萬事開頭難,但是一旦數據分析有了動力,就要開始完善自己的知識體系,這也是真正入門的開端。那如何完善數據分析的知識體系? 1、基本的計算機知識和統計知識數據庫 + SQL 語言 一些常用的數據庫如 Oracle、SQL Sever、DB2、MySQL,這些數據庫或者說日常接觸的數據庫都要有所了解,懂最常用的就好,最重要的還是要會寫 SQL。 數學 / 統計學知識 一些基本的數學統計方法如描述性統計、多元統計分析、回歸分析等,重要性不言而喻。 數據挖掘知識:方差分析、回歸分析、因子分析、聚類分析等等。這些東西作為入門多多少少都要會一些,雖然有可能不會全用到,但一旦用時方恨少。而且也可以作為未來發展的基礎 數據分析可視工具 數據分析可視化工具很寬泛。首推 Excel,中小公司很依賴,熟練使用數據透視表,這是必備技能。中大型公司都是用報表工具或者 BI 來做報表,但有了 SQL+Excel 的基礎,這些工具上手都很快。 2、業務知識數據分析師要與公司的各業務打交道,所以對于各部門的業務知識要有深入的了解。某業務領導需要知道某個指標,你需要知道這個指標由哪些數據構成? 數據統計的口徑是什么?數據怎么取出來?這個指標對于行業的意義是什么,處于什么范圍分別對應什么樣的情況,是好還是壞。然后慢慢摸索這個指標層面多維度的規律,如何設定最合理。 明確自己的位置,快速成長 數據分析是一向比較專業的工作,要時刻警惕自己能力是否有提升,目前是什么樣的水平,習慣反思自己: 你了解你所整理的數據的來源嗎?是自己公司的業務數據,還是與合作伙伴交換的數據?是自己公司相關部門采集的,還是從第三方獲取的?獲取過程中,具體的指標和邏輯是什么? 這些數據是真實的嗎?采集和整理過程中會不會出現什么問題?技術上的邏輯和業務上的邏輯是不同的概念,有沒有技術上沒有瑕疵,但并不符合業務邏輯的數據流程? 到你手里的數據經過了什么處理?你又做了什么處理?為什么他們和你要做這些處理? 誰需要你的數據?你處理后的數據流向哪里?他們用數據做什么?這些數據最終又拿去做了什么?比如,為客戶做了什么服務,公司發布了什么內容,或向管理層證明了什么 KPI,或支持了哪個部門的評估? 你做整理的周期是什么?為什么是這樣的周期? 公司有其他的部門在處理其他的數據嗎?是什么樣的數據?和你有什么關系?為什么這些數據要分開處理? 近一年,你自己的電腦上應該已經積累了不少數據,試試做個分析,從一段較長的時間來看,你負責的這一塊數據發生了什么變化?為什么會有這個變化?和公司的產品、經營、業務有關,還是和行業有關?具體怎么有關? 如何進一步提升?業務上 1. 業務為核心,數據為王
需要懂業務的整體概況,摸清楚所在產業鏈的整個結構,對行業的上游和下游的經營情況有大致的了解。然后根據業務當前的需要,指定發展計劃,從而歸類出需要整理的數據。最后一步詳細的列出數據核心指標(KPI),并且對幾個核心指標進行更細致的拆解,當然具體結合你的業務屬性來處理,找出那些對指標影響幅度較大的影響因子。前期資料的收集以及業務現況的全面掌握非常關鍵。 2. 思考指標現狀,發現多維規律
業務的分析大多是定性的,需要培養一種客觀的感覺意識。定性的分析則需要借助技術、工具、機器。而感覺的培養,由于每個人的思維、感知都不同,只能把控大體的方向,很多數據元素之間的關系還是需要通過數據可視化技術來實現。 |