資料分析是行業,還是技能?(上)

我們上篇內容,從本文梳理和分享一些該如何刻意訓練資料思維的方法論以及建議,目的主要給大家提供一下資料思維培養的思路。(

詳情請看:資料思維怎麼培養?)

其實,資料思維並不是一日可形成,是需要我們結合日常工作生活來刻

意練習,去實踐,發現問題、解決問題、總結問題的一個不斷積累經驗的過程。

然而,無論做產品,運營,銷售,市場,人力資源管理,還是做研發、測試等工作崗位,在不同的業務場景下,如何提升付費轉化率,調研使用者滿意度訴求,人力成本分析以及精細化運營做使用者分層分群等工作內容,都會涉及到資料分析的思維方式。其分析的大概思路:

確定分析目標→梳理業務場景→明確核心指標→搭建分析體系→資料視覺化→分析資料得出結論

隨著5G以及大資料時代背景下,

資料分析領域相關崗位也是呈現多元化的發展趨勢

,如資料運營、經營分析師、商業分析師、資料科學家、資料工程師、資料架構師、演算法工程師、資料產品經理、資料分析師……

無論從哪個視角來看,資料分析是不會脫離業務存在。也很大程度會決定我們所需要掌握的能力棧,如金融行業的風控模型、電商行業的轉化漏斗模型等等。那麼,我們應該是把資料分析作為一個行業,還是一種技能來看待呢?

本文將從資料分析領域的崗位詳解以及資料分析在其他領域的應用進行簡單的梳理分享,其目的主要讓大家清晰地瞭解“資料分析”後,

結合自己的自身經驗和認知情況,是把資料分析作為行業,還是當做一項技能?僅供參考!

資料分析領域的崗位詳解

資料分析是行業,還是技能?(上)

01偏業務方向的資料分析崗位

偏業務方向的資料分析,一般屬於運營部門。有資料運營、資料分析師、商業分析、資料產品經理等,其崗位的職位描述一般是:

負責和支撐各部門相關的報表;

建立和最佳化指標體系;

監控資料的波動和異常,找出問題;

最佳化和驅動業務,推動資料化運營;

找出可增長的市場或產品最佳化空間;

輸出專題分析報告;

下面我們介紹幾個常見的崗位詳解:

資料運營

主要負責運營相關資料的分析,協助運營人員制定資料分析策略,為日常運營提供資料支援,協調落地,形成推動閉環等,以活躍指標的下跌舉例:

活躍指標下跌了多少?是屬於合理的資料波動,還是突發式?

什麼時候開始的下跌?

是整體的活躍使用者下跌,還是部分使用者?

為什麼下跌?是產品版本,還是運營失誤?

怎麼解決下跌的問題

·····

在工具方面,主要以Excel+SQL+PPT+運營思維為主。總之,

往往更關心某個指標為什麼下跌或者上升。產品的使用者是什麼樣的?怎麼能更好的完成業務的KPI。

資料分析師

主要將業務資料體系化,建立一套指標框架,其次資料提取、清洗、多維度分析、預測;生成策略推動執行。如活躍下跌的問題,本質上也是指標問題。什麼時候開始下跌,哪部分下跌,都能轉化成對應指標,如日活躍使用者數,新老使用者活躍數,地區活躍數。指標體系如果工程化自動化,也就是BI,所以資料分析師可以算半個BI分析師,這裡不包括BI報表開發。

在工具方面,主要以Excel+SQL+Python/R/SPSS/SAS+PPT。Excel+SQL是必備技能,Python/R/SPSS/SAS任選其一即可。一個優秀的資料分析師,應該業務、管理、分析、工具、設計都不落下。

總之,對於新人,比較普適的發展路線是先成為一位資料分析師。積累相關的經驗,在一兩年後,決定往後的發展,是資料探勘和商業分析師,還是專精資料分析成為管理崗。資料分析的管理崗,比較常見的有資料運營經理/總監,資料分析經理等,

相對應的能力是能建立指標體系,並且解決日常的各類「為什麼」問題。

商業分析師

是另外一個方向,更多見於傳統行業,一般更加宏觀,偏行業研究,主要向高層彙報,基於商業問題和場景,透過資料洞察商業問題,為企業戰略和決策提供資料支援,諮詢/投行對該崗位的需求會比較多,會更多地關注國內外政策,對統計和業務能力要求更高。

若在商業分析師做資料報告時,需要能站在整個行業的宏觀角度,去看待本公司、所有競對公司以及上下游的各種關係與優劣勢等。

比如要開一家快遞驛站,我們就需要考慮哪裡開,這就要考慮居民密度,居民消費能力,競爭對手,網上的消費能力等因素。這些資料是宏觀的大指標,往往靠搜尋和調研完成,這是和網際網路資料分析師最大的差異。

總之,

商業分析師

是需要有一定的MBA或商科背景,在能力上,

需要對行業市場、上下游、商業敏感度有強烈的洞察力,能夠體系化系統化的進行資料收集、市場研究、競對研究和使用者研究。

資料產品經理

這個崗位比較新興,適合對資料特別感興趣的產品經理。它有兩種理解,一種是具備強資料分析能力的PM,一種是公司資料產品的規劃者。

前者,以資料導向最佳化和改進產品。在產品強勢的公司,資料分析也會劃歸到產品部門,甚至運營也屬於產品部。這類產品經理有更多的機會接觸業務,屬於順便把分析師的活也幹了,一專多能的典型。最典型的場景就是AB測試。大到頁面佈局、路徑規劃、小到按鈕的顏色和樣式,均可以透過資料指標評估。俗話說,再優秀的產品經理也跑不過一半AB測試。此類資料產品經理,更多是注重資料分析能力,擅長用分析進行決策。資料是能力的一部分。

後者,是真正意義上的資料產品經理。隨著資料量的與日俱增,此時會有不少資料相關的產品專案:包括大資料平臺、埋點採集系統、BI、推薦系統、廣告平臺等。這些當然也是產品,自然需要提煉需求、設計、規劃、專案排期,乃至落地。

總之,資料產品經理普遍要求如下:

負責大資料產品的設計,輸出需求文件、產品原型;

負責推薦演算法的產品策略,完成相關推薦及個性化推薦產品的需求分析;

負責分析和挖掘使用者消費內容的行為資料,為改進演算法策略提供依據;

負責客戶端資料需求的對接,制定相關埋點規範及口徑,相關業務指標驗證;

報表展示工具的落地和應用;

·······

還有,

資料產品經理必須瞭解公司或者業務線在不同的階段,需要哪些資料產品,並能夠製作出來,這是此職位的核心要求

。其次,資料產品經理必須有足夠的資料分析能力,如果有了資料分析的思維,再跟公司業務結合就會比較容易。最後,資料產品經理是產品經理的一種,所以要同時具備產品經理的能力:

瞭解使用者,需求調研,方案設計,協調技術、測試、設計等。從職業發展上看,資料分析師做資料產品經理更合適

。普通的產品經理,對前端、後端的技術棧尚未熟悉,何況日新月異的資料棧。

02

偏技術方向的資料分析崗位

偏技術方向的資料分析崗位,如資料探勘/演算法專家等崗位有的歸在研發部門,有的則單獨成立資料部門。與業務方向的資料分析師相比較來說,要求更高的統計學能力、數理能力以及程式設計技巧。有資料探勘工程師、資料演算法工程師、資料倉庫工程師、資料科學家等崗位。

下面我們介紹幾個常見的崗位詳解:

資料探勘

從概念上說,資料探勘Data mining是一種方式,即可以透過機器學習,而能借助其他演算法。比如協同過濾、關聯規則、PageRank等,它們是資料探勘的經典演算法,但不屬於機器學習,所以在機器學習的書籍上,你是看不到的。

實際的應用場景中,如共享單車,如何尋找單車使用效率最大化的最優投放,就是資料探勘的工作範疇。資料探勘工程師,除了掌握演算法,同樣需要程式設計能力去實現,不論R、Python、Scala/Java,至少掌握一種。模型的實施,往往也要求Hadoop/Spark的工程實踐經驗,精通SQL/Hive是必須的。

常見資料探勘專案的閉環如下:

定義問題

資料抽取

資料清洗

特徵選取/特徵工程

資料模型

資料驗證

迭代最佳化

總之,單看環節,資料探勘對分析能力沒有業務型那麼高。

這不代表業務不重要,尤其在特徵選取方面,對業務的理解很大程度會影響特徵怎麼選取,進而影響模型質量。使用者流失是一個經典的考題,如何選取合適的特徵,預測使用者會否流失,能夠考察對業務是否深刻洞察。

還有,資料探勘的業務領域一樣可以細分。金融行業的信用模型和風控模型/反欺詐模型、廣告模型的點選預估模型、電商行業的推薦系統和使用者畫像系統。從需求提出到落地,資料探勘工程師除了全程跟進也要熟悉業務。

演算法專家

資料探勘往後發展,稱為演算法專家。後者對理論要求更嚴苛,幾乎都要閱讀國外的前沿論文。方向不侷限於簡單的分類或者回歸,還包括影象識別、自然語言處理、智慧量化投顧這種複合領域。

這裡開始會對從業者的學校和學歷提出要求,名校+碩士無疑是一個大優勢,也有很多人直接做資料探勘。

深度學習則更前沿,它由神經網路發展而來,是機器學習的一個子集。因為各類框架開枝散葉,諸多模型百花齊放,也可以算一個全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度學習框架,對模型的應用和調參也是必備的,後者往往是劃分普通人和大牛的天塹。

總之,演算法專家和深度學習專家,薪資level會更高一級,一般對應於業務型的資料運營/分析總監。

資料工程師

更偏資料底層,其核心是做好資料倉庫建設及ETL資料處理。

這個崗位基本不涉及資料分析的能力,而對大資料處理能力要求較高

,需要較強的程式設計及架構設計能力。

分析歷史、預測未來、最佳化選擇,這是大資料工程師在“玩資料”時最重要的三大任務。

透過這三個工作方向,他們幫助企業做出更好的商業決策。要求具備一定的統計學、數學理論知識,有實際開發能力和大規模的資料處理能力,對行業有認知。

在很多中小型的公司,一方面資料是無序的、缺失的、原始的,另外一方面各種業務報表又嗷嗷待哺。沒辦法,分析師只能自己擼起袖子,一個人當三個人用。兼做資料清洗+ETL+BI。

部分歸屬到技術部的資料分析師,雖然Title叫資料分析

(其實應該叫資料分析開發工程師)

,其工作職責為建設資料倉庫、資料庫表開發、資料採集、清洗、儲存、建模、資料應用、資料平臺的建設最佳化等職責,這就是標準的資料工程路線。部分公司會將機器學習模型的部署和實現交給資料工程團隊,這要求資料工程師熟悉sparkMLlib、Mahout此類框架。

除此之外,還有演算法工程師(核心是機器學習等演算法能力)、資料架構師(核心是平臺建設及資料倉庫建設能力)等等,這些崗位要麼跟資料分析能力關係不大,要麼能力模型已經包含在前面幾個崗位中了,就不一一羅列了。

總之,資料科學家是上述崗位的最終形態之一

。其要求的能力更加全面,基本綜合了前面崗位的核心能力,並且對AI能力及程式設計能力要求更高,這個崗位也會成為未來資料方向的重點發展趨勢。

由於篇幅原因,我們分析上下兩部分,

下篇梳理資料分析在各領域的應用

(部分崗位明細整理於網路)