在美國,大數(shù)據(jù)工程師平均年薪達(dá)17.5萬美元,在中國頂尖的互聯(lián)網(wǎng)公司里,大數(shù)據(jù)工程師的薪酬比同級(jí)別的其他職位高出30%以上。DT時(shí)代來得太突然了,國內(nèi)發(fā)展勢(shì)頭很猛,而大數(shù)據(jù)相關(guān)的人才卻非常地有限,在未來若干年內(nèi)都會(huì)是供不應(yīng)求的狀況,因此程序員們,你們的春天到了!
成為數(shù)據(jù)分析師有哪些要求?
1. 理論知識(shí)要寬泛,涉及數(shù)學(xué)、市場和技術(shù)。要求及對(duì)數(shù)據(jù)敏感,包括統(tǒng)計(jì)知識(shí)、市場研究、模型原理等。
2. 常規(guī)分析工具的使用,包括數(shù)據(jù)庫、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析工具,常用辦公軟件(Excel、PPT、思維導(dǎo)圖)等等。
3. 有一定的業(yè)務(wù)理解能力,能理解業(yè)務(wù)背后的商業(yè)邏輯。因?yàn)橹挥欣斫饬松虡I(yè)問題,才能轉(zhuǎn)換成數(shù)據(jù)分析的問題,從而滿足部門的要求。
4. 數(shù)據(jù)報(bào)告和數(shù)據(jù)可視化的能力。數(shù)據(jù)分析得再好,如果不能以漂亮的方式“表達(dá)”,成效也會(huì)大打折扣。
現(xiàn)在大多工作都需要你擁有邏輯分析能力,尤其是對(duì)數(shù)據(jù)的分析理解。在數(shù)據(jù)化運(yùn)營理念深入的今天,BAT這樣的大型互聯(lián)網(wǎng)公司強(qiáng)調(diào)全員參與數(shù)據(jù)化運(yùn)營,把數(shù)據(jù)分析當(dāng)作一種能力在培訓(xùn),也必定是未來趨勢(shì)。
數(shù)據(jù)分析師所需具備的能力和知識(shí)(從數(shù)據(jù)分析的4個(gè)步驟來理解)
數(shù)據(jù)分析的四個(gè)步驟:數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)。
1. 數(shù)據(jù)獲取
數(shù)據(jù)獲取看似簡單,但是需要把握對(duì)問題的商業(yè)理解,轉(zhuǎn)化成數(shù)據(jù)問題來解決,直白點(diǎn)講就是需要哪些數(shù)據(jù),從哪些角度來分析,界定問題后,再進(jìn)行數(shù)據(jù)采集。此環(huán)節(jié),需要數(shù)據(jù)分析師具備結(jié)構(gòu)化的邏輯思維。
推薦書籍:《金字塔原理》、麥肯錫三部曲:麥肯錫意識(shí)、工具、方法;
推薦工具:思維導(dǎo)圖工具(Xmind百度腦圖等);
2. 數(shù)據(jù)處理
數(shù)據(jù)的處理需要掌握有效率的工具:
Excel及高端技能:日常工作通用,容易掌握,處理10萬級(jí)別的數(shù)據(jù)很輕松。學(xué)習(xí)高端Excel需要哪些技能?學(xué)習(xí)excel是個(gè)循序漸進(jìn)的過程
基礎(chǔ):簡單的表格數(shù)據(jù)處理、打印、查詢、篩選、排序
函數(shù)和公式:常用函數(shù)、高級(jí)數(shù)據(jù)計(jì)算、數(shù)組公式、多維引用、function
可視化圖表:圖形圖示展示、高級(jí)圖表、圖表插件
數(shù)據(jù)透視表、VBA程序開發(fā)
按照我習(xí)慣的方法,先過一遍基礎(chǔ),知道什么是什么,然后找幾個(gè)case練習(xí)。多逛逛excelhome論壇,平常多思考如何用excel來解決問題,善用插件,還有記得保存。
帆軟FineReport:專業(yè)的報(bào)表工具,日常做報(bào)表設(shè)計(jì)一個(gè)模板可通用,只要會(huì)寫SQL就可上手。相比excel做報(bào)表,開發(fā)的技術(shù)要求較少,能很快地開發(fā)常規(guī)報(bào)表、動(dòng)態(tài)報(bào)表,并可以放在移動(dòng)端和大屏查看。
Oracle和SQL sever:企業(yè)最常用的千萬級(jí)別的數(shù)據(jù)庫,熟練掌握SQL語言。
保持不斷的技術(shù)學(xué)習(xí),比如學(xué)習(xí)新流行的hadoop之類的分布式數(shù)據(jù)庫來提升個(gè)人能力,對(duì)求職有幫助。
3. 分析數(shù)據(jù)
分析數(shù)據(jù)往往需要各類統(tǒng)計(jì)分析模型,如關(guān)聯(lián)規(guī)則、聚類、分類、預(yù)測(cè)模型等等。
因此,熟練掌握一些統(tǒng)計(jì)分析工具不可免:
SPSS系列:老牌的統(tǒng)計(jì)分析軟件,SPSS Statistics(偏統(tǒng)計(jì)功能、市場研究)、SPSS Modeler(偏數(shù)據(jù)挖掘),不用編程,易學(xué)。
SAS:經(jīng)典挖掘軟件,需要編程。
R:開源軟件,新流行,對(duì)非結(jié)構(gòu)化數(shù)據(jù)處理效率上更高,需編程。
4. 數(shù)據(jù)呈現(xiàn)
Tableau:可視化工具的鼻祖,對(duì)于處理好的數(shù)據(jù)可作自由的可視化分析,圖表效果驚人,大數(shù)據(jù)BI工具FineBI:類同Tableau,可在前端做任意維度分析;數(shù)據(jù)可在前端繼續(xù)處理(計(jì)算、篩選過濾等),可對(duì)接hadoop之類的大數(shù)據(jù)平臺(tái),數(shù)據(jù)處理性能較好。
很多數(shù)據(jù)分析工具已經(jīng)涵蓋了數(shù)據(jù)可視化部分,只需要把數(shù)據(jù)結(jié)果進(jìn)行有效的呈現(xiàn)和演講匯報(bào),可用wordPPTH5等方式展現(xiàn)。
總結(jié):大數(shù)據(jù)分析的工作是由大數(shù)據(jù)工程師設(shè)計(jì)的系統(tǒng)提供的大量數(shù)據(jù)。大數(shù)據(jù)分析包括趨勢(shì)、模式分析和不同分類和預(yù)測(cè)系統(tǒng)的開發(fā)。因此,簡而言之,大數(shù)據(jù)分析是對(duì)數(shù)據(jù)的高級(jí)計(jì)算。大型數(shù)據(jù)工程是系統(tǒng)設(shè)計(jì)、部署和計(jì)算平臺(tái)的頂層結(jié)構(gòu)。
學(xué)習(xí)信息分布
你的領(lǐng)域是什么,它的方向是什么?現(xiàn)在我們已經(jīng)了解了我們可以從行業(yè)中選擇的職業(yè)類型,讓我們來決定哪一個(gè)區(qū)域適合你。這樣,我們就可以確定你在這個(gè)行業(yè)中的位置。一般來說,你的教育背景和工作經(jīng)驗(yàn)可以分為:基于我們的教育背景(包括利息,但不一定是你的大學(xué)教育相關(guān))在計(jì)算機(jī)科學(xué)、數(shù)學(xué)、行業(yè)經(jīng)驗(yàn),新的數(shù)據(jù),計(jì)算機(jī)科學(xué)家和工程師(數(shù)據(jù)域相關(guān)工作)因此,根據(jù)上述分類。