大數(shù)據(jù),這個(gè)被炒爛了的概念,現(xiàn)如今已被人工智能替代。我們先不討論人工智能,就大數(shù)據(jù)而言,我們都是在強(qiáng)調(diào)他的技術(shù),例如網(wǎng)絡(luò)熱詞:hadoop+spark,data mining。而我們?cè)谟么髷?shù)據(jù)時(shí)候,經(jīng)常用它的來(lái)神話它的影響。例如,廣告投放精準(zhǔn)化,社會(huì)安全管理有序,醫(yī)藥行業(yè)智能化等。
當(dāng)然這些是我們的暢想,同時(shí)確實(shí)也離不開(kāi)數(shù)據(jù)分析影響,但是我們有沒(méi)有停下腳步去想一想,到底大數(shù)據(jù)怎么去落地呢,怎么去分析?怎么利用數(shù)據(jù)來(lái)去使企業(yè)做出決策,例如:廣告投放精準(zhǔn)化?
我們了解什么叫大數(shù)據(jù)分析么?
麥肯錫給大數(shù)據(jù)定義:
“一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。“
基于我對(duì)以上定義的理解,我總結(jié)的大數(shù)據(jù)分析就是,將獲取的數(shù)據(jù),打通,整合,找尋規(guī)律,立即得出決策信息。
數(shù)據(jù)獲取
我總結(jié)的數(shù)據(jù)源可分類三類:
(1)一方數(shù)據(jù):用戶事實(shí)數(shù)據(jù)
例如用戶在某金融機(jī)構(gòu)購(gòu)買的理財(cái)產(chǎn)品,時(shí)間,哪個(gè)出單口,姓名,電話等,或者運(yùn)營(yíng)數(shù)據(jù),例如某互聯(lián)金融app,用戶操作行為數(shù)據(jù)
(2)二方數(shù)據(jù):其實(shí)這部分叫做廣告投放數(shù)據(jù)
例如,廣告展示量,活動(dòng)頁(yè)點(diǎn)擊量,廣告來(lái)源等。也有公司將這部分?jǐn)?shù)據(jù)作為第三方數(shù)據(jù),因?yàn)橛行V告監(jiān)測(cè)公司會(huì)利用此數(shù)據(jù)和人群數(shù)據(jù)整合構(gòu)建自己dmp這樣的公司一般宣稱為第三方公司,三方數(shù)據(jù)
(3)三方數(shù)據(jù):行業(yè)數(shù)據(jù),也叫公開(kāi)數(shù)據(jù)
例如行協(xié)的數(shù)據(jù),或者互聯(lián)網(wǎng)行為數(shù)據(jù),例如某互聯(lián)網(wǎng)公司用戶在此網(wǎng)站的行為數(shù)據(jù),或者嵌入sdk的app后我們能采集到的安裝活躍列表,以及可采集到線下數(shù)據(jù)。
-
打通:其實(shí)就是利用關(guān)鍵點(diǎn)的采集整合一二三方數(shù)據(jù)。例如我們可以通過(guò)手機(jī)號(hào)將一方和三方數(shù)據(jù)整合,或者利用cookie,或者imei號(hào)等將二方、三方數(shù)據(jù)整合。但是由于現(xiàn)在監(jiān)管制度對(duì)手機(jī)號(hào)敏感數(shù)據(jù)的控制,以及互聯(lián)網(wǎng)和移動(dòng)端數(shù)據(jù)的跨平臺(tái)打通技術(shù)難點(diǎn),我們現(xiàn)實(shí)的匹配率很低,例如一方和三方的數(shù)據(jù)匹配達(dá)到20%其實(shí)就算比較不錯(cuò)的情況,當(dāng)然運(yùn)營(yíng)商數(shù)據(jù)除外。
-
找尋規(guī)律:目標(biāo)就是數(shù)據(jù)清理,從非結(jié)構(gòu)化數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),以便統(tǒng)計(jì),數(shù)據(jù)探索,找尋規(guī)律,形成數(shù)據(jù)分析報(bào)告觀點(diǎn)。本文將會(huì)在第三部分闡述。
-
立即決策:將數(shù)據(jù)分析報(bào)告中的觀點(diǎn)系統(tǒng)化或產(chǎn)品化,目前而言,大部分公司還是會(huì)依靠人工決策。
為什么需要大數(shù)據(jù)分析?看上去大數(shù)據(jù)分析似乎按照這些步驟來(lái),但是從第一步的數(shù)據(jù)源來(lái)說(shuō),其實(shí)已經(jīng)反應(yīng)了大數(shù)據(jù)的特點(diǎn),就是雜亂無(wú)章,那么怎么從這些數(shù)據(jù)找尋規(guī)律,分析的內(nèi)容和目標(biāo)是否對(duì)應(yīng)上,似乎就是我們需要大數(shù)據(jù)分析的理由
現(xiàn)在,大數(shù)據(jù)的分析通常采用的數(shù)據(jù)報(bào)表來(lái)反映企業(yè)運(yùn)營(yíng)狀況,同時(shí),對(duì)于熱點(diǎn),人群分析,我們看到的統(tǒng)計(jì)值,目標(biāo)核心都是用數(shù)據(jù)分析報(bào)告提煉的觀點(diǎn)來(lái)指導(dǎo)運(yùn)營(yíng),那么問(wèn)題來(lái)了,怎么用數(shù)據(jù)分析來(lái)指導(dǎo)數(shù)據(jù)決策呢?
數(shù)據(jù)分析的報(bào)告思路(本文從移動(dòng)端的角度進(jìn)行切入)
基于我對(duì)數(shù)據(jù)分析的理解,我將數(shù)據(jù)報(bào)告會(huì)分成三大類:市場(chǎng)分析、運(yùn)營(yíng)分析、用戶行為分析。
市場(chǎng)分析
由于市場(chǎng)分析一般而言是定性、定量分析,最近熱播劇《我的前半生》賀函和唐晶的職業(yè)就是來(lái)去咨詢公司的一般會(huì)以訪談、問(wèn)卷調(diào)查來(lái)一份市場(chǎng)分析報(bào)告去告訴客戶他們的市場(chǎng)占有量,消費(fèi)者觀點(diǎn)等。
這里,我們以移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)的市場(chǎng)分析為例,通常來(lái)說(shuō),數(shù)據(jù)源是公開(kāi)數(shù)據(jù),或者在第三方數(shù)據(jù)。正如我們所講,將sdk嵌入開(kāi)發(fā)者應(yīng)用,就可以收集到安裝以及使用列表,那么開(kāi)發(fā)者使用的sdk越多,我們能收集的數(shù)據(jù)源也越多,這樣就可以形成安裝app排名,使用app排名,這里面所說(shuō)的覆蓋率、活躍率也是這個(gè)意思,例如:即此款應(yīng)用安裝量、使用量在整體金融類的安裝量、使用量占比。
那么,這些市場(chǎng)分析的作用呢,一般而言,是對(duì)公司市場(chǎng)營(yíng)銷的總結(jié),比如某金融公司kpi是為了獲客,他們做了一系列營(yíng)銷,下個(gè)月排名我們可以查詢到此款應(yīng)用的安裝量,是否較上個(gè)月上升呢? 那么我們的競(jìng)品表現(xiàn)呢,他們是不是也做了一些列的營(yíng)銷活動(dòng)排名上升下降?我們都可以通過(guò)市場(chǎng)分析,競(jìng)品分析來(lái)觀測(cè),但是這部分的觀點(diǎn)由于是市場(chǎng)數(shù)據(jù),我們只能通過(guò)大量的搜尋官網(wǎng)活動(dòng),或者互聯(lián)網(wǎng)廣告推測(cè)營(yíng)銷來(lái)推測(cè)是否競(jìng)爭(zhēng)對(duì)手排名上升和這些營(yíng)銷活動(dòng)有關(guān)。
同時(shí),根據(jù)市場(chǎng)的走勢(shì)圖,我們能發(fā)現(xiàn)潛在的競(jìng)爭(zhēng)對(duì)手,例如:我們能看出下圖中的工商銀行由于手機(jī)屬于高覆蓋高活躍組,即安裝xxapp活躍人群也是最高的,因此,無(wú)疑xx銀行是所有銀行組潛在競(jìng)爭(zhēng)對(duì)手。需要更加注意他們的市場(chǎng)策略
運(yùn)營(yíng)分析
移動(dòng)互聯(lián)網(wǎng)提出的方法論:3A3R,筆者之前在做咨詢的時(shí)候,此方法論也可以將網(wǎng)站分析套用,總結(jié)來(lái)說(shuō)3A3R就是:
感知 → 獲取 → 活躍 → 獲取 → 營(yíng)收 → 傳播 → 感知
這里需要注明下,運(yùn)營(yíng)分析只是一個(gè)公司的baseline,讓產(chǎn)品經(jīng)理,運(yùn)營(yíng)人員,市場(chǎng)人員根據(jù)自己本公司的數(shù)據(jù)參考做出合理的決定,同時(shí),運(yùn)營(yíng)的數(shù)據(jù)只是參考或者叫警示,若要具體,需要特定細(xì)節(jié)的分析,例如是否app改版,怎么改?需要增加哪家渠道合作?
(1)Awareness 感知
根據(jù)廣告投放數(shù)據(jù)進(jìn)行分析,目的判斷渠道廣告頁(yè)對(duì)app 或者網(wǎng)站引流情況,同時(shí)可以幫助廣告主設(shè)計(jì)監(jiān)測(cè)表格,以數(shù)字角度衡量廣告投放效果
但是,廣告數(shù)據(jù)一般而言在廣告監(jiān)測(cè)公司手中,或者公開(kāi)的使用工具上例如GA,我們需要依靠廣告公司設(shè)計(jì)營(yíng)銷環(huán)節(jié),例如活動(dòng)頁(yè),加監(jiān)測(cè)代碼,或者在媒體,app應(yīng)用商店加入代碼便于監(jiān)測(cè)廣告表現(xiàn),而往往這樣的數(shù)據(jù)很難加載,一般是由應(yīng)用商店,或者媒體提供,同時(shí),以上數(shù)據(jù),監(jiān)測(cè)公司數(shù)據(jù)一般而言也不會(huì)提供給廣告主,只是會(huì)提供統(tǒng)計(jì)值。
言歸正傳,我們看感知數(shù)據(jù)其實(shí)目的就是想衡量我們的大量的營(yíng)銷投放錢花的對(duì)不對(duì),廣告的展示量,點(diǎn)擊量等是最好衡量一個(gè)公司的廣告市場(chǎng)部門績(jī)效,沒(méi)有廣告投放,就無(wú)法帶來(lái)獲客,因此錢花的值不值,能帶來(lái)多少客人,才會(huì)有下一步 acquisition。
(2)Acquisition 獲客
獲客是第一步廣告投放拓展,用戶點(diǎn)擊廣告后到達(dá)應(yīng)用商店或者著陸頁(yè)后去下載app,訪問(wèn)網(wǎng)頁(yè)后,登陸app后的數(shù)據(jù)是廣告公司或者應(yīng)用商店提供不了的數(shù)據(jù),因此獲客其實(shí)有兩重目的。
-
目的1:衡量第一步提供的數(shù)據(jù)是否準(zhǔn)確,即是否渠道作弊
-
目的2:判斷渠道是否好壞
-
目的3:判斷營(yíng)銷活動(dòng)是否有效
例如下圖中,我們發(fā)現(xiàn)4成用戶是搜索流量較上個(gè)月增加了6%,是不是我們需要增加和sem的合作呢?而在媒體引薦渠道中,我們通過(guò)渠道衡量客戶轉(zhuǎn)化率,點(diǎn)擊-用戶激活的,激活的注冊(cè)轉(zhuǎn)化,可否重點(diǎn)對(duì)某應(yīng)用商店增加合作
下圖是目的3的應(yīng)用,來(lái)衡量三個(gè)月內(nèi)的新增用戶,活躍用戶是否受活動(dòng)營(yíng)銷、廣告投放、版本更迭等影響。例如:7月28日的版本更迭,增加新用戶的利器,那么產(chǎn)品經(jīng)理需要分析下這個(gè)版本到底哪里的改變,讓用戶增長(zhǎng)這么快,而8月份的營(yíng)銷活動(dòng)會(huì)喚醒沉睡用戶,反應(yīng)考核運(yùn)營(yíng)人員的績(jī)效,那么,是否我們?cè)谧龃倩顣r(shí)候可以借鑒8月的成功經(jīng)驗(yàn)?zāi)兀慷@個(gè)成功經(jīng)驗(yàn)需要進(jìn)一步做專題分析
(3)Activities 活躍
獲客后,我們想看看我們的新增、活躍用戶的表現(xiàn)情況,那么就到了第三步 活躍,其實(shí)就是為產(chǎn)品經(jīng)理改版app或者頁(yè)面提供數(shù)據(jù)支持
活躍分析可參考以下三個(gè)步驟:
第一:從頁(yè)面瀏覽次數(shù),獨(dú)立訪問(wèn)人數(shù),來(lái)圈定主要頁(yè)面分析。
例如某款app首頁(yè)是pv,uv最高,我們會(huì)重點(diǎn)分析首頁(yè)。
第二:根據(jù)圈定頁(yè)面,制作點(diǎn)擊熱力圖,便于產(chǎn)品經(jīng)理對(duì)后續(xù)頁(yè)面改造提供數(shù)據(jù)支持,例如我們可以將點(diǎn)擊量小的按鈕在下次改版刪除,對(duì)點(diǎn)擊量大的重新排序
第三:根據(jù)圈定頁(yè)面,制作點(diǎn)擊熱力圖,便于產(chǎn)品經(jīng)理對(duì)后續(xù)頁(yè)面改造提供數(shù)據(jù)支持,例如我們可以將點(diǎn)擊量小的按鈕在下次改版刪除,對(duì)點(diǎn)擊量大的重新排序
(4)Retention留存分析& Revenue & Refer
這幾個(gè)實(shí)際上在企業(yè)運(yùn)用的并不多,這里簡(jiǎn)要說(shuō)明下。
① Retention
用戶積累到一定數(shù)量后,我們想看下用戶粘性,那么我們就來(lái)到retention,一般是衡量活動(dòng)效果時(shí)候運(yùn)用的比較多,來(lái)看此次活動(dòng)過(guò)后,是否用戶依舊會(huì)使用我們的app,但是由于金融app屬性不會(huì)像游戲應(yīng)用每天進(jìn)行訪問(wèn),因此Retention 在實(shí)際應(yīng)用中不會(huì)太多,下面的例子是個(gè)展示,不做贅述
② Revenue
這些留下來(lái)的客戶給公司貢獻(xiàn)多少現(xiàn)金呢?會(huì)看收入步驟, 一般公司不會(huì)將現(xiàn)金流數(shù)據(jù)放入在統(tǒng)計(jì)平臺(tái)中,但是我們需要提出用戶貢獻(xiàn)的流水金額數(shù)據(jù)供我們使用,便于人群劃分,例如下面簡(jiǎn)要分析:
Refer 傳播:
最后,我們想讓這些客戶進(jìn)行傳播;核心是口碑營(yíng)銷,即用戶自發(fā)的轉(zhuǎn)發(fā)給其他用戶鏈接,讓他們下載app或者參與活動(dòng),因此傳播的下一個(gè)環(huán)節(jié)又會(huì)轉(zhuǎn)換營(yíng)銷,但是傳播會(huì)受到很多限制,例如沒(méi)有獎(jiǎng)勵(lì)機(jī)制的口碑傳播,幾乎轉(zhuǎn)發(fā)量為0,同時(shí),傳播若要衡量比較困難,尤其在大量互聯(lián)網(wǎng)用戶基礎(chǔ)上,這樣會(huì)造成資源代碼疊加,系統(tǒng)負(fù)擔(dān),因此一般企業(yè)也不會(huì)設(shè)計(jì)這樣活動(dòng)讓營(yíng)銷人員參考
用戶分析
若說(shuō)大數(shù)據(jù)分析的核心,其實(shí)就是在于用戶分析,正如我們前面所講,用戶分析的步驟流程如下:
即在力所能及的搜集數(shù)據(jù)范圍內(nèi),打通數(shù)據(jù),客戶用戶,精準(zhǔn)營(yíng)銷。
第一,我們可以篩選的條件列表,我們可以通過(guò)應(yīng)用條件,位置,標(biāo)簽條件將數(shù)據(jù)整合,整合的目的就是刻畫(huà)客戶,定出營(yíng)銷策略。
例如:我們想篩選金融客戶(應(yīng)用條件篩選),出現(xiàn)在五星級(jí)酒店(位置條件),且為母嬰人群(標(biāo)簽)
但是需要注意的是,條件越多,用戶輪廓越清晰,人群會(huì)越少。
第二,根據(jù)篩選的人群,我們將線上/線上統(tǒng)計(jì)化,或者建模多維度分析。
例如,我們根據(jù)篩選的人群,發(fā)現(xiàn)男性多于女性,蘋(píng)果手機(jī)屬性最高,常手機(jī)工具使用,那么我們可以將這部分目標(biāo)人群用增加手機(jī)工具合作、或者和蘋(píng)果合作獲客或者促活。
第三,整合以上數(shù)據(jù)分析,形成人群畫(huà)像。
結(jié)束語(yǔ)
這篇文章主要是總結(jié)的一體化數(shù)據(jù)分析框架,簡(jiǎn)單介紹下數(shù)據(jù)分析能分析能落地的幾點(diǎn)。當(dāng)然,這里面需要大量的數(shù)據(jù)清洗工作,以及對(duì)行業(yè)的認(rèn)知,此篇只是從數(shù)據(jù)分析角度的概要,內(nèi)容上的細(xì)化,其實(shí)可以單拿出來(lái)細(xì)細(xì)分析,尤其用戶畫(huà)像那章節(jié)。