北冥乘海生:大數據是否能改造你的行業?

背景:這是在知乎上面一系列的付費直播。講者是劉鵬,網號『北冥乘海生』,自稱大數據仁波切。他的『計算廣告』博客來也買得到。因為劉鵬話很多,每次的直播都有四小時那麼久,我沒法逐字記,所以就大略花兩小時內紀錄,我記得到多少是多少,記不下來的,就放水流去了。

一:數據有用的前提條件?

劉鵬舉了個例子:很多人認為大數據就是用電腦收集了各種交易資料,經過清洗加工運算,做出了幾張報表,恭恭敬敬的呈給老闆或者軍師看,大腦袋碰的一下洞察了商機或問題,然後做出了正確的決策。

事情不是這樣的,首先運算結果就不太會是幾張摘要報表,通常是針對特定主題的預測,我們常說做模型要有個預測的標的,傳統商業預測會預測誰會借錢不還,今天很多內容網站預測每個個體會想要看什麼內容,這些都是標的。

數據分析與其說是洞察,不如說是機率:發生那件事情的機率到底有多高。發生機率較高的又是哪些事件。

要讓數據分析有用,要願意使用運算出來的結果做為決策依據,而不是堅持去發想洞察。(當然,運算出來的機率必須通得過各種檢驗,那是另外一個問題)

如果老闆總覺得自己比數據英明,那公司其實沒啥好做數據,更不用說大數據了。

但是當行業裡面有公司或個人願意用運算的結果做決策,而我們還在猶豫,那可能就是別人上太空我們殺豬公,差異會越來越大。

二:你的行業有沒有大數據的原料?

有人以為保險金融業最多大數據,畢竟保險的精算師聽起來就很會算,而銀行要決定貸款利率一定也是用各種厲害的方法算出來的。其實過去的保險精算跟貸款利率決策過程雖然是依照運算出來的結果,但仍不是大數據,因為只使用到交易資料,而沒有用到大數據最重要的原料:行為數據。

劉鵬用電信業舉例說明交易數據跟行為數據的差異,交易數據是客人儲值多少錢,跟網內或網外客戶講了幾分鐘電話,上網流量用了多少。行為數據是客人簡訊的內容,上網的地點。(當然內容就有隱私權的問題,這也是大數據的挑戰)

交易數據的特徵是數量少,但每一筆都重要。畢竟你要付錢給電信業,或者銀行要把客人帳戶裡的錢做清算,重要性當然都很高。但是跟網路時代為了分析賣什麼廣告給每個個人使用的數據量,簡直是微不足道。行為數據的數量是極其龐大的。

如果你的行業變不出行為數據,那再怎麼用運算結果做決策,做的其實是優化運算模型還有優化決策能力。

好消息是,暫時還不用花那麼多那麼多的軟硬體費用。
壞消息是,誰知道哪天隔壁行業的巨頭會不會數據太多沒地方用,跑來你家侵門踏戶。

行為數據就算有,通常也不是立馬可以使用。因為過去沒有用武之地,大部分的公司未曾好好收集行為數據的,更遑論清洗、加工、各種使用。

好消息是,就算同行現在開始覺悟,要收集行為數據了,還需要經過一段時間才能真正變現,大家的差距沒有那麼大。
壞消息是,開始從大數據上面賺到錢之前,你就得為了收集原料先花錢。

三:有了行為數據之後怎麼用

最早的分析方式,是規則:『曾經欠錢的人,以後欠錢不還的機率高』。

後來發現,把『規則』的交給機器,效率更高。用白話說:變數與結果之間的關係,還有權重的設定,就交給機器吧。人類負責把行業知識萃取出來,變成有意義的變數。所以行業專家的知識對於會有哪些變數有不可取代的價值。機器算出來的結果,不會離專家知識太遠。

大數據時代,主張把變數產生的工作也交給機器。但是交給機器的只有交易數據,其實變不出什麼新把戲。大數據的亮點之一,是把根本不知道該怎麼使用的行為數據,經過清洗加工後交給機器,就有可能會找出新的分析切入點。

決勝關鍵在於誰能收集最大量過去沒有的數據,誰能夠用最有效率的演算法,以及誰能找出最有價值待解決的商業問題。

劉鵬舉了個例子,他們在分析網路詐騙刷機的時候,發現『手機電量』是個重要變數。電量老是保持很高的手機,是更可疑的。這點講出來後大家可以想像,就是刷機的手機都放在機架上面,因此電量是比較高些。但在結果出來之前,很難想到用電量判斷刷機。

這就是行為數據的特點,他很難收集,收集的時候你也不知道會不會有用,行業中的老司機也未必想得到可以這樣用。可是他可以開拓你對客戶的了解。這個例子還是可以想得到因果關係的,更多連因果或關聯性都想不到關係的例子,但是沒有這些就無法開啟後面的大數據乃至人工智能的應用。


本系列我嘗試從不同角度切入跟複習,最後寫了十篇,連結各如下。歡迎按讚或微信打賞。

A.大數據職業生涯(摘要)
A-1.大數據改造你的行業
A-2.用數據武裝運營
A-3.大數據職業生涯

B.大數據廣告鍊(摘要)
B-1.用數據掙錢
B-2.用數據洞察用戶
B-3.數據如何交易

C.數據如何變現(全文筆記)
D.大數據如何改造你的行業(全文筆記)

Comments

comments powered by Disqus