12月3-4日有個Big data world congress,這會議的名頭聽起來異常氣勢恢宏又仿佛很野雞。去聽了一天,感覺講得都很淺,沒有多少技術性的東西,基本都是各家粗淺的介紹自己在做什么。倒是提供的伙食異常的好,仿佛就專去蹭了一整天的飯!
對我而言唯一有趣的是spotify的發言——用發言人Wouter de Bie的話,其他人都是西裝族,只有他是隨隨便便的碼農形象——所以比較知道我們想聽什么,舉的例子都非常有意思。
比如他們對他們客戶的使用統計
瑞典的各年齡組:

看圖很明顯,17歲以下的瑞典小孩的曲線非常有特色,在上課時間,他們的使用曲線明顯低于其它年齡組,一放學就高揚——所以整體而言,瑞典小孩還是乖乖上課的。
另一個特色是周三和周末夜間曲線有個小小的上揚波動——這是party后回家路上聽音樂。周三在瑞典稱為小周末,很多人在周三開party。
然后來看西班牙的各年齡組曲線:

西班牙小孩們在上課時間跟別的年齡組沒·有·差·別!(主講當時表示:我不是評判他們什么啦,但是,這個,你們明白的……)
周六的party后小波峰是一致的,但是西班牙并沒有周三party的習慣,所以周三就沒有類似瑞典的波動。
西班牙與瑞典的另一個極大差別,就是除了小孩子之外,所有西班牙人的曲線都在中午有個明顯波谷——這就是西班牙著名的siesta午休時間。(Siesta,西班牙人雷打不動的午睡時間,從3小時到5小時不等)
看,就從聽音樂的行為統計,其可以獲取的地域差別信息就已如許。
此外spotify舉的另一例,風暴Sandy過境時候明顯的數據變化(下圖對應美國):


完整的颶風路線!
此外還有個很有意思的結論,spotify他們對各種用戶界面的各種細小改變都做了詳細的用戶測試,他們發現各種他們絞盡腦汁想出來的界面美化啦功能增強啦都沒有啥很顯著的效果——甚至有些反而起反作用,唯一一個真的明顯增加點擊率的是改變button上的文字!從“download”改成類似play啊try啊listen啊之類會明顯增加點擊,大約是因為群眾本能的對下載存有恐懼心理。
其余都太淺與空泛,包括google等。不值一提。整體只提供了一個各家做big data的現在在做什么的概況印象。
最大的好處的吃得很好,正餐有牛排且沙拉主食甜點齊備,上午下午各有一次茶點時間無數可愛小點心,另有咖啡、茶、水與蘋果汁無限量。明年似乎他們還打算弄個Big data Asia congress.
最后附上會議brochure。