從BloomReach這一云端服務(wù)創(chuàng)業(yè)公司的角度講述了要如何在Saas(軟件服務(wù)化)上做好大數(shù)據(jù)這個(gè)議題。有人問(wèn)我要怎樣的智慧才能利用好大數(shù)據(jù)這個(gè)商機(jī),然后我常常覺(jué)得這不是個(gè)智慧的問(wèn)題——我又不是職業(yè)投資人。不過(guò)如果我是的話,我肯定會(huì)盯著SaaS(軟件服務(wù)化)。
這么說(shuō)是有兩個(gè)原因的:先進(jìn),有那么多的公司需要管理他們的應(yīng)用和設(shè)備。如果這時(shí)候有什么技術(shù)能自動(dòng)地優(yōu)化這些常規(guī)任務(wù),那一定很有潛力?,F(xiàn)在這項(xiàng)技術(shù)叫做“云計(jì)算”。
第二點(diǎn)就是只有通過(guò)大數(shù)據(jù),你才能看見(jiàn)整個(gè)業(yè)務(wù)的全局和它的每個(gè)細(xì)節(jié)。當(dāng)任何一家獨(dú)立的終端用戶公司沒(méi)有能力(或者說(shuō)不太可能)通過(guò)收集建立龐大的數(shù)據(jù)存儲(chǔ)來(lái)解決搜索引擎優(yōu)化這個(gè)難題時(shí),專業(yè)的云端服務(wù)就可以。
從網(wǎng)絡(luò)安全到系統(tǒng)管理,SaaS已經(jīng)從集中數(shù)據(jù)存儲(chǔ)中獲益:對(duì)業(yè)務(wù)的全景的把握和細(xì)致到每個(gè)獨(dú)立客戶的特殊需求。
這其中一個(gè)很好的例子就是BloomReach,一家為其他公司提供網(wǎng)頁(yè)內(nèi)容優(yōu)化的SaaS起步公司。
“桌子”和“手機(jī)”各是什么意思?
BloomReach的營(yíng)銷總監(jiān)Joelle告訴我說(shuō):“理想狀況是我們幫助用戶在消費(fèi)者搜索時(shí)以更顯眼(排名靠前)、更相關(guān)(展現(xiàn)他們服務(wù)的內(nèi)容)和更匹配的方式(比如語(yǔ)言)出現(xiàn)。”
BloomReach會(huì)高頻率地從整個(gè)互聯(lián)網(wǎng)抓取信息來(lái)掌握所有其他站點(diǎn)內(nèi)容描述、頁(yè)面排布和網(wǎng)頁(yè)架構(gòu)的方式。每天他們?cè)贏WS(亞馬遜網(wǎng)絡(luò)服務(wù))中有超過(guò)1000臺(tái)云計(jì)算機(jī)來(lái)處理從10億的數(shù)據(jù)點(diǎn)獲取到的5T的用戶行為數(shù)據(jù)。
BloomReach的CTO和創(chuàng)始人之一Garg解釋道:我們需要分析是哪些人在訪問(wèn)這些站點(diǎn),他們?cè)谧鍪裁?,瀏覽的時(shí)間是怎么分布的還有如何把用戶行為聯(lián)系在一起。
“在你動(dòng)手干活(優(yōu)化網(wǎng)頁(yè))以前,你需要從對(duì)的地方拿到足夠量的數(shù)據(jù)。這個(gè)計(jì)算機(jī)學(xué)習(xí)的量是巨大的。”他說(shuō)。
當(dāng)你考慮所有描述和組織事物的方式的時(shí)候,問(wèn)題的規(guī)模也是一個(gè)很大的影響因素。比如你說(shuō)“桌子”和“凳子”,那么結(jié)果應(yīng)該是比較單一的。但是如果你說(shuō)的是“手機(jī)”,這個(gè)會(huì)包含智能機(jī),板磚機(jī),安卓,蘋(píng)果…兩者的機(jī)器學(xué)習(xí)要求完全不在一個(gè)等級(jí),是你要在優(yōu)化以前,先收集的數(shù)據(jù)。
成千上萬(wàn)的可能性 挑一個(gè)吧
網(wǎng)頁(yè)組織也就是一個(gè)網(wǎng)頁(yè)從跳轉(zhuǎn)到另一個(gè)網(wǎng)頁(yè)的佳方式。這個(gè)問(wèn)題會(huì)隨著數(shù)字的增加讓人異常暴躁。比如,你有4樣產(chǎn)品要掛到2個(gè)網(wǎng)頁(yè)上,這個(gè)很好辦。但是如果你有1000件商品要放在100個(gè)頁(yè)面上,同要考慮這些頁(yè)面間的聯(lián)系?
還有一點(diǎn)是處理時(shí)間,分析100個(gè)頁(yè)面要遠(yuǎn)遠(yuǎn)長(zhǎng)于分析10個(gè)頁(yè)面的10倍,沒(méi)準(zhǔn)兒比100倍還多。如果一個(gè)網(wǎng)站有100萬(wàn)個(gè)頁(yè)面,其中涉及的計(jì)算量是不能估計(jì)的。通常這種情況的慣用做法是模擬,也就是在一定量的數(shù)據(jù)上計(jì)算近似結(jié)果。這樣才有可能在靠譜的時(shí)間內(nèi)把問(wèn)題搞定。
定制個(gè)性化的頁(yè)面
如果我們想在用戶搜索時(shí),實(shí)時(shí)調(diào)整頁(yè)面內(nèi)容,其中的難度可想而知。但是如果你能準(zhǔn)確地預(yù)測(cè)他們的意圖并顯示合理的內(nèi)容,自然意義重大。你要做的判斷包括他是不是??突蛘咝掠脩?,是不是對(duì)價(jià)格敏感或是鐘愛(ài)某一個(gè)品牌…等等。
這里BloomReach有一個(gè)很有趣的發(fā)現(xiàn)是:在節(jié)日里,“禮物”這樣的搜索會(huì)非常多,但是在單個(gè)用戶身上持續(xù)的時(shí)間會(huì)很短。Grag解釋說(shuō),這是因?yàn)槿藗兺ǔ2辉敢庠?ldquo;禮物”這件事上糾結(jié)太久,所以只要看到了合眼又價(jià)格過(guò)得去的商品,他們很快就會(huì)下單的。
但是要用大數(shù)據(jù)優(yōu)化這些頁(yè)面比僅僅合眼要復(fù)雜得多。在前面那些計(jì)算機(jī)學(xué)習(xí)的過(guò)程里,人的參與也非常重要。人類當(dāng)然比機(jī)器更了解買什么做禮物更合適。聰明人總是能很快發(fā)現(xiàn)什么是適合他的,這就是為什么SaaS在大數(shù)據(jù)時(shí)代這么重要了。
掃一掃
關(guān)注新圖聞科技
全國(guó)咨詢熱線
186-0984-0880