艾瑞網(wǎng) 發(fā)表于:13年07月31日 13:39 [轉(zhuǎn)載] DOIT.com.cn
“大數(shù)據(jù)”作為時下最火熱的IT行業(yè)的詞匯,屢屢見諸報端:電商網(wǎng)站通過數(shù)據(jù)分析判斷用戶購買習(xí)慣,社交網(wǎng)站通過數(shù)據(jù)分析分類用戶圈子。那么婚戀網(wǎng)站可否通過數(shù)據(jù)分析向用戶精準推送適合的婚戀對象?答案應(yīng)該是肯定的。“數(shù)據(jù)能夠開口說話當(dāng)紅娘”,網(wǎng)易花田(love.163.com)的負責(zé)人夏天宇如是說。
網(wǎng)易花田作為網(wǎng)易布局交友領(lǐng)域的重要一步于2012年底上線,作為網(wǎng)易交友高級總監(jiān),數(shù)據(jù)管理和數(shù)據(jù)分析出身的夏天宇從一開始便相信:通過挖掘全站用戶數(shù)據(jù),并結(jié)合用戶注冊產(chǎn)品和使用產(chǎn)品的時間,網(wǎng)易花田可以更精準的為用戶推薦合適的匹配,就像是專門定制的一樣。
花田的技術(shù)團隊在對海量軟硬數(shù)據(jù)進行分析的基礎(chǔ)上,總結(jié)出一些人物特征,建立出一定數(shù)量的人物模型。再分析具體用戶,將其分門別類套入各種模型。這樣,用戶心儀其中某一個人,便可向其推薦這一類人。
目前網(wǎng)易花田對數(shù)據(jù)的挖掘體現(xiàn)在三個方面:
1、基于用戶公開顯示的基本資料,在后臺為用戶貼標簽。
年齡、身高、職業(yè)、收入、擇偶要求等這些用戶公開顯示的資料,最直接反映用戶的個人現(xiàn)狀和擇偶期望,但讓用戶自己去發(fā)掘的時間成本很高。網(wǎng)易花田通過對這些數(shù)據(jù)進行挖掘分析,為全平臺的用戶主動推薦匹配度較高的人選。另一方面,由于用戶規(guī)模足夠大,數(shù)據(jù)分析結(jié)果還能夠基本反映出大眾的擇偶要求,比如:年齡22歲的男性用戶尋找的異性年齡段一般在18-22歲之間——這些普遍性數(shù)據(jù)也在用戶匹配中占有部分比重。
2、挖掘用戶的行為數(shù)據(jù),建立用戶的。
網(wǎng)易花田每日活躍用戶中超過30%會產(chǎn)生互動行為:例如點擊感興趣異性的頁面,對異性動態(tài)發(fā)表“贊”或評論等。用戶互動作為一種隱式反饋,相比用戶填寫的資料更加細致,能夠更精準的反映出用戶對什么類型的異性更感興趣。一般情況下,雖然用戶的擇偶要求較明確,但基于比較泛的篩選條件,一些隱含要求比如購房、購車、名企、名校等沒有表達出來,而網(wǎng)易花田通過對用戶行為數(shù)據(jù)的分析能夠得到更精準的用戶興趣模型。
3、分析用戶Q&A數(shù)據(jù),為你推薦真正情投意合的人。
Q&A是網(wǎng)易花田推出的一個問答題庫系統(tǒng),通過設(shè)置價值觀、興趣愛好、生活習(xí)慣、愛情觀等分類問題,讓用戶參與答題。目前花田平臺預(yù)設(shè)300道QA題,已經(jīng)有20%左右的用戶擁有Q&A數(shù)據(jù),平臺用戶答題量數(shù)據(jù)達到千萬級。網(wǎng)易花田對Q&A數(shù)據(jù)的分析,能夠發(fā)現(xiàn)兩個異性之間在生活習(xí)慣、價值觀、興趣愛好等方面的契合度,建立數(shù)據(jù)模型,促使用戶快速找到溝通的話題。
此外,花田技術(shù)團隊正試圖通過自然語言處理技術(shù)和語義分析方法來解碼用戶性格,實現(xiàn)“軟硬兼施”的精準推薦。首先,他們運用切分詞方法,從用戶的“內(nèi)心獨白”中提取出現(xiàn)頻率較高的關(guān)鍵詞;再將這些關(guān)鍵詞分類,如感性詞匯或理性詞匯;最后,通過文本分析、語義分析,從中挖掘出用戶的性格是內(nèi)向、外向、理想化還是現(xiàn)實派等等。這一技術(shù)目前還在測試中,2013年下半年會逐步投入使用。屆時,宅男“定制”女友將擁有除3D打印機之外的另外一條可行之路。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.