1、?一人多機檢測

極光大數(shù)據(jù)通過自有業(yè)務海量調用日志分析,對于用戶設備及app建立了多維度的唯一性識別標識,通過設備的多維度識別交叉定位,發(fā)掘設備關聯(lián)關系。

2、?用戶行為相似性

極光大數(shù)據(jù)通過移動設備的用戶行為相似性來衡量用戶在移動設備上的使用行為相關程度,主要從2個方面來度量:

??app安裝特征相似度:

基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù)挖掘,構造用戶app安裝行為特征矩陣,使用廣義Jaccard相關系數(shù),計算用戶app安裝特征相似度。對于用戶app安裝特征,不同的app能夠反映用戶相似度的程度有很大差異,根據(jù)app的滲透率加權得到修正后的app安裝特征相似度。

??3.png

??WiFi特征關聯(lián)度:

基于極光大數(shù)據(jù)平臺的海量數(shù)據(jù),根據(jù)時間、空間、無線WiFi屬性等信息進行清洗加工,建立用戶WiFi使用特征矩陣;基于用戶WiFi特征矩陣,對于不同時段設備間的WiFi特征,采用余弦相似度計算兩兩用戶間的工作日WiFi使用特征關聯(lián)度和周末WiFi使用特征關聯(lián)度。

??4.png

3、?空間軌跡相似度

空間軌跡相似度(spatial trajectory similarity)算法的基本思想就是通過降維的手段將多維空間向量分解到同一維度上求解,通過解決平面問題來達到最終解決空間模型的目的。

??5.png

兩個軌跡間的相似度可以定義為:Sim(A,B) = (POIA∩POIB)/ (POIA∪POIB);

向量空間余弦相似度(Cosine Similarity):余弦相似度用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小。余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似。

提取一段時間內的用戶報點信息,按照時間序列處理,采用STS算法,計算兩兩設備間的空間軌跡相似度。

實證效果

1、?app安裝特征相似度:

對于某用戶換機前后的兩個設備,計算app安裝特征相似度,使用app滲透率加權,兩個移動設備的app安裝特征相似度為:0.913,app安裝特征相似性非常高。

兩個設備安裝app數(shù)量為120個以上,app安裝重合度為72.8%,同時安裝了滲透率低于5%的app應用有22個,滲透率低于1%的app有7個。由此可見,app的安裝情況能在一定程度上反應設備之間的相似性。

2、?WiFi使用特征關聯(lián)度:

基于兩個設備的WiFi使用偏好情況,計算WiFi特征關聯(lián)度,計算得出工作日WiFi使用特征關聯(lián)度為0.35,周末WiFi使用特征關聯(lián)度為0;

經過極光大量數(shù)據(jù)驗證,工作日WiFi特征關聯(lián)度大于0.25,為工作日關系較為密切的用戶,比如同事關系;周末WiFi特征關聯(lián)度大于50%,為周末關系較為密切的用戶,比如親人。

3、?空間軌跡相似度

從極光大數(shù)據(jù)數(shù)據(jù)庫中挑選3個空間軌跡較為相似的設備,其中設備A和設備C為同一用戶的兩個設備,設備A和設備B的位置軌跡比較相近,以設備A為基準,分別計算設備A和設備B、設備A和設備C的空間軌跡相似度。

??6.png

上表中都是解析出的各軌跡對應的POI坐標值,按時間維度將三維空間軌跡解析到平面中,分別取各POI點的經度(id,lat)和維度(id,lng)計算軌跡間的余弦相似度。二者的平面軌跡圖如下(紅線表示設備A,藍實線表示設備B,虛線表示設備C):

??7.png

??8.png

可以計算出COSlat(A,B)=0.708,COSlng(A,B)=0.784;?COSlat(A,C)=0.746,?COSlng(A,C)= 0.819;

那么可以得到該設備A與設備B的相似度為0.746,與設備C的相似度為0.783。顯然設備A和設備C的空間相似度較高。

總結

目前各個行業(yè)的大數(shù)據(jù)的應用越來越頻繁,大數(shù)據(jù)精準營銷、大數(shù)據(jù)運營、智能推薦等應用均取得顯著的效果,而這些領域都要求企業(yè)對用戶要有充分的了解,才能精準的定位目標人群。如何有效高質量的擴充目標群體用戶,基于現(xiàn)有用戶標簽的基礎上,用戶相似性也是一個非常重要的信息。極光大數(shù)據(jù)基于設備的用戶相似性能夠在精準營銷、智能推薦中發(fā)現(xiàn)很多的關聯(lián)用戶,能夠一定程度上擴充關聯(lián)目標人群,提升企業(yè)的營銷效率和質量。

分享到

songjy

相關推薦