雅安之聲:匯集數(shù)據(jù)并分析災(zāi)區(qū)當(dāng)?shù)鼐W(wǎng)友微博信息
知乎 發(fā)表于:13年04月27日 10:58 [來稿] DOIT.com.cn
雅安之聲是基于新浪微博開放平臺(tái)的救援信息查詢工具,是由雅安本地人創(chuàng)造內(nèi)容的原汁原味微博直播媒體。雅安之聲匯集了兩萬多雅安本地網(wǎng)友實(shí)時(shí)發(fā)布的微博,救援人員和普通網(wǎng)友可以像閱讀普通微博一樣使用。
雅安之聲解決的問題
救援人員點(diǎn)擊“緊急”按鈕查看被標(biāo)注的微博,迅速找到求助信息及時(shí)救助。通過關(guān)鍵字如“帳篷”等搜索微博,精確找到物資缺乏的災(zāi)民,為救援物質(zhì)調(diào)配起到查漏補(bǔ)缺的作用。
一線記者可以通過“給力”“氣憤”兩個(gè)按鈕迅速獲取新聞線索,幫助現(xiàn)場(chǎng)采訪。未能到達(dá)災(zāi)區(qū)的記者,可以通過微博內(nèi)容了解現(xiàn)場(chǎng)情況獲取一手新聞素材。
網(wǎng)友可以觀看原汁原味的微博直播。內(nèi)容由雅安本地網(wǎng)友創(chuàng)造,未經(jīng)媒體或微博大V加工,保持了原汁原味。這里有反應(yīng)災(zāi)情的揪心內(nèi)容,也有反應(yīng)日常生活的普通內(nèi)容,更加鮮活。
為什么做雅安之聲
我創(chuàng)業(yè)的方向是微博運(yùn)營和數(shù)據(jù)挖掘,雅安地震時(shí),本能的反映是對(duì)雅安地區(qū)網(wǎng)友的微博進(jìn)行數(shù)據(jù)分析。馬上從庫里找出所在地是雅安的一萬多微博用戶,調(diào)用新浪微博開放接口掃描數(shù)據(jù)。
每一條微博,都是一個(gè)悲慘的畫面,我猶如置身雅安,心情沉重又無奈,不知道能為災(zāi)區(qū)同胞做點(diǎn)什么。
各大互聯(lián)網(wǎng)公司行動(dòng)迅速,但都一窩蜂的做尋人。尋人雖然是剛需,但我再做意義不大。
隨著時(shí)間的推進(jìn),雅安多數(shù)地區(qū)電力、通訊逐步恢復(fù),兩天之后,雅安網(wǎng)友發(fā)布的微博數(shù)量逐漸增多,我的信息也越來越豐富。但是打開電視看直播,打開微博看大V發(fā)布的信息,卻與我看到的視角完全不同。
大量的救災(zāi)信息淹沒了雅安本地網(wǎng)友的內(nèi)容,沒有專用數(shù)據(jù)挖掘工具,在微博通過關(guān)鍵字搜索等很難找到。我想,也許有人需要這些信息,我應(yīng)該發(fā)揮優(yōu)勢(shì)做個(gè)容易使用的產(chǎn)品,讓普通網(wǎng)友能迅速找到這些信息。
產(chǎn)品開發(fā)
這些信息的第一用途肯定是救災(zāi),如何讓救援人員迅速找到重要信息,信息重要程度用神馬參數(shù)衡量呢?
已經(jīng)是22日中午了,黃金救援時(shí)間都過去60個(gè)小時(shí)了,我們沒有時(shí)間去思考重要程度的算法,那需要大量時(shí)間不斷的試錯(cuò)改進(jìn),而我現(xiàn)在最缺的就是時(shí)間,必須找到電風(fēng)扇吹空肥皂盒這種笨拙但簡單有效的方法。
我想到了眾包,在微博下面設(shè)幾個(gè)按鈕,讓普通網(wǎng)友看直播時(shí)捎帶著標(biāo)注重要性,于是便有了這張草圖。
幾天的積累,我們的雅安微博用戶ID已經(jīng)增長到一萬八千個(gè),用開放接口完整輪詢一遍需要幾個(gè)小時(shí),信息更新速度太慢。與死神賽跑每一秒都要爭取,這個(gè)時(shí)間是無法容忍的。
我們求助新浪官方,新浪免費(fèi)給我們開通了開放平臺(tái)之外的“訂閱”接口。從開始溝通到正式開通,總共只用了58分鐘,效率非常高。但是訂閱接口也有數(shù)量限制且官方無法更改模塊,依然不能滿足我一萬八千個(gè)ID的需求量,而且ID數(shù)量還在不斷增加。
我用@勤娘紙 賬號(hào)發(fā)了條微博,招募志愿者請(qǐng)求同行幫助。平時(shí)打的頭破血流的競(jìng)爭對(duì)手,迅速表態(tài)放下恩怨,共享資源解決難題。
開發(fā)人員連軸轉(zhuǎn),從畫出草圖到產(chǎn)品測(cè)試,只用了20個(gè)小時(shí),晚上測(cè)試修改完畢第一版正式上線。
23日19:49微博發(fā)出鏈接,迅速被轉(zhuǎn)發(fā)四百多次,我們收到網(wǎng)友評(píng)論和私信大量反饋。從反饋中發(fā)現(xiàn),物資調(diào)配信息需求最強(qiáng)烈,因?yàn)辄S金救援時(shí)間已過,救援隊(duì)伍的主攻方向是發(fā)放帳篷等救援物資。
產(chǎn)品存在的問題集中在兩點(diǎn),第一、設(shè)定的按鈕“重要”沒有引起網(wǎng)友的重視,被標(biāo)注的次數(shù)不多,導(dǎo)致重要信息沒有篩選出來。第二、標(biāo)注“重要”的微博是按照標(biāo)注次數(shù)排序,這樣排在最前面的反而是幾個(gè)小時(shí)之前的信息。
24日凌晨一點(diǎn),我們更新了第二版,將按鈕改為“緊急”“給力”“氣憤”三個(gè),排序規(guī)則改為12小時(shí)內(nèi)的微博按時(shí)間排序,12小時(shí)候后的按標(biāo)注次數(shù)排序。并且添加了關(guān)鍵字搜索功能,方便救援人員根據(jù)物資情況精確查找。
三十多個(gè)小時(shí)的時(shí)間,我們更新了兩個(gè)版本,改了四次算法,加上@獨(dú)到網(wǎng) 的接口級(jí)別較高,微博同步延遲時(shí)間壓縮到5分鐘左右。
此時(shí),雅安之聲已經(jīng)是一個(gè)有用、能用的產(chǎn)品了。
當(dāng)你打開網(wǎng)站,就會(huì)看到兩萬多雅安網(wǎng)友五分鐘之前的發(fā)的全部微博,可以很方便的找到你需要的信息。
只是網(wǎng)站不太好看,志愿者中沒設(shè)計(jì)人員。
效果
根據(jù)北大可視化小組@曉如微博 標(biāo)注的雅安微博用戶分布圖,我們的數(shù)據(jù)可以全面反映雅安情況,包括曾經(jīng)被忽視的天全等縣,以及一些偏遠(yuǎn)的鄉(xiāng)鎮(zhèn)。
宣傳雅安之聲的微博被轉(zhuǎn)發(fā)489次,理論上凈覆蓋人數(shù)460萬,@桔子水晶吳海 @酒紅冰藍(lán) @丁來峰 @白玉峰 等關(guān)鍵人物參與了轉(zhuǎn)發(fā)。
24日晚十點(diǎn)鐘左右檢查PV,發(fā)現(xiàn)這幾天@獨(dú)到網(wǎng) 的PV沒有任何增長。大家一直忙著看用戶反饋改產(chǎn)品,竟然沒檢查CNZZ的統(tǒng)計(jì)。 22:38分修復(fù)后,顯示15分鐘內(nèi)119人在線,瀏覽次數(shù)為250次。第一微博宣傳的四百多次轉(zhuǎn)發(fā)是在23日,第二這個(gè)時(shí)間段不是高峰期,我們大致推斷 24日PV在一萬以上,23日PV在五萬以上。
數(shù)據(jù)的意義
截止24日,2.1萬雅安網(wǎng)友中的七千多人在地震后發(fā)出14萬條微博,活躍用戶高達(dá)35%,平均每個(gè)用戶以每天4條的高頻率發(fā)布微博。之前有微博活躍度下降,微信將取代微博,甚至微博已死等言論,但關(guān)鍵時(shí)刻還是微博頂上去了,微信似乎沒幫上啥忙。
國外已經(jīng)可以通過社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘預(yù)測(cè)流感趨勢(shì),監(jiān)測(cè)災(zāi)難時(shí)期的民眾恐慌情緒等。我們會(huì)對(duì)抓取的原始數(shù)據(jù)進(jìn)行分析,期望能夠?yàn)榫葹?zāi)工作總結(jié)經(jīng)驗(yàn)教訓(xùn)。水平有限,不敢說一定能成功,但做一下探索,失敗了也能讓后來者避開陷阱少走彎路。
參與雅安之聲的全部志愿者同意將數(shù)據(jù)無償公開。有需要數(shù)據(jù)做研究的傳播、心理等專業(yè)人士,告知@勤娘紙 分析維度等,她協(xié)調(diào)技術(shù)人員幫忙提取數(shù)據(jù)。需要原始數(shù)據(jù)的同行找@張文浩100 拷貝。
公司簡介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.