yj 發(fā)表于:13年12月03日 10:54 [來(lái)稿] DOIT.com.cn
搜索的本質(zhì)是從海量數(shù)據(jù)中挖掘價(jià)值,如果大數(shù)據(jù)是金礦,搜索技術(shù)無(wú)疑是大數(shù)據(jù)時(shí)代的掘金機(jī)之一。經(jīng)過(guò)十多年的發(fā)展,搜索技術(shù)已經(jīng)在海量數(shù)據(jù)分析、圖譜構(gòu)造、用戶語(yǔ)義理解等方面有了豐富的積累,而這些技術(shù)正是大數(shù)據(jù)的基本技術(shù)。2013年12月5日-6日舉辦的2013中國(guó)大數(shù)據(jù)技術(shù)大會(huì)上,來(lái)自百度、奇虎360搜索、一淘搜索事業(yè)部的技術(shù)專家將在大數(shù)據(jù)技術(shù)論壇中帶來(lái)大數(shù)據(jù)時(shí)代搜索技術(shù)的實(shí)踐分享。
百度技術(shù)專家:百度知識(shí)圖譜(Knowledge Graph)
今年8月,百度知識(shí)圖譜悄然上線。傳統(tǒng)的搜索是以網(wǎng)頁(yè)搜索為粒度的,知識(shí)圖譜則基于語(yǔ)義、以知識(shí)為粒度,從互聯(lián)網(wǎng)中挖出各種知識(shí)碎片,形成答案,從根本上提高搜索質(zhì)量。過(guò)去十年,網(wǎng)頁(yè)搜索結(jié)果幾乎不變,如今,這是一種高質(zhì)量的有問(wèn)必答式搜索,可以實(shí)現(xiàn)智能交互,也預(yù)示著下一代搜索引擎的方向。
2013中國(guó)大數(shù)據(jù)技術(shù)大會(huì)中,來(lái)自百度的技術(shù)專家將為聽(tīng)眾分享百度知識(shí)圖譜的相關(guān)技術(shù),對(duì)于想要了解下一代搜索引擎的你,絕對(duì)不容錯(cuò)過(guò)!
奇虎360搜索技術(shù)專家:奇虎360超大規(guī)模HBase集群增強(qiáng)與改進(jìn)
奇虎360搜索上線于去年8月份,如今,據(jù)中國(guó)國(guó)內(nèi)權(quán)威流量統(tǒng)計(jì)機(jī)構(gòu)CNZZ在11月17日公布的數(shù)據(jù)顯示,奇虎360搜索在國(guó)內(nèi)搜索市場(chǎng)所占份額已從10月份的20.8%上升至22.6%。然而,360搜索一直較為低調(diào),較少向外界透露自己的核心搜索技術(shù)。去年的Hadoop與大數(shù)據(jù)技術(shù)大會(huì)中,奇虎360系統(tǒng)部工程師趙健博分享了“HBase系統(tǒng)在搜索網(wǎng)頁(yè)庫(kù)的應(yīng)用”,本次2013中國(guó)大數(shù)據(jù)技術(shù)大會(huì)中,來(lái)自奇虎360的搜索技術(shù)專家,將繼續(xù)講述奇虎360超大規(guī)模HBase集群的增強(qiáng)與改進(jìn)。
一淘搜索王峰:阿里搜索實(shí)時(shí)流計(jì)算技術(shù)
利用批處理方式為搜索引擎提供數(shù)據(jù)的方式已經(jīng)成為過(guò)去,實(shí)時(shí)大數(shù)據(jù)處理時(shí)代已經(jīng)到來(lái),一淘及搜索事業(yè)部高級(jí)軟件工程師王峰(莫問(wèn)),將揭秘阿里搜索離線生產(chǎn)集群中的流服務(wù)調(diào)度、流服務(wù)框架、分布式消息隊(duì)列等技術(shù),讓你看明白全網(wǎng)商品是如何實(shí)時(shí)處理并流入阿里搜索引擎的。
王峰曾先后在雅虎中國(guó)、阿里云、淘寶和一淘從事搜索引擎和分布式技術(shù)領(lǐng)域的研發(fā)工作,目前在網(wǎng)頁(yè)抓取團(tuán)隊(duì),主要負(fù)責(zé)分布式存儲(chǔ)系統(tǒng)和大數(shù)據(jù)處理技術(shù)方向。本次演講中王峰即將帶來(lái)的主要內(nèi)容包括:
全網(wǎng)商品搜索系統(tǒng)架構(gòu)
全網(wǎng)商品實(shí)時(shí)數(shù)據(jù)處理流程
流計(jì)算技術(shù)揭秘
流服務(wù)調(diào)度——Hadoop-2.0定制調(diào)度器(PriorityCapacityScheduler)
流服務(wù)模型——基于YARN的自主流計(jì)算模型(StreamService)
流數(shù)據(jù)傳輸和持久化——基于HBase的自主分布式消息隊(duì)列(HQueue)
除了搜索領(lǐng)域的大數(shù)據(jù)核心技術(shù),第七屆中國(guó)大數(shù)據(jù)技術(shù)大會(huì)中還有更多精彩議題。Spark核心設(shè)計(jì)者、Databricks創(chuàng)始人兼CEO Ion Stoica,Apache HBase項(xiàng)目管理委員會(huì)主席Michael Stack、百度大數(shù)據(jù)首席架構(gòu)師林仕鼎、華為公司諾亞方舟實(shí)驗(yàn)室主任楊強(qiáng)、Apache Tez commiter Bikas Saha大數(shù)據(jù)技術(shù)專家領(lǐng)銜,來(lái)自騰訊、阿里巴巴、Hortonworks、LinkedIn、小米、Intel等50余位工程師帶來(lái)近60場(chǎng)干貨分享,更有《中國(guó)智能交通與大數(shù)據(jù)技術(shù)峰會(huì)》專場(chǎng)感受智能交通如何改變生活。第七屆中國(guó)大數(shù)據(jù)技術(shù)大會(huì)(Big Data Technology Conference 2013,BDTC 2013)將于2013年12月5日-6日在北京世紀(jì)金源大酒店召開(kāi)。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.