噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

Facebook表示:數(shù)據(jù)驅(qū)動(dòng)初創(chuàng)公司發(fā)展無限

ZDNet存儲(chǔ)頻道 發(fā)表于:13年08月02日 19:50 [轉(zhuǎn)載] 至頂網(wǎng)

  • 分享:
[導(dǎo)讀]Airbnb也是盡最大努力分析很多很多的數(shù)據(jù),力圖為用戶提供最佳的用戶體驗(yàn)。此文介紹Airbnb公司如何在亞馬遜云上,建立自己的大數(shù)據(jù)基礎(chǔ)設(shè)施,并用之于產(chǎn)品開發(fā)。

“我們要利用數(shù)據(jù)做每一個(gè)決定。 我們要將公司建成數(shù)據(jù)驅(qū)動(dòng)公司。”到硅谷走一趟,你會(huì)聽到到處都是類似的豪言壯語,至少在Google成為世界上最強(qiáng)大的公司以后是這樣。

上面那一段話是Airbnb的工程副總裁Mike Curtis說的。他半年前加入這家公寓分享首創(chuàng)公司,他來Airbnb之前在Facebook做了近兩年工程總監(jiān)。 我們上個(gè)星期談起Airbnb數(shù)據(jù)驅(qū)動(dòng)的擴(kuò)展宏圖的真正含義,以及Curtis和他的工程團(tuán)隊(duì)如何把這個(gè)宏圖變?yōu)楝F(xiàn)實(shí)。 跟他在互聯(lián)網(wǎng)上與網(wǎng)絡(luò)數(shù)據(jù)打交道的同輩一樣,Curtis認(rèn)為,他和Airbnb的數(shù)據(jù)研究工作人員的工作,與公司戰(zhàn)略性帶頭人的工作有著本質(zhì)的聯(lián)系。

Curtis說:“我們認(rèn)為,我們?cè)诼糜晤I(lǐng)域推動(dòng)數(shù)據(jù)科學(xué),迄今為止我們做的可能比任何人都多。” 從長(zhǎng)遠(yuǎn)來看,這樣做——并在過程中同時(shí)獲利——必須利用一些尖端工具。

宏圖: 公寓共享變得更加人性化

Airbnb產(chǎn)品倚重人性化,目前最大的數(shù)據(jù)問題之一就是找出最佳的方法實(shí)施人性化搜索。 他說,“我們希望客人搜索得到的地點(diǎn)接近他們想找的東西。”

Facebook前工程總監(jiān):數(shù)據(jù)驅(qū)動(dòng)初創(chuàng)公司前途讓人驚嘆 

Mike Curtis

然而,他補(bǔ)充說,要搞清楚如何為每一個(gè)用戶的搜索排名在算法上是一個(gè)甚為困難的問題。 我們沒有更深入到談到細(xì)節(jié),但問題似乎很清楚。要對(duì)一個(gè)群體的搜索結(jié)果或是對(duì)地域性的搜索結(jié)果排序是很容易的,但要弄清楚如何準(zhǔn)確地考慮一個(gè)用戶的各種因素,如喜好、社會(huì)關(guān)系、租賃歷史、評(píng)論和其他數(shù)據(jù)點(diǎn),其復(fù)雜度會(huì)上升到另一個(gè)層次。(再加上Airbnb的數(shù)據(jù)來自特定的城市、訪客和主人的地域以及其他元數(shù)據(jù)也是要考慮的因素。)

推特的個(gè)性化搜索引擎用到數(shù)據(jù)科學(xué),因?yàn)樾枰紤]眾多因素以確定相關(guān)性,實(shí)現(xiàn)起來有相當(dāng)?shù)碾y度,是一個(gè)很好的例子 。

Curtis說,Airbnb進(jìn)行大量數(shù)字計(jì)算,意圖能幫助公寓主人找到最佳的租金率。

在公司內(nèi)部,Airbnb希望叫板Curits的前雇主Facebook。Facebook在利用Hadoop建造工具方面小有名氣,現(xiàn)在Facebook公司幾乎每一個(gè)人都直接或間接地用到Hadoop。 Curtis說,F(xiàn)acebook“真正地讓員工深入接觸數(shù)據(jù)及找出關(guān)鍵的問題。……在Airbnb打造產(chǎn)品的過程中,我也想這樣做。”

Mesos種種

Airbnb兜里的一個(gè)重要戰(zhàn)略性工具之一是一個(gè)開源集群管理項(xiàng)目,名為Mesos。Airbnb用Mesos實(shí)現(xiàn)自己的數(shù)據(jù)之夢(mèng)。 Mesos用到的技術(shù),源自加州大學(xué)伯克利分校的AMPLab,可以讓用戶在一個(gè)單一的資源集里運(yùn)行多種類型的計(jì)算框架(也有可能只是幾個(gè)不同的Hadoop集群)。Mesos在網(wǎng)絡(luò)上的名氣要拜推特所賜,Mesos項(xiàng)目上個(gè)星期一躍而成頂級(jí)Apache項(xiàng)目。

Facebook前工程總監(jiān):數(shù)據(jù)驅(qū)動(dòng)初創(chuàng)公司前途讓人驚嘆

Mesos結(jié)構(gòu)

對(duì)Airbnb而言,Mesos的關(guān)鍵是讓公司里的工程師在利用Hadoop范疇以外,最大限度地利用基于Amazon Web Services的基礎(chǔ)設(shè)施。 Curtis解釋說,Airbnb在很多地方都用到Hadoop,但是Airbnb想在流處理(stream processing)方面用Storm做實(shí)驗(yàn),Airbnb希望用Spark(也是AMPLab出的東西)來處理Hive查詢,會(huì)比Hadoop允許的速度快些。

實(shí)際上,Spark在搜索排名、定價(jià)和檢測(cè)服務(wù)的“不良行為”方面有可能特別有用,Curtis說,“這些東西很多都涉及到機(jī)器學(xué)習(xí)模型,”與Hadoop比,Spark的性能優(yōu)勢(shì)意味著它可以在較短時(shí)間內(nèi)一遍又一遍運(yùn)行這些模型。

Chronos是Airbnb打造的一個(gè)分布式作業(yè)調(diào)度程序,用于云環(huán)境之中。Chronos也是在Mesos上運(yùn)行的。

Airbnb用Mesos的一個(gè)很大的原因肯定是資源管理和效率,不過Curtis說,Mesos也可以幫助Airbnb在綜合工程戰(zhàn)略方面更進(jìn)一步,可以有助于建立小團(tuán)隊(duì)快步前進(jìn)。 Airbnb自動(dòng)資源配置做得越好,工程師做其他事情的時(shí)間就越多。他說,“理想的情況下,基本思想是利用Mesos的自動(dòng)化讓極少數(shù)的幾個(gè)工程師可以產(chǎn)生較大的影響。”

云:哇噻!Elastic MapReduce:無所謂?

雖然Airbnb仍在用AWS云,Airbnb的Mesos卻在考慮從流行Elastic MapReduce的Hadoop服務(wù)里遷移出來。 據(jù)Curtis說,走這一步棋有幾個(gè)原因,但最主要的原因是要用Mesos管理所有Airbnb需運(yùn)行的框架,從而對(duì)Airbnb的Hadoop環(huán)境有更精細(xì)的控制。他說,Elastic MapReduce在很大程度上來說是亞馬遜自己的分布式Hadoop,也就是說,用戶打補(bǔ)丁或完成類似的東西時(shí)必須依賴AWS,Elastic MapReduce也僅僅是做了Hadoop的事。

另一個(gè)工程師Brenden Matthews在上周在推特總部做了個(gè)演講,講Airbnb從Elastic MapReduce遷移到Mesos。他的幻燈片列出了更多轉(zhuǎn)換的原因,他還列出了有關(guān)在云里運(yùn)行Hadoop的常見挑戰(zhàn)。

Facebook前工程總監(jiān):數(shù)據(jù)驅(qū)動(dòng)初創(chuàng)公司前途讓人驚嘆

Curtis說,盡管如此,AWS總的來說還是很可靠的,而且還有云的靈活性——與Mesos的組合一起——意味著Airbnb可以想干什么就干什么,想什么時(shí)候干叫什么時(shí)候干。Airbnb的臨時(shí)分析查詢不會(huì)干擾Airbnb的長(zhǎng)時(shí)間運(yùn)行的批量工作流,反過來也一樣。

Curtis說,“運(yùn)行群集作業(yè)的速度完全處決于資源配置。我們?cè)诔乩锓哦嗌儋Y源呢?”

Curtis 90年代后期出道于AltaVista,后來在AOL、Yahoo和Facebook待過。他講起資源時(shí)笑遂顏開,一般來說,像Airbnb這樣的初創(chuàng)公司,一開始購置和管理服務(wù)器這么少的投資,云計(jì)算提供了很大的潛力發(fā)展空間。他說,“想想今時(shí)今日,所有的所有都是抽象的……真的是如此的美好和讓人驚嘆。”


[責(zé)任編輯:彭彥明]
阿明
如果我們要探求企業(yè)存儲(chǔ)的十年發(fā)展史,那么勢(shì)必需要從中國(guó)的數(shù)據(jù)中心的變化出發(fā)。數(shù)據(jù)中心近十年左右確實(shí)發(fā)生了很大的變化,單從其存儲(chǔ)方面的發(fā)展來看,從最初的存儲(chǔ)孤島,到存儲(chǔ)多元的整合,再到存儲(chǔ)優(yōu)化和發(fā)揮存儲(chǔ)價(jià)值,存儲(chǔ)在數(shù)據(jù)中心中的重要性與日俱增,那么這十年左右,到底企業(yè)存儲(chǔ)因數(shù)據(jù)中心發(fā)生了哪些具體改變呢?
官方微信
weixin
精彩專題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.