IT時(shí)報(bào) 發(fā)表于:13年08月21日 10:39 [轉(zhuǎn)載] DOIT.com.cn
——嘉賓——
上海圖書館副館長(zhǎng) 陳超
著名作家 梁曉聲
中華書局副總編輯 顧青
大數(shù)據(jù)之熱,出版業(yè)不可能沒(méi)有感受到.不過(guò),對(duì)大數(shù)據(jù)時(shí)代的到來(lái),出版業(yè)人士在2013上海書展的一場(chǎng)高層論壇上表現(xiàn)得誠(chéng)惶誠(chéng)恐,他們不知道大數(shù)據(jù)是否真的那么美妙,不清楚大數(shù)據(jù)給未來(lái)提供的全新可能性是什么.盡管如此,出版業(yè)面對(duì)大數(shù)據(jù)的一場(chǎng)長(zhǎng)期戰(zhàn)役已經(jīng)打響.
當(dāng)出版遇上大數(shù)據(jù)
2010年,谷歌推出圖書數(shù)據(jù)庫(kù),庫(kù)中包括從1500年到2008年間出版的各類圖書的5000億個(gè)單詞.用戶可以在電腦上輸入最多五個(gè)單詞,查看這些單詞歷年來(lái)的使用頻率情況.
例如,輸入"women"(女性)和"men"(男性)會(huì)發(fā)現(xiàn),上世紀(jì)70年代之前,"women"在圖書中很少被提及,而當(dāng)女權(quán)主義站穩(wěn)腳跟后,"women"的使用頻率逐年提升,到1986年,"women"和"men"的使用頻率曲線出現(xiàn)了交點(diǎn)."這說(shuō)明,將高質(zhì)量的數(shù)據(jù)分析應(yīng)用于人文學(xué)科也是可行的."美國(guó)哈佛大學(xué)研究員埃雷茲·利伯曼·艾丁將這種研究方法稱作"文化組學(xué)"(culturomics).上海圖書館副館長(zhǎng)陳超在論壇上分析說(shuō),這誘發(fā)了一個(gè)新的學(xué)科,通過(guò)文本的定量分析來(lái)揭示人類行為和文化發(fā)展的趨勢(shì).
隨著大數(shù)據(jù)時(shí)代的到來(lái),閱讀方式也發(fā)生了深刻的變化.數(shù)世紀(jì)以來(lái)閱讀作為一種單獨(dú)、私密行為的方式,轉(zhuǎn)變?yōu)槟撤N可以測(cè)量的半公開的行為.如今,電子閱讀器能夠讓出版商和作家一窺銷售額背后的故事,它們不僅僅能夠顯示某些書吸引了多少購(gòu)買者,還能揭示他們的閱讀強(qiáng)度.
出版社已經(jīng)開始運(yùn)用這些數(shù)據(jù).出版《哈利·波特》小說(shuō)的Scholastic出版社通過(guò)建立在線游戲追蹤最吸引人的線索和角色,以此為構(gòu)思基礎(chǔ)創(chuàng)作了《39條線索》系列小說(shuō),成為又一本全球暢銷書;Coliloquy出版的電子書允許讀者自己設(shè)計(jì)人物角色和情節(jié)線索,經(jīng)數(shù)據(jù)分析,讓作家調(diào)整故事迎合大眾口味.讀者甚至可以選擇女主角與三位追求者中的哪一位發(fā)生關(guān)系.
中國(guó)出版業(yè)的實(shí)踐與猜想
Coliloquy的這一模式某種意義上說(shuō)明了大數(shù)據(jù)在出版業(yè)的可行性.但是,能否真的像英國(guó)電視劇《紙牌屋》那樣,靠大數(shù)據(jù)的排列組合,流水線生產(chǎn)一本同類暢銷書呢?陳超很同意豆瓣上一篇關(guān)于此分析的日志:"如果我們能量化用戶的閱讀題材、閱讀場(chǎng)所、閱讀時(shí)長(zhǎng)、標(biāo)注章節(jié)和重復(fù)瀏覽內(nèi)容,大數(shù)據(jù)時(shí)代的快銷書指日可待."
著名作家梁曉聲卻并不如此認(rèn)為,"大數(shù)據(jù)不可能影響我們(作家)."他在接受《IT時(shí)報(bào)》記者采訪時(shí)斬釘截鐵地表示.他認(rèn)為:"數(shù)字閱讀的時(shí)代剛剛來(lái)臨,是否意味著它將告別讀書這一古老而良好的習(xí)慣呢?有人斷言這是早晚的事,最快50年后變成現(xiàn)實(shí).我認(rèn)為不會(huì),起碼100年后不會(huì).人類對(duì)讀書的親情,對(duì)于一部分讀書人而言,早已成為基因,成了DNA的一部分."
現(xiàn)實(shí)情況是,出版業(yè)已經(jīng)開始對(duì)大數(shù)據(jù)展開各類探索.上海圖書館今年春節(jié)期間做了"讀者閱讀賬單",根據(jù)一年來(lái)的外借量,將讀者分為極客、書蟲、文青,并寄一張個(gè)性化的閱讀數(shù)據(jù)表給讀者.陳超介紹,他們發(fā)現(xiàn)去年一年在上海所有圖書館中借書量最大的一個(gè)人共借了3414本書,是一位司機(jī),"沒(méi)有數(shù)據(jù),不知道這個(gè)事情,知道以后會(huì)去問(wèn)為什么,和數(shù)據(jù)大小無(wú)關(guān)."
作為中國(guó)傳統(tǒng)文化的內(nèi)容供應(yīng)商,中華書局也在思考如何在大數(shù)據(jù)時(shí)代為出版提供更多可能.中華書局副總編輯顧青認(rèn)為,用數(shù)字經(jīng)濟(jì)的理念來(lái)看待,中華書局不僅要保持古籍整理和出版的核心競(jìng)爭(zhēng)力,更應(yīng)該保留獲取、存儲(chǔ)、整合、搜索、分析中國(guó)傳統(tǒng)古籍文本及其研究文本的能力.
顧青同時(shí)坦承,目前中華書局仍以紙書為主,數(shù)字產(chǎn)品極少,主要是"中華經(jīng)典古籍庫(kù)"和"中華基本史籍知識(shí)庫(kù)"兩個(gè)數(shù)據(jù)庫(kù).圖書館采購(gòu)也在借力大數(shù)據(jù).如今,圖書館文獻(xiàn)資源建設(shè)經(jīng)費(fèi)緊張,特別是紙本書刊經(jīng)費(fèi)比例逐年減少.同時(shí),圖書采訪員人員有限,三四萬(wàn)人的綜合類大學(xué)的圖書采訪員也不過(guò)三四個(gè),采回的書80%沒(méi)有價(jià)值或價(jià)值不高.據(jù)此,北京人天書店董事長(zhǎng)鄒進(jìn)提出,在大數(shù)據(jù)時(shí)代,可以從采訪數(shù)據(jù)中提取核心書目,根據(jù)出版社、作者、責(zé)任編輯、版次等綜合評(píng)分提供采購(gòu)指導(dǎo).
要大數(shù)據(jù),得先數(shù)字化
與會(huì)者普遍認(rèn)為,在中國(guó),傳統(tǒng)出版業(yè)和圖書館還處在數(shù)字化的轉(zhuǎn)型時(shí)期,因此現(xiàn)在談要在內(nèi)容、閱讀、服務(wù)、管理方面"數(shù)據(jù)化",得先將"數(shù)字化"進(jìn)行徹底.
在管理方面,陳超說(shuō),我國(guó)數(shù)字出版產(chǎn)業(yè)鏈上"B2L2R"(出版社到圖書館到讀者)的商業(yè)模式和平臺(tái)遠(yuǎn)未成熟.在美國(guó),Overdrive公司搭建了這樣一個(gè)平臺(tái):出版社把電子資源交給他們,再由他們負(fù)責(zé)向所有圖書館提供電子書,亞馬遜借書服務(wù)就是他們的客戶.
"國(guó)內(nèi)沒(méi)有數(shù)字閱讀平臺(tái),不掌握用戶閱讀行為的數(shù)據(jù),怎么來(lái)做大數(shù)據(jù)創(chuàng)新呢?"陳超發(fā)問(wèn)道.
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.