基因檢測(cè)飛入尋常百姓家
生命基線創(chuàng)立的JanGene(簡基)品牌,是把2C的基因檢測(cè)做成了2B(面向企業(yè))業(yè)務(wù),面向企業(yè),為企業(yè)員工提供健康風(fēng)控服務(wù),側(cè)重點(diǎn)是做疾病預(yù)防,有相對(duì)明確的檢測(cè)指標(biāo),并結(jié)合體檢的數(shù)據(jù)提供有針對(duì)性的預(yù)防手段,與一些泛娛樂化的互聯(lián)網(wǎng)基因檢測(cè)服務(wù)有很大區(qū)別。
談到基因檢測(cè),許多人的第一直觀感受就是高大上,九十年代開始,全球六個(gè)國家的科學(xué)家一起協(xié)作“人類基因組計(jì)劃”,這是一項(xiàng)浩大的工程,整個(gè)項(xiàng)目花費(fèi)13年超過30億美金。而現(xiàn)在一個(gè)全基因組測(cè)序,只需要數(shù)天不到一千美金就可以完成,這就是基因測(cè)序領(lǐng)域常說的超摩爾定律,,而這一切源于基因檢測(cè)整體技術(shù)的進(jìn)步所致。成本和速度都發(fā)生了天翻地覆的變化,這也讓原本高大上的基因檢測(cè)服務(wù)飛向了尋常百姓家。
常見的基因檢測(cè)服務(wù)主要分兩個(gè)環(huán)節(jié),一個(gè)是采集基因的數(shù)據(jù),一個(gè)是解析這些數(shù)據(jù)反應(yīng)的結(jié)果。
基因檢測(cè)準(zhǔn)不準(zhǔn)?測(cè)序和分析都很重要
第一環(huán)節(jié),凌之浩表示,整體市場(chǎng)上的基因數(shù)據(jù)采集過程都有非常標(biāo)準(zhǔn)化的流程和檢測(cè)設(shè)備,數(shù)據(jù)的準(zhǔn)確程度其實(shí)非常高。
第二個(gè)環(huán)節(jié)就是要根據(jù)現(xiàn)有的數(shù)據(jù)進(jìn)行解析,給出分析報(bào)告,說明數(shù)據(jù)背后反映的意義。而大多數(shù)疾病的發(fā)生并不完全由基因決定,后天生活環(huán)境也很重要。
基因檢測(cè)與基于AWS云計(jì)算的數(shù)據(jù)分析
凌之浩介紹說,按照目前的測(cè)序技術(shù),要相對(duì)完整的覆蓋一個(gè)人的全基因組序列,大約需要產(chǎn)出約90G的原始數(shù)據(jù)。而基于這些數(shù)據(jù)的研發(fā)過程,在存儲(chǔ)和計(jì)算都需要強(qiáng)大的IT支持。
同一基因位點(diǎn)的變異,在不同人群中的影響可能完全不同,基因信息的解析是否適合服務(wù)的人群是一家基因公司最核心的競(jìng)爭(zhēng)力。為了提升解析的精準(zhǔn)度,需要做許多原創(chuàng)性的研究,從凌之浩的介紹中了解到,生命基線科技已與四川大學(xué)華西醫(yī)院聯(lián)合申報(bào)了原創(chuàng)性的研發(fā)項(xiàng)目,而類似的這種創(chuàng)新合作需要長期堅(jiān)持才能有所成效。生命基線是在做事業(yè),而不是急于追求商業(yè)上的成功,在產(chǎn)品上,生命基線已經(jīng)累計(jì)了許多知識(shí)產(chǎn)權(quán)。
除了直接面向企業(yè)提供健康風(fēng)控服務(wù)外,生命基線科技的另一塊業(yè)務(wù)叫做“基因幫”,致力解決科研人員在科研過程中各個(gè)環(huán)節(jié)的需求,提供基因測(cè)序及測(cè)序數(shù)據(jù)分析服務(wù)??蒲腥藛T在平臺(tái)上提交需求,基因幫進(jìn)行工程師匹配,雙方取得聯(lián)系,明確收費(fèi)和交付時(shí)間。在這個(gè)過程中基因幫作為一個(gè)第三方平臺(tái),將對(duì)項(xiàng)目預(yù)付款、項(xiàng)目進(jìn)度進(jìn)行把控和監(jiān)管。。
在陸陸續(xù)續(xù)使用了超算和一些云計(jì)算平臺(tái)后,基因幫最終在半年前選擇了AWS。對(duì)于選擇亞馬遜AWS的原因,凌之浩說,一方面是因?yàn)槌杀?,一方面是服?wù)。在使用AWS的過程中,公司發(fā)現(xiàn)AWS的服務(wù)非常好,24小時(shí)有工程師可以解決問題,而且AWS提供的API接口等工具非常便于開發(fā)者去學(xué)或者用,上手很快,作為一家創(chuàng)業(yè)公司,AWS的性價(jià)比也是他們非??粗氐?/p>
通過數(shù)百臺(tái)Amazon EC2 Spot實(shí)例,基因幫獲得所需要的計(jì)算能力,使用命令行工具和豐富的API種類,配合EC2,以及啟動(dòng)腳本來進(jìn)行快速的部署,利用AWS S3存儲(chǔ)桶來儲(chǔ)存樣本數(shù)據(jù)和最終結(jié)果?;驇涂筛鶕?jù)業(yè)務(wù)需求自動(dòng)的進(jìn)行彈性擴(kuò)展所需要的實(shí)例,可以在 Amazon EC2 Spot實(shí)例請(qǐng)求中指定出價(jià),從而選擇愿意為實(shí)例支付的每小時(shí)價(jià)格,這一模式非常適合測(cè)試和開發(fā)環(huán)境。
現(xiàn)在幾分鐘就可以部署上百臺(tái)服務(wù)器實(shí)現(xiàn)計(jì)算分析任務(wù),并在計(jì)算完成后自動(dòng)關(guān)閉實(shí)例,極大的降低了運(yùn)維的壓力。
未來發(fā)展
生命基線的兩大業(yè)務(wù)當(dāng)中,簡基作為新興業(yè)務(wù)在定位和內(nèi)容上都不同于市場(chǎng)常見的2C的基因檢測(cè)公司,對(duì)企業(yè)員工提供的一系列服務(wù)能讓企業(yè)為員工選擇更有針對(duì)性的體檢項(xiàng)目,讓員工看到體檢的價(jià)值,這點(diǎn)理應(yīng)受到企業(yè)的歡迎。
面向未來,生命基線給自己的定位是技術(shù)服務(wù)商,為體檢機(jī)構(gòu)、社區(qū)醫(yī)院等機(jī)構(gòu)提供高質(zhì)量的基因數(shù)據(jù)分析服務(wù),幫助這些機(jī)構(gòu)為用戶提供更高質(zhì)量的服務(wù)。