先聲教育成立于2016年,是一家教育領(lǐng)域的AI技術(shù)服務(wù)商,做的是智能語言學(xué)習(xí),AI技術(shù)服務(wù)能力主要包括:智能語音評測技術(shù)、智能寫作批改技術(shù)、自適應(yīng)學(xué)習(xí)技術(shù)、智能對話技術(shù)以及情感識別五個方面,以云服務(wù)的形式把技術(shù)提供給B端企業(yè)用戶,比如一些教育企業(yè)或者教育機(jī)構(gòu)。而不是直接面向最終用戶的,這是與許多AI教育創(chuàng)業(yè)公司的不同之處。?
秦龍表示,之所以提供2B的服務(wù),一方面是因為我們對技術(shù)更專業(yè)一些,技術(shù)我們可以做得很好。另外一方面還在于,做2B的服務(wù),可以通過教育機(jī)構(gòu)把技術(shù)應(yīng)用交付給學(xué)生來用。我們都知道,機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù),讓用戶快速用起來對于產(chǎn)品的升級迭代有很大的積極作用。
憑借對行業(yè)的認(rèn)知,他坦言,如果做2C業(yè)務(wù),很難在兩年時間內(nèi)達(dá)到100萬日活。目前來看,很多國內(nèi)大的教育企業(yè)的產(chǎn)品也沒有100萬日活。然而,先聲教育已經(jīng)做到了。?
先聲教育是一家技術(shù)驅(qū)動的公司,“先聲”名字源于在語音技術(shù)上的積累,有技術(shù)自信,“先聲”做的業(yè)務(wù)是先從語音技術(shù)入手。
先聲教育的核心競爭力在人工智能語音服務(wù),做的是語音測評而不是簡單的語音識別,語音識別有很多開源的框架和模型,而先聲教育做的測評則是更深入而且有廣泛應(yīng)用場景的技術(shù)路線,語音評測涉及發(fā)音的方方面面,對語速,連貫性,流利度,語調(diào),音量,停頓,韻律,語氣內(nèi)涵的情緒、態(tài)度都會記錄,用技術(shù)模型來打分評判,而且可以給出改進(jìn)的意見。
CTO秦龍與語音智能技術(shù)結(jié)緣已久,在中國科學(xué)技術(shù)大學(xué)上學(xué)期間就曾進(jìn)入了科大訊飛的實(shí)驗室,如今科大訊飛在中國乃至全球的語音處理方面都有領(lǐng)先地位,當(dāng)時,他在實(shí)驗室里做一些語音合成方面的工作,從中國科學(xué)技術(shù)大學(xué)畢業(yè)之后,他又去到卡內(nèi)基梅隆大學(xué)讀博士,所學(xué)專業(yè)也是語音識別,畢業(yè)之后加入到美國的語音教育平臺Duolingo(多鄰國)。?
然而,當(dāng)他看到國內(nèi)市場的機(jī)遇之后,毅然決定回國,開始加入先聲教育。秦龍表示,我們看到國內(nèi)人群在口語方面問題很大,絕大多數(shù)學(xué)生很難獲得口語上的指導(dǎo)和提升,因為絕大多數(shù)英語老師沒辦法做出好的指導(dǎo)。
酒香也怕巷子深,2B的方向是為了讓好酒走的更遠(yuǎn),先聲教育的這一做法已然奏效。?
據(jù)介紹,先聲教育的客戶列表中已然有了好未來集團(tuán)、新東方在線、全通教育、等各種不同類型的教育公司和企業(yè),全國加起來有數(shù)百家家企業(yè)用戶,先聲教育現(xiàn)每天服務(wù)數(shù)百萬萬學(xué)生,每天處理一萬小時的語音數(shù)據(jù),相當(dāng)于416天不間斷的時長,更大的挑戰(zhàn)是需要應(yīng)對幾千甚至上萬的并發(fā)請求,對穩(wěn)定的服務(wù)質(zhì)量有很高需求。?
雖然是在2016年才成立,但先聲教育的發(fā)展速度非???,飛速成長中的先聲教育在IT基礎(chǔ)架構(gòu)上自然會考慮上云,為了向用戶提供穩(wěn)定的服務(wù),先聲教育選擇了AWS,秦龍對AWS的易用性和穩(wěn)定性非常認(rèn)可,希望用比較成熟的云服務(wù)來向企業(yè)用戶提供穩(wěn)定的服務(wù)。
在實(shí)際應(yīng)用中,先聲教育主要用的是AWS的一些基礎(chǔ)服務(wù),計算,存儲,網(wǎng)絡(luò)資源。?
當(dāng)學(xué)生發(fā)音朗讀之后,系統(tǒng)把音頻文件傳輸?shù)?span lang="EN-US">AWS的服務(wù)商,過程中會用到CDN加速,然后數(shù)據(jù)主要的存儲空間是S3對象存儲,先聲教育的AI系統(tǒng)調(diào)用的計算資源主要還是CPU,為了應(yīng)對洶涌而來的高并發(fā),自然還需要用到EBL負(fù)載均衡服務(wù),當(dāng)然,配套的還需要用到Autoscaling自動擴(kuò)展的服務(wù),計算會輸出模型,最后通過API向用戶提供服務(wù),為了進(jìn)一步降低數(shù)據(jù)存儲的成本,先聲教育還使用了AWS的歸檔存儲Glacier來存放音頻。?
秦龍本人對AWS還是比較熟悉的,除了這些基本的服務(wù)以外,先聲教育還在嘗試一些新的服務(wù),比如使用了AWS的Polly語音合成服務(wù),該服務(wù)能提供多種語言的發(fā)音,在計算資源上,先聲也在考慮使用GPU服務(wù),另外,在圖像識別方面,先聲教育也在嘗試AWS的OCR服務(wù),對新技術(shù)保持著非常開放的態(tài)度,只做自己最擅長最專業(yè)的那部分。