訊飛語音輸入法一夜爆紅,除了其本身數十年來的低調努力,或許還是第三次AI浪潮的一個縮影。
訊飛:典型創業成長史
1998年,科大訊飛創始人劉慶鋒在“國家863 ”比賽中拿到了第一名,與導師王仁華一起決定創業。然而,路程是漫長而艱難的,從最初的中國科大中銀天音智能多媒體實驗室,到成立安徽硅谷天音科技信息有限公司,為了省錢,他們甚至連一個電腦顯示器都舍不得換。
經歷了一年的高額虧損后,1999年底公司正式更名為科大訊飛。拿到了3000 萬融資,劉慶鋒開始跟中科院聲學所、社科院語言所、清華等研究機構都成立聯合實驗室。這一步,訊飛整合了做語音的源頭資源,為后來的發展打下了基礎。
小編炮:國家高技術研究發展計劃(863計劃)是中華人民共和國的一項高技術發展計劃。這個計劃是以政府為主導,以一些有限的領域為研究目標的一個基礎研究的國家性計劃。
訊飛商業模式第一次形成叫“iFly inside”,模式基于科大訊飛為聯想“天禧”電腦提供語音合成技術支持,此后科大又先后接受了來自復興集團、英特爾等公司的早期投資。
2004年科大訊飛進一步在IT市場發力,簽約華為后,這個團隊面臨了許多在實驗室時不曾有的問題:實驗室狀態的產品,在穩定性、工程化上面,如何滿足真正大規模商用的要求。而華為幾近苛刻的標準,讓他們把這個過程形容為“脫了一層皮”。但是正這一層皮脫掉了以后,之后再有誰測系統,訊飛從來沒倒過。
2002 年到 2005 年,訊飛將它叫做“彎曲的直線”,因為犯過無數的錯誤,走了無數的彎路。做過電話訪問的“有聲Email”、解決老師和家長之間的溝通問題“老師家長一線通”、語音選彩鈴的“聲動彩鈴”、在線K歌的平臺“愛吼網”、把書本內容讀出來的“會說話的書”……盡管有很多不完善與錯誤的存在,但如果沒做當時那些瘋狂的傻事,就沒有訊飛今天的發展。
訊飛輸入法誕生在2010年。iPhone4發布的那個晚上,因為思考到手機屏幕小不方便打字的問題,他們試著做了一個包含語音手寫還有拼音功能的demo。后來通過對市場進行研究和分析,一個幾人組建的小團隊就在杭州封閉開發了三四個月,終于在10月28號對外發布了第一個版本。
小編炮:訊飛的團隊,從最早的只有幾個人的小團隊,現在發展到包含完整職能的二百多人團隊,就是一部典型的創業公司成長史。
什么樣的優勢能叫創新
這些年來訊飛語音輸入技術的突破可以分為三個階段:
第一個階段,2010年剛推出的時候,識別率初步達到使用門檻,字正確率還不到80%;
第二個階段,隨著用戶越來越多,積累了大量的數據,通過大數據的訓練驅動,識別效果穩步提升,能夠到達90%以上。
第三個階段,2012-2013年,使用了深度學習算法,再結合大數據的訓練,正確率有了更大的突破。
語音輸入法一夜爆紅并非偶然。
2006年,隨著Hinton提出的深度學習的技術,以及在圖像、語音識別以及其他領域內取得的一些成功,第三次人工智能的浪潮來襲。2016年,人工智能的概念更是快速火熱起來。
“如果說,在50、60年代和70、80年代那兩次(人工智能發展期),中國企業還沒有辦法和外國企業在技術上相比的話,那在這次(發展浪潮里),我們完全走在了前面。”科大訊飛的輪值總裁胡郁在接受采訪時表示:相比于傳統的高新技術,中國在人工智能領域是有優勢的。
小編炮:因為地域語音的差異,語言之間的壁壘會有多高可想而知。960萬平方公頃的中國,自然有它的本地優勢……
不過,胡郁也承認,相對于美國很多人是真正從理論的角度進行非常深入的探討,中國對人工智能更多的認識是落在應用特性和娛樂特性上。
美國所謂原創性的研究,是從理論的根基出發,建立一套完整的思維方式。而有許多理論研究的東西是不會產業化的,沒有產業化價值的,它只是一種哲學化的思考。哲學會產生真正的創新,一種是在最原始的技術上創新。而這些東西,中國幾乎沒有關心過。
“現在學術界可能因為要和產業界對接,做了很多技術層面上,和應用相關的創新。而產業界還沒有能力,來做整體性、系統性創新的工作,比較少。所以我覺得這就是我們和美國相比有差異的所在。”
巨頭圍城,AI大戰開打
訊飛從語音這塊具有本地化優勢的市場切入AI形成了領先優勢,但也面臨著國際巨頭的圍城,國際層面的AI大戰其實早在悄悄醞釀。自2011年以來,蘋果、谷歌、微軟、英特爾、IBM、雅虎、eBay、亞馬遜、AOL、Facebook、Twitter、Salesforce和甲骨文等巨頭一共收購了140家AI公司。
谷歌:
不管是早前一口氣收購7家機器人公司——Schaft、Industrial Perception、Meka Robotics、Redwood Robotics、Bot & Dolly和Holomni,還是默默吞下圍棋大戰中一戰成名的Deep Mind,又或今年再次收購了聊天機器人創業公司API.AI……谷歌在自家旗下的多項服務中投放了AI技術。
英特爾:
2015年10月,英特爾收購了AI初創公司Saffron。2016年5月,收購了專門從事計算機視覺(CV)算法的初創公司Itseez。
此外,英特爾還花費4億美元收購深度學習初創公司Nervana Systems。作為芯片制造商,英特爾想要通過Nervana Systems在硅層實現機器學習,而不是在圖形處理芯片上發展機器智能。
蘋果:
盡管蘋果很少討論他們的收購案,但2016年,蘋果先后收購了AI初創公司Emotient、專注于用于智能手機的AI技術的Perceptio和VocalIQ、西雅圖初創公司Turi和其服務于開發者和數據科學家的機器學習平臺。
近日,來自卡耐基梅隆大學的羅斯教授更在Twitter上公布了自己加入蘋果的消息,未來他將組建并管理面向未來的蘋果AI團隊。
三星:
10月初,三星宣布收購 Viv Labs。這家致力于打造開放式人工智能助理平臺的初創公司,創始成員正是曾幫助蘋果推出語音助理 Siri 的幕后功臣——Dag Kittlaus、Adam Cheyer 和 Chris Brigham。
和谷歌助手一樣,Viv也采用了機器學習技術。作為消費電子巨頭,三星旗下有大量產品可以搭載Viv,加強其的個人數字助理領域的動作。
微軟:
2016年,微軟花費2.5億美元收購了總部位于倫敦的初創公司Swift Key,其產品可以讓鍵盤輸入法學習記憶用戶的輸入習慣,并做出相應調整;6月末收購了自然語言信息平臺Wand實驗室,來讓他們專注于微軟產品;8月份收購了一個擁有AI技術的智能日程工具的初創公司Genee。
這些公司都將為微軟帶來他們的專業知識,但本身的產品項目被叫停,可能是為了更深度地集成其智能助手Cortana和Outlook等應用。
Twitter:
2014年,Twitter收購機器學習初創公司Madbits;2015年,Twitter收購Whetlab公司;2016年,Twitter更是花費令人瞠目結舌的1.5億英鎊收購了倫敦初創公司Magic Pony。
首席執行官Jack Dorsey在今年的收購聲明中表示:Magic Pony團隊研究創造出了可以識別圖像特征的算法,其技術將用于提升我們在直播和視頻的能力,并為Twitter打開了很多激動人心的創意可能。
Salesforce:
2015年6月,Salesforce收購了智能日歷應用Tempo.ai,12月又收購了AI虛擬助理AILA的開發者Min Hash。今年還收購的開源機器學習服務器和開發者社區PredicitonIO以及致力于機器學習分析的初創公司Beyond Core。
首席技術官Adam Evans在接受英國的Computer world訪問時說:Salesforce對AI技術非常感興趣,我們已經從記錄系統轉變為參與系統,而現在我們正向智能系統進軍。
小編炮:各大巨頭的舉措,都從側面反映出AI時代到來。未來,以AI為基礎的虛擬助手將大大改變人們使用電子設備的方式,一旦使用方式改變,人們手中的設備也會經歷大的更新換代。在這巨大浪潮中,中國公司如何利用優勢殺出一條血路,讓我們拭目以待。