• 本站點使用cookies,繼續瀏覽表示您同意我們使用cookies。Cookies和隱私政策>

    科大訊飛:聽見AI的聲音

    2018年09月03日 文/許勝藍、薛樺

    未來的人工智能什么樣?現在還沒有確定的答案,但能確定的是現在只是開始。科大訊飛執行總裁、消費者事業群總裁胡郁表示,人工智能經過60多年的發展,現在剛剛找到了一個可能達到人類智能的入口。

    從智能語音到訊飛超腦

    科大訊飛1999年成立的時候,手上只有一項技術就是語音技術,當時的目標是讓機器開口說話。胡郁笑談:“當時我們并不知道,我們處于人工智能的范疇,至少自己沒有清晰的概念。我們更加不知道的是,1999年恰恰是人工智能的第二次冬天。就像華為任總以前經常講的一句話,華為要是知道通訊行業這么難做,可能就不會做了。我們當時也是,如果知道人工智能處于那樣的環境,可能就不會創業了。這既有巧合,又是冥冥之中的注定。”

    “2003-2004年以后,人工智能還不是特別熱,我們慢慢意識到我們做的恰好是人工智能最關鍵的技術。”人類的智能相對于其他動物或者相對于機器,最重要的是認知智能,而認知智能的主要來源是人類對語言的掌握和對知識的表達,然后在這個基礎上進行邏輯推理和復雜的決策。以語音和語言為中心的認知革命,是人類智慧的最高水平,也是現在人工智能所面臨的最大挑戰。

    作為訊飛超腦的總牽頭人,胡郁作出了這樣的詮釋:“2014年,我們在業界第一次推出‘訊飛超腦’計劃,這不僅僅是一個口號。我們同時發布了對人工智能的定義,即運算智能。機器從發明的第一天開始,就比人類強很多,比如會下圍棋的機器,就是機器運算智能的表現。還有類人機器具有感知智能和運動智能,具體表現是機器能夠看到、聽到、感覺到周圍的世界。現在的類人和動物的機器已做得不錯了。但是,人類之所以能夠屹立在地球生物鏈的頂端,是因為人類的語言能力,我們稱為認知智能。這是訊飛超腦計劃的一個目標,讓具備感知智能的機器從能聽會說、能看會認,過渡到認知智能,即能理解,會思考。”

    當前,“訊飛超腦”利用大數據來進行訓練以提升相關算法,這其中的“訓練”指代的并不是那種填鴨式的數據輸入和訓練,而是來自于真實應用場景的真實交互數據,讓系統能夠依據真實數據實現自主學習和提升,胡郁稱之為漣漪效應,就像水滴入水面產生的漣漪一樣,隨著產品覆蓋面的不斷增加,數據量級也在快速攀升,進而帶來產品體驗的快速優化迭代,這一切的背后都依賴于“訊飛超腦”這個強大的人工智能引擎。

    科大訊飛在語音合成、識別、評測、翻譯等領域都擁有全球領先的核心技術。2006年至2018年,在全球最高水平的語音合成比賽Blizzard Challenge中,科大訊飛取得13連冠,同時科大訊飛各項關鍵指標均名列第一。在國際機器翻譯評測IWSLT2014、NIST2015等大賽中,科大訊飛連奪冠軍。在過去6年中,科大訊飛的語音識別技術準確率從60.2%提升到98%以上。語音技術上的優勢為科大訊飛向人工智能發展,同時落地行業與應用打下良好的根基。

    科大訊飛在布局當前的大數據人工智能的同時,也在關心人工智能發展的另一方面,即與人腦相結合,基于類腦計算,試圖找到人腦智能的奧秘,發現其中的智能動力學,進而真正讓機器具備像人一樣的智能,同時不受人腦物理空間的局限,以此來實現人工智能領域真正的突破。

    智能交互改變生活

    科大訊飛是真正把人工智能的應用落地了。在2010年,科大訊飛開發了世界上第二個、中國第一個語音輸入法,僅次于谷歌。訊飛輸入法主打語音輸入,語音識別準確率超98%,同時支持22種方言的語音輸入。

    在2016年,科大訊飛發布了第一個智能終端產品訊飛翻譯機。2018年4月又推出了訊飛翻譯機2.0,主打中文與33種語言實時互譯、方言翻譯和拍照翻譯,并獨家具備4G、Wi-Fi和離線翻譯模式。86%的用戶將翻譯機用于出境游。考慮到用戶可能不會使用標準普通話,訊飛翻譯機2.0同時搭載了方言和帶方言口音非標準普通話的識別能力,目前已支持粵語、四川話、東北話、河南話四大方言。方言種類還在持續增加中,并能根據用戶的不同使用場景與用詞習慣,準確識別并給出最符合語境的翻譯結果,真正做到了落地實用。可以說,訊飛翻譯機2.0是至今世界上銷量最好、好評度最高的手持式智能翻譯系統。

    胡郁說:“有人主張把翻譯功能完全整合到手機里,沒有必要專門為此做一個硬件,但‘做翻譯機是科大訊飛深思熟慮的結果’。”首先,手機的主要使用場景是近場使用,沒有考慮到在翻譯過程中人可能離得比較遠、環境噪聲大等問題;其次,智能硬件的精髓在于好用,在于方便快捷,打開即用,一步到位才能有更好的體驗,而手機中使用APP的過程繁瑣,操作不便;第三,翻譯場景應該有更自然、更親和的交互,將手機直接放在別人嘴邊也不符合我們的社交禮儀。

    為了構建未來人工智能產業生態體系,在2010年科大訊飛發布了語音云平臺。目前平臺上的開發者已經超過86萬,連接19億設備,每日提供近46億次交互服務,數以百萬計的開發者正在借助科大訊飛的核心技術開發智能產品,服務于我們生活的方方面面。

    此外,2015年,科大訊飛發布了對人工智能產業具有里程碑意義的人機交互界面——AIUI,重新定義了萬物互聯時代的人機交互標準。胡郁說道:“2017年,科大訊飛被宣布作為首批國家新一代人工智能開放創新四大平臺之一,旨在建成依托智能語音的國家新一代人工智能開放創新平臺,這是國家對訊飛人工智能產業生態的高度認可。”

    專家系統賦能行業

    智能語音和人工智能技術對傳統行業賦能方面,科大訊飛也做了很多嘗試,例如公檢法、教育等行業。

    在公檢法領域,科大訊飛與最高法、最高檢開展創新合作。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話準確率極高;人工智能還充當起法庭書記員,經測試,智能語音識別參與庭審取得實際效果,庭審時長縮短30%。

    在教育領域,人工智能在“改卷子”方面的能力就超乎了人們的想象。在江蘇省的高考智能閱卷驗證中,兩個不同的人工智能語文作文閱卷分差小于7分,一致率達92.82%,比兩位老師的閱卷評分一致率高出5%以上。在湖南省研究生考試的智能閱卷驗證中,兩個不同的人工智能分別對英語作文進行閱卷評分,分差小于6分的一致率竟高達99.83%,比兩位老師的閱卷評分一致率高出了4%以上。胡郁表示,教育部考試中心正聯合科大訊飛建立人工智能聯合實驗室,在教育領域醞釀更多“黑科技”的誕生。

    共建AI未來

    科大訊飛與華為公司始終保持著緊密合作,雙方充分依托各自行業領域的長期積淀優勢,在電信平臺、智能終端等領域建立了戰略合作關系,攜手推動語音及人工智能技術的深入應用。雙方合作在2010年建立了世界上第一個中文語音的開放云平臺。云計算能力開放以后,眾多公司和開發者可以面向最終用戶的各種需求,開發各種各樣的產品,這就形成了生態的建設。

    2018年5月,華為與科大訊飛簽署戰略合作協議,未來雙方將在公有云服務、ICT基礎設施產品、智能終端、以及辦公IT四大領域開展深度戰略合作。雙方還將面向未來開發創新AI語音應用,拓展全新行業市場,做大規模,共享收益,共同做強人工智能產業生態。

    對于消費者市場,華為手機使用的技術中,有一部分是源于科大訊飛的智能語音技術加持。華為手機還將科大訊飛的AI技術和能力內化為華為手機能力的一部分,為其帶來差異化的競爭優勢。雙方將基于科大訊飛的語音識別、語音合成、訊飛聽見、訊飛翻譯等語音AI技術和能力,圍繞手機等智能終端產品以及終端云服務進行合作。

    對于企業市場,華為在基礎設施、內部辦公產品等使用科大訊飛的技術與產品,雙方將基于訊飛引擎和華為云資源,共同構筑華為云EI平臺(Enterprise Intelligence)。面向未來+智能的時代,胡郁認為將來的人工智能都要在云計算上做。由于云計算的資源消耗比較大,將來有可能會在端計算和邊緣計算上實現更好的人工智能,也許很快成為技術上的突破口,人工智能的應用也會更多地落地。

    我們有理由相信,未來華為和科大訊飛可以更好地依托自身優勢,結合產業發展,共建更好的人工智能生態體系,為未來的AI生活增光添彩。

    掃描體驗移動閱讀

     
    十一选五开奖结果