圖片展示

IDC最新報告:阿里語音AI登頂中國No.1

發表時間: 2020-12-10 15:56:05

瀏覽:

沒錯,阿里并非先發的語音AI,現在中國市場份額第一。 7月14日(周二),IDC發布《中國AI云服務市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,超過百度云、騰訊云、華為云、AWS、微軟Azure等云服務廠商,成為第一。 從IDC報告的具體內容來看,阿里語音AI這個No.1,得益于其在智能語音、對話式AI、機器學習三大領域的實力: 智能語音領域產品數量、市場份額、API調

沒錯,阿里并非先發的語音AI,現在中國市場份額第一。

    7月14日(周二),IDC發布《中國AI云服務市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,超過百度云、騰訊云、華為云、AWS、微軟Azure等云服務廠商,成為第一。

從IDC報告的具體內容來看,阿里語音AI這個No.1,得益于其在智能語音、對話式AI、機器學習三大領域的實力:

智能語音領域產品數量、市場份額、API調用量三項第一;對話式AI領域市場份額、API調用量兩項第一;機器學習領域獲得市場份額第一。

這還只是現狀。

    IDC還預測,2020年中國人工智能市場規模將會接近20億美元,巨大的市場規模,作為市場領導者,阿里將會有更多的表現空間。

然而,對于這樣的一份成績單,阿里巴巴達摩院語音實驗室負責人鄢志杰,并不“感冒”。

在他看來,IDC報告中的數字并不重要,更值得關注的是背后的趨勢:語音AI技術的商業價值,已經在市場上得到了初步體現。

他說,阿里巴巴之所以有這樣的成績,不僅僅有過去5、6年時間的技術積累為基礎,還在于AI上云的過程中,找到了“落地”秘訣。

中國No.1的語音AI,如何后發先至?

相比90時代就搞語音的玩家,阿里的語音AI之路,不算早。

阿里開始大力度、嚴肅地研發語音AI技術,起于2014年底,標志性事件是“神秘部門”iDST(數據科學與技術研究院)成立。

在此之前,相關的研究只是零散地分布在各個業務線之中。

2015年,鄢志杰在微軟亞洲研究院工作7年后,加入阿里iDST,負責語音技術的研發工作。

當時,語音AI技術主要用于阿里內部業務,比如淘寶、天貓的等電商體系客服中心的需求。

因為之前沒有研究積累,鄢志杰需要帶隊從0到1,為阿里打造一個能用、好用的語音AI系統。

雖然困難,但也好在沒有“歷史包袱”,他可以放開手去做。

在阿里豐富的應用場景下,阿里語音AI的后發優勢顯現出來。

比如2016年開始備受關注的latency-controlled BLSTM(LC-BLSTM) 模型,從學界到阿里率先實現落地,只用了幾個月的時間。

而且不僅僅只有單純的落地,還有面向應用的優化。

在阿里版本的LC-BLSTM模型中,不僅降低了傳統BLSTM模型延遲嚴重的問題,精度同樣不差。

相關論文也得到了學術界的認可,在2017年經過同行評審,發表在了IEEE旗下ICASSP(聲學語音和信號處理國際會議)上。

之后,阿里語音AI進一步發展,不斷涌現出新的研究成果,被ICASSP、DSP等語音領域國際頂尖會議收錄。

2019年2月28日,MIT將阿里巴巴語音AI技術評為2019年“全球十大突破性技術”。

MIT認為,阿里巴巴已擁有比谷歌更好的AI語音技術,可以完成復雜的人類對話功能,甚至可讀懂人類的潛在意圖。

阿里巴巴也是唯一上榜的中國科技公司,其他的突破技術分別是“腸道顯微膠囊”、“定制癌癥疫苗”、“人造肉漢堡”、“可穿戴心電儀”、“無下水道衛生間”等等。

突破仍在繼續。2019年7月,阿里發布新一代語音合成技術KAN-TTS,首次將該數字提高到97%以上。

阿里達摩院介紹,KAN-TTS已經實現主流場景風格聲音的全覆蓋,可針對通用場景、客服場景、童聲場景、英文場景和方言場景,提供41種高品質的聲音,例如溫柔、甜蜜、嚴厲等風格。

而且還具備多方言、重口音語音識別,全雙工語音交互,智能語音流式響應等技術能力。

鄢志杰說,它已經能夠實現擬人程度更高的交互效果,整個過程幾乎聽不出是AI在跟人交互。

想要推動技術落地,技術強是根本,但找到商業價值和模式更加重要。

在鄢志杰看來,這是阿里語音AI技術發展到現在最難的一個點,也是其能夠得到市場認可的關鍵。

自學習,阿里語音AI的落地秘訣

2017年初,阿里開始推動AI技術上云對外輸出,語音AI作為阿里內部廣泛應用且成熟的技術,成為“先鋒”。

語音AI上云后,阿里對外輸出的第一個項目,是為浙江高院提供庭審速記能力。

拿下行業頭部用戶,是推動AI技術落地時最常用的一種手段。

其不僅能夠產生“標桿效應”,吸引更多的人采用技術,而且還能在這個過程中,快速汲取行業Know—How,來完善技術方案,更好地復制到其他相似場景中。

目前,阿里智能庭審語音識別覆蓋超過全國20個省的8000間線下法院,覆蓋率近50%?;ヂ摼W庭審覆蓋15000余間線上法庭,覆蓋率超過90%。

IDC報告也給出了分析稱,通過前期的行業布局,阿里云在法院、呼叫中心、電信運營商領域的客戶認知度也處于第一位,領先其它云服務廠商。

不過,這樣的AI落地模式也存在弊端——依賴項目推進,不僅需要大量的人力資源,效率并不高。

如何找到一種更高效的落地方式,是整個行業都面臨的挑戰。

同樣是在2017年,阿里語音AI團隊在與客戶共創的時候受到啟發,基于“定制AI”打造出了語音自學習平臺,面向沒有技術研發實力的客戶提供語音原子能力、行業模型等服務。

鄢志杰將其形容為“傻瓜相機”式的產品。

阿里提供針對聲學模型和語言學模型的定制訓練流程,用戶在安全環境中灌注行業數據,可以在完全不了解語音語言算法的情況下,快速、便捷地定制自己的語音模型。

在落地過程中,也展現出了效力。比如疫情期間,湖北的智能疫情機器人使用阿里語音AI自學習平臺,湖北口音語音識別率從62.5%提升至94.4%。

IDC在報告中總結稱,語音語義領域,用戶重視的是服務,能不能滿足客戶的個性化需求十分重要。

阿里語音AI能夠實現大面積落地,在法院、呼叫中心、電信運營商領域的客戶認知度處于第一位,擁有教育、金融、互聯網、交通、餐飲、通信、醫療等各行各業5萬家客戶,秘訣正在于此。

現在,鄢志杰正在致力于將語音AI技術拓展到更多的場景中,供給無處不在的智能語音。

在他看來,整個語音AI的價值才剛剛開始呈現,市場還處于早期發展階段,未來將會有更大的發揮空間和價值。

比如,如果在強噪音、多人交互的情況下,實現更高準確率的識別,比如語音和NLP技術的結合,實現語音翻譯、語音摘要技術等等。

而且隨著新基建機遇到來,語音AI與云結合,還會有更大的前景。

被集成,阿里的“基建式”打法

2020年4月20日,阿里云宣布未來3年規劃:再投2000億,用于云操作系統、服務器、芯片、網絡等重大核心技術研發攻堅和面向未來的數據中心建設。

阿里到底如何做?具體做什么?想要達到什么樣的效果?阿里語音AI無疑給出了直觀體現。

一方面基于阿里達摩院,從未來商業價值出發,提升技術層面上的能力,進行前瞻性研發布局。

另一方面在于阿里云平臺的能力建設,供應更強的算力,為技術對外輸出提供堅實支撐。

再往底層芯片上面,平頭哥也在積極布局,前不久已經實現含光800商用,通過阿里云對外輸出。

一系列動作背后,也不難發現阿里的目標所向——打造基礎設施,供應給有需求的客戶,甘愿被集成,幫助他們來打造成落地的應用,服務更多人。

鄢志杰說,阿里內部有一個口號是“達摩院技術零時差上云”。阿里語音AI技術,就是其交出的答卷之一。

1999年,阿里巴巴在杭州成立之時,定下了公司的使命:讓天下沒有難做的生意。

這也成為了阿里孵化出淘寶、支付寶、天貓、菜鳥等等一系列產品的出發點,打造出了輻射數億人的阿里經濟體。

現在,經濟發展的驅動力逐步發生改變,AI、大數據為核心的新興技術,在“生意”中變得越來越關鍵。

阿里巴巴,同樣正在用自己的行動踐行使命:讓天下沒有難得到的技術。

 

免責聲明:【我們尊重原創。文字圖片素材,版權屬于原作者。部分文章推送時因種種原因未能與原作者聯系上,若涉及版權問題,敬請原作者聯系我們刪除處理,我們只做分享之用,不用于商業?!?/span>

 


遼寧企淘網絡有限公司

 

地址:總部:遼寧省沈陽市華強廣場

           分部:吉林省松原市法雅廣場; 

           分部:長春市寬城區萬達廣場

郵箱:shejibu@zsmmail.com

電話:024-31814044

24小時熱線:400-038-9658

咨詢電話:13161134333  

 Copyright @ 2020         遼寧企淘網絡有限公司服務商版權所有     備案號: 遼ICP備17017131號-5 百度地圖

添加微信好友,詳細了解產品
使用企業微信
“掃一掃”加入群聊
復制成功
添加微信好友,詳細了解產品
我知道了
视频二区精品中文字幕