河南夢之網網絡科技有限公司
夢之網科技出品
掃描關注夢之網科技微信公眾賬號

掃小程序碼聯系客服

【人機對話】阿里云人工智能ET化身CEO,對話蜻蜓

夢之網科技?2016-12-13?行業動態?

本站部分內容系互聯網轉載,本站不擁有所有權,不承擔相關法律責任。企業宣傳商業資訊,僅供用戶參考,如用戶將之作為消費行為參考,敬告用戶需審慎決定。站長微信(廣告合作/文章刪除):18239951881

59c6ce9fb832e245d648cee39ecdc5b2276130e0

 

猛戳鏈接,直擊現場:未來科技局 | 獨家連線阿里巴巴未來CEO

 

11月29日,阿里云人工智能ET化身阿里巴巴CEO,參加蜻蜓FM貓眼未來科技局欄目,對話貓局長。人機對話,妙趣橫生。

3e1f25b2dac6c6c9da791895b908a8ee962e8b17

此外,12月1日,貓眼科技連線阿里云AI專家,關于阿里云人工智能ET背后的語音識別技術進行了一次深度訪談。

貓:先請我們的科學家自我介紹一下吧?

陳:大家好我是阿里云負責ET智能語音對外服務的陳一寧。

7088e3ea8974fe9bbb875010b802c899886d8cc5

貓:你好陳工。我們看到et能言善辯還可以模仿馬云的聲音。這個是怎么實現的呢?

陳:模仿馬云的聲音這個是我們的語音合成技術。我們的語音合成技術原理是說它會根據一些已有的錄音庫生成一個與人的聲音類似的模擬聲音。那這個馬云的聲音實際上是因為我們收集了一些馬老師在大會上的講話之類或者是一些演講的材料根據這個我們做了一個音庫。根據這個模型生成的一個對應的馬老師的語音合成的聲音。

貓:語音識別在ET的各項能力中處于一個什么樣的地位我看它有很多種能力啊?

陳:我認為語音識別首先是一個我們叫做聽覺或者聽覺中樞的一個作用它實際上是在ET的這種人機交互的過程中是一個必不可少的很重要的作用。也是相對來說一個比較成熟和比較接近產品化的一種能力。它很多時候在我們需要跟ET交互或者ET需要理性的處理一些非結構化數據的時候,語音時識別都可以幫助我們能夠進入到這些數據中,能夠讓我們的交互可以開始發聲。人機交互嘛!所以需要人說一些事情讓機器去理解它。語音識別是這些理解的第一步,先把它變成文字然后才能開始做進一步的理解和進一步的交互。

貓:從現在全球的情況來看語音識別的應用情況是怎么樣的從專家的角度如何看這個事情?

陳:全球來看的話語音識別應用還是比較火熱的吧現在有很多種應用領域,我們一個一個來說吧比如說從這個人機交互的角度來說其實現在有很多這種助手類的產品比如蘋果的siri,比如微軟的小娜比如亞馬遜的echo等等這樣的產品。實際上都是在做這種比如手機特別是IOT設備上的語音交互產品。他們都需要語音識別的技術。那么再往下一點比如在做車載系統,如果你想跟車載做一些交互基本上智能汽車對于語音識別技術都是不可或缺的部分。同時如果對于商用的系統對于這種全球的客服比如我們民航的這種退票和改簽服務應用,還有比如說在醫療領域一些醫生處方或者醫療記錄中發揮作用。

貓:現在語音技術還有沒有面臨挑戰的地方阿里云是如何應對這種挑戰的

陳:語音識別這個方向上我們覺得現在遇到的挑戰有幾種吧一個是比如說想噪聲的這種挑戰那么現在碰到的情況就是在干凈的情況下或者說噪聲很小的情況下語音識別的效果還是不錯的但是在這個噪聲比較大的時候這個識別率就會相對有所下降。還包括說話有一定口音的情況下。標準普通話標準語音會好一些但是有口音的情況下識別率也會有下降然后還包括說話的年齡過小或者過老也會有一些影響會打一些折扣。那么阿里云我們認為在這里面最主要的都是數據的問題。包括我們剛才講到說抗噪聲的理由識別率低實際上都是因為我們沒有足夠的噪聲語音在里面。那么我們阿里云會采用一些技術通過人工的方式記錄或者采集的方式獲得大量的這種含噪聲的,含口音的等等的這些語料,通過我們大規模的大數據方式做一些計算把這些海量的數據結合在一起就能夠做出很多在各種情況下應用會比較好的語音識別的效果。還有提到比如中英文混雜的效果這是一個很頭疼的問題那么我們也會通過各種識別材料增加的方式來達到最終的滿意度。

貓:給我們能不能講幾個科學家工程師們的小故事讓大家都了解一下他們的付出。了解工程師們是如何努力的?

陳:試試看啊我講一個前線落地的故事不是一個后臺的故事落地的時候我們會碰到一個很正常的問題有時候我們在做語音識別相關的工作的時候有一個事情很重要就是錄音質量要好。錄音如果本身就有巨大的噪聲或者是你根本就沒錄下來那么肯定這個效果就會不好吧那這個就會有問題我舉個例子比如說之前我們在這個湖南衛視我是歌手》這個節目里頭去預測這個歌王。我們現場要得到歌手演唱的這些數據那么這樣的一些東西我們都需要把聲音錄下來都錄下來以后發現我們跟電視臺的設備做的一些連接我們的設備和電臺的設備是不兼容的。插上來基本上就是燒設備。然后當時很緊急的要拔掉開始直播了就發現這個設備有問題。然后后來緊急的想了各種辦法來解決。從湖南衛視借了他們的一些設備出來才把這個事兒最后解決的這種情況還有很多比如說在雙11晚會的過程中。也會遇到這種設備插在一起還會遇到這種電流電源上的干擾這種聲音錄起來是完全沒法聽這樣的情況都有很多這種需要現場的工程師去解決,他們有時候都是沒日沒夜加班連軸轉,把公司當做自己的家,非常的辛苦。

文章關鍵詞
語音
人工智能
阿里巴巴
阿里云
蜻蜓FM
語音識別
急速赛车国语 昆明按摩一条龙服务 体彩排列5开奖号码 比亚迪股票 竞彩足球比分直播现场足彩 山西体彩十一选五20011542期 足球比分计算器 *排列三开奖号码 足球直播黑白直播 雪缘园篮球比分直播网 沈阳一条龙会所 p62历史开奖号码黑龙江省 巧克力球番号 球探比分网球探比分网下载 山东的十一选五一定 太龙药业股票 特黄一级大真人片