日本一道免费补卡的d

牛客網>熱搜>正文

達摩院公布語音AI四大進展,實現理論、技術、應用全鏈路突破

2019-10-16 10:14:56 分享

  9月26日,達摩院在杭州云棲大會公布2019年阿里語音AI四大進展,在語音AI的理論、技術、應用等整個鏈路均有突破。y70中文科技資訊

  當日,阿里巴巴在杭州云棲大會上首次公布人工智能調用規模:每天調用超1萬億次,服務全球10億人,日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句,已經成為中國最大的人工智能公司。y70中文科技資訊

  達摩院語音實驗室負責人鄢志杰介紹,今年以來實現了四大技術進展:聲學信號處理理論、語音合成技術、語音自學習平臺及通用語音交互方案。y70中文科技資訊

  語音AI團隊提出了聲學信號處理的理論創新——指向性差分麥克風陣列,用“應用指向性麥克風陣列”替代傳統的全向型麥克風,使得阿里AI能夠實現超大型空間內的遠距離清晰收音。y70中文科技資訊

  不久前,達摩院發布了自研的新一代KAN-TTS語音合成技術,把語音合成與真人錄音的相似度提升到95%以上,并將聲音定制成本降低10倍以上、周期壓縮3倍以上。y70中文科技資訊

  阿里云語音自學習平臺升級到了2.0版本,全面開放自學習優化手段,人人都能自主定制語音模型,目前平臺已經服務超過2.6萬個場景。同時,達摩院推出了通用語音交互方案,提供端云接入、全方位服務、可定制的一站式解決方案。y70中文科技資訊

  “達摩院的AI就是大家的AI,達摩院要把語音技術能力做得高一點,但把技術到產業落地的門檻做得低一點。”鄢志杰表示,達摩院最先進的AI技術全都“零時差上云”,通過阿里云對外輸出服務。y70中文科技資訊

  他打開阿里云官網,現場演示了“開箱即用”的語音合成服務:假設要定制一套給小朋友說故事的聲音,先在頁面上選擇合適的聲音,然后輸入任意文本,比如“歡迎大家來到云棲大會,我長大了也要到達摩院當一個掃地僧”,馬上,語音AI就用奶聲奶氣的合成童聲念出了這句話。y70中文科技資訊

聲明:本站部分資源來源于網絡,版權歸原作者或者來源機構所有,如作者或來源機構不同意本站轉載采用,請通知我們,我們將第一時間刪除內容。本站刊載文章出于傳遞更多信息之目的,所刊文章觀點僅代表作者本人觀點,并不意味著本站贊同作者觀點或證實其描述,其原創性及對文章內容的真實性、完整性、及時性本站亦不作任何保證或承諾,請讀者僅作參考。
編輯:可欣