Google DeepMind人工智慧已可讀懂唇語

匯流新聞網記者/藍立晴綜合報導

Google的人工智慧團隊DeepMind自從戰勝頂尖圍棋棋手又讓AI做出驚人創舉，讓其AI系統觀摩學習5000小時的BBC節目，結果在與人類唇語專家的決戰中徹底打趴人類。

匯流新聞網：〈Google DeepMind團隊能讓AI從「記憶」中學習〉

DeepMind與英國牛津大學（University of Oxford）合作開發出這個能讀懂唇語的AI系統，且同樣是運用了機器學習（machine learning）技術。先前匯流新聞網曾報導，該團隊於上月才成功開發讓AI從記憶中「學習」的系統differentiable neural computers（DNC），與Alpha GO不同，不再依賴人類輸入的大量資訊就能學習。

而這套與牛津大學合作開發、能夠讀懂唇語的AI系統則是在觀摩了近5000小時的BBC節目，擷取學習了約11.8萬句話語，接著研究團隊再從3～9月「新播出的節目」中選取隨機的說話場景，並讓此套AI系統與人類唇語專家一決勝負，結果AI的準確率為46.8％；人類唇語專家準確率僅有12.4％，AI又再一次的於新的領域上完勝人類。

〈MIT TECHNOLOGY REVIEW〉指出，AI於唇語方面超越了人類，未來要如何應用也不難想像，這表示將來人們在使用Skype時若因為身旁環境太過嘈雜而覺得聽不太清楚、或者在聽覺上有些困難的人們，他們就只需要看著手機便能夠「聽見」朋友們在說些什麼。

牛津大學與DeepMind團隊日前才開發出一種唇語程式LipNet，其準確率更是高達93.4％（此測驗較為簡單）；人類唇語專家則是79.6％；聽覺受損可讀唇語者則是52.3％，未來可望幫助許多聽障人士。

（LipNet的相關影片）

教導AI讀懂唇語未來將可以適用於無數情形，最重要的是能夠幫助到聽覺受損者，消彌人與人之間的溝通障礙。

消息來源：
[ QUARTZ ]：Oxford University’s lip-reading AI is more accurate than humans, but still has a way to go
[ MIT TECHNOLOGY REVIEW ]：AI Has Beaten Humans at Lip-reading

延伸閱讀：
匯流新聞網：〈「人工智慧法官」神預測與法院八成判決一致〉

【匯流筆陣】
CNEWS歡迎各界投書，來稿請寄至[email protected]，並請附上真實姓名、聯絡方式與職業身份簡介。CNEWS匯流新聞網：https://cnews.com.tw

新聞照來源:翻拍自網路

Google DeepMind人工智慧已可讀懂唇語

匯流新聞網

LIFE

PS 4 Pro日本快速跳水開賣一週後銷量跌6成

濫用個資集體訴訟和解臉書賠每名用戶15美元

延伸閱讀

AI大模型導入智慧駕駛與座艙應用　帶動感測器、記憶體需求成長

AI翻轉手機產業　MIC：AI手機預期2027年滲透全球達42%

AI新時代　MIC揭生成式AI邊緣運算的應用發展趨勢

會員登入

LIFE

PS 4 Pro日本快速跳水 開賣一週後銷量跌6成

濫用個資集體訴訟和解 臉書賠每名用戶15美元

延伸閱讀

AI大模型導入智慧駕駛與座艙應用 帶動感測器、記憶體需求成長

AI翻轉手機產業 MIC：AI手機預期2027年滲透全球達42%

AI新時代 MIC揭生成式AI邊緣運算的應用發展趨勢

PS 4 Pro日本快速跳水開賣一週後銷量跌6成

濫用個資集體訴訟和解臉書賠每名用戶15美元

AI大模型導入智慧駕駛與座艙應用　帶動感測器、記憶體需求成長

AI翻轉手機產業　MIC：AI手機預期2027年滲透全球達42%

AI新時代　MIC揭生成式AI邊緣運算的應用發展趨勢