Google DeepMind人工智慧已可讀懂唇語 - 匯流新聞網

LIFE

Google DeepMind人工智慧已可讀懂唇語
  • 字級
Google DeepMind人工智慧已可讀懂唇語

匯流新聞網記者/藍立晴綜合報導

Google的人工智慧團隊DeepMind自從戰勝頂尖圍棋棋手又讓AI做出驚人創舉,讓其AI系統觀摩學習5000小時的BBC節目,結果在與人類唇語專家的決戰中徹底打趴人類。

匯流新聞網:〈Google DeepMind團隊能讓AI從「記憶」中學習〉

DeepMind與英國牛津大學(University of Oxford)合作開發出這個能讀懂唇語的AI系統,且同樣是運用了機器學習(machine learning)技術。先前匯流新聞網曾報導,該團隊於上月才成功開發讓AI從記憶中「學習」的系統differentiable neural computers(DNC),與Alpha GO不同,不再依賴人類輸入的大量資訊就能學習。

而這套與牛津大學合作開發、能夠讀懂唇語的AI系統則是在觀摩了近5000小時的BBC節目,擷取學習了約11.8萬句話語,接著研究團隊再從3~9月「新播出的節目」中選取隨機的說話場景,並讓此套AI系統與人類唇語專家一決勝負,結果AI的準確率為46.8%;人類唇語專家準確率僅有12.4%,AI又再一次的於新的領域上完勝人類。

〈MIT TECHNOLOGY REVIEW〉指出,AI於唇語方面超越了人類,未來要如何應用也不難想像,這表示將來人們在使用Skype時若因為身旁環境太過嘈雜而覺得聽不太清楚、或者在聽覺上有些困難的人們,他們就只需要看著手機便能夠「聽見」朋友們在說些什麼。

牛津大學與DeepMind團隊日前才開發出一種唇語程式LipNet,其準確率更是高達93.4%(此測驗較為簡單);人類唇語專家則是79.6%;聽覺受損可讀唇語者則是52.3%,未來可望幫助許多聽障人士。

(LipNet的相關影片)

教導AI讀懂唇語未來將可以適用於無數情形,最重要的是能夠幫助到聽覺受損者,消彌人與人之間的溝通障礙。

消息來源:
[ QUARTZ ]:Oxford University’s lip-reading AI is more accurate than humans, but still has a way to go
[ MIT TECHNOLOGY REVIEW ]:AI Has Beaten Humans at Lip-reading

延伸閱讀:
匯流新聞網:〈「人工智慧法官」神預測與法院八成判決一致〉

【匯流筆陣】
CNEWS歡迎各界投書,來稿請寄至[email protected],並請附上真實姓名、聯絡方式與職業身份簡介。CNEWS匯流新聞網:https://cnews.com.tw

新聞照來源:翻拍自網路


R18