匯流新聞網記者 / 藍立晴綜合報導
若是能請人工智慧(AI)為我們處理任何事,那就太好了?百度宣布推出一款能將音訊檔案轉化為文字的網路應用程式,可仰賴AI來改變現在人工逐字稿的現狀,比人類快上1.67倍,且「準確率高達97%」。
《騰訊科技》報導,百度首席科學家吳恩達指出,這款網頁應用程式SwiftScribe將改變採訪和影片字幕生成,非常適合將長語音轉化為文本的人士,AI將實現1+1大於2的效果。
只要在SwiftScribe選取wav或mp3的檔案,上傳至此網站,就能馬上處理,長約1分鐘的文件可在30秒內完成,而目前可處理1小時內的檔案。在這之後,用戶只需人工調整大小寫、添加標點符號以及一些細節,就能完成將音訊轉化為文字的工作。報導指出,利用此系統,可以縮短40%的工作時間。
說到字幕生成,當然不能忘了YouTube。2006年開始,YouTube開始為部分地區的影片開放「字幕功能」;2009年,YouTube開始為字幕系統導入自動語音辨別技術(Automatic Speech Recognition,ASR),隨著機器學習演算法不斷進步,英文的自動字幕準確性大幅提升。
今年2月,YouTube宣布已經透過AI自動為十億支線上影片上字幕,且每天的觀看字數多達1500萬次,在串流史上開創了一個新的里程碑,現在的字幕錯誤率已經和人類聽寫的錯誤率差不多了。
消息來源:
騰訊科技
*SwiftScribe小百科
SwiftScribe背後是百度深度語音辨識系統Deep Speech 2。
Deep Speech 2曾被《麻省理工科技評論》(MIT Technology Review)評為2016年十大突破技術之一,透過長達數千小時的訓練,Deep Speech 2可不斷學習從語音中辨識特定的字或詞。
【匯流筆陣】
CNEWS歡迎各界投書,來稿請寄至[email protected],並請附上真實姓名、聯絡方式與職業身份簡介。
CNEWS匯流新聞網:https://cnews.com.tw
新聞照來源:翻拍自網路