匯流新聞網記者黃有容 / 綜合報導
英國著名科幻電視劇《黑鏡》(Black Mirror)第2季裡,有一集故事的女主角因為太想念車禍過世的老公,於是經推薦使用了一個軟體,只要給這個軟體一個人的社群帳號數據,就可以模仿對方的語氣發訊息;只要給這個軟體模仿對象的幾則影音,就可以模仿這個對象說話。綜合所有數據,就可以像和本人對話一樣。現在這個科技,可能已經不是電視劇裡的想像,而是現實──百度推出的Deep Voice 2,只要30分鐘就能學習一種人聲說話。
百度位於矽谷的研究室,在今年2月發表了Deep Voice這個以深度神經網路為基礎,用以學習人類語音的系統。Deep Voice可以從大量數據中學習,並快速合成聲音,可用於對話類型的運用。而在5月底,Deep Voice就升級了。
新推出的Deep Voice 2,和需要龐大數據、好幾個小時學習的前代不同,只需要一個人30分鐘的語音資料,就可以學會並合成高音質的聲音。並且同一套Deep Voice 2系統,可以學習數百種不同的聲音,也能產出數百小時的語音,比起前身Deep Voice進化數十、甚至百倍。Deep Voice 2的訣竅在於,找出所有人講話的共同特徵,當它要學會新的聲音,只要以這些特徵為主去學習就可以了。
科技媒體《The Verge》對Deep Voice 2讚譽有佳,更表示相較於需要數千小時才能學習一種人聲的Siri,Deep Voice 2用更聰明的方式、不需要人工調整就能學會,是很驚人的發展。
像Deep Voice 2這樣的仿人聲技術,除了智慧裝置中的語音助手之外,將可以運用客服、電訪、電子書,甚至廣播上。這些智慧人聲都會有獨特的聲音和語氣,生動且親切,人機之間的互動可以更融洽。
【文章轉載請註明出處】
【匯流筆陣】
CNEWS歡迎各界投書,來稿請寄至[email protected],並請附上真實姓名、聯絡方式與職業身份簡介。
CNEWS匯流新聞網:https://cnews.com.tw
新聞照來源:翻攝自網路