語音辨識應用多 公開資料庫是關鍵

呂翔禾 2019/06/25 13:22 點閱 32050 次
杜奕瑾表示,語音辨識在台灣未來發展AI下,可以應用到不同產業。(Photo by 呂翔禾/台灣醒報)
杜奕瑾表示,語音辨識在台灣未來發展AI下,可以應用到不同產業。(Photo by 呂翔禾/台灣醒報)

【台灣醒報記者呂翔禾台北報導】「不同產業都可以應用資料庫,讓更多人受惠!」科技部25日與學界、內政部、教育部合作的「AI語音數據資料集」共同發表。科技部政務次長許有進,希望透過資料庫開放,讓各行各業應用,加速台灣中文語音對話技術的開發。PTT創辦人杜奕瑾也提到,光是逐字稿軟體就商機無限,未來語音辨識的應用與發展值得期待。

語音辨識商機無限

杜奕瑾說,語音辨識雖然離「理解」人類說什麼還有一段距離,可光是在純粹的辨識上就可以有許多應用。他舉例,現在語音辨識應用最廣泛的就是逐字稿APP,甚至未來可能還會有AI記者出現,可以透過神經網絡運算、機器學習等方式,幫助未來使用者挑選新聞。

他還提到,語音辨識除了聽懂人類發出聲音之外,對於音樂創作也具有極大的潛力,不過前提就是需要有資料庫的建置,現在科技部建構的語音資料庫,對於台灣日後語音在AI上的應用都有很大的幫助。

資料庫可廣泛利用

許有進提到,由於資料庫中的語句已經過標記與辨識,就可以大幅縮短語音發展所需的人力與時間,降低相關技術的發展門檻。他希望可以吸引更多不同產業、學界投入,讓台灣在未來的數位轉型更加順利。

現場也有一些學生將他們應用語音辨識的研究展出。有同學利用語音辨識的建檔與歸納,讓電腦可以產生唐詩與對聯的上下聯;還有同學透過語音與文字辨識,將許多關於咖啡評鑑的紀錄放到雲端彙整後,再與現今資料做對比,試圖建構各種咖啡的評鑑資料庫。