語音辨識應用多公開資料庫是關鍵

杜奕瑾表示，語音辨識在台灣未來發展AI下，可以應用到不同產業。（Photo by 呂翔禾／台灣醒報）

【台灣醒報記者呂翔禾台北報導】「不同產業都可以應用資料庫，讓更多人受惠！」科技部25日與學界、內政部、教育部合作的「AI語音數據資料集」共同發表。科技部政務次長許有進，希望透過資料庫開放，讓各行各業應用，加速台灣中文語音對話技術的開發。PTT創辦人杜奕瑾也提到，光是逐字稿軟體就商機無限，未來語音辨識的應用與發展值得期待。

語音辨識商機無限

杜奕瑾說，語音辨識雖然離「理解」人類說什麼還有一段距離，可光是在純粹的辨識上就可以有許多應用。他舉例，現在語音辨識應用最廣泛的就是逐字稿APP，甚至未來可能還會有AI記者出現，可以透過神經網絡運算、機器學習等方式，幫助未來使用者挑選新聞。

他還提到，語音辨識除了聽懂人類發出聲音之外，對於音樂創作也具有極大的潛力，不過前提就是需要有資料庫的建置，現在科技部建構的語音資料庫，對於台灣日後語音在AI上的應用都有很大的幫助。

資料庫可廣泛利用

許有進提到，由於資料庫中的語句已經過標記與辨識，就可以大幅縮短語音發展所需的人力與時間，降低相關技術的發展門檻。他希望可以吸引更多不同產業、學界投入，讓台灣在未來的數位轉型更加順利。

現場也有一些學生將他們應用語音辨識的研究展出。有同學利用語音辨識的建檔與歸納，讓電腦可以產生唐詩與對聯的上下聯；還有同學透過語音與文字辨識，將許多關於咖啡評鑑的紀錄放到雲端彙整後，再與現今資料做對比，試圖建構各種咖啡的評鑑資料庫。

台灣醒報

語音辨識商機無限

資料庫可廣泛利用

最新熱門

熱門新聞

熱門副刊文章