MIT 研製出極低耗能語音辨識晶片,可節省達 99% 電力需求

Voice Assistant 的發展可說是一日千里,當初 Siri 的出現掀起的語音助手熱潮直捲智能裝置市場,Google Assistant、S Voice、Cortana 等新興 Voice Assistant 相繼壯大,今天我們在手機、平板、電腦都能看到語音助手的蹤影。Amazon Echo、Google Home 更成為語音助手的載體,將 Voice Assistant 帶進家居,為 Smart Home 概念的發展注入新動力。

圖片取自 Google

雖然 Voice Assistant 能為用家帶來便利,但由於它的運作 (例如:常駐待命、語音資訊收發) 需要大量電力支持,以一般手機為例,光是運行語音辨識軟件已經要耗費 1 Watt,故此現時不少 Voice Assistant 都主要在較高端的裝置上運行。不過,Voice Assistant 未來可能有機會在低端裝置上出現,因為麻省理工學院 (即 MIT) 已經成功研製出極低耗能的自動語音辨識芯片,聲稱可節省 90% 至 99% 電力,有望協助 Voice Assistant 進駐低端物聯網。

圖片取自 Live with Google

一般的常駐 Voice Assistant 會一直分析並對比外界的聲音,當它偵測到用家的指令時便會馬上作出回應。然而這樣的工作模式會耗用大量不必要的能源,有見及此,MIT 的芯片內置了一個簡單的語音活動偵測 (Voice activity detection) 系統,當它確認所接收的音訊是人類語音指令時,才會開始耗能較高的語音辨識程序,這樣就能減少一直進行語音比對的能源浪費。

圖片取自 Intellectual Interchange

由於 Voice Assistant 背後的資料庫十分龐大,一般都不會直接存放在裝置的記憶體裡,而是透過互聯網將語音指令傳送至伺服器進行分析,並回傳結果到裝置上。不過,互聯網存取同樣是非常耗能的工作,所以 MIT 就選擇把單個語音神經網絡 (neural network) 的節點 (Node) 壓縮後傳送至芯片,然後芯片會把節點解壓縮,再將語音指令分割成 32 段 10 毫秒的數據並放入節點中,最後芯片會將該節點的輸出結果集合起來才傳送到下一層的節點繼續分析,以節省外部資料存取的體積,減省能源消耗。

如果此芯片在未來得以投入生產,將會大大降低語音辨識的硬件門檻,相信可以將不少微型裝置、可攜式電子產品及低端裝置帶進 Voice Assistant 的領域。

Leave a Comment