康乃爾大學研究生開發一副全新聲納眼鏡(Sonar Glasses),可以透過裝置的麥克風及喇叭,辨識和讀取使用者「無聲」念出某個字或指令的嘴形,就能解鎖手機、播放音樂,甚至操控CAD繪圖軟體。
由康乃爾大學博士生 Ruidong Zhang研發的全新聲納眼鏡,雖然是基於大學研究團隊之前專案所打造的,但使用者不再需面對鏡頭,也不需在耳朵裡塞東西。只需要利用幾分鐘讀取訓練資料(如一串數字),就可以讓系統學習並建立使用者語音模型。系統會發送和接收音波到使用者臉部,感測嘴形動作,同時透過深度演算法即時分析回聲曲線屬性,且整體準確率可達約 95%。
所有資料會傳送到使用者智慧手機處理,而不會傳到雲端,可以打消洩漏隱私的疑慮,同時確保眼鏡整體體積更精巧。最新版聲納眼鏡功耗極低,可為音學感測提供約 10 小時電池續航力。
實際應用時,使用者不需動手、只需動動嘴就可以操控,包括圖書館等安靜的環境,一樣可以下達「無聲指令」給眼鏡以播放、暫停等來控制音樂。又或是在嘈雜環境無聲錄製語音備忘錄。使用者還能無聲唸出密碼解鎖手機,甚至不用鍵盤就能用CAD繪圖軟體盡情作業。對有語音障礙的人,可以無聲透過眼鏡,將對話輸入語音合成器,再由合成器大聲說話,與任何人溝通。