為協助視障者「看見」社群平台上用戶分享的圖片,臉書在2016年引進AI圖片辨識技術「AAT」,能夠自動偵測照片內容並語音敘述其中的場景。如今這項技術已經歷多次測試和升級,以辨識出更多的相片內容,帶來更具體畫面描述。
臉書發表的聲明指出,為了讓AAT技術大幅提升,臉書運用數十億張Instagram上的相片以及標籤訓練測試模組。如今最進階的AAT技術和以往相比,可辨認出10倍多的內容,多達1200種意象。同時,相片描述內容也更加具體,可準確指出影像中的風景、活動、動物品種等等。
此外,新版的AAT技術還能夠辨識出物品的相對位置以及相對大小,堪稱業界第一。過去的AI技術可能只是簡單的描述「相片中有一座山和一間房子」,新的技術則能夠偵測山和房子的大小差異和前後位置,進而表達出哪一個物件才是相片的主角。
臉書表示,這項新功能允許視障人士更明確得到到社群平台上的所有資訊,促進所有用戶公平享用這個開放的平台。新版AAT技術預計會先在臉書進行測試,並且在不久後於Instagram推出,目前的相片敘述一共能翻譯成45種語言。
臉書最新的AI圖片描述功能,可更明確表達相片中的物品種類、數量、相對位置等。 圖:翻攝自Facebook