國家科技委員會(國科會)今日在行政院會議上報告了「生成式AI對話引擎TAIDE成果」。國科會副主委林法正在記者會上表示,因科技發展快速,各國在制定AI基本法相關法規方面都採取觀望態度。國科會希望讓台灣在AI發展和應用有所遵循,原定年底前提交行政院,可能會提早到10月提出。而我國重要AI基礎設施「TAIDE」細節曝光,以繁體中文為本,在基礎文本作業能力上已與ChatGPT 3.5相當。
「生成式AI對話引擎TAIDE」是台灣重要的AI基礎設施,第一階段以Meta開源模型Llama 2為基礎,透過整理繁體中文和在地文本訓練資料來開發預訓練模型,已於4月15日正式開源釋出可商用版TAIDE LX-7B模型;學研版TAIDE LX-13B模型則可透過申請授權簽署合作備忘錄(MOU)取得。這兩種模型在寫作、寫信、摘要、英翻中、中翻英等5大任務上表現出色,已可與ChatGPT 3.5相當,並具備多輪對話及防止產生不適當回應的能力。
國科會指出,TAIDE以台灣文化為基礎,融入台灣特有元素打造專屬大型語言模型。國科會希望持續精進TAIDE,積極開發相關加值應用,加速導入業界,以提高民間企業的生產力;同時也希望導入政府部門及各公共服務領域,提供更多便民服務,增進行政效率。
國際大型語言模型的訓練資料以英文為主,中文部分則以簡體中文為主,因此常會產生與台灣文化、價值觀不符的回應內容。為保護在地文化、確保台灣的「數位主權」,國科會自112年4月起推動發展具有台灣特色的繁體中文TAIDE模型,以促進生成式AI應用的普及化、帶動相關產業發展,並提升台灣的國際競爭力。
另一方面,因應Meta最新推出的新一代大型語言模型Llama 3,TAIDE開發團隊於4月29日發布了「升級版」Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,以快速回應外界期待。TAIDE團隊也與產學研夥伴合作,將TAIDE模型應用於7個領域,包括農業知識檢索系統「神農TAIDE」和中小學生台語教學等。
國科會強調,將持續關注國際生成式人工智慧的發展,及時導入新技術,使TAIDE模型與時俱進,成為台灣具指標性的基礎模型。同時將協助推動TAIDE模型導入公私領域的創新應用,使台灣在生成式人工智慧領域保持競爭力。