繁體中文為本、台版AI「TAIDE」追上國際水準！功能不輸ChatGPT 3.5 | 科技

國家科技委員會(國科會)今日在行政院會議上報告了「生成式AI對話引擎TAIDE成果」。國科會副主委林法正在記者會上表示，因科技發展快速，各國在制定AI基本法相關法規方面都採取觀望態度。國科會希望讓台灣在AI發展和應用有所遵循，原定年底前提交行政院，可能會提早到10月提出。而我國重要AI基礎設施「TAIDE」細節曝光，以繁體中文為本，在基礎文本作業能力上已與ChatGPT 3.5相當。

「生成式AI對話引擎TAIDE」是台灣重要的AI基礎設施，第一階段以Meta開源模型Llama 2為基礎，透過整理繁體中文和在地文本訓練資料來開發預訓練模型，已於4月15日正式開源釋出可商用版TAIDE LX-7B模型；學研版TAIDE LX-13B模型則可透過申請授權簽署合作備忘錄(MOU)取得。這兩種模型在寫作、寫信、摘要、英翻中、中翻英等5大任務上表現出色，已可與ChatGPT 3.5相當，並具備多輪對話及防止產生不適當回應的能力。

國科會指出，TAIDE以台灣文化為基礎，融入台灣特有元素打造專屬大型語言模型。國科會希望持續精進TAIDE，積極開發相關加值應用，加速導入業界，以提高民間企業的生產力；同時也希望導入政府部門及各公共服務領域，提供更多便民服務，增進行政效率。

國際大型語言模型的訓練資料以英文為主，中文部分則以簡體中文為主，因此常會產生與台灣文化、價值觀不符的回應內容。為保護在地文化、確保台灣的「數位主權」，國科會自112年4月起推動發展具有台灣特色的繁體中文TAIDE模型，以促進生成式AI應用的普及化、帶動相關產業發展，並提升台灣的國際競爭力。

另一方面，因應Meta最新推出的新一代大型語言模型Llama 3，TAIDE開發團隊於4月29日發布了「升級版」Llama 3-TAIDE-LX-8B-Chat-Alpha1模型，以快速回應外界期待。TAIDE團隊也與產學研夥伴合作，將TAIDE模型應用於7個領域，包括農業知識檢索系統「神農TAIDE」和中小學生台語教學等。

國科會強調，將持續關注國際生成式人工智慧的發展，及時導入新技術，使TAIDE模型與時俱進，成為台灣具指標性的基礎模型。同時將協助推動TAIDE模型導入公私領域的創新應用，使台灣在生成式人工智慧領域保持競爭力。