全球首款繁中 AI 語言模型開源釋出聯發科：比現大1000倍

2023-02-24 下午 01:48 記者林育如／綜合報導

大型語言模型為人工智慧技術進步的重要的一環。圖：取自123RF

大型語言模型為人工智慧技術進步的重要的一環。由聯發科技集團轄下的前瞻技術研究單位聯發創新基地、中央研究院詞庫小組和國家教育研究院三方所組成的團隊，22日宣布開放全球第一款繁體中文語言模型到開源網站提供測試。以開源語言模型BLOOM開發的繁體中文大型語言模型，比目前開源可用的最大繁體中文模型大1,000 倍，所使用的訓練資料也多1,000倍。

為了建立該項語言模型，三方運用各自優勢資源。其中，國家教育研究院提供了大量高品質的繁體中文語料，聯發創新基地則建置了訓練的硬體環境，而中央研究院詞庫小組則針對模型生成的文字不合適的內容，進行自動偵測與改正的研究與評估。

大型語言模型近來的蓬勃發展，源自於 2019 年 Google 推出的 BERT 語言模型，以及同年 OpenAI 開始推出的一系列 GPT 語言模型。這些大型語言模型已經被證實具備相當的知識與能力，即使在少量訓練資料，甚至無訓練資料之下也依然能夠對新任務產生正確結果，已成為人工智慧往前進化不可或缺的基礎。

聯發創新基地負責人許大山表示，此次合作結合臺灣極少數能訓練大型語言模型的團隊，以透明、開放和包容的方式，善用技術、人才及資源，既發展自主訓練大型人工智慧模型的能力，也讓繁體中文的大型語言模型研究及應用更為普及。

聯發科表示，模型已公開讓外界下載，可應用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。

延伸閱讀：
力積電加碼投資苗栗600億元導入智慧化產線帶動就業
 王品前兩季釋出500名職缺高薪上看6.5萬
 考生注意！地特將併入初考預計114年施行
 臺鐵招募30名車勤服務員月薪30K起

1指點入看錢景：
找工作快上1111人力銀行 http://m.myqueenbquilts.com/
想找更多兼職打工 https://parttime.1111.com.tw/
科技新知請上科技島https://www.technice.com.tw
youtube強檔影音 1111人力銀行一次滿足 http://m.myqueenbquilts.com/162804/
1111產經新聞網職場產業最核心 http://m.myqueenbquilts.com/news

AI 聯發科聯發創新基地中央研究院