Stability AI Japan、最高水準の日本語言語モデル2種を公開

2023年10月25日 14時00分更新

　Stability AI Japanは10月25日、日本語タスクを用いた性能評価でトップクラスの性能を示す日本語向け大規模言語モデル（LLM）「Japanese Stable LM 3B-4E1T（およそ30億パラメーター）」と「Japanese Stable LM Gamma 7B（およそ70億パラメーター）」を商用利用可能な「Apache 2.0」ライセンスでリリースした。

英語モデルをベースに継続事前学習

　今回発表されたモデルは同社が2023年8月に公開した「Japanese Stable LM Alpha」シリーズと異なり、もともと英語モデルとして制作・公開された「Stable LM 3B-4E1T」「Mistral-7B-v0.1」をベースに、日本語を主としたデータを用いて更に事前学習を実行した継続事前学習（Continued Pretraining）と呼ばれるアプローチで日本語の能力を追加している。

　継続事前学習にはWikipedia、mC4、CC-100、OSCAR、SlimPajama（Books3を除く）などの日本語と英語データのべ約1000億トークンが使用されている。