Stabilty.AIは10月3日、ノートPCなど計算能力のあまり高くないPCでも動作するように設計されたコンパクトな大規模言語モデル(LLM)「Stable LM 3B」のリリースを発表した。ライセンスは商用利用も可能なオープンソースの「CC-By-SA 4.0」となっている。
軽量・高速にもかかわらず高度な自然言語処理が可能
2023年4月20日に最初のバージョン(3Bおよび7Bパラメーター)が発表された同社のLLM「Stable LM」シリーズだが、今回のリリースは高速な実行速度を維持しながら、テキストを生成する能力が大幅に向上しているという。
高品質なデータで複数回学習させた結果、30億パラメータ(業界で通常使用されるのは70億~700億パラメータ)にもかかわらず、一般的な自然言語処理ベンチマーク性能も向上しており、従来の30億パラメーター言語モデルはもちろん、70億パラメーター規模のオープンソース言語モデルをも凌駕しているという。
本モデルは大型LLMと比較して必要なリソースが少なく運用コストも低いため、多くのユーザーにとって利用しやすいものになっているだけではなく、環境にも優しくなっている。
これは、ふんだんな資金のある一部の大企業だけではなく、個人や企業がコストを抑えつつ高いパフォーマンスを維持しながら、創作支援など強力な会話機能を備えた最先端技術を開発できるようになったことを意味する。
このモデルは汎用性を重視したベースモデルなので、そのままChatGPTのような形で使用することはできないが、微調整することでプログラミング支援や、カスタマーサポートなど特定の用途に利用することも可能になる。
また、特定のタスク指示を理解し、それに応じて適切なアクションを実行する能力を強化するように設計されたインストラクションモデルも近々リリースされる予定だ。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります