第47回

9Bなのに120B超え!?　Qwen3.5-9BがローカルAIの常識を変えた

2026年03月20日 17時00分更新

コーディング能力

　続いてコーディング能力を確認してみよう。Qwen3.5-9Bは小型モデルながら、実用的なコード生成にも対応している。単純なコード断片だけでなく、ファイル操作を含む実務的なスクリプトも安定して出力できる。

　例えば、指定したフォルダ内のファイルを拡張子ごとに分類し、それぞれのサブフォルダに移動するPythonスクリプトを書かせてみよう。

　生成されたコードには、拡張子ごとの分類処理やサブフォルダの作成、上書き防止といった実用上の配慮も含まれており、そのまま動作する完成度に近い。関数単位で整理されているため構造も分かりやすく、用途に応じた改変もしやすい。ファイル操作や例外処理も含めて一通りの構成が揃っており、実務的なスクリプトとして成立している。

　簡単な自動化スクリプトや日常的な開発補助用途であれば、9Bクラスでも十分に実用的な水準に達している。ただし細部の挙動には調整が必要な場合もあるため、生成コードは内容を確認したうえで利用する前提になる。

Thinkingモードの挙動

　Qwen3.5-9Bは内部的に思考過程（CoT）を生成する設計になっている。質問内容によってはモデルが自動的にThinkingモードに入り、推論トークンを出力する。ただし、GGUF版をLM Studioで動かした場合、この推論出力が長く続き、最終回答に到達しないケースが確認できた。

CoTが暴走した例

　ChatMLテンプレートを使うことで通常のチャットは安定するが、推論タスクでは同様の現象が起きる場合がある。現時点ではThinkingを前提とした使い方よりも、通常のチャット用途として利用する方が安定している。なお、この挙動はローカル推論環境の実装に起因している可能性もあり、今後のアップデートで改善される可能性はある。