Gemma 3nを試す
ダウンロードが終わると下記画面に変わるので、プロンプトを入力して「紙飛行機」アイコンをタップ。
プロンプト:日本語で自己紹介して
ChatGPTのようにスラスラとまではいかないが、そこそこのスピード(31.1秒)で回答が生成された。「Show Stats」をタップすると詳細を確認できる。
項目の詳細は以下。初回トークン生成に少し時間がかかってはいるものの、生成開始後は安定したペースで文章が出力されている。
| 項目 | 値 | 単位 | 説明 |
|---|---|---|---|
| 1st token | 4.84 | sec | 最初の文字が生成されるまでの時間 |
| Prefill speed | 1.03 | tokens/s | 入力された質問を処理する速度 |
| Decode speed | 4.00 | tokens/s | 回答を生成する速度 |
| Latency | 31.09 | sec | 質問から回答完了までの総時間 |
1秒間に4トークンという生成速度は、ユーザーが読むペースとほぼ同等であり、回答を待つストレスは少ない。クラウドAIと比較すれば遅いものの、完全オフラインでこの性能が得られるのは画期的といえるだろう。
このように、文体の変更も可能だ。これならローカルでも十分話し相手になるのではないだろうか。
ちなみに、こちらの記事で紹介したPocketPal AIを使って「DeepSeek-R1」に同じプロンプトを投げてみたところ以下のようになった。おもしろくはあるが日本語はまだ厳し目に感じる。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります





