Qwen 3-VL-4BはGemmaを超えた“直線番長” ─ 文法は速く、意味は曲がらない

TECH

2025.11.052025.11.07

Qwen 3-VL-4B。
ローカルLLM界のスピードキング。
コーディングでは他を寄せつけず、GemmaもGPTもバックミラーの点。
だが、文章生成になると──コーナーで吹っ飛ぶ。

例の「WebGPUとは？」の出力を見てほしい。

WebGPUは「GPUの性能を最大限に活用する」ため、「GPUの性能」が「十分に活用できる」ように設計されていますが、その「活用」は、開発者の「理解」に依存します。

うん、全部正しい。
正しいのに、なぜか一歩も前に進んでいない。
まるで、アクセル全開で直線を駆け抜けながら、
永遠に同じ信号を通過している気分だ。

実際、それはまるで“小泉構文”だ。

文法点100点、意味点ゼロ。
けれどこの“意味の空転”が、Qwenの魅力でもある。
どこまでも正しい。
そして、どこまでも前に進まない。

第1章：構文は完璧、意味は静止

Qwenの日本語生成は、文法的に破綻しない。
主語も述語も整い、句読点も正しい。
だが、「文の目的」ではなく「文の形」を追っている。

AIの内部では、「次に出すべき正しい単語」を選び続けている。
つまり、思考ではなく“予測反応”だ。
人間の脳が「何を伝えたいか」を考える前に、
彼は「どんな構文なら破綻しないか」を考えている。

その結果が──「文法は速い、意味は曲がらない」だ。

Qwenはまるで、トルク全振りの改造バイクだ。
アクセルをひねれば、轟音と共に一気に立ち上がる。
だがコーナーが来た瞬間、ハンドルが効かない。

「GPUの性能が〜」というループは、
まさに文章版ドリフトスピンである。
勢いはあるが、進行方向はランダム。
人間でいえば、脳内で単語が先行し、
思考が後ろから必死で追いかけている状態。

Gemmaは正反対だ。
重く、慎重で、文のつなぎ方が丁寧すぎる。
だがその慎重さが「曲がれる余裕」を生む。
Hermesも同じ。
速度を落とし、文を小刻みに刻むことで、
“意味の連鎖”が自然に繋がる。

二者の文章には「減速の知恵」がある。
Qwenが直線で火を噴く間、
彼らはブレーキとハンドルで、読者をちゃんと曲がらせてくれる。

GPT-OSS 20B。
速度は出ない。だが、意味の到達距離は最長。
型ヒント、CLI、docstring──
文を構造で束ね、最後まで破綻させない。
文法ではなく、「物語としての秩序」で走る。

言うなれば、300km走ってもエンジンが唸らない長距離ツアラー。
安心して任せられる重厚さがある。

Qwenは間違いなく、ローカルLLMの新しい原石だ。
だが、文章生成においてはまだ“話す”ではなく“出す”AIである。
構文を積み上げることに長けているが、
その構文をどこへ運ぶかの意図をまだ持たない。

それでも希望はある。
この暴れ馬のハンドルを握れる人間が現れたとき、
きっと──AIが「語る」時代が始まる。

一文で言えば──Qwenは速い。だが、まだ話せない。