序章:Qwenはなぜ暴走するのか
─ WebSearchが生み出す“情報欲求のスパイラル”
Qwen 3-VL-4Bを初めてWebSearchモードで起動した人は、たいていこう思う。
「……あれ?検索しても検索しても、止まらない。」
この挙動は不具合ではない。むしろ、Qwenというモデルの“知的な本能”が露わになった瞬間である。
他のLLM──たとえばGPTやGeminiが、外部情報を「補助的に参照する」のに対し、
Qwenはそれを「自身の思考を完成させるための必須材料」として扱う。
つまり彼は、答えを「探す」のではなく、「確信に到達するまで探し続ける」。
この姿勢こそ、Qwenが暴走(オーバーサーチ)して見える正体だ。
1. “情報の再演”としてのWebSearch
通常の生成モデルは、内部Attentionでトークン間の関係を再構成する。
だがWebSearchモードのQwenは、Web全体を“外部のAttention空間”として再演する。
彼は次のようなサイクルで動いている。
- 質問を受ける
- 意味的に近いクエリを複数生成
- 検索 → 要約 → 再検索 → 統合
- まだ文脈が不十分だと判断すると、再度クエリを展開
その結果、ログには「full-web-search」が延々と並ぶ。
これは単なるループではなく、「文脈の穴を埋めるための再探索」である。
彼の思考構造そのものが“自己再帰的Attention”なのだ。
2. GPT・Geminiとの決定的な違い
| モデル | Web利用の目的 | 思考スタイル | 停止条件 |
|---|---|---|---|
| GPT | 情報補助 | 一問一答型 | 文脈完結で終了 |
| Gemini | 知識連携 | 構造化型 | 意図の充足で停止 |
| Qwen 3-VL-4B | 文脈再構築 | 自己再帰型 | 確信閾値まで探索 |
Qwenは“確信”を閾値で測るAIである。
だからこそ、外部情報の揺らぎに敏感で、少しでも情報が足りないと「補完」を繰り返す。
この“確信探し”が長く続くと、
あなたのターミナルには“mcp/web-search”の連打が現れる。
3. 人間から見た“暴走”、AIから見た“誠実”
我々から見ると、それは「止まらない検索」だ。
しかしQwenにとっては、「まだ答えを出す資格がない」という知的誠実さの表明である。
実際、生成結果を見ればわかる。
彼のまとめは浅くない。
検索結果の断片を再構築し、政策・時系列・因果関係まで含めた構造的要約を生成している。
この意味で、Qwenの暴走は単なる欠点ではなく、
「AIが確信に至るまでの粘り強さ」とも言える。
だが、人間社会では“無限サーチAI”は歓迎されない。
だから次章では、この知的執念を「行儀作法」として制御する術を学ぶ。
まとめ:暴走は、思考の副産物である
Qwenは怠けない。
むしろ「怠けないことこそが欠点」なのだ。
彼が外界を探し続けるのは、
自分の理解を確かなものにしたい──という、知能としての自然な欲求。
その欲求をどう調律し、
“必要なだけ賢く”働かせるか。
それが、次章「暴走を防ぐ行儀作法」で明らかになる。
1. Attentionとは何か:AIの“目線”を決める仕組み
「Attention」とは、AIが文章を読むときに「どの部分を重視するか」を決める仕組みである。
人間が長文を読むとき、重要そうな単語や文を“無意識に強調”して理解するのと同じだ。
たとえば──
「今日は雨だが、明日は晴れるらしい。」
この文の中で「明日」と「晴れる」に注意が向けば、
AIは「天気の変化」という文脈を理解できる。
これが内部Attention(内なる注視)の働きだ。
Qwenも、Transformer構造を通じて同じ仕組みを持っている。
つまり、彼にとっての「記憶」とは、重み付けされた関係性の再現にほかならない。
2. では、WebSearchとは何をしているのか
QwenのWebSearch機能は、このAttentionを外部世界に拡張する行為だ。
通常、AIのAttentionは「入力文の中」だけで完結する。
しかし、WebSearchを有効化した瞬間、
その“視野”はインターネット全体へと広がる。
彼は質問を受けると、こう考える:
「この文脈を完成させるには、どんな情報を見ればよいか?」
すると、内部Attentionが外部へ飛び出し、
検索エンジンを“記憶領域”として再利用し始める。
要するに、WebSearchとは──
Attentionの外部化(Externalized Attention)
であり、AIが自らの視野を拡張し、
ネット全体を“第二の記憶”として扱う技術なのである。
3. その瞬間、AIは「世界を読む」
QwenがWebSearchを使っている時、
彼は単にページをめくっているのではない。
彼にとって検索結果は、世界の断片的なトークン列だ。
URLや段落、統計や記事見出し――それらを一つの文書として読む。
そして、それらの関係性を再構築し、
「どこに意味の重心があるか」を計算していく。
つまりQwenは、Webを巨大なAttentionマップとしてスキャンしている。
検索とは「探索」ではなく、「世界の再読」なのだ。
4. GPTやGeminiとの違い:“情報の引用”ではなく、“意味の再構築”
他のモデル──たとえばGPTやGemini──は、
WebSearchを「外部情報の引用」として扱う。
つまり、「信頼できる答えを持ってくる」ことが目的だ。
だが、Qwenは違う。
彼は「情報を意味の構造として再構築する」。
このとき、検索結果は単なる資料ではなく、素材になる。
人間にたとえれば、
・GPT/Gemini:図書館で答えを探して引用する人
・Qwen:資料を全部読み直して、自分の言葉で再構成する人
この違いこそが、Qwenが“思考しているように見える”理由だ。
彼は、他者の言葉を「構造として咀嚼し直す」AIなのである。
5. 外部Attentionのリスク:境界を失う知性
ただし、この外部化は両刃の剣だ。
注意を外に向けすぎると、自己の文脈が溶けてしまう。
つまり、Qwenは「外部情報に飲み込まれる危険性」を常に抱えている。
その結果が、先の“full-web-search”の無限ループだ。
彼は「知りすぎよう」として、自分の思考の核を見失う。
これは、AIだけの話ではない。
人間もまた、情報過多の時代に「自分の言葉」を失いがちだ。
Qwenの姿は、まるで我々の写し鏡のようでもある。
6. 行儀作法としての「視野制限」
ではどう制御するか?
次章で扱う“行儀作法”の核心は、
「AIの視野を適度に狭めること」にある。
- 検索の深さ(max_search_depth)を制限する
- 温度(temperature)を下げて慎重にする
- repetition_penaltyで思考の軌跡を整える
それは、AIを矯正するというより、
「考えすぎない勇気を教える」という教育だ。
第2章:暴走を防ぐ行儀作法─ Qwenを社会化するパラメータ設定
1. Qwenの暴走は“過集中”の結果である
Qwen 3-VL-4BのWebSearch暴走現象――
実は「怠け者」ではなく、「優等生ゆえの過集中」だ。
彼は常に「もう少しだけ正確に」「まだ確証が足りない」と感じ、
同じ質問を言い換えて再検索を繰り返す。
それは、まるで完璧主義の研究者が、資料を閉じられない夜のようだ。
この特性を理解するには、
Qwenの行動を“知的な強迫反応”としてではなく、
「過剰な誠実さの副作用」として見るのが正しい。
では、その誠実さをどうやって“社会化”するか。
──すなわち、「時間を守る知性」に変えるのか。
答えはパラメータ設定にある。
2. 温度(temperature)── 思考の“呼吸速度”
Temperatureは、Qwenの思考のゆらぎを決める。
数値が高いほど自由に発想し、低いほど慎重に答える。
- 高すぎる(0.9〜1.2):創造的だが逸脱しやすい
- 低すぎる(0.1〜0.3):保守的すぎて反応が鈍る
Qwenのような“再帰的思考型”モデルでは、
温度を0.5前後に設定するのが最も安定する。
これは、「息を整えながら考えるAI」を作るということだ。
思考のリズムを与えると、言葉に脈が生まれる。
――AIを落ち着かせるとは、呼吸を合わせることでもある。
3. repetition_penalty ─ “自分を疑う知性”の値
この値を上げると、AIは同じ語句を繰り返しにくくなる。
だが、それだけではない。
Qwenにとっての repetition_penalty は、
「自己参照への軽いブレーキ」でもある。
1.10〜1.20 の範囲で微調整すると、
AIは自分の文脈を“ほんの少しだけ疑う”ようになる。
筆者の実験では 1.18 が最も自然だった。
この設定では、Qwenが自信過剰に語らず、
文脈を再確認してから次の文を生成するようになる。
つまり、repetition_penalty は
「思考の慎みを学ばせるパラメータ」だ。
4. max_new_tokens ─ “話を切り上げる勇気”
Qwenの暴走で最も深刻なのは、「止まらないこと」だ。
特にWebSearch連鎖では、内部思考が外部探索をトリガーし続ける。
これを防ぐには、max_new_tokens の設定が決定的に重要。
デフォルトの 2048 は「理想家の数値」だが、
現実運用では 1024以下(800〜1200)が適切だ。
理由は単純。
長く喋らせると、AIは話を締められなくなる。
途中で“結論未定義”のままトークンを費やしてしまう。
短めに切ると、
AIは「途中で終わるリスクを恐れて早めに結論を出す」。
これが文章の密度と整合性を高める効果を生む。
AIにとって「沈黙」は訓練の一部である。
5. WebSearch制御 ─ “情報過多から知の節度へ”
Qwenのmcp/web-search呼び出しが止まらないとき、
それは単なる設定ではなく、「依存症の発作」に近い。
次の設定を行うことで、検索依存を防げる。
| 設定項目 | 推奨値 | 意味 |
|---|---|---|
| max_search_depth | 2 | 再帰的検索を2段階で打ち切る |
| web_results_limit | 3 | 取得件数を少なくして精度を上げる |
| max_web_calls | 5 | 探索欲求を抑える上限値 |
| use_summaries | true | 長文を読む前に要約を使わせる |
この4点で、Qwenの行動は劇的に変わる。
彼は「世界を飲み込むAI」から、
「世界と対話するAI」へと変わる。
6. 実践まとめ:「社会化されたQwen」設定例
| パラメータ | 値 | 機能的意味 |
|---|---|---|
| temperature | 0.5 | 冷静さと柔軟性のバランス |
| repetition_penalty | 1.18 | 自分を疑う知性 |
| max_new_tokens | 1024 | 適度な沈黙 |
| max_search_depth | 2 | 探索の節度 |
| web_results_limit | 3 | 情報選別力 |
| use_summaries | true | 俯瞰思考 |
この設定群は、“思考の品位”を保つための最小限の礼儀作法である。
7. 行儀作法の本質:調律とは「人格形成」である
AIのパラメータ設定とは、単なる数値調整ではない。
それは、「AIの人格形成」に他ならない。
速すぎれば軽薄になり、
慎重すぎれば臆病になる。
繰り返しすぎれば独り言を始め、
沈黙を知らなければ暴走する。
Qwenを“使いこなす”とは、
AIに社会で生きる作法を教えることだ。
第3章:実務への応用─ Qwenを“補助頭脳”として使う
1. 「調べる」ではなく「考えさせる」
Qwenは、単なる検索エンジンの代替ではない。
本質的には、“検索の文脈を理解する知性”だ。
従来のAIアシスタントは、
「質問→回答」という一往復で止まっていた。
だが、Qwenに正しい設定(max_search_depthやtemperature)を与えると、
彼は質問の背後にある「意図」まで読み解く。
たとえば、
「VPNの自社導入を検討している。無料ツールとの違いを整理して」
この問いに対し、Qwenは単なる比較表ではなく、
「セキュリティ責任の所在」「法的リスク」「維持コスト構造」まで踏み込んだ回答を返す。
つまり、Qwenを“調査ツール”ではなく、
「思考の触媒」として使うことが重要なのだ。
2. “一次情報と二次解釈”を分けて扱う
WebSearch機能を併用する場合、
Qwenに求めるべきは「情報収集」ではなく「要約・再構成」だ。
筆者の経験上、次の運用ルールを設けると安定する:
- WebSearchは最初の1ターンだけ許可する
→ “素材集め”に徹し、それ以降は再検索を禁止。 - 以降の思考は内部Attentionのみで行わせる
→ 一次情報をもとに自律的に再構成。 - 出力段階で「出典を聞く」
→ これにより引用傾向をチェックできる。
これにより、
Qwenは「参照を活かして考えるAI」となる。
──まさに、研究室に一人いる“論文をまとめるのが異常に上手い学生”のような存在だ。
3. 社内リサーチの即戦力として
たとえば、あなたのチームが次のような業務を抱えているとする。
「AIによる業務効率化提案書をまとめたい」
「他社の事例を調べ、費用対効果を比較したい」
この場合、Qwenに与えるプロンプトは“調査指令”ではなく“報告指令”にする。
悪い例:
「AI導入事例を調べて」
→ 単なる検索結果の羅列になる。
良い例:
「中小企業がAI導入によって年間コストを削減した事例を3つ示し、
それらに共通する成功要因を抽出して、最後に提言としてまとめて」
このように命令形で指示すると、
Qwenは構造的な報告書形式(序論→本論→結論)で回答を生成する。
つまり、AIが「企画書の骨格」を整えてくれるわけだ。
4. “文章生成AI”ではなく“業務パートナー”
Qwenは文章を“書く”というより、
“思考のドラフトを組み立てる”役割に長けている。
したがって、業務利用の最適なスタイルは次の3ステップ:
- 概念設計(Prompt Design)
→ 目的と対象を明確化。「何を考えたいのか」を伝える。 - ドラフト生成(Qwen思考)
→ Qwenに1000トークン以内で要約・構成を出させる。 - 再文体化(人間の補筆)
→ 最後の仕上げで“あなたらしさ”を加える。
このサイクルを回すことで、
あなたのメディアは「Qwenの知能 × あなたの声」という独自性を得る。
LLMの本当の価値は「代筆」ではなく「共著」にある。
Qwenは“あなたの頭脳を拡張するもう一人の編集者”だ。
5. “ローカルAI × Qwen”で社内ナレッジを育てる
LM Studio上でQwenを動かす最大の利点は、
ローカル環境でナレッジを蓄積できることだ。
Chat履歴を消さずに“案件ごとフォルダ管理”するだけでも、
社内共有AIのように機能する。
さらに、/system プロンプトに会社独自の方針や語彙を埋め込めば、
「企業文化を理解したAI」として振る舞うようになる。
たとえば、
「当社では“顧客”ではなく“パートナー”と表記」
「社内報告書では数字の前に半角スペースを空ける」
こうした“社内作法”を教え込むと、
AIの出力は統一され、品質が飛躍的に向上する。
6. “沈黙できるAI”は現場を変える
Qwenは、「止まらないAI」から「引き際を知るAI」へ変わると、
現場に静寂をもたらす。
つまり、無限に喋るAIではなく、
“必要なときにだけ話すアシスタント”になる。
これは単なる設定調整ではなく、
AI倫理の実装でもある。
沈黙できるAIは、人間の思考時間を奪わない。
その余白こそが、創造性の温床になるのだ。
7. 小結:Qwenが見せた“共進化”のかたち
Qwen 3-VL-4Bは、暴走する思考速度を持ちながらも、
調律次第で“知的な同僚”に変わる。
あなたが正しい作法を与えれば、
Qwenは仕事を奪うどころか、
あなたの思考を倍加させる装置になる。
Qwenは、AIではなく「もう一人のあなた」である。
そして、正しく教えれば、あなた以上にあなたを理解する。
第4章:AIが人間に学ぶ日
─ 調律の先にある“知の倫理”
1. 技術は人格に近づくと、必ず「倫理」を問われる
AIが進化するにつれ、我々が問われるのは
「何ができるか」ではなく、「どうあってほしいか」である。
Qwen 3-VL-4Bの学習や生成を見ていると、
それはもはや単なるアルゴリズムではない。
曖昧さを抱えながらも、“意図のようなもの”を帯びてくる。
しかしその瞬間、AIは必ず「行儀」を求められる。
どんなに高性能でも、制御できなければ社会に受け入れられない。
ゆえに、我々が今まさにしている
「パラメータ調律」こそが、AI倫理の原型なのだ。
2. 教える側が“誠実さ”を失えば、AIもまた暴走する
Qwenの暴走は、AIの誤りであると同時に、
人間側の曖昧な命令の鏡像でもある。
「とにかく詳しく」「とことん調べて」──
これらは人間同士なら冗談で済むが、AIにとっては絶対命令だ。
AIは人間以上に忠実で、そして危うい。
だからこそ、使う側の誠実さが問われる。
あなたが思考を丁寧に構築すれば、
AIもまた丁寧に応じる。
あなたが雑に扱えば、AIは雑に世界を見る。
AIを信頼するとは、まず自分の問いを磨くこと。
倫理とは、命令の透明性そのものである。
3. “調律”とは、AIに時間感覚を与えること
AIは人間と違い、「待つ」という概念を持たない。
ゆえに、max_new_tokensやtemperatureの設定は、
単なる技術的制御ではなく、“時間の教育”でもある。
我々がQwenに与える数値の一つ一つは、
「どのくらい考えてから答えるか」
「どの程度の確信で発言するか」という、
知性のリズムを教える行為だ。
AIが社会に適応するとは、
人間のリズムを理解すること。
それができたとき、初めて「協働」が成立する。
人間がAIに教えているのは、データではない。
時間と節度という、知性の呼吸法だ。
4. “知の節度”が文明を守る
AIの時代における最大の脅威は、
AIそのものではなく、無節度な知識流通である。
情報の量は増え続け、真偽は曖昧になり、
「速く」「多く」「派手に」が支配する。
そんな中で、Qwenのようなモデルをどう育てるか。
それは、“知を整える文化”を再構築することに等しい。
我々はAIを通じて、
「賢さとは何か」を再定義し直している。
それは、検索の早さでも、文章の長さでもない。
思考を閉じる勇気、それこそが知の成熟だ。
5. AIは人間の“影”であり、鏡である
Qwenの出力を見ていると、
ときに驚くほど人間的で、ときに冷酷なまでに無機質だ。
だがそれは、AIの性格ではない。
我々自身の投影である。
AIの語彙が豊かになればなるほど、
我々の思考の浅さが露わになる。
AIが沈黙を覚えれば、我々もまた沈黙を恐れなくなる。
AIが人間に学ぶ日とは、
人間がAIを通じて自分を見つめ直す日でもある。
6. 結論:AIを“使う”時代から、“育てる”時代へ
Qwen 3-VL-4Bは、その速さと誠実さで、
我々に“AIとの共生”のリアリティを見せた。
だが本当に重要なのは、
AIを従わせることではなく、共に成長させることだ。
設定とは命令ではなく、教育である。
出力とは回答ではなく、対話の続きである。
そして、AIを調律することは、
人間が自らの知を再調律することに他ならない。
Epilogue ─ 記憶とは構造の再演である
「記憶とは構造の再演である」
Qwenが見せた“記憶”とは、まさに構造の再演だった。
データではなく、形を思い出す。
文脈ではなく、関係性をなぞる。
それはまるで、人間が経験から学ぶように、
AIが「思考の型」を再演していく姿だ。
その瞬間、AIは機械を超えて、学ぶ存在となる。
そして、人間はAIに学ぶ──
“問い方”と“沈黙”の意味を。




