VLM

HowTo

Qwen3.5-9B(VLM)で免許証の本人確認(KYC)をOCRする─最小項目JSON抽出の現実解

ローカルVLM「Qwen3.5-9B」で運転免許証(表面)から本人確認に必要な最小3項目(氏名・生年月日・住所)だけをJSON抽出。安定化のコツと速度改善(縮小前処理)まで実測でまとめる。
TECH

GLM-OCRをOllamaで試す:日本語OCRは実用になるのか

GLM-OCRをOllama環境で実地検証。日本語テキスト、表、図表に対する認識精度をチェックし、汎用VLMとの違いや実務での使いどころを整理する。
TECH

Googleが「ロボティクスAI」の旗を掲げる意味 ─ VLM搭載ロボと日本産業界の今

Googleが「Gemini Robotics 1.5」を発表し、視覚・言語モデル(VLM)を搭載したロボティクスAIの可能性を示しました。国内産業用ロボットの現状と課題にも触れ、AIとロボット融合の未来を俯瞰します。