LPU

TECH

専用チップ時代に台頭するGroq ─ RAGの即時応答を可能にする仕組み

GPU万能時代の次。GroqのLPU(Language Processing Unit)がもたらす決定論的な低遅延と高速トークン生成は、RAG(Retrieval-Augmented Generation)での“待ち時間ほぼゼロ”体験に直結する。アーキテクチャの背景、公開ベンチマーク、実例、設計上の勘所をまとめる。