【2026年版】いま押さえるべき生成AI用語まとめ

2026.01.22

〜LLM、RAG、AIエージェント、LLMOpsを「5つの話題」で最短整理〜

会議や資料で「LLM」「RAG」「AIエージェント」「LLMOps」などの用語が次々に出てきても、いま何の話をしていて、何を決めればいいのかが曖昧なまま議論が進んでしまう——生成AI領域ではよく起きる状況です。事業側/PMにとって致命的なのは、単語を覚えることではなく、判断の土台（共通言語）がないことです。

本記事は、生成AIの頻出用語を 「5つの話題（モデル／出力／知識／実行／運用・安全）」に整理し、1用語2〜4行で「会話についていける最低限」を最短で押さえるための用語まとめです。

この記事を読むことで得られること（＝次の意思決定が速くなる）
結論：まずはこの5分類だけ覚える
使い方：会議で迷子にならないコツ
1. モデルの話（AIの“頭”の基本）
2. 出力の話（回答の作られ方とクセ）
3. 知識の話（賢く答えさせる：プロンプトと検索）
4. 実行の話（AIに仕事を任せる：ツールとエージェント）
5. 運用・安全の話（作って終わりにしない）
まとめ
おすすめ書籍
参考・関連リンク

この記事を読むことで得られること（＝次の意思決定が速くなる）

議論が「どの話題（モデル？RAG？運用？安全？）」か即判定でき、要件整理・リスク整理・合意形成が速くなります。
用語が出ても焦らず、落ち着いて判断できる状態を作れます。
チーム内で“生成AIを分かりやすく整理して説明できる人”として、共通言語づくりを主導できます。

用語を押さえたら、体系的にまとめられた書籍で全体像を理解することをおすすめします。まずは1冊だけで構いません。

断片知識のつぎはぎだけでは意思決定の場面で必ず詰まります。記事末に、事業側/PMが「まず最初に読むべき」書籍を厳選して5選載せていますので、この記事で全体像を掴んだらそのまま書籍で理解を一段深めてください。

「まずは」の1冊におすすめなのはこちら↓

図解入門ビジネス最新生成AIのビジネスと動向がよ~くわかる本

生成AIの台頭により、産業構造は歴史的な転換点を迎えています。本書は、技術論に偏った解説書とは一線を画し、「生成AIをいかに事業戦略に活かすか」というビジネスの視点から書かれた実践的な戦略書です。特に、自律的に思考しタスクを遂行する「A...

結論：まずはこの5分類だけ覚える

生成AIの用語は、次の5つの話題に分けると迷子になりにくいです。

モデルの話：AIの「頭」の仕組み（LLM、トークン等）
出力の話：どう答えが作られるか（推論、ハルシネーション等）
知識の話：賢く答えさせるために何を渡すか（プロンプト、RAG等）
実行の話：AIに「仕事」をさせる（Tool Calling、エージェント等）
運用・安全の話：品質とリスクを管理する（Evals、LLMOps、ガードレール等）

使い方：会議で迷子にならないコツ

まず「その単語は5分類のどこか」を判断します（意味が曖昧でも構いません）。
「いまはモデル性能の話なのか」「運用の話なのか」が見えるだけで、議論が前に進みます。
個別用語の深掘りは別記事に譲り、本記事は「会話についていける最低限」を狙います。

1. モデルの話（AIの“頭”の基本）

LLM（Large Language Model）

大量の文章から学習し、文脈に沿った文章を作れる言語モデルです。
生成AIアプリの“エンジン”に当たります。

パラメータ数

モデル内部の調整要素（変数）の規模です。
大きいほど高性能になりやすい一方、コストも上がりがちです。

トークン（Token）

AIが文章を処理する最小単位です。料金や処理量の基準になりやすいです。
注意点ですが、文字数と一致するものではありません。

コンテキストウィンドウ

AIが一度に参照できる情報量の上限です。
長い資料をまとめて扱えるかどうかに直結します。

事前学習・ファインチューニング・蒸留

事前学習：一般知識を広く学ぶ
ファインチューニング：用途に合わせて追加学習
蒸留：大きいモデルの振る舞いを小さいモデルに学習させ、軽量化する

2. 出力の話（回答の作られ方とクセ）

推論（Inference）

学習済みモデルが実際に回答を生成する処理です。
運用コストやレイテンシ（体感速度）に直結します。

ハルシネーション（Hallucination）

誤りをもっともらしく言い切る現象です。
「自信」と「正確さ」は別として扱うのが重要です。

マルチモーダル生成

テキストだけでなく、画像・音声など複数形式を扱って生成できる能力です。
問い合わせ対応や資料要約など、入口が広がります。

Temperature（温度）

出力の“ランダムさ”を調整するパラメータです。
低いほど堅め・安定、高いほど発想は出るがブレやすくなります。

構造化出力（Structured Outputs / JSON Schema）

AIの出力を、指定したJSON構造に従わせる考え方（または機能）です。
業務システム連携で「型崩れ」を減らし、実装と運用が安定します。

3. 知識の話（賢く答えさせる：プロンプトと検索）

プロンプトエンジニアリング

AIへの指示（プロンプト）を工夫して、望ましい出力を引き出すスキルです。
「何をするか」「どの形式で」「逆に、何をしないか（禁止事項）」を明確にします。

システムプロンプト（System Prompt）

ユーザー入力より“上位”に置かれる前提指示（役割、口調、禁止事項など）です。
チームで運用するときの「方針の固定」に効きます。

RAG（Retrieval-Augmented Generation：検索拡張生成）

モデルの知識だけに頼らず、社内文書や最新情報を検索してから回答する仕組みです。
「社内固有」「根拠提示」「更新頻度が高い」領域で有効です。

ベクトル検索

文章を数値表現にして意味の近さで検索する方法です。
キーワード一致が弱い領域でも関連情報を拾いやすくなります。

Embeddings（埋め込み）

文章を“意味のベクトル”に変換した表現です。
RAGやベクトル検索の基礎部品として頻出します。

ベクトルデータベース（Vector Database）

Embeddingを大量に保存し、近いものを高速に探すためのデータベースです。
RAGで「検索部分」を支える定番コンポーネントです。

チャンキング（Chunking）

長文を検索しやすい適切な単位に分割することです。
分割が雑だとRAGの回答品質が不安定になりやすいです。

リランキング（Reranking）

検索で拾った候補を、別のモデル等で“並べ替えて精度を上げる”工程です。
「それっぽいが外れている」を減らしたいときに有効です。

4. 実行の話（AIに仕事を任せる：ツールとエージェント）

Function Calling / Tool Calling

AIが外部APIや社内システムを呼び出してモデル単体ではできない処理を行う仕組みです。
「調べる」「登録する」「集計する」など、業務操作につながります。

MCP（Model Context Protocol）

AIと外部ツール/データを、共通ルールでつなぐための仕組み（プロトコル）です。
接続方式を揃えることで、連携先を増やしやすくします。

オーケストレーション（Orchestration）

複数の処理やAIの実行順序を制御し、全体として“仕事が完了する流れ”を作る考え方です。
例：検索→要約→確認→登録のような手順設計です。

AIエージェント（AI Agent）

目標を与えると、自分で考え必要に応じてツールを使いながらタスクを進める仕組みです。
業務の「代行」に近づく一方、誤操作リスクも増えます。

チャットボット / Conversational UI

会話形式で操作・問い合わせできるUIです。
社内ヘルプデスクや問い合わせ一次対応でよく使われます。

Copilot（伴走型）vs Agent（代行型）

Copilot：人が主役、AIが補助
Agent：AIが主役、人が監督
要件定義の時点で、責任分界（誰が最終判断するか）を決めておくのが重要です。

ローコード／ノーコードAIプラットフォーム

プログラミングを最小限にしてAIアプリを作る手段です。
検証スピードは上がりますが、複雑化すると設計が必要になります。

バイブコーディング（Vibe Coding）

自然言語で“やりたいこと”を伝え、AIと対話しながら実装を進めるスタイルです。
試作は速い一方、品質担保は別途設計が必要です。

5. 運用・安全の話（作って終わりにしない）

プロンプトインジェクション／脱獄（Jailbreak）

入力文でAIの指示系統をねじ曲げ、意図しない応答や情報漏えいを狙う手法です。
利用規模が大きいほど、後追い対策だと高くつきやすい領域です。

ガードレール（Guardrails）

入力/出力を監視・制御し、不適切な挙動を防ぐ仕組みです。
「禁止語」「個人情報」「根拠のない断定」などをルール化します。

評価（Evaluation / Evals）

AIの回答を“測る”仕組みです。
品質を再現可能にしないと、改善も比較もできません。

LLMOps

LLMを使ったシステムを安定して運用・改善するための考え方です。
監視、評価、コスト管理、プロンプト管理などを含みます。

監視（Observability：ログ/トレース/メトリクス）

「いつ・何に・どう答えたか」を追える状態にすることです。
障害対応だけでなく、品質改善や事故調査にも効きます。

プロンプトキャッシュ（Prompt Caching）

繰り返し使う前置き（指示や前提）を再利用し、コストとレイテンシを下げる考え方です。
運用品質を保ったまま、体感速度を改善しやすくなります。

レイテンシ（Latency）とコスト（Token Cost）

レイテンシ：体感速度。業務利用ではUXを左右します
コスト：多くはトークン量に依存。RAGや長文入力で増えやすいです
要件定義では、精度だけでなく「速さ・費用」も同列で扱うのが現実的です。

まとめ

生成AIの用語は、まず5つの話題（モデル/出力/知識/実行/運用・安全）に分けると理解が安定します。
事業側/PMとしては、精度だけでなく 安全（ガード）・運用（Evals/LLMOps）・コスト/レイテンシまで含めて会話できると、判断が速くなります。
次の一手として、下の「おすすめ書籍」から1冊選び、体系的に理解を固めるのがおすすめです。

参考・関連リンク

https://forest.watch.impress.co.jp/docs/serial/aidev/2078521.html