今年はこの一冊だけでOK!AI用語ガイド

今年はこの一冊だけでOK!AI用語ガイド

2023年が生成AIの元年、2024年が実用化の年だとすれば、2025〜2026年はAI用語が爆発的に増加する時期と言えるだろう。学術界からテクノロジー大手、スタートアップから一般ユーザーまで、ほぼ誰もがAIについて語っているが、頻繁に登場する専門用語を正確に理解できているとは限らない。TechCrunchの5名のベテランテクノロジー記者が共同でまとめた本年度のAI用語ガイドでは、習得しておくべき用語とその定義を網羅している。

基礎編:知らなければならないAIのコアコンセプト

大規模言語モデル(LLM):現在のAIの波を支える基盤。大規模言語モデルは膨大なテキストデータで学習されており、人間に近いテキストの生成、質問への回答、言語翻訳などが可能だ。代表的なモデルには、OpenAIのGPT-4o、GoogleのGemini、AnthropicのClaude、MetaのLlamaシリーズなどがある。なお、LLMはテキストを扱う広義のモデルであり、マルチモーダルモデルはさらに画像・音声・動画も処理できる点で区別される。

生成AI:新しいコンテンツを生み出すことができる人工知能システムを指す。テキストにとどまらず、画像、音楽、動画、さらにはコードも含まれる。代表的な生成AIツールには、Midjourney、DALL-E、Sora、Stable Diffusionなどがある。生成AIと大規模言語モデルの交差領域が、現在のAI発展の中核を担っている。

AGI(汎用人工知能):AI分野の究極の目標——ほぼすべての認知タスクにおいて人間レベルに達するか、あるいはそれを超えるAIシステムのことだ。現在の主流AIシステムはすべて特化型AIに分類されるが、AGIをめぐる議論は絶えることがない。OpenAIやDeepMindなどの企業はAGI実現をミッションに掲げているものの、そのタイムラインについては諸説ある。

編集者注:2026年の現在、特定のベンチマークで人間を超えるAIシステムも登場しているが、常識的推論・横断的学習・自律的な目標設定を真に備えたAGIはまだ実現していない。AGIがいつ来るかを不安視するよりも、まず現在の基礎用語を整理することが先決だ。

応用編:AIテクノロジースタックにおける重要用語

Transformer:2017年にGoogleが提案したニューラルネットワークアーキテクチャで、現代の大規模言語モデルのほぼすべての基盤となっている。中核となる仕組みはアテンション機構であり、モデルがすべての入力位置を並列処理することで、長距離依存関係を効率よく学習できる。BERT、GPTシリーズ、T5などのモデルはいずれもTransformerをベースとしている。

ハルシネーション(幻覚):AIモデルが、もっともらしく見えるが実際には誤っている、あるいは無意味なコンテンツを生成する現象を指す。例えば、モデルが事実を捏造したり、引用を作り上げたり、概念を混同したりすることがある。ハルシネーションは大規模言語モデルが抱える最も厄介な課題の一つであり、研究者はRAGやファクトチェックなどの手法によってこの問題の軽減に取り組んでいる。

RAG(検索拡張生成):情報検索とテキスト生成を組み合わせた技術。RAGでは、回答を生成する前に外部の知識ベースから関連文書を検索し、それらの情報をコンテキストとしてモデルに提供することで、精度と情報の鮮度を大幅に向上させる。多くのエンタープライズAIアプリケーションがRAGアーキテクチャを採用している。

MoE(Mixture of Experts、混合エキスパートモデル):複数の特化したサブモデル(エキスパート)を組み合わせたモデル設計手法であり、各入力に対して一部のエキスパートのみが活性化される。MoEはモデルの容量を維持しながら計算コストを効果的に削減でき、近年ますます普及しているモデルアーキテクチャだ。DeepSeek-V2やMixtral 8x22BなどのモデルもMoEを採用している。

最前線編:AIガバナンスと倫理に関する用語

AIアライメント:AIシステムの目標が人間の価値観と一致するよう確保するための研究分野。アライメント問題には、AIが人間の嗜好を理解する方法、報酬ハッキング行動を回避する方法、長期的な安全性を確保する方法などが含まれる。現在のAI安全性研究の中核的な方向性となっている。

レッドチームテスト:もともとはサイバーセキュリティにおいて攻撃者をシミュレートする手法を指すが、AI分野ではモデルのセキュリティ上の欠陥、バイアス、脆弱性、不適切な動作を体系的にテストすることを意味する。2025年には、複数の規制当局がAI開発者に対し、リリース前に厳格なレッドチームテストの実施を義務付けている。

説明可能性:AIモデルの内部的な意思決定プロセスを理解・説明する能力のことだ。モデルがますます複雑化する中、説明可能性は信頼構築の鍵となっている。技術的なアプローチとしては、アテンションの可視化、特徴量帰属、概念ボトルネックモデルなどがある。

編集者注:AI用語の急速な進化は、一つの産業が成熟していく過程を反映している。インターネット黎明期にTCP/IPやHTTPを理解する必要があったように、今日これらのAI用語を把握することは学術的な負担ではなく、デジタル時代に参加するためのパスポートだ。もちろん、用語そのものはあくまでツールに過ぎない。本当の価値は、その背後にある技術的論理と人文的影響を理解することにある。

実用編:日常会話でよく使われるAI用語

プロンプトエンジニアリング:AIモデルが期待する出力を生成するよう誘導するために、最適な入力テキストを設計するスキル。優れたプロンプトはモデルの回答品質を大幅に向上させることができるため、プロンプトエンジニアリングは新たな職種として確立されつつある。

ファインチューニング(微調整):事前学習済みモデルをベースに、特定ドメインの少量データでさらに学習させ、モデルを特定のタスクに適応させること。ゼロから学習するよりも効率的であり、カスタマイズされたAIアプリケーション開発の主な手法となっている。

ベクターデータベース:高次元のベクターデータを専門的に保存・検索するデータベースで、セマンティック検索や推薦システムなどのシナリオで活用される。RAGシステムにおいては、文書の埋め込み(エンベディング)を格納する重要なコンポーネントとなっている。

AIエージェント:環境を認識し、計画を立て、目標達成のために行動を実行できるAIシステム。単純な質疑応答モデルとは異なり、AIエージェントはツールの呼び出し、再帰的思考、多段階のプランニングが可能だ。2025年以降、AIエージェントはスタートアップの最もホットな領域の一つとなっている。

以上はAI用語という海の、ほんの氷山の一角に過ぎない。技術が進化し続ける中、新たな用語は次々と生まれてくる——例えば2026年に注目されるワールドモデル因果AIニューロシンボリックシステムなどだ。学び続けることは大切だが、すべての用語を網羅しようとする必要はない。コアコンセプトを理解し、マーケティング的な言葉と真の技術を見分ける力を養うことこそが、AIの波を乗りこなす鍵となる。

本記事はTechCrunchより編集・翻訳