用語辞典に戻る

Benchmark

ベンチマーク(ベンチマーク)

中級Core Concepts

特定のタスクにおける異なるAIモデルの性能を測定・比較するための標準化されたテストやデータセット。

なぜ重要か

ベンチマークはモデル間の精度、速度、能力を比較し、適切なモデル選択を支援します。

実際の活用例

MMLU（大規模マルチタスク言語理解）が57科目にわたるモデルの回答能力をテストする。

AIを定義だけでなく、理解したいですか？

HonuVibeのコースでは、これらの概念を暗記するのではなく、実際に使いこなす方法を学べます。

コースを見る