用語辞典に戻る
Multimodal AI
マルチモーダルAI(マルチモーダルエーアイ)
中級Models & Architecture
テキスト、画像、音声、動画など複数の種類のデータを同時に理解・生成できるAIシステム。
なぜ重要か
マルチモーダルAIは人間の知覚を反映し、AIをより多用途にします。
実際の活用例
GPT-4Vが数学の問題の写真を分析して解いたり、画像の内容を説明する。
マルチモーダルAI(マルチモーダルエーアイ)
テキスト、画像、音声、動画など複数の種類のデータを同時に理解・生成できるAIシステム。
マルチモーダルAIは人間の知覚を反映し、AIをより多用途にします。
GPT-4Vが数学の問題の写真を分析して解いたり、画像の内容を説明する。