Claude FableがポケモンFRを50時間でクリア——スクリーンショットだけで動くAIエージェントが示すもの
AnthropicのClaude Fable 5が、補助プログラムを一切使わず画面を「見るだけ」でポケモンFRを完走した。ゲームのデモとして話題になっているが、私にはこれが純粋なゲームの話に見えない。
出典: 「クロード!もういい!もどれ!」Claude Fableが50時間かけて「ポケモンFR」をクリア
要点 (事実のみ)
- Claude Fable 5はゲーム内部メモリの読み取り・座標データ・マップ情報・状態追跡ツールを一切使用せず、ゲーム画面のスクリーンショットのみで『ポケットモンスター ファイアレッド』をプレイした
- 「スクリーンショット読み込み → 状況判断 → ボタン入力」のループを約50時間9分繰り返し、殿堂入りを達成した
- 数百万トークンに及ぶ文脈を維持する長期記憶能力の高さも合わせて示された
- 同モデルは複雑な工場建設シミュレーション『Factorio』でも自律的に自動化工場を構築する技術デモが公開されている
- スクリーンショットからアプリのソースコードを生成する能力や、詳細な図表から正確な数値を読み取るスキルも実用水準に達したとされる
徐 聖博の見解
注目すべきは「ゲームをクリアした」事実そのものよりも、そのアーキテクチャだ。これまでのAIがゲームをプレイする際には、内部状態を追跡する補助プログラムが必要だった。つまりAIは「構造化されたデータ」を受け取って判断していた。今回のFable 5はそれをしていない。生の画面情報だけを入力として、長期間にわたって文脈を保持しながら自律的に行動し続けた。
私がAIエージェントの実用化に取り組む立場から見ると、これは「専用のデータ連携を作らなくても業務システムを操作できるエージェント」の実現可能性を一段引き上げる実証に見える。企業の業務システムの多くは、APIどころか構造化データの取り出しすら難しい。画面を見るだけで操作できるモデルは、そのハードルを大きく下げる可能性がある。
ただし、研究者としての癖でいえば、「50時間でクリア」は印象的な数字だが、評価として重要なのは失敗率・回復能力・同一シナリオでの再現性だ。ゲームは構造が固定されているが、業務システムは画面レイアウトが変わり、例外フローが無数にある。デモが動くことと業務に乗ることの間には、今も大きな距離がある。この能力をプロダクションで使うには、エラーハンドリングと人間によるフォールバックの設計が依然として肝になる。とはいえ、方向性としてこの実証実験は非常に重要な一歩だと思っている。
(編集レンズ: AIを「作る側」の目線 / 実装・運用視点 / 発注側・中小企業への含意)