Claude Fable 5が登場!最先端のAI能力を一般向けに提供。特定グループ向けMythos 5も見逃せない。
Claude Fable 5とMythos 5の発表
原題: Claude Fable 5 and Claude Mythos 5
重要度の根拠: 新モデルの発表は多くのユーザーに影響を与えるため。
要約
Anthropicは、一般利用向けに安全化されたMythosクラスのモデルClaude Fable 5を発表しました。このモデルは、AI能力のほとんどのテストベンチマークで最先端を行っており、特にソフトウェアエンジニアリングや知識作業、科学研究などで優れた性能を示しています。同時に、サイバーセキュリティ分野でのリスクを軽減するために、Claude Mythos 5も発表され、米国政府との協力により特定のグループ向けに提供されます。両モデルはそれぞれ、1百万トークンあたり10ドルと50ドルで提供され、Claude Mythos Previewの半額となっています。
要点
- Claude Fable 5は最先端の性能
- Mythos 5は特定グループ向け
- 価格は半額で提供
- ソフトウェアエンジニアリングでの実績
- サイバーセキュリティに配慮した設計
開発者向け技術解説(API・実装詳細・破壊的変更)を見る
Claude Fable 5は、Mythosクラスのモデルで、一般利用向けに安全化されました。性能面では、ソフトウェアエンジニアリングにおいて、50百万行のRubyコードベースに対し、1日でコードベース全体の移行を実施し、通常なら2ヶ月かかる作業を数日で達成しています。また、Claude Mythos 5は、同じ基盤モデルながら、一部の領域でセーフガードが解除され、米国政府とのプロジェクトGlasswingを通じて提供されます。価格は、入力トークンあたり10ドル、出力トークンあたり50ドルで、Claude Mythos Previewの半額です。Fable 5は、長期的な自律作業が可能で、特に複雑な分析タスクにおいても最も高いスコアを記録しています。
本文の日本語訳(全文)を見る
本日、一般利用向けに安全化されたMythosクラスのモデルClaude Fable 5を発表します。
Fable 5の能力は、これまで一般に提供したモデルの中で最も優れています。AI能力のほとんどのテストベンチマークで最先端を示し、ソフトウェアエンジニアリング、知識作業、ビジョン、科学研究など多くの分野で優れた性能を発揮しています。タスクが長く複雑になるほど、Fable 5は他のモデルに対して大きなリードを見せます。
このような能力を持つモデルのリリースにはリスクが伴います。セーフガードなしでFable 5の能力がサイバーセキュリティなどの分野で悪用され、深刻な損害を引き起こす可能性があります。そのため、いくつかのトピックに関するクエリには、次に最も能力のあるモデルClaude Opus 4.8からの応答が得られるようにするセーフガードと共にモデルをリリースしました。安全かつ迅速にモデルをリリースするために、これらのセーフガードは保守的に調整されていますが、時には無害なリクエストをキャッチすることがあります。ただし、平均して5%未満のセッションでトリガーされます。今後数ヶ月でより能力の高いモデルが登場するため、セーフガードの改善や偽陽性の削減に取り組んでいます。
サイバー防御者やインフラプロバイダーの小グループ向けには、同じ基盤モデルのClaude Mythos 5も発表しますが、一部の領域でセーフガードが解除されています。Mythos 5は初めに、米国政府とのコラボレーションでProject Glasswingを通じて展開され、Claude Mythos Previewのアップグレード版となります。世界で最も強力なサイバーセキュリティ能力を持っています。すぐに、より広範な信頼されたアクセスプログラムを通じてMythos 5へのアクセスを拡大する予定です。
Fable 5やMythos 5のモデルの能力は、世界に大きな貢献をする可能性を秘めています。Project Glasswingでは、モデルがサイバー防御者の重要なソフトウェアを保護する手助けをしていることが見られます。また、ライフサイエンス研究においても、モデルが新しい仮説を提示し、新しい治療法の開発を加速しています。
Fable 5とMythos 5は、入力トークン1百万あたり10ドル、出力トークン1百万あたり50ドルで提供され、Claude Mythos Previewの半額です。今日の共同発表は、できるだけ多くのユーザーに高度なAI能力を迅速かつ安全に提供するという目標に向けたもう一つのステップです。
下の表はFable 5とMythos 5の能力を他の主要モデルと比較したものです。
Fable 5とMythos 5は、過去のClaudeモデルよりも自律的に長時間作業できます。ここでは、これらのスキルがソフトウェアエンジニアリングにどのように適用されるかを説明し、モデルの知識作業、ビジョン、記憶、ライフサイエンス研究における改善された能力についても触れます。
ソフトウェアエンジニアリングでは、初期テスト中にStripeがFable 5が数ヶ月のエンジニアリングを数日で圧縮したと報告しました。50百万行のRubyコードベースにおいて、モデルは1日でコードベース全体の移行を行い、手作業で2ヶ月かかる作業を実施しました。Fable 5は、過去のClaudeモデルよりもトークン効率が高く、CognitionのFrontier Code評価では、モデルが困難なコーディングタスクをクリアできるかをテストし、高品質なプロダクションコードベースの基準を満たすことができるかを評価し、Fable 5はフロンティアモデルの中で最高点を獲得しました。
知識作業では、Fable 5は複雑な分析タスクに対して強い性能を示しています。Hebbiaのファイナンスベンチマークで、Fable 5は高レベルの推論で最高スコアを記録し、文書ベースの推論、チャートや表の解釈、問題解決においても大幅な向上を示しました。IMCは、Fable 5が事実確認、概念的推論、根本原因分析、期待値分析などのトレーディング分析評価でほぼすべての項目で優れた成績を収めたと伝えています。
出典: https://www.anthropic.com/news/claude-fable-5-mythos-5
媒体: Anthropic News
※本記事は Anthropic / Claude 関連の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。