2026年4月8日、Meta社(旧Facebook)がAI戦略を根本から覆す新モデル「Muse Spark」を発表しました。
これまでオープンソースのLlamaシリーズで知られてきたMetaが、なぜクローズドモデルに転換したのか? ChatGPTやGemini、Claudeと比べて何が優れていて、何が足りないのか? そして日本のユーザーはいつ使えるのか? 気になるポイントをすべてまとめました。
この記事の内容
1. Muse Sparkとは何か? 基本をおさらい
2. なぜLlamaからMuse Sparkへ? 戦略転換の背景
3. ベンチマーク徹底比較 ― 強い分野・弱い分野
4. Muse Sparkの3つの動作モード
5. 日本での利用状況と今後の見通し
6. プライバシーの懸念と注意点
7. まとめ ― Muse Sparkは「買い」か?
1. Muse Sparkとは何か? 基本をおさらい
Muse Sparkは、Meta社の新しいAI研究部門「Meta Superintelligence Labs(MSL)」が開発した大規模言語モデルです。開発コードネームは「Avocado」。2026年4月8日に正式に発表されました。
MSLを率いるのは、データラベリング企業Scale AIの創業者で元最高経営責任者のAlexandr Wang氏。Metaは2025年6月にScale AIの49%の株式を約143億ドル(約2.1兆円)で取得し、Wang氏を初の最高AI責任者として迎え入れました。
Wang氏のチームは約9か月でAI基盤をゼロから再構築し、Muse Sparkを完成させています。Metaのザッカーバーグ最高経営責任者は、このモデルを「パーソナルスーパーインテリジェンス」への第一歩と位置づけています。
| 項目 | 内容 |
| 正式名称 | Muse Spark(Museシリーズ第1弾) |
| 開発元 | Meta Superintelligence Labs(MSL) |
| 発表日 | 2026年4月8日 |
| 入力形式 | テキスト・画像・音声 |
| 出力形式 | テキストのみ(現時点) |
| 公開形態 | プロプライエタリ(クローズド) |
| 利用料金 | 無料(Meta AIアプリ経由) |
| 利用可能場所 | Meta AIアプリ、meta.ai、今後Instagram/Facebook/WhatsApp/Messenger/AIグラスにも展開 |
2. なぜLlamaからMuse Sparkへ? 戦略転換の背景
Metaはこれまで、オープンソースのLlamaシリーズでAI業界に独自のポジションを築いてきました。しかし2025年4月にリリースしたLlama 4は「期待外れ」と酷評され、さらにベンチマークスコアの操作が発覚するという事態に陥りました。
その間にOpenAIとAnthropicの合計企業評価額は1兆ドルを超え、GoogleのGeminiも消費者市場で存在感を高めました。2026年初頭には中国勢(Zhipu AIのGLM-5、AlibabaのQwen 3.6 Plusなど)にもベンチマークで追い抜かれる状況に。
この危機感からザッカーバーグ氏はAI体制を抜本的に見直し、MSLを設立。Wang氏をはじめOpenAI、Anthropic、Googleなどの競合からも研究者を大量採用しました。2026年のAI関連設備投資は1,150億〜1,350億ドル(前年のほぼ2倍)という巨額を投じています。
注目ポイント:オープンソースからの転換
ザッカーバーグ氏はかつて「オープンソースAIこそが正しい道」と2,000字超のマニフェストを発表していました。しかしMuse Sparkは一転してクローズドモデルに。「将来のバージョンはオープンソース化を目指す」としていますが、具体的な時期は未定です。開発者コミュニティからは失望の声も上がっています。
3. ベンチマーク徹底比較 ― 強い分野・弱い分野
Muse Sparkの実力を、主要なベンチマークで他社モデルと比較してみましょう。比較対象は、OpenAIのGPT-5.4、AnthropicのClaude Opus 4.6、GoogleのGemini 3.1 Proです。
Muse Sparkが強い分野
| ベンチマーク | Muse Spark | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
| HealthBench Hard(医療) | 42.8% | 40.1% | - | 20.6% |
| Humanity's Last Exam(極限推論) | 50.2% | 43.9% | - | 48.4% |
| CharXiv Reasoning(図表理解) | 86.4 | 82.8 | - | 80.2 |
| MMMU-Pro(視覚理解) | 80.5% | - | - | 82.4% |
| トークン効率(出力トークン数) | 5,800万 | 1億2,000万 | 1億5,700万 | 5,700万 |
Muse Sparkが弱い分野
| ベンチマーク | Muse Spark | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
| GPQA Diamond(博士級推論) | 89.5% | 92.8% | 92.7% | 94.3% |
| Terminal-Bench(コーディング) | 59.0 | 75.1 | - | 68.5 |
| SWE-Bench Verified(ソフト開発) | 77.4 | - | 80.8 | 80.6 |
| ARC-AGI-2(抽象推論) | 42.5 | 76.1 | - | 76.5 |
| GDPval-AA(エージェント性能) | 1,427 | 1,676 | 1,606 | 1,320 |
※ 「-」はデータ未公表。Artificial Analysis Intelligence Indexの総合スコアでは、Muse Sparkは52点で、GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6に次ぐ4位。
筆者の見解
数字だけ見ると「善戦しているが突出はしていない」という印象です。ただし医療分野とトークン効率(=応答速度・運用コスト)では明確にトップ。コーディングや抽象推論のギャップは大きく、開発者向けAIとしてはまだ物足りません。Metaもこれを認めており、この分野への投資継続を明言しています。また、Llama 4でベンチマーク操作が発覚した前科があるため、独立した第三者検証の結果を待つ姿勢も大切です。
4. Muse Sparkの3つの動作モード
Muse Sparkには、タスクの複雑さに応じて切り替えられる3つのモードが用意されています。
Fastモード
日常的な質問や簡単なリクエストに素早く応答。従来のチャットAIに近い使用感です。
Thinkingモード
法的文書の分析、栄養情報の画像読み取りなど、より深い推論が必要なタスク向け。
Contemplatingモード
複数のサブエージェントが並列で推論する最上位モード。GoogleのGemini Deep ThinkやOpenAIのGPT Proに対抗。段階的に提供開始。
特にContemplatingモードのマルチエージェント構成は、他社にはないMuse Spark独自のアプローチです。例えば「家族でフロリダ旅行を計画して」と依頼すると、1つのエージェントが旅程を作成し、別のエージェントがオーランドとキーズを比較し、さらに別のエージェントが子ども向けアクティビティを検索する、という並列処理が行われます。
5. 日本での利用状況と今後の見通し
Metaは2025年11月25日に、AIアシスタント「Meta AI」の日本国内への段階的な提供を開始しています。Instagram、Facebook、Messenger、WhatsApp上で利用可能で、Webサイト「meta.ai」からもアクセスできます。
Muse Sparkは現在、Meta AIアプリとmeta.aiに搭載されており、今後数週間でWhatsApp、Instagram、Facebook、Messenger、さらにRay-Ban AIグラスにも展開される予定です。日本のユーザーも、Meta AIサービスのバックエンドが順次Muse Sparkに切り替わることで、自動的に恩恵を受けることになるでしょう。
日本市場での注目ポイント
Metaの幹部は2026年中にMeta AIグラスの日本発売を予定していることを明かしています。Muse Sparkがこれらのウェアラブル端末の頭脳となるため、日本のAR/AI市場においてもMetaの存在感が一気に高まる可能性があります。ただし、日本語でのMuse Sparkの性能がどの程度最適化されているかは、現時点では未検証です。
6. プライバシーの懸念と注意点
Muse Sparkを利用するには、FacebookまたはInstagramのMetaアカウントでのログインが必要です。Metaは個人情報がAIに使われるかどうかを明確にしていませんが、同社は一般的にユーザーの公開データをAI学習に活用しています。
特に「ショッピングモード」は、Instagram やThreadsでのユーザーの行動や興味関心データを活用してパーソナライズされた提案を行う機能であり、便利な反面、データ活用の範囲には注意が必要です。
注意: Metaのプライバシーポリシーは、AIシステムと共有されたデータの利用についてほとんど制限を設けていません。健康に関する質問をMuse Sparkに投げかける場合は、個人を特定できる情報を含めないよう気をつけましょう。
7. まとめ ― Muse Sparkは「推せる」か?
Muse Sparkは、Llama 4の失敗から約1年、Metaが威信をかけて送り出した「再起の一手」です。すべての分野でトップを取るモデルではありませんが、以下のような明確な強みを持っています。
強み: 医療分野で業界トップの精度、マルチモーダル(画像・図表理解)で2位クラス、トークン効率が圧倒的に優秀、完全無料で30億人以上のユーザー基盤に直接配信
弱み: コーディングとエージェント性能で他社に大きく後れ、抽象推論はほぼダブルスコアの差、クローズドモデルのためカスタマイズ不可、ベンチマーク信頼性に前科あり
Metaの戦略は明確で、「すべてのリーダーボードで1位になる必要はない。30億人のユーザーにとって十分に優秀であればいい」というものです。OpenAIやAnthropicが有料APIで開発者市場を狙うのに対し、MetaはSNSエコシステムに無料で組み込むことで、AI利用の裾野を一気に広げようとしています。
プログラマーやAI開発者にとってはまだ物足りないかもしれませんが、「InstagramやWhatsAppの中で無料で使えるAI」として見れば、一般ユーザーへのインパクトは非常に大きいと言えるでしょう。今後のMuse次世代モデルの進化にも注目です。
出典:Meta公式ブログ、CNBC、Fortune、TechCrunch、VentureBeat、Axios、Artificial Analysis、The Register、9to5Mac、日本経済新聞、MarkeZine 他(2026年4月8日〜9日取得)