【速報】Meta「Muse Spark」とは？ChatGPTやGeminiとの違いをわかりやすく解説

2026年4月8日、Meta社（旧Facebook）がAI戦略を根本から覆す新モデル「Muse Spark」を発表しました。

これまでオープンソースのLlamaシリーズで知られてきたMetaが、なぜクローズドモデルに転換したのか？ ChatGPTやGemini、Claudeと比べて何が優れていて、何が足りないのか？そして日本のユーザーはいつ使えるのか？気になるポイントをすべてまとめました。

この記事の内容

1. Muse Sparkとは何か？基本をおさらい
2. なぜLlamaからMuse Sparkへ？戦略転換の背景
3. ベンチマーク徹底比較 ― 強い分野・弱い分野
4. Muse Sparkの3つの動作モード
5. 日本での利用状況と今後の見通し
6. プライバシーの懸念と注意点
7. まとめ ― Muse Sparkは「買い」か？

1. Muse Sparkとは何か？基本をおさらい

Muse Sparkは、Meta社の新しいAI研究部門「Meta Superintelligence Labs（MSL）」が開発した大規模言語モデルです。開発コードネームは「Avocado」。2026年4月8日に正式に発表されました。

MSLを率いるのは、データラベリング企業Scale AIの創業者で元最高経営責任者のAlexandr Wang氏。Metaは2025年6月にScale AIの49%の株式を約143億ドル（約2.1兆円）で取得し、Wang氏を初の最高AI責任者として迎え入れました。

Wang氏のチームは約9か月でAI基盤をゼロから再構築し、Muse Sparkを完成させています。Metaのザッカーバーグ最高経営責任者は、このモデルを「パーソナルスーパーインテリジェンス」への第一歩と位置づけています。

項目	内容
正式名称	Muse Spark（Museシリーズ第1弾）
開発元	Meta Superintelligence Labs（MSL）
発表日	2026年4月8日
入力形式	テキスト・画像・音声
出力形式	テキストのみ（現時点）
公開形態	プロプライエタリ（クローズド）
利用料金	無料（Meta AIアプリ経由）
利用可能場所	Meta AIアプリ、meta.ai、今後Instagram/Facebook/WhatsApp/Messenger/AIグラスにも展開

2. なぜLlamaからMuse Sparkへ？戦略転換の背景

Metaはこれまで、オープンソースのLlamaシリーズでAI業界に独自のポジションを築いてきました。しかし2025年4月にリリースしたLlama 4は「期待外れ」と酷評され、さらにベンチマークスコアの操作が発覚するという事態に陥りました。

その間にOpenAIとAnthropicの合計企業評価額は1兆ドルを超え、GoogleのGeminiも消費者市場で存在感を高めました。2026年初頭には中国勢（Zhipu AIのGLM-5、AlibabaのQwen 3.6 Plusなど）にもベンチマークで追い抜かれる状況に。

この危機感からザッカーバーグ氏はAI体制を抜本的に見直し、MSLを設立。Wang氏をはじめOpenAI、Anthropic、Googleなどの競合からも研究者を大量採用しました。2026年のAI関連設備投資は1,150億〜1,350億ドル（前年のほぼ2倍）という巨額を投じています。

注目ポイント：オープンソースからの転換

ザッカーバーグ氏はかつて「オープンソースAIこそが正しい道」と2,000字超のマニフェストを発表していました。しかしMuse Sparkは一転してクローズドモデルに。「将来のバージョンはオープンソース化を目指す」としていますが、具体的な時期は未定です。開発者コミュニティからは失望の声も上がっています。

3. ベンチマーク徹底比較 ― 強い分野・弱い分野

Muse Sparkの実力を、主要なベンチマークで他社モデルと比較してみましょう。比較対象は、OpenAIのGPT-5.4、AnthropicのClaude Opus 4.6、GoogleのGemini 3.1 Proです。

Muse Sparkが強い分野

ベンチマーク	Muse Spark	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
HealthBench Hard（医療）	42.8%	40.1%	-	20.6%
Humanity's Last Exam（極限推論）	50.2%	43.9%	-	48.4%
CharXiv Reasoning（図表理解）	86.4	82.8	-	80.2
MMMU-Pro（視覚理解）	80.5%	-	-	82.4%
トークン効率（出力トークン数）	5,800万	1億2,000万	1億5,700万	5,700万

Muse Sparkが弱い分野

ベンチマーク	Muse Spark	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
GPQA Diamond（博士級推論）	89.5%	92.8%	92.7%	94.3%
Terminal-Bench（コーディング）	59.0	75.1	-	68.5
SWE-Bench Verified（ソフト開発）	77.4	-	80.8	80.6
ARC-AGI-2（抽象推論）	42.5	76.1	-	76.5
GDPval-AA（エージェント性能）	1,427	1,676	1,606	1,320

※ 「-」はデータ未公表。Artificial Analysis Intelligence Indexの総合スコアでは、Muse Sparkは52点で、GPT-5.4、Gemini 3.1 Pro、Claude Opus 4.6に次ぐ4位。

筆者の見解

数字だけ見ると「善戦しているが突出はしていない」という印象です。ただし医療分野とトークン効率（＝応答速度・運用コスト）では明確にトップ。コーディングや抽象推論のギャップは大きく、開発者向けAIとしてはまだ物足りません。Metaもこれを認めており、この分野への投資継続を明言しています。また、Llama 4でベンチマーク操作が発覚した前科があるため、独立した第三者検証の結果を待つ姿勢も大切です。

4. Muse Sparkの3つの動作モード

Muse Sparkには、タスクの複雑さに応じて切り替えられる3つのモードが用意されています。

Fastモード

日常的な質問や簡単なリクエストに素早く応答。従来のチャットAIに近い使用感です。

Thinkingモード

法的文書の分析、栄養情報の画像読み取りなど、より深い推論が必要なタスク向け。

Contemplatingモード

複数のサブエージェントが並列で推論する最上位モード。GoogleのGemini Deep ThinkやOpenAIのGPT Proに対抗。段階的に提供開始。

特にContemplatingモードのマルチエージェント構成は、他社にはないMuse Spark独自のアプローチです。例えば「家族でフロリダ旅行を計画して」と依頼すると、1つのエージェントが旅程を作成し、別のエージェントがオーランドとキーズを比較し、さらに別のエージェントが子ども向けアクティビティを検索する、という並列処理が行われます。

5. 日本での利用状況と今後の見通し

Metaは2025年11月25日に、AIアシスタント「Meta AI」の日本国内への段階的な提供を開始しています。Instagram、Facebook、Messenger、WhatsApp上で利用可能で、Webサイト「meta.ai」からもアクセスできます。

Muse Sparkは現在、Meta AIアプリとmeta.aiに搭載されており、今後数週間でWhatsApp、Instagram、Facebook、Messenger、さらにRay-Ban AIグラスにも展開される予定です。日本のユーザーも、Meta AIサービスのバックエンドが順次Muse Sparkに切り替わることで、自動的に恩恵を受けることになるでしょう。

日本市場での注目ポイント

Metaの幹部は2026年中にMeta AIグラスの日本発売を予定していることを明かしています。Muse Sparkがこれらのウェアラブル端末の頭脳となるため、日本のAR/AI市場においてもMetaの存在感が一気に高まる可能性があります。ただし、日本語でのMuse Sparkの性能がどの程度最適化されているかは、現時点では未検証です。

6. プライバシーの懸念と注意点

Muse Sparkを利用するには、FacebookまたはInstagramのMetaアカウントでのログインが必要です。Metaは個人情報がAIに使われるかどうかを明確にしていませんが、同社は一般的にユーザーの公開データをAI学習に活用しています。

特に「ショッピングモード」は、Instagram やThreadsでのユーザーの行動や興味関心データを活用してパーソナライズされた提案を行う機能であり、便利な反面、データ活用の範囲には注意が必要です。

注意： Metaのプライバシーポリシーは、AIシステムと共有されたデータの利用についてほとんど制限を設けていません。健康に関する質問をMuse Sparkに投げかける場合は、個人を特定できる情報を含めないよう気をつけましょう。

7. まとめ ― Muse Sparkは「推せる」か？

Muse Sparkは、Llama 4の失敗から約1年、Metaが威信をかけて送り出した「再起の一手」です。すべての分野でトップを取るモデルではありませんが、以下のような明確な強みを持っています。

強み：医療分野で業界トップの精度、マルチモーダル（画像・図表理解）で2位クラス、トークン効率が圧倒的に優秀、完全無料で30億人以上のユーザー基盤に直接配信

弱み：コーディングとエージェント性能で他社に大きく後れ、抽象推論はほぼダブルスコアの差、クローズドモデルのためカスタマイズ不可、ベンチマーク信頼性に前科あり

Metaの戦略は明確で、「すべてのリーダーボードで1位になる必要はない。30億人のユーザーにとって十分に優秀であればいい」というものです。OpenAIやAnthropicが有料APIで開発者市場を狙うのに対し、MetaはSNSエコシステムに無料で組み込むことで、AI利用の裾野を一気に広げようとしています。

プログラマーやAI開発者にとってはまだ物足りないかもしれませんが、「InstagramやWhatsAppの中で無料で使えるAI」として見れば、一般ユーザーへのインパクトは非常に大きいと言えるでしょう。今後のMuse次世代モデルの進化にも注目です。

出典：Meta公式ブログ、CNBC、Fortune、TechCrunch、VentureBeat、Axios、Artificial Analysis、The Register、9to5Mac、日本経済新聞、MarkeZine 他（2026年4月8日〜9日取得）