※本ページはプロモーションが含まれています

外出先のWi-Fi接続であなたを守ります

IT小僧の時事放談

AppleのAI 学習お断りです 複数の大手ニュースサイトがクローラーブロックをしている

ライバル達のAIスマホが急速に成長しているのにiPhoneは、やっとAI iPhoneの発表をするところまでやってきました。
※年内に米国英語のベータ版から公開予定1

今回、発表される AI iPhoneですが、実際にAIが搭載されるのはまだ先になりそう。
現在、AppleのAI「Apple Intelligence」は、トレーニングの最中なのですが・・・

Gigazineからの記事です。

複数の大手ニュースサイトがAppleのパーソナルAI「Apple Intelligence」をトレーニングするために使用されるクローラーをブロックしていることが明らかに

生成AIのトレーニングに使用するコンテンツは、ボットを使ってウェブ上からスクレイピングすることがありますが、これは度々問題視されています。AppleもAIのトレーニングに使用するコンテンツをスクレイピングしているものの、複数のニュースサイトがこのクローラーをブロックしている実態が明らかになりました。

Many of the biggest websites opted out of Apple Intelligence training
https://9to5mac.com/2024/08/29/apple-intelligence-training-opt-outs/

Why top publishers are opting out of Apple Intelligence AI data scraping | iThinkDifferent
https://www.ithinkdiff.com/apple-intelligence-data-scraping-publishers/

Websites Increasingly Tell Apple and AI Companies to Stop Scraping - MacStories
https://www.macstories.net/linked/websites-increasingly-tell-apple-and-ai-companies-to-stop-scraping/

Top Media Outlets Block Apple’s AI Data Collection • iPhone in Canada Blog
https://www.iphoneincanada.ca/2024/08/29/news-outlets-block-apple-ai-data-collection/

Apple wants to scrape content for Apple Intelligence training — but few publishers have agreed terms to let it happen | iMore
https://www.imore.com/apple/apple-wants-to-scrape-content-for-apple-intelligence-training-but-few-publishers-have-agreed-terms-to-let-it-happen

Apple blocked from training Apple Intelligence on several publishing websites — here’s what we know | Tom's Guide
https://www.tomsguide.com/ai/apple-blocked-from-training-apple-intelligence-on-several-publishing-websites-heres-what-we-know

Websites opt out of Apple AI scraping, signaling 'conflict zone' | Cult of Mac
https://www.cultofmac.com/news/websites-opt-out-of-apple-ai-scraping

New York Times and more block Apple Intelligence training
https://appleinsider.com/articles/24/08/29/big-name-publishers-are-refusing-to-let-apple-intelligence-train-on-data

Apple's AI training faces backlash as major publishers opt out - PhoneArena
https://www.phonearena.com/news/apple-ai-training-publishers-opt-out_id162000

生成AIはウェブ上のコンテンツをスクレイピングしてトレーニングに利用しています。著作権で保護されたコンテンツもAIのトレーニングに利用しているため、この手法は度々問題視されてきました。

AppleのパーソナルAIであるApple Intelligenceもトレーニングのためにウェブ上のコンテンツをスクレイピングしていますが、コンテンツパブリッシャーはrobots.txtファイルに指示を記載することで、自身のコンテンツがスクレイピングされることを明示的にオプトアウト(ブロック)することが可能です。

Appleはこのオプトアウト機能「Applebot-Extended」を2024年5月に発表しており、Appleがウェブ上のコンテンツをスクレイピングするのに使用しているクローラーの「Applebot」に関する情報がまとめられている以下のページにも情報が記載されています。なお、Applebotは元々は音声アシスタントのSiriや検索機能のSpotlightをトレーニングするために利用されていたクローラーで、2015年に登場しました。Appleは近年、Apple IntelligenceをトレーニングするためにApplebotを再利用するようになっています。

About Applebot - Apple Support
https://support.apple.com/en-us/119829

このApplebotのオプトアウト機能を、FacebookやInstagramといったMetaの運営する大手SNSや、The New York TimesやThe Atlanticといった大手ニュースサイトが利用していることが明らかになりました。

Applebotをオプトアウトしているか否かは一般公開されているrobots.txtファイルをチェックすることで誰でも確認できます。海外メディアのWIREDが調査したところ、Facebook、Instagram、Craigslist、Tumblr、The New York Times、The Financial Times、The Atlantic、Vox Media、USA Today、Condé NastなどがApplebotをブロックしていることが明らかになりました。WIREDは「トラフィックの多いウェブサイトの約6~7%がApplebotをブロックしている」と報じています。

続きはこちらから👇

複数の大手ニュースサイトがAppleのパーソナルAI「Apple Intelligence」をトレーニングするために使用されるクローラーをブロックしていることが明らかに - GIGAZINE
https://gigazine.net/news/20240830-many-websites-opted-out-apple-intelligence-training/

AIの学習は、ネット上に掲載されている多くの情報を取り込んで学習させるわけですが、今回のニュースによると大手の海外メディアは、AppleのAIが自社の情報を読み込ませないようにブロックしているという内容です。

特に大手ニュースサイトの情報は重要でAIの学習に必須と言えるでしょう。
The New York Times、The Financial Times、The Atlantic、Vox Media、USA Todayがブロックしているとなると学習の制度が落ちることが懸念されます。

またSNSの情報も重要なのですが、Facebook、Instagramなどライバル企業のSNSは、当たり前ですがブロックしています。
大手SNSを運営しているMetaは、この点 AI学習には十分な情報を持っていることになります。
また、Googleは、世界中のサイト情報を持っているようなものですし、MicrosoftはWindowsというこれまたビジネスで大きな市場をもっています。

そうなるとiPhone、iPadという巨大なプラットフォームを持っていても肝心のAI学習が満足にできなければ ライバルとの差がますますおおきくなるという状況になるでしょう。

Appleは、そこをおカネで解決しようとしていたわけですが・・・
Appleがニュース記事で生成AIをトレーニングするためさまざまなメディアと5000万ドル以上の複数年契約について話し合ったことが発覚 - GIGAZINE

今回のニュースを見ると双方でなにか問題が生じたのでしょうか?

どんなに優れているハードウェアやソフトウェアがあっても 情報源がなかったら 厳しいことはあきらかです。

年内に米国英語のベータ版から公開予定の「Apple Intelligence」の習熟度はどうなるのか

続報があったら随時ご報告いたします。

-IT小僧の時事放談
-, , ,

Copyright© IT小僧の時事放談 , 2024 All Rights Reserved Powered by AFFINGER5.