ジェンダーレス音声「Q」の可能性　 AIは、男か？女か？

2019年5月29日 2019年5月28日

LGBT　知り合いに２人ほどいますが、極自然な感じで話したり呑みに行ったりしていました。
差別的な陰口を言う人もいますが、それは慣れていないだけであるとIT小僧は思っています。

また、YouTubeでご活躍の青木花音さんの動画、楽しく視聴させていただいております。
彼女の動画は、「ホッ」と一息つけるような感じで肩の力が抜ける番組ですのでオススメです。
https://www.youtube.com/channel/UCp1p09xUo_lTQONF73ptnBg

今回のIT小僧の時事放談は、
ジェンダーレス音声「Q」の可能性　 AIは、男か？女か？
と題して「AI音声アシスタントの'声'について考えてみよう。

小難しい話をわかりやすく開設しながらブログにまとめました。
最後まで読んでいただけたら幸いです。

音声認識デバイスは、女性の声だけ？

皆さんは、音声認識デバイスお使いですか？

「Alexa」　 Amazone Echo
「OK Google」　Google Home/Assistant
「Hey Siri」　iPhone　

AIスピーカーやスマートフォンのAIアシスタントとの会話は、「ウェイク・ワード(Wake Word)」を話しかけることから開始されます。
例えば　て30分のタイマーをセットしたかったら

「Alexa 30分経ったら教えて」

で30分後にアラームで教えてくれるようになります。

ところでこれら「音声認識デバイス」は、初期設定で女性の声になっていることにお気づきでしょうか？

と思ってこのブログを書いていたらこんなニュースが飛び込んできました。

（ＣＮＮＢｕｓｉｎｅｓｓ）国連教育科学文化機関（ユネスコ）がこのほど発表した報告書で、アップルの「Ｓｉｒｉ」やアマゾンの「アレクサ」など初期設定で女性の声が使われているＡＩパーソナルアシスタントについて、性別に関する固定観念を定着させ、性差別的な発言や乱暴な発言を助長すると指摘した。

中略

ユーザーが性虐待的な言葉を浴びせた場合でも、ＡＩアシスタントからは受動的で丁寧な反応が返ってくるとも指摘。「女性は従順で、不当な扱いも我慢するという偏見を助長させる」などと述べ、「感情も意識もない非人間のコンピューターコードであるＳｉｒｉが、女性という異性で、男性の性的な誘いや嫌がらせに耐え、時には誘いもするという幻想を抱かせる」とした。

音声アシスタントはＳｉｒｉやアレクサに加え、マイクロソフトの「コルタナ」、グーグルの「Ｇｏｏｇｌｅアシスタント」の主要４製品すべてで、女性の声が初期設定として使われている。

https://www.cnn.co.jp/tech/35137380.html

IT小僧は、男（おじさん）なので　あまり気にもとめなかったのですが、このブログを書こうと思ったきっかけは、ある人の一言でした。

「音声認識って　男の人の声はないんですか？」

確かにそのとおり　初期設定は、すべて女性の音声です。
※現在では（Amazone Echo以外）設定で変更できるようになってきました。

CNNで、初期設定で女性の声ということで非難されましたが、じゃ「男の声」ならいいの？

そうするとそれは、また問題になりそうです。

では、なぜ　音声デバイスの初期設定の声が女性だったのか？

[amazonjs asin="B07934NYFN" locale="JP" title="Echo Show (エコーショー) 第2世代 - スクリーン付きスマートスピーカー with Alexa、チャコール"]

女性の声と男性の声

音声アシスタントの「Siri」や「Cortana」、「Alexa」がすべて女性の声であるのは、

「相手が男性の声より女性の声のほうが、より積極的にやりとりする」

こうしたことを書くと

「気遣いができて役に立つAIアシスタントは女性の声」
「セキュリティロボットなどのマシンには男性の声を使って権威を示す」

というステレオタイプに分類さえがちですが、

HONDAのASIMOは、男性の声だった。

そんなことを言っていたら、電車の音声案内、ディズニーランドの音声ガイドも考えないといけなくなるので
この話は、こういうデータに基づいて決定されたらしいということでひとまずおいておきます。

そんな中、性差別に関してジェンダーレスなデジタル音声を開発している人たちがいました。

ジェンダーレスデジタル音声「Q」

男性でも女性でもない、中性的な音声アシスタントの「声」を開発しようとする人々は、

デンマークで開催されているLGBTの祭典を主催
「コペンハーゲン・プライド」

世界35ヵ国に展開する若者向けのメディアカンパニー「VICE Media」参加の企業で
「Virtu」

上記２つの団体（会社）が中心となっています。

開発の目的は、男性でも女性でもない、中性的な音声アシスタントの「声」の作成

その名称は、ジェンダーレスなデジタル音声

と呼ばれています。

男性らしさと女性らしさ

声は、最終的には、データではなく　人が認識することなので曖昧さが伴う。

男性らしさと女性らしさの声は、声の高低（周波数）で
男性の声低く、女性の声は、高くなる。
これは、声道と呼ばれる器官の太さによるもので決定されています。

この中間、つまり周波数で図ると
145 Hz～175 Hzが、中間になりこれより低いと男性っぽく、高くなると女性っぽくなると人は認識するらしい。

中性的な声は、難しい

サウンドデザイナーのNis Nørgaard（ニース・ノアゴール）は、まず声を集めることから開始

「男性、女性、トランスジェンダー、ノンバイナリーなど20人以上の声を録音」

次に

「集めた声を合成、平均的な声を人工的に作り出す。」

しかしなかなか思い通りな声にならなかったそうです。

そこで中性的な声を持つ人（周波数　145 Hz～175 Hzの声）を選び出し、集めた声で周波数を変更して調整を加える。

こうして出来上がった4種類の声を、4,500人を越える欧州の人に聞いてもらいアンケートをとったところ

「ひとつの声が中性的に聞こえる」

として浮上してきました。

その結果を元に創り上げたのが、
ジェンダーレスなデジタル音声「Q」である。
こうして出来上がった声が、こちらです。

IT小僧的には、微妙なんですが、おそらく日本人の耳だからだと思います。

いや！違う

微妙な声だからこそ、男とか女とか限定されないということかも知れません。

まとめ

音声認識デバイスの声なんて初期値だけなんで気に食わなかったら切り替えれば済むこと
正直IT小僧もそう思っています。

しかし、増え続ける音声認識のデバイスで初期値の音声で疑問に持つ人もいるはずです。

ジェンダーレスなデジタル音声「Q」が実際に音声認識のデバイスに搭載されるかどうかは未定です。
しかし、この研究成果が発端となり、
ジェンダーレスなAI
という問題的になるかも知れません。

最後にCNNの記事から一部抜粋しました。

ユネスコのサニエ・ギルセル・コラット男女共同参画局長は「ＡＩ技術の性別がどのように決められるのか。そして誰がそれを決めているのか」にもっと注目すべきだと訴えた。

https://www.cnn.co.jp/tech/35137380.html

参考資料
https://www.wired.com/story/the-genderless-digital-voice-the-world-needs-right-now/

-IT小僧の時事放談
-IT小僧の時事放談, LGBT

ぬりかべより:

2019年5月29日 10:47 AM

こんにちは。AIの声で思いついたのが1968年公開映画「2001年宇宙の旅」と1970年公開「地球爆破作戦」の２つです。前者のAIであるHAL9000も後者の防衛コンピュータ「コロッサス」の声も男性の声でした。一方は前者の続編「2010年宇宙の旅」の「SAL」は女性の声だったので、米映画では人類に挑戦するAIは男性の声、従っていくれるのは女性の声になってます。日本の場合、アニメ映画「地球へ」のイライザは女性の声だったので、日米ではちょっと感覚が違うのかも知れません。

返信
- habozou より:
  
  2019年6月1日 1:41 PM
  
  いつもコメントありがとうございます。
  「2001年宇宙の旅」、「2010年宇宙の旅」は、好きな映画です。
  たしかにおっしゃる通りで人間に反抗するのは、男性、協力するのは女性の声でした。
  スタートレックのコンピューターも女性の声だったし、言われてみるとあまり意識しなかったのですが、今回のニュースを調べていて、難しいなと思っています。
  
  返信
pod tym linkiem より:

2019年5月31日 7:18 PM

Currently it sounds like WordPress is the top blogging platform out there right
now. (from what I've read) Is that what you're using on your blog?

返信

comment コメントをキャンセル

: どうしたApple　iPhoneの「FaceTime」バグは、対応も内容もひどすぎるぞ

システムにバグは、つきものである。これは、どんなに厳重に検査しても消し去ることはできません。「そんないいかげんなの」コンピュータ屋の経験上「いいかげんではなく、不可能」と言っていいでしょう。 ...