LGBT 知り合いに2人ほどいますが、極自然な感じで話したり呑みに行ったりしていました。
差別的な陰口を言う人もいますが、それは慣れていないだけであるとIT小僧は思っています。
また、YouTubeでご活躍の青木花音さんの動画、楽しく視聴させていただいております。
彼女の動画は、「ホッ」と一息つけるような感じで肩の力が抜ける番組ですのでオススメです。
https://www.youtube.com/channel/UCp1p09xUo_lTQONF73ptnBg
今回のIT小僧の時事放談は、
ジェンダーレス音声「Q」の可能性 AIは、男か?女か?
と題して「AI音声アシスタントの'声'について考えてみよう。
小難しい話をわかりやすく開設しながらブログにまとめました。
最後まで読んでいただけたら幸いです。
スポンサーリンク
音声認識デバイスは、女性の声だけ?
皆さんは、音声認識デバイスお使いですか?
「Alexa」 Amazone Echo
「OK Google」 Google Home/Assistant
「Hey Siri」 iPhone
AIスピーカーやスマートフォンのAIアシスタントとの会話は、「ウェイク・ワード(Wake Word)」を話しかけることから開始されます。
例えば て30分のタイマーをセットしたかったら
「Alexa 30分経ったら教えて」
で30分後にアラームで教えてくれるようになります。
ところでこれら「音声認識デバイス」は、初期設定で女性の声になっていることにお気づきでしょうか?
と思ってこのブログを書いていたらこんなニュースが飛び込んできました。
(CNN Business) 国連教育科学文化機関(ユネスコ)がこのほど発表した報告書で、アップルの「Siri」やアマゾンの「アレクサ」など初期設定で女性の声が使われているAIパーソナルアシスタントについて、性別に関する固定観念を定着させ、性差別的な発言や乱暴な発言を助長すると指摘した。
中略
ユーザーが性虐待的な言葉を浴びせた場合でも、AIアシスタントからは受動的で丁寧な反応が返ってくるとも指摘。「女性は従順で、不当な扱いも我慢するという偏見を助長させる」などと述べ、「感情も意識もない非人間のコンピューターコードであるSiriが、女性という異性で、男性の性的な誘いや嫌がらせに耐え、時には誘いもするという幻想を抱かせる」とした。
音声アシスタントはSiriやアレクサに加え、マイクロソフトの「コルタナ」、グーグルの「Googleアシスタント」の主要4製品すべてで、女性の声が初期設定として使われている。
IT小僧は、男(おじさん)なので あまり気にもとめなかったのですが、このブログを書こうと思ったきっかけは、ある人の一言でした。
「音声認識って 男の人の声はないんですか?」
確かにそのとおり 初期設定は、すべて女性の音声です。
※現在では(Amazone Echo以外)設定で変更できるようになってきました。
CNNで、初期設定で女性の声ということで非難されましたが、じゃ「男の声」ならいいの?
そうするとそれは、また問題になりそうです。
では、なぜ 音声デバイスの初期設定の声が女性だったのか?
女性の声と男性の声
音声アシスタントの「Siri」や「Cortana」、「Alexa」がすべて女性の声であるのは、
「相手が男性の声より女性の声のほうが、より積極的にやりとりする」
こうしたことを書くと
「気遣いができて役に立つAIアシスタントは女性の声」
「セキュリティロボットなどのマシンには男性の声を使って権威を示す」
というステレオタイプに分類さえがちですが、
HONDAのASIMOは、男性の声だった。
そんなことを言っていたら、電車の音声案内、ディズニーランドの音声ガイドも考えないといけなくなるので
この話は、こういうデータに基づいて決定されたらしいということでひとまずおいておきます。
そんな中、性差別に関してジェンダーレスなデジタル音声を開発している人たちがいました。
ジェンダーレス デジタル音声「Q」
男性でも女性でもない、中性的な音声アシスタントの「声」を開発しようとする人々は、
デンマークで開催されているLGBTの祭典を主催
「コペンハーゲン・プライド」
世界35ヵ国に展開する若者向けのメディアカンパニー「VICE Media」参加の企業で
「Virtu」
上記2つの団体(会社)が中心となっています。
開発の目的は、男性でも女性でもない、中性的な音声アシスタントの「声」の作成
その名称は、ジェンダーレスなデジタル音声
Q
と呼ばれています。
男性らしさと女性らしさ
声は、最終的には、データではなく 人が認識することなので曖昧さが伴う。
男性らしさと女性らしさの声は、声の高低(周波数)で
男性の声低く、女性の声は、高くなる。
これは、声道と呼ばれる器官の太さによるもので決定されています。
この中間、つまり周波数で図ると
145 Hz~175 Hzが、中間になりこれより低いと男性っぽく、高くなると女性っぽくなると人は認識するらしい。
中性的な声は、難しい
サウンドデザイナーのNis Nørgaard(ニース・ノアゴール)は、まず声を集めることから開始
「男性、女性、トランスジェンダー、ノンバイナリーなど20人以上の声を録音」
次に
「集めた声を合成、平均的な声を人工的に作り出す。」
しかしなかなか思い通りな声にならなかったそうです。
そこで中性的な声を持つ人(周波数 145 Hz~175 Hzの声)を選び出し、集めた声で周波数を変更して調整を加える。
こうして出来上がった4種類の声を、4,500人を越える欧州の人に聞いてもらいアンケートをとったところ
「ひとつの声が中性的に聞こえる」
として浮上してきました。
その結果を元に創り上げたのが、
ジェンダーレスなデジタル音声「Q」である。
こうして出来上がった声が、こちらです。
IT小僧的には、微妙なんですが、おそらく日本人の耳だからだと思います。
いや!違う
微妙な声だからこそ、男とか女とか限定されないということかも知れません。
まとめ
音声認識デバイスの声なんて初期値だけなんで気に食わなかったら切り替えれば済むこと
正直IT小僧もそう思っています。
しかし、増え続ける音声認識のデバイスで初期値の音声で疑問に持つ人もいるはずです。
ジェンダーレスなデジタル音声「Q」が実際に音声認識のデバイスに搭載されるかどうかは未定です。
しかし、この研究成果が発端となり、
ジェンダーレスなAI
という問題的になるかも知れません。
最後にCNNの記事から一部抜粋しました。
ユネスコのサニエ・ギルセル・コラット男女共同参画局長は「AI技術の性別がどのように決められるのか。そして誰がそれを決めているのか」にもっと注目すべきだと訴えた。
参考資料
https://www.wired.com/story/the-genderless-digital-voice-the-world-needs-right-now/
スポンサーリンク