男女の「かわいい」の違いをテクノロジーで考える

男女の「かわいい」の違いをテクノロジーで考える

SHARE

日本語は、ニュアンスの言葉だと言われています。同じ単語を使っていても、そこに載せる抑揚や感情によって、意味が幾重にも変わっていくからです。

たとえば、「かわいい」という言葉。これも、状況や場面、そして立場によって意味が大きく変わります。
今回は、「テキストマイニング」という技術を使って、男女における「かわいい」の使い方の違いを見てみます。

男女で違う?「かわいい」の定義

男性が言う「かわいい」と女性が言う「かわいい」では、ニュアンスや使い方がなんとなく違うと感じることはないでしょうか。

しかし、どんなふうに違うのかを説明しろと言われるとすごく難しい…。そんなふんわりと感じている男女間での「かわいい」の違いを今回は「テキストマイニング」という技術を使いながら探っていこうと思います。

「テキストマイニング」とは

「テキストマイニング」(text mining)とは、大量のテキストデータから「統計学」や「機械学習」を用いて、有益な情報を取り出す技術のことです。
具体的に言うと、たとえばある言葉が、どのようなときにどんな単語と一緒に使われているかなどを、世の中にある大量の文章データから集めて、傾向を調べたりすることができます。

今までこれらの作業は、大型のコンピュータを使わないとできなかったため、一部の専門家しか使えませんでしたが、パソコンの処理能力の向上や文章情報の電子化が進んだことで、さまざまな分野で用いられるようになった技術です。

最近では、病院でカルテや医者のメモ情報を分析したり、企業の人材育成や離職防止のために従業員のアンケートや面談履歴を分析する、といった場面で導入が進んでいるようです。

特にアンケートは、「はい・いいえ」で答える部分以外、たとえば、「その理由についてお書きください」とか「意見やご感想をお書きください」など、自由な文章で記載する部分の分析は、そのままでは難しいものがありました。

「テキスト・マイニング」は、曖昧な文章も分析できるため、そういった分野でも重宝されています。

「かわいい」を分析する方法

では、実際にどのように分析したかを説明しましょう。

  1. 「かわいい」「カワイイ」「可愛い」のいずれかを含むツイートを約1万件集める。
  2. 機械学習を使って男性によるツイートか女性によるツイートかを判別する。
  3. 男女の「かわいい」が含まれるツイートから、それぞれ特徴的なキーワードを取り出す。
  4. 男女の「かわいい」の違いは何かを考える。

注意したいのは、男女の違いは、あくまで機械学習上で判定しており、実際のジェンダーやセクシャリティの男女とは関係ありません。

テキストマイニングソフト「KH coder」

今回のテキストマイニングに使ったソフト「KH coder」は、立命館大学の樋󠄀口耕一准教授が開発したもので、プログラミングが出来ればだれでも使える、計量テキスト分析・テキストマイニングのフリーソフトウェアです。

「KH coder」では、あるキーワードと一緒に出現することが多い言葉や文章中に登場する言葉のグループ分けをすることができます。これによって、文章の特徴を探し出すことができます。

たとえば、「シンデレラ」の文章を「KH coder」で分析すると以下のような結果になります。キーワードを囲んでいる丸が大きければ大きいほど、出現頻度が高くなります。また、関連度が高いキーワード同士は線で結ばれています。

「シンデレラ」をKH coderで分析した結果

コンピュータの判断のみの集計・分析だけではなく、分析から除外したい言葉やより注目したい言葉を指定するなど、人間が決めたルールを踏まえた集計・分析もできます。

今回の分類では、「かわいい」「カワイイ」「可愛い」を含む文章の中で特徴的な言葉を抽出し、それぞれの言葉が他のどんな言葉と関連しているのかを調べる作業を「KH coder」で行いました。

「KH coder」は、以下のような手順でテキストを解析します。[1]

第一段階では、データを抽出し、分析者の恣意を加えないかたちで、集計・分析します。
第一段階は、完全にコンピュータが分析するので、この段階で自分の意図するデータを抜き出せれば良いですが、コンピュータが人間のように意味を理解することは(いまのところ)できないので、上手く分析結果が出なかった場合は、第二段階に進みます。

第二段階では、分析者がどのようにデータを解析したいかということ(コーディングルール)を指定して、データを分析します。こうすることにより、分析者が望むデータ解析が可能になります。
(これらとは別に、随時計量的分析をバックグランドでしています)。

特徴的なキーワードを取り出してみる

男性の「かわいい」と女性の「かわいい」からそれぞれ特徴的なキーワードを100語取り出した結果、以下のようになりました。

男性の「かわいい」から抽出した特徴語(KH coderを使用)
女性の「かわいい」から抽出した特徴語(KH coderを使用)

それぞれで特徴度高いTOP 10は、以下のようになりました。

それぞれの特徴語を見て、まず思ったのは女性のほうが男性よりも「かわいい」を使う場面も対象も圧倒的に幅広いということです。
特徴語TOP 10で男性は1位から順に「言う」「思う」「見る」「好き」というキーワードがランクインしており、男性の「かわいい」には自らの行動が伴っていると解釈できます。

一方、女性のランキングでは「ほんと」や「最高」「めちゃくちゃ」「本当に」など「かわいい」そのものを修飾しているであろうキーワードがランクインしています。
このことから、女性の「かわいい」にはさまざまなランクがあり、その適応範囲もかなり広いという解釈ができそうです。

また、女性のランキングには「ありがとう」や「RT」といったなにかしら相手がいる状況で使われやすいキーワードが入っています。もちろん、これらはテキストマイニングの結果なので実際にどのように使われているかまでは分からないですが、男性のランキングに入っているキーワードは相手がいなくても成立するものばかりです。

このようなことから、女性は男性と違って、コミュニケーションツールとして「かわいい」を使っているということが言えそうです。
確かに、私自身も相槌のように「うん、うん、かわいい〜」と発することが多々あるような気がするので、これについては女性の皆さんにはかなり賛同してもらえるのではないでしょうか。

さらに、今回抽出した特徴的なキーワード100個の品詞(動詞・名詞・感動詞・形容詞・形容動詞・副詞)の数を男女別にカウントしてみました。

その結果、動詞と感動詞について男女で大きな差が出ました。

まず、感動や応答、呼びかけを表す感動詞が女性は男性よりも多かったことからは、先ほど述べたように女性はコミュニケーションツールとして「かわいい」を使っているということが言えそうです。

一方で、動作や状態を表す動詞は主語や目的語などの名詞句をとる品詞です。ここから男性は女性よりも具体的な場面で「かわいい」を使うことが多いと考えられます。

結果からわかった男女の「かわいい」の違い

今回の分析結果から分かった男女の「かわいい」の違いは次の3つです。

  1. 男性の「かわいい」は女性よりも具体的。
  2. 女性の「かわいい」のほうが男性よりも適応範囲が広い。
  3. 女性はコミュニケーションツールとして「かわいい」を使う。

これまで男女でなんとなく違うと感じていた「かわいい」の使い方ですが、このように「テキスト・マイニング」を使って特徴を出してみることで、どんな違いがあるのかがよく見えます。

実は身近にある「テキストマイニング」

「テキストマイニング」や「機械学習」というと、「ビジネスで…ビッグデータを〜!」と難しくて大変なことのように感じる人もいるかもしれませんが、今回のような身近なのことにも利用することができます。

現在はテキストマイニングを使って、その文章にどんな感情が含まれているかを分析する研究なども進んでいます。このようにこれまでコンピュータで扱うのが難しかった言葉が分析できるようになると、たとえばSNSで「こんな感じのかわいいのものがほしい!」と曖昧に呟いても、前後のつぶやきから的確なものがリコメンドされるようになります。

人間と会話するようにコンピュータとコミュニケーションが取れる未来はそう遠くないのかもしれません。ロボットやAIに「機嫌悪いの?」「今日は元気そうだね!」などと話しかけられうようになる時代を想像するとワクワクします。

「テキストマイニング」が進めば、より住みよい世の中になる日が来るのかもしれません。

source:
[1]KH Coderの主な機能と分析手順