【歌詞分析】「VOCALOID伝説入り」曲をテキストマイニング【やってみた】
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

【歌詞分析】「VOCALOID伝説入り」曲をテキストマイニング【やってみた】

2014-03-09 15:09
  • 1
  • 2
折角ミクさんの日なので、何か一つやってみようかと思いまして。
 既に去年の話になってしまったのだが、この動画をご存知でしょうか。

 この動画を見た時に、「この曲数だと歌詞分析できるかも…」と考えてしまったのがきっかけでした。歌詞分析といっても、「この曲の歌詞について詳しく見ていこう…」ではなく、「最近の曲ってどんな傾向があるんだろう?」といったことを調べていくものです。この手のもので有名なものは、(といっても明らかに社会学でしか有名ではないのですが、)見田宗介氏の『近代日本の心情の歴史』があったりします。これは、明治~昭和中期までの日本の流行歌を分析したものですね。
 ・・・という堅い説明はこれくらいにして内容に入りましょうか。

注:これはあくまでも興味本位で「やってみた」ものなので、「こんなものなのか~」程度に見ていただけるとうれしいです。また、分析結果に関するミスなどは全て著者に帰属するものです。

 今回対象にしたのは「VOCALOID伝説入り」と呼ばれるニコニコ動画で100万回再生を突破したVOCALOIDオリジナル曲(アレンジ・替え歌は除く)164曲(2014.2.14時点)です。
 また、今回分析する上で使用したソフト「KH Coder」はこちらからDLできます。
 http://khc.sourceforge.net/index.html

 具体的にはどのように行ったかを簡単に説明しておくと、まず対象となる曲の歌詞をテキストデータベース化し(ボカロPさん公式のものもしくはニコニコ大百科より引用)、KH Coderで単語を抽出します。その後、複合語をKH Coder付属の「茶筌」で検出したものを著者自身が1単語とするべきかどうか判断しています(たとえば「ふぁんくらぶ」でなく「んくらぶ」と検出したとすると流石に1単語ではないと考えられるので除外というように、ここは人の目を通す必要があります)。1単語と判断して単語は強制抽出に指定し、再び単語抽出の処理にかけます。

 というわけで、いきなりですが結果に入りましょう。下に、VOCALOID伝説入り曲における頻出語句ランキングと、共起ネットワーク(語句のつながりを図にしたもの)をお見せします。



 まず頻出語句ランキングを見ると、「今」「世界」「言う」が上位に来ていますね。「リンちゃん」の101回はオワタPの「リンちゃんなう!」からですから共起ネットワークには反映されていません。共起ネットワークの図は、「どの単語とどの単語が近い位置にあるか」ではなく「どの単語とどの単語が太い線で繋がっているか」を見ます。比較的強く結びついている部分はグループ化して色分けされています。
 で…ここからスパッと何か言えるといいのですが、比較対象も何もないのではどうしようもない…ので、対象となっている曲を年代別にわけてみましょう。KH Coderの機能を利用して、それぞれの年代の特徴語を見てみます。

 年代分類は<第1世代:~2009年上半期(56曲)><第2世代:2009年下半期~2011年上半期(57曲)><第3世代:2011年下半期~(51曲)>の三つです。2009年の分割点では、MegpoidやProject DIVAの発売。2011年の分割点ではそれほど強い出来事はありませんが、それぞれの年代に活躍したボカロPさんを見て行くと、第1世代にはryo(supercell)さん、第2世代にはwowakaさんとハチさん、第3世代にはじん(自然の敵P)さんやkemuさん、が、名を連ねています。
 これの読み方は様々にあると思われますが、わかりやすいよう表に色付けなどをして筆者の考えを述べて行こうと思います。
 特徴語の表を見てみると、第1世代は「歌う」「歌」など「歌うこと自体」に重心があり、第2世代は「言葉」「言う」など、「言葉や話すこと」に重心が移ったように見えます。また、第1世代や第2世代では「今」「今日」が特徴として入っているのに対して、第3世代では「明日」「前」などポジティブな単語が出ています(あくまでも単語だけで、それがポジティブに使われているかは別ですが)。また、「夢」「世界」という単語が第1世代と第3世代で登場しています。
 ここで、それぞれの年代における歌詞中の頻出語句ランキングを見てみます。


 こちらを見てみると、「言葉」「言う」は第2世代の特徴語というよりはむしろどの世代にも言えることだということが分かります。しかし、VOCALOIDの初期ほど「歌う」や「歌」など、「歌うこと自体」に対する単語が出てきていることが分かります。これは、初期にはVOCALOIDの調声技術が発展途上であった点や、VOCALOID自体がアイドルとして、1つのキャラクターとして歌詞の中に登場していたことが考えられるでしょう。また、後の時代になるほど「前」や「明日」、さらに第3世代では「未来」まで出てきます。現代に近づくほど、「ミク」の名の通り、「未来」に関心のある曲が増えたということでしょうか。
 また、「世界」はどの世代においても上位にいますが、「夢」は第2世代では上位30位からも姿を消しています(54位タイ)。こうなると一つ考えられるのは、VOCALOIDにおいて初期と現在では「夢」が持つ意味合いが変わってきているのではないかということです。そこで、第1世代と第3世代の語句の共起ネットワークを見てみましょう。上が<第1世代>で下が<第3世代>です。



 これらを見ると、第1世代では「夢」は「見る」「終わる」と繋がっており、第3世代では「見る」「明日」と繋がっています。また、その「明日」は「未来」とも繋がっていますね。ということは第1世代よりも第3世代では「夢」はポジティブな存在として扱われていると思われます。これがはっきり言えるか解明するには一つ一つの歌詞を考察する必要があります(それこそ、解釈が分かれるものです)ので、ここでは割愛させて頂こうと思います。

 以上を総合すると、
VOCALOIDの初期は「歌う」や「歌」など、「歌うこと自体」に対する単語が出てきていたが、現在はその傾向は無くなりつつある。
VOCALOID初期から現在に至るまで、相対的に未来志向が強まってきている。
と考えられます。

 もちろん、他の解釈や、もう少し深い分析と考察、また、この結果が何を意味するのかについてもこれから検証する必要があります。そちらに関してもまた機会があれば、書き込んでいきたいと思います。
 最後に、ここまで読んで下さった読者の皆様、ありがとうございました、そしてお疲れさまでした。
 VOCALOIDに関わった全ての方々に感謝を込めつつ。
広告
×
ボカロの傾向を語句のつながりから分析する、興味深い!
44ヶ月前
コメントを書く
コメントをするには、
ログインして下さい。