• このエントリーをはてなブックマークに追加

記事 2件
  • 第29回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(最終回)

    2013-09-06 07:30  
    後藤和智の若者論と統計学っぽいブロマガ第29回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(最終回:テキストマイニング)この連載企画も最後となります。この連載企画の締めとして、テキストマイニングという手法について解説します。テキストマイニングとは、テキストデータを単語ごとなどに分け、それをもとにして統計解析を行う手法のことです。特に動詞や名詞などの品詞(形態素)ごとに分ける手法を形態素解析と言い、通常のテキストマイニングはこの形態素解析によって得られた手法を元に行うのが一般的です。この連載では、フリーの統計ソフト「R」を使って分析を行ってきましたが、形態素解析もRで可能です。用いるのはフリーの形態素解析ツール「MeCab」と、これをR上で動かせるようにするツール「RMeCab」です。MeCabとRMeCabはそれぞれ次のサイトから取得します。なお、前提としてRをインストー

    記事を読む»

  • 第9回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回

    2013-01-25 23:30  
    漫画や小説などをレビューしたサイトや同人誌、あるいは書籍はよく見かける。しかし、その多くは個々の作品の評価に終始し、評価の全体像が見られるものは少ない。そこでこのシリーズでは、多変量解析を通じて、レビューの全体像を示す手法を紹介していく。第1回は、分析のためのツールとして、フリーソフト「R」を紹介する。

    記事を読む»