• このエントリーをはてなブックマークに追加

記事 4件
  • 第29回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(最終回)

    2013-09-06 07:30  
    後藤和智の若者論と統計学っぽいブロマガ第29回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(最終回:テキストマイニング)この連載企画も最後となります。この連載企画の締めとして、テキストマイニングという手法について解説します。テキストマイニングとは、テキストデータを単語ごとなどに分け、それをもとにして統計解析を行う手法のことです。特に動詞や名詞などの品詞(形態素)ごとに分ける手法を形態素解析と言い、通常のテキストマイニングはこの形態素解析によって得られた手法を元に行うのが一般的です。この連載では、フリーの統計ソフト「R」を使って分析を行ってきましたが、形態素解析もRで可能です。用いるのはフリーの形態素解析ツール「MeCab」と、これをR上で動かせるようにするツール「RMeCab」です。MeCabとRMeCabはそれぞれ次のサイトから取得します。なお、前提としてRをインストー

    記事を読む»

  • 第21回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回)

    2013-06-05 19:00  
    後藤和智の若者論と統計学っぽいブロマガ第21回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門(第4回:間奏――ツール紹介)今回は、フリーの統計ソフト「R」による分析を行うに当たって、分析をより円滑にしてくれるツールを紹介します。1. R Commander(Rコマンダー)2003年5月から開発が進められている(RjpWiki「R史」http://www.okada.jp.org/RWiki/?R%BB%CB より)、最も伝統的なRの入力支援ツールです。CRANでパッケージとして提供されています。Rコマンダーを呼び出すためには、次のように入力します(呼び出せない場合は、「パッケージ」メニューの「パッケージのインストール」から「Rcmdr」を選んで、もう一度インストールしてください)。> library(Rcmdr)これでRコマンダーを呼び出すと次のような画面が現れます。Rコマ

    記事を読む»

  • 第13回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第2回

    2013-03-05 22:00  
    今回は、データの傾向を分析する方法として、対応分析(コレスポンデンス分析)という方法を紹介する。分析の一例として、ニコニコ静画の作品に使われたタグを分析することにより、作品の特徴を分けることとする。

    記事を読む»

  • 第9回:【科学・統計】レビュー系サイト・同人誌のための多変量解析入門/第1回

    2013-01-25 23:30  
    漫画や小説などをレビューしたサイトや同人誌、あるいは書籍はよく見かける。しかし、その多くは個々の作品の評価に終始し、評価の全体像が見られるものは少ない。そこでこのシリーズでは、多変量解析を通じて、レビューの全体像を示す手法を紹介していく。第1回は、分析のためのツールとして、フリーソフト「R」を紹介する。

    記事を読む»