• このエントリーをはてなブックマークに追加
業務で使えるオープンソース(169)「要約・抽出」
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

業務で使えるオープンソース(169)「要約・抽出」

2015-10-06 11:20

    今回のテーマは抽出、要約です。インターネットの登場以来、情報量は爆発的に増えています。そんな中で降り注いでくる日々の情報をすべて消化するのはもはや不可能ではないでしょうか。その結果として情報の取りこぼしが増えていきます。

    今回はそれを防ぐための施策およびオープンソース・ソフトウェアを紹介します。

    フィルタリング

    情報のフィルタリングはとても大事です。最も有名なところではスパムフィルタがあります。不要な情報(スパムメール)をはじくための仕組みです。基本的にこの仕組みの場合、シグナル/ノイズの2パターンしかありません。

    Gmailの場合、さらにソーシャルとプロモーション、重要などが自動で振り分けされるようになっています。フィルタリングは手作業で行うものと、ベイジアンフィルタのように学習型の2種類が存在します。

     
    この記事は有料です。記事を購読すると、続きをお読みいただけます。
    ニコニコポイントで購入

    続きを読みたい方は、ニコニコポイントで記事を購入できます。

    入会して購読

    この記事は過去記事の為、今入会しても読めません。ニコニコポイントでご購入下さい。

    コメントを書く
    コメントをするにはログインして下さい。