ブログ記事のテキストマイニングが始まる

この1年くらいからでしょうか?
ネット上のブログの記事や掲示板の内容をデータソースとしてテキストマイニングができるようになりました。

有料サービスで提供するものがあれば、簡易版なら無料もある。(gooブログ評判分析)
例)「ドラクエ」でブログ検索したものがこれ
http://blog.search.goo.ne.jp/wpa/rb/dispatch.rb?si=2&ik=%A5%C9%A5%E9%A5%AF%A5%A8&from=web

ブログ分析をすると、例えば下記のようなことがわかることがある。

■キャンペーンの効果測定
キャンペーン時はその商品やサービスに関する記事数が多くなるはず。
時系列で折れ線グラフなどで記事数を表示し、山がすぐにわかります。山が高いか低いかは、キャンペーンの投下量と合わせて見ていきデータをストックしてケースを集めるといいと思います。

■新商品の評判
開発者が想定しなかったことが意外に発見できる。
新製品の味が濃くておいしいぐらいの極めて簡単な文章ならカウントが可能。
必要であれば元データ(ブログ記事)をみることも可能。

■デスクリサーチのツールとして利用し商品・サービスの基礎情報を得る
新しい案件があればさっと調べて世間での評判をおさえることも可能、、、かも。

ところで、このようなテクノロジーは進化が早いのですが、最新版では、男女別に見ることも可能になるそうです。

仕組みとしては、
自社の提供するブログなら利用者のプロフィールを登録しているのでそれを利用。
他社のものはプロフィールが公開されていればそれをデータにできそうである。
面白いのが、「俺」なら男性、文末が「かしら」なら女性と判別するアルゴリズムを開発中で、それを自社のユーザーで的中率を検証中とのことである。

巷にデータは蔓延しており、集計も以前より比較的簡単にできるようになってきている。
リサーチ会社としては、気になるのは、クライアントの問題意識・課題をどう引き出し、それをどう整理するかであろうと痛感している。