• このエントリーをはてなブックマークに追加
ソーシャルメディアでの影響力を真剣に解析しようとしているサービスの裏側
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

ソーシャルメディアでの影響力を真剣に解析しようとしているサービスの裏側

2012-10-31 09:30
    「率直に言いますが、twitterのフォロワー数やFacebookの友だち数は、影響力とはまったく因果関係がありません。フォロワー数が多いからと言って、そのユーザーの影響力が必ずしも高いとは言えないと言う事です。フォロワー数や友達の数が、時には他の要素に比べて意図的に操作しやすいのも理由の一つです。(本文より)」

     

    ソーシャル・エンドースメントサービス「ソエンド(旧:つあど)」を提供するOvertex Group CEO 朝山 貴生氏より、ソーシャルメディア上の影響力測定について専門的見地から解説する記事を寄稿いただきました。前述の通り専門性の高い内容になっておりますが、ご興味のある方はぜひ御覧ください!

     

    増加する「影響力解析サービス」 

    欧米ではこの数年Klout,Kred,Peerindexなどといったサービスが成長しておりますが、最近では国内でも同様にSNSやソーシャルメディアにおける影響力の解析を謳うサービスが増えてきました。

     

    特に米国のKloutについては日本でも耳にする機会が増えたのではないかと思われます。

     

    通常影響力を解析するサービスは、各ユーザーが自分のデータを数値化したものを楽しむためだけのものだと思われるかもしれませんが、実際には欧米ではここ数年で生涯売上などに加えて顧客対応の優先順位付けを行う重要な指標としても採用され始めるほどの重要なデータ源となっています。

     

    当然ながら何を持って「SNSにおける影響力」とするかは、各サービスの独自のノウハウとして一般には公開されておりませんし、それらの信憑性や有効性についても、利用するの側の好みによって意見が分かれるのは仕方がないことです。

     

    各サービスにもそれぞれ利点・欠点がありますが、それとは別次元の話として、そのサービスが「果たして真剣に影響力を測定しようと努力しているのかどうか」という疑問を持つ方もいらっしゃるのではないでしょうか。

    それは、先述の「影響力」の定義や特質に対する好み以前の話で、実際には本当に「影響力を測定しています」と公に言うレベルに値するのかどうかという根本的な部分に関わってくるでしょう。

     

    今日は、影響力測定の仕組みを研究し開発してきた一人としまして、それらサービスが真剣に影響力を解析しようとしているかどうかを見分ける方法についてその根拠と共に順に説明してみたいと思います。

     

    サービスの真偽と信頼性を見分ける方法の前に、前置きとして影響力解析サービスの裏側について説明しておきたいと思います。

     

    3種類のデータ

    ユーザーの影響力を解析するに当たって、SNSから取得できるデータは大きく3つに分類することができます。

     

    ユーザー情報

    1つめはプロフィールやユーザー名などの「ユーザー情報」です。

     

    これら情報は次の2つに比べれば変動が少ないものであり、特にその中でもユーザーIDやユーザー名は各ユーザーを判別するために用いられる必須の情報です。さらには、ユーザー情報には下に説明する2つの要素の概数が含まれていることが多くあります。

     

    たとえばtwitterで言えば、ユーザー情報にフォロワーの数やフォローの数、ツイートの総数が含まれています。

     

     

    ユーザーアクティビティ

    2つめの「ユーザーアクティビティ」は、各ユーザーの投稿やtwitterのRT、Facebookのいいね!やシェアなど、ユーザーが起こすアクティビティ全般がこれにあたります。

     

    これは、各ユーザーのエンゲージメントはもちろんのこと、それら各ユーザーに向かって他のユーザーから集まってくるエンゲージメントも影響力を測るデータとして重要です。

     

     

    ソーシャルグラフ

    3つめが、各ユーザーのフォローやフォロワー、友だちと言ったいわゆる人間関係(ユーザー関係?)を表す「ソーシャルグラフ」です。

     

    twitterで言えばフォローやフォロワー、Facebookで言えば友だちやフィード購読者とのつながりです。

    これは、単に誰が誰にフォローされているのかを見る、というわけではなく、各ユーザーの人間関係を影響力の指標の一つとして取り入れるための要素となります。

     

    また、解析したいユーザーに向かっての他のユーザーからのエンゲージメントを解析する際にも必要となってきます。

     

    固定要素、変動要素そして流動要素

    次に、これら3種類のデータを変化の特徴から見直してみますと以下のように再分類することができます。

     

    固定要素のユーザー情報

    ユーザー情報は3つの内で最も変化が少ない要素です。

     

    プロフィール情報やそこで合算されて取得出来るフォロワー数といった数値も、たとえ日々変動することがあっても、影響力を測定するという目的においては実はそこまで重要な要素ではありません。

     

    ですので実際には「ユーザー情報」が固定された情報であるとは言いがたいのですが、解析のために日々最新の情報を取得しておかなければならないという訳ではありませんので、説明の都合上ここでは固定要素であるとしておきます。

     

    変動要素のソーシャルグラフ

    ソーシャルグラフの情報は、ユーザー情報に比べれば日々変化していると言えます。

     

    基本的には、現時点より以前の状態を元にして、そこからの変動を起こすためにこれは変動要素であると言えます。

     

    たとえば、SNSでは友だちを新しく承認したり、フォローを外したりという行為が日々起こるからです。

    この変動要素も影響力の測定に当たっては重要な指標となってきますが、これも解析のためにすべてのフォローや友だちリストを最新に保たなければならいというわけではありません。

     

     

    流動要素のアクティビティ

    問題は最後のアクティビティデータです。

     

    ユーザーによっては全くツイートしない日もあれば、突然彗星のように現れたユーザーのツイートが莫大な反響を呼ぶこともあり、それらを解析するためにあたっては、以前のデータを前提としないままに日々押し寄せてくる情報を常に監視せねば成りません。

     

    ですので、このアクティビティは流動要素であると言えます。そして、やっかいなことにこの流動要素が影響力測定において最も重要なデータなのです。

     

     

    データ取得の難易度

    次に、上記3種類のデータの取得における難易度を比較するとこのようになります。

     

    ユーザー情報<ソーシャルグラフ<ユーザーアクティビティ

     

    基本、取得の難易度は取得するデータの量に比例します。

     

     

    最も取得が簡単なユーザー情報

    ユーザー情報は、各サービスでたいてい1回のAPIコールで完結するようにできています。

     

    たとえば、10万人分のデータを取得したければ文字通り10万回アクセスすれば良いわけです。また、固定要素であるユーザー情報は、影響力測定においてはそこまでの頻度で再取得する必要もありません。

     

    ただ、サービスで表示されている自分のプロフィール文が古かったりすると、更新して下さいというリクエストが結構来ますので、エンドユーザーさんはその点を気にされる方が多いようです。

     

     

    取得が困難なソーシャルグラフ

    先述の通り、twitterでいうフォロワー数のように、ソーシャルグラフに関するデータのまとめや概数はユーザー情報の一部として取得できることが多くなっています。

     

    しかし、各ユーザーのフォロワー全部のユーザー情報を取りたいとなると、取得すべき情報は一気に激増してしまいます。たとえば、twitterで10万人の先にそれぞれ平均50人のフォロワーがいるとすれば、延べフォロワー数は500万となります。

     

    このようなデータを取得する際には、実際には1回のアクセスで一定量のデータを取得できるようになっている場合が多いのですが、それでも元になる解析対象のユーザー数からの倍々ゲームでアクセス回数(結果APIコール数)の桁数が一気に増えてしまいます。

     

    更に、変動要素であるソーシャルグラフは、一定の頻度で再度取得して更新する必要があります。

    算出する影響力の信頼性を高めようとすればするほど、その頻度を上げていく必要があり、その分かけ算で取得回数が倍増してしまうと言うわけです。

     

     

    数が膨大で取得が更に困難なアクティビティ

    もし、合計500万人のユーザーを解析していて、各ユーザーが平均5回投稿しているとすれば、それだけで2,500万の投稿を取得せねば成りません。

     

    たいていの場合、1回のアクセスでこれも一定数のデータを取得できるようになっていることがのですが、これも同様にユーザー情報取得から比べるとアクセス回数(結果APIコール数)の桁数がいくつも増えてしまいます。

     

    さらには、SNSによっては各投稿に対する他のユーザーからのエンゲージメントを取得するには、別途それら主語となるユーザーを主体としてAPIを再びコールする必要も出てきます。

    もし、これらすべてのアクティビティを解析対象とするのであれば、そのデータ数は膨大になってしまうと言う訳です。

     

    しかもやっかいなことに、このアクティビティはいくらでも「間引いて取得する」ことによってごまかすことはできるのですが、そこを省略すればするほど算出される影響力の信頼性が落ちてしまったり、突発的に起こった反響を見逃したりしてしまいます。

     

    最も重要なアクティビティが、最も取得するのがやっかいであり、そこが影響力測定サービス構築において頭痛の種となるわけです。

     

    ここまで読んで頂ければ、先ほどの比較をこう書き直しても大げさではないとおわかり頂けるでしょう。

     

    ユーザー情報<<<<<ソーシャルグラフ<<<<<ユーザーアクティビティ

     

     

    立ちはだかる各種制限

    さて、データ取得の難易度は取得するデータの量に比例すると書きましたが、その大きな原因が各SNSが設定する利用制限にあります。

     

    各サービスは、1時間当たりにAPIにアクセスできる回数などの技術的な制約を定めています。

     

    規制緩和申請を出したりすることによって、その制限を緩和することもできますが、それでもすべてのデータを取得しようと思えばいとも簡単に限界に達してしまいます。

     

    twitterなどは、2011年2月の時点で緩和申請の受け付けを終了し、データの販売を一定数のサードパーティーに制限して許可するように方針を変えてしまいました。それまでに「ホワイトリスト」に登録されたIPアドレスの在庫を持っていない場合は、通常の制限に従ってアクセスするしかなく、とうてい数十万人のデータを取得するためのアクセス数を確保することは不可能です。

     

    ですので、まともな影響力を解析するためにはこれら制限を乗り越えなければ成りません。

     

    先刻のようにtwitterからあらかじめ全データにアクセスする権限を与えられている企業は別として、もし全データについてのアクセスが必要であれば、FirehoseというストリーミングAPIへの接続権をtwitterに対して年間何億円という金額を払ってその権利を手に入れなければ成りません。

     

    実際に日本でその権利を買っている企業はNTT DocomoとYahoo! Japanぐらいしかありません。

    twitterでは無料で使えるストリーミングAPIもありますが、ツイートが間引きされているので今回の目的ではほとんど使い物にならないのです。

     

     

    必要となるリソースへの投資

    それらSNSが設定する制限を資金力やコネでたとえ乗り越えたとしても、次に立ちはだかるのが必要となる技術的なリソースの問題です。

     

    理想論から言えば、最大限のデータを取得すれば良いのですが、それらリソースの制限が理由で取得するデータに優先順位を付けざるを得ないのです。

     

    解析する対象の数にもよりますが、単純に100万人を解析するのであればまずそこでデータ数が100万となり、それだけではたいしたことがないのですが、そのユーザーの全アクティビティともなれば、すべてを合わせて下手をすれば簡単に億単位というデータを保存することとなります。

     

    そうなれば、たとえ全データに接続する権利を持っていたとしても、各SNSに接続してデータを取得するためのサーバーだけではなく、そのデータを保存したり、その莫大なデータを解析するためのサーバーも多数必要となり、ある程度まとまった設備投資が必要となります。

    必要なときに必要なだけの保存や計算のリソースが手に入るクラウド時代となった今でも、この環境を実現するにはかなりの投資が必要となるのです。

     

    ましてやほとんどの影響力計測サービスは基本的に無料版がメインで有り、投資対象としては魅力的ではありません。

     

    そこでたいていの場合、ユーザーや情報を絞り込んでデータを取得するという結論に至るわけですが、その結果解析サービスとしては精度が低くなり、実際にはショボくて使い物にならないものができあがってしまうことも多々あるわけです。

     

     

    認証制によるクローズドかそれともオープンか

    基本twitterはオープンが前提でツイートをほとんど取得することができますが、Facebookでは友だち関係に限定されたクローズドな投稿も数多く存在しています。

     

    いずれにせよ、ユーザーの認証なしでは、どのSNSでもすべてのデータを取得することは不可能です。

    言い返せば、ユーザーの認証を取れば様々なデータが取りやすくなり、より正確な影響力が計測できるとも言えます。

     

    しかし、その認証を取っていればより解析をまともにしているのかと言えばそうでもないのです。

    先ほどリソースの面から説明しましたが、ちゃんと解析しようとしているサービスは、認証なしにオープンな情報からも常に解析を行っており、あくまでも認証は別の目的で使用しています。

    その目的は以下の2つです。

     

    • 個人(人間ということです)と、複数のSNSアカウントを紐付けて総合的な影響力を算出したい。
    • オープンな情報からだけでは足りない、更に掘り下げたデータを取得して解析したい。

     

    ですので、ここで影響力測定サービスの品質として大きな差が出るのは、「認証をしているかどうか」ではなく、「認証をしない状態でもデータを取得して解析しているかどうか」なのです。

     

    もし、認証を行ったユーザーのみの影響力を掲示しているとすれば、たいていの場合そのサービスは非常に限られた分母を元に影響力を計算している、もしくは最悪の場合ユーザー間の比較を行うことなくユーザー情報を加工しただけで影響力値を算出していることになり、その信頼性は必然的に低くなるでしょう。

     

    その場合、認証済みのユーザーを数十万以上抱えているならまだしも、そうでなければ影響力として掲示されている数値はほぼ役に立ちません。

     

     

    影響力測定サービスのレベル

    以上のことを踏まえて、影響力測定サービスをにわかなものから理想的なものまで独自にレベル分けをしてみました。

     

     

    この表の列は解析対象として利用しているデータの種類、行は提供形態を表しています。

     

    レベル1: 登録ユーザー情報からのみ解析するクローズド型

    これは、ユーザーの登録を前提としてその認証を取り、かつそのユーザー情報からのみ影響力を解析するというものです。

     

    しかし、ユーザー情報には単にアカウントの年齢やフォロワー数、フォロー数、友達の数などの集計数しか含まれておらず、そのようなデータだけからまともな影響力が解析できるわけがありません。

    影響力を算出するために、認証済みの登録ユーザー以外のオープンな情報から一般的なユーザーのサンプリングを行っているかどうかにかかわらず、ユーザー情報からのみ算出された影響力数値は実用には全く役に立たないレベルです。

     

    これは、最終的には数値には根拠がないものの、算出自体にエンターメント性を持った診断サービスと同じですね。

     

    通常であれば、このレベルであれば実はユーザー認証も必要ありませんので、認証を取る目的としては先述の通りSNSをまたいでユーザー情報と個人を紐付けると言う事と、将来のデータ取得の幅を拡げるという事が挙げられますが、もっと根本的な目的として解析の対象とするユーザーを頭を使わずに絞り込みたいという事が挙げられます。

     

    その場合は自分たちで条件を決めて対象となるユーザーを絞り込まずとも、登録してきたユーザーの情報だけを使って計算した通知を表示すれば良いのですから。

     

     

    レベル2a: アクティビティを解析するクローズド型

    次に、レベル1からの分かれ道の一つとしてユーザーのアクティビティを解析対象に追加するというステップがあります。

     

    なぜなら、各ユーザーのアクティビティを解析対象に追加すると、レベル1から比べ格段に影響力値の信頼性が一気に上がるからです。

     

    ただし、全アクティビティを保存して解析することは並大抵のことではありませんので、ここでどのようなデータをどこまで解析するか、またどの期間まで保存するかといったところに、センスと技術力が必要とされてきます。実際にこの同じレベル2内であっても上と下の高低差は大きく、単に各ユーザーの投稿データとそこに集計されたRTやいいね!といった概算データを取って解析するものから、各ユーザーに向けて発生しているアクティビティまでを解析するものまで、リソースと開発工数、さじ加減のセンスと解析の技術力によって分析される影響力値にもかなりの幅が出てしまいます。

     

    ただし、それでもレベル1よりは「格段にましである」、ということです。

     

    ちなみに、上で説明したデータ取得の難易度ではソーシャルグラフよりも上であるにもかかわらず、それでも優先してこのアクティビティを取得せねばならないのには理由があります。

     

    解析にソーシャルグラフの要素を取り入れたとしても、先にユーザーのアクティビティのデータがなければ影響力を計測するという目的の上では余り役に立たないからです。

     

    演出上の理由から、「この人はこんな人ともつながっています」というエンターテイメント的なコンテンツを提供したいのであれば話は別ですが。

     

     

    レベル2b: 解析対象を広げてユーザー情報のみを解析するオープン型

    次は、レベル1からの2つめのオプションとして、サービスをオープン化して解析対象を広げるというステップがあります。

     

    しかし、たとえば日本人tiwtterユーザー全部を対象とするとしても、実に何千万人もの解析を行わなければなりません。

     

    そこで、それを回避する方法としては、ある程度活動があるユーザーに絞り込んであらかじめ解析しておいて、それ以外のユーザーは希望者をその都度解析するという手法がありますが、リソースをケチると多くのユーザーには「データなし」となり、サービスのエンターテイメント性は大きく下がってしまいます。

     

    いずれにせよ、このオプションでは解析対象の幅は広がるものの、解析できるデータ自体に信頼性に欠けるので、提供する幅は広がるものの結果として算出される影響力値には魅力が感じられません。

     

    ですので、2bはあくまでもレベル3へ移行するための経過点と見て良いでしょう。

     

     

    レベル2c:アクティビティとソーシャルグラフを解析するクローズド型

    実際には、レベル2aからクローズドのままでソーシャルグラフの概念を取り入れようとすると矛盾が発生します。

     

    レベル2aの説明でも書きましたが、コンテンツの演出上ユーザーのつながりを見せるためだけの目的であればまだしも、影響力の指標としていわゆる「ソーシャル人脈」の概念を取り入れようとすれば、結果それらユーザーがサービスで登録を行っていなくても解析する必要があるため、必然的に最低限一部はオープン型のレベル4に移行せざるを得ないからです。

     

    ですので、レベル2cにはレベル4への経過点として以外は余り意味がありません。

     

    レベル3: アクティビティを解析するオープン型

    次に、アクティビティを解析するという要素と、オープン型でマスユーザーが利用できるという要素を両立させたものがレベル3です。

     

    やっとここで統計的にもサービス的にも影響力として信頼性のおけるレベルに達してきます。ですので、このレベル3からを「影響力を真剣に解析しようとしている」の基準としたいと思います。

     

    レベル4: ソーシャルグラフを取り入れてアクティビティを解析するオープン型

     

    そして最後は、各ユーザーの人間関係をも取り入れて、そのアクティビティから影響力を解析するレベル4です。

     

    ここまで来れば、好みの問題はさておいて実用に耐える立派な影響力が算出できると言えるでしょう。

    まさに固定要素であるユーザー情報を利用して、変動要素であるソーシャルグラフから変動的な影響力を算出し、流動要素である日々激しく変化するアクティビティから流動的な影響力を加味して最終的な総合影響力を算出できるというわけです。

     

     

    更に影響力測定を多元化する要素「時間」

    ここまでで全く触れていないままでいた、且つそして影響力解析にとって必要不可欠な要素がもう一つあります。

     

    それが「時間」という要素です。そしてその「時間」という要素にも3つのポイントが存在します。

     

    1つ目はまず、影響力を算出するにあたってどの時間軸で区切って計測するのかということです。果たして毎日計測するのか、過去1週間で区切るのか、過去1ヶ月で区切るのか。

     

    次に、2つ目は計測頻度です。毎日計測するのか、毎週するのか、毎月するのか。

     

    そして最後に3つ目が更に事態を複雑化させる「過去の計測結果を記録しておき、そこからの変動を考慮するのか」という点です。

     

    この3つのポイントにおける設定の組み合わせは無限に存在し、特に3つめを取り入れることによって、またここでも保存して解析対象とするデータ量も倍々ゲームで増えてしまうと言う訳です。

     

    この「時間」要素の設定においても、サービスを作る側のさじ加減とセンスが問われるのです。

    そしてそれが失敗すれば、影響力の信頼性とともに、ユーザーに対してのエンターテイメント性も大きく損なってしまいます。

     

    影響力を真剣に解析しようとしているサービスの見分け方

    さて、ここに来てようやく「影響力を真剣に測定しようとしているサービス」の見分け方について説明したいと思います。

     

    レベル3以上を見分ける

    先に説明しました通り、まずは最低基準となるレベル3の境界線を上回っているかを見分ける必要があります。

    ここで注目すべきポイントはたった2つです。

     

    • 「オープン型であること」
    • 「アクティビティを解析していること」

     

    この2要素がそろえば、結果のスコアの信憑性は別として、真剣に影響力を測定しようとしているレベル3を達成していると言えるでしょう。

     

    オープン型であることを見分ける

    まず、サービスがオープン型であることを見分けるかどうかは簡単です。

     

    単にユーザー登録をしていないユーザーについても影響力が測定されて公開されているかを見れば良いのです。

    クローズ型であっても、一定のユーザーを分母としてサンプリングしていることもあるでしょうが、登録ユーザーのみに影響力を公開している場合はほぼレベル1もしくは2と見て間違いないでしょう。

     

     

    アクティビティを解析していることを見分ける

    次に、アクティビティを解析せずユーザー情報だけから影響力を解析している場合は、影響力の上下関係がほぼtwitterのフォロワー数のそれと連動していたりします。

     

    ですから、その場合は合計ツイート数や普段のツイート数が同じぐらいであるにもかかわらず、一方はフォロワー数が多いもののリプライやRTなどされていないユーザー、もう一方はフォロワー数が少ないもののリプライやRTがされているユーザーの2つを用意してその影響力値を比べてみればよいのです。

     

    どのツイートにも反響がないのにもかかわらず、前者の方が影響力が高ければ、そのサービスは実際のアクティビティは考慮せず、ユーザー情報空のみ影響力を算出しようとしていることになります。

     

    もし、同じようなユーザーにフォローされており、同時期に開設され、フォロワーではなくフォロー数がほぼおなじ2つのアカウントを用意出来れば、この見分け方の精度は更に高くなります。

     

    また、登録制のクローズドなサービスにもかかわらず、サービスに登録した瞬間に影響力が算出される場合は、ユーザー情報だけから影響力という名の数字を計算していることにほぼ間違いありません。

    なぜなら、各SNSに接続してユーザーのアクティビティを取得して、解析を完了するまでには最低でも数秒以上はかかってしまうからです。

    例外としてはレベル2bのサービスであると言う事が考えられますが、そうであれば登録前から一定のデータを掲示する方がサービスの口コミ効果的には高いので、すでにレベル3になっているはずです。

     

     

    いわゆるランキングコンテンツから見分ける

    もし、影響力計測サービスが上位ユーザーの影響力値のランキングを公開している場合は、そこにいわゆる「業界の常連」ばかりが並んでいるかどうかを見てみてください。

     

    もし、いわゆる常連ばかりが並んでいて、意外性のあるユーザーがほとんどいない場合は、アクティビティを考慮していないレベル1,2bであるか、もしくはクローズドのレベル1、2aである可能性が高くなります。

    なぜなら、オープン型でかつユーザーのアクティビティを考慮しているとすれば、通常あなたが知らないようなユーザーが必ずランキングに入っているはずだからです。

     

    影響力値はもうご存じの通り生ものだからです。

     

     

    レベル3以上であればよしとしましょう

    この見分け方で、レベル3以上であることが判別出来れば、「影響力を真剣に解析しようとしている」として良いでしょう。

     

     

    サービスの信頼性を確かめる方法

    さて、これ以降はここまでに説明してきた「真剣に解析しようとしているかどうか」よりは先の話です。

    次は、算出されている影響力値が「信用出来る値として利用出来るのかどうか」を判断する方法について説明します。

     

     

    偏差や分布の要素を取り入れているかを見る

    もし、算出される影響力値が、周りのユーザーと比較せずにそのユーザーから取得した数値だけで算出されている場合は、いろいろと最終の解析結果に不整合が出てきます。

     

    その場合は、変な影響力値に多数のユーザーの値が集中したり、2ユーザーの影響力値の比較が全く意味のないものになったりしてしまいます。そういった偏差や分布の要素を取り入れていないサービスでは、上位ユーザーでもスコアの数値が妙に低かったりします。

     

    それら要素を取り入れているサービスでは、複数のユーザーを比較していけば自然と影響力値の差が分かるのに対して、そうでないサービスは単にざっと数値を出しているだけですので、その矛盾がすぐに露呈してしまいます。

     

    ちなみに、この要素を取り入れない理由は、解析のアルゴリズムを考える手間が減るのと、なによりも計算のためのリソースがかなり少なくて済むということです。偏差や分布の要素を取り入れて解析するには、一定数のユーザー数からサンプリングを行って、さらに全ユーザーの影響力値を計算するというとても準備に手間がかかるプロセスを経なければならないからです。

     

    サービス品質の面からも、そしてユーザーを楽しませるというエンターテイメント性の面からも、このプロセスを経ると言う事は大事なことなのです。

     

     

    twitterのフォロワー数と影響力値の相関関係を見る

    率直に言いますが、twitterのフォロワー数やFacebookの友だち数は、影響力とはまったく因果関係がありません。

     

    フォロワー数が多いからと言って、そのユーザーの影響力が必ずしも高いとは言えないと言う事です。時には、フォロワー数や友達の数も他の要素に比べて意図的に操作しやすいのも理由の一つです。

     

    ですので、「なんで私よりフォロワー数の少ないあの人の方が影響力が高いの?」という声が聞こえてこない場合は、逆に算出されている影響力値の信頼性が低い証拠です。

     

    フォロワー数と影響力値が常に比例していない、これが結構重要なポイントとなります。

     

     

    明確な上下関係を比べる

    一つの要素をのぞいて、全く同じ、もしくはほぼ同じアカウントがあるとすれば、単純にその一つの要素が影響力を測定するにあたって及ぼす影響が把握出来るというわけです。

     

    もし、明らかに上であるべきユーザーの影響力値が、下であるべきユーザーの影響力値を下回っていれば、なにか測定方法がおかしいか、もしくはまったくアクティビティを考慮していないということになります。

     

     

    影響力変動の記録の有無を見る

    先述の通り、影響力の変動を記録している、記録していないではサービスを構築するインフラの規模においてかなりの差があります。

     

    もし、影響力の変動を記録していて、過去の推移を見られるようになっているサービスであれば、その推移を影響力算出に加味しているかどうかは別にしてでも、記録していないサービスよりは一定のインフラ投資をしており、そのサービス体制にも信頼がおけると言えるでしょう。

     

     

    影響力の変動を見る

    算出方法にもよるのですが、影響力値は先述の変動要素や流動要素によって算出されてしかるべきであり、算出する度に上がり下がりして当たり前のものなのです。

     

    ですので、変動が全くないものや、フォロワー数に応じて上がりっぱなしのサービスは、全くといって信頼が置けないと言って良いでしょう。

     

    しかし、レベル1や2のサービスの場合は影響力が変動していても注意が必要です。小さい分母を元に影響力を解析してしまったりしている場合は、ユーザー数が増えて再解析される度に、周りのデータにつられて本人のアクティビティとは関係なく影響力値が増減してしまうからです。そんな場合は、自分の影響力値が気になるユーザーさんは、自分のアクティビティとは全く関係ない要因による変動に一喜一憂するという何とも切ない状況に陥ります。

     

    複数SNSをまたいで包括的な影響力値も解析するサービスでは、アカウント認証時のその変動を見ることも需要です。

     

    もし、認証するSNSを追加する度にその総合的な影響力値がガタっと下がるような事があれば、解析するロジックが破綻してしまっていると言えます。そのサービスは、各SNSの影響力の平均値を取ったりと、おかしな計算方法を採用していると思われます。

     

     

    自分の手応えと比べる

    この場に及んで実にアナログ的な事を書いて申し訳ないのですが、信頼性の高い影響力値は、得てしてユーザーの実際の手応えと連動している場合が多いのです。

     

    ですから、影響力の計測期間に該当する時期に、まわりから大きな反響を受けていたり、メディアに取り上げられていたりした際に、ちゃんと連動して自分の影響力値が上がっていればちゃんとアクティビティを計測しているという証拠になります。

     

    一概に人間の感覚と実際のデータが連動しているとは限りませんし、自分が意識しない間に大きな反響を呼んでいる場合も多々ありますので、この法則が人によっては体感出来ない場合もあったり、逆に自分の感覚とは真逆になっていたりという事も場合によってはありますが、明らかに実体験と連動していないサービスはすぐにわかるはずです。

     

    たとえば、何もしていないのに急増、急落を繰り返したりするのがその代表例です。ただし、繰り返しとなりますがここでもフォロワーの多い少ない、もしくは急増急激はあまり重要でありません。

     

    当然のことながらフォロワーゼロとフォロワー1万といった場合には、そこが算出される影響力値に間接的に波及していることも考えられますが、実際はフォロワー数10万人の人よりフォロワー数数千人の人の方が影響力が高いことも多々あるのが事実なのです。

     

    どうしてもフォロワー数が気になる場合は、比較するユーザーがどのようなユーザーにフォローされているかの方に目を向けて下さい。

     

     

    まとめ

    以上、一口に影響力を測定するといっても、お遊び程度に簡単なロジックでユーザー情報をスコアに変換するものから、実際に人間関係までをも考慮してスコア化するものまで、様々なレベルがあることをおわかり頂けたかと思います。

     

    さて、今回は代表的な各サービスの特徴や信憑性・有効性については一切言及しませんでした。

     

    当然のことながら突き詰めれば「本当の影響力」という定義自体が世の中に存在しませんので、重要なのは算出される数値がどこまでそれぞれサービスの目的に応じて信頼性が高いものなのかどうかということになります。

    そのテーマについては更に長くなってしまいますので、また別の機会に書いてみたいと思います。

     

    今後も同様の影響力測定サービスが日本国内でも増えてくるでしょうから、その際にはこれを参考にそこで見る影響力値の真偽と信憑性、そして信頼性をご自分の目で見極めてみてください。

     

    今後もソーシャル・メディアや世界のインターネット業界、ガジェットなどの最新情報を配信しますので、もしよろしければ是非Google+で私をフォローしてみてください。

     

    Facebookでは、Google+ユーザーのページを開設しているほか、私のフィード購読が可能です。

    また、もしよろしければ弊社提携先の「宇宙会社ソエンド」のGoogle+ページもフォローを是非お願いします。

     

    著者情報

    CEO of Overtex Group. Running the Social Endorsement Service SOENDO. Involved in Internet business since 1996 in SF bay area and Japan.

     

    最近の興味はLytroなど。ソエンドやをQrustなどソーシャルエンドースメント事業を運営しております。

     


    by 許 直人
    RSSブログ情報:http://media.looops.net/naoto/2012/10/31/asayama-soendo/
    コメントを書く
    コメントをするにはログインして下さい。