スキップしてメイン コンテンツに移動

『解析に不要なアクセスを徹底排除(アクセス解析ツールの事前準備)』



アクセスログ解析ツールのPV計測方法を知る
Webサーバのアクセスログにはロボット・スパイダや画像のアクセスログ、その他様々な情報が含まれています。
サーバログの解析ツールの場合は、ツールの仕様や設定によってPV数や訪問数の計測から除外されているものやそうでないものもあったりしますので、使用される解析ツールの仕様はよく確認することはとても大切になります。

(図: 除外するページ設定画面)


また、クローラ(ロボット・スパイダー)などのアクセスは、あらかじめSiteTrackerで設定されている「ロボット・スパイダ」として別集計を行っています。(図: あらかじめSiteTracker8で設定されているロボットスパイダ設定画面とGooglebotの設定サンプル)
SiteTrackerはあらかじめ決まった画像ファイル等(gif、jpg、png、css、js、class)のアクセスログデータは「PV数」としてカウントしないようになっています。

SiteTrackerの良いところは、この「ロボット・スパイダ」を別集計し、ロボット・スパイダーの解析レポートが用意されていることです。
ロボット・スパイダーがどのような頻度でサイトに訪れ、またどのページを閲覧していったのかが分析できます。

解析データの整理が必要
サイトによって訪れるクローラーは異なる!んですね。
そのため、解析ツールで設定されているクローラーだけでは不十分な場合があります。
一度アクセスログを解析したら、次は解析データの整理が必要になります。

基本的にアクセスログを解析する上で、除外して解析すべきものとしては以下のようなものがあるでしょう。
  • ツールで設定されていない「ロボット・スパイダ」
  • PVとしてカウントさせたくないページ、ファイル等(例:PDF、SWF、ico、textなど)
  • 関係者によるアクセス(例:自社内からのアクセス、コンテンツ製作会社、運用会社・・・など)


ドリルダウンを使って不要なアクセスを調査
SiteTrackerの「ドリルダウン」機能は、解析結果の詳細を深堀できる機能で、異常値が出た場合などに「何が原因なのか」を追究するのに非常に役に立つ機能です。
図は、ある日の「訪問数」をドリルダウンした「訪問詳細」情報の一部です。
(1行ごとが訪問単位として見れるレポートです。)

ここのブラウザとプラットフォームの部分を見てみると、一般的に訪問者が利用するブラウザ以外からのアクセス(例えば、YetiやMAILPIAなど)が見て取れます。

特にこれらクローラーは1ページのみの閲覧であったり、逆に1訪問中に数十ページを短時間に閲覧するような「人間らしくない動き」のものが多いです。(図にある「ビュー」のカラムを参照。)

また、左図は「訪問者サマリ」という個別訪問者ごとの訪問回数やビュー数が見れるレポートです。
このレポートで解析から除外すべき訪問者を特定していきます。
上位を占めている「○○PIA」は特に訪問数も多く解析結果に影響がでることが明らかです。

これらのアクセスを解析に含めたままにしておくと、解析データによる「判断」に狂いが生じることがありますので注意です。

特に「PV数」「訪問数」「訪問あたりのPV数」「直帰率」などに直接影響しますので、できるだけ除外して解析を行うことをお勧めします。


アクセス解析に必要ないページがあればそれも除外
特にhtmlページ内に埋め込まれたFlash画像(swfファイル)などは、「訪問あたりのPV数」に影響し「直帰訪問」の解析精度が低くなりますので、解析に含めるべきか否かはあらかじめ確認しておきましょう。

図は、ひとつの「訪問」で閲覧されたビュー詳細をドリルダウンして見たサンプルです。
時刻「11:54」にトップページ「/」を閲覧開始した際にアイコン画像「.ico」やトップページに埋め込まれたFlashファイル「.swf」のアクセスもページとしてカウントされています。
そしてトップページ「/」を閲覧しただけで計4PV数のカウントとなっています。
6行目以下もオレンジ□枠の通常のページ「~.html」を閲覧するごとに、何故か「.ico」ファイルもリクエストされPV数にカウントされています。

このままではきちんとしたアクセス解析データが得られないことが想像できます。
このように、あらかじめ解析する前に除外しておきたいページは、SiteTrackerの「設定」画面で除外の設定を施しておきます。

図の「設定」タブをクリックし、メニューの「フィルタ」項目にある「除外するページ」を選択して、設定画面に移ります。
「追加」ボタンをクリックして、除外するページの設定を追加します。



右図の例では|で終わる|.ico|としています。これで拡張子がicoのファイルは全て除外対象のページとなります。









関係者のアクセスをIPアドレスで除外
Webサイトの運営会社、コンテンツ制作会社、自社の社員のアクセスなども、アクセスログには記録されますので、これらのアクセスを除外して解析を行うかどうかも確認しましょう。
図は「ホストサマリ」のサンプルですが、この1位のアクセスが実は自社内からのアクセスでした。
これらを含めた状態でアクセス解析を行うと、やはり解析データの「読み」に影響がでることは必至でしょう。

SiteTrackerの「設定」タブをクリックして、プロファイルの設定画面を表示させます。「フィルタ」項目にある「除外するホスト」を選択し、画面サンプルのように解析に含めないIPアドレスを追加します。
SiteTrackerのプロファイル設定の「フィルタ」項目は、ログを読み込む際にあらかじめフィルタを適用させる場合に行う設定となります。解析後にフィルタをかけて一時的に解析データから除外してレポートを見ることも可能ですが、全レポートに共通させてフィルタをかける必要がある場合は、ここでフィルタ設定を行っておくと良いでしょう。
同じ「フィルタ」項目に「除外するページ」がありますので、ここでswfやicoファイルも除外設定をしておきます。
リダイレクトページはすでに解析対象外となっていますので、逆にアクセス解析に含めたいリダイレクトページは設定をします。
プロファイル設定中にプロファイルの「レポートデータを削除」するか「続行」するかを毎回聞かれますが、ここは「続行」して設定作業を続け、全て設定が終わってからレポートデータの削除を行い再解析すればOKです。
※これらの設定を行った場合は、プロファイルからデータを削除し、もう一度ログから読み込み直しを行ってください。(再解析を行わなければここのフィルタは適用されません。)

プロファイルからのデータ削は、「設定」画面の左上部にあるプルダウンメニューで「プロファイルからのデータ削除」を選択します。
「データをアーカイブする」のチェックを外します。(アーカイブが必要な場合のみチェックします)
ここでは全て再解析しますので「全ての月を削除」を選択します。(月単位で削除する場合は削除する月を選択して「選択した月を削除」を選びます。)

  • 注意:プロファイルのデータ(解析済みデータ)を削除する場合は、一番古い月の方から削除して下さい。途中の月を削除して再解析はできませんのでご注意ください。

以上が、基本的にアクセス解析ツールに事前に行っておく準備作業となります。
(他にもパラメータを認識させる設定や、SiteTrackerの場合はページのグルーピング、キャンペーンレポート設定は再解析が必要な設定になりますが、ここでは長くなるので次回以降で解説します。)

再解析してみると、意外とアクセス数が少ない?
という実感があると思います。
でも決してガッカリしないでください。
この丸裸な解析データは、仮説を立てる判断を極力鈍らせないものになってくれるでしょう。
つまるところ、アクセス解析は「量」だけではありません。「質」もかなり重要になってきます。

ここは割り切って、その解析データを基に以後のアクセス解析に役立てましょう。
ある程度明確な要因が確かめられれば無駄な対策を打たずに済む場合もありますよ。

コメント

このブログの人気の投稿

『手続きのコンバージョン分析 ~SiteTrackerの2つのシナリオ分析~』

コンバージョンに影響してくる手続きステップ Webサイトの中における目的(GOAL)として、資料請求や会員登録、商品購入など訪問者にアクションをとってもらうことがあります。 コンバージョンを上げるのに、これらの資料請求手続きやカート手続きのステップには特に神経を使う部分ではないでしょうか? 右の図でいうと、手続き開始ページの部分から完了ページまでの流れのところですね。 今回はその手続きステップにポイントを絞ったシナリオ分析について、図の「手続きページ→完了ページ」の部分をどうやって分析するべきか、SiteTracker8のシナリオレポートによる2つの設定によって解析結果の違いをみながら確認してみたいと思います。

解析データの根拠を追求できるSiteTrackerの「ドリルダウン機能」

手探りの解析には限界がある 定期的なアクセス解析運用を行っている中で、解析データの数値に異常値が出たとき、その原因をどこまでどのように追求してますか? フィルタ機能を駆使してセグメント化し、それぞれの特出したデータから推測することも当然必要ですが、ここはまずシンプルに「ドリルダウン機能」を使ってその数値の詳細を確かめることからはじm。 data-gtmクリック data-gtm=’バナークリック,レコメンドバナー_クリック,ボタン01’ data-trackeventnameクリック data-trackeventname="event_click" data-trackeventlabel="TOPボタン_GTM;1"

『SiteTrackerでの訪問数(セッション)の定義』

SiteTrackerでいう「訪問数」とは? 解析レポートによく出てくる指標として「訪問数」があります。 この「訪問(セッション)」はどのように定義してカウントしているのでしょうか? この図で示す通り、 訪問者がサイトに訪れた時から訪問が始まり、ページを遷移(リクエスト)するまでの時間が30分未満、さらに次のページへの遷移がそこから30分未満であればひとつの「訪問」がつづきます。 そして、そのサイトを離れるか、または次のページをリクエストするまでに30分以上経過すると、そこで「訪問」が終了します。 図では、ページC→ページDの間が30分以上過ぎたため、1訪問はここで終了。ページDからは2訪問となります。 SiteTrackerのセッション化の設定画面をご覧下さい。