参考:サーバから得られるアクセスログについて

ホームページへのアクセス記録(ログ)は、そのホームページを公開しているサーバに保存されます。 FC2のような、ホームページサーバとは違うサーバで行うアクセス解析は、サーバのアクセスログ解析とは技術的にちょっと違う ところがありますが、基本は同じと思われますので、サーバから直接得られるアクセスログとその解析について簡単に説明します。 アクセス解析サービスを利用する際の参考にしてください。


ホームページを保存し公開するサーバは通常UNIXマシンです。UNIXサーバに保存されるアクセスログは次のような内容です。 (一部改変してあります。)

150.29.130.77 - - [05/Jan/2004:22:21:19 +0900] "GET /home/links.html HTTP/1.1" 200 8038 "http://kelon.fc2web.com/index.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

これはサーバ管理者だけが閲覧できる場合と、ユーザに自分のサイトの分だけを配信する場合があります。 私は職場のサーバから自分のサイトのアクセスログを自動配信されています。

以下にアクセスログの各データについて説明します。

150.29.130.77

訪問者のIPアドレスです。IPアドレスについては 自分のIPアドレス・ドメイン・都道府県解析対応状況を調べる をご覧ください。

- -

標準Webサーバログ形式との互換性を表す記号です。

[05/Jan/2004:22:21:19 +0900]

訪問日時です。この場合は2004年1月(January)5日22時21分19秒にアクセスしたことを示しています。 「+0900」は、時刻が世界標準時からどれだけずれているかを示します。日本国内ではすべて+0900です。

"GET /home/links.html HTTP/1.1"

訪問者(のパソコン)が実行したアクションに関するデータです。 「GET」は訪問者がホームページのデータを得るというアクションを意味します。 「/home/links.html」は訪問したページです。このログはサーバがユーザに自分のサイトのログだけを配信したもの であるため、URLの最初の方は省略されています。 「HTTP/1.1」はプロトコルがHTTPでバージョンが1.1であることを示しています。

200 8038

訪問者(のパソコン)に対してサーバが実行したアクションに関するデータです。 最初の数字はアクションの内容を示すステータスコードで、200は正常送信を示しています。この他によく見られるのは、 304(訪問者側にキャッシュされていたため何も送信しなかったが正常終了)、 404(アクセスしようとしたページが存在しない)、 があります。ホームページのリンク切れなどで「404 Not Found」と表示される場合の404とはこのコードです。 2番目の数字はサーバが訪問者のパソコンに送信したデータの量で、この場合は8038バイトを送信したことを示しています。

"http://kelon.fc2web.com/index.html"

リンク元ページ(リファラ)です。こちらのURLは省略されず全部表示されます。 お気に入り(ブックマーク)を使用してアクセスした場合は"-"となりますが、 ごくまれに"bookmarks"と表示されていることがあります。 URLを直接入力またはコピー&ペーストした場合は"-"となります。 JavaScriptで新しいウィンドウを開いた場合は通常"-"となりますが、 まれにリンク元ページが記録されていることがあります。 また、検索結果の場合は
"http://search.yahoo.co.jp/bin/query?p=%ca%d4%a4%df%a4%b0%a4%eb%a4%df&hc=2&hs=14&h=p"
等と表示されます。これをブラウザのURL欄にコピー&ペーストするとサーチワードがわかります。 (なんでこんなサーチワードで当たるかな^^;)

"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

訪問者のパソコン環境に関するデータです。ブラウザはなぜかMozillaが基準のようです。 この場合は、訪問者のパソコンのOSがWindows XP、使用ブラウザがIE6.0であることを示しています。 Windowsのバージョンは開発経緯によるものか、XPがNT5.1、2000がNT5.0、Meが98と表示されるようです。 またMacOSの場合は、OS X以外はMac_PowerPCまたはMacintoshと表示されるだけで、バージョンは表示されません。 この訪問者のパソコン環境はシンプルな表示ですが、複雑なケースになりますと
"Mozilla/5.0 (Windows; U; Windows NT 5.1; ja-JP; rv:1.0.1) Gecko/20020823 Netscape/7.0"
等と表示され、OSがWinXP、ブラウザがNetscape7.0であること以外は何が何だかわかりません。

と、見てくると比較的簡単なようですが、実は各htmlページ読み込み記録の後に、画像のあるページならgifやjpgの読み込み 記録が全部付いているので、大変な量になります。検索エンジン巡回には画像読み込みは付きませんが、アクセス数は かなりあります。真面目にアクセス解析してると仕事になりません(^^;;)。

検索エンジンの巡回は、以下のように記録されます。

64.68.92.190 - - [02/Mar/2004:03:35:26 +0900] "GET /index.html HTTP/1.0" 200 3812 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"

「Googlebot」という名前と、パソコン環境の情報が無いこと、この後に画像読み込み記録が付かないことから、 検索エンジン巡回だろうとわかるだけです。もっとわかりにくい名前のついている検索エンジンと 怪しいアクセスは区別がつきません。

情報量が少なくてかなり怪しいアクセス記録の例
61.210.143.202 - - [09/Jan/2004:22:31:25 +0900] "GET /index.html HTTP/1.0" 200 522 "-" "-"
61.210.143.202 - - [09/Jan/2004:22:34:12 +0900] "GET /g... HTTP/1.0" 404 306 "-" "-"

★下記のサイトを参考にさせていただきました。
HTTPログファイルの読み方
http://service.jp.real.com/help/library/guides/g270/htmfiles/report.htm


本ページの作成責任者:kelon

本ページはFC2アクセス解析サービス 利用者の参考とする目的で作成しておりますが、他のどなたでもご自由にご利用ください。

FC2アクセス解析FAQに戻る


SEO [PR] 爆速!無料ブログ 無料ホームページ開設 無料ライブ放送