ログ解析スクリプトAWStats 5.0ドキュメント

 


ログ解析ツールの比較



AWStatsとその他の著名なログ解析ツールとの比較

機能/ソフトウェア AWStats Analog Webalizer HitBox
バージョン - リリース日 5.0 - 2002年9月 5.24 - 2002年7月 2.01 - 2000年9月 不明
言語 Perl C C HTMLに
埋め込まれたタグ
全てのプラットフォームで利用可能? Yes Yes Yes 不明
ソースを入手できるか? Yes Yes Yes No
価格/ライセンス Free Free Free Freeだが,
広告が必要
Apache combined (XLF/ELF)もしくは
カスタマイズされたログ形式に対応可能か?
Yes Yes Yes 不明
Apache common (CLF) ログ形式に対応可能か? 特定の機能が対応 特定の機能が対応 特定の機能が対応 不明
IIS (W3C) のログ形式に対応可能か? Yes Yes No 不明
統計の更新方法 コマンドライン (CLI)
もしくは/及び
ブラウザ(CGI)
コマンドライン (CLI)
もしくは/及び
ブラウザ(CGI)
コマンドライン 不明
DNSの逆引きを行えるか? Yes Yes Yes 不明
DNSキャッシュファイルが利用できるか? 静的 / 動的の両方 静的もしくは動的 静的もしくは動的 不明
ロードバランスを行っているシステムの
分割されたログファイルを処理できるか?
Yes Yes No No
訪問した"人間"の数のレポート Yes No Yes Yes
訪問した"人間"の一意な数のレポート Yes No No Yes
滞在時間のレポート Yes No No Yes
ソートされたレコードを正常に処理し, 訪問を識別できるか? Yes 訪問は識別できない No ?
一意な訪問者の統計の基準 ページ***** 訪問は
サポートされていない
ヒット***** ページ*****
ドメイン/国のレポート(検知できる種類) Yes (259) Yes (259) Yes (252) Yes (?)
認証されたユーザーのレポート Yes Yes No No
ロボットのレポート/フィルタ(検知できる種類) Yes/Yes (291**) Yes / Yes (8) No/No (0**) No/No (0**)
時間帯別のレポート Yes Yes Yes Yes
曜日別のレポート Yes Yes Yes Yes
頻繁に閲覧されたページのレポート Yes
Yes Yes Yes
最初に閲覧されたページのレポート Yes
No Yes Yes
最後に閲覧されたページのレポート Yes
No Yes Yes
ソートされたレコードを正常に処理し,
最初/最後に閲覧されたページを識別できるか?
Yes 最初/最後に閲覧された
ページをサポートしてない
No ?
CGIのページを(ヒットとしてではなく)ページとして
検知できるか?
Yes 定義された値で
終了している場合のみ
".cgi"で終わっている
場合のみ
Yes
ディレクトリ別のページのレポート No Yes No No
CGIの最後にアクセスされた時間/平均サイズのレポート Yes/Yes Yes/No No/No No/No
Web圧縮の統計 (mod_gzip) Yes No No No
ファイルタイプのレポート Yes Yes No No
ファイルサイズのレポート No Yes No No
ブラウザのレポート(検知できる種類) Yes (75*) No Yes (4*) Yes (<20*)
ブラウザの詳細なバージョンのレポート Yes No No Yes
OSのレポート(検知できる種類) Yes (29) Yes (25) No (0) ?
利用された検索エンジンのレポート(検知できる種類) Yes (63***) Yes (24) No (0) Yes (<20 ***)
検索エンジンで利用された検索語/検索文のレポート
(検知できる種類)
Yes/Yes (65***) Yes/No (29***) No/Yes (14***) Yes/No (<20***)
HTTPエラーのレポート Yes
Yes Yes No
404エラーのレポート 回数, 最後の日付, referer
回数のみ 回数のみ No
'お気に入りに追加'のレポート No
No No No
日別の統計 Yes Yes Yes Yes
月別の統計 Yes Yes Yes Yes
年別の統計 Yes Yes Yes Yes
DNSの逆引きを行わない場合の, 処理行数/秒のベンチマーク
(全機能を有効, XLF format, Athlon 1Ghz)
4500**** ?**** 10000**** 不明
実行プログラム
がない
DNSの逆引きを行った場合の, 処理行数/秒のベンチマーク
(全機能を有効, XLF format, Athlon 1Ghz)
80**** 80**** 80**** 不明
実行プログラム
がない
主要な統計が1ページ内にグラフィカルに表現 Yes Yes Yes No

* この数値は, 実際に検知されるブラウザの種類ではありません. 全てのブラウザ(既知/未知)はこの機能をサポートするツール(AWStats,Webalizer,HitBox)で検知できます. この数値は, 異なるバージョンをひとつのグループにまとめることができる既知のブラウザの種類でしかありません.

** AWStatsはロボットの訪問を検知することができます:
robotslist.txt (250Kb)にリストされているロボットの内, 主要なロボットは全て検知できます. この機能に対応していないツールは, そのサイトへの訪問者が少なければ少ないほど, 誤った情報をレポートしてしまいます. 例えば, あなたのサイトが全ての著名な検索エンジンやロボットから, 更新や存在の有無を確認する訪問を受けたとしたら, 1ヶ月あたり500回程度の訪問になるでしょう. もしあなたのサイトが1ヶ月あたり2,000回程度の訪問しか受けないと仮定すると, ロボットを検知できないツールは2,500回の訪問があったと報告するでしょう(誤差25%です!). AWStatsであれば, 500回はロボットの訪問, 2,000回は人間の訪問であることを報告します.

*** AWStatsは, 著名な検索エンジンについてはURLを解析するための独自のルールを持っています. また, 未知の検索エンジンのためのルールも持っています. これらのルールはAWStatsが更新する際に併せて更新されます.

**** この速度は, 全ての情報(
combined XLF/ELFあるいはW3C拡張ログ形式)が含まれているログのレコードを処理する速度ですが, この数値にはDNSの逆引きの時間が含まれていないことを忘れないでください. DNSの逆引きの速度はあなたのシステムやネットワーク, インターネットの状況に依存しますが, 利用しているログ解析ツールに依存するわけではありません. このため, DNSの逆引きは全てのログ解析ツールのベンチマークで無効にされます. このため, ログ解析ツールのベンチマークは, ほとんど"無意味"であるということになります. なぜならば, DNSの逆引きが(たとえキャッシュがあったとしても)ログ解析ツールの処理時間の95%を占めるからです. つまり, ログファイルの中で既にDNSの逆引きが行われていない限り, ログ解析ツール自体の処理速度に依存せず, 処理全体の時間はほぼ同じになります.

***** 訪問者の中には, 多数のプロキシサーバーを利用している人もいます(例 : AOLユーザー). これはある一人の訪問者があなたのサイトに到達するために
, 複数のホスト(複数のIPアドレス)を利用する可能性があることを意味します(例 : あるプロキシサーバーがページ本体をダウンロードし, 別の2つのサーバーが全てのイメージをダウンロードするために利用される). この場合, 一意な訪問者の統計が"ヒット"を基準にしていると, 3人の訪問者があったと報告されますが, これは誤りです. AWStatsでは, HitBoxと同様に, HTMLページのみを一意な訪問者をカウントする際に利用します. この方式だとエラーが減少します(あるプロキシサーバーがあるHTMLのフレームをダウンロードし, それ以外のプロキシサーバーが別のフレームをダウンロードする可能性があるので, 完璧ではありません.)