CentOS/基于日志的站点统计系统的构建

来自站长百科
跳转至: 导航、​ 搜索

CentOS | CentOS安装 | CentOS使用手册

通过我们构建的HTTP服务器将Web发布后,随着不断被访问,Apache会记下每个访客的基本信息。CentOS的情况下,这些信息通常保存在位于/var/log/httpd/下的相应日志文件中。但Apache单调的日志,除了提供给我们一些最基本的服务器被访信息、以及出错信息之外,我们很难单纯的通过日志文件得到更多、更系统的关于时间、规律性、地点方面的信息。这也使得很难通过单纯的日志去系统的分析流量。

但通过Awstats,我们可以把Apache的日志作为一种有效资源,获得更加系统化的信息。

实质上,Awstats就是一套分析系统,它将日志文件统计学式的进行分析与统计,然后提供一个能够反映规律性的界面给我们。Awstats并不是仅能应用于分析Apache的日志,在邮件服务器等等方面,它也被广泛的应用。但在这一节中,只介绍在Web服务器中运用Awstats建立统计系统的方法。

下载并安装Awstats[ ]

首先下载并安装Awstats。

[root@sample ~]# wget http://nchc.dl.sourceforge.net/sourceforge/awstats/awstats-6.5-1.noarch.rpm  ← 下载Awstats的rpm包

--15:34:59-- http://nchc.dl.sourceforge.net/sourceforge/awstats/awstats-6.5-1.noarch.rpm
=> `awstats-6.5-1.noarch.rpm'
Resolving nchc.dl.sourceforge.net... 211.79.61.10
Connecting to nchc.dl.sourceforge.net|211.79.61.10|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1,095,131 (1.0M) [text/plain]
100%[====================================>] 1,095,131 155.28K/s ETA 00:00

15:35:06 (158.94 KB/s) - `awstats-6.5-1.noarch.rpm' saved [1095131/1095131]

[root@sample ~]# rpm -ivh awstats-6.5-1.noarch.rpm ← 安装Awstats

Preparing... ########################################### [100%]
1:awstats ########################################### [100%]

----- AWStats 6.5 - Laurent Destailleur -----
AWStats files have been installed in /usr/local/awstats

If first install, follow instructions in documentation
(/usr/local/awstats/docs/index.html) to setup AWStats in 3 steps:
Step 1 : Install and Setup with awstats_configure.pl (or manually)
Step 2 : Build/Update Statistics with awstats.pl
Step 3 : Read Statistics

然后删除安装后的遗留源文件。

[root@sample ~]# rm -f awstats-6.5-1.noarch.rpm  ← 删除安装后的遗留源文件

配置Awstats[ ]

接下来对Awstats进行初始配置。

[root@sample ~]# /usr/local/awstats/tools/awstats_configure.pl  ← 运行初始配置脚本
----- AWStats awstats_configure 1.0 (build 1.6) (c) Laurent Destailleur -----
This tool will help you to configure AWStats to analyze statistics for
one web server. You can try to use it to let it do all that is possible
in AWStats setup, however following the step by step manual setup
documentation (docs/index.html) is often a better idea. Above all if:
- You are not an administrator user,
- You want to analyze downloaded log files without web server,
- You want to analyze mail or ftp log files instead of web log files,
- You need to analyze load balanced servers log files,
- You want to 'understand' all possible ways to use AWStats...
Read the AWStats documentation (docs/index.html).

-----> Running OS detected: Linux, BSD or Unix
Warning: AWStats standard directory on Linux OS is '/usr/local/awstats'.
If you want to use standard directory, you should first move all content
of AWStats distribution from current directory:
/root
to standard directory:
/usr/local/awstats
And then, run configure.pl from this location.
Do you want to continue setup from this NON standard directory [yN] ? y  ← 选择y,同意安装到默认目录下

-----> Check for web server install

Enter full config file path of your Web server.
Example: /etc/httpd/httpd.conf
Example: /usr/local/apache2/conf/httpd.conf
Example: c:\Program files\apache group\apache\conf\httpd.conf
Config file path ('none' to skip web server setup):
> /etc/httpd/conf/httpd.conf  ← 指定Apache配置文件所在位置

-----> Check and complete web server config file '/etc/httpd/conf/httpd.conf'
Add 'Alias /awstatsclasses "/root/wwwroot/classes/"'
Add 'Alias /awstatscss "/root/wwwroot/css/"'
Add 'Alias /awstatsicons "/root/wwwroot/icon/"'
Add 'ScriptAlias /awstats/ "/root/wwwroot/cgi-bin/"'
Add '<Directory>' directive
AWStats directives added to Apache config file.

-----> Update model config file '/etc/awstats/awstats.model.conf'
File awstats.model.conf updated.

-----> Need to create a new config file ?
Do you want me to build a new AWStats config/profile
file (required if first install) [y/N] ? y  ← 选择y,同意创建一个新的对象配置文件

-----> Define config file name to create
What is the name of your web site or profile analysis ?
Example: www.mysite.com
Example: demo
Your web site, virtual server or profile name:
> www.centospub.com  ← 为统计对象创建代号(推荐以网站URL作为代号)

-----> Define config file path
In which directory do you plan to store your config file(s) ?
Default: /etc/awstats
Directory path to store config file(s) (Enter for default):
>  ← 直接按回车,接受将Awstats的配置文件置于/etc/awstats下

-----> Create config file '/etc/awstats/awstats.www.centospub.com.conf'
Config file /etc/awstats/awstats.www.centospub.com.conf created.

-----> Restart Web server with '/sbin/service httpd restart'  ← HTTP服务重新启动

Stopping httpd:               [ OK ]
Starting httpd:               [ OK ]

-----> Add update process inside a scheduler
Sorry, configure.pl does not support automatic add to cron yet.
You can do it manually by adding the following command to your cron:
/root/wwwroot/cgi-bin/awstats.pl -update -config=www.centospub.com
Or if you have several config files and prefer having only one command:
/root/tools/awstats_updateall.pl now
Press ENTER to continue...  ← 按回车继续进行配置

A SIMPLE config file has been created: /etc/awstats/awstats.www.centospub.com.conf
You should have a look inside to check and change manually main parameters.
You can then manually update your statistics for 'www.centospub.com' with command:
> perl awstats.pl -update -config=www.centospub.com
You can also read your statistics for 'www.centospub.com' with URL:
> http://localhost/awstats/awstats.pl?config=www.centospub.com

Press ENTER to finish...  ← 按回车结束初始配置

然后对刚刚创建的对象配置文件进行配置。

[root@sample ~]# vi /etc/awstats/awstats.www.centospub.com.conf  ← 修改对象配置文件(文件名与上一步初始配置中设置的域名对应)

LogFile="/var/log/httpd/mylog.log"  ← 找到这一行,修改日至文件所在位置(指定Apache的日志文件)
 ↓
LogFile="/var/log/httpd/access_log"   ← 变为此状态

DirData="/var/lib/awstats"  ← 找到这一行,更改Awstats数据的保存位置
 ↓
DirData="."  ← 变为此状态,让数据与awstats.pl脚本在同目录下

Lang="auto"  ← 找到这一行,将auto改为cn
 ↓
Lang="cn"   ← 变为此状态,让语言默认为中文

SkipHosts=""  ← 找到这一行,在""之间添加无效访问规则
 ↓
SkipHosts="127.0.0.1 REGEX[^192\.168\.]"   ← 变为此状态,本地及内部的访问不做分析统计

LevelForWormsDetection=0  ← 找到这一行,将0改为2
 ↓
LevelForWormsDetection=2  ← 变为此状态,将来自Worm的访问也不做分析统计

接下来,再对httpd.conf中面向Awstats的部分进行必要设置。

[root@sample ~]# vi /etc/httpd/conf/httpd.conf  ← 编辑Apache的配置文件

#
# Directives to allow use of AWStats as a CGI
#
----------------------------------------------------
Alias /awstatsclasses "/root/wwwroot/classes/"
Alias /awstatscss "/root/wwwroot/css/"
Alias /awstatsicons "/root/wwwroot/icon/"
ScriptAlias /awstats/ "/root/wwwroot/cgi-bin/"
----------------------------------------------------

找到以上水平线间的语句群,对相应路径进行正确修改。变为下面水平线间状态:

----------------------------------------------------
Alias /awstatsclasses "/usr/local/awstats/wwwroot/classes/"
Alias /awstatscss "/usr/local/awstats/wwwroot/css/"
Alias /awstatsicons "/usr/local/awstats/wwwroot/icon/"
ScriptAlias /awstats/ "/usr/local/awstats/wwwroot/cgi-bin/"
----------------------------------------------------

#
# This is to permit URL access to scripts/files in AWStats directory.
#
<Directory "/root/wwwroot">  ← 找到这一行,对相应路径进行正确修改
 ↓
<Directory "/usr/local/awstats/wwwroot">  ← 变为此状态

然后,重新启动HTTP服务,使新的设置生效。

[root@sample ~]# /etc/rc.d/init.d/httpd restart  ← 重新启动HTTP服务,使设置生效

Stopping httpd:               [ OK ]
Starting httpd:               [ OK ]

对日志进行分析统计[ ]

配置完毕后,我们可以通过各种适用于自己的方式,定义统计的方式以及输出的结果。在这里,介绍最简单,也是最广泛的统计方法,如下:

[root@sample ~]# vi /root/awstats.sh  ← 建立统计用脚本如下:

#!/bin/bash
/usr/local/awstats/wwwroot/cgi-bin/awstats.pl -update -config=www.centospub.com
(以上紫色字体部分的域名请根据实际情况设置)

[root@sample ~]# chmod 700 /root/awstats.sh   ← 赋予脚本可被执行的属性

[root@sample ~]# /root/awstats.sh   ← 运行脚本,开始进行统计(如日志量比较大的话,要花一段时间)

Update for config "/etc/awstats/awstats.www.centospub.com.conf"
With data in log file "/var/log/httpd/access_log"...
Phase 1 : First bypass old records, searching new record...
Searching new records from beginning of log file...
Phase 2 : Now process new records (Flush history on disk after 20000 hosts)...
Jumped lines in file: 0
Parsed lines in file: 55
Found 52 dropped records,
Found 0 corrupted records,
Found 0 old records,
Found 3 new qualified records.

然后在客户端的浏览器上访问http://服务器IP地址(或你的域名)/awstats/awstats.pl?config=www.centospub.com即可看到详细的分析统计资料,如下图:

Awstats.gif

定制统计分析规则及相应外观设置[ ]

[1]完成以上配置,我们已经可以通过客户端的浏览器,掌握Web服务器的访问量、来路等等详细的信息,但由于Awstats的统计是基于Apache日志的, 我们必须通过awstats.pl对当前最新的日志文件进行统计才能得到最新的统计结果。

也就是说,在我们运行自行创建的awstats.sh脚本之前, 当前在客户端能够看到的统计分析结果,只是上一次运行awstats.sh脚本时统计的结果。想得到最新的统计结果,必须再次运行awstats.sh。 在这里,我们将其设置为每天定时自动运行,以便于每天都能查看到最新的信息。如下:

[root@sample ~]# crontab -e  ← 对定期任务执行时间表进行编辑,添加如下一行:

00 00 * * * /root/awstats.sh  ← 添加此行到其中,让统计分析在每天0点更新

(以上操作方法与vi编辑器相同)

[2] 在一些情况,可能并不希望外界看到日志统计分析的结果。对此,我们可以为Apache添加面向于Awstats的访问限制,如下:

[root@sample ~]# vi /etc/httpd/conf.d/awstats.conf  ← 创建面向于Awstats的配置文件

<Files "awstats.pl"> 
AllowOverride None
Order deny,allow
Deny from all 
Allow from 192.168.0  ← 只允许局域网内访问
</Files>


[root@sample ~]# /etc/rc.d/init.d/httpd restart  ← 重新启动HTTP服务,使设置生效

Stopping httpd:               [ OK ]
Starting httpd:               [ OK ]

[3]用Firefox浏览分析结果时,字体会显得很难看(因为Firefox和IE识别11px字体不一样),所以用Firefox浏览器的情况,可以通过修改awstats.pl输出css的相关字体尺寸进行修改,而达到用Firefox浏览时也和IE一样能够正确显示出适当尺寸的字体。方法就是直接编辑"/usr/local/awstats/wwwroot/cgi-bin/awstats.pl",将文件中所有“11px”的地方都替换为“12px。

参考来源[ ]

http://www.centospub.com/make/awstats.html

CentOS使用手册导航

CentOS安装

CentOS安装 | 系统安装后的初始环境设置 | 服务器方式安装CentOS 5

CentOS使用手册

使用RPM管理包 | 使用YUM工具更新系统 | 使用rsync服务 | 使用rsync同步 | 使用tar备份 | 使用tar恢复文件 | Samba 服务器的构建 | 用SWAT让Samba服务器的管理温和化 | SMTP服务器的构建 | POP/IMAP服务器的构建 | 病毒查杀系统的构建 | 入侵监测系统的构建 | 用OpenSSH构建SSH服务器 | 用SSH客户端软件登录到服务器 | 让服务器支持安全HTTP协议 | 开放一般用户的网页发布权限 | 虚拟主机的构建 | Servlet/JSP服务器的构建 | 基于日志的站点统计系统的构建 | 构建MySQL数据库服务器 | 用phpMyAdmin让MySQL数据库管理温和化 | 数据库的自动备份与恢复 | 用ProFTPD构建FTP服务器 | 用FTP客户端软件连接到服务器