加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

网站日志是什么?网站日志剖析了什么内容?

发布时间:2023-08-19 14:02:05 所属栏目:经验 来源:
导读:对于站长而言,日常访问的日志通常是必读之物;而虽不常被视为主要数据源,但我们却可通过这些记录得知访客举止与解析其浏览焦点的方法。本文跟大家讲下网站日志是什么?网站日志分析了什么内容?

一、网站日志格
对于站长而言,日常访问的日志通常是必读之物;而虽不常被视为主要数据源,但我们却可通过这些记录得知访客举止与解析其浏览焦点的方法。本文跟大家讲下网站日志是什么?网站日志分析了什么内容?

一、网站日志格式分类

目前常见的网站日志格式主要有两类:

1、Apache的NCSA日志格式:NCSA格式又分为NCSA普通日志格式(CLF)和NCSA扩展日志格式(ECLF)两类,目前最常用的是NCSA扩展日志格式及基于自定义类型的Apache日志格式。

2、IIS的W3C日志格式:W3C扩展日志格式(ExLF)具备了更为丰富的输出信息,主要是微软IIS(Internet Information Services)中应用。

二、网站日志是什么

网站日志(Web log)是一种记录网站服务器与用户之间交互行为的文件。当用户访问网站时,服务器会自动将用户的访问信息写入日志文件中。网站日志主要包括访问日志、错误日志和其他类型的日志。这些日志文件有助于网站管理员分析网站的运行状况,监测服务器性能,诊断问题,分析用户行为等。

网站日志通常包含以下信息:

1、IP地址:用户的IP地址,用于识别访问者的地理位置和网络服务商。

2、访问时间:用户访问网站的日期和时间。

3、请求方法:用户使用的HTTP方法,如GET、POST等。

4、请求资源:用户请求的网页或资源的URL地址。

5、HTTP状态码:服务器返回给访问者的HTTP响应状态码,如200表示请求成功,404是请求资源未找到等。

6、用户代理:访问者使用的浏览器和操作系统的信息,有助于了解访问者的设备和浏览习惯。

7、来源页面:用户从哪个页面跳转至当前页面的URL地址,有助于了解网站的内部链接和外部来源。

8、可用数据传输量:根据用户每次请求的资源大小,用于动态统计网站的网络流量服务器的消耗。

三、典型的网站日志文件

网站日志数据的优势在于不需要安装跟踪代码,只要你的网站上线,即网站代码在服务器运行时,它就会开始记录数据。用户访问你网站触发的任何行为,网站日志都会一一记录,比如当用户访问你网站一个页面,这时你的网站日志就会记录一行。当同一个用户访问网站上的另一个页面或图像,网站日志又会记录另一行。

四、网站日志文件的缺点

从网站日志中获得的数据并不是完整的,很多网站使用的是JavaScript等代码来实现用户在网站上的交互行为,但网站日志不能记录这些由JavaScript代码产生的交互行为,所以会缺失一部分用户数据。一些流量数据统计分析工具可以跟踪JavaScript的交互行为。

当你的网站有网站静态的缓存文件时,文件缓存机制将只会返回用户的缓存文件。例如,图像文件、CSS文件、JavaScript文件等文件类型适用于文件缓存机制。所以,当你的网站日志返回用户缓存文件时,将不会被记录到网站日志中。

当网站每天的访问数超过100,000时将会生成一个至少30G的网站日志文件,那一个月就会累计1TB的原始数据。从如此大的原始数据中提取分析出人们易懂的日常报表是非常困难而且非常耗时的,而且还占用了很多宝贵的储存资源。这就需要一个专门的软件来处理这些数据,并且可以根据用户的喜好进行个性化的设置。
 

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!