可可网络
专注效果,用心服务
电话

免费服务热线

19925363846

二维码
如何查看SEO优化日-网站日志?如何使用

来源: 2021-08-23

如何查看SEO优化日-网站日志?如何使用?有什么规则吗? 如何查看网站日志?如何使用?有什么规则吗? 你觉得怎么样? 首先要明确日志各部分的意义。推荐在线分析(我直接从日志文件DW下载分析,比较亲测,向开发者订购32个非常准确的工具!)。 使用方法: 可以看到,我们需要通过日志记录来更正网站的问题,所以网站是引擎的首选。 有什么规则吗? 引擎中有各种IP段的蜘蛛。 1、捕捉蜘蛛的其他内容 2、抓蜘蛛的权重页、抓蜘蛛的低权重页 3、蜘蛛的另一页 4、新站爬行蜘蛛 5,K站,会进入捕沙盒蜘蛛 7、捕捉蜘蛛的高频(每日更新) 8、新网站或异常网站蜘蛛 9.不间断巡逻的蜘蛛210.72.225。*(这是我们通常理解的引擎蜘蛛抓住网站的情况。我一直以为百度上有一只蜘蛛。每天 不断出入各种网站,但事实上,这只是例行程序。) 10、用户访问IP 它还包含进入网站的位置、用户搜索时显示网站、用户单击、搜索照片时进入的位置。进入时间, 等等(下面详细说明,不同的IP对网站有不同的意义,不仅是因为301、200、304、404等,还因为日志中的信息量很大。) 如果你知道这些内容,引擎就应该是123.125.71。通过日志可以知道,只发送*来处理权重低的网页。经常这个 IP段的蜘蛛访问后返回304。304表示网页没有更改。什么,通过这一点,我们知道两个问题:首先要更新这个网站。第二,这个网站的权重不高,需要内外锚吗?(每个日志都清楚地记录了某一页的返回信息,但对第一页的捕获除外。) 等待IP段的蜘蛛和返回代码、访问的网页等,有助于改善主页。日志是这样用的。 请仔细阅读以下内容:为了让大家获得更好的研究日志。 不同IP段蜘蛛的意义1: 121.14.89。*该IP段被用作超过新站视察期间。 123.125.68。*这种蜘蛛经常来,其他蜘蛛来的少,这表明网站可能进入沙盒,或者降低嫌疑人的权利。 220.181.7。* 123.125.66。*代表百度蜘蛛IP访问,准备抓东西。 220.181.68。*每天只要这个IP段增加,就很有可能进入沙盒或K站。203.208.60。*此IP部分在新工作站和站点出现异常现象后出现。 210.72.225。*该IP段不间断地巡逻各站。 二: 123.125.71。*内部页面上包含的、权重低、登上这一段的内部页面句子(internal page)不是原件或采集句子(capture),因此不会很快被释放 第三: 125.90.88。*广东茂名市电信也是百度蜘蛛IP的主要成分,因为新鲜站多,站长工具或SEO综合检查。 四: 第220.181段属于加权IP段。本段上传的文章或网站基本上是24小时释放。 220.181.108.75主要捕获更新文章内部页面90%,8%捕获主页,2%其他。加权IP段、上传的句子或主页基本上24小时释放。 220.181.108.77专用主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.80专用捕获主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.83专用捕获主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.86专用捕获主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.89专用捕获主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.91是综合性的,主要属于主页和内页或其他、加权IP段,上传的文章或主页基本上24小时释放。 网页捕捉,如220 . 181 . 108 . 92%,其他(非内部页面) 220.181.108.94专用捕获主页IP加权段,普通返回代码304 0表示未更新。 220.181.108.95这是百度抓取主页的专用IP。如果是220.181.108段,基本上你的网站每天晚上都会拍快照。 220.181.108.97专用捕获主页IP加权段,普通返回代码304 0表示未更新。 五: 注意===以上IP尾数还有很多,但段相同的123.125.71。*段IP表示内部页面捕获的权重比较低。可能是因为文章收集或文章拼写暂时收录,但没有公开。(即未定) 220.181.108。*第IP节主要占主页的80%,内页占30%,是这个爬上去的句子或主页。六: 与其相信所有所谓的书,不如没有书。以上只能作为参考,不能完全沿袭。如果还能看到未知的百度IP蜘蛛,可能是部分(站长工具)的模拟蜘蛛IP。 网站日志中返回代码的含义 1: 1xx(临时响应)表示临时响应,是指示请求者必须继续工作的状态代码。 100(续)请求者必须继续请求。服务器返回此代码,表示收到了请求的第一部分 布恩,我在等剩下的部分。 101(切换协议)请求者请求服务器切换协议,服务器已确认,准备切换。 2: 2xx(成功)是指示请求已成功处理的状态代码。 200(成功)服务器已成功处理请求。通常,这意味着服务器提供请求的网页。 201(生成)请求成功,服务器中创建新资源。 202(已接受)服务器已接受请求,但尚未处理。 203(非批准信息)服务器已成功处理请求,但返回的信息可能来自其他来源。 204(无内容)服务器已成功处理请求,但未返回任何内容。 205(内容重置)服务器已成功处理请求,但未返回任何内容。 206(部分内容)服务器已成功处理部分GET请求。 3: 3xx(重定向)表示完成请求需要额外的工作。通常,这些状态代码用于重定向。 300(多种选项)服务器可以对请求执行多种操作。服务器可以根据请求者(useragent)选择任务,或提供请求者可以选择的任务列表。 301(永久移动)请求的网页已永久移动到新位置。服务器返回此响应(对GET或HEAD请求的响应)后,请求者将自动移动到新位置。 302(临时移动)服务器当前正在其他位置的网页上响应请求,但请求者必须继续使用原始位置,以便将来请求。 303(查看其他位置)请求者需要对其他位置使用单独的GET请求检索响应时,服务器将返回此代码。 304(未修改)自上次请求以来,请求的网页未被修改。服务器返回此响应时,不返回网页内容。 305(使用代理)请求者只能使用代理访问请求的网页。如果服务器返回此响应,请求者也必须使用代理。 307(临时重定向)服务器当前正在其他位置的网页上响应请求,但请求者必须继续使用原始位置,以便将来请求。 4: 4xx(请求错误)这些状态代码表示请求无效,可能会妨碍服务器处理。400(错误请求)服务器不理解请求语法。 401(未授权)请求需要认证。对于需要登录的网页,服务器可以返回此响应。 403(禁止)服务器拒绝了请求。 404(找不到)服务器找不到请求的网页。 禁用405(方法已禁用)请求中指定的方法。 406(不允许)无法使用请求的内容属性响应请求的网页。 407(需要代理权限)此状态代码类似于401(没有权限),但请求者必须授权使用代理。408(请求超时)服务器等待请求时发生超时。 409(冲突)服务器完成请求时发生冲突。服务器必须在响应中包含冲突的信息。 410(已删除)如果请求的资源被永久删除,服务器将返回此响应。 411(需要有效长度)服务器不接受没有有效内容长度标头字段的请求。 412(不符合先决条件)服务器不符合请求者在请求中设置的先决条件之一。 413(请求对象太大)服务器无法处理请求。这是因为请求对象太大,超出了服务器的处理能力。 414(请求的URI太长)请求的URI(通常是URL)太长,服务器无法处理。 415(不支持的媒体类型)请求的格式在请求页上不受支持。 如果416(请求范围不符合要求)页面无法提供请求范围,服务器将返回此状态代码。 417(未满足期望)服务器不符合“期望”请求标头字段的要求。 5: 5xx(服务器错误)这些状态代码表示在尝试处理请求时,服务器发生了内部错误。这些错误可能是服务器本身的错误,而不是请求错误。 500(服务器内部错误)服务器出错,无法完成请求。 501(尚未实施)服务器没有完成请求的功能。例如,服务器无法识别请求方法时,可能会返回此代码。 502(错误网关)服务器作为网关或代理从上游服务器收到错误的响应。 503(服务不可用)服务器当前不可用(超载或停机维护)。一般来说,这是暂时的状态。 504(网关超时)服务器作为网关或代理运行,但未及时从上游服务器收到请求。 505(不支持的http版本)服务器不支持请求中使用的HTTP协议版本。 日志分析 服务器响应状态代码通常有状态代码200,301,302,304,404,500等。200意味着成功获取用户请求的文件,如果是搜索引擎,则证明蜘蛛在此次爬虫中成功发现了新内容。301是用户访问的页面URL之一,301重定向(永久),302是临时重定向。404意味着访问的页面不再存在,或者访问的URL完全错误。500是服务器的错误。 19967表示已捕获19967字节 如果日志的格式不正确,则表示日志格式设置不同。 从很多日志可以看出,200和200 0 64都表示正常的捕捉。 捕捉频率可以从每日日志中看到百度蜘蛛的捕捉次数来判断。捕捉频率没有规定的时间表或频率号码,我们一般通过多日的对数比较来判断。 当然,我们希望百度蜘蛛每天捕捉的次数越多越好。