如何查看SEO优化日-网站日志？如何使用-优化动态技巧基础知识-可可网络

如何查看SEO优化日-网站日志？如何使用

来源： 2021-08-23

如何查看SEO优化日-网站日志？如何使用？有什么规则吗？如何查看网站日志？如何使用？有什么规则吗？你觉得怎么样？首先要明确日志各部分的意义。推荐在线分析(我直接从日志文件DW下载分析，比较亲测，向开发者订购32个非常准确的工具！)。使用方法：可以看到，我们需要通过日志记录来更正网站的问题，所以网站是引擎的首选。有什么规则吗？引擎中有各种IP段的蜘蛛。 1、捕捉蜘蛛的其他内容 2、抓蜘蛛的权重页、抓蜘蛛的低权重页 3、蜘蛛的另一页 4、新站爬行蜘蛛 5，K站，会进入捕沙盒蜘蛛 7、捕捉蜘蛛的高频(每日更新) 8、新网站或异常网站蜘蛛 9.不间断巡逻的蜘蛛210.72.225。*(这是我们通常理解的引擎蜘蛛抓住网站的情况。我一直以为百度上有一只蜘蛛。每天不断出入各种网站，但事实上，这只是例行程序。） 10、用户访问IP 它还包含进入网站的位置、用户搜索时显示网站、用户单击、搜索照片时进入的位置。进入时间，等等(下面详细说明，不同的IP对网站有不同的意义，不仅是因为301、200、304、404等，还因为日志中的信息量很大。）如果你知道这些内容，引擎就应该是123.125.71。通过日志可以知道，只发送*来处理权重低的网页。经常这个 IP段的蜘蛛访问后返回304。304表示网页没有更改。什么，通过这一点，我们知道两个问题：首先要更新这个网站。第二，这个网站的权重不高，需要内外锚吗？(每个日志都清楚地记录了某一页的返回信息，但对第一页的捕获除外。）等待IP段的蜘蛛和返回代码、访问的网页等，有助于改善主页。日志是这样用的。请仔细阅读以下内容：为了让大家获得更好的研究日志。不同IP段蜘蛛的意义1: 121.14.89。*该IP段被用作超过新站视察期间。 123.125.68。*这种蜘蛛经常来，其他蜘蛛来的少，这表明网站可能进入沙盒，或者降低嫌疑人的权利。 220.181.7。* 123.125.66。*代表百度蜘蛛IP访问，准备抓东西。 220.181.68。*每天只要这个IP段增加，就很有可能进入沙盒或K站。203.208.60。*此IP部分在新工作站和站点出现异常现象后出现。 210.72.225。*该IP段不间断地巡逻各站。二： 123.125.71。*内部页面上包含的、权重低、登上这一段的内部页面句子(internal page)不是原件或采集句子(capture)，因此不会很快被释放第三： 125.90.88。*广东茂名市电信也是百度蜘蛛IP的主要成分，因为新鲜站多，站长工具或SEO综合检查。四：第220.181段属于加权IP段。本段上传的文章或网站基本上是24小时释放。 220.181.108.75主要捕获更新文章内部页面90%，8%捕获主页，2%其他。加权IP段、上传的句子或主页基本上24小时释放。 220.181.108.77专用主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.80专用捕获主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.83专用捕获主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.86专用捕获主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.89专用捕获主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.91是综合性的，主要属于主页和内页或其他、加权IP段，上传的文章或主页基本上24小时释放。网页捕捉，如220 . 181 . 108 . 92%，其他(非内部页面) 220.181.108.94专用捕获主页IP加权段，普通返回代码304 0表示未更新。 220.181.108.95这是百度抓取主页的专用IP。如果是220.181.108段，基本上你的网站每天晚上都会拍快照。 220.181.108.97专用捕获主页IP加权段，普通返回代码304 0表示未更新。五：注意===以上IP尾数还有很多，但段相同的123.125.71。*段IP表示内部页面捕获的权重比较低。可能是因为文章收集或文章拼写暂时收录，但没有公开。(即未定) 220.181.108。*第IP节主要占主页的80%，内页占30%，是这个爬上去的句子或主页。六：与其相信所有所谓的书，不如没有书。以上只能作为参考，不能完全沿袭。如果还能看到未知的百度IP蜘蛛，可能是部分(站长工具)的模拟蜘蛛IP。网站日志中返回代码的含义 1: 1xx(临时响应)表示临时响应，是指示请求者必须继续工作的状态代码。 100(续)请求者必须继续请求。服务器返回此代码，表示收到了请求的第一部分布恩，我在等剩下的部分。 101(切换协议)请求者请求服务器切换协议，服务器已确认，准备切换。 2: 2xx(成功)是指示请求已成功处理的状态代码。 200(成功)服务器已成功处理请求。通常，这意味着服务器提供请求的网页。 201(生成)请求成功，服务器中创建新资源。 202(已接受)服务器已接受请求，但尚未处理。 203(非批准信息)服务器已成功处理请求，但返回的信息可能来自其他来源。 204(无内容)服务器已成功处理请求，但未返回任何内容。 205(内容重置)服务器已成功处理请求，但未返回任何内容。 206(部分内容)服务器已成功处理部分GET请求。 3: 3xx(重定向)表示完成请求需要额外的工作。通常，这些状态代码用于重定向。 300(多种选项)服务器可以对请求执行多种操作。服务器可以根据请求者(useragent)选择任务，或提供请求者可以选择的任务列表。 301(永久移动)请求的网页已永久移动到新位置。服务器返回此响应(对GET或HEAD请求的响应)后，请求者将自动移动到新位置。 302(临时移动)服务器当前正在其他位置的网页上响应请求，但请求者必须继续使用原始位置，以便将来请求。 303(查看其他位置)请求者需要对其他位置使用单独的GET请求检索响应时，服务器将返回此代码。 304(未修改)自上次请求以来，请求的网页未被修改。服务器返回此响应时，不返回网页内容。 305(使用代理)请求者只能使用代理访问请求的网页。如果服务器返回此响应，请求者也必须使用代理。 307(临时重定向)服务器当前正在其他位置的网页上响应请求，但请求者必须继续使用原始位置，以便将来请求。 4: 4xx(请求错误)这些状态代码表示请求无效，可能会妨碍服务器处理。400(错误请求)服务器不理解请求语法。 401(未授权)请求需要认证。对于需要登录的网页，服务器可以返回此响应。 403(禁止)服务器拒绝了请求。 404(找不到)服务器找不到请求的网页。禁用405(方法已禁用)请求中指定的方法。 406(不允许)无法使用请求的内容属性响应请求的网页。 407(需要代理权限)此状态代码类似于401(没有权限)，但请求者必须授权使用代理。408(请求超时)服务器等待请求时发生超时。 409(冲突)服务器完成请求时发生冲突。服务器必须在响应中包含冲突的信息。 410(已删除)如果请求的资源被永久删除，服务器将返回此响应。 411(需要有效长度)服务器不接受没有有效内容长度标头字段的请求。 412(不符合先决条件)服务器不符合请求者在请求中设置的先决条件之一。 413(请求对象太大)服务器无法处理请求。这是因为请求对象太大，超出了服务器的处理能力。 414(请求的URI太长)请求的URI(通常是URL)太长，服务器无法处理。 415(不支持的媒体类型)请求的格式在请求页上不受支持。如果416(请求范围不符合要求)页面无法提供请求范围，服务器将返回此状态代码。 417(未满足期望)服务器不符合“期望”请求标头字段的要求。 5: 5xx(服务器错误)这些状态代码表示在尝试处理请求时，服务器发生了内部错误。这些错误可能是服务器本身的错误，而不是请求错误。 500(服务器内部错误)服务器出错，无法完成请求。 501(尚未实施)服务器没有完成请求的功能。例如，服务器无法识别请求方法时，可能会返回此代码。 502(错误网关)服务器作为网关或代理从上游服务器收到错误的响应。 503(服务不可用)服务器当前不可用(超载或停机维护)。一般来说，这是暂时的状态。 504(网关超时)服务器作为网关或代理运行，但未及时从上游服务器收到请求。 505(不支持的http版本)服务器不支持请求中使用的HTTP协议版本。日志分析服务器响应状态代码通常有状态代码200，301，302，304，404，500等。200意味着成功获取用户请求的文件，如果是搜索引擎，则证明蜘蛛在此次爬虫中成功发现了新内容。301是用户访问的页面URL之一，301重定向(永久)，302是临时重定向。404意味着访问的页面不再存在，或者访问的URL完全错误。500是服务器的错误。 19967表示已捕获19967字节如果日志的格式不正确，则表示日志格式设置不同。从很多日志可以看出，200和200 0 64都表示正常的捕捉。捕捉频率可以从每日日志中看到百度蜘蛛的捕捉次数来判断。捕捉频率没有规定的时间表或频率号码，我们一般通过多日的对数比较来判断。当然，我们希望百度蜘蛛每天捕捉的次数越多越好。