2024年闫宝龙祝大家龙年吉祥如意,财源滚滚!

当前位置:首页 » 日常随记 » 正文

助力全球营销

网站开发者如何解除封禁百度蜘蛛

744 人参与  2020年11月27日 23:17  分类 : 日常随记  评论

近期收到一些开发者反馈,为什么网站或智能小程序资源的内容非常优质,但是没有查询到百度蜘蛛抓取记录,或在百度搜索中没有得到收录和展现?

在技术分析后发现,有些网站或智能小程序存在封禁百度蜘蛛的情况,导致百度蜘蛛无法正常抓取,所以无法在百度搜索中正常收录和展现,或在搜索结果中的摘要展现为“存在robots封禁”字样。

为了让广大开发者的网站或小程序,在百度搜索中得到正常的收录和展现,建议开发者及时根据以下内容自查,解除封禁问题,并通过链接提交工具主动提交给我们。

常见的封禁行为包括robots封禁、封禁百度UA、封禁百度IP等。

如何验证网站和智能小程序是否存在封禁百度蜘蛛的情况?


1、首先, 查看robots.txt文件,是否存在封禁记录。(一般robots.txt文件放置在网站根目录下。)

【建议方案】解除robots封禁:robots封禁情况,请检查robots.txt文件,及时修改。

robots文件说明:https://ziyuan.baidu.com/college/articleinfo?id=1516

 

2、robots文件无异常,进一步排查是否存在封禁百度UA情况;

方案一:执行 curl --head --user-agent 'Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)' --request GET 'xxxxxxx'

注:正常返回码是200,其他情况为异常。

xxxxxxx为网站域名,如:http://abc.com.cn

正确识别和获取百度蜘蛛,https://ziyuan.baidu.com/college/articleinfo?id=2855

 

方案二:变更浏览器UA验证;

【建议方案】解除百度UA封禁:查看网站反爬虫策略,进行策略调整。或针对百度UA添加策略白名单。

 

3、以上验证均无异常,最后进一步排查是否存在IP级别的封禁;

常见的IP封禁,源自网站的防火墙系统配置,需要查看防火墙配置系统后台,检查是否存在百度蜘蛛的IP级别封禁措施。

【建议方案】解除百度IP封禁:查看网站反爬虫策略,进行策略调整。


来源:闫宝龙(微信/QQ号:18097696),转载请保留出处和链接!

版权声明1,本站转载作品(包括论坛内容)出于传递更多信息之目的,不承担任何法律责任,如有侵权请联系管理员删除。2,本站原创作品转载须注明“稿件来源”否则禁止转载!

本文链接:http://www.yanbaolong.com.cn/post/408.html

<< 上一篇 下一篇 >>
海量短视频营销

网站首页 | 客户营销 | 营销技巧 | 网站SEO | 案例分享 | 海外推广 | 科技资讯 | 海外营销 | 日常随记 | 关于闫宝龙 | 免责说明 | 网站地图

Copyright@2004-2024 闫宝龙官方网址www.YBL.cn 联系邮箱:im@Ybl.cn
网站备案号:陕ICP备19006681号-6