robots.txt是搜索引擎中的一个协议,当你的网站有一些内容不想给蜘蛛爬取,那可以利用robots.txt来告诉蜘蛛不要去爬取这些页面,不爬取这些页面当然就不收录了。
robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。
robots.txt规则怎么写
新建一个txt文本,命名为robots.txt,比如说你不想给蜘蛛去爬你网站后台这个文件夹,那就就这样写,该文件放在网站根目录
User-agent: *
Disallow: /admin/
解释:
User-agent: * 这个是代表所有搜索引擎
Disallow: /admin/ 禁止爬取admin这个文件夹
Disallow: / 代表根目录所有
Allow: / 代表允许 例子:比如说你禁止webdesgn文件夹 但是你又想让他收录webdesign下的wangzhanjianshe 写法Allow: /webdesign/wangzhanjianshe/*.html 收录webdesign下的wangzhanjianshe下的所有html
如果你只想对百度有效,那就这样写。User-agent: Baiduspider 这样只对百度有效,其它搜索引擎不受限制。
搜索引擎蜘蛛的名字:Baiduspider 百度蜘蛛、Googlebot 谷歌蜘蛛、Bingbot 必应蜘蛛、360Spider 360蜘蛛、Sogouspider 搜狗蜘蛛
扫描二维码与小二CMS创始人沟通:
小二CMS专注于高端网站定制、系统开发、商城开发、外贸网站建设、公众号开发、小程序开发、网站优化推广、安全运维等技术领域。是高端定制网站领域著名服务商!
在智能家居从概念走向现实的今天,消费者对"全屋智能"的期待已从科幻电影中的场景,转化为对便捷、舒适、个性化居住体验的切实需求。
在微信生态中构建网站已成为企业品牌展示、用户运营与商业转化的核心场景。区别于传统网站,微信网站需深度适配微信的交互逻辑与功能接口,实现从流量获取到用户沉淀的闭环。
在移动互联网迅猛发展的当下,微信作为一款拥有庞大用户群体的超级应用,不仅改变了人们的社交方式,也深刻影响了商业运营模式。
在数字化浪潮席卷的今天,一个专业、高效且符合企业特色的网站已成为企业展示形象、拓展业务、提升竞争力的关键窗口。
在人工智能(AI)技术以迅猛之势席卷各个领域的当下,一个疑问悄然浮现:网站是否会被AI工具替代?
在用户注意力碎片化、搜索引擎排名与加载速度强关联的今天,网站访问速度已成为影响用户体验、转化率及SEO效果的核心指标。
在搜索引擎流量成本持续攀升的背景下,企业SEO投入与产出比成为核心关注点。SEO关键词排名收费模式已从传统的“按词计费”向“效果导向+技术赋能”转型
在数字化竞争白热化的今天,企业网站已从“信息展示窗口”升级为“品牌价值载体”与“用户转化引擎”。