robots.txt禁止访问特定目录下的部分文件怎么写?

日期:2016-06-16 16:52:02 人气:1

robots.txt禁止访问特定目录下的部分文件怎么写?

生动的叫做“蜘蛛” 蜘蛛在爬去网站页面之前,会先去访问网站根目录下面的一个文件,就是robots.txt。这个文件其实就是给“蜘蛛”的规则,如果没有这个文件,蜘蛛会认为你的网站同意全部抓取网页。 Robots.txr文件是一个纯文本文件,可以告诉蜘蛛哪些页面可以爬取(收录),哪些页面不能爬取。 举个例子:建立一个名为robots.txt的文本文件,然后输入 User-agent: * 星号说明允许所有搜索引擎收录 Disallow: index.php? 表示不允许收录以inde
    A+
热门评论