午夜蜜桃视频在线,看日韩激情网站,人妻超碰久久

robots.txt寫法大全和robots.txt語法的作用

1如果允許所有搜索引擎訪問網(wǎng)站的所有部分的話我們可以建立一個空白的文本文檔，命名為robots.txt放在網(wǎng)站的根目錄下即可。

robots.txt寫法如下：

User-agent: *

Disallow:

或者

User-agent: *

Allow: /

2如果我們禁止所有搜索引擎訪問網(wǎng)站的所有部分的話

robots.txt寫法如下：

User-agent: *

Disallow: /

3如果我們需要某一個搜索引擎的抓取的話，比如百度，禁止百度索引我們的網(wǎng)站的話

robots.txt寫法如下：

User-agent: Baiduspider

Disallow: /

4如果我們禁止Google索引我們的網(wǎng)站的話，其實跟示例3一樣，就是User-agent:頭文件的蜘蛛名字改成谷歌的Googlebot

即可

robots.txt寫法如下：

User-agent: Googlebot

Disallow: /

5如果我們禁止除Google外的一切搜索引擎索引我們的網(wǎng)站話

robots.txt寫法如下：

User-agent: Googlebot

Disallow:

User-agent: *

Disallow: /

6如果我們禁止除百度外的一切搜索引擎索引我們的網(wǎng)站的話

robots.txt寫法如下：

User-agent: Baiduspider

Disallow:

User-agent: *

Disallow: /

7如果我們需要禁止蜘蛛訪問某個目錄，比如禁止admin、css、images等目錄被索引的話

robots.txt寫法如下：

User-agent: *

Disallow: /css/

Disallow: /admin/

Disallow: /images/

8如果我們允許蜘蛛訪問我們網(wǎng)站的某個目錄中的某些特定網(wǎng)址的話

robots.txt寫法如下：

User-agent: *

Allow: /css/my

Allow: /admin/html

Allow: /images/index

Disallow: /css/

Disallow: /admin/

Disallow: /images/

9我們看某些網(wǎng)站的robots.txt里的Disallow或者Allow里會看很多的符號，比如問號星號什么的，如果使用“*”，主要是限制訪問某個后綴的域名，禁止訪問/html/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。

robots.txt寫法如下：

User-agent: *

Disallow: /html/*.htm

10如果我們使用“$”的話是僅允許訪問某目錄下某個后綴的文件

robots.txt寫法如下：

User-agent: *

Allow: .asp$

Disallow: /

11如果我們禁止索引網(wǎng)站中所有的動態(tài)頁面（這里限制的是有“?”的域名，例如index.asp?id=1）

robots.txt寫法如下：

User-agent: *

Disallow: /*?*

有些時候，我們?yōu)榱斯?jié)省服務器資源，需要禁止各類搜索引擎來索引我們網(wǎng)站上的圖片，這里的辦法除了使用“Disallow: /images/”這樣的直接屏蔽文件夾的方式之外，還可以采取直接屏蔽圖片后綴名的方式。

示例12

如果我們禁止Google搜索引擎抓取我們網(wǎng)站上的所有圖片(如果你的網(wǎng)站使用其他后綴的圖片名稱，在這里也可以直接添加)

robots.txt寫法如下：

User-agent: Googlebot

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

13如果我們禁止百度搜索引擎抓取我們網(wǎng)站上的所有圖片的話

robots.txt寫法如下：

User-agent: Baiduspider

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

14除了百度之外和Google之外，禁止其他搜索引擎抓取你網(wǎng)站的圖片

(注意，在這里為了讓各位看的更明白，因此使用一個比較笨的辦法——對于單個搜索引擎單獨定義。)

robots.txt寫法如下：

User-agent: Baiduspider

Allow: .jpeg$

Allow: .gif$

Allow: .png$

Allow: .bmp$

User-agent: Googlebot

Allow: .jpeg$

Allow: .gif$

Allow: .png$

Allow: .bmp$

User-agent: *

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

15僅僅允許百度抓取網(wǎng)站上的“JPG”格式文件

（其他搜索引擎的辦法也和這個一樣，只是修改一下搜索引擎的蜘蛛名稱即可）

robots.txt寫法如下：

User-agent: Baiduspider

Allow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

16僅僅禁止百度抓取網(wǎng)站上的“JPG”格式文件

robots.txt寫法如下：

User-agent: Baiduspider

Disallow: .jpg$

17如果 ? 表示一個會話 ID，您可排除所有包含該 ID 的網(wǎng)址，確保 Googlebot 不會抓取重復的網(wǎng)頁。但是，以 ? 結尾的網(wǎng)址可能是您要包含的網(wǎng)頁版本。在此情況下，沃恩可將與 Allow 指令配合使用。

robots.txt寫法如下：

User-agent:*

Allow:/*?$

Disallow:/*?

Disallow:/ *?

一行將攔截包含 ? 的網(wǎng)址（具體而言，它將攔截所有以您的域名開頭、后接任意字符串，然后是問號 (?)，而后又是任意字符串的網(wǎng)址）。Allow: /*?$ 一行將允許包含任何以 ? 結尾的網(wǎng)址（具體而言，它將允許包含所有以您的域名開頭、后接任意字符串，然后是問號 (?)，問號之后沒有任何字符的網(wǎng)址）。

18如果我們想禁止搜索引擎對一些目錄或者某些URL訪問的話，可以截取部分的名字

robots.txt寫法如下：

User-agent:*

Disallow: /plus/feedback.php?

參考地址：http://www.liuheng.org/yunying/634.html

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

robots.txt 暫時禁止、允許收錄整個網(wǎng)站

robots.txt 暫時禁止、允許收錄整個網(wǎng)站

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

robots.txt 暫時禁止、允許收錄整個網(wǎng)站

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av