向書(shū)本學(xué)習(xí),還要向?qū)嵺`學(xué)習(xí)、向生活學(xué)習(xí)。消化已有知識(shí),
而且要力求有所發(fā)現(xiàn)、有所發(fā)明、有所創(chuàng)造
2019/3/3 16:48:37
什么是spider?(引擎蜘蛛)
spider是搜索引擎的一個(gè)自動(dòng)程序。它的作用是訪問(wèn)互聯(lián)網(wǎng)上的html網(wǎng)頁(yè),建立索引數(shù)據(jù)庫(kù),使用戶能在搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁(yè)。
spider對(duì)一個(gè)網(wǎng)站服務(wù)器造成的訪問(wèn)壓力如何?
spider會(huì)自動(dòng)根據(jù)服務(wù)器的負(fù)載能力調(diào)節(jié)訪問(wèn)密度。在連續(xù)訪問(wèn)一段時(shí)間后,spider會(huì)暫停一會(huì),以防止增大服務(wù)器的訪問(wèn)壓力。所以在一般情況下,spider對(duì)您網(wǎng)站的服務(wù)器不會(huì)造成過(guò)大壓力。
為什么spider不停的抓取我的網(wǎng)站?
對(duì)于您網(wǎng)站上新產(chǎn)生的或者持續(xù)更新的頁(yè)面,spider會(huì)持續(xù)抓取。此外,您也可以檢查網(wǎng)站訪問(wèn)日志中spider的訪問(wèn)是否正常,以防止有人惡意冒充 spider來(lái)頻繁抓取您的網(wǎng)站。如果您發(fā)現(xiàn)spider非正常抓取您的網(wǎng)站,請(qǐng)發(fā)送反饋郵件到該搜索引擎,并請(qǐng)盡量給出spider對(duì)貴站的訪問(wèn)日志,以便于我們跟蹤處理。
我不想我的網(wǎng)站被spider訪問(wèn),我該怎么做?
spider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止spider訪問(wèn)您的網(wǎng)站,或者禁止spider訪問(wèn)您網(wǎng)站上的部分文件。 注意:禁止spider訪問(wèn)您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁(yè),在搜索引擎以及所有提供搜索引擎服務(wù)的搜索引擎中無(wú)法被搜索到。
關(guān)于robots.txt的寫(xiě)作方法,請(qǐng)參看我們的介紹:robots.txt寫(xiě)作方法
為什么我的網(wǎng)站已經(jīng)加了robots.txt,還能在搜索出來(lái)?
因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間。雖然spider已經(jīng)停止訪問(wèn)您網(wǎng)站上的網(wǎng)頁(yè),但搜索引擎數(shù)據(jù)庫(kù)中已經(jīng)建立的網(wǎng)頁(yè)索引信息,可能需要二至四周才會(huì)清除。 另外也請(qǐng)檢查您的robots配置是否正確。
蜘蛛在robots.txt中的名字是什么?
“spider”全部為小寫(xiě)字母。
spider多長(zhǎng)時(shí)間之后會(huì)重新抓取我的網(wǎng)頁(yè)?
搜索引擎每周更新,網(wǎng)頁(yè)視重要性有不同的更新率,頻率在幾天至一月之間,spider會(huì)重新訪問(wèn)和更新一個(gè)網(wǎng)頁(yè)。
知道了什么是SPIDER蜘蛛,那么怎么才能知道蜘蛛是否來(lái)過(guò)你的站?這個(gè)可以從你服務(wù)器或者虛擬主機(jī)的日志中看出來(lái),如果你還想知道有沒(méi)有其它搜索引擎的蜘蛛來(lái)過(guò)你的站,你可以在日志文件中搜索“spider”這個(gè)詞,或者搜索蜘蛛的IP,查看蜘蛛是否來(lái)過(guò)你的站,IIS日志與Apache的日志是一樣的,都可以查到。
下面是整理出來(lái)的一些搜索蜘蛛的地址
1 202.106.186.* 163蜘蛛
2 202.108.36.* 163蜘蛛
3 202.108.44.* 163蜘蛛
4 202.108.45.* 163蜘蛛
5 202.108.5.* 163蜘蛛
6 202.108.9.* 163蜘蛛
7 220.181.12.* 163蜘蛛
8 220.181.13.* 163蜘蛛
9 220.181.14.* 163蜘蛛
10 220.181.15.* 163蜘蛛
11 220.181.28.* 163蜘蛛
12 220.181.31.* 163蜘蛛
13 222.185.245.* 163蜘蛛
14 202.165.100.* 3721蜘蛛
220.181.38.177 百度蜘蛛
15 220.181.19.* 百度蜘蛛
16 159.226.50.* 百度蜘蛛
17 202.108.11.* 百度蜘蛛
18 202.108.22.* 百度蜘蛛
19 202.108.23.* 百度蜘蛛
20 202.108.249.* 百度蜘蛛
21 202.108.250.* 百度蜘蛛
22 61.135.145.* 百度蜘蛛
23 61.135.146.* 百度蜘蛛
24 64.124.85.* become.com
25 61.151.243.* china蜘蛛
26 202.165.96.* gais.cs.ccu.edu.tw
27 216.239.33.* google蜘蛛
28 216.239.3
深圳市南山區(qū)南山街道南海大道西桂廟路北陽(yáng)光華藝大廈1棟4F、4G-04
咨詢電話:136 8237 6272
大客戶咨詢:139 0290 5075
業(yè)務(wù)QQ:195006118
技術(shù)QQ:179981967
深圳精銳軟件 深圳APP開(kāi)發(fā) 深圳小程序開(kāi)發(fā) 深圳微信開(kāi)發(fā) 深圳APP制作 深圳營(yíng)銷推廣 深圳網(wǎng)站建設(shè) 深圳游戲開(kāi)發(fā)
客戶案列
新聞資訊
資質(zhì)榮譽(yù)
團(tuán)隊(duì)風(fēng)采
項(xiàng)目進(jìn)度查詢
售前QQ咨詢
QQ溝通 項(xiàng)目QQ溝通