企業(yè)網(wǎng)站必須要注意避免的蜘蛛陷阱
第一、FLASH
有的網(wǎng)站整個首頁就是一個很大的flash,這就構(gòu)成了蜘蛛陷阱。搜索引擎住宅區(qū)的html代碼只有一個鏈向flash文件的鏈接,沒有其他文字內(nèi)容。
還有網(wǎng)站在首頁的banner就使用一個flash,并且添加活動鏈接,雖然對用戶來說能夠直觀的看到活動內(nèi)容,但是對于蜘蛛來說,就無法識別,而且抓取不到flash的鏈向地址。
第二、Session ID
有些網(wǎng)站使用sission ID(會話ID)跟蹤用戶訪問,每個用戶訪問都會生成一個獨特唯一的session ID,加在URL中。搜索引擎蜘蛛的每一次訪問也會被當成一個新的用戶,URL中會加上一個不同的session ID,這樣搜索引 擎每次來訪問時所得到的同一個頁面的URL將不一樣,后面帶著一個不一樣的session ID。這也是最常見的蜘蛛陷阱之一。
第三、各種跳轉(zhuǎn)
除了301跳轉(zhuǎn)以外,搜索引擎蜘蛛對其他形式的跳轉(zhuǎn)都比較敏感,如302跳轉(zhuǎn),javascript跳轉(zhuǎn)、meta refresh 跳轉(zhuǎn)。
如果必須轉(zhuǎn)向,301轉(zhuǎn)向是搜索引擎推薦的、用于網(wǎng)站更改的轉(zhuǎn)向,可以吧頁面權(quán)重從舊網(wǎng)址轉(zhuǎn)移到新網(wǎng)址。其他的轉(zhuǎn)向方式都對蜘蛛爬行不利。所以除非萬不得已,盡量不要使用301轉(zhuǎn)向以外的跳轉(zhuǎn)。
第四、框架結(jié)構(gòu)
使用框架結(jié)構(gòu)設(shè)計頁面,在網(wǎng)站誕生初期曾經(jīng)聽流行,但是現(xiàn)在網(wǎng)站已經(jīng)很少使用框架了,不利于搜索引擎抓取是框架越來越不流行的重要原因之一,對于搜索引擎來說,訪問一個使用框架的網(wǎng)址所抓取的html只包含調(diào)用其他html文件的代碼,并不包含任何文字信息。搜索引擎無法判斷這個網(wǎng)址的內(nèi)容是什么。
總之,如果你的網(wǎng)站還在使用框架,或者你的老板要使用框架結(jié)構(gòu),唯一要記住的是,忘記使用框架這回事。和Flash一樣,別浪費時間研究怎么讓搜索引擎收錄框架結(jié)構(gòu)網(wǎng)站。
第五、動態(tài)URL
動態(tài)URL值的是數(shù)據(jù)庫驅(qū)動的網(wǎng)站所生成的、帶有問號、等號及參數(shù)的網(wǎng)址。一般來說動態(tài)URL不利于搜索引擎蜘蛛爬行,應該盡量避免。雖然百度現(xiàn)在已經(jīng)能夠識別動態(tài)URL了,但是也不能保證百分百能識別。
第六、javaScript鏈接
由于javaScript可以創(chuàng)再出很多吸引人的視覺效果,有些網(wǎng)站喜歡使用javascript腳本生成導航系統(tǒng)。這也是比較嚴重的蜘蛛陷阱之一,雖然搜索引擎都在嘗試解析JS腳本,不過我們不能寄希望與搜索引擎自己去客服困難,而要讓搜索引擎跟蹤爬行鏈接的工作盡量簡單容易。
jacascritp鏈接在SEo中也有特殊用途,那就是站長不希望被收錄的頁面,比希望被百度抓起的鏈接,可以使用javascript腳本阻止搜索引擎蜘蛛爬行
第七、要求登錄
有些網(wǎng)站的內(nèi)容需要用戶登錄后才能看到的頁面,這部分內(nèi)容搜索引擎是無法看到的。這個要注意確定是否是需要登錄以后才能看到。
第八、強制使用cookies
很多網(wǎng)站為了實現(xiàn)某種功能,強制使用cookies,用戶瀏覽器如果沒有啟用cookies,頁面顯示不正常。搜索引擎蜘蛛就相當于一個禁止了cookies的瀏覽器,強制使用cookies只能造成搜索引擎蜘蛛無法正常訪問。