?? 有的網站使用了不利于蜘蛛爬行的技術,這些技術被稱為蜘蛛陷阱。網站想要有好的排名就必須避免這些蜘蛛陷阱。避免蜘蛛陷阱應該先了解網站常見的蜘蛛陷阱有哪些。
1. Flash
在網頁的某一小部分使用Flash增強視覺效果是很正常的,比如用Flash做成的廣告、圖標等。這種小Flash和圖片是一樣的,頁面上還有其他以 文字為主的內容,所以對搜索引擎爬行沒有影響。但是有的網站整個首頁就是一個Flash文件,這就形成了蜘蛛陷阱。搜索引擎抓取的HTML代碼只有一個 Flash文件的鏈接,沒有其他文字內容。搜索引擎無法讀取Flash文件中的內容。也有的網站喜歡在首頁放一個Flash動畫片頭(Flash Intro),用戶訪問網站看完片頭后跳轉到真正的HTML版本的網站首頁。搜索引擎不能讀取Flash,也就無法從Flash Intro跟蹤到HTML版本頁面。
2. 各種跳轉
除了301重定向以外,搜索引擎對其他形式的跳轉都比較敏感,如302跳轉、Js跳轉、Flash 跳轉。如果必須跳轉,301重定向是搜索引擎推薦用于URL更改的跳轉,可以把頁面權重從舊網址轉移到新網址。其他跳轉方式都對蜘蛛爬行不利,黑帽SEO 經常使用跳轉欺騙搜索引擎,所以很多跳轉對搜索引擎都不友好。除非萬不得己,否則盡量不要使用301重定向以外的跳轉。
3. 框架結構
使用框架結構設計頁面,曾經挺流行,因為對網站的頁面更新維護十分方便。不過現在的網站已經很少使用框架了,不利于搜索引擎爬行是框架越來越不流行的 原因之一。對搜索引擎來說,訪問一個使用框架的網頁,所抓取的HTML只包含調用其他HTML文件的代碼,并不包含任何文字信息,搜索引擎無法判斷這個網 頁的內容是什么。雖然蜘蛛可以跟蹤框架中所調用的其他HTML文件,但是這些文件是不完整的頁面。搜索引擎也無法判斷框架中的頁面內容應該屬于主框架,還 是屬于框架調用的文件。
4. JavaScript 鏈接
由于JavaScript可以創造出很多吸引人的視覺效果,有些網站喜歡使用JavaScript腳本生成導航系統。這也是比較嚴重的蛛蛛陷阱之一。雖然搜索引擎都在嘗試解析JS腳本,不過我們不能寄希望于搜索引擎去克服困難,而應該讓搜索引擎爬行的工作盡量容易。
據觀察,雖然有的搜索引擎在技術上可以獲得JavaScript腳本中包含的鏈接,甚至可以執行腳本并跟蹤鏈接,但對一些權重比較低的網站,搜索引擎 覺得沒有必要,便不會費那個勁。所以網站上的鏈接必須使用最簡單標準的HTML鏈接。尤其是導航系統,用CSS做導航系統一樣可以實現很多視覺效果。
5. 要求登錄
有些網站需要用戶登錄之后才能看到內容,這部分內容搜索引擎無法爬行。蜘蛛不能填寫用戶名、密碼,也不會注冊。
如果想要網站排名靠前,那么網站設計時就應該盡量避免蜘蛛陷阱,蜘蛛無法爬行網站,搜索引擎無法收錄網頁,那就更加不要談什么快照,什么排名了。
發表評論 取消回復