接下來我們探討HTML方面的問題:
(一)HTML結(jié)構(gòu)化單元
(二)內(nèi)容突出和表格
(三)幀
(四)表單
HTML結(jié)構(gòu)化單元
通常,HTML提供的結(jié)構(gòu)化單元可以幫助搜索引擎從全局上了解文件內(nèi)容,以及定位邏輯分區(qū)和重要部分,例如<h1>和<h2>,<b>標(biāo)簽等。如果在HTML代碼中沒有給出此類結(jié)構(gòu)化單元,搜索引擎將完全根據(jù)自己的判斷工作。
大多手工編寫的網(wǎng)站在這方面做得很好,特別是在搜索引擎營銷人員參與動作后。但是通常很多內(nèi)容管理系統(tǒng)在這方面不盡如人意。所見即所得的網(wǎng)頁制作軟件一般不使用這類標(biāo)簽,而是使用style屬性中內(nèi)嵌的CSS來生成HTML。這些因素不利于針對搜索引擎的優(yōu)化。請看下面這段代碼:
<ol>
<li>Item1</li>
<li>Item2</li>
<li>Item3</li>
</ol>
雖然在當(dāng)前運用的樣式表下,屏幕上顯示的內(nèi)容完全相同,但上面這段代碼比下面這段代碼提供了更多的語義信息:
<img src='buller.gif'>Item1<br>
<img src='buller.gif'>Item2<br>
<img src='buller.gif'>Item3<br>
如果已經(jīng)使用了所見即所得編輯器開發(fā)了WEB內(nèi)容,那么好通過手工編輯已生成的HTML代碼來優(yōu)化內(nèi)容。當(dāng)然,也可以選擇直接創(chuàng)建HTML而不使用這種編輯器。在這里,將介紹另一種解決方案,即使用自定義標(biāo)記語言來解決這個問題。
內(nèi)容突出和表格
內(nèi)容突出指的是物理上的深度,即該內(nèi)容在HTML文檔中的實際起始位置。由于搜索引擎對越靠近HTML文檔頂端的內(nèi)容越重視,所以要盡量避免在頁面的初始內(nèi)容中設(shè)置重復(fù)和不相關(guān)的內(nèi)容。
通常的內(nèi)容格式中,沒有必要設(shè)置在HTML文件頂端的是JavaScript代碼。好將位于HTML文檔頂端的JavaScript代碼移到底部,或者移到單獨的文件中,因為JavaScript包含網(wǎng)絡(luò)蜘蛛難以檢索的大量腳本??梢允褂孟旅娴拇a調(diào)用外部JavaScript文件:
<script src='my_script.js'></script>
注意:調(diào)用外部JavaScript文件時,不要忽略了</script>標(biāo)簽,否則瀏覽器不會執(zhí)行該腳本。
這個問題的另一種常見的表現(xiàn)形式就是,由于很多基于表格的站點將導(dǎo)航單元置于網(wǎng)頁左邊,也會出現(xiàn)上述問題。因為以這種方式使用表格,將會把主要內(nèi)容的物理位置向下推,從而導(dǎo)致頁面在搜索引擎中的排名更加靠后。由于導(dǎo)航單元在文檔中的物理位置很靠前,如果導(dǎo)航單元設(shè)置過多,還將導(dǎo)致搜索引擎將無法判斷頁面的主要內(nèi)容:
提示:搜索引擎會檢測頁面上的重復(fù)單元,例如物理位置在主要內(nèi)容之前的導(dǎo)航單元,然后盡可能多地忽略這些單元?,F(xiàn)代搜索引擎不只看源文檔中內(nèi)容的物理位置,而是檢查出內(nèi)容實際顯示出現(xiàn)的位置。盡管如此,避免出現(xiàn)導(dǎo)航單元帶來的問題,總會帶來好處。
要解決這個問題,有如下三種方法:
(一)使用純CSS類替代表格進(jìn)行排版。這樣可以任意確定頁面內(nèi)容的順序。
(二)在使用表格排版時,可以將導(dǎo)航單元放置在頁面右邊。
(三)使用表格技巧技術(shù)。該技術(shù)使用HTML手法在維持表格的出現(xiàn)順序的同時,逆置表格單元在文檔中的物理位置順序。
這并不是說網(wǎng)頁中完全不能出現(xiàn)表格。如果在網(wǎng)頁中使用了表格,可以將其中一部分表格轉(zhuǎn)換為CSS版本。由于表格一般占有很大一片覆蓋區(qū),所以要縮減HTML代碼規(guī)模。好從代碼中的重復(fù)單元著手。
表格技巧說明
表格技巧使用2*2的表格,先進(jìn)行先進(jìn)個單元為空,第二個單元中將rowspan設(shè)置為2,接著將導(dǎo)航信息放入第二行的先進(jìn)個單元。
以下是一個簡單的HTML示例:
<table>
<tr>
<td valign=top>Navigation</td>
<td valign=top>Content</td>
</table>
此時,可以通過重寫HTML代碼,在不改變外觀順序的同時,將文檔中的相關(guān)內(nèi)容前置,代碼如下所示:
<table>
<tr>
<td></td>
<td>Content</td>
</tr>
<tr>
<td>Navigation</td>
</tr>
</table>
通過這個方法,可以使文檔中導(dǎo)航代碼的物理位置在內(nèi)容的物理位置之下,而且當(dāng)代碼載入瀏覽器時,導(dǎo)航仍會出現(xiàn)在頁面左邊。
幀
由于在使用幀時會出現(xiàn)很多問題,以致有很多設(shè)計者都對為什么要使用幀感到困惑。搜索引擎在搜索含有幀的網(wǎng)站時,會出現(xiàn)很多問題。當(dāng)一個頁面中包含與上下文相關(guān)的幀時,搜索引擎不能為該頁面創(chuàng)建索引,只有單個幀頁面才能被索引。但在經(jīng)常用導(dǎo)航幀將這些幀相關(guān)起來,這樣一來,即使一些單個幀頁面被索引了,也有可能使得用戶收到不帶導(dǎo)航的孤立頁面。對這個問題也有一個解決方法,然而此方法又會導(dǎo)致其他問題;noframes標(biāo)簽試圖處理這個問題,但它只是個不可見的頁上因素,并且被垃圾網(wǎng)站濫用。任何使用幀的網(wǎng)頁都會存在上述問題,因此建議設(shè)計網(wǎng)頁時不要使用幀。
Jacob Nielsen在1996年就提出了這個問題,并建議不要使用幀。10年過去了,仍然沒有證據(jù)說明使用幀能夠帶來什么好處。而且與表格帶來的問題不一樣,幀的這些問題沒有那么簡單的解決方法。
使用表單
由于搜索引擎蜘蛛不提交任何表單,導(dǎo)致表單導(dǎo)航下的所有內(nèi)容都會被蜘蛛忽視。蜘蛛不會填寫表單,表單只能由下拉菜單、復(fù)選框和單選框三者的排列組合定義,但哪些組合能被蜘蛛提交并不可知。這種方法在實踐中并不可用。
提示:也有報告稱某些搜索引擎可以索引簡單表單下的內(nèi)容。例如,由一個下拉菜單組成的,可以指引用戶進(jìn)入一個特殊頁面的表彰,就是一種可被檢索的簡單表彰,但是,不推薦依賴這種方法檢索自己的表單頁面內(nèi)容。我們認(rèn)為,如果不應(yīng)該檢索某種靜音指向的內(nèi)容,那么好以明晰的排除機(jī)制排除該內(nèi)容,例如使用robots.txt或者robots meta標(biāo)簽。
沒有什么辦法可以解決這個問題。但是也有一個繞過去的方法,只要將腳本配置為接受來自GET請求的參數(shù),就可以在網(wǎng)站中的站點地圖或者其他地方設(shè)置某些表單請求的URL。
如果表單提交它的值并創(chuàng)建動態(tài)URL的代碼如下所示:
/search.php?category_id=1&color=red
那么同樣的鏈接就可以放到站點地圖,而蜘蛛可以檢索到它。
希望以上的這些信息能夠幫助您,如果您還有關(guān)于大連網(wǎng)站制作,大連網(wǎng)站建設(shè)及企業(yè)郵箱等相關(guān)問題,請與我們聯(lián)系,新圖聞科技將竭誠為您服務(wù)!