Search Engine Optimization(搜尋引擎最佳化),簡稱SEO一直都是網站經營者不得不了解的一門技術。我一直很想找機會分享我對於SEO的看法,最近總算有了一點時間,就簡單整理一下我對於SEO的認知與作法。

所謂的SEO主要是將網頁內容與網站的結構,針對搜尋引擎的特性來進行調整,目的是希望藉由搜尋引擎上的曝光,幫網站帶來更多的流量。以下所談的SEO的看法,都是我個人的心得,如果文內有錯誤,或者是已經過時的資訊,還請多多包涵。另外本篇僅提供個人看法的分享,將不回答各式各樣相關的問題。

我將SEO簡單區分為三個大項的工作內容,分別是:1.網站結構、2.網站內容、3.外連結。在談這三個大項的內容之前,應該先提一下搜尋引擎運作的原理。

搜尋引擎的主要動作,包含了Crawling(資料抓取)、Preprocessing(資料處理與過濾)、Indexing(資料索引)、Query Processing與Ranking(提供查詢介面與排序機制)這幾項。

搜尋引擎會到網站上進行頁面爬取的動作,透過Spider(代理程式)來將頁面內容抓回資料庫裡。而抓取的動作是由一組伺服器在指派,抓取的URL清單會丟進一個Pool,然後伺服器會同時分派給幾個子伺服器進行頁面抓取的動作。而通常頁面抓取的模式是由廣而深,這意思是指會先抓取不同Domain Name下的第一階頁面,有餘裕時才繼續抓取某個Domain Name下第二、第三、或更深階的內容。會這樣也是有個原因,通常URL Pool裡的資料,大多都是Domain Name下的主網域,隨著Spider抓取頁面資料後,後續過程所分析到的URL才會丟回URL Pool裡,這時才會繼續抓取更深層的頁面。因此這個程序裡對SEO的作業來說很重要的兩件事:就是一、資料爬取;以及二、爬取的方式是由廣而深。

[全文:]

而Spider抓回來的資料會非常的雜亂,因此接下來會進行Preprocessing的動作。一般來說資料處理與過濾,主要會將重複性的資料移除,同時也會進行Spam的分析,然後進行Data Partition,區分的方式包含了網頁語系、Domain Name分隔。另外也會進行連結分析,前面提到連結分析的資料,也會吐回URL Pool裡,讓爬蟲伺服器持續抓取頁面,除此外還會進行網站評分的動作。而分析過的資料會給予PageID,同時丟回資料庫裡。在這個過程裡,對SEO的作業來說,最重要的就是如何減少搜尋引擎進行資料分析的時間,以及如何在這邊取得較好的網站分數。

已經過濾後的資料,會進行索引的動作。索引的過程會搭配詞庫(關鍵字詞庫、同義字詞庫)進行頁面索引的動作。對SEO的作業來說,最重要的就是關鍵字的策略。

最後一項,已經索引後的資料,會搭配查詢介面。當使用者下達一個關鍵字進行查詢時,搜尋引擎有一個Ranking系統(積分排序系統),搭配索引結果,用來提供最符合使用者想查詢的資料。所謂的Ranking系統,包含了使用者所在位置、使用語系、然後索引資料裡關鍵字的密度、內容的媒合度......等等,搜尋引擎是透過這些排序的積分,計算出接近查詢關鍵字結果的頁面分數,再顯示在使用者眼前。對SEO的作業來說,就在於網頁內容的整合是否有搭配前面所提到的關鍵字策略。

回到SEO的三大項內容:1.結構、2.文案、以及3.連結。在1.結構上,有幾個值得注意的重點,包含:1-1.內容主要的Text區塊,是否有安排在頁面的頂端。由於網頁開發技術的發達,各種特別效果的追求,導致某些特殊頁面會注重視覺效果的呈現,但卻忽略了頁面讀取的效率,以及主文是否有被抓取。舉例來說,透過Flash的包裝,可以讓頁面看起來更為有趣,但若將網頁內容塞在Flash裡,儘管搜尋引擎已經可以分析Flash的內容,但會增加它的負擔,若文字內容包覆的太深,其實不見得會被抓到。或者有些頁面透過JS來呈現某些效果,但頁面前端塞了太多JS,這對網頁效能的載入有影響,同時也會增加搜尋引擎對頁面處理的效率。

1-2.網頁的重要內容,或主要資訊頁應該予以扁平化。前面提到搜尋引擎是由廣而深,因此主要頁面扁平化有助於資料被爬取跟索引,頁面的積分也會比較高。

1-3.網站結構與內部連結策略要明確。所謂的內部連結,是指一個網站裡面,頁面跟頁面之間的關係。基本上除非是一頁式網站(現今的一頁式網站越來越多,尤其是透過視差滾動來表現的網站,比方說我的這個攝影App產品網站就是),否則一個網站內至少都會有三、四個頁面以上,甚至會有所謂的階層關係。此時應該注意到一件事,那就是網站地圖的結構(樹狀結構)應該要先確認,比方說一個標準的企業網站,在第一階會有首頁(主網域預先載入的頁面)、關於我們產品頁面、與聯繫我們......等。這些就是第一階頁面,而在產品頁面裡可能會有好幾項大分類的產品,這些大分類就成了第二階。而最後每一個產品介紹頁,就是第三階。如果網站頁面只有到這邊,那就可以將這網站視為是三階網站。

要讓網站結構明確有幾個方式,包含提供Sitemap給搜尋引擎,在網站上直接製作一個Sitemap頁面,一方面提供給使用者當導覽,另一方面給搜尋引擎用來分析Link,丟回URL Pool裡,再派Spider來抓頁面。再者可以透過麵包屑的設定,所謂的麵包屑就是在每個頁面裡,都埋入提示它所在頁的位置。例如當我在香菇鮮肉包的頁面時,頁面的上方會有一個「回首頁 > 推薦商品 > 香菇鮮肉包」的麵包屑,麵包屑的作用可以讓使用者快速的在網站結構裡切換到不同階,同時也可以當做搜尋引擎分析頁面的錨點。

對搜尋引擎來說,它在抓取頁面時無法直接分析頁面的權重,也不知道頁面的完整架構,因為它是透過URL Pool來抓取資料的。因此透過這樣的設定,可以讓網站不容易有抓取的死角,因為只要有Link,最終都會丟回URL Pool裡。所以透過麵包屑可以讓網站的所有內容,盡可能被搜尋引擎抓取。而這邊有個注意事項應該要特別注意,頁面跟頁面的連結,請謹記盡可能只跟直系或根系頁面連結,請不要讓頁面相互亂連。但是如果是導入推薦系統或關連系統的話除外,比方說「室內設計 > 客廳」跟「各式家具 > 各式木製傢俱訂作」一點關係都沒有,讓他們在頁面上互連不會是一個好點子。但若是「室內設計 > 客廳1」跟「室內設計 > 客廳2」有相關性,那個頁面上有互相的連結反而可以增加頁面本身的積分。

除此之外,提交Sitemap跟頁面權重的資訊給搜尋引擎,也是網站結構重要的內容。這部份請注意搜尋引擎所提供的站長工具,相關資訊可以透過站長工具的介面提交。而最重要的一點,就是robots.txt的設定,請確認網站是否允許搜尋引擎來抓取。

1-4.URL Rewrite。如果網站本身是利用程式搭配資料庫來呈現頁面資訊的話,通常會利用Rewrite的技術,讓一堆參數顯示的結果頁面,變成一個偽裝的靜態頁面。比方說本來應該是這樣的頁面(http://www.iyp.com.tw/showroom.php?cate_name_eng_lv1=electrical-material&cate_name_eng_lv3=electric-supplies&p=0)透過Rewrite的設定,可以偽裝成(http://www.iyp.com.tw/electrical-material/electric-supplies.html)這樣的頁面。而URL跟Domain name本身,在網站與頁面的權重上也是有加分的。

在2.文案的部份,最重要的在於網站本身的頁面,是否有足夠的資訊。而這邊也有幾個重點:2-1.關鍵字策略。關鍵字策略是值得深入探討的學問,應該說這邊所描述到的每一個項目,都可以再深入進行研究,我只針對通則的項目進行簡單的說明。這邊舉我們單位開發的架站平台來做說明,這個網站主要是要曝光我們的架站服務,因此要進行SEO時,應該要先想想,我想在搜尋引擎上攔截哪些人的哪些查詢?因此在關鍵字的選擇上,我們設定了簡易架站平台、網站架設、HiPage開站系統、企業架站、快速架站、網路架站......等關鍵字。要先確認我們想經營的關鍵字,然後在頁面的文案撰寫上,再將這些關鍵字包裝進每個頁面的文字敘述裡。

這邊提醒一下,前面提到搜尋引擎抓取頁面後,會進行Preprocessing(資料處理與過濾)跟Indexing(資料索引)的動作,而我們要理解搜尋引擎看到的文案呈現跟我們所看到的不同,我們會區分出文字本身的段落,也會進行每一行文字的斷詞,但搜尋引擎的斷詞理解與我們不同。因此若可以針對關鍵字進行適當的斷詞,會有助於我們頁面跟關鍵字的關聯度。通常適當的斷詞包含透過HTML的語法來包裝,比方說搭配超鏈結(a href)、加粗(B)、強調(strong)等語法,在文章內的關鍵字部分進行一些區隔,這在搜尋引擎進行索引時,可以有效的增加網頁跟關鍵字連結上的權重。

2-2.Landing Page。我們必須先選定哪個關鍵字被搜尋時,我們最想露出在使用者眼前的頁面,有了這樣的認知,我們才能選出自己站內最重要的頁面。一般來說,產品頁面通常都是主要的Landing Page,此時我們應該將在其他頁面裡的關鍵字,透過超鏈結的設定,將Link指向我們想要曝光的Landing Page上。

2-3.關鍵字對應與設定。除了每一個網頁文案的關鍵字設定外,網頁還有所謂的Meta區塊(需到HTML裡設定),這包含了Title、Keywords、Description的設定,儘管現在有很多說法說這些設定已經沒有什麼影響力了,但據我觀察的結果,還是有作用的。另外配合前面1-4的URL Rewrite,可以針對頁面的特性跟關鍵字,讓該頁的URL本身具有意義性。

在3.連結的部分,主要就是要讓網站能夠被搜尋引擎發現,同時也能增加網站的積分。一個新的網站,除非自行提交給搜尋引擎,否則搜尋引擎是不會知道你的存在的。但是除了自行提交資料給搜尋引擎之外,若能過透過有力人士的舉薦,當然會讓網站大大的加分。所以除了現實生活裡靠山很重要之外,在網路上也是一樣的。

3-1.外連結策略、早期有所謂付費的連結登入,只要付一筆錢,就能夠在大型網站上登錄網址。透過這些網站的舉薦,當然有了加分的作用。但後來濫用的狀況太多,有些搜尋引擎反而會針對這些行為,進行些微的降分動作。但原則上還是沒變,有知名的網站連結到我們的網站上,表示我們的網站上具有一定的專業性、或是知名度。因此若能取得較具影像力的網站連結,可以讓自己的頁面加分。除了付費網站外,也可以自行到DMOZ上提交網站,但DMOZ是透過義工審核,提交之後不見得會被上架到目錄上。有關外連結策略的應用,牽扯到SEM的範圍,詳細的作法這邊不另做說明。

3-2.內連結策略、除了外站連結我們之外,網站本身應該配合2-2.Landing Page的策略,讓主要的關鍵字都連結到要曝光的Landing Page上。除此也可以引用他網專業的說明,除了被人連有加分之外,連到有用、專業的網站上,也是有加分的。

基本上我在SEO的工作上,就圍繞在上述的這三大項裡。在這邊老當賣瓜一下,我們單位開發的架站平台,已經針對結構跟連結部分進行了處理,若你有架站需求,只要設定好網站的文案,基本上就能夠有不錯的SEO曝光效益。有關我們平台所提供的功能,可以自行參考產品官網。除了架站該有的功能外,我們也提供了線上購物模組,以及多語系的功能模組哦!

Related Posts Plugin for WordPress, Blogger...
玩科學套書組(天天在家玩科學+親子FUN科學) ART OF MOANA迪士尼動畫《海洋奇緣》電影美術設定集 海洋奇緣 3D+2D 限量鐵盒版 (藍光2BD) 電影原聲帶 / 美女與野獸 (2CD豪華典藏盤) 錦衣夜行.第一部 (5冊套書) 大唐雙龍傳【卷一~卷廿】 你不可以隨便摸我!




逢甲住宿 台中背包客棧
2013-09-05  -  duncan Email  -  2280  -  資訊工程 - 讀者回應

回應管理, Pingbacks:

這篇文章還沒有 回應管理/Pingbacks ...

讀者回應:


你的Email位址將不會顯示在這個站點.

您的URL將被顯示.

允許的XHTML標記: <p, ul, ol, li, dl, dt, dd, address, blockquote, ins, del, span, bdo, br, em, strong, dfn, code, samp, kdb, var, cite, abbr, acronym, q, sub, sup, tt, i, b, big, small>
Enter this code:
authimage

(換行會被轉換為 <br /> 標記)
(將你的姓名及Email及網址記在Cookie中)
(讓使用者可以直接寫訊息給你(不會顯示你的Email).)

上一篇文章: 「簡單構圖與基礎攝影」iPad App兌換碼抽獎活動開跑下一篇文章: Treetops Lodge - 位於羅托魯瓦的頂級莊園