SEO優化技術基礎理論及基本概念的(Of)認知
如何設置SEO關鍵詞當然重要(Want),但SEO優化技術如果隻是(Yes)機械式的(Of)說該做什麽不(No)做什麽,而涉及的(Of)步驟又非常死闆,例如:将焦點關鍵詞設定放在(Exist)标題一(One),關鍵詞在(Exist)首段重覆出(Out)現三次等等 ,會是(Yes)何等枯燥乏味。
過去二十年搜索引擎優化是(Yes)圍繞關鍵詞爲(For)基礎,理由是(Yes)計算機無法有效分析自然語言輸入,從而理解搜索用(Use)戶的(Of)目的(Of),退而求其次依賴搜索用(Use)戶輸入簡單詞組作(Do)爲(For)導向,就是(Yes)所謂關鍵詞。關鍵詞研究 Keyword Research 是(Yes)指利用(Use)工具,例如 :Google Adwords Planner 分析個(Indivual)别關鍵字的(Of)搜索量和(And)競争度。由于(At)傳統搜索引擎優化是(Yes)以(By)關鍵字爲(For)對象,關鍵字研究得出(Out)來的(Of)一(One)籃子關鍵字會根據和(And)内容的(Of)相關性被分配到網站内不(No)同網頁用(Use)作(Do)所瞄準的(Of)關鍵字。
SEO關鍵字 – 基本概念
多了(Got it)解一(One)些關鍵字設定基本概念和(And)基礎理論會令SEO優化變得更有趣味。例如:SEO關鍵字的(Of)出(Out)現密度的(Of)基礎理論是(Yes)TF-IDF。搜索引擎希望從頁面出(Out)現的(Of)關鍵字密度決定該SEO關鍵字和(And)内容的(Of)相關性 Relevance 有多大(Big)。用(Use)淺白語言排除數學其實不(No)難理解:
關鍵字在(Exist)網頁出(Out)現的(Of)頻率就是(Yes) TF (Term Frequency)。如果關鍵字 K 在(Exist)網頁出(Out)現 4 次, TF 值看似應該是(Yes)4。
問題是(Yes)如果A頁的(Of)内容長度是(Yes) B頁的(Of)兩倍,某關鍵字 K 在(Exist)A頁的(Of)出(Out)現次數是(Yes)B頁兩倍時(Hour)就不(No)能斷言關鍵字 K 與A頁更相關。所以(By) TF 被修正爲(For) 出(Out)現次數 / 長度。例如,出(Out)現 4 次文件章度爲(For) 100 個(Indivual)字:
TF 值 = 4 / 100 = 0.04
問題是(Yes)例如一(One)編介紹 “網上(Superior)生意” 文章的(Of)描述中,有些字像 “客戶”,”網上(Superior)” 的(Of) TF 就顯然要(Want)比 “網上(Superior)生意” 的(Of) TF 爲(For)高。但說該文章跟 “網上(Superior)” 或 “生意” 的(Of)相關性較 “網上(Superior)生意” 爲(For)高,明顯違反常識。當文章是(Yes)談論 “網上(Superior)生意”,”雲端運算”,”網上(Superior)繳費”,”網上(Superior)教學”等等時(Hour) “網上(Superior)” 都很可能被提及。結論是(Yes) “網上(Superior)” 一(One)詞是(Yes)一(One)般文章中更普及出(Out)現。單純利用(Use) TF 計算相關性會出(Out)現以(By)上(Superior)的(Of)偏差。
解決的(Of)方法是(Yes)對愈普及的(Of)關鍵字給出(Out)愈低的(Of)權重 Weight,倒如在(Exist) 10,000 文章中關鍵字 “網上(Superior)” 出(Out)現 100 次,權重變成倒數 (所以(By)叫 IDF 或 Inverse Document Frequency) 10,000/100 = 100 , 如關鍵字 “網上(Superior)推廣” 在(Exist) 10,000 文章中出(Out)現一(One)次,權重變成 10,000/1 = 10,000. 爲(For)了(Got it)令這(This)權重值變化不(No)要(Want)不(No)急,所以(By)以(By) log base 10 計算。
“網上(Superior)” IDF 值 = log (10,000 / 100) = 2
“網上(Superior)推廣” IDF 值 = log (10,000 / 1) = 5
将 TF 乘以(By) IDF 就是(Yes)相關性的(Of)評分。當然今天的(Of)搜索引擎采用(Use)的(Of) TF-IDF 更複雜,但原理是(Yes)一(One)樣。今天搜索引擎已經進化到非常複雜,除了(Got it) Google 内部從事 SEO 研究的(Of)資深工程師外,外面從事SEO優化的(Of)人(People)隻能根據一(One)些如專利申請和(And)Google人(People)員不(No)同埸合的(Of)闡述等符嘗試理解其中的(Of)精萃。Google 搜索引擎計算關鍵字相關性的(Of)算法是(Yes)以(By) TF-IDF 爲(For)基礎,但已經進化到更爲(For)先進。
長尾關鍵字
長尾關鍵字 Long tail keyword 指基于(At)通用(Use)關鍵字在(Exist)前或在(Exist)後或同時(Hour)在(Exist)前後加入更多字眼作(Do)更精準标示所要(Want)找的(Of)産品、服務或信息,長尾關鍵字 IDF 值高。例如:“大(Big)碼衣服婚禮用(Use)”,“防敏感化妝品”等等。長尾關鍵字特色是(Yes)搜索量小,但同時(Hour)提供和(And)該關鍵字相關的(Of)産品、服務或信息的(Of)網站亦小,所以(By)該長尾關鍵字的(Of)搜索排名競争亦小,更容易獲得高搜索排名。
焦點關鍵字
焦點關鍵字 Focus Keyword 指網頁内容是(Yes)以(By)該關鍵字爲(For)争取排名目标,焦點關鍵字 IDF 值低。所以(By)在(Exist)頁内重要(Want)的(Of)元素中會加入該焦點關鍵字以(By)便通知搜索引擎網頁内容和(And)焦點關鍵字的(Of)相關性。SEO 優化工具如 Yoast SEO, SEOpressor 的(Of)排名優化建議都需要(Want)先設定焦點關鍵字。一(One)般網頁内容隻應瞄準一(One)兩個(Indivual)焦點關鍵字,否則可能造成文理不(No)通,降低可讀性。
單頁相關還是(Yes)多頁相關
某些網站接受遊客發帖 Guest Posting, 單獨一(One)個(Indivual)頁面和(And)某關鍵字有高相關性不(No)及和(And)好幾頁面展現高相關性來得重要(Want)。利用(Use) ITF 可以(By)偵測到整個(Indivual)網站 (或者更正确是(Yes)整個(Indivual)網站中被搜索引擎索引的(Of)頁面) 和(And)某關鍵字的(Of)相關性。例如“韓國(Country)時(Hour)裝” 在(Exist)一(One)般網站的(Of) ITF 是(Yes) 0.0003,即是(Yes)在(Exist)一(One)萬頁中隻有 3 頁提及,而某網站是(Yes) 0.05,即一(One)百頁中有五頁提及,就表示該網站以(By) “韓國(Country)時(Hour)裝” 爲(For)主題的(Of)可能性極高。也就是(Yes)該網站對 “韓國(Country)時(Hour)裝” 的(Of)權威性高,亦即是(Yes) Google Rater Guideline 所闡述優質内容 E.A.T 裏内的(Of) A,代表 Authority。搜索引擎是(Yes)偏好來自權威性高的(Of)内容。
直接相關還是(Yes)間接相關
關鍵字有同義詞 Synonyms。例如:教員,教師,老師代表非常接近甚至完全相同的(Of)概念或事物。當網頁或網站和(And)關鍵字A的(Of)相關性高,而關鍵字B是(Yes)關鍵字A的(Of)同義詞時(Hour),就間接引證該網頁或網站和(And)關鍵字B的(Of)相關性亦高。但由于(At)是(Yes)間接相關,所以(By)網頁對搜索輸入關鍵字B的(Of)排名評分會略低于(At)對直接相關的(Of)關鍵字A。
應該是(Yes)直接相關還是(Yes)間接相關取決于(At)地理位置文化差異。有些同義詞是(Yes)由于(At)文化地理差異引起,例如 “moggie” 是(Yes)英國(Country)人(People)對混種家貓的(Of)稱呼,亦就是(Yes)一(One)般我們都叫 “cat”. 随着手機普及可以(By)更準确判斷用(Use)戶的(Of)地理位置,英國(Country)用(Use)戶輸入 “moggie” 可以(By)判斷爲(For)貓 (搜索引擎很可能判斷與 “cat” 爲(For)直接相關),但中國(Country)用(Use)戶輸入 “moggie” 就不(No)一(One)定 (搜索引擎很可能判斷與 “cat” 爲(For)間接相關)。
關鍵字的(Of)繁簡轉換亦可以(By)看成間接相關,所以(By)你會看到輸入繁體關鍵字時(Hour)亦有時(Hour)會出(Out)現簡體排名結果。但亦是(Yes)由于(At)間接相關,所以(By)排名計分稍爲(For)不(No)利。
潛在(Exist)詞義的(Of)相關性
随着手機愈趨普及,語音搜索 Voice Search 使用(Use)量會大(Big)幅增加。當用(Use)戶慢慢發現原來搜索引擎對自然語音輸入的(Of)理解原來不(No)差時(Hour),搜索用(Use)戶行爲(For)亦會改變,放棄以(By)詞組式關鍵字輸入而改爲(For)更自然的(Of)句子。RankBrain 的(Of)出(Out)現就是(Yes)爲(For)了(Got it)處理更複雜的(Of)詞意含義,通過利用(Use)人(People)工智能 AI 理解潛在(Exist)含意而将用(Use)戶的(Of)搜索輸入和(And)隐含的(Of)關鍵字搭出(Out)關系。例如用(Use)戶查詢:PDF 有什麽弊端,通過 RankBrain 潛在(Exist)詞義分析轉化爲(For) “PDF 保安”。
LSI 和(And) Proximity
單一(One)詞語代表的(Of)意義有時(Hour)非常含糊。例如 “蘋果” 代表水果亦廣泛指美國(Country)一(One)家上(Superior)市公司。所以(By)确切的(Of)相關性判斷需要(Want)看上(Superior)文下理,例如如果網頁是(Yes)關于(At)水果蘋果,很可能同時(Hour)在(Exist)内文中找都關于(At)食品的(Of)關鍵字,例如 “健康”,“味道”。如果是(Yes)關于(At)蘋果公司,就可以(By)找到關鍵字如 “公司”,流行産品如 “iPhone” 等等。又例如 “心理輔導” 的(Of)資料,多數會提及 “情緒” 這(This)個(Indivual)詞。英文 Lincoln 可以(By)是(Yes)人(People)名,可以(By)代表汽車,可以(By)代表美國(Country)總統。潛在(Exist)語義索引 Latent Semantic Indexing (LSI) 是(Yes)指搜索引擎根據上(Superior)文下理所出(Out)現的(Of)其他(He)相關詞彙判斷關鍵字的(Of)相關性。而這(This)些相關的(Of)關鍵字應該出(Out)現在(Exist)主關鍵字不(No)太遠的(Of)地方,相隔愈遠代表兩者關系愈弱。
SEO關鍵字密度
從以(By)上(Superior)的(Of)理論介紹中你看到爲(For)多幾個(Indivual)的(Of)關鍵字出(Out)現次數對搜索引擎判斷相關性沒有大(Big)幫助,反而一(One)些長尾的(Of)關鍵字可能更有利 IDF 權重計分。
由于(At)關鍵字密度已經被濫用(Use)。今時(Hour)今日,關鍵字出(Out)現在(Exist)網頁的(Of)密度已經變得不(No)重要(Want)。代之已起的(Of)是(Yes)更看重 LSI 暗視式的(Of)相關性出(Out)現頻率。理解SEO關鍵字基本概念後下一(One)步就是(Yes)如何選關鍵字。
關鍵字位置
關鍵字位置 Keyword Position 指關鍵字在(Exist)不(No)同元素中出(Out)現位置對搜索排名的(Of)影響,特别是(Yes)當元素出(Out)現在(Exist)有長度限制的(Of)地方,例如标題。一(One)般出(Out)現位置是(Yes)愈前愈好,但有時(Hour)将關鍵字放在(Exist)前面可能造成文理不(No)通,又會降低搜索用(Use)戶點擊意欲。
- 上(Superior)一(One)篇:發布外鏈的(Of)四大(Big)技巧,進一(One)步提升網站排名
- 下一(One)篇:沒内容的(Of)網站怎麽優化?