您的位置:老鐵SEO > 站長新聞 >

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

文章來源:www.anamjw.live

作者:老鐵SEO

人氣:121

2017-12-14

本文并不是科普文,也不是什么技術探討文。僅僅是為了那些和我一樣,因為對“程序”、“代碼”的望而卻步,不敢或沒有信心研究SEO的“小白”們,能快速簡單有趣地了解搜索引擎背后的原理和邏輯,以便建立對互聯網營銷的基本認識。

感謝Zac的《SEO實戰密碼:60天網站流量提高20倍》

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

圖:PEXELS

文:幺幺 本文約2800字,閱讀時間為4分鐘。

SEO離我們很遠,也很近。

作為營銷人員,你會發現SEO離你很遠也離你很近。工作中明明有個別同事專門做SEO,你卻完全摸不懂他具體做一些什么?

我們好奇卻從不去研究時,SEO其實離我們很遠。

然而當我們開始把職業規劃往上提的時候,當我們開始找工作的時候,發現很多公司對營銷人員、運營人員的要求是“懂SEO/SEM”。

這個時候,SEO又離我們很近,近到你不得不去正視它。

什么是SEO?就是利用規則獲得排序的手法。

基本定義:

SEO: 是由英文Search Engine Optimization縮寫而來, 中文意譯為“搜索引擎優化”。

是指在了解搜索引擎自然排名機制的基礎之上,對網站進行內部及外部的調整優化,改進網站在搜索引擎中關鍵詞的自然排名,獲得更多的展現量,吸引更多目標客戶點擊訪問網站,從而達到互聯網營銷及品牌建設的目標。

有點復雜?其實你搞清楚3個基本概念就好了。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

1、研究算法:百度這類網站不是憑感覺對搜索結果進行排序的,它有一套復雜的規則,以保證用戶能搜到他想要的內容。

2、網站優化:研究清楚(或者大致清楚)百度這類搜索引擎的算法后,根據其喜歡或者討厭的內容,調整我們自己的網站內容。包括關鍵詞、內外鏈接、網站結構等等。

3、獲得排名:這是SEO的目的,也是所有一切的起點。

所以我對SEO的理解就是,通過研究和利用搜索引擎的排名方法,將我們想要推廣的網頁排在前面。

由于篇幅的原因,我們今天僅探討,搜索引擎是怎么展示給我們搜索結果的。

搜索引擎背后的邏輯,就是一個搜羅→分析→整理→排序的過程

我們在百度的搜索框里面輸入詞,按下enter鍵就能出來這么多頁的結果,而且似乎大部分都是我們想要的。

搜索引擎它是怎么做到的,是背后有小小的兵工廠在不斷整理和輸送我們想要的文件嗎?或者是像汽車一樣后面有整套的動力系統嗎?

如果說程序、代碼等,可能大家會覺得太抽象,無法想象它的樣子。接下來我們用幾個相對具象的事物舉例,來說明搜索引擎背后的原理和邏輯。

一、像蜘蛛網一樣“搜羅”信息(互聯網就是是個蜘蛛網)

蜘蛛順著蜘蛛網,從一條線爬到另一條線(從一個網頁爬到另一個網頁)。還順便把爬到的數據丟進一個箱子存儲起來。這就是搜索引擎的第一步“搜羅”。

那網頁之間是怎么聯系起來的呢?就是蜘蛛網的這條線與那條線之間有個節點一樣,網頁與網頁之間也有鏈接,相當于蜘蛛網的節點,讓蜘蛛從一個網跳轉到另一個網。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

互聯網就像一個蜘蛛網

二、像圖書館一樣“分析+整理”(箱子里都是原始數據,又多又雜怎么辦?分門別類!)

前面我們說過,蜘蛛會把爬到的數據放在一個箱子里,但這些原始數據沒法直接用,就像你去圖書館找一本書,結果圖書管理員說書堆在房間里,自己去一個個翻。你覺得你找到自己想要的書的概率有多大?要花多長時間?

所以這個時候就要對原始數據進行預處理,也就是索引。就像圖書館將圖書分門別類一樣。這里就是搜索引擎的“分析和整理”。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

蜘蛛爬取到的數據在沒處理前,就跟沒分門別類的圖書館一樣

1、先把每個網頁解析成文字

搜索引擎的本質是基于文字的處理,而每個網頁都是包含了無數關鍵詞和非關鍵詞的組合。

(1) 提取文字:把每個網頁看成一個文件夾,里面可能有文字、圖片、視頻。但搜索引擎會提取其中的文字。

(2) 中文分詞:把句子切成文字。

(3)把非關鍵詞去掉。如“的”“地”“得”等助詞、“啊”“哦”“呀”等感嘆詞、“從而”“以”卻等副詞或介詞去掉。

另外還有消除噪聲如導航欄、分類廣告等對頁面主題沒有什么作用的去掉,以及去重后,最后將每個網頁(也就是文件夾)變成一個個的關鍵詞,如下圖。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

2、再給它進行更“人性化的組合”

但是,解析到的正向索引還不能直接用于排名。為什么呢?如果用戶搜索關鍵詞2,程序就要掃描所有的文件來找出哪些文件有關鍵詞2,耗時又耗力。怎么辦呢?

用戶是根據關鍵詞來搜索的,那我們完全可以通過關鍵詞進行索引排序呀。這就倒排索引:即根據關鍵詞排列文件夾,具體如下圖:

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

3、最后計算“相關性”和“可信性”:鏈接關系計算

現在我們再次回到搜索引擎的原理:按下enter鍵后,出來的網頁是按照與你搜索詞相關的順序排序的(相關性),同時也要保證你搜索的是你想要的(可信度)。那么如何確定?

舉個例子,馬路上你碰到一個陌生人,你怎么確定你和他的關系,以及他的人品如何?如果他是你大姨夫的同學的鄰居的同事,這就是通過“鏈接關系”確定相關性。而你對你大姨夫、大姨夫同學、大姨夫同學的鄰居的人品和說辭來判斷這個人的人品,這就是通過“PR值”確定可信度。

這里只是很簡要的說明了鏈接關系計算的大致原理,真實的計算復雜度和維度是我們難以想象的。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

確定鏈接關系,就像確定你與另一個人之間的關系一樣

4、排名:一切準備就緒,網民可以開始搜索了

齒輪和齒輪才會合得起來,齒輪是沒法與螺絲匹配的。

所以,既然程序把網頁編程了關鍵詞對應文件夾的組合,那么用戶搜索時,也要提取關鍵詞才能匹配相應的文件。

(1)提取關鍵詞:這里也包括中文分詞、把非關鍵詞去掉、拼寫錯誤矯正等等。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

用戶輸入“我們的冥王星”,百度可能的提取結果

(2)文件匹配:提取出關鍵詞后,就可以根據前面所說的倒排索引找出對應的“文件夾”,其實也就是網頁。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

關于“冥王星”,搜索引擎可能匹配出幾千萬個文件請點擊此處輸入圖片描述

(3)初始子集選擇:一般來講,一個關鍵詞對應的網頁(文件夾)可能有上千萬個,但用戶可能只需要1000個。所以,搜索引擎會只選擇一部分匹配的子集再進行后續的相關性計算以便排序。(至于怎么選取子集,文章里沒有講,可能屬于算法的高級機密,一般人也不知道。)

(4)相關性計算:絕對情況下,以“冥王星”為例,如果一個網頁上,“冥王星”這個次出現的頻率越多、出現的位置越重要(如標題)、外部因為“冥王星”導入到這個網頁的鏈接越多,則搜索引擎會覺得這個頁面與“冥王星”越相關,越能排在前面。(其實搜索引擎的相關性排序非常復雜,這里方便大家理解,只能絕對化講。)

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

通過“預處理”后的數據,如整理好的圖書館一樣不僅井井有條,還方便查詢

三、像“貼標簽”一樣做最后排名

貼標簽可以讓你快速了解一個人,或者是一個網頁

最后,就是排名顯示了。

通過前面的一步步,后臺各種數據已經準備完成,現在只剩下給“圖書館的書貼標簽”了。所以搜索引擎最后只用調用原始頁面的標簽標標簽、說明標簽、快照日期等顯示再頁面上。就形成了我們最終搜索結果。

小白也看得懂的SEO基本原理,讓你更了解百度背后的故事

通過上述一系列的計算,促成了我們一秒搜出相關網頁的結果。是不是很神奇?

本文僅講述了搜索引擎的原理,如果大家有興趣,后續可能會整理SEO人員針對這些原理如何對網頁進行優化的相關內容。如果想要更深入了解SEO,建議還是去看Zac的原書。

因為幺幺也是第一次接觸SEO,如果文中有錯漏,歡迎大家一起探討進步。

相關文章

在線客服

外鏈咨詢

掃碼加我微信

0557-8818050

返回頂部

群星闪耀彩金