你打開 Google,輸入手沖咖啡怎麼沖,按下 Enter,不到一秒畫面上出現十個結果。你再打開 ChatGPT 問同樣的問題,它直接給你完整的步驟說明,還附上幾個參考來源。

這兩個場景你每天都在經歷,但背後有一套運作機制,理解這套機制是學 SEO 的第一步。

搜尋引擎只做三件事

把複雜的系統化繁為簡,搜尋引擎其實只做三件事。

第一是爬取,也就是發現你的存在。Google 有一群叫爬蟲的自動程式,24 小時不停在網路上從一個網頁的連結跳到另一個網頁。每發現一個新頁面就把內容記錄下來。如果你的網頁沒有任何其他網站連結到它,爬蟲就找不到它,就像一座沒有路通向的孤島。

第二是索引,也就是理解你在講什麼。爬蟲帶回內容後,Google 會分析標題、內文、圖片、連結,然後分類存檔,就像圖書館員把新書依主題上架。如果 Google 看不懂你的網頁,就無法正確分類,搜尋時就找不到你。

第三是排名,也就是決定你排第幾。當有人搜尋某個關鍵字,Google 從索引庫找到所有相關頁面,然後選出最好的十個按順序排列。排名最核心的邏輯只有兩條,相關性,你的內容和使用者搜尋的東西有多匹配,以及權威性,有多少其他網站透過連結推薦你。

爬取是發現你的存在,索引是理解你是誰,排名是決定你排第幾,三步缺一不可。

ChatGPT 出現之後,規則變了

2024 年以前,搜尋就是 Google 的遊戲,目標很簡單,排名越高越好。然後 ChatGPT 加入了搜尋功能,Perplexity 快速崛起,Google 自己也在搜尋結果頂端加入了 AI 生成的回答。

在 Google 的世界裡,排第 11 名和第 10 名,差距是 95% 的流量。在 AI 搜尋的世界裡,一項涵蓋 55,936 個查詢的研究發現,37% 被 AI 引用的網站根本不在 Google 前十名。對新網站來說,這是 25 年來第一次出現的破局機會,你不需要先在 Google 爬到前十,AI 有可能直接引用你。

AI 搜尋的三層機制

Google 搜尋是爬取、索引、排名三步。AI 搜尋也有自己的三層。

第一層是預訓練知識。ChatGPT 上線之前已經讀過了網路上海量的文字,如果你的內容在這些地方被頻繁提到,ChatGPT 在訓練階段就記住了你,這一層是過去的積累,很難短期改變。

第二層是實時搜尋。當 ChatGPT 開啟搜尋功能回答問題時,它實際上先用 Bing 搜了一遍,拿到排名靠前的結果。Perplexity 用的是 Google,Gemini 也用 Google。這意味著傳統搜尋排名仍然是 AI 獲取資訊的主要通道,如果你在 Google 排不進去,大多數 AI 也搜不到你。這就是為什麼 SEO 仍然重要,它是 AI 搜尋的入場券。

第三層是選擇過濾。AI 從搜尋結果拿到 10 到 20 個候選頁面,然後決定引用哪幾個、從每個頁面提取哪段話。Google 只排名不提取,AI 要從你的頁面裡挖出一段話直接放進回答裡,這就引出了 AI 時代最重要的新概念,可提取性。

可提取性,AI 時代最關鍵的新概念

你的文章能不能被 AI 引用,不只取決於排名,還取決於你的內容有沒有辦法被提取出來獨立使用。

低可提取性的例子,考量到以上各種因素,這款咖啡壺整體來說表現不錯,詳細分析請見前文。這段話脫離了上下文什麼都沒說,AI 不會引用它。

高可提取性的例子,Hario V60 02 在 SCA 標準測試中,以 93°C 水溫、研磨度刻度 4、粉水比 1:15 沖煮,萃取率穩定落在 18 到 22% 的黃金區間。這段話完全獨立,有數據、有來源、有具體條件,AI 可以直接放進回答裡。

Princeton 大學的研究發現,內容加入統計數據後 AI 引用率提升 86%,而關鍵字堆砌不只對 AI 無效,引用率反而下降 22%。

可提取性的五個基本原則,每個核心觀點配一個具體數據,結論前置不要讓讀者自己推理,避免如前所述、詳見上文這類需要上下文的說法,用 FAQ 格式呈現常見問題,每段話單獨拿出來要能讓沒看過全文的人也看得懂。