Google 面临着长尾问题——而且这个问题不会消失。
多年来,Google 一直表示,每天的搜索中都有很大一部分是全新的。你经常会看到这样一个数字:约 20% 的查询从未被搜索过(Google 历史上在公开演讲中引用过 ~15% 的比例;业界在讨论创新规模时通常会向上取整)。
这一个事实解释了现代 SEO 的很多现象:大多数查询不是“关键词”,而是“一次性问题”。
每当有无限供应的长尾查询时,就会产生批量生产“匹配”这些查询的页面的动力——即使这些页面并没有真正回答问题。
长尾并非由 SEO 人员发明,而是现实所迫
长尾之所以存在,是因为人类的行为是复杂多变的:
- 我们会添加语境(“适合初学者”、“在 2026 年”、“我附近”)。
- 我们会组合概念(“最适合使用 AI 自动化的牙医 CRM”)。
- 我们在搜索时带有不确定性(“那个什么什么的东西是……”)。
- 我们会用数千种独特的方式表达同一种意图。
当网络上没有针对某个新查询的完美文档时,搜索引擎面临着艰难的权衡:展示一些不完美的内容,或者什么都不展示。
这种“差距”创造了一个可以预见的机遇:
如果没有人为某个查询写过完美的页面,那么能够为该查询生成一个**“形似页面的物体”**的网站就有机会获得排名。
这就是“搜索结果中的搜索结果”发挥作用的地方。
什么是“搜索结果中的搜索结果”(又名幽灵页面)?
在英语 SEO 圈子中,你会看到针对同一现象的几种称呼:
- “搜索结果中的搜索结果” (Search Results in Search Results):Google 搜索结果页面 (SERP) 中包含的页面本质上是另一个网站的搜索结果页面。
- “幽灵页面” (Ghost Pages):看起来相关(URL/标题中包含查询词),但页面上的价值很薄、很宽泛或者是空的。
- 索引站内搜索:被大规模抓取和索引的
/search?q=...或/search/keyword/页面。
从技术上讲,站内搜索创造了一个无限的 URL 空间:
/search?q=wireless+earbuds+for+small+ears/search?q=best+crm+for+nonprofits/search?q=how+to+remove+coffee+stains+from+linen
如果这些 URL 返回 200 OK 状态码,并包含类似以下的高权重关键词标题:
“关于‘最适合非营利组织的 CRM’的搜索结果”
……那么该页面就可以变得可索引、可链接并获得排名。
为什么这些页面能够获得排名?
因为排名系统通常不得不利用不完善的信号来推断价值:
- 字面匹配:查询词出现在 URL/标题/H1 中。
- 权威继承:页面位于受信任的域名下(大品牌、.edu、.gov、主要出版商)。
- 用户信号:对于某些意图(灵感、浏览、发现),“事物列表”可能比单篇文章更能满足用户。
- 软 404 (Soft-404) 混淆:一个页面对人类来说可能感觉是“无结果”,但对抓取工具来说看起来仍像一个正常页面。
Google 自己的文档对此非常直白:网站所有者通常应防止站内搜索结果被索引,因为它们作为独立的搜索结果通常没什么用,而且会浪费抓取预算。
- 参见:Google Search Central — 站内搜索结果指南(以及 Search Central 文档中关于“避免索引站内搜索结果”的相关建议)。
那么,为什么网络上仍然充斥着这些页面呢?因为这种策略有两面性:一面是合法的帮助,另一面则是毒瘤。
这种策略的两面:程序化 SEO (pSEO) vs. 滥用
1) 合法版本:程序化 SEO (pSEO)
“好”的版本不是“搜索垃圾”。它是从数据库到页面的发布:你拥有结构化数据、真实的库存和真实的用户价值,然后生成帮助人们的页面。
通常有效且真正有用的例子包括:
- Yelp / TripAdvisor 风格的页面:“波士顿最好的意大利餐厅”实际上是
city = Boston + category = Italian,但页面内容丰富,包含评论、照片、筛选器和对比。 - Zillow 风格的页面:地点 + 房产类型 + 价格趋势 + 库存。
- Wise 风格的汇率转换页面:“美元兑欧元”页面包含真实汇率、图表和解释(而不是一段泛泛的文字)。
这些页面虽然“像搜索结果”,但它们并不空洞。它们减少了用户的摩擦,并帮助 Google 满足特定的意图。
2) 毒瘤版本:幽灵页面 + 网站声誉滥用
“坏”的版本是指页面存在的目的主要是为了收割曝光量:
- 空的或近乎空的站内搜索页面(显示“未找到结果”+ 模板化的推荐)。
- 在受信任域名上注入关键词(寄生式 SEO / 网站声誉滥用的一种形式),攻击者(或阴暗的联盟营销人员)利用网站的站内搜索端点生成数百万个可索引的 URL,如:
example.edu/search?q=best+crypto+casino+2026
即使宿主网站没有相关内容,域名的声誉也会暂时将该 URL “带入”索引。这也是网站声誉滥用成为主要执法领域的原因之一。
在 2024 年 3 月,Google 明确扩展了直接针对这一生态系统的垃圾内容政策:
- 规模化内容滥用(以操纵排名为主要目的而大量生成的页面)
- 网站声誉滥用(发布第三方内容以利用宿主网站的排名信号)
参考资料:
为什么 Pinterest 看起来像“幽灵页面”却依然能赢
Pinterest 是英语 SERP 中一个“爱恨交织”的典型案例。
对于许多“灵感”类查询(家居装饰、服装搭配、婚礼主题),用户想要的不是一个完美的答案,而是一种高密度的浏览体验。一个 Pinterest 画板或标签页面可以起到“内部搜索结果”的作用,但其满足意图的效果却比单篇博文更好。
换句话说:有时“搜索结果中的搜索结果”正是用户想要的。
这就是为什么正确的问题不是“这种策略被允许吗?”
而是:
这个页面是否能可靠地为该意图提供独特的价值,还是仅仅是一个关键词形状的空壳?
AI 时代改变了回报(和风险)
AI 让生成页面的成本变得非常低。这也意味着 Google 必须更激进地过滤这些页面。
如果你的“策略”是:
- 生成 50,000 个几乎相同的页面,
- 替换城市名称和标题,
- 添加几段 AI 生成的内容,
- 并寄希望于长尾点击来获利……
……那么你就是在与无限的供应进行一场“逐底竞争”。
与此同时,AI 驱动的搜索体验(以及 LLM 引用)往往会奖励:
- 更清晰的结构,
- 更强的证据,
- 更深层的解释,
- 原始数据,
- 以及值得信赖的作者身份。
单薄的“幽灵页面”是 AI 摘要最糟糕的输入源——因为没有什么真实的内容可以引用。
我们的经验:错误 vs. 正确
这是一份可以应用于任何 SEO 计划的实用清单。
| 模式 | 错误的做法 (幽灵页面) | 正确的做法 (有价值的 pSEO) |
|---|---|---|
| 页面目的 | 获取曝光量 | 解决特定的意图 |
| 数据 | 无库存 / 无证据 | 真实的实体、评论、价格、可用性或原始研究 |
| 模板 | 仅更换关键词的相同页面 | 模板 + 真正不同的数据和结果 |
| 空结果 | 使用通用模板返回 200 OK | 返回真实的 404 / 提供有用的替代路径;避免索引空页面 |
| 索引控制 | 任由 /search?q= 泛滥 | 对站内搜索使用 noindex;规范化 (canonicalize);限制参数抓取 |
| 内容 | 泛泛的 AI 段落 | 清晰的结构、对比、限制条件和决策支持 |
| 风险 | 高(垃圾内容信号、手动操作惩罚) | 较低(价值优先、符合意图) |
一个简单的经验法则
如果你从标题和 URL 中删除关键词,这个页面还值得访问吗?
- 如果不值得,你正在构建幽灵页面。
- 如果值得,你正在构建产品化的内容。
长尾增长的策略(而不变成垃圾内容)
如果你想在 2026 年及以后获得长尾覆盖,请像产品团队一样进行优化:
- 从实体出发,而非关键词:围绕存在的事物(地点、类别、工具、使用场景、模板)构建页面,并使它们真正有用。
- 为“浏览意图”设计:对于发现类查询,投入精力进行筛选、分组和对比——不要躲在单薄的“结果”页面后面。
- 让站内搜索回归站内:你的搜索框是为了导航,而不是为了索引。在搜索结果页面上使用
noindex,并防止无限的参数抓取。 - 严格对待空状态:“无结果”页面不应被索引,且通常不应返回
200 OK。 - 衡量有用性:如果用户跳出很快,那就是你的答案。长尾奖励相关性,但惩罚失望感。
结束语
长尾之所以真实存在,是因为人类语言是无限的。
获胜的策略不是生成无限的页面。
而是构建一组有限的、高信号、有数据支撑的页面,这些页面之所以能够规模化,是因为它们植根于现实——这些页面是搜索引擎和 AI 系统都可以放心信任、检索和引用的。