本文讨论的是 §1.3 框架 中的第 5 / 6 阶段:返回展示与 GEO 引用的归因差异。
目标读者: 做外贸独立站(B2C 或 B2B SaaS)、内容已经开始在 Google 和 ChatGPT / Perplexity 两条通道同时产生流量的团队。如果你还在纠结"为什么 Google Analytics 上看不到 ChatGPT 带来的转化"——本文讨论的就是这个问题。
实验背景
做外贸独立站的团队普遍在 2024 下半年到 2025 上半年遇到同一个困惑:ChatGPT / Perplexity 明显在引用我们的内容,但 GA4 上几乎没有对应流量——这些"引用"到底值不值得做?
我在一个外贸 SaaS 工具站(月 UV 约 8 万,主要市场美国 + 英国 + 澳大利亚,付费订阅模式)做了一次 3 个月的对照实验,回答这个问题:同一篇优质内容,靠 Google organic 获取 1 万次阅读、和靠 AI 引用"被看见" 1 万次,归因路径和转化结果相同吗?
实验设计
- 站点:外贸 SaaS 工具站,WordPress + WooCommerce Subscriptions,英文为主站,带
/de/、/fr/多语言 - 文章:一篇 2500 词的 "how to solve X problem" 类 pillar article
- 时间:2024 年 9 月–12 月(覆盖 Google 的 11 月 Core Update)
- 两条归因通道:
- SEO 通道:Google Search Console + GA4 的 organic 渠道 + Ahrefs 的 keyword ranking
- GEO 通道:ChatGPT、Perplexity、Claude、Google AI Overview 中对该话题的引用次数(通过每日 API prompt 采样 50 个相关 query)+ GA4 的 referral source(
chat.openai.com、perplexity.ai、chatgpt.com、claude.ai、gemini.google.com)
- 追踪埋点:
- UTM
utm_source=chatgpt.com等 referral 自动识别 - 每篇文章嵌入一个 "How did you find us?" 的注册漏斗问题
- 客服后台标记 "LLM-referred" 工单
- UTM
3 个月的数据
| 指标 | SEO 通道 | GEO 通道 |
|---|---|---|
| 总"到达次数" | 11,200 次 UV | ~9,400 次被引用(采样估算) |
| 实际到站 UV | 11,200 | 840(被引用后点击进站) |
| 平均停留时长 | 2:10 | 3:45 |
| 注册转化率 | 1.8% | 0.7%(按实际到站 UV 算) |
| 注册后 30 日 LTV | $180 / 用户 | $340 / 用户 |
| 品牌搜索变化 | 基线 | +42%(3 个月后"品牌名 + 功能词"直接搜索) |
五个具体观察
1. AI 引用的到站点击率极低,这是结构性的不是你的问题。
被 Perplexity 或 ChatGPT 引用约 9,400 次,但实际点击到站的约 840 次——CTR 仅 8.9%,比 Google SERP 的 CTR(首位约 27%、第三位约 11%)低一个数量级。原因:LLM 已经在答案里给了完整答复,用户不需要再点击。别用 SEO 的 CTR 预期看 GEO。
2. 到站后的用户质量显著更高。
GEO 通道带来的用户平均停留 3:45,是 SEO 用户的 1.7 倍;注册后 30 日 LTV 是 SEO 用户的 1.9 倍。解释:能从 LLM 答案里"主动点击引用链接回站"的用户,本身就完成了一层强筛选——他们在评估答案可信度、想看原始出处。外贸 SaaS 里这类用户的付费意愿本来就高。
3. 品牌认知无法用点击衡量,但它是真实的。
有 8,000+ 次用户只在 LLM 答案里看到了我们、没有点击。但后续 3 个月,"品牌名 + 功能词"的直接搜索量上升 42%、"品牌名"的直接访问上升 28%——这是 GEO 的真正价值,但 GA4 的 last-click 归因会把它错算给 "Direct" 或"Organic Branded Search"。
4. 转化路径变长,last-click 归因严重失真。
传统 SEO 路径:Google 搜索 → 点击 → 试用 → 注册(通常 1–3 天内完成)。
GEO 路径:ChatGPT 看到引用 → 记住 → 1–2 周后搜索品牌名 → 点击首页 → 注册。中间多了一步"时间间隔 + 品牌搜索"。GA4 的默认 last-click 会把这种转化归因给 "Organic Search – Branded",完全掩盖 GEO 贡献。
5. Core Update 的抗波动性 GEO > SEO。
11 月 Google Core Update 期间,SEO 通道的 UV 掉了 18%;GEO 通道引用次数仅掉了 4%——LLM 的"稳定候选集"衰减速度显著慢于 Google 排名。
外贸独立站的归因埋点落地
外贸团队想在自己站上复现类似测量,下面是最小可行配置。按这个顺序做,第一周就能拿到可解读的数据:
第 1 步:GA4 自定义 channel group。
默认 channel group 不识别 AI referrer,会把 ChatGPT 带来的流量错误归到 "Referral" 里看不出细节。在 GA4 后台 Admin > Data Settings > Channel Groups 里新建一条 "AI Referral" 规则,匹配 chat.openai.com / chatgpt.com / perplexity.ai / claude.ai / gemini.google.com / copilot.microsoft.com / phind.com / you.com 的 source 全部归入。这样在 Reports > Acquisition 里就能单独看这条通道的 UV 和转化曲线。
第 2 步:GSC 的 AI Overview 维度。
Google Search Console 在 2025 年 Q1 开始灰度推出 "Search appearance > AI Overview" 筛选——登录后如果看到这个选项就用它看 Google AI Overview 带来的 impression 与 click。这是目前唯一能直接拿到 Google AI 引用量的官方数据源。
第 3 步:埋一个漏斗问题。
注册流程或首次购买流程里加一个非必填单选 "How did you find us?",选项包含 "ChatGPT / Perplexity / AI assistant / Google / 推荐 / 其它"。成本是增加一个字段、半天开发,但能拿到 GA4 归因之外的"自报告"数据,用于交叉验证 referral 真实性。
第 4 步:Shopify / WooCommerce 订单 referrer 标记。
在订单 meta 里写入首次 session 的 referrer + UTM,这样可以按 LTV 维度(订单金额、复购率)复盘哪条通道的用户更值钱。Shopify 用 Shop Analytics、WooCommerce 用 WC_Order::add_meta_data()。
第 5 步:每日采样脚本。
写一个小脚本每日用 50 个目标 prompt 跑 OpenAI / Perplexity / Claude API,记录你的域名是否被引用、出现在答案的第几句、上下文关键词是什么。这是 GEO 通道的"关键词排名监测"(等价于 SEO 里的 rank tracker)。详见 Python ChatGPT 引用检查脚本。
常见问题:
- "GA4 里 referrer 是空的怎么办?" ChatGPT 桌面 app 和部分 iOS 客户端不传 referrer。目前没法完美解决,所以漏斗问题(第 3 步)是必要的交叉验证。
- "数据量太小无法统计显著怎么办?" 先把单一文章做到单通道 3 个月 500 次以上的引用,再谈对照。外贸站早期样本少,可以把 5–10 篇 pillar article 合并分析。
三条推论
推论 1:外贸站不能用同一套 KPI 衡量 SEO 和 GEO。
"UV × 转化率"在 GEO 上丢失了"被引用但未点击"的部分。GEO 的第一指标应该是引用次数(citation count)+ 品牌搜索 lift,而不是到站 UV。
推论 2:GEO 的 ROI 曲线滞后但更稳定。
外贸站常做 Google Ads 补量应对 Core Update 波动——GEO 的"抗波动"特性让它可以在一定程度上替代 Ads 作为自然流量的稳定器。
推论 3:双通道内容策略比单通道更稳健。
对同一篇内容同时做 SEO + GEO 优化的成本增量不大——Schema、llms.txt、可引用段落与基础 SEO 重合度高(见 M7 可引用段落方法论)——但风险分散显著。
实验的局限
- 样本只有一个站、一篇文章、一个行业,不能直接泛化到消费品类外贸 B2C;
- "被引用但未点击" 的估算依赖 prompt 采样,实际数字可能有 20%–40% 误差;
- 品牌搜索 +42% 无法完全归因到 GEO——也可能是同期 LinkedIn 内容 + 通稿的叠加效应;
- Google AI Overview 的 Search appearance 数据在实验时还未 GA,2026 年的复现版本会更准。
这只是一个起点。 需要在更多站、更多时间窗、更多行业里复现。欢迎同行用自己的数据验证或反驳——把 CSV 发到社交账号一起看。
配套阅读
- 《LLM 引用机制:ChatGPT / Perplexity / Google AI Overview 的可引用条件》 — GEO 通道上游:怎么让内容被引用
- 《可引用段落写法:让 LLM 能"原文引用"的段落结构》 — 同一篇内容同时优化 SEO + GEO 的写法
- 《Python ChatGPT 引用检查脚本》 — 本实验用的采样脚本简化版