如何判断一个外链来源是否属于垃圾链接网络(Link Farm)?
解读
国内面试官问这道题,核心想验证三件事:
- 你是否能把“链接农场”这一黑帽概念与百度、搜狗、360 等国内搜索引擎的识别逻辑对应起来;
- 你是否具备可落地的排查流程,而不是只背定义;
- 你能否用数据说话,用工具、指标、案例把判断过程标准化,方便团队复制。
因此,回答要“有定义、有指标、有工具、有案例”,并体现对国内监管风险(如百度惊雷、蓝天算法)的敏感度。
知识点
- 链接农场本质:以操纵排名为目的、批量互换或出售外链的低质站点集群,常伴随内容农场、蜘蛛池、站群。
- 国内算法对应:百度“绿萝”“惊雷”“蓝天”、360“悟空”、搜狗“犀牛”,均明确打击链接交易与站群。
- 核心识别维度:主题相关性、链接拓扑、内容质量、流量健康度、Whois 重合度、历史惩罚记录。
- 国内常用工具:百度资源平台“外链分析”、5118“站群监控”、爱站“反链检测”、ChinaZ“同IP站点”、百度口碑“安全评级”。
- 量化红线(经验值,供面试引用):
- 出站链接>100 且锚文本重复率>70%;
- 同IP/C 段下绑定域名>50;
- 百度流量预估<50 但反链数>1000;
- 域名年龄<1 年却拥有大量政府/教育反链;
- 快照 30 天内无更新但每日新增反链>100。
- 法律风险:国内《反不正当竞争法》第八条已覆盖“虚假商业宣传”,链接农场若被竞争对手公证,可触发行政举报。
答案
判断流程可拆成“五步筛”:
第一步,基础过滤。用百度资源平台导出外链列表,按域名聚合,先筛出“无备案、无安全评级、被百度风险提示”的域名,直接拉黑。
第二步,批量指标。把剩余域名扔进 5118“站群监控”,看同IP、同Whois 邮箱、同模板覆盖率,任一指标>50% 即高度可疑。
第三步,内容体检。随机抓取 20 个疑似页面,人工检查:若文章字数<300 字、关键词密度>8%、正文插入>5 处无意义锚文本,可判定为内容农场,其外链一并降权。
第四步,链接图谱。用 Python+Gephi 拉取域名 A 的出链与入链,计算“出链域名多样性(ODD)”与“互链三角形数量”。ODD<0.3 且互链三角形>100 的,基本属于闭环农场。
第五步,惩罚验证。在百度搜索资源平台“索引量”里查看该域名近 90 天趋势,若出现断崖式下跌或与惊雷、蓝天算法更新时间高度吻合,即可坐实惩罚记录,直接拒掉。
落地时,把以上五步写成 SOP,每周跑一次自动化脚本,输出“红橙绿”名单,绿名单正常、橙名单人工复核、红名单永久屏蔽,并同步给内容与合作团队,防止采购或互换时再次踩坑。
拓展思考
- 国际化视角:若公司同时做 Google,需叠加 Spam Score、SERP 波动、Penguin 刷新日期,避免“国内干净、国外被惩罚”的双标陷阱。
- 反制策略:发现竞争对手用农场冲排名,可先做公证保全,再向百度举报中心提交“作弊线索”,同步在站长平台申请“恶意外链屏蔽”,缩短对方存活周期。
- AI 生成内容冲击:2024 年起,国内出现“AI 内容+AI 外链”的混合农场,特征为语义通顺但事实错误、配图带隐形水印。判断时要增加“事实核查+图片哈希比对”步骤,防止传统关键词密度法失效。