URL重写后,如何确保旧URL的权重能正确传递到新URL?
解读
在国内面试场景里,这道题表面问“技术”,实则考察“权重继承的闭环思维”。面试官想确认三件事:
- 你是否知道百度对301的识别周期与考核标准;
- 你能否把技术、数据、运营三条线串成可落地的SOP;
- 你有没有处理过大站或政府/教育类高信任域的迁移经验,能否在“不能丢量”的高压下给出灰度方案。
回答时,先给出“权重传递=搜索引擎信任度转移”的定义,再按“事前—事中—事后”拆动作,最后落到可量化的验收指标,才能体现资深度。
知识点
- 百度301:完整传递权值需2—6个自然周,首次抓取返回码必须为301,且Location字段只能出现一次,禁止链式跳转。
- 信任度继承因子:旧URL年龄、历史点击行为、外链数量与质量、主体备案一致性、新URL首次评分(Core Update窗口期会重新计算)。
- 国内特有:百度站长平台“网站改版”工具需提交“规则改版”或“新旧URL对”文件,支持https与http分开提交;ICP备案主体变更>30%时,权重继承会被降权一档。
- 技术细节:Nginx return 301、Apache RewriteRule [R=301,L]、CDN边缘规则回源301、Sitemap中仅保留新URL、robots.txt禁止旧URL抓取。
- 数据监控:百度资源平台“索引量”“流量与关键词”“抓取失败”三项日报;第三方爱站/5118历史曲线对比;服务器日志中baiduspider 301状态码占比=100%且404=0。
- 风险控制:灰度10%→30%→100%阶梯上线,每阶段留存7天观察转码与快照更新;旧URL外链前200域逐一邮件+微信沟通改链,降低外链衰减率。
- 验收指标:四周后旧URL百度快照消失、新URL快照标题与描述无误;目标关键词排名TOP10占比≥迁移前95%;SEO UV周同比跌幅<3%。
答案
第一步,全量映射:用Python+MySQL跑完整站URL,生成“旧→新”一一对应字典,确保无逻辑歧义,杜绝多对一或一对多。
第二步,纯301:运维在凌晨低峰期上线Nginx return 301,Location一次性写死,禁止302或js跳转;同步在CDN侧配置边缘规则,保证全国节点全部返回301。
第三步,平台提交:登录百度站长平台,进入“网站改版-规则改版”,按“^/old/(.*)1”格式提交,附sitemap_txt仅含新URL,加速百度发现。
第四步,外链修复:导出Ahrefs+爱站外链前500域,运营同学48小时内完成邮件、微信、QQ三通道触达,争取70%外链主动改链;剩余30%无法修改的,用301兜底继承。
第五步,数据监控:上线当天起,每日拉取服务器日志,grep baiduspider | awk '$9==301'确保占比100%;同时记录百度资源平台“索引量”曲线,若新URL索引量7天内未达旧URL 80%,立即回滚灰度比例并排查链式跳转。
第六步,验收与报告:第四周出具《权重迁移验收报告》,核心指标:①旧URL快照清零;②新URL排名TOP10关键词数≥原95%;③SEO UV周同比跌幅<3%;④外链衰减率<15%。全部达标即宣告迁移成功,否则启动二次补救:增加优质外链、内链锚文本强化、临时sitemap旧URL重新提交加速404。
拓展思考
- 若旧URL已做百度小程序,需在小程序后台同步“路径映射”,否则会出现小程序快照与新URL打架,导致转码异常。
- 政府/教育类高信任域迁移时,建议提前30天向百度资源平台发邮件报备(gov/edu邮箱),申请“信任度保护白名单”,可缩短301生效周期至2周。
- 对电商大促节点,采用“二级目录先行”策略:/old/→/new/先灰度10%SKU,确认无异常后再全量,避免大促流量峰值期因快照回档导致订单损失。
- 未来若百度全量上线“IndexNow”或“MIP推送3.0”,可实时推送新URL,301仅做兜底,届时权重传递周期可能从周级降至天级,需持续关注官方公告。