Transformer

题库介绍
Transformer 是一种基于自注意力机制(Self-Attention)的深度学习模型架构,由 Vaswani 等人在 2017 年提出,彻底颠覆了传统 RNN/CNN 序列建模方式。它通过 Multi-Head Attention、位置编码与并行化训练,实现长距离依赖捕捉与高效 GPU 加速,成为 NLP、CV、语音等多模态任务的事实标准,并衍生出 BERT、GPT、T5 等预训练大模型家族。
基本信息
题目数
300
更新时间
2025-09-22

问题目录