当前位置：首页 > article >正文

【NLP算法面经】腾讯 WXG 技术研究-NLP算法三面复盘（★附面题整理★）

article 2025/2/24 7:31:34

【NLP算法面经】腾讯 WXG 技术研究-NLP算法三面复盘（★附面题整理★）

🌟 嗨，你好，我是青松！

🌈 自小刺头深草里，而今渐觉出蓬蒿。

NLP Github 项目推荐：

【AI 藏经阁】：https://gitee.com/fasterai/ai-e-book

介绍：该仓库主要分享了数百本 AI 领域电子书
【AI 算法面经】：fasterai/nlp-interview-handbook#面经

介绍：该仓库一网打尽互联网大厂NLP算法面经，算法求职必备神器
【大模型（LLMs）面试笔记】：https://gitee.com/fasterai/nlp-interview-handbook

介绍：该仓库汇总了 NLP 算法工程师高频面题，适合大模型初学者和正在准备面试的小伙伴希望能帮助各位同学缩短面试准备时间，不错过金三银四涨薪窗口，迅速收获心仪的Offer 🎉🎉🎉

文章目录

- 一面初试
- 面委会复试
- HR面试
- 总结
大模型（LLMs）高频面题全面整理（🌟2025 Offer 必备🌟）
- 一、大模型进阶面
- - [💯 DeepSeek篇](https://t.zsxq.com/YmHO4)
  - [💯 大模型编辑篇](https://t.zsxq.com/YmHO4)
  - [💯 大模型压缩篇](https://t.zsxq.com/YmHO4)
  - [💯 分布式训练篇](https://t.zsxq.com/YmHO4)
- 二、大模型微调面
- - [💯 有监督微调（SFT）篇](https://t.zsxq.com/YmHO4)
  - [💯 高效微调篇](https://t.zsxq.com/YmHO4)
  - [💯 提示学习篇](https://t.zsxq.com/YmHO4)
  - [💯 人类对齐训练（RLHF）篇](https://t.zsxq.com/YmHO4)
  - [💯 Prompt 工程篇](https://t.zsxq.com/YmHO4)
- 三、大模型（LLMs）基础面
- - [💯 大模型（LLMs）架构篇](https://t.zsxq.com/YmHO4)
  - [💯 注意力机制（Attention）篇](https://t.zsxq.com/YmHO4)
  - [💯 Transformer 理论篇](https://t.zsxq.com/YmHO4)
- 四、NLP 任务实战面
- - [💯 文本分类篇](https://t.zsxq.com/YmHO4)
  - [💯 命名实体识别（NER）篇](https://t.zsxq.com/YmHO4)
  - [💯 关系抽取篇](https://t.zsxq.com/YmHO4)
  - [💯 检索增强生成（RAG）篇](https://t.zsxq.com/YmHO4)
- 五、NLP 基础面
- - [💯 分词（Tokenizer）篇](https://t.zsxq.com/YmHO4)
  - [💯 词嵌入（Word2Vec）篇](https://t.zsxq.com/YmHO4)
  - [💯 卷积神经网络（CNN）篇](https://t.zsxq.com/YmHO4)
  - [💯 循环神经网络（RNN）篇](https://t.zsxq.com/YmHO4)
  - 💯 长短期记忆网络（LSTM）篇
  - [💯 BERT 模型篇](https://t.zsxq.com/YmHO4)
  - [💯 BERT 变体篇](https://t.zsxq.com/YmHO4)
  - [💯 BERT 实战篇](https://t.zsxq.com/YmHO4)
- 六、深度学习面
- - [💯 激活函数篇](https://t.zsxq.com/YmHO4)
  - [💯 优化器篇](https://t.zsxq.com/YmHO4)
  - [💯 正则化篇](https://t.zsxq.com/YmHO4)
  - [💯 归一化篇](https://t.zsxq.com/YmHO4)
  - [💯 参数初始化篇](https://t.zsxq.com/YmHO4)
  - [💯 过拟合篇](https://t.zsxq.com/YmHO4)
  - [💯 集成学习篇](https://t.zsxq.com/YmHO4)
  - [💯 模型评估篇](https://t.zsxq.com/YmHO4)

腾讯WXG 已offer，岗位是技术研究-自然语言处理方向

一面初试

时间约30min

介绍一下比赛
介绍multi sample dropout
比赛还用到什么预训练模型
bert、roberta、xlnet异同点
如何处理文本长度大于512
bert参数如何计算
bert mask策略，作用分别是什么

面委会复试

时间约30min

问一下自己认为做的比较好的，有亮点的比赛或项目，
介绍了下比赛，最后介绍了模型融合的方式，为什么选择加权融合，当时还尝试了stacking融合，只不过stacking融合的结果不如加权融合的好，这个解释有点牵强，没有从理论上进行解释。
介绍了下项目，落地的场景
论文什么时候出结果。

HR面试

时间约30min

自我介绍
为什么选择做NLP，为什么读硕士，还读博么
爱好？工作地点？缺点？
从小到大，一个人计划，组织，实行，成功的事
为什么不投其它事业群

总结

一定要投提前批！一定要投提前批！一定要投提前批！刚回学校的时候在改论文，没有时间复习刷题（主要也是因为寒假太堕落了，没能静下心来学习T T），浪费了很多提前批的机会。提前批阶段简历不进系统，私下面试，就算挂了也不影响内推和正式批。

回到学校也开始慢慢刷题复习，有针对性地投了几家公司，腾讯相对来说是较晚投的，但却是第一个发起面试邀请的，不得不说腾讯的工作效率很高。面试过程也很愉快，HR小姐姐说话很温柔，贼好听。

面试完需要复盘，总结哪里不足。面试官提到的一点让我印象很深刻，就是不仅要做到知其然，还要知其所以然。确实有些方法，我只了解他是怎么做的，却不明白为何这样做。这个坏习惯算是打比赛“培养”出来的吧。参加了很多比赛，尝试了很多方法去刷榜，只知道这些方法怎么用，却不了解其原理，比赛结束后也没花时间去看论文。复习的时候也是如此，尽量去看论文原文，博客笔记只是辅助。我记得复习BERT的时候就发现有些博客讲得不一样，然后回过头去看BERT论文才更加深入。

先写这么多吧~

大模型（LLMs）高频面题全面整理（🌟2025 Offer 必备🌟）

全面总结了【大模型面试】的高频面题和答案解析，答案尽量保证通俗易懂且有一定深度。

适合大模型初学者和正在准备面试的小伙伴。

希望也能帮助你快速完成面试准备，先人一步顺利拿到高薪 Offer 🎉🎉🎉

一、大模型进阶面

💯 DeepSeek篇

【大模型进阶面之 DeepSeek篇】你必须要会的高频面题 查看答案

一、概念篇
- Deepseek-V3的主要特点有哪些？
- DeepSeek-V3在推理速度方面表现出色的原因有哪些？
二、模型结构篇
- MLA
  - 什么是多头潜在注意力（MLA）？
  - MLA的计算流程是什么样的？
  - 训练时MLA需要配置哪些超参？
  - MLA相对于MHA有哪些改进？
- MoE
  - 什么是MoE？
  - DeepSeekMoE包含哪两种专家类型？
  - Share 专家和Router 专家的作用是什么？
  - 讲一下DeepSeekMoE的计算流程？
  - DeepSeekMoE是如何实现负载均衡的？
- MTP
  - 什么是Multi-Token Prediction（MTP）？
  - Multi-Token Prediction（MTP）有何作用？
  - 讲一下Multi-Token Prediction（MTP）的预测流程？
三、预训练篇
- Prefix-Suffix-Middle (PSM)数据格式是什么样的？
- DeepSeek预训练数据为何使用Prefix-Suffix-Middle (PSM)格式？
- 介绍一下Byte-level BPE？
- DeepSeek是如何进行长上下文扩展的？
- DeepSeek的使用YaRN进行长上下文扩展有哪两个阶段？
- DeepSeek预训练追求极致的训练效率的做法有哪些？
- 批量级负载均衡（Batch-Wise Load Balance）和顺序级负载均衡（Sequence-Wise Load Balance）有何区别？
- 使用MTP为何在提高计算效率的同时还能提升效果？
**四、有监督微调篇
- DeepSeek的SFT有哪几种数据？
- DeepSeek是如何构造Reasoning Data数据的？
- DeepSeek两种不同类型的SFT数据，区别是什么？
- DeepSeek在SFT训练时是如何加速训练过程的？
五、强化学习篇
- DeepSeek有哪两种奖励模型？
- Rule-Based RM和Model-Based RM的区别是什么？
- Rule-Based RM用在什么地方？有何作用？
- Model-Based RM用在什么地方？有何作用？
- DeepSeek是如何降低奖励欺诈风险的？
- DeepSeek为何使用Group Relative Policy Optimization（GRPO）？
- DeepSeek为何放弃Critic模型来估计状态的价值？
- DeepSeek是如何进行Self-Rewarding的？
- DeepSeek-V3从DeepSeek-R1中蒸馏知识有哪些影响？

点击查看答案

💯 大模型编辑篇

【大模型进阶面之模型魔改篇】你必须要会的高频面题 查看答案

模型编辑（Model Editing）核心目标是什么？
对比重新预训练和微调，模型编辑的优势和适用场景是什么？
如何用模型编辑修正大语言模型中的知识错误？
如何量化评估模型编辑的五大性质？
模型编辑局部性如何避免“牵一发而动全身”的问题？
知识缓存法（如SERAC）的工作原理是什么？
附加参数法（如T-Patcher）如何在不改变原始模型架构的情况下实现编辑？
知识缓存法和附加参数法的优缺点有何优缺点？
ROME方法如何通过因果跟踪实验定位知识存储位置？
元学习法（如MEND）如何实现“学习如何编辑”？
元学习法的双层优化框架如何设计？
More …

点击查看答案

💯 大模型压缩篇

【大模型进阶面之模型压缩篇】你必须要会的高频面题 查看答案

💯 为什么需要对大模型进行压缩和加速？
💯 什么是低秩分解？
💯 什么是奇异值分解（SVD）？
💯 权值共享为什么有效？
💯 什么是模型量化？
💯 什么是混合精度分解？
💯 什么是基于反馈的知识蒸馏？
💯 什么是基于特征的知识蒸馏？
💯 模型蒸馏的损失函数是什么？
💯 描述一下剪枝的基本步骤？
More …

点击查看答案

💯 分布式训练篇

【大模型进阶面之分布式训练篇】你必须要会的高频面题 查看答案

PS架构和Ring-AllReduce架构有何不同？
什么是张量并行，如何使用集群计算超大矩阵？
讲一讲谷歌的GPipe算法？
讲一讲微软的PipeDream算法？
ZeRO1、ZeRO2、ZeRO3分别做了哪些优化？
用DeepSpeed进行训练时主要配置哪些参数？
More …

点击查看答案

二、大模型微调面

💯 有监督微调（SFT）篇

【大模型微调面之 SFT篇】你必须要会的高频面题 查看答案

💯 从零训练一个大模型有哪几个核心步骤？
💯 为什么要对LLM做有监督微调（SFT）？
💯 如何将一个基础模型训练成一个行业模型？
💯 如何准备SFT阶段的训练数据？
💯 如何自动生成指令构建SFT的训练数据？
💯 LM做有监督微调（SFT）变傻了怎么办？
💯 有监督微调（SFT）和人工偏好对齐（RLHF）有何区别？
More …

点击查看答案

💯 高效微调篇

【大模型微调面之 PEFT篇】你必须要会的高频面题 查看答案

💯 全量微调与参数高效微调的区别是什么？
💯 什么是轻度微调？轻度微调有哪些常用方法？
💯 什么是BitFit微调？
💯 分层微调如何设置学习率？
💯 什么是适配器微调？适配器微调有哪些优势？
💯 讲一讲IA3微调？
💯 提示学习（Prompting）代表方法有哪些？
💯 指令微调（Instruct-tuning）和提示学习（Prompting）的区别是什么？
💯 详细说明LoRA的工作原理及其优势？
💯 LoRA存在低秩瓶颈问题，ReLoRA和AdaLoRA分别通过哪些方法改进？
💯 动态秩分配（如AdaLoRA）如何根据层的重要性调整秩？
More …

点击查看答案

💯 提示学习篇

【大模型微调面之提示学习篇】你必须要会的高频面题 查看答案

💯 提示学习（Prompting）代表方法有哪些？
💯 前缀微调（Prefix-tining）的核心思想？
💯 提示微调（Prompt-tuning）的核心思想？
💯 P-tuning 的动机是什么？
💯 P-tuning v2 进行了哪些改进？
💯 提示微调（Prompt-tuning）与 Prefix-tuning 区别是什么？
💯 提示微调（Prompt-tuning）与 fine-tuning 区别是什么？
More …

点击查看答案

💯 人类对齐训练（RLHF）篇

【大模型微调面之 RLHF篇】你必须要会的高频面题 查看答案

💯 RLHF有哪几个核心流程？
💯 RLHF与SFT的本质区别是什么？为什么不能只用SFT？
💯 什么是人类偏好对齐中的"对齐税"(Alignment Tax)？如何缓解？
💯 在强化学习中，基于值函数的和基于策略的的优化方法有何区别？
💯 什么是近端策略优化（PPO）？
💯 RLHF中的PPO主要分哪些步骤？
💯 PPO中的重要性采样(Importance Sampling)如何修正策略差异？
💯 DPO如何通过隐式奖励建模规避强化学习阶段？
💯 DPO vs PPO：训练效率与性能上限的对比分析？
💯 RLHF训练数据的格式是什么样的？
💯 如何选择人类偏好对齐训练算法？
More …

点击查看答案

💯 Prompt 工程篇

【大模型微调面之提示工程篇】你必须要会的高频面题 查看答案

💯 Prompt工程与传统微调的区别是什么？
💯 如何规范编写Prompt？
💯 上下文学习三种形式（零样本、单样本、少样本）的区别？
💯 如何通过预训练数据分布和模型规模优化上下文学习效果？
💯 思维链（CoT）的核心思想是什么？
💯 按部就班（如 Zero-Shot CoT、Auto-CoT）、三思后行（如 ToT、GoT）、集思广益（如 Self-Consistency）三种 CoT 模式有何异同？
More …