当前位置: 首页 > article >正文

阿里斑马智行 2025届秋招 NLP算法工程师

文章目录

  • 个人情况
  • 一面/技术面 1h
  • 二面/技术面 1h
  • 三面/HR面 20min

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN等平台有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

阿里今年秋招hc基本都只给转正,招人很少,形势不太好,大模型领域更是如此了,面了几家基本也都是走个过场,毕竟不是大模型科班出身,还是差了点

阿里这边只有斑马走完流程拿到了offer,阿里旗下一个做汽车科技的独角兽企业,目前等待开奖
在这里插入图片描述

一面/技术面 1h

  1. 自我介绍
  2. 介绍大模型实习
  3. 应用场景是什么,有什么意义
  4. 构造SFT数据的细节
  5. SFT的prompt模板
  6. 目前的方案有没有什么创新的地方
  7. 后续有没有什么改进,具体介绍一下
  8. 效果如何评估
  9. 大模型SFT过程中自己有没有什么总结出来的经验
  10. SFT过程中如何判断是否过拟合
  11. 硕士期间发表的paper,可以结合ppt来介绍一下
  12. 如何看待目前大语言模型都是decoder-only结构
  13. encoder-only和decoder-only的对比,纯理解场景哪个更优
  14. 描述一下典型的encoder-only如Bert的结构细节
  15. 多层堆叠时如何避免梯度消失和梯度爆炸
  16. DPO和PPO
  17. 代码题:lc75,颜色分类

二面/技术面 1h

  1. 自我介绍
  2. 询问转正情况
  3. 介绍大模型实习,具体负责了哪些板块
  4. 为什么没有公司内部的LLM
  5. 为什么非得用长文本而不用RAG
  6. 为什么不用GPT-4
  7. prompt优化这部分做了什么工作
  8. prompt优化这部分还了解哪些方法吗
  9. 如何判断当前使用的prompt就是最优的,无法进一步调整了
  10. 不做全量微调的原因(还能什么原因,没卡)
  11. SFT的资源描述,卡数,机器数
  12. SFT过程中如何判断是否过拟合
  13. 有没有系统学过机器学习课程,开始拷问八股
  14. 如何判断一个模型是否收敛,从多个角度回答
  15. 判断收敛需要用验证集吗
  16. 如何定量判断是否收敛
  17. 如何判断目前的收敛点是局部最优解还是全局最优解
  18. 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
  19. 主要使用什么语言(Python),有没有系统学过C++
  20. C++中STL中一些容器的底层实现原理
  21. pytorch中的计算图
  22. 最近看的一些开源代码和paper介绍,有没有学到什么东西
  23. 对第一份工作的预期,希望加入什么团队
  24. 反问:进来后可能会做的方向

三面/HR面 20min

  1. 自我介绍
  2. 询问高考成绩,成绩排名
  3. 保研学校抉择问题
  4. 硕士期间在专业方向上的产出介绍
  5. 大概介绍了下论文
  6. 介绍大模型实习
  7. 实习对自己的提升是什么
  8. 针对本次面试的岗位,你觉得自己有哪些优势
  9. 平时通过什么途径来学习新东西
  10. 周围人/自己如何评价自己,优缺点
  11. 职业规划
  12. 反问:后续流程

http://www.kler.cn/a/398840.html

相关文章:

  • 探索Python网络请求新纪元:httpx库的崛起
  • 【MQTT.fx 客户端接入 阿里云平台信息配置】
  • 【MySQL】优化方向+表连接
  • 场景营销在企业定制开发 AI 智能名片 S2B2C 商城小程序中的应用与价值
  • 【3D Slicer】的小白入门使用指南九
  • RT-Thread 星火1号学习笔记
  • The Internals of PostgreSQL 翻译版 持续更新...
  • Java语言在医疗健康小程序开发中的应用研究
  • 机器学习周报(11.11-11.17)
  • 力扣-2175、世界排名的变化
  • mybatis 动态SQL语句
  • CSS预编译器:让样式编写更高效的秘密武器(6)
  • 何为Jenkins
  • React中组件通信的几种方式
  • 微软推出的AI无代码编程微应用平台GitHub Spark和国产AI原生无代码工具CodeFlying比到底咋样?
  • 华为云stack网络服务流量走向
  • 基于Hadoop、hive的数仓搭建实践
  • VUE+SPRINGBOOT实现邮箱注册、重置密码、登录功能
  • react17安装html-react-parser运行报错记录
  • Android Framework PMS面试题及参考答案
  • 【AI图像生成网站Golang】项目架构
  • 电脑长期不用,开不了机怎样解决
  • 【FFmpeg系列】:音频处理
  • 蓝队知识浅谈(上)
  • Sqlserver 操作大数据量表,具体操作时间和服务器的配置等都有关系
  • MarDini:Meta与KAUST合作的AI视频插帧技术,树立视频生成新标杆