当前位置：首页 > article >正文

阿里斑马智行 2025届秋招 NLP算法工程师

article 2025/2/21 3:16:59

文章目录

个人情况
一面/技术面 1h
二面/技术面 1h
三面/HR面 20min

个人情况

先说一下个人情况：

学校情况：211本中9硕，本硕学校都一般，本硕都是计算机科班，但研究方向并不是NLP，而是图表示学习
论文情况：1A(NeurIPS)+1B(ICDM)已录用，还有一篇A会(AAAI 2025)最近快出结果了，以及一篇数据挖掘A刊TOIS在投，四篇论文都是一作
实习情况：快手推荐算法日常实习 + 腾讯大模型暑期实习
奖学金情况：本科生国家奖学金、研究生国家奖学金，4次校级一等奖学金
其他：我的CSDN等平台有一点粉丝量，至于其他诸如数学建模还有蓝桥杯获奖，以及优秀毕业论文和优秀毕业生之类的，对求职也没太大作用

阿里今年秋招hc基本都只给转正，招人很少，形势不太好，大模型领域更是如此了，面了几家基本也都是走个过场，毕竟不是大模型科班出身，还是差了点

阿里这边只有斑马走完流程拿到了offer，阿里旗下一个做汽车科技的独角兽企业，目前等待开奖
在这里插入图片描述

一面/技术面 1h

自我介绍
介绍大模型实习
应用场景是什么，有什么意义
构造SFT数据的细节
SFT的prompt模板
目前的方案有没有什么创新的地方
后续有没有什么改进，具体介绍一下
效果如何评估
大模型SFT过程中自己有没有什么总结出来的经验
SFT过程中如何判断是否过拟合
硕士期间发表的paper，可以结合ppt来介绍一下
如何看待目前大语言模型都是decoder-only结构
encoder-only和decoder-only的对比，纯理解场景哪个更优
描述一下典型的encoder-only如Bert的结构细节
多层堆叠时如何避免梯度消失和梯度爆炸
DPO和PPO
代码题：lc75，颜色分类

二面/技术面 1h

自我介绍
询问转正情况
介绍大模型实习，具体负责了哪些板块
为什么没有公司内部的LLM
为什么非得用长文本而不用RAG
为什么不用GPT-4
prompt优化这部分做了什么工作
prompt优化这部分还了解哪些方法吗
如何判断当前使用的prompt就是最优的，无法进一步调整了
不做全量微调的原因（还能什么原因，没卡）
SFT的资源描述，卡数，机器数
SFT过程中如何判断是否过拟合
有没有系统学过机器学习课程，开始拷问八股
如何判断一个模型是否收敛，从多个角度回答
判断收敛需要用验证集吗
如何定量判断是否收敛
如何判断目前的收敛点是局部最优解还是全局最优解
测试集为什么一定需要存在，亦或者为什么不直接把验证集测试集合在一起
主要使用什么语言（Python），有没有系统学过C++
C++中STL中一些容器的底层实现原理
pytorch中的计算图
最近看的一些开源代码和paper介绍，有没有学到什么东西
对第一份工作的预期，希望加入什么团队
反问：进来后可能会做的方向

三面/HR面 20min

自我介绍
询问高考成绩，成绩排名
保研学校抉择问题
硕士期间在专业方向上的产出介绍
大概介绍了下论文
介绍大模型实习
实习对自己的提升是什么
针对本次面试的岗位，你觉得自己有哪些优势
平时通过什么途径来学习新东西
周围人/自己如何评价自己，优缺点
职业规划
反问：后续流程

http://www.kler.cn/a/398840.html

相关文章：

The Internals of PostgreSQL 翻译版持续更新...

Java语言在医疗健康小程序开发中的应用研究

机器学习周报（11.11-11.17）

力扣-2175、世界排名的变化

mybatis 动态SQL语句

CSS预编译器：让样式编写更高效的秘密武器（6）

何为Jenkins

React中组件通信的几种方式

微软推出的AI无代码编程微应用平台GitHub Spark和国产AI原生无代码工具CodeFlying比到底咋样？

华为云stack网络服务流量走向

基于Hadoop、hive的数仓搭建实践

VUE+SPRINGBOOT实现邮箱注册、重置密码、登录功能

react17安装html-react-parser运行报错记录

Android Framework PMS面试题及参考答案

【AI图像生成网站Golang】项目架构

电脑长期不用，开不了机怎样解决

【FFmpeg系列】：音频处理

蓝队知识浅谈（上）

Sqlserver 操作大数据量表，具体操作时间和服务器的配置等都有关系

MarDini：Meta与KAUST合作的AI视频插帧技术，树立视频生成新标杆