阿里斑马智行 2025届秋招 NLP算法工程师

文章目录

  • 个人情况
  • 一面/技术面 1h
  • 二面/技术面 1h
  • 三面/HR面 20min

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN等平台有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

阿里今年秋招hc基本都只给转正,招人很少,形势不太好,大模型领域更是如此了,面了几家基本也都是走个过场,毕竟不是大模型科班出身,还是差了点

阿里这边只有斑马走完流程拿到了offer,阿里旗下一个做汽车科技的独角兽企业,目前等待开奖
在这里插入图片描述

一面/技术面 1h

  1. 自我介绍
  2. 介绍大模型实习
  3. 应用场景是什么,有什么意义
  4. 构造SFT数据的细节
  5. SFT的prompt模板
  6. 目前的方案有没有什么创新的地方
  7. 后续有没有什么改进,具体介绍一下
  8. 效果如何评估
  9. 大模型SFT过程中自己有没有什么总结出来的经验
  10. SFT过程中如何判断是否过拟合
  11. 硕士期间发表的paper,可以结合ppt来介绍一下
  12. 如何看待目前大语言模型都是decoder-only结构
  13. encoder-only和decoder-only的对比,纯理解场景哪个更优
  14. 描述一下典型的encoder-only如Bert的结构细节
  15. 多层堆叠时如何避免梯度消失和梯度爆炸
  16. DPO和PPO
  17. 代码题:lc75,颜色分类

二面/技术面 1h

  1. 自我介绍
  2. 询问转正情况
  3. 介绍大模型实习,具体负责了哪些板块
  4. 为什么没有公司内部的LLM
  5. 为什么非得用长文本而不用RAG
  6. 为什么不用GPT-4
  7. prompt优化这部分做了什么工作
  8. prompt优化这部分还了解哪些方法吗
  9. 如何判断当前使用的prompt就是最优的,无法进一步调整了
  10. 不做全量微调的原因(还能什么原因,没卡)
  11. SFT的资源描述,卡数,机器数
  12. SFT过程中如何判断是否过拟合
  13. 有没有系统学过机器学习课程,开始拷问八股
  14. 如何判断一个模型是否收敛,从多个角度回答
  15. 判断收敛需要用验证集吗
  16. 如何定量判断是否收敛
  17. 如何判断目前的收敛点是局部最优解还是全局最优解
  18. 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
  19. 主要使用什么语言(Python),有没有系统学过C++
  20. C++中STL中一些容器的底层实现原理
  21. pytorch中的计算图
  22. 最近看的一些开源代码和paper介绍,有没有学到什么东西
  23. 对第一份工作的预期,希望加入什么团队
  24. 反问:进来后可能会做的方向

三面/HR面 20min

  1. 自我介绍
  2. 询问高考成绩,成绩排名
  3. 保研学校抉择问题
  4. 硕士期间在专业方向上的产出介绍
  5. 大概介绍了下论文
  6. 介绍大模型实习
  7. 实习对自己的提升是什么
  8. 针对本次面试的岗位,你觉得自己有哪些优势
  9. 平时通过什么途径来学习新东西
  10. 周围人/自己如何评价自己,优缺点
  11. 职业规划
  12. 反问:后续流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/18212.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

谈一谈QThread::CurrentThread和this->thread

QThread::CurrentThread是指的当前函数调用者者所在的线程 this->thread是指的当前对象所在的线程(对象创建出来的时候所在的线程) Qt文档说明 CurrentThread返回一个指向管理当前执行线程的QThread的指针 thread返回对象所在的线程 这两个函数所…

深度学习实验十一 卷积神经网络(2)——基于LeNet实现手写体数字识别实验

目录 一、数据 二、模型构建 三、模型训练及评价 四、打印参数量和计算量 五、模型预测 附:完整可运行代码 实验大致步骤: 一、数据 下载网站:MNIST数据集 之前的官网不能下载数据集了,403了,所以找到一个类似…

Python语法便捷查询

一、Python基础语法: (1)注释: (2)标识符: 简介:标识符的格式限制和C语言一样 (3)字符串定义方法: (4)字符串拼接: (5)字符串的格式化(占位拼接): 和C语言的printf类…

Ansys Maxwell - 3PH 感应电机 - 第 2 部分 - 机床工具包 ACT

本篇博文是“Ansys Maxwell:3PH 感应电机 - 力和热耦合”的延续。在本篇博文中,我将展示如何使用 Ansys Machine Toolkit ACT 开发扭矩与速度曲线(一系列性能曲线,包括效率图),以评估在 Ansys Maxwell 中建…

【含开题报告+文档+PPT+源码】基于springboot的教师评价系统的设计与实现

开题报告 随着信息技术的迅猛发展,教育信息化已成为现代教育的必然趋势。教研室作为高校教学管理的重要机构,肩负着提升教学质量、推动教学改革的重要使命。然而,传统的教学管理方式往往存在效率低下、数据分散、管理不便等问题,…

用 Python 从零开始创建神经网络(八):梯度、偏导数和链式法则

梯度、偏导数和链式法则 引言1. 偏导数2. 和的偏导数3. 乘法的偏导数4. Max 的偏导数5. 梯度(The Gradient)6. 链式法则(The Chain Rule) 引言 在我们继续编写我们的神经网络代码之前,最后两个需要解决的难题是梯度和…

并查集 poj 2524,1611,1703,2236,2492,1988 练习集【蓝桥杯备赛】

目录 前言 并查集优势 Ubiquitous Religions poj 2524 问题描述 问题分析 代码 The Suspects poj 1611 问题描述 问题分析 代码 Wireless Network poj 2236 问题描述 问题分析 代码 分类 带权并查集合 权值树构建步骤 Find them, Catch them poj 1703 问题描述 问题分…

zabbix监控tomcat

1. 准备JDK环境 #vim /etc/profile export JAVA_HOME/usr/local/jdk export TOMCAT_HOME/usr/local/tomcat export PATH$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$TOMCAT_HOMOE/bin [rootCentOS8 ~]# source /etc/profile [rootCentOS8 ~]# java -version openjdk version &q…

Nuget For Unity插件介绍

NuGet for Unity:提升 Unity 开发效率的利器 NuGet 是 .NET 开发生态中不可或缺的包管理工具,你可以将其理解为Unity的Assets Store或者UPM,里面有很多库可以帮助我们提高开发效率。当你想使用一个库,恰好这个库没什么依赖(比如newtonjson),那么下载包并找到Dll直接…

如何在 Ubuntu 上安装 Mattermost 团队协作工具

简介 Mattermost 是一个开源、自托管的通信平台,专为团队协作设计。它类似于 Slack,提供聊天、消息传递和集成功能。Mattermost 在重视数据隐私的组织中特别受欢迎,因为它允许团队在自己的服务器上管理通信。以下是 Mattermost 的一些关键特…

初识Linux—— 基本指令(上)

前言 Linux简述 ​ Linux是一种开源、自由、类UNIX的操作系统,由著名的芬兰程序员林纳斯托瓦兹(Linus Torvalds)于1991年首次发布。Linux的内核在GNU通用公共许可证(GPL)下发布,这意味着任何人都可以自由…

VBA技术资料MF223:从文件添加新模块

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

利用RAGflow和LM Studio建立食品法规问答系统

前言 食品企业在管理标准、法规,特别是食品原料、特殊食品法规时,难以通过速查法规得到准确的结果。随着AI技术的发展,互联网上出现很多AI知识库的解决方案。 经过一轮测试,找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉…

路径规划——RRT*算法

路径规划——RRT*算法 算法原理 RRT Star 算法是一种渐近最优的路径规划算法,它是 RRT 算法的优化版本。RRT Star 算法通过不断地迭代和优化,最终可以得到一条从起点到目标点的最优路径。 在学习RRT Star 算法之前最好先学习一下RRT原始算法&#xff1…

Java——并发工具类库线程安全问题

摘要 本文探讨了Java并发工具类库中的线程安全问题,特别是ThreadLocal导致的用户信息错乱异常场景。文章通过一个Spring Boot Web应用程序示例,展示了在Tomcat线程池环境下,ThreadLocal如何因线程重用而导致异常,并讨论了其他并发…

网络编程套接字

前言: 认识了网络,我们就应该考虑一下如何编程实现不同主机上的应用进程之间如何进行双向互通的端点。 套接字(Socket)是网络编程的一种基本概念,套接字是应用程序通过网络协议进行通信的接口,是操作系统提…

计算机网络:运输层 —— TCP 的拥塞控制

文章目录 TCP的拥塞控制拥塞控制的基本方法流量控制与拥塞控制的区别拥塞控制分类闭环拥塞控制算法 TCP的四种拥塞控制方法(算法)窗口慢开始门限慢开始算法拥塞避免算法快重传算法快恢复算法 TCP拥塞控制的流程TCP拥塞控制与网际层拥塞控制的关系 TCP的拥…

vue学习第8章(vue的购物车案例)

🎉🎉🎉欢迎来到我的博客,我是一名自学了2年半前端的大一学生,熟悉的技术是JavaScript与Vue.目前正在往全栈方向前进, 如果我的博客给您带来了帮助欢迎您关注我,我将会持续不断的更新文章!!!🙏🙏🙏 文章目录…

【SpringBoot】什么是Maven,以及如何配置国内源实现自动获取jar包

前言 🌟🌟本期讲解关于Maven的了解和如何进行国内源的配置~~~ 🌈感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 &#x1f3…

【Linux】:进程信号(详谈信号捕捉 OS 运行)

✨ 来去都是自由风,该相逢的人总会相逢 🌏 📃个人主页:island1314 🔥个人专栏:Linux—登神长阶 ⛺️ 欢迎关注:👍点赞…