字节跳动算法岗面试亲历：高效流程大公开，通关诀窍全掌握

最近这一两周看到不少互联网公司都已经开始秋招提前批了。

不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。

个人情况

985 本硕+项目一个+论文一篇+无实习经历

时间节点

7.2 技术面一面

7.4 技术面二面

7.9 HR 面

7.12 offer call+发offer

在这里插入图片描述

面经总结

技术面试

主要问简历项目内容和专业相关知识，也有业务场景提出方案与策略。

在回答业务场景并设计方案的时候，确实之前没有遇到过，所以感觉自己也答的磕磕绊绊，比较好的是，面试官最开始会详细讲解具体是什么场景。

HR 面

想在实习中学到什么/如果offer不过你会做什么/到岗时间和时长/在做项目的过程中遇到的困难/有无考博打算

15分钟很快结束，我还以为凉了，后来发现好像基本都是这个时间。

总结一下：

字节的面试流程很规范，每次都会hr提前联系约面。流程进度也很快，从面试到offer时间为10天。

6、7月份实习还是要试着捡漏的（虽然我简历是5月份投的）

希望大家都能心想事成～

高频面试题总结
目前主流的开源模型体系有哪些？

你了解ReAct吗，它有什么优点？

解释一下langchain Agent的概念

langchain 有哪些替代方案？

LLM 预训练阶段有哪几个关键步骤？

RLHF 模型为什么会表现比SFT更好？

参数高效的微调（PEFT）有哪些方法？

LORA 微调相比于微调适配器或前缀微调有什么优势？

请简述TPPO算法流程，它跟TRPO的区别是什么？

目前主流的中文向量模型有哪些？

为什么LLM的知识更新很困难？

RAG和微调的区别是什么？

大模型一般评测方法及其准是什么？

什么是Kv cache技术，它具体是如何实现的？

DeepSpeed推理对算子融合做了哪些优化？

简述一下FlashAttention的原理

MHA、GQA、MQA三种注意力机制的区别是什么？

请介绍一下微软的ZeRO优化器

Paged Attention的原理是什么，解决了LLM中的什么问题？

什么是投机采样技术，请举例说明？

简述GPT和BERT的区别

讲一下GPT系列模型的是如何演进的？

为什么现在的大模型大多是decoder-only的架构？

讲一下生成式语言模型的工作机理

哪些因素会导致LLM中的偏见？

LLM中的因果语言建模与掩码语言建模有什么区别？

如何减轻LLM中的“幻觉”现象？

解释ChatGPT的“零样本”和“少样本”学习的概念

你了解大型语言模型中的哪些分词技术？

如何评估大语言模型（LLMs）的性能？

请简述下 Transformer 基本原理

为什么 Transformer 的架构需要多头注意力机制？

为什么transformers需要位置编码？

transformer中，同一个词可以有不同的注意力权重吗？

Wordpiece与BPE之间的区别是什么？

有哪些常见的优化LLMs输出的技术？

为什么transformer块使用LayerNorm而不是BatchNorm？

介绍一下post layer norm和pre layer norm的区别

prefix LM和causal LM区别是什么？

llama输入句子长度理论上可以无限长吗？

如何让大模型处理更长的文本？

为什么大模型推理时显存涨的那么多还一直占着？

有哪些省内存的大语言模型训练/微调/推理方法？

RLHF在实践过程中存在哪些不足？

如何解决三个阶段的训练（SFT->RM->PPO）过程较长，更新迭代较慢问题？

什么是位置编码？

什么是绝对位置编码？

什么是相对位置编码？

旋转位置编码RoPE思路是什么？

旋转位置编码RoPE有什么优点？

Layer Norm 的计算公式写一下？

RMS Norm 的计算公式写一下？

RMS Norm 相比于 Layer Norm 有什么特点？

Deep Norm 思路？

写一下 Deep Norm 代码实现？

Deep Norm 有什么优点？

LN在LLMs中的不同位置有什么区别么？如果有，能介绍一下区别么？

LLMs各模型分别用了哪种Layer normalization？

零基础如何学习大模型 AI
领取方式在文末

为什么要学习大模型？
学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享
①智能客服：某科技公司员工在学习了大模型课程后，成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率，还显著降低了人工成本。
②医疗影像分析：一位医学研究人员通过学习大模型课程，掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变，为医生提供了有力的诊断辅助。
③金融风险管理：一位金融分析师利用大模型课程中学到的知识，开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险，降低了不良贷款率。
④智能推荐系统：一位电商平台的工程师在学习大模型课程后，优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率，为公司带来了显著的增长。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。