感觉整体不太难,发点面经攒攒人品! 1.如何提升 agent的function call的能力 2.上下文工程了解多少,长短期记忆如何做 3.记忆覆盖问题如何解决 4.transformerlora变体 5.手撕 MHA
1.实习介绍 2.为什么这么做产品设计,怎么做运营推广的 3.上一段实习最有成就感的项目 4.为什么要做xx产品能力,业务价值是什么 5.目前产品的发展阶段,为什么这么定产品规划 6.这样一个xx产品能力应用在Agent工作流上面有什么不同效果 7.和传统数据库相比,目前数据库的技术提升和所带来的业务价值是什么 8.如何评估RAG的效果,客户成功指标有哪些 9.讲一个和业务结合比较深的项目 10.
前段时间面试了阿里云数据开发岗位,面试问题如下 1 先自我介绍 2 先说一下你做的项目有哪些,哪些地方可以体现你的技术能力 3 看你实时和离线都做过,你们这边实时和离线是怎么技术选型的,平时对于实时需求多吗,怎么评估一个实时需要的资源 4 看你有做过数据治理,如果这个项目要你来立项你会从哪方面入手,对于治理之后如何体现收益 5 对于财务数据你感觉和平时的流量数据有啥区别,为啥需要做财务数据 6 对
1. 在LLM推理里,我们经常听到一个词叫prefill,能解释一下它是什么意思吗? 2. 我们来聊聊Transformer的基础吧。能先介绍一下Softmax函数吗?然后整体讲讲Transformer模型,特别是里面的QKV(Query, Key, Value)机制,能详细说说这个过程吗? 3. Transformer的训练复杂度还挺高的,尤其是在处理长序列时。你了解哪些工作是致力于降低它训练时
1.实习经历穿插具体介绍 2.bceloss公式介绍用pe,优势在哪里 3.粗排有没有和精排有什么交互信息 4.序列建模的基线模型是什么 5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据 6、如何降低KV cache 7、讲讲DeepSeek中的MLA 8.讲讲最开始的自注意力机制发展到当今的一个优化路线 9.手撕最长公共子串 1.合并有序数组(双指针) 2.搜索插入位置(二分
社招1年面试:感觉现在貌似不咋考八股了。 技术二面:45min 主要聊项目,无八股。印象如下: 项目问题:印象较深的是这个 拖拽层的交互 — 协议层 怎么写? 设计一个“单选框组件”,选项里面可能是图片、文字等,该如何设计。 拓展问题:该如何约束选项中的内容,比如内容只能是某种文字,该如何实现? 技术二面:30min 技术负责人面,无八股。印象如下: 聊天,关于家乡 工作离职原因,手上 Offer
1.Lora 的相关八股:常见参数、缩放 2.有没有做记忆衰退,避免旧数据干扰新任务? 3.Deepspeed zero3为什么比zero2更省显存 4.训练大模型的框架都有哪些呢 5.讲解一下 Flash Attention 6.讲解一下 Qwen 的滑动窗口注意力机制,计算量是多少? 7.PPO 的损失函数构成。 8.讲解一下KL散度。PPO和GRPO的损失函数有哪些区别? 9.在高并发查询
1.问实习项目。 2.项目上线前的评价指标? RAG 子模块的评价指标? 3.八股:过拟合原因?有什么常见解决思路? 4. 模型训练的显存估计?由哪几部分组成?除了 Model States 之外还有哪些显存占用?· 5.造成多模态大模型缓解的原因?现在常见的缓解思路。 6·场景题:识别图片并生成商品描述,会怎么做? 7.如果这个产品 MLLM 压根没见过,怎么办? 8. 手撕:二维矩阵,里面全是
1.项目经历 2.模型的 loss 函数前乘以10,会对训练造成什么影响? 3.deepseek v3的 rope 实现? deepseek r1的训练过程? 4.做过 rag 是吗?介绍 graph rag ? 5.bge 和 gte 模型怎么训练的?为什么不能直接用 bert - base 来做余弦相似度召回? 6.对比学习的常用 loss 有哪些? InfoNCE 的超参数?温度系数对训练的
面了将近70min,拷打了很多之前完全没接触的问题。快两个月没准备面试了,实习的细节很多都记不太清没答上来。 自我介绍 自学和实习中遇到的最大的技术问题是什么?怎么解决的? 文件上传到一半,用户刷新页面或者网络中断,这种情况怎么处理? 分片信息是存储在localstorage吗?localstorage和cookie的限制大小是多少?如果溢出大小了怎么办? 讲一下OSS是什么?评论,弹幕,文章这些
1.深入挖掘项目细节,例如某个复杂模块的设计思路、遇到的性能瓶颈及解决方案。 2.async/await的实现原理是什么?它和Promise、Generator之间有什么关系? 3.Webpack中Loader和Plugin的区别是什么?分别举例说明。 4.如何设计一个高可用的前端系统? 5.前端监控系统如何设计?如何上报和分析数据? 6.手写题:实现一个函数柯里化(currying)。 7.PW
1.vue怎么做路由鉴权的 2.怎么处理页面抖动的bug 3.怎么优化性能 4.怎么修复数据更新不同步 5.学算法对学习前端的优势 6.怎么做实时的同步服务端的数据显示 7.为什么使用tailwindcss,和普通手写的样式表有什么区别 8.平时怎么定位和修改样式问题 9.鼠标的拖尾效果怎么实现 10.怎么css做成一个三角形 11.怎么让三角形保持旋转
前段时间面了阿里健康的数据开发岗位 面试问题如下 1 先进行自我介绍 2 说一下你做的数仓项目,怎么风层的, 3 数据治理主要是治理了哪一些,带来了什么收益 4 看你做过财务数据,财务数据主要是看哪些指标,对于财务来说最核心的主要是啥,有哪些策略可以确保数据准确 5 看你也有实时经验,如果要你建设一些实时的财务指标需要怎么建设,可以从哪些方面入手 6 你做财务数据以来感觉最难的主要哪一块,怎么解决
1. 手撕 背包dp 2. 实习/项目拷打 穿插八股 3. 为什么选择redis zset存储标签信息,mysql如何实现set 4. redis的作用,那些场景/数据适合用到redis 5. redis和mysql怎么同步更新 6. 日志系统怎么记录traceid,服务异步在线程池去跑的话是怎么追踪呢? 7. spring aop 原理 8. Redis 数据丢失问题怎么解决 怎么保障不丢失
1.实习介绍 2.前面两家公司的数仓的设计有哪些不同?如果再让你重构,你会做出哪些优化。 3.工作中遇到过哪些难点?比如性能问题。 4.如何与业务部门保持良好的合作关系,怎么配合下游输出价值。 5.工作内容有哪些?分别占比是多少? 6.为什么都是累计快照表?产出的压力怎么解决? 7.dwd和dws分别怎么设计?选择什么粒度的dws来建模。 8.怎么衡量数仓的好坏?结合案例来说。 9.笔试题:正则表