腾讯
阿里巴巴
华为
字节跳动
百度
网易
美团
拼多多
京东
蚂蚁集团
小米
微博
平安科技
携程
滴滴出行
搜狗
用友
欢聚时代
七牛云
完美世界
唯品会
美丽联合
搜狐
趋势科技
爱奇艺
凤凰网
吉比特
4399公司
迅雷
猎豹移动
去哪儿
自如
微众银行
途虎养车
顺丰
云从科技
乐信
恒生公司
酷家乐
美的
快手
瓜子二手车
360公司
奇安信
货拉拉
度小满
德邦
寒武纪
搜狐畅游
Shopee
腾讯音乐
小鹏汽车
旷世科技
金山办公
中兴
VIVO
哔哩哔哩
深信服
格力
贝壳找房
猿辅导
阅文集团
浩鲸科技
58同城
小红书
商汤科技
招商银行
依旧自我介绍 未来规划 如何平衡学习和任务 还有一些校园经历深挖 定性调研/定量调研更偏好哪一个 用什么工具? 访谈的用户如何选择? 你想了解用户对于新职业看法,但来访情绪激烈,并没有回答新职业的问题,你该? 玩过名下游戏吗 好了其他忘了,问了蛮多校园经历挺意外
大模型数据算法实习生 2026.01.09,上午10:00,一面,线上,30多min,只有自己开摄像头,面试官没开 1.自我介绍 2.有没有用过正则表达式处理过数据? 3.假设给一个jsonl数据,和几个关键词,jsonl数据中命中3个以上关键词保留,让用python实现(用了两层循环) 4.往列表里添加一条数据是什么方法(append) 5.python中的多进程和多线程有什么区别?网络请求中是
1.实习介绍 2.拷打项目 3.AUC如果出现波动,应该如何分析 4.测试集情况,哪些红哪些绿(细说) 5.分析baseline中为什么之前没有这些东西(emm) 6.手撕:有10000大小的数据集,内存放不下没办法一次性shuffle,但是你有一个shuffle_100(),在不随机写10000的情况下如何借助硬盘进行全局公平shuffle。 7.提示:可以用10个文件进行随机写,但是不能随机1
1.自我介绍及项目经历 2.如何增强模型的多轮对话能力? 3.介绍MoE (混合专家)架构核心优势。 4.阐述大模型训练与推理的完整流程。 5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。 6.FlashAttention v1 和 v2 的主要改进点分别是什么? 7.CoT(Chain-of-Thought)训练数据是如何构造的? 8.当前主流的强化学习算法有哪些? 9.代码:
AIGC算法实习生 2026.01.12,下午16:00,二面,线上,40多min,只有自己开了摄像头,面试官没开 1.自我介绍 2.拷打简历 3.介绍RAG 4.嵌入模型是什么?为什么要把文本转换成向量存储? 5.手撕:原始字符串1112234443556666,输出112234435566(就是超过3个相同的字符,保留两个) 6.解释:lr,batch_size,step,epoch,迭代一遍
1.项目相关 2.如果是做生成式召回应该对模型结构怎么修改 3.常用的归一化方法有哪些 4.从样本里随机去掉一些负样本,Auc怎么变 5.DPO的全称是什么,公式是什么,直接体现在哪里 6.MOE激活的分布,怎么确定是MOE的效果 7.dpo的公式是什么 8. sgd是什么,Adam相对于sgd改进了什么 9.kvcache怎么做的,了解大模型中别的提高效率的办法吗位置编码 10. 正余弦位置编码
1.自我介绍 2.问项目 3.wide&deep结构 4.deepfm结构,和wide&deep区别,wide和fm部分具体是什么有什么区别 4.MLP和DNN的区别 5.手撕求前k个最小值,用了最小堆,问了最小堆是用什么排序实现的 6.手撕子集型回溯,没注意到给的列表可能有重复元素, 被问到了,回答用哈希记录然后跳过重复 7.DIN结构,外积的物理意义 8.除DIN外还有什么序列建模方法,回答t
第一轮项目领导面 1.结合你的简历做一个自我介绍2.结合项目展开说具体做了什么工作(先说总体目标是干啥,以及每一步目标是为了什么)回答模板:项目的服务对象是谁?这个项目能为他做什么?3.用的什么向量数据库?4.问答模型、RAG、知识库的向量化处理这些你都做了吗?怎么做的?5.这个过程中你怎么去设计的向量库?什么向量库?6.画出典型的RAG结构7.机器人售后项目数据治理工作包括那些?8.你对dock
文心一言 大模型算法实习生 2026.01.15,上午11:00,一面,线上,1h左右,只有自己开了摄像头,面试官没开 面试官首先介绍了自己团队的工作,是百度文心团队旗下专注于代码大模型的相关团队,核心工作涉及模型的预训练,也包含后续的后训练工作,同时会进行数据策略的优化,开展数据分析等相关工作。 面试时录音了,以下是语音转文字后的简要结果: 1.自我介绍 2.拷打简历 3.你现在在北邮这边读书时
1.Transformer 中为什么要用多头注意力?单头注意力有什么局限性? 2.GRPO 和 PPO 在 RLHF 中的核心区别是什么? 3. vLLM 的核心优势是什么? 4.为什么在推荐系统中引入RAG?知识库的数据来源和构建流程是怎样的? 5.嵌入模型为什么选 BGE?FAISS 索引是如何构建的? 6.RAG 的 chunk 划分策略是什么? 7.什么场景需要GraphRAG? 8.当输