otter https://github.com/alibaba/otter 同样是阿里巴巴开源的数据同步工具 定位: 基于数据库增量日志解析,准实时同步到本机房或异地机房的mysql/oracle数据库. 一个分布式数据库同步系统 注意:基于cannal 原理 基于Canal开源产品,获取数据库增量日志数据。 什么是Canal, 请点击 典型管理系统架构,manager(web管理)+node(
双非本科,参加了无数场面试,以下是最近面阿里的总结(来源于网络): 阿里 面经1 简单介绍项目 知道哪些数据结构以及他们的特点 链表增删快,那如何提高其查询效率,有没有什么想法? B+树了解吗?B+树如何范围查询?B+树退化的极端情况是什么? 跳表了解吗? 大顶堆、小顶堆了解吗? 实现长地址请求到服务端,然后服务端重定向短地址给客户端,如何实现长短地址的互相映射? 那我现在有10份数据,有1000
阿里巴巴-智能信息事业群-数据研发工程师 一面(11.21) 涉及项目、机器学习算法、sql、Python 等等,大概40min。 自我介绍 项目深挖 调参经验 catboost和xgb的区别 数据挖掘项目中你为什么不采用深度学习? 说一下深度学习效果不好的原因? 打比赛有什么收获 python2 和 python3的区别 如何对字典按照key排序? 多模态算法有哪些?MMOE和PLE的区别及原理
这是阿里巴巴的一个研发岗位,涵盖一些大数据的笔试 专业面试问题 #软件开发2024笔面经# 针对过往经历 Q:字节确实注重数据驱动,这样子的决策方式可能会有什么问题?哪些决策没办法用这些方法进行验证? Q:结合过往实习经历,你现在想要帮商家提升GMV,你觉得该如何去进行提升? 行为面 Q:在这几段实习经历中,哪段需要联系各方的人推动解决问题的情景更多? Q:在合作过程中遇到比较多的卡点是什么,导致
题型:两道编程题 题目1: 题目描述 给出一个1~n的排列p=[p1, p2, … , pn] 请计算有多少个pi (1<i<n)满足在pi-1, pi, pi+1三个数字中,pi既不是最大的数字也不是最小的数字。 输入描述: 第一行一个整数n 接下来给出一个1~n的排列 3<n<30 输出描述: 在一行中输出满足条件的 pi的个数 示例1 输入: 5 1 4 2 3 6 输出: 1 说明: 只有
吹爆阿里,整个面试过程体验极佳! 数据库怎么分类,描述一下你对这些数据库的理解 什么情况使用MySQL,什么情况使用Redis Redis有什么持久化策略 MySQL有哪2种引擎,说一下它们的区别 MySQL两个线程的update语句同时处理一条数据,会不会有阻塞 滥用事务,或者一个事务里有特别多sql的弊端 两条update语句处理一张表的不同的主键范围的记录,一个<10,一个>15,会不会遇到
面试过程 SQL题目:基于如下数据为电商平台中用户每日订单金额,找出各天订单金额排名前三名的用户,表名temp1。 WITH ref_amt AS ( SELECT dt, user_id, SUM(order_amt) AS order_amt_sum FROM temp1 GROUP BY dt, user_id ) S
攒人品了 简单的自我介绍 介绍实习经历中的具体项目 描述项目中遇到的问题及解决方法 分享比赛经历,特别是如何提高模型得分 Python中的pandas包和numpy包的常见操作 数据仓库的四个层级(ods、dwd、dwm、dws)的具体功能 SQL的开窗函数及其执行顺序 #软件开发笔面经#
#产品2023笔面经# 去年投简历直接挂 今年投终于收到了笔试 北森题库 40min 10言语理解 10资料分析 10图形推理 51性格测试 形式上和携程、shein的一致,只是性格测评不太一样,求一个面试机会吧