我要投稿 投诉建议

面试经验分享之机器学习、大数据问题

时间:2023-03-20 10:22:07 晓怡 面试技巧 我要投稿
  • 相关推荐

面试经验分享之机器学习、大数据问题

  本人的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同。以下是小编整理的面试经验分享之机器学习、大数据问题,欢迎大家借鉴与参考,希望对大家有所帮助。

面试经验分享之机器学习、大数据问题

  机器学习、大数据相关岗位的职责

  自己参与面试的提供算法岗位的公司有 BAT、小米、360、飞维美地、宜信、猿题库 等,根据业务的不同,岗位职责大概分为:

  1、平台搭建类

  数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;

  2、算法研究类

  文本挖掘,如领域知识图谱构建、垃圾短信过滤等;

  推荐,广告推荐、APP 推荐、题目推荐、新闻推荐等;

  排序,搜索结果排序、广告排序等;

  广告投放效果分析;

  互联网信用评价;

  图像识别、理解。

  3、数据挖掘类

  商业智能,如统计报表;

  用户体验分析,预测流失用户。

  以上是根据本人求职季有限的接触所做的总结。有的应用方向比较成熟,业界有足够的技术积累,比如搜索、推荐,也有的方向还有很多开放性问题等待探索,比如互联网金融、互联网教育。在面试的过程中,一方面要尽力向企业展现自己的能力,另一方面也是在增进对行业发展现状与未来趋势的理解,特别是可以从一些刚起步的企业和团队那里,了解到一些有价值的一手问题。

  以下首先介绍面试中遇到的一些真实问题,然后谈一谈答题和面试准备上的建议。

  面试问题

  1、你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法?

  2、你熟悉的机器学习/数据挖掘算法主要有哪些?

  3、你用过哪些机器学习/数据挖掘工具或框架?

  4、基础知识

  无监督和有监督算法的区别?

  SVM 的推导,特性?多分类怎么处理?

  LR 的推导,特性?

  决策树的特性?

  SVM、LR、决策树的对比?

  GBDT 和 决策森林 的区别?

  如何判断函数凸或非凸?

  解释对偶的概念。

  如何进行特征选择?

  为什么会产生过拟合,有哪些方法可以预防或克服过拟合?

  介绍卷积神经网络,和 DBN 有什么区别?

  采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?

  用 EM 算法推导解释 Kmeans。

  用过哪些聚类算法,解释密度聚类算法。

  聚类算法中的距离度量有哪些?

  如何进行实体识别?

  解释贝叶斯公式和朴素贝叶斯分类。

  写一个 Hadoop 版本的 wordcount。

  5、开放问题

  给你公司内部群组的聊天记录,怎样区分出主管和员工?

  如何评估网站内容的真实性(针对代刷、作弊类)?

  深度学习在推荐系统上可能有怎样的发挥?

  路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路况做出合理估计?采集数据中的异常值如何处理?

  如何根据语料计算两个词词义的相似度?

  如何判断自己实现的 LR、Kmeans 算法是否正确?

  100亿数字,怎么统计前100大的?

  答题思路

  1、用过什么算法?

  最好是在项目/实习的大数据场景里用过,比如推荐里用过 CF、LR,分类里用过 SVM、GBDT;

  一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑;

  优缺点分析。

  2、熟悉的算法有哪些?

  基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合;

  面试官和你的研究方向可能不匹配,不过在基础算法上你们还是有很多共同语言的,你说得太高大上可能效果并不好,一方面面试官还是要问基础的,另一方面一旦面试官突发奇想让你给他讲解高大上的内容,而你只是泛泛的了解,那就傻叉了。

  3、用过哪些框架/算法包?

  主流的分布式框架如 Hadoop,Spark,Graphlab,Parameter Server 等择一或多使用了解;

  通用算法包,如 mahout,scikit,weka 等;

  专用算法包,如 opencv,theano,torch7,ICTCLAS 等。

  4、基础知识

  个人感觉高频话题是 SVM、LR、决策树(决策森林)和聚类算法,要重点准备;

  算法要从以下几个方面来掌握

  产生背景,适用场合(数据规模,特征维度,是否有 Online 算法,离散/连续特征处理等角度);

  原理推导(最大间隔,软间隔,对偶);

  求解方法(随机梯度下降、拟牛顿法等优化算法);

  优缺点,相关改进;

  和其他基本方法的对比;

  不能停留在能看懂的程度,还要

  对知识进行结构化整理,比如撰写自己的 cheet sheet,我觉得面试是在有限时间内向面试官输出自己知识的过程,如果仅仅是在面试现场才开始调动知识、组织表达,总还是不如系统的梳理准备;

  从面试官的角度多问自己一些问题,通过查找资料总结出全面的解答,比如如何预防或克服过拟合。

  5、开放问题

  由于问题具有综合性和开放性,所以不仅仅考察对算法的了解,还需要足够的实战经验作基础;

  先不要考虑完善性或可实现性,调动你的一切知识储备和经验储备去设计,有多少说多少,想到什么说什么,方案都是在你和面试官讨论的过程里逐步完善的,不过面试官有两种风格:引导你思考考虑不周之处 or 指责你没有考虑到某些情况,遇到后者的话还请注意灵活调整答题策略;

  和同学朋友开展讨论,可以从上一节列出的问题开始。

  准备建议

  1、基础算法复习两条线

  材料阅读 包括经典教材(比如 PRML,模式分类)、网上系列博客(比如 研究者July),系统梳理基础算法知识;

  面试反馈 面试过程中会让你发现自己的薄弱环节和知识盲区,把这些问题记录下来,在下一次面试前搞懂搞透。

  2、除算法知识,还应适当掌握一些系统架构方面的知识,可以从网上分享的阿里、京东、新浪微博等的架构介绍 PPT 入手,也可以从 Hadoop、Spark 等的设计实现切入。

  3、如果真的是以就业为导向就要在平时注意实战经验的积累,在科研项目、实习、比赛(Kaggle,Netflix,天猫大数据竞赛等)中摸清算法特性、熟悉相关工具与模块的使用。

  拓展:面试的经验技巧

  重要因素

  成功的求职者面试需要带什么东西?那天我正在面试一个高级职位的候选人,尽管有数以百计的人选面试此职位,但是我被竞争者和竞争失败者之间明显巨大的差异震惊了。这些候选人值得我们考虑他们共有的某些特点:

  能量

  面试者需要推动。他们通常被困在一个屋子里就是一整天,他们希望候选人能够带给他们兴奋和灵感。充满活力地进入一个房间要比你保持冷静地进入一个房间好得多。所有艰难的工作都需要很多能量,而重要的是你要表现出你拥有很多能量。

  雄心壮志

  很少有组织机构需要的只是一双安全的双手。很少的公司会积极寻求蛮勇的冒险者,但是每个人都希望他的员工可以推动工作超出它的自然边界。我们总是在寻找可以给予我们的东西比我们要求的更多的人,寻找对组织和他们自己有雄心的人,寻找能够说服我们可以达到两者协调一致的人。

  想法

  大多数候选人来的时候准备好的观点只不过是根据自己的猜测准备的。也就是说他们很仔细、顺从并没有冒险精神。但是收敛过多的创造力比激发创造力要容易得多。因此要豁出来,不要猜测,自己思考!很少的老板会对能够读懂他们想法的人感兴趣。

  信心

  我知道人们很可能过度自信,但是我几乎还没有看过谁这样呢。相反,大多数候选人给人留下的印象是踌躇的、谨慎的和充满恐惧的。但是如果想激发其他人对你的信任,你需要展示出你自己身上拥有自信。这并不意味着要表现出一幅傲慢的销售姿态;这并不意味着要因为曾经的成绩而感到骄傲并兴高采烈地谈论这些成绩。

  好奇心

  我以前曾经写过对你周围的世界有好奇心有多么重要,但是在面试中,你需要展现这一点。你知道面试的人会问你你是否有问题要问。来的时候准备一些你对该组织、个人和文化真正好奇的问题,不要留下即兴发挥的机会。努力思考那些可以展示出你进行了调查并想了解更多的问题。

  你会注意到,在这个列表列出的所有特点中,我并没有提到技巧。那是因为如果你已经被选中参加一个面试,你的基本技能已经得到认可。面试存在的目的就是让雇主看到简历上没有的东西,确保你能准确清楚地说出这些东西。

  面试准备

  有效准备

  (1)充分了解应聘单位。对用人单位的性质、地址、业务范围、经营业绩、发展前景、对应聘岗位职务及所需的专业知识和技能等要有一个全面的了解。单位的性质不同,对求职者面试的侧重点不同。如果是公务员面试,内容和要求与企业公司相差很大。公务员侧重于时事、政治、经济、管理、服务意识等方面。而一位资深人力资源专员说:“面试时,我们都会问求职者对我们公司了解多少,如果他能很详细地回答出我们公司的历史、现状、主要产品,我们会高兴,会认为他很重视我们公司,对我们公司也有信心。”同时还应该通过熟人、朋友或有关部门了解当天对你进行面试考官的有关情况及面试的方式过程。以及面试时间安排,索取可能提供给你的任何说明材料。

  (2)使自己的能力与用人单位工作的要求相符合。“知己知彼,百战不殆”。求职者面试前应对自己的能力、特长、个性、兴趣、爱好、长短处、人生目标、择业倾向有清醒认识。认真阅读你所收集到的所有信息并牢记它们。尽量使自己的能力与工作要求相适应。参加面试时,通过显示你对知识的掌握和理解来表达你希望进入这一职业工作的愿望。

  (3)模拟可能询问应聘的问题。面试前不经过角色模拟,便无法达到最佳的效果。一些负责招聘的人事主管提出,求职者应当乐意提问题,这样招聘者才能知道求职者的水准及想了解的问题。

  (4)对可能遇到的问题进行准备。这项准备有助于认清自己真正的想法,有助于在面试的现场能够清晰的自我表达。

  (5)练习处理对你面试不利的事情。即使曾有一些不愉快的受挫经历,即使自己曾经犯过错,也可作为一段可供学习的经验加以陈诉。务必用积极的事情抵消消极的事情,最好不要说有损自己形象的话。

  注意点

  a.提早到达较为从容;

  b.进入房间应先敲门;

  c.坐姿端正,眼神自然,手脚安定;

  d.每次答话应干脆俐落,不打断对方谈话。

  自我认知

  要自信地应对面试,首先要对自己有清楚的认识:

  (1)写出几件自己认为可以称得上成功的事情,并逐一分析这些成就,列出你最主要的几项技能。

  (2)同一件事情,各人有各人截然不同的处理方式,这取决于每个人不同的个性。为弄清自己的个性,可以通过分析成就,用一些形容词来归纳自己的性格。

  (3)确定与你的个性、兴趣相符的工作环境。工作环境不仅指具体的环境,更重要的是工作单位的文化背景。一位求职者到一家由几个工程师开设的公司面试,她说:“那里给人的感觉就象军队,棕色的地毯、黄色的屏风、陈旧的家具……我不会在这儿工作的。”

  心理准备

  面试就好比是一场考试,在测试每个人的能力,也在测试每个人的心理素质和临场发挥。因此,要成功面试,首先要充满信心。“天高任鸟飞,海阔凭鱼跃”。保持良好的状态,快乐的心情,会大有好处。其次,要抓住招聘者的心。招聘者可能会先评价一个求职者的衣着、外表、仪态及行为举止;也可能会对求职者的专业知识、口才、谈话技巧做整体性的考核;还可能会从面谈中了解求职者的性格及人际关系,并从谈话过程中了解求职者的情绪状况、人格成熟度、工作理想、抱负及上进心。

  知识准备

  与应聘岗位相关的专业知识、业务技能等要熟知,备上一份求职材料,供招聘者查阅参考。准备当天可能用到的个人资料或作品,携带相关证件,以便在面试过程中进一步向招聘者提供有关自己个人的相关资料。

  体能、仪表准备

  面试前要保证充分的睡眠和愉快的心情,以保持良好的精神状态,面试前还应注意修饰自己的仪表,使穿着打扮等与年龄、身份、个性等相协调,与应聘的职业岗位相一致。这一点将在以下的内容中较为详细地阐明。

  应对面试

  一要背熟自己的求职履历。常常遇到有些求职太过频繁,而自己的求职履历则又是经过精心“包装”的人,轮到面试时有时连自己都记不清究竟“工作经验”是怎样“排列组合”的了,一上阵便迅速“露出马脚”,不战自败。

  二要准备好同所申请的职位相吻合的“道具”。身上穿的、手上戴的、浑身上下的衣着均能反映出求职者对所申请的职位的理解程度。试想如果一家五星级酒店招一名公关经理,而应聘者下雨天穿着高统套鞋去面试恐怕同所申请的职位形象相去甚远。所以面试时的“道具”也应有所选择。

  三要准备好同自己身份相吻合的语言。每个人都应对语言和遣词用字有所选择,面试不同于闲聊,张嘴就来,可以不假思索。每句话,每一个词都应有所挑选。如不少不谙世面的求职者参加面试时张口闭口“你们公司怎么怎么”,听多了肯定会引起别人的反感。应该十分有礼貌客气地说“贵公司”,礼多人不怪嘛!

  四要准备好同选择的职业和身份相吻合的行为规范。面试时的细小行为最能说明一个人的真实情况,试想一个个人物品杂乱无章,甚至连钢笔都找不到的人,是很难受到面试考官的青睐的。

【面试经验分享之机器学习、大数据问题】相关文章:

外企面试经验分享09-26

HR面试经验分享08-06

护士面试经验分享08-03

面试问题之五大“最”07-22

面试经验及心情分享09-25

嘉吉面试经验分享03-03

美的面试技巧经验分享08-03

成功的面试技巧经验分享08-04

大数据面试常见问题08-05