《12个数据科学面试必问问题.docx》由会员分享,可在线阅读,更多相关《12个数据科学面试必问问题.docx(5页珍藏版)》请在三一办公上搜索。
1、12个数据科学面试必问问题原作者 Venkat Nagaswamy编译CDA编译团队本文为CDA 数据分析师原创作品,转载需授权聘用到出色的数据科学家至关重要,但这并非易事。本文从面试 公司的角度,列出了数据科学相关职位面试时必问的一些问题,相信 应聘者也能从中得到启示。根据IDC最近的一项研究预测,到2018年美国企业需要 181,000名具有深厚分析能力、数据管理以及表述能力的人才。那么面试时该如何筛选出最好的人才?技术问题在面试中有一定作用,但只反映了他们技术知识的水平。白板演示问题很有用,但是能否反映面试者面实际挑战时能够提 供的真正价值?为了在面试中更全面的评估数据科学家,在这里有一
2、份偏重市场 营销和客户分析的面试问题列表。旨在测试数据科学家的技术能力以 及其他影响聘用的因素:思维敏捷捷性,灵感性和客观性。1.你最欣赏哪位数据科学家?为什么?以这个问题作为开场是不错的选择,很多面试者很可能认为,在 一开始会被问到技术问题,或一些相关工作或学术背景。但这是一个 重要的问题,因为他们应该对这个领域有足够的认识,并了解该领域 的重要人物,无论是目前还是历史上。例如,以下是几个我们关注的数据科学家,以及原因:John Snow (不是权力的游戏”那个)发现了伦敦1840-1850 年期间的霍乱疫情,他通过统计学和点示图证明该疾病是如何聚集在 公共水泵上,从而污染了泰晤士河水。Hi
3、lary Mason,在仓U 立 Fast Forward Labs 前,在 bitly 担任4 年首席数据科学家,被Fast Company评为“100位商界最具创意 者”。Peter Skomoroch,LinkedIn Skills 创始人,Skipflag 创始人、 首席执行官;在LinkedIn之前,任Juice Analytics的高级分析总监, AOL Search的高级研究工程师。2. 如何证明你对算法做的改进比改进前更好?一个好的数据科学家不应该让自大或不安影响其经验判断,因此 他们应该有一个严谨的分析框架,用于评估每次改进。换句话说,他们进行自我审核时,对自己需比他人更严格
4、。比如:用于性能比较的数据中是否存在选择偏差?受控实验的方法是否被遵循?是否应用了 A /B测试?我的测试数据是否有足够的多样性以代表真实数据以避免过度拟 合)?结果是否可重复?3. 你将如何使用数据来改进我们的网站?Airbnb的前数据科学负责人Riley Newman对于公司如何利用数 据科学的问题给出了很好的回答:“ Airbnb将数据视为客户的声音, 而数据科学则是对该声音的解读。”通过这个问题,可以了解面试者将如何利用访问者、客户网站的 使用趋势或其他数据,并改进营销或内容接触点。这也显示了他们是否真正了解面试公司。4. 详细描述你最近完成的一个项目,以及雇主是如何使用当中的 发现的
5、?如果面试者不能回答这个问题,说明他们并不是真心诚意像得到 这份工作。另外,如果他们不愿意回答这个问题,那就是一个危险的 信号。说明没有必要与其分析详细或机密数据。劳动力管理公司Kronos的数据科学家Tom Walsh表示业余者 谈论到项目过程时会透露当中弱点。但是一位真正的数据科学家能够 提供他们在项目阶段每一步的见解。”针对应届毕业生,可以询问有关学校研究项目或论文的类似问题。5. 你能举实例说明,如何把创意应用于数据科学吗?在大数据世界中,敏捷性和创造力至关重要。当需要充分利用这 些数据时,你应该调动其想象力并保持开放心态。一个伟大的数据科 学家总能假设并建立模型。补充的问题可以是询问
6、面试者在过去工作中应用了什么模式和过 程。如果他们一直采取相同的解决方案,那未必是件好事:这可能表 明他们不愿意或不能创新的迹象。6. 你对竞争情报有多熟悉?举个例子。如果你是看中产品开发,市场营销等能力招聘他们的话,面试者 最好能够证明他们熟悉收集和分析竞争环境的各个方面的工具,从产 品、客户再到竞争对手。不仅仅是知道使用Alexa,Compete或Google Trends等工具。 最重要的是弄清楚面试者过去实际做过的事情,从而提供可行的见解。7. 如果他人很难理解你的模型时,你将如何有效地传达其关键信 息?当向高层和股东解释其发现时,数据科学家认为很好理解的内容, 常常可能让其他人感到很
7、费解。在任何公司企业中各种决策者的理解能力都不同,因此数据科学 家需要能够清晰的讲解发现和观点。8. 你将如何对完全没有基础的人解释线性回归?这与前一个问题的目的类似:检测面试者如何将复杂的概念以浅显易懂的方式解释给他人。除了 线性回归”,还可以将术语改为 “机器学习”“ ROC曲线”等等。9.你将如何社交媒体融入到你的工作中?如果工作中涉及到消费者、客户分析的方面,包括B2B ABM,那 么社交媒体则提供了一个实时样本集,这对任何品牌以及营销人员来说都是十分重要的。面试者需要对如何利用社交媒体数据有明确见解。你希望他们在 当中投入多少精力取决于实际情况和业务模式,但由于社交媒体是各 个行业的
8、关键渠道,因此面试者需要能够充分利用社交数据。10. 请解释哪种数据科学的最佳实践”与这项工作紧密相关?为 什么?特别是当雇用高级职位时,这对于事先努力熟悉业务和行业操作 的面试者而言,这是一个不容错过的问题。此外,如果是管理职位的话,那么更值得考验其与下属和供应商 进行沟通和执行的能力。11. 判定开发数据模型是否良好的标准是什么?这可以作为技术问题之一。在这种情况下,面试者应该能够轻松 地说出它需要具有可预测的性能,可以轻松适应业务需求的任何改变, 是可扩展的,并提供可操作的结果。你可以测试面试者关于Hadoop、Spark的各种知识,以及Python,R,SAS等编程语言的知识,或者关于
9、数据再加工,数据可 视化,机器学习等问题。12. 如何利用机器学习解决如下问题:当地一家船运公司发现无法 准时送货。什么算法可以解决该问题?这是一个棘手的问题,旨在测试他们对机器学习应用的的基本理 解。这是一个路径优化问题,而不是机器学习问题,可以用数学方法 解决。相反,机器学习问题具有模式和数据,无法通过构造方程来解 决。在面试中,问一两次这种问题是可以的,因为这揭示了面试者是 否真正掌握了在特定情况下适用的分析工具。原文链接:/venkatnagaswamy/12-must-ask-questions-to-ask-a- data-scientist-job-candidate-626ee2cc62d9