2021数据马拉松初赛测评例题

Q:什么是中国数据马拉松?
A:中国数据马拉松由美国著名的数据科学人才解决方案专家Correlation One公司与前程无忧一起举办的开放式数据类现场竞赛。数据马拉松真实模拟了数据科学家在真实环境中面临的挑战-如何有效转化商业问题,通过挖掘数据获取潜在、有价值的信息和发现,最后结合商业问题得出结论。这将是一场考验数据科学家综合实力的最高级别的竞赛。
Q:如何理解开放式竞赛?
A:数据马拉松比赛采取开放式的竞赛模式,鼓励学生结合自己的兴趣,在大赛给定的背景下大胆且创新的设立自己研究的问题。大赛提供的数据来源于社会实际问题相关的真实数据集。在竞赛决赛中,参赛者根据给定的数据,进行头脑风暴、快速分析和提炼总结,在大量复杂的数据中寻找自己感兴趣的话题,并且建立模型最后得出结论或者有趣的发现。
Q:数据马拉松都在哪里举办过?
Correlation One公司在全世界许多国家(比如美国、英国、加拿大等)举办过数据马拉松,竞赛的赞助商包括许多全球一流的企业比如Citadel。值得一提的是,我们在几乎所有的北美及欧洲最好的理工科大学-比如哈佛大学、麻省理工学院、斯坦福大学、哥伦比亚大学、牛津大学等-都举办过数据马拉松比赛。2018年,我们在中国举办过两次数据马拉松竞赛,今年是我们在中国举办的第三次比赛。
Q:这场比赛能带给你什么?
你将有机会与数据科学领域内最优秀的人才进行比拼赢取几万大奖,并且提高和锻炼自己的专业技能。你将与知名企业近距离接触和了解就业机会,甚至有可能在现场拿到大企业的offer哦。另外,你还能认识许多有趣的灵魂,而且还有可能成为志同道合的朋友哦。
Q:如何参加比赛?
比赛分两部分。第一部分是预赛阶段, 你需要网上填写报名信息提交简历点击这里,提交报名后你将收到测评链接,请及时完成测试哦。请务必认真对待此次测评,我们建议你在电脑上完成测试。测评系统安装反作弊插件,因此请务必诚实作答,否则取消比赛资格。具体比赛细则请看主页“比赛规则”部分点击这里。你将有机会与数据科学领域内最优秀的人才进行比拼赢取几万大奖,并且提高和锻炼自己的专业技能。你将与知名企业近距离接触和了解就业机会,甚至有可能在现场拿到大企业的offer哦。另外,你还能认识许多有趣的灵魂,而且还有可能成为志同道合的朋友哦。
Q:赛程时间如何安排?
预赛为为5月24日至7月9日,请尽快在线注册报名,并在截止日前提交在线测评。决赛日期是7月30日。主办方会在预赛报名结束后公布决赛名单,并第一时间通知具体决赛细节。
Q:预赛阶段的测评是怎么样的,需要什么技能?
预赛阶段的在线测评一共15道题目,限时60分钟内完成。点击“开始测试”就开始计时并正式进入做题页面,每一道题目答完后进入下一题,不再返回,直至所有题目完成,最后提交测评答卷。预赛时将会记录测评所用时间,请注意不要超时。测评主要考察Python的数据整理和清理,及建模的能力。这些技能对数据马拉松非常关键。数据马拉松要求参赛选手在Python里整理数据,并且基于此数据分析行进建模。大赛提供了样题供大家参考 点击这里,请利用好资源哦。
Q:决赛提交报告的要求是怎么样的?
大多数参赛选手选择PDF,不过最终的电子报告形式不限(HTML、PPT、网页链等)。报告必须汇总你们想要回答的问题(研究的方向),研究该问题的原因及过程,数据分析汇总与呈现,以及最后的结论或者发现。大赛更关注的是你们研究和探索数据的过程中,是否有深刻的见解和创新,并是否能清晰且精准的汇报。
Q:决赛所用的数据集是怎么样的?
每次的数据马拉松都会有一个有趣的主题及相关的数据集。举例过去举办的数据马拉松所涵盖的一些主题及相关数据集:城市交通(共享乘车、出租车和公交系统的数据集),住房开发(酒店、房屋租赁和区域人口统计学的数据集)和教育(大学、测评和职业的数据集)。
Q:决赛所需的技能有哪些?
参赛选手应该熟悉基本的统计方法(例如线性建模、回归分析等)和工具(例如Python、R等)。不过从以往的案例来看,获胜的团队也并不总是拥有最先进的数据技技能。相反,许多团队的数据技能相对普通,反而获胜,因为他们的报告逻辑非常清晰,而且富有创造性的数据分析。
Q:大赛如何评选获奖者?
大赛评委根据几个纬度来给每个参赛选手打分:数据分析的相关性,所研究问题的创造性,分析过程中的逻辑严谨性,所用统计方法的适用性,以及报告的整体质量。
返回首页