数据科学家显然需要强大的数学和编码技能

数据科学家在Glassdoor上被评为2019年美国最佳职位。基本工资中位数为108,000美元,工作满意度排名为4.3,满分为5,加上预计的开放数量,这并不奇怪。问题是:为了顺利完成这项工作,我们必须做些什么?

为了找到答案,我们寻找那些寻求进入这个职业轨道的人的建议。很大程度上归结于编码和数学方面的硬技能。但仅凭强大的计算并没有削减它。成功的数据科学家还需要能够以自己的方式与商业人士交流,这需要与软技能和领导力相关的能力。

建立教育基金会:三个主要技巧

纽约数据科学学院的数据科学家Drace Zhan 强调需要一个教育基础,其中包括编码和数学能力的基本要素:

R / Python + SQL。如果你没有编码技能,你需要很多网络能力和其他方面来加强这种不足。我见过的数据科学家数学能力差,领域经验不多,但他们总是有很强的编码能力。Python是理想的,但R是一个很棒的后备工具。最好同时拥有你的武器库。SQL对于Data Analyst来说也非常重要。

强大的数学技能。对一些常用方法有很好的理解:广义线性模型,决策树,K均值和统计检验优于具有各种模型或专业化(如RNN)的广泛图景。

一些专家补充说,这些是建立在上面的核心技能。例如,KDnuggets列表包含Zhan提到的编码组件,并在技术方面添加了一些其他有用的东西,包括Hadoop平台Apache Spark,数据可视化,非结构化数据,机器学习和AI。

但是,如果我们通过对Kaggle调查中确定用于现实生活的最常用工具的调查得出我们的线索,我们会得到一些不同的结果。从下面的前15个选项图中可以看出,Python,R和SQL很容易进入前三,但第四个是Jupyter笔记本,其次是TensorFlow,Amazon Web Services,Unix shell,Tableau,C / C ++,NoSQL,MATLAB / Octave和Java,都领先于Hadoop和Spark。微软的Excel数据挖掘是另一个令人惊讶的新增功能。

图片由Kaggle提供

该KDnuggets名单中还包括关于正规教育小费。大多数数据科学家拥有高级学位:46%拥有博士学位,88%至少拥有硕士学位。他们拥有的本科学位一般分为相关领域。大约三分之一是数学和统计学,这是这个职业轨道中最受欢迎的。其次是最受欢迎的是计算机科学学位,占19%,工程学占16%。当然,数学科学专用的技术工具通常不会在学位课程中学习,而是在专业训练营或在线课程中学习。

不仅仅是课程:还有两个提示

Hank Yun是威尔康奈尔医学院肺科系的研究助理,也是纽约数据科学学院的学生,他建议有抱负的数据科学家计划他们将要做的工作并寻找导师。他说:

不要因为你参加课程并获得证书而告诉自己你知道数据科学,从而犯了我的错误。这是一个很好的开始,但是当你开始学习时,请记住一个项目。然后找到该领域的导师,立即开始一个激情项目!当你新鲜的时候,你不知道你不知道什么,所以当有人在那里指导你对你重要的事情和什么不重要时,它会有所帮助。你不想花很多时间学习没有任何东西可以展示它!

知道从工具箱中取出哪种工具:提示保持曲线前进

鉴于数据科学工具排名的差异,有些人可能会对应该关注什么感到困惑。安全软件公司迈克菲首席数据科学家Celeste Fralick在一篇CIO文章中解决了这个问题,该文章着眼于数据科学家的基本技能,宣称“数据科学家需要在研究中保持领先地位,以及了解什么技术适用时。“这意味着没有被”性感“和新的诱惑,当实际问题”需要更多的普通问题。“意识到生态系统的计算成本,可解释性,延迟,带宽,以及其他系统边界条件 - 以及客户的成熟度 - 本身有助于数据科学家了解应用哪种技术。“

基本软技能:另外六个技巧

Fralick提出的观点与数据科学家工作所需的非技术技能有关。这就是为什么KDnuggets列表包括以下四个:求知欲,团队合作,沟通技巧和商业头脑。Zhan还在数据科学家的技巧中包含了关键的软技能,识别了像KDnuggets这样的“沟通技巧”,但是使用“领域专业知识”代替了“商业敏锐”。无论它被称为什么,它都指的是数据科学的实际应用。商业。

奥利维亚·帕尔鲁德(Olivia Parr-Rud)对此提出了自己的想法,增加了两种软技能,强调了创造力的作用,断言“我认为数据科学既像艺术又像科学一样”,需要借鉴大脑两侧的优势。“很多人都把数据科学称为主要使用左脑的职业。我发现要成功,数据科学家必须使用他们的整个大脑。“

她解释说,在该领域取得进步不仅需要技术能力,还需要创造力和领导力所需的愿景:

大多数左脑/线性任务可以自动化或外包。为了提供数据科学家的竞争优势,我们必须能够识别模式并使用我们大脑的两侧来合成大量信息。我们必须是创新思想家。许多最好的结果来自左脑和右脑的整合。

她还强调为什么清楚地传达愿景是至关重要的:

作为数据科学家,我们的目标是利用数据帮助客户增加利润。大多数高管不了解我们做什么或我们如何做。所以我们需要像领导者一样思考并用我们的利益相关者理解和信任的语言来传达我们的发现和建议。

数据打

关键技巧包含了大量的技术工具,技能和能力,以及不太可量化的品质,如创造力和领导能力。最终,它不仅仅是一场数字游戏。由于数据科学不仅仅是在真空中创建模型,而是提出实际应用来解决企业的现实生活问题,那些在该领域取得成功的人不仅要掌握技术,还要了解他们的业务领域并了解他们的需求。工作团队的各个成员。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

相关推荐