AI工程师应聘要具备哪些能力?

开课吧开课吧锤锤2021-03-31 15:57

    2021年,随着疫情逐步好转,新基建等继续升温,AI在瘟疫和经济建设过程中屡创佳绩。人工智能给每一个行业和领域带来观念上的冲击和改变,改变着经济,改变着产业,推动着整个人类社会走向更美好的未来。

    人工智能工程师求职的“硬”实力

    对AI工程师而言,最重要的竞争力无疑是他们在人工智能、机器学习等技术方面的知识积累和融会贯通。

c

    最重要的无疑是监督学习。

    什麽是督导学习?监控学习是指我们通过外部变量ResponseVariable来引导模型学习我们所关心的任务,从而达到我们所需要的目的。在监督学习中,需要彻底掌握三种最基本的模型,包括线性回归(LinearRegression)、对数概率回归(LogisticRegression)和决策树(DecisionTrees)。

    如何理解我所说的“完全掌握”?在这里,完全掌握有三层意思。

    首先,需要理解这些模型的数学意义,能够理解它们的假设和求解。例如,线性回归的目标函数是什么,对数概率回归的目标函数是什么,以及在写下目标函数后,如何求最优解。对这些核心模型,必须能够完全理解,没有任何错误。

    其次,需要了解在哪些情况下使用这些模型最合适,以及如何将实际问题转化为这些模型的应用,如果不能直接转化,还存在哪些差距。

    三是能写出描述这些模型算法的真实代码或伪代码,真正掌握这些算法。

    监管学习当然不局限于这三种算法,但这三种算法是大多数机器学习应用于工业领域的起点,也是学习其它算法模型的支点,可以根据这一思路了解更多的算法。要能在面试中有一个坚实的基础来理解这些基本算法,这点非常重要。

    理解机器学习的第二个关键在于无监督学习。

    非监督学习通常没有明确的反应变量,它的核心是希望发现数据内部的潜在结构和规则,从而为我们下一步的决策提供参考。

    在访谈中,“K-均值算法”常常成为检验数据科学家无监督学习能力的核心所在。所以有必要对该算法进行认真学习,达到真正全面的理解。

    怎样学习?正如我们之前提到的监督学习一样,需要从程序实现和算法本身两个方面来把握K-均值。对K-均值的掌握之后,可以进一步了解一些基于概率模型的聚类方法,如“高斯混合模型”(GaussianMixtureModel),扩展视野。

    第二,尽管机器学习和统计学习有很多重叠之处,但对于有资格的数据科学家和人工智能工程师来说,一些难以涵盖机器学习的统计问题也是需要掌握的。

    首先,我们必须了解并掌握一些核心的概率分布,包括离散分布和连续分布。这方面的重点不仅在于能够理解概念,而且在于能够使用这些概率分布来描述真实场景,并能够抽象地为场景建模。

    其次,这需要理解假设检验。它常常是被AI工程师和算法工程师完全遗忘的东西。为了熟悉假设检验的基本设定及其背后的假设,我们应该弄清楚在什么情况下这些假设可以被使用,以及当假设被违反时需要做什么来弥补。

    三是要学会和理解因果推理(CasualInference)。尽管它并非经典的统计内容,但近年来却越来越受到重视。许多学者和工程师都在使用因果推理来研究机器学习模型产生这种结果的原因。

    还有一项非常重要的“硬性”技能,即对系统有一个基本的理解。

    首先要具备最基本的编程能力,对数据结构和基本算法有一定的掌握。在编程语言方面,Python在近几年得到了很多数据相关从业者的青睐。由于Python语言本身的特点,相对于C++或Java等其他语言,Python对从业者来说,降低了学习和掌握的难度。但是,我们也必须认识到,大多数人工智能产品都是复杂的产品链。整条链子通常需要对多种语言环境都有所了解。所以,掌握Python,学习一到两门其它语言,在这个时候选择Java或C++,是非常必要的。此外,许多公司也采用了诸如Hadoop、Spark等大数据环境来整合和挖掘数据,了解这些技术对于求职者来说往往是一种“加分项”,让雇主感觉不错。

    其次,是对构建人工智能系统有最基本的理解(如搜索系统、人脸识别系统、图像检索系统、推荐系统等)。真正能将机器学习算法应用到实际产品中,必须依赖于一条完整的系统链路,其中包括数据链路的设计,整个系统的架构,甚至前后端的连接等多方面的知识。要想知道一个候选人是否能将这个算法应用到实际中,最简单的方法就是考察他的能力。所以从我们准备面试的角度来看,这一部分的内容通常是初学者需要花更多时间去了解和提升的地方。

    资料学家申请的“软”力量。

    之前我们已经谈过了数据科学家要申请的“硬”技能,接下来,我们再来看应聘者还需要注意并培养哪些“软”技能。

    这是数据科学家的第一个“软”技能,它能将商业需求转化为机器学习设置的“转换”能力。这意味着什么?与纯粹从理论上学习不同,大多数实际的业务场景都非常复杂。在产品经理谈到产品构思时,当设计师谈到商业创新时,没人能告诉你,作为一个数据科学家,这是一个监督学习问题,还是一个无监督学习问题,这是一个可以转化为分类问题还是一个回归问题。有时,你会发现似乎有好几条路可以通。所以,从这些不同设置所依赖的假设中,合理地分析业务场景的能力,就成了数据科学家必须具备的核心能力。

    对业务场景进行分析这一“软”技能确实与工作经验密切相关。这不只是“翻译”机器学习问题,而是需要了解整个系统的架构,因为真正适合的场景“翻译”通常是机器学习中问题设置和系统限制的平衡与结合。举例来说,一个推荐系统需要在100毫秒的级别向一个用户推荐,那么相应的推荐方案必然有计算复杂度的限制。所以场景中的“翻译”实际上是检验数据科学家和人工智能工程师的一个非常重要的步骤,也是一种观察求职者是否真能学以致用的有效方法。

    对此,您是否会有疑问:如果我没有相关的实践经验,那么如何来锻炼这种“翻译”能力呢?事实上,如今丰富的网络产品已经为我们提供了一个无形的平台。如果您在现实中看到了真正的产品,如京东的产品搜索,科大讯飞的语音识别系统等等,您想象一下,如果您是设计师,如果您是数据科学家,您将如何实现该产品的功能?事实上,很多面试问题,都是面试官直接问你关于某个已有产品的设计想法,比如谷歌的面试官可能会问你如何设计一个搜索查询关键字的拼写检查组件。这种方式一方面可以帮你“打开脑洞”,另一方面也可以很好地锻炼大脑。

    另一项非常重要的“软性”技能是数据科学家表达交流的能力。有人可能会对此感到惊讶,因为人们可能认为,数据科学家和人工智能工程师完全是技术岗位,无需与人打交道。事实上,这种认识是片面的。如前所述,数据科学家的一项重要职责是将现实的业务场景“转换”为机器学习的设置,然后在此过程中,会与业务人员、其他工程师、科学家进行高频交流。怎样将你的想法、计划清楚地传达给同事和团队成员是一项重要责任。事实上,数据科学家不仅仅是承担着公司内部的沟通任务,我们经常还需要参加社区的演讲、演讲等活动,成为社区中的一员,离不开沟通表达能力的培养。

如果你对AI工程师感兴趣,不妨点击下方图片,免费领取课程。

c生活中有很多次可以提升自己的机会,但是你没有抓住,为什么呢?免费的课程赠送的就是福利,有免费福利不领取,就是你放过的机会。

有用
分享
全部评论快来秀出你的观点
登录 后可发表观点…
发表
暂无评论,快来抢沙发!
AI项目实战精讲