大厂研究员带你手推数学模型

开课吧开课吧锤锤2021-05-20 18:30

    扎实的数学功底是作为人工智能工程师必不可少的基本素质。然而现在依然有许多工程师将关注点聚集在如何调参和调包。殊不知,没有扎实的基本功作为支持,一切的技术都如空中楼阁,难以落地。

ai

    从最近几年大公司的岗位JD我们也可以看出来,数学、数据结构、算法这些基础知识已经成为面试者必备的要求

哎

    这不,5月19日的《HelloWorld公开课》,现大厂人工智能实验室研究员,伊利诺伊大学香槟分校机器Jerry老师,就教你,如何自己来手推一个数学模型。

    机器学习进阶路径

    一说起数学模型很多人就头大,感觉到很头疼无法下手。但如果摸索到学习路径,有人指引,其实一点都不难学。因为我们毕竟是通过模型学习背后的原理,最终来指导工程上出现的问题,我们最终的目标不是要做数学家。

    以基础数学为例,我们只需掌握线性代数、微积分、概率论的基础知识就行,比如线性代数中的基础矩阵运算,微积分中的求导,如何求取条件概率,只要掌握这些基础知识,就足以应付大多数情况。

Java

    在掌握了基本的数学知识后,你需要开始了解几种机器学习和深度学习的经典模型,洞悉其背后的设计思想和实现原理,这样以后在看其他模型时就可以举一反三。

    比如针对传统的机器学习模型,你需要了解回归模型、支持向量机、聚类算法、决策树,针对深度学习模型,你要去看多层感知机(DNN,MLP)、卷积网络(CNN)、循环网络(RNN)、“变形金刚”(Transformer)等经典的模型。

    KNN模型

    以经典的KNN模型为例,这个模型实际是对特征空间的划分,是一种基于分类与回归方法其核心要素为距离度量、K值的选择、分类决策规则。这个模型的分类依据是看离待分类点最近的k个邻居属于哪个分类的最多。通过调整k的值,可能会得到不同的分类效果。

ai

    针对这类模型,下面来看下它实现的具体步骤有哪些,首先要给出已标注好的数据点i(i=1,…,n)的坐标(x_i,y_i)以及类别t_i(取值为0或1),再给出新加入点的坐标(x_0,y_0),计算它到每个标注点的距离(欧式距离)。

    根据上一步求到的距离,找出离它最近的k个点,最近的k个点中,数量最多的那个类别就判定为新加入点的类别。

    K-Means模型

    K-means是常见的基于欧式距离的聚类算法,这个算法认为两个目标的距离越近,相似度越大。比如我们看下面这张图,通过肉眼来观察,可以很明显看出它分为红、黑、绿三种。那么计算机是如何来分辨的呢,这里就用到了K-means这种聚类算法。

Java

    用数学公式来表达就是下面这个式子,这个就是我们的优化目标,求出这个式子最小值

ai

    然后再求各个簇的簇心位置,为属于这个簇的所有点的平均值。翻译成数学语言就是下图公式所示

ai

    这里可能有同学会问,为什么要求簇的所有点的平均值呢,其实这里面是有数学依据的,首先对其求导,令其等于0,便有了上面的结果,具体推到过程如下图公式所示

ai

    我们来总结下K-means的步骤,首先从n个数据点中随机选k个作为簇心;计算每个数据点到各个簇心的距离,将距离最小的簇心选作该数据点的分类;对每个分类的数据点求均值,得到新的簇心的位置;重复上述步骤,直到簇心位置不再改变。

    以上我们仅仅是简单的推到了一下模型背后的原理,如果有同学想要了解更深度的推导过程,可以点击你也可以从零手推模型观看公开课的回放视频!

ai

    讲师介绍

    Jerry,伊利诺伊大学香槟分校机器学习方向硕士,现为某大厂人工智能实验室研究员

    《Hello,World公开课》是由开课吧推出的面向广大开发工程师的免费加餐课,集结业内名师大咖,聚焦热门技术和实战解决方案,以专业知识分享交流为桥梁,链接正在创造世界的一群科技主力们,向初心致敬,为技术发烧。无论你是初入职场的应届生,还是准备升职加薪的职场精英,相信这里都有你需要的养料。

    以上就是开课吧广场小编为大家整理发布的“大厂研究员带你手推数学模型”一文,更多动态相关内容尽在开课吧广场动态频道!

免责声明:本站所提供的内容均来源于网友提供或网络搜集,由本站编辑整理,仅供个人研究、交流学习使用。如涉及版权问题,请联系本站管理员予以更改或删除。
有用
分享