常用的大数据算法有哪些?

开课吧小白2021-06-21 11:52

我们生活在一个依赖 “算法”的时代,它对我们生活的影响越来越大,数字经济的时代,算法究竟应该是一个怎样的存在?常用的大数据算法有哪些?

1、C4.5

C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树核心算法。

2、The k-means algorithm即K-Means算法

k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割(k<n)。它与处理混合正态分布的最大期望算法(本十大算法第五条)很相似,因为他们都试图找到数据中自然聚类的中心。

3、Support vector machines

支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。

4、The Apriori algorithm

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。

5、CART: 分类与回归树

CART,Classification and Regression Trees。在分类树下面有两个关键的思想:第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。

6、AdaBoost

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。

7、KNN法即K近邻法

最初由Cover和Hart于1968年提出的,是一个理论上比较成熟的方法。它的思路非常简单:找到训练集样本空间中的K个距离预测样本x最近的点,统计K个距离最近的点的类别,找出个数最多的类别,将x归入该类别。

以上就是开课吧广场小编为大家整理发布的“浅析大数据框架内容有哪些?”一文,感兴趣的同学推荐听一下这节公开课,《大数据生态体系解读》,点击下方图片领取。

大数据算法

免责声明:本站所提供的内容均来源于网友提供或网络搜集,由本站编辑整理,仅供个人研究、交流学习使用。如涉及版权问题,请联系本站管理员予以更改或删除。
有用
分享