浅析什么是数据挖掘?

slime2021-08-20 14:33

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

浅析什么是数据挖掘?

1、数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程;

2、基本任务包括利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,从数据中提取蕴含价值的信息。

3、根据问题决定属于哪一类任务,确定任务以后再决定使用什么算法建模;

注:机器学习算法指的是分类与预测和聚类分析算法(每一次从数据集的学习都是不确定的,这样的算法叫做机器学习算法)

数据挖掘的过程及描述:

定义挖掘目标:要实现什么样的哦功能,找到什么样的信息;

数据取样:需要哪些原始的数据;

数据探索:对数据进行了解分析(直观或统计)、数据质量分析(脏数据等)、数据特征分析(分布等);

数据预处理:数据清洗、数据集成、数据变换、数据规约;降维、补缺等修剪来获得“好”数据;

挖掘建模:首先判断属于哪类问题(分类、聚类等);选用对应的算法和模型进行数据分析;

模型评估:对所选用的模型进行评测;利用该类模型的评估指标(方差、ROC等);

注:数据探索和数据预处理都是为了获取到好的数据训练而服务的;

脏数据包括:缺失、异常、一致;

特征分析:分布、对比、统计量、周期性、贡献度、相关性;

统计数据清洗:缺失值、异常值处理;

数据集成:实体识别、冗余属性识别;

数据变换:简单函数变换、规范化、连续属性离散化、属性构造、小波变换;

数据规约:属性规约、数值规约;

为了帮助大家顺利了解数据挖掘技术,小编向大家推荐这门公开课,电商用户行为序列建模点击图片立即领取

电商用户行为序列建模

课程介绍

讲解电商用户行为,进行漏斗分析实践。介绍用户购买行为预测业务,进行建模训练。

Pandas数据分析

漏斗模型搭建

用户购买行为预测模型

以上就是小编为大家整理的“浅析什么是数据挖掘?”一文,更多相关信息尽在人工智能教程频道。

相关推荐:

2021如何成为更值钱的数据型人才,课程特惠0元领

产品经理如何做好产品规划

AI入门必备资料,人工智能必读书单

免责声明:本站所提供的内容均来源于网友提供或网络搜集,由本站编辑整理,仅供个人研究、交流学习使用。如涉及版权问题,请联系本站管理员予以更改或删除。
有用
分享