数据挖掘过程中不能犯的错误有哪些?

slime2021-08-24 14:37

在做数据分析的时候,想要做好数据分析,不仅需要了解各个环节的处理方法,同时还需要避免犯错。那么在数据挖掘过程中不能犯的错误有哪些呢?

数据挖掘过程中不能犯的错误有哪些?

数据挖掘过程中不能犯的错误如下:

1、缺乏数据(Lack Data)

对于分类问题或预估问题来说,常常缺乏准确标注的案例。

2、太关注训练(Focus on Training)

IDMer:就象体育训练中越来越注重实战训练,因为单纯的封闭式训练常常会训练时状态神勇,比赛时一塌糊涂。

实际上,只有样本外数据上的模型评分结果才真正有用!

数据挖掘过程中不能犯的错误有哪些?

3、只依赖一项技术(Rely on One Technique)

IDMer:这个错误和第10种错误有相通之处,请同时参照其解决方法。没有对比也就没有所谓的好坏,辩证法的思想在此体现无遗。

“当小孩子手拿一把锤子时,整个世界看起来就是一枚钉子。”要想让工作尽善尽美,就需要一套完整的工具箱。

不要简单地信赖你用单个方法分析的结果,至少要和传统方法(比如线性回归或线性判别分析)做个比较。

4、提错了问题(Ask the Wrong Question)

IDMer:一般在分类算法中都会给出分类精度作为衡量模型好坏的标准,但在实际项目中我们却几乎不看这个指标。为什么?因为那不是我们关注的目标。

项目的目标:一定要锁定正确的目标

模型的目标:让计算机去做你希望它做的事

5、只靠数据来说话(Listen(only)to the Data)

IDMer:“让数据说话”没有错,关键是还要记得另一句话:兼听则明,偏听则暗!如果数据+工具就可以解决问题的话,还要人做什么呢?

投机取巧的数据:数据本身只能帮助分析人员找到什么是显著的结果,但它并不能告诉你结果是对还是错。

经过设计的实验:某些实验设计中掺杂了人为的成分,这样的实验结果也常常不可信。

以上就是小编为大家整理的“数据挖掘过程中不能犯的错误有哪些?”一文,更多相关信息尽在数据分析教程频道。

相关推荐:

2021如何成为更值钱的数据型人才,课程特惠0元领

产品经理如何做好产品规划

AI入门必备资料,人工智能必读书单

免责声明:本站所提供的内容均来源于网友提供或网络搜集,由本站编辑整理,仅供个人研究、交流学习使用。如涉及版权问题,请联系本站管理员予以更改或删除。
有用
分享
全部评论快来秀出你的观点
登录 后可发表观点…
发表
暂无评论,快来抢沙发!
Hello,World公开课