数据挖掘——概论
数据挖掘——概论
- 数据、信息和知识的关联和联系
- 数据挖掘
- 数据挖掘定义
- 数据挖掘的步骤
- 数据挖掘的主要内容
数据、信息和知识的关联和联系
数据、信息和知识是知识工作者感知和认识客观事物的3个连贯的阶段。
数据无处不在,聚合/集成后转化为信息,结构化后变成知识
从数据到信息,再到知识,甚至智慧,存在一个层层递进的关系。
下面是一个关于数据、信息和知识的例子
数据挖掘
数据挖掘定义
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
数据挖掘的步骤
- 数据准备并筛选
- 数据预处理(数据清理、数据集成、数据变换、数据规约)
- 数据变换
- 数据挖掘
- 解释/评估(通常用可视化)
数据挖掘的主要内容
这些方法共同构成了数据挖掘的核心技术,用于从大量数据中提取有价值的信息和知识。