数据挖掘所发现的知识最常见的有以下四类: 1)广义知识 ——广义知识指类别特征的概括性描述知识。根据数据的微观特性发现其表征、带有普遍性的、较高层次概念的、中观和宏观的知识,反映同类事物共同性质,是对数据的概括、精炼和抽象。 ——广义知识的发现方法和实现技术有很多,如数据立方体、面向属性的归约等。 2)关联知识(Association) ——它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。 3)分类知识(Claaification&Clustering) ——它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习方法。该方法现根据训练子集形成决策树。如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集。最终结果是一棵树,其叶节点是类名。 4)预测型知识 ——它根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为是以时间为关键属性的关联知识。 5)偏差型知识 ——此外,还可以发现其他类型的知识,如偏差型知识,它是对差异和极端特例的描述,揭示事物偏离常规的异常现象。 |