数据挖掘引论

我们的数据是丰富的,但信息是贫乏的,数据中的有价值的知识不能被提取出来,数据再多也都变成了“数据坟墓”。可以这么说,我们并不是真正的生活在“信息时代”,而只是生活在数据时代。随着数据库和数据管理产业的不断发展:数据收集、数据库创建、数据管理和高级数据分析,如今,大量的数据被收集和存储,大量的数据库系统提供了查询和事务处理,高级数据分析自然成为信息技术发展的必然趋势。把数据挖掘类比为在砂石中淘金是很形象的,如何挖掘大量数据中有用的信息,提取出数据的利用价值,就是数据挖掘的研究目标。
数据挖掘可以分为两种任务:描述性和预测性。描述性挖掘任务刻画目标数据中数据的一般性质。预测性挖掘任务在当前数据上进行归纳,以便做出预测。