数据挖掘的方法有哪些
世界包含的多得难以想象的数字化信息变得更多更快……从商业到科学,从政府到艺术,这种影响无处不在。科学家和计算机工程师们给这种现象创造了一个新名词:“大数据”。大数据时代什么意思?大数据概念什么意思?大数据分析什么意思?所谓大数据,他的来源在哪里,讲了那么多,那么数据挖掘是什么呢?

2、可伸缩:如果数据挖掘算法要处理海量数据集,则算法必须是可伸缩的(scalable)许多的数据挖掘算法使用特殊的搜索策略处理指数级搜索问题。为实现可伸缩可能还需要实现新的数据结构,才能有效的访问每个记录。

4、异种数据和复杂数据:通常情况下,传统的数据分析方法只处理包含相同类型属性的数据集,或者是连续的,或者是分类的。 随着数据挖掘在商务、科学、医学和其他领域的作用越来越大,越来越需要处理异种属性的技术。近年来,已经出现了更复杂的数据对象。这些非传统的数据类型的 例子有:含有半结构话文本和超链接的Web叶面集、具有序列和三维结构的DNA数据、包含地球表面不同位置上的时间序列测量值的气象数据等等。

5、数倌栗受绽据的所有权与分布:有时,需要分析的数据并非存放在一个站点,或者归属一个机构,而是地理上分布在属于多个机构的资 源中。这就需要梯瓣氨割开发分布式数据挖掘技术。分布式数据挖掘算法面临的主要挑战包括:(1)如何降低执行分布式计算的通信量?(2)如何有效的同意从多个资源 得到的数据挖掘结果?(3)如何处理数据安全性问题?
