来源: 最后更新:22-07-29 04:59:03
常用的数据预处理方法是:
1、墓于粗糙集理论的约简方法。粗糙集理论是一种研究不精确、不确定性知识的数学工具。
2、基于概念树的数据浓缩方法。在数据库中,许多属性都是可以进行数据归类,各属性值和概念依据抽象程度不同可以构成一个层次结构,概念的这种层次结构通常称为概念树。
3、信息论思想和普化知识发现。特征知识和分类知识是普化知识的两种主要形式,其算法基本上可以分为两类:数据立方方法和面向属性归纳方法。
4、基于统计分析的属性选取方法。可以采用统计分析中的一些算法来进行特征属性的选取,比如主成分分析、逐步回归分析、公共因素模型分析等。
5、遗传算法。遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法。遗传算法的基本思想是:将问题的可能解按某种形式进行编码,形成染色体。
论语中的经典语录 论语中的经典语录摘抄1 吾十有五而志于学;三十而立;四十而不惑;五十而知天命;六十而耳顺;七
当一个现代村落成为洪水中的孤岛 乌东持续激战!乌方拟通过中间人调停俄乌冲突,“欧尔班不可能是中间人人选” 赖清德用“反贪腐”拉支持度(赖清德2024) 二十不惑里面小卷是谁 二十不惑小卷什么时候回来