基于特征选择的过抽样算法的研究
[本文摘要]
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度。
相关阅读
热门文章
2021年12月6日
2016年10月28日
2016年10月24日
2016年9月28日
蓝戈沙龙