摘要
决策树是从一组数据中生成分类器的一个行之有效的方法。其中ID3算法是目前引用率较高的算法。ID3算法是以信息熵为核心的分类预测算法。然而ID3算法存在多值偏向问题,可能使得出的决策树并不是最优的。文章将信息增益与关联函数生活经验和相结合,改进ID3算法,克服ID3算法偏向于选择取值多的属性的缺点,提高ID3算法准确率。并将改进后的ID3算法与原算法比较,证明改进后的ID3算法准确有效。
引文
[1]韩松来,张辉,周华平.基于关联度函数的决策树分类算法[J].计算机应用,2005(11):2655-2657.
[2]毛国君,段立娟.数据挖掘原理与算法[M].清华大学出版社.
[3]李建,付小斌,吴媛媛.基于优化ID3的井漏类型分类算法[J].计算机工程,2019,45(02):290-295.