属性约简。数据预处理。样本选择。样本间的相似性度量。
问题:
[单选] 聚类分析中,常用的距离度量方式有()。
欧式距离。绝对距离。Minkowski距离。以上都是。
问题:
[单选] 在K-Means聚类分析中,初始聚点的选择方法有().
根据经验选择。随机选择。将全部样本人为地或者随机的进行划分,以每类的重心为聚点。以上都可以。
问题:
[单选] 以下关于决策树的说法中,不正确的是()。
冗余属性不会对决策树的准确率造成不利的影响。子数可能在决策树中重复多次。决策树算法对于噪声的干扰非常敏感。寻找最佳决策树是NP完全问题。
问题:
[单选] ID3,C4.5,CART等分类算法均是在()的基础上改进得到。
Apriori算法。SVD算法。Hunt算法。EM算法。
问题:
[单选] ID3算法以()作为测试属性的选择标准。
所划分的类个数。分类的速度。信息熵。信息增益。
问题:
[单选] ID3算法的策略是选择()的属性作为测试属性。
信息增益最小。信息增益最大。信息增益为0。信息增益不变。
问题:
[单选] ID3算法的问题是,测试属性的分支越多,信息增益值(),但输出分支多并不表示该测试属性有更好的预测效果。
越大。越小。保持不变。时大时小。