学堂在线北京理工大学机器学习实践(2021秋)习题答案
- 本章实验中训练集与测试集的划分比为()。 A3:7 B5:5 C7:3 D8:2 2021-12-10
- 对决策树优缺点叙述有误的是()。 A决策树能同时处理数据型和常规型属性 B可以 2021-12-10
- 决策树进行分类时过拟合的原因有()。 A训练数据中存在噪音数据,决策树的某些节 2021-12-10
- 下面关于ID3算法中说法错误的是()。 AID3算法要求特征必须离散化 B信息增益可 2021-12-10
- 给定17个样本类别为颜色,其中有8红9绿,则其信息熵为()。 A0.995 B1 C0.9975 D0. 2021-12-10
- 下列决策树流程顺序正确的是()。 (1)数据准备:通过数据清洗和数据处理,将数据整 2021-12-10
- 下列关于决策树算法,错误的描述是()。 AID3算法使用信息增益方法作为属性的选 2021-12-10
- 影响基本K-均值算法的主要因素有()。 A样本输入顺序 B模式相似性测度 C聚类准 2021-12-10
- 关于数据预处理对聚类分析的影响的错误说法是()。 A可能改变数据点之间的位置 2021-12-10
- EM算法是()。 A有监督 B无监督 2021-12-10
- 假如你使用EM算法对一个有潜变量的模型进行最大似然估计(Maximum likelihoo 2021-12-10
- 通过监督学习进行二分类模型训练过程中,可能会遇到正负样本数量不平衡的情况 2021-12-10
- 使用k-means算法对红酒数据集进行聚类的实践中,与事实不符的是()。 A不提供红 2021-12-10
- 下列关于基于模型的方法叙述错误的是()。 A假设数据是根据潜在的概率分布生成 2021-12-10
- 下列关于网格的方法中叙述错误的是()。 A采用一个多分辨率的网格数据结构,将空 2021-12-10
- 下列关于DBSCAN定义叙述错误的是()。 A密度可达是直接密度可达的传递闭包,是对 2021-12-10
- 对于DBSCAN,下列说法错误的是()。 A计算复杂度为O(n^2) B使用空间索引的数据库 2021-12-10
- 下列关于K-means算法叙述有误的是()。 A算法可能终止于局部最优解 B算法只有 2021-12-10
- K-means的算法步骤正确的是()。 输入:n个对象的数据集D,簇数目k 输出:k个簇 (1 2021-12-10
- 划分方法包括的典型方法有()。 (1)K-means及其变种 (2)K-中心点 (3)CLARA (4) 2021-12-10
- 下列属于聚类算法的方法包括()。 (1)划分方法 (2)层次方法 (3)基于密度方法 ( 2021-12-10
- 下列关于聚类和分类的说法中,错误的是()。 A聚类是一种无监督学习,在聚类中没有 2021-12-10
- 以下哪些函数是凸函数?() Af(x) = x Bf(x) = x^3 Cf(x) = x^4 Df(x) = x^3+x^4 2021-12-10
- 在两个变量的回归分析中,作散点图是为了()。 A根据经验选定回归方程的类型 B估 2021-12-10
- 已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3. 5, 2021-12-10