问题:
A需要保持训练集和测试集数据分布的一致性
B只需要进行一次划分
C测试集不能太大,不能太小
D以上选项都是
[单选题]下面哪一项不是留出法的注意事项?
答案解析:
您可能感兴趣的问题
- Hadoop 3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。
- 以下说法正确的是()。 AHDFS源自于Google的GFS论文 BHDFS是一易于扩展的分布式文件系统 CHDFS运行在大量普通廉价机器上,提供容错机制 DHDFS为大量用户提供性能不错的文件存取服
- 下列关于YARN框架描述正确的有( )。 AResourceManager负责整个集群的资源管理和分配。 BNodeManager是每个节点上的资源和任务管理器。 CNodeManager定时向Res
- 下列关于Flume架构描述正确的有()。 ASource是数据的收集端,负责将数据捕获后进行特殊的格式化。 BSource将数据封装到事件(event) 里,然后将事件推入Channel中。 CCha
- Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。()
- 在RDD的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD是经过哪些转化操作得来的。()
- 数据可视化常用方式包括()。 A面积&尺寸可视化。 B颜色.图形可视化。 C地域空间可视化。 D概念可视化。
- 数据处理大致分为两类()。 A OLTP(On-Line Transaction Processing:联机事务处理) B OLAP(On-Line Analytical Processing:联机分
- 以下哪些是虚拟化需要解决的问题()。 A 隔离性 B 移动性 C 安全性 D 可配额/可度量
- XenServer是Citrix(思杰)的虚拟化平台组件,开源,直接安装在裸机上,核心代码是Linux和Xen。()