问题:
[单选题]我们想在大数据集上训练决策树,为了减少训练时间,我们可以
A增加树的深度
B增大学习率(Learning Rate)
C对决策树模型进行预剪枝
D减少树的数量
答案解析:
您可能感兴趣的问题
- 虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。 A服务器 B网络 C存储 D操作系统
- Ceph计算模式是一种完全无中心架构()
- 通用的大数据分析系统的核心设计理念包括并行化.规模经济.虚拟化。()
- HDFS不适合的场景()。 A存储小文件。 B对延迟要求较高的场景。 C支持多用户写入。 D进行文件随机修改。
- Spark运行架构包括()。 A集群资源管理器(Cluster Manager)。 B运行作业任务的工作节点(Worker Node)。 C每个应用的任务控制节点(Driver)。 D每个工作节点上负
- Hive内部表(table)删除后,HDFS上的文件没有删除,只是把文件删除,删除元数据,不删除数据。()
- 下列关于Message Queue功能描述正确的是( )。 A 削峰填谷。 B 程序间解耦。 C 迁移数据。 D 转换数据格式。
- I/O设备虚拟化模式包括()。 A I/O全虚拟化 B I/O半虚拟化 C I/O直通虚拟化 D 内存储器虚拟化
- 下列不属于Strom特性的是()。 A 适用场景广泛,可伸缩性高。 B 保证无数据丢失.异常健壮 容错性好.语言无关性 D 是一个通用资源管理系统和调度平台。
- 下列关于Spark Streaming描述正确的有( )。 A 是构建在Spark RDD之上的一款流处理工具。 B 是Spark核心(Spark Core)API的一个扩展。 C 可以实现高吞吐量的