问题:
[判断题]信息熵是度量样本集合纯度最常用的一种指标。信息熵的值越大,说明样本集合的纯度越高。
答案解析:
您可能感兴趣的问题
- 虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。 A服务器 B网络 C存储 D操作系统
- 存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存储系统和数据迁移。()
- Hadoop 3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。
- 如果任务运行在它将处理的数据所在的节点, 则称该任务具有“数据本地性”。()
- Spark支持使用Scala.Java.Python和R语言进行编程。()
- 在RDD的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD是经过哪些转化操作得来的。()
- 下列Storm工作流程描述正确的是()。 AClient节点提交Topology任务。 BNimbus节点将提交的Topology进行分片,分成一个个Task,分配给相应的Supervisor。 CN
- Hive的本质是将SQL语句转换为MapReduce任务运行,使不熟悉MapReduce的用户很方便地利用HQL处理和计算HDFS上的结构化的数据。()
- 采用HA(High Availability:高可用性)的HDFS集群配置两个NameNode,分别处于Active和Standby状态。当Active NameNode故障之后,Standby接过责
- Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存.CPU.磁盘.网络等。()