问题:
[判断题]聚类分析针对有标签的数据进行。基于最大化类别内部的相似度,最小化类别之间的相似度的原则来分组。( )
答案解析:
您可能感兴趣的问题
- HDFS文件被切分成固定大小的数据块,为实现高吞吐率,默认数据块大小为128MB。()
- Mesos组件中Framework Scheduler组件是实现单个应用程序的管理和资源二次调度。()
- 下列适合MapReduce应用场景的是()。 A实时计算。 B流式计算。 CDAG计算。 D离线批处理。
- Storm将Spouts和Bolts组成的网络抽象成topology(类似Job),它可以被提交到Storm集群执行。()
- 下列关于数据仓库工具Hive架构描述正确的是()。 AHive用户接口主要有三个:CLI,JDBC/ODBC和Web UI,最常用的是CLI。 BHive将元数据存储在关系型数据库中,有三种模式可连接
- 数据可视化常用方式包括()。 A面积&尺寸可视化。 B颜色.图形可视化。 C地域空间可视化。 D概念可视化。
- Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存.CPU.磁盘.网络等。()
- Spark GraphX是Spark中用于图和图计算的组件。()
- OpenFlow协议是SDN架构中位于控制面和转发面的第一个标准通信接口,允许直接访问和操控网络设备的转发面。()
- 下列关于Spark Streaming描述正确的有( )。 A 是构建在Spark RDD之上的一款流处理工具。 B 是Spark核心(Spark Core)API的一个扩展。 C 可以实现高吞吐量的