问题:
[单选题]将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
A频繁模式挖掘
B分类和预测
C数据预处理
D数据流挖掘
答案解析:
您可能感兴趣的问题
- 软件定义网络()将网络管理与底层网络基础设施分离开来,允许管理员动态调整整个网络的流量,以满足不断变化的需求。()
- 大数据的科学价值和社会价值正是体现在()。 A对大数据的掌握程度可以转化为经济价值来源 B大数据已经撼动了世界的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会的其他各个领域 C大数据的价值
- 下列关于YARN框架描述正确的有( )。 AResourceManager负责整个集群的资源管理和分配。 BNodeManager是每个节点上的资源和任务管理器。 CNodeManager定时向Res
- 发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。()
- MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()
- Hive的本质是将SQL语句转换为MapReduce任务运行,使不熟悉MapReduce的用户很方便地利用HQL处理和计算HDFS上的结构化的数据。()
- 下列属于在Spark核心框架的基础上提供的计算框架( )。 A Spark SQL。 B Spark Streaming。 C Spark (machine learning)。 D GraphX(g
- 下列描述中错误的是()。 A 集群是指一组桌面计算机或服务器通过局域网连接在一起。 B 集群中每个节点都运行自己的操作系统,节点之间使用网络协议进行通信。 C 最大规模的集群称为仓库级计算机(WSC)
- 以下属于IaaS管理工具的有()。 A OpenStack B CloudPlatform C Helion Eucalyptus D CloudStack
- 下列不属于Strom特性的是()。 A 适用场景广泛,可伸缩性高。 B 保证无数据丢失.异常健壮 容错性好.语言无关性 D 是一个通用资源管理系统和调度平台。