学堂在线清华大学高级大数据系统(2021春)课后作业题答案
- MapReduce处理的数据通常只存储在一台服务器上 2021-02-22
- MapReduce中search任务可以只用map实现 2021-02-22
- 统计最流行的单词时,可以通过提前去除出现频率低的单词,来提高程序效率 2021-02-22
- 利用Partition行数,Map和Reduce阶段不做任何操作即可实现排序功能 2021-02-22
- 通过串联多个MapReduce过程,可以实现复杂的数据处理功能 2021-02-22
- Spark的核心API支持下列哪几种语言 AJava BC/C++ CRuby DScala EPython 2021-02-22
- Spark 生态体系中,包括以下哪几种计算框架 AStreaming BStorm CMLlib DGraph 2021-02-22
- Spark运行在现有的分布式文件系统(HDFS)之上。 2021-02-22
- Spark大部分是用那种语言编写的 AScala BC++ CJava DC 2021-02-22
- Spark 一切都以Resilient Distributed Dataset(RDD)为基础 2021-02-22
- 弹性数据集(RDD)的transformation操作表示对数据集的操作延迟执行,而Action 2021-02-22
- 弹性数据集(RDD)可以从下列哪些对象转换过来? A其他RDD转换而来 BLinux单机 2021-02-22
- RDD cache默认的存储级别(StorageLeve)是什么 AMYMORY_AND_DISK BMEMORY_ON 2021-02-22
- 以下针对RDD的操作中,属于Transformation的操作有哪些? Amap() Bfilter() Cco 2021-02-22
- 以下针对RDD的操作中,属于Action的操作有哪些? Acollect() Breduce() Csave() 2021-02-22
- 下列哪些模式可以运行Spark? ALocal BStandalone CMesos DYARN 2021-02-22
- 在Spark的运行架构中,一个Job包含多个Task(被送到executor上的工作单元)组成 2021-02-22
- 在Spark的任务处理中,Master节点充当哪些角色 A任务和资源调度 B节点管理 C 2021-02-22
- Spark运行任务过程中的Stage是由下列哪个过程产生的? ARDD Objects BDAGSche 2021-02-22
- 在Spark计算的过程中,可以直接使用 Local files 和 DFS files 作为数据源来 2021-02-22