问题:
[多选题]下列关于Spark GraphX图计算描述正确的有()。
A图上的计算任务分成图并行计算和数据并行计算两种。
B图并行计算任务是指那些迭代计算任务,如PageRank。
C数据并行计算任务是指图上代数运算,如构建一个图.合并两个图.跨越多个图等。
D将Spark SQL转换成RDD,然后提交到集群执行。
答案解析:
您可能感兴趣的问题
- IaaS云计算解决方案中,虚拟化平台(硬件资源.虚拟软件)主要解决如何运行虚拟机的问题。()
- 大数据的科学价值和社会价值正是体现在()。 A对大数据的掌握程度可以转化为经济价值来源 B大数据已经撼动了世界的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会的其他各个领域 C大数据的价值
- HDFS不适合的场景()。 A存储小文件。 B对延迟要求较高的场景。 C支持多用户写入。 D进行文件随机修改。
- 字节跳动公司产品对YARN的定制应用描述正确是()。 A实现YARN支持单集群使用。 BYARN主要承载着字节跳动公司内的离线作.流式作业.模型训练三大场景。 C公司的抖音.今日头条等产品重度依赖推荐
- MapReduce.Storm.Spark.Tez等计算框架都可以整合在YARN上运行,只要他们各自的框架中有符合YARN规范的资源请求机制即可。()
- YARN采用双层调度框架,ResourceManager将资源分配给AppMaster,AppMaster将资源进一步分配给各个Task。()
- Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()
- 下列关于Kafka描述正确的有()。 AKafka是一个分布式.分区的.多副本的.多订阅者日志系统。 BKafka是一基于zookeeper协调的分布式日志系统。 CKafka可以用于web/ngin
- MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()
- Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。()