问题:
[判断题]在RDD的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD是经过哪些转化操作得来的。()
答案解析:
您可能感兴趣的问题
- 下列哪些应用属于大数据技术的应用()。 A电商网站上对注册用户浏览信息记录.分析.挖掘,为用户推送感兴趣的商品。 B音视频网站上通过分析注册用户的浏览习惯,为用户推送感兴趣的音视频。 C政务领域中的智
- 云计算的劣势有()。 A信息技术产业进一步合理分工 B严重依赖网络 C数据泄密的环节增多 D风险被集中
- 虚拟技术特性有()。 A分区 B隔离 C封装 D相对于硬件独立
- 根据OverLay的载体不同,VXLAN的OverLay分为()3种。 A主机OverLay B网络OverLay C混合OverLay D虚实OverLay
- IaaS云计算解决方案中,虚拟化平台(硬件资源.虚拟软件)主要解决如何运行虚拟机的问题。()
- Hadoop MapReduce.Spark属于离线计算框架技术。()
- Hadoop 3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。
- HDFS不适合的场景()。 A存储小文件。 B对延迟要求较高的场景。 C支持多用户写入。 D进行文件随机修改。
- 如果任务运行在它将处理的数据所在的节点, 则称该任务具有“数据本地性”。()
- Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于Amazon EC2等云环境中,并且可以访问HDFS.Cassandra.HBase.Hive等多种数据源。()