本在线课程通过通俗的语言、形象的图文、来系统的讲解基础理论,使我们了解云计算服务所涉及关键技术、大数据框架技术各部分基本功能和运行原理。通过线下验证性技术实践、案例实践系统掌握云计算与大数据技术,为我们从事云计算、大数据开发和应用提供一个入门级的了解和学习实践。
学堂在线北京联合大学云计算与大数据技术(2022春)作业题答案
开课机构:北京联合大学 教师团队:张冰峰 总点击数:
绪论
第十六章 大数据应用前端展示
- 数据可视化工具分为()。 A零编程类。 B开发工具类。 C画图工具。 D专业图表类。…
- 数据可视化常用方式包括()。 A面积&尺寸可视化。 B颜色.图形可视化。 C地域空间可视化。 D概念可…
- 从用户的角度,数据可视化可以让用户快速抓住要点信息,让关键的数据点从人类的眼睛快速通往心灵深…
- 借助于图形化的手段,可以清晰.快捷有效的传达与沟通信息。()
- 市场上有许多专业的可视化工具,包括零编程拖拽类.专业图表类.软件开发工具类等。()…
第十五章 Hive数据仓库
- 下列关于数据仓库工具Hive描述正确的是()。 AHive是一个构建在Hadoop上的数据仓库框架。 BHive可…
- 下列关于数据仓库工具Hive架构描述正确的是()。 AHive用户接口主要有三个:CLI,JDBC/ODBC和Web UI…
- Hive的存储结构包括数据库.表.视图.分区和表数据等。()
- Hive内部表(table)删除后,HDFS上的文件没有删除,只是把文件删除,删除元数据,不删除数据。()…
- Hive的本质是将SQL语句转换为MapReduce任务运行,使不熟悉MapReduce的用户很方便地利用HQL处理和…
第十四章 NoSQL数据库
- 下列关于Hbase描述正确的是()。 AHBase是一个开源的非关系型分布式数据库。 B运行于HDFS文件系统…
- 下列哪些数据库产品是NoSQL数据库()。 ARedis。 BMongoDB。 CMySQL。 DCassandra。…
- 若要在 HBase 上使用 SQL,则需要联合使用 Apache Phonenix,或者联合使用 Hive 和 HBase。…
- HBase存储模式是基于列存储的,每个column family存储在HDFS上的一个单独文件中。()…
- 在当今云计算.大数据盛行的时代,关系型数据库性能遇到瓶颈,瓶颈的源头一般是在磁盘的I/O上。()…
- NoSQL数据库同时具备了高性能.可扩展性强.高可用等优点。()
第十三章 Storm计算框架
- 下列对Storm集群结构描述正确的是()。 ANimbus负责在集群范围内分发代码.为Worker分配任务和监测…
- 下列Storm工作流程描述正确的是()。 AClient节点提交Topology任务。 BNimbus节点将提交的Topolog…
- Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。()…
- Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。()…
- Storm将Spouts和Bolts组成的网络抽象成topology(类似Job),它可以被提交到Storm集群执行。()…
第十二章 Spark计算框架
- 下列关于Spark使用场景描述正确的有()。 A复杂的海量数据批量处理,时间在数十分钟到数小时之间。…
- 下列关于Spark GraphX图计算描述正确的有()。 A图上的计算任务分成图并行计算和数据并行计算两种…
- Spark运行架构包括()。 A集群资源管理器(Cluster Manager)。 B运行作业任务的工作节点(Worker No…
- Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于Amazon EC2等云环境中,并且可以访…
- Spark支持使用Scala.Java.Python和R语言进行编程。()
- Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。()…
- 在RDD的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD是经过哪些转化操作得来的…
第十一章 MapReduce计算框架
- 下列适合MapReduce应用场景的是()。 A实时计算。 B流式计算。 CDAG计算。 D离线批处理。…
- 下列关于MapReduce2.0架构描述正确的有()。 AMapReduce 2.0将 JobTracker 两个主要的功能资源管…
- 如果任务运行在它将处理的数据所在的节点, 则称该任务具有“数据本地性”。()…
- MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()…
第十章 数据采集与迁移工具
- 常用大数据采集途径有()。 A数据服务机构。 B互联网数据采集。 CAPP移动端数据采集。 D智能感知…
- 下列关于Flume架构描述正确的有()。 ASource是数据的收集端,负责将数据捕获后进行特殊的格式化。…
- 下列关于数据迁移工具Sqoop描述正确的有()。 ASqoop 是一款用于在Hadoop和关系数据库服务器之间…
- 下列关于Kafka描述正确的有()。 AKafka是一个分布式.分区的.多副本的.多订阅者日志系统。 BKafka…
- 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络.物联网.电子…
- 大数据的处理流程的第一步就是大数据的采集与预处理。()
- 发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以…
第九章 大数据技术 YARN
- 下列关于YARN框架描述正确的有( )。 AResourceManager负责整个集群的资源管理和分配。 BNodeMana…
- 下列关于YARN描述正确的有()。 AYARN是一个通用资源管理系统和调度平台。 BYARN为上层应用提供统…
- 字节跳动公司产品对YARN的定制应用描述正确是()。 A实现YARN支持单集群使用。 BYARN主要承载着字…
- MapReduce.Storm.Spark.Tez等计算框架都可以整合在YARN上运行,只要他们各自的框架中有符合YARN规…
- YARN基于ZooKeeper实现HA,主提供服务,备同步主的信息。主挂掉,备立即做切换接替主进行服务。()…
- Mesos是一个开源的资源管理系统,可以对集群中的资源做弹性管理,目前Twitter、 Apple等公司在大量使…
- YARN采用双层调度框架,ResourceManager将资源分配给AppMaster,AppMaster将资源进一步分配给各个Tas…
- Mesos组件中Framework Scheduler组件是实现单个应用程序的管理和资源二次调度。()…
- Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()…
- YARN天生是为批处理而设计的,很多地方与流式或模型训练场景并不匹配,为了给批处理、流式、模型训练…
第八章 大数据技术 HDFS
- 以下说法正确的是()。 AHDFS源自于Google的GFS论文 BHDFS是一易于扩展的分布式文件系统 CHDFS运…
- HDFS不适合的场景()。 A存储小文件。 B对延迟要求较高的场景。 C支持多用户写入。 D进行文件随机…
- 传统的NFS不是一种典型的分布式系统,虽然它的文件的确放在远端(单一)的服务器上面。()…
- HDFS文件被切分成固定大小的数据块,为实现高吞吐率,默认数据块大小为128MB。()…
- HDFS文件不仅支持追加,还支持文件任意offset的修改。()
- HDFS不支持多用户写入,也无法进行文件随机修改。仅支持以append的方式,即通过追加的方式添加到文…
第七章 大数据核心技术
- Hadoop1.0和Hadoop2.0区别包括()。 AHadoop2.0新增了HDFS HA机制 BHadoop2.0新增了HDFS federati…
- Hadoop2.0和Hadoop3.0区别包括()。 AHadoop3.0的Java运行环境升级为1.8 BHadoop3.0支持多于2个以…
- Hadoop 2.0版本加入了通用YARN资源管理器,用以协调各个组件对系统资源的利用,合理分配集群CPU、内…
- Hadoop2.0版本中,MapReduce2.0只是一个计算框架,具体资源调度全部交给Yarn框架。()…
- Hadoop 3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要…
第六章 大数据基础
- 大数据4V特点是()。 AVolume(体量大) BVelocity(处理速度快) CVariety(数据类型多) DValue(价值…
- 大数据的定义是()。 A指无法在可承受的时间范围内用常规软件工具进行捕捉.管理和处理的数据集合 …
- 在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该着重于()为其行为承担责任。 A…
- 大数据的处理流程涉及()。 A数据采集 B数据导入/预处理 C统计/分析 D数据挖掘与预测…
- 大数据的科学价值和社会价值正是体现在()。 A对大数据的掌握程度可以转化为经济价值来源 B大数据…
- 通用的大数据分析系统的核心设计理念包括并行化.规模经济.虚拟化。()…
- 大数据框架技术中消息系统技术有:Kafka.StormMQ.ZeroMQ.RabbitMQ。()
- Hadoop MapReduce.Spark属于离线计算框架技术。()
第五章 云计算服务实践
- 虚拟化平台软件有哪些()。 AHyper-V BEsxi CxenServer DKVM
- 下列描述中正确的有 A集群是指一组桌面计算机或服务器通过局域网连接在一起,运转方式类似于一个更…
- 以下属于PaaS管理工具的有()。 A红帽公司的OpenShift BCloud Foundry 社区的CloudFoundry CHyper…
- IaaS云计算解决方案中,虚拟化平台(硬件资源.虚拟软件)主要解决如何运行虚拟机的问题。()…
- SaaS云管理工具与业务关联性大,目前没有统一的标准版产品。()
- 一般地,SaaS云管理软件包含两大部分:一是SaaS业务门户,二是SaaS管理门户。()…
第四章 网络虚拟化
- 软件定义网络(SDN)特点。 A控制转发分离。 B控制平面集中化。 C转发平面通用化。 D控制器软件可编…
- OpenFlow组件包括()。 AOpenFlow控制器 BOpenFlow交换机 C数据转发平面 D控制平面…
- 根据OverLay的载体不同,VXLAN的OverLay分为()3种。 A主机OverLay B网络OverLay C混合OverLay D虚…
- 软件定义网络()将网络管理与底层网络基础设施分离开来,允许管理员动态调整整个网络的流量,以满足…
- 网络虚拟化是一种网络技术,可以在物理拓扑上创建虚拟网络。基于SDN的网络架构可以更容易地实现网…
第三章 存储虚拟化
- 开放系统的存储类型分为内置存储和外挂存储,其中外挂存储可分为()。 A直连式存储(DAS) B网络接入…
- 根据实现方式,可将存储虚拟化分为()。 A带内虚拟化 B带外虚拟化 C文件虚拟化 D块虚拟化…
- 根据存储虚拟化实现的位置,可将存储虚拟化分为()。 A基于主机的虚拟化 B基于存储设备的虚拟化 C…
- Ceph计算模式是一种完全无中心架构()
- 存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存…
第二章 云计算关键技术
- 虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。 A服务器 B网络 C存储 D操作系统…
- 虚拟技术特性有()。 A分区 B隔离 C封装 D相对于硬件独立
- 虚拟化的益处包括()。 A实现资源最优利用 B实现动态负载均衡 C通过系统自愈功能提升可靠性 D实现…
- 个人PC上使用比较多的虚拟化工具有()。 AVMware Workstation BVirtual Box CXen DKVM…
- 虚拟化是一项技术,而云是一种环境或服务。()
- 虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自…
第一章 云计算简述
- 云计算的服务模式包括()。 A基础设施即服务 B平台即服务 C系统即服务 D软件即服务…
- 云计算的劣势有()。 A信息技术产业进一步合理分工 B严重依赖网络 C数据泄密的环节增多 D风险被集…
- 云计算部署模型有()。 A公有云 B私有云 C混合云 DPaaS云
- 云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS)…
- 云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享…