学堂在线清华大学高级大数据系统(2021春)课后作业题答案
- 通过生成ssh密钥,可以不用密码登陆linux服务器 2021-02-22
- 下列哪个工具可以在多台服务器上同时执行命令? Apscp Bpssh Cpslurp Dpnuke 2021-02-22
- 下列哪些属于分布式文件系统? AHBase BSpark CMapReduce DKFS 2021-02-22
- 在处理数据的能力上,分布式文件系统相比于单机最大的优点是能够并行处理数据 2021-02-22
- 在存储文件方式上,传统文件系统和DFS: A两者都以文件形式存储数据 B前者以文 2021-02-22
- 分布式事务处理的特性包括哪些 A持久性 B隔离性 C原子性 D一致性 2021-02-22
- 分布式系统设计包括 A容错,design for fault B数据/服务可靠性 C多数据中心 2021-02-22
- 下面关于GFS集群的叙述中,正确是 AGFS所有的元数据都存放在chunkserver上 BG 2021-02-22
- GFS中,客户与master的交换只限于对元数据(metadata)的操作,所有数据方面的通信 2021-02-22
- 关于HDFS,下面说法正确的是: AHDFS中的文件以块序列的形式存储 B存储的文件块 2021-02-22
- HDFS中一个文件备份在多个位置的好处有哪些? A改善服务的伸缩性 B提高了容错 2021-02-22
- 对于HDFS中的名字节点,下面说法正确的是: A文件被分割成一个或多个块,被存储在 2021-02-22
- HDFS中典型的块大小是64MB,一个HDFS文件可以被被切分成多个64MB大小的块,如果 2021-02-22
- 以下关于HDFS叙述错误的是? A一个客户端创建一个文件的请求会立即转发到名字 2021-02-22
- 当Job Tracker宕掉时,Namenode会发生什么? A当Job Tracker失败时,集群也随之宕 2021-02-22
- Hadoop集群可以运行的几个模式有: A单机(本地)模式 B伪分布式模式 C全分布式模 2021-02-22
- “jps”命令的用处? A检查Namenode是否正常工作 B检查Datanode是否正常工作 2021-02-22
- jobtracker和tasktracker都可以管理整个系统内的任务jobtracker和tasktrack 2021-02-22
- mapreduce系统中如节点故障、网络不通的问题都可以由系统自动管理 2021-02-22
- 数据读入在mapreduce的那个阶段产生? AMap BReduce 2021-02-22
- Map阶段生成的结果通过网络直接传输给reduce节点 2021-02-22
- 通过自定义partition过程,用户可以自定义每个key将被分配到的reducer 2021-02-22
- 具有同一个key的key/value对可能被分配到不同的reduce上 2021-02-22
- Map, Partition和Reduce阶段都存在对Local Storage的读写 2021-02-22
- Fair Scheduling对小任务更公平 2021-02-22