教育部-IBM精品课程建设项目

虚拟化与云计算 天津大学软件学院

试卷

云计算部分_试卷

一、选择题(可以多选):
1、 云架构包含以下哪些?(ACD)
      A. 基础设施层       B. 服务层        C. 应用层       D. 平台层
2、 平台层的功能有哪些?(ABCD)
      A. 开发环境        B. 运行时环境        C. 运营环境       D. 测试环境
3、 应用层的分类有哪些?(BCD)
      A. 网络应用        B. 标准应用       C. 客户应用       D. 多元应用
4、 请指出下列哪些是HADOOP中的组件?(ABD)
      A. Pig       B. Avro       C. Chubby       D. Chukwa
5、 请指出下列哪些是Master的作用?(ACD)
      A. 基础文件系统目录管理与加锁设施层
      B. 存储缓存数据
      C. 数据块创建、复制及负载均衡
      D. 陈旧数据块删除
6、 智慧的云的主题包括?(ABCD)
      A. 新锐洞察       B. 智能运作        C.动态架构       D. 绿色节能
7、 以下不是SaaS的是?(D)
      A. Google邮件        B. Google App Engine        C. Google日历        D. 阿里软件
8、 SaaS成熟度模型的Level2是指 (D)?
      A. 定制开发       B. 高性能       C. 可伸缩性       D. 可配置 9、 高性能的多租户性能优化包括 (ABC)
      A. 数据库层优化       B. 应用层优化       C. Web层优化       D. 传输层优化
10、 数据的可配置性包括 (ABD)
      A. 定制字段       B. 预分配字段       C. 原子划      分D. 名称值对
11、 以下不是应用层服务器层实现水平扩展的方案比较(C)
      A.Session复制        B. Session Sticky       C. 垂直切分       D. 基于Cache的集中式Session
12、 可伸缩性包括 (BCD)
      A. 功能的伸缩       B. 容量的扩展       C. 性能的扩展       D. 系统的伸缩

二、判断题:
1、 HDFS,即GFS,就是分布式文件系统。(F)
2、 MapReduce可以用分布式的方法处理海量数据的一切复杂操作。(F)
3、 HDFS为了做到可靠性创建了多份数据块的复制,并将它们放置在服务器群的计算节点中,MapReduce就可以在它们所在的节点上处理这些数据了。(T)
4、 在MapReduce工作时,map与reduce函数必须都存在,缺一不可。(F)
5、 Combiner函数对于MapReduce处理过程中非常重要,可以节省时间,所以总需要编写Combiner以获得更高的效率。(F)
6、 函数式编程是种编程范型,它将电脑运算视为函数的计算。(T)
7、 Combiner 就是一个Mini Reducer,它在执行Map 任务的节点本身运行,先对Map 的输出做一次简单Reduce,使得Map 的输出更紧凑,更少的数据会被写入磁盘和传送到Reducer。(T)
8、 云计算是面向应用的。(F)
9、 只要是产品就可以使用云计算。(F)
10、 SaaS的规模效应是指每个客户的平均运行和维护成本将降低。(T)
11、 开发云计算产品必须按照一定的渐进步骤进行。(F)
12、 项目面向单一客户,产品面向大众或者行业。(T)

三、简单题:
1、 GFS如何解决单一Master的瓶颈问题?
      尽可能减少数据存取中Master的参与程度
      不适用Master读取数据,仅用于保存元数据
      客户端缓存元数据
      采用大尺寸的数据块(64M)
      数据修改顺序交由Primary Chunk Server完成
2、 简述MapReduce中的容错机制,包括Master故障以及Worker故障。
      Worker故障
            Master 周期性的ping每个worker。如果master在一个确定的时间段内没有收到worker返回的信息,那么它将把这个worker标记成失效
            重新执行该节点上已经执行或尚未执行的Map任务
            重新执行该节点上未完成的Reduce任务,已完成的不再执行
      Master故障
            定期写入检查点数据
            从检查点恢复
3、 列举基础设施层的基本功能(至少五个)
      资源抽象、资源监控、负载管理、数据管理、资源部署、安全管理、计费管理
4、 简述在HDFS中三种节点角色以及各自的作用:
      Namenode
            负责处理来自client端的档案存取要求
            负责储存整个HDFS中各档案之metadata
      Secondary Namenode
            协助Namenode整并并跟新当中的metadata
            当Namenode挂点时,可手动令其做Namenode用
      Datanode
            为data本身存放之处
            听取Namenode的安排,然后让client存取档案
5、 分别编写map函数以及reduce函数完成以下功能:统计一篇文章中的单词频率。

6、 什么是云?
      Datanode云计算是一种计算模式:把IT资源、数据和应用作为服务通过网络提供给用户.(课件中其他课件可以添加进来,只要有这个即可)。
7、 什么是SaaS?为什么软件是服务?
      SaaS指软件即服务。
            a) 软件只有研发成本,没有生产成本
            b) 软件是无形商品,没有损耗的概念
            c) 软件是需要持续的服务、维护和升级,才能真正发挥其内在的价值
8、 实现多租户的技术以及比较其优缺点

9、 什么是可配置性?什么是功能可配置性?
      兼顾多方的共性和个性化需求。按需使用,按需付费,1.允许不同的用户购买不同的功能集合,同时在线使用。2.同一个用户在不同时期,有不同需要,可以选择那个的功能集合并为之付费。
10、 数据库层的水平扩展的方案比较


四、综合题:
请简述Amazon EC2、Google App Engine、Microsoft Azure以及Yahoo Hadoop之间的异同。