【学习笔记|云计算复习题】一、简答题(四个,一个六分)
1.大数据特点和云计算特点(可简单进行叙述)
(1)大数据的特点 ①数据量大②多样③快速④价值密度低⑤复杂度高
(2)云计算特点 ①超大规模。②虚拟化。③高可靠性。④通用性。⑤高可伸缩性。⑥按需服务。⑦极其廉价。
2.云计算和大数据的关系
云计算与大数据的关系:G=f(x)。x 是大数据,f 是云计算,G 是我们的目标。
云计算是处理大数据的手段,大数据与云计算是一枚硬币的正反面。大数据是需求,云计算是手段。没有大数据,就不需要云计算。没有云计算,就无法处理大数据。
3.原则(数据库 数据模型 )ACID BASE CAP
ACID,原子性、一致性、隔离性、持久性 BASE:基本可用、软状态、最终一致性 CAP原则:一致性、可用性、分区容错性。
4.云计算按照服务类型分为了哪几类,举个例子
SaaS:将软件作为服务,如:Sal esforce online CRM PaaS:将平台作为服务,Google APP Engine、Microsoft Windows Azure IaaS:将基础设备作为服务,如:Amazon EC2/S3
5.存储虚拟化的作用
存储虚拟化将系统中分散的存储资源整合起来,利用有限的物理资源提供大的虚拟存储空间,提高了存储资源利用率,降低了单位存储空间的成本,降低了存储管理的负担和复杂性。提高了数据的可靠性及系统的可用性。提升系统的潜在性能。满足多种存储应用的需求。
6.分布式锁服务设计目标,算法在chubby中起到的作用
分布式锁服务的设计目标:高可用性和高可靠性、高扩展性、支持粗粒度的建议性、服务信息的直接存储、支持通报机制、支持缓存机制
作用:用于解决分布式系统中的一致性问题。
在Chuby中Paxos算法的实际作用为如下三个过程:
(1)选择一个副本成为协调者(Coordinator)。
(2)协调者从客户提交的值中选择一个,然后通过种被称为acep的消息广播给所有的副本,其他的副本收到广播之后,可以选择接受或者拒绝这个值,并将决定结果反馈给协调者。
(3)一旦协调者收到大多数副本的接受信息后,就认为达到了一致性, 接着协调者向相关的副本发送一个commit消息。
二、简述题 40分
1.power Drill 的设计目标和设计的理念,采用的是列存储,和dremel 的区别
设计目标:(1)如何尽可能在查询中略去不需要的数据分块
(2)如何尽可能地减少数据在内存中的占用,占用越少意味着越多的数据可以被加载进内存中处理
区别:
(1)两者的设计目标不同,Dremel用来处理非常大量的数据集(指数据集的数量和每个数据集的规模都大),而PowerDrill 设计用来分析少量的核心数据集(指每个数据集的规模大,但数据集的数量不多)。
(2)基本设计理念路不同,主要有:
①Dremel 处理的数据来自外存,PowerDrill 处理的数据尽可能地存于内存。
②Dremel未进行数据分区,分析时要扫描所有需要的列;
PowerDrill 使用了组合范围分区,分析时可以跳过很多不需要的分区。
③Dremel 数据通常不需要加载,增加数据很方便;
PowerDrill 数据需要加载,增加数据相对不便。
2.虚拟机迁移的目的是什么?迁移的步骤写出来
目的::保证云端的负载均衡,增强系统错误容忍度,当发生故障时,也能有效恢复。迁移服务器可以为用户节省管理资金、维护费用和升级费用。
迁移步骤:
步骤1: 预迁移(Pre-Migration)。主机A打算迁移其上的一个虚拟机VM,首先选择一个目的计算机作为VM的新主机。
步骤2:预定资源(Reservation)。主机A向主机B发起迁移请求,先确认B是否有必需的资源,若有,则预定这些资源;
若没有,VM仍在主机A中运行,可以继续选择其他计算机作为目的计算机。
步骤3:预复制(InterativePre-Copy)。在这一阶段VM仍然运行,主机A以迭代的方式将VM的内存页复制到主机B上。在第一轮迭代中,所有的页都要从A传送到B,以后的迭代只复制前轮传送过程中被修改过的页面。
步骤4:停机复制(Stop-and-Copy)。停止主机A上的VM,把它的网络连接重定向到B。CPU状态和前一轮传送过程中修改过的页都在这个步骤被传送。最后,主机A和主机B上有一致的VM映象。
步骤5:提交(Commitment)。-主机B通知A已经成功收到了VM的映像,主机A对这个消息进行确认,然后主机A可以抛弃或销毁其上的VM。
步骤6:启动(Activation)。启动迁移到B上的VM,迁移后使用目的计算机的设备驱动,广播新的IP地址。
3.第八章openstack主要组件(主要的写出来,主要的功能有哪些,一个)
① Nova.提供计算服务,是 OpenStack 云计算架构的控制器,管理计算资源、网络、授权和扩展要求。② Swift。提供对象存储服务,允许对文件进行存储或检索。③ Glance。提供一个虚拟硬盘镜像的目录和存储仓库,可以提供对虚拟机镜像的存储和检索。④ Keystone。为 OpenStack 上的所有服务提供身份验证和授权。⑤ Cinder。提供块存储服务。⑥ Horizon.提供一个 Web 界面,使用户可以用图形化的方式直观、方便地使用 OpenStac
4.PUE含义
PUE的英文全称是Power Usage Effectiveness,又叫电源使用效率。PUE是评价数据中心能源效率的指标,是数据中心消耗的所有能源与IT负载使用的能源之比。
PUE = 数据中心总设备能耗/IT设备能耗
PUE是一个比率,基准是2,越接近1表明能效水平越好。PUE的值越小,就说明数据中心的电大部分都被服务器、网络设备、存储设备消耗掉。
5.全球最节能的五个数据中心列出来
雅虎“鸡窝”式数据中心(PUE=1.08)、Facebook数据中心(PUE=1.15)、谷歌比利时数据中心(PUE=1.16)、惠普英国温耶德数据中心(PUE=1.16)、微软都柏林数据中心(PUE=1.25)。
5. Paxos算法的举例(例子看懂,考的就是这个)
细看课本 P336-P337。解决的问题:解决了一个分布式系统如何就某个协议达成一致的问题。
6.一致性哈希算法(第八章,在雨课堂上,12分 算法要解决的是什么问题
解决问题:解决节点负载均衡及节点变化时任务分配问题
计算找数据:①将服务器节点以 IP 地址作为 Key 值,以一致性哈希方法映射到哈希环上;②在数据存储时以(用户名+文件逻辑位置)作为惟一的 Key 值,映射到哈希环上,并顺时针找到离自己哈希值最近的节点作为实际数据存储的位置;③在发起计算任务时提取计算任务所要操作的数据对应的(用户名+文件逻辑位置)值作为 Key 值,映射到哈希环上,并顺时针找到离自己哈希值最近的节点注入程序并发起计算的节点
7.BigTable①数据模型,②系统架构(画图)(P32)
数据模型:Bigtable 是一个分布式多维映射表,表中的数据通过一个行关键字(Row Key)、一个列关键字(ColumnKey)以及一个时间戳(Time Stamp)进行索引。
系统架构图:
文章图片
推荐阅读
- #yyds干货盘点# js学习笔记五十BFC规范
- 学习笔记|ES学习笔记
- #yyds干货盘点# js学习笔记四十六实现两栏布局的第二种方式
- #yyds干货盘点# js学习笔记四十一单体模式
- #yyds干货盘点# js学习笔记四十复杂工厂模式
- 上证上市数据可视化分析-清林会员@娇大侠 的学习笔记2
- #yyds干货盘点# js学习笔记三十六事件委托
- electron学习笔记如何通过electron实现图片查看器
- ThingsBoard 学习笔记