学习笔记|云计算复习题学习笔记|努力学习云计算

【学习笔记|云计算复习题】一、简答题（四个，一个六分）
1.大数据特点和云计算特点（可简单进行叙述）
（1）大数据的特点 ①数据量大②多样③快速④价值密度低⑤复杂度高
（2）云计算特点 ①超大规模。②虚拟化。③高可靠性。④通用性。⑤高可伸缩性。⑥按需服务。⑦极其廉价。
2.云计算和大数据的关系
云计算与大数据的关系：G=f(x)。x 是大数据，f 是云计算，G 是我们的目标。
云计算是处理大数据的手段，大数据与云计算是一枚硬币的正反面。大数据是需求，云计算是手段。没有大数据，就不需要云计算。没有云计算，就无法处理大数据。
3.原则（数据库数据模型）ACID BASE CAP
ACID，原子性、一致性、隔离性、持久性 BASE：基本可用、软状态、最终一致性 CAP原则：一致性、可用性、分区容错性。
4.云计算按照服务类型分为了哪几类，举个例子
SaaS：将软件作为服务，如：Sal esforce online CRM PaaS：将平台作为服务，Google APP Engine、Microsoft Windows Azure IaaS：将基础设备作为服务，如：Amazon EC2/S3
5.存储虚拟化的作用
存储虚拟化将系统中分散的存储资源整合起来，利用有限的物理资源提供大的虚拟存储空间，提高了存储资源利用率，降低了单位存储空间的成本，降低了存储管理的负担和复杂性。提高了数据的可靠性及系统的可用性。提升系统的潜在性能。满足多种存储应用的需求。
6.分布式锁服务设计目标，算法在chubby中起到的作用
分布式锁服务的设计目标：高可用性和高可靠性、高扩展性、支持粗粒度的建议性、服务信息的直接存储、支持通报机制、支持缓存机制
作用：用于解决分布式系统中的一致性问题。
在Chuby中Paxos算法的实际作用为如下三个过程：
(1)选择一个副本成为协调者(Coordinator)。
(2)协调者从客户提交的值中选择一个，然后通过种被称为acep的消息广播给所有的副本，其他的副本收到广播之后，可以选择接受或者拒绝这个值，并将决定结果反馈给协调者。
(3)一旦协调者收到大多数副本的接受信息后，就认为达到了一致性，接着协调者向相关的副本发送一个commit消息。
二、简述题 40分
1.power Drill 的设计目标和设计的理念，采用的是列存储，和dremel 的区别
设计目标：（1）如何尽可能在查询中略去不需要的数据分块
（2）如何尽可能地减少数据在内存中的占用，占用越少意味着越多的数据可以被加载进内存中处理
区别：
(1)两者的设计目标不同，Dremel用来处理非常大量的数据集(指数据集的数量和每个数据集的规模都大)，而PowerDrill 设计用来分析少量的核心数据集(指每个数据集的规模大，但数据集的数量不多)。
(2)基本设计理念路不同，主要有:
①Dremel 处理的数据来自外存，PowerDrill 处理的数据尽可能地存于内存。
②Dremel未进行数据分区，分析时要扫描所有需要的列; PowerDrill 使用了组合范围分区，分析时可以跳过很多不需要的分区。
③Dremel 数据通常不需要加载，增加数据很方便; PowerDrill 数据需要加载，增加数据相对不便。
2.虚拟机迁移的目的是什么？迁移的步骤写出来
目的：：保证云端的负载均衡，增强系统错误容忍度，当发生故障时，也能有效恢复。迁移服务器可以为用户节省管理资金、维护费用和升级费用。
迁移步骤：
步骤1: 预迁移(Pre-Migration)。主机A打算迁移其上的一个虚拟机VM，首先选择一个目的计算机作为VM的新主机。
步骤2:预定资源(Reservation)。主机A向主机B发起迁移请求，先确认B是否有必需的资源，若有，则预定这些资源; 若没有，VM仍在主机A中运行，可以继续选择其他计算机作为目的计算机。
步骤3:预复制(InterativePre-Copy)。在这一阶段VM仍然运行，主机A以迭代的方式将VM的内存页复制到主机B上。在第一轮迭代中，所有的页都要从A传送到B,以后的迭代只复制前轮传送过程中被修改过的页面。
步骤4:停机复制(Stop-and-Copy)。停止主机A上的VM,把它的网络连接重定向到B。CPU状态和前一轮传送过程中修改过的页都在这个步骤被传送。最后，主机A和主机B上有一致的VM映象。
步骤5:提交(Commitment)。-主机B通知A已经成功收到了VM的映像，主机A对这个消息进行确认，然后主机A可以抛弃或销毁其上的VM。
步骤6:启动(Activation)。启动迁移到B上的VM,迁移后使用目的计算机的设备驱动，广播新的IP地址。
3.第八章openstack主要组件（主要的写出来，主要的功能有哪些，一个）
① Nova.提供计算服务，是 OpenStack 云计算架构的控制器，管理计算资源、网络、授权和扩展要求。② Swift。提供对象存储服务，允许对文件进行存储或检索。③ Glance。提供一个虚拟硬盘镜像的目录和存储仓库，可以提供对虚拟机镜像的存储和检索。④ Keystone。为 OpenStack 上的所有服务提供身份验证和授权。⑤ Cinder。提供块存储服务。⑥ Horizon.提供一个 Web 界面，使用户可以用图形化的方式直观、方便地使用 OpenStac
4.PUE含义
PUE的英文全称是Power Usage Effectiveness，又叫电源使用效率。PUE是评价数据中心能源效率的指标,是数据中心消耗的所有能源与IT负载使用的能源之比。
PUE = 数据中心总设备能耗/IT设备能耗
PUE是一个比率,基准是2,越接近1表明能效水平越好。PUE的值越小，就说明数据中心的电大部分都被服务器、网络设备、存储设备消耗掉。
5.全球最节能的五个数据中心列出来
雅虎“鸡窝”式数据中心（PUE=1.08）、Facebook数据中心（PUE=1.15）、谷歌比利时数据中心（PUE=1.16）、惠普英国温耶德数据中心（PUE=1.16）、微软都柏林数据中心（PUE=1.25）。
5. Paxos算法的举例（例子看懂，考的就是这个）
细看课本 P336-P337。解决的问题：解决了一个分布式系统如何就某个协议达成一致的问题。
6.一致性哈希算法（第八章，在雨课堂上，12分算法要解决的是什么问题
解决问题：解决节点负载均衡及节点变化时任务分配问题
计算找数据：①将服务器节点以 IP 地址作为 Key 值，以一致性哈希方法映射到哈希环上；②在数据存储时以(用户名+文件逻辑位置)作为惟一的 Key 值，映射到哈希环上，并顺时针找到离自己哈希值最近的节点作为实际数据存储的位置；③在发起计算任务时提取计算任务所要操作的数据对应的(用户名+文件逻辑位置)值作为 Key 值，映射到哈希环上，并顺时针找到离自己哈希值最近的节点注入程序并发起计算的节点
7.BigTable①数据模型，②系统架构（画图）（P32）
数据模型：Bigtable 是一个分布式多维映射表，表中的数据通过一个行关键字(Row Key)、一个列关键字(ColumnKey)以及一个时间戳(Time Stamp)进行索引。
系统架构图：

文章图片

学习笔记|云计算复习题

推荐阅读

盐水加白醋泡脚的好处舒服每一晚

床单起球是质量问题吗

马上消费金融额度是多少

上环后图片避孕环是什么样子图片

SpringBoot配置并使用Redis缓存服务

1秒钟等于几毫秒一秒等于多少毫秒多少微秒

罗汉松有哪些品种如何区分

中年之殇

电脑里编程的软件有哪些，目前计算机编程的常用软件有什么

网易怒斥暴雪:离婚不离身暴雪是不是网易的

cfree里面怎么一步一步分析结果

山东良法领导干部知识竞赛题目是什么？领导干部知识题库大全

95和98的暗语是什么意思 98是什么

vxlan 格式分析

如何在手机上连接黑魂2服务器？黑魂2服务器怎么用手机

医生竟会对孕检女子做出这事，女子怀孕去医院检查

崩坏3新版本新增内容汇总 3.4版本相关调整内容前瞻

中国民俗的“鬼节”有哪些？中元节和清明节有什么区分？

张裕干红葡萄酒口感怎么样张裕特选级干红葡萄酒怎么样

看财报|苏酒老二今世缘百亿冲刺第一战：7%的省外营收如何撬动全国化市场？｜看财报