vSAN基础知识问答

亦余心之所善兮,虽九死其犹未悔。这篇文章主要讲述vSAN基础知识问答相关的知识,希望能为你提供帮助。
1.   超融合架构的物理服务器是否不再需要磁盘控制器(阵列卡)
答: 需要一个磁盘控制器,但磁盘控制器不需要缓存,如果有缓存,必须设置为非写缓存


2.   如果已有服务器配置有阵列卡,采用什么模式?   JBOD、直通还是Raid0?
答:优先使用直通模式,在DELL服务器上叫HBA模式,实际上就是把所有的硬盘设置为Non-Raid。注意,是所有硬盘都要设置成为个模式。
        如果不能设置为HBA模式或者直通模式,查看兼容性列表,有的服务器可以设置为RAID0.


3.   JBOD和直通有什么区别?
答: JBOD只是简单的将多个磁盘合并成一个大的逻辑盘。直通相当于数据的读写不经过Raid卡,直接读写磁盘。


4.   如果某虚拟机有两个副本,是否对应群集中有两台物理机上跑着相同的两台虚拟机,并且是实时同步数据的?     意思是,它的运行方式是同时只有一台在运行,另一台只是磁盘同步,并不占用CPU内存,还是两台都要占用CPU   内存   存储
答:这个副本只是指数据存储的副本,计算资源仍旧在一台机器上。只需要占用一份CPU和内存。


5. VSAN上的同一个虚拟机的不同副本之间如何同步
答:可以将vSAN的存储技术看成是Raid 1,在早期的版本中只支持Raid1,新版本中,全闪支持Raid5、6。可能是通过组播来传输数据的(郝旺视频说6.6改成单播了)。
VSAN存储流量 例如读和写)----这是网络流量的主要部分。群集中任何主机和其他主机的通信都是通过单播进行的。     来源VSAN权威指南第2版,存疑     是通过组播还是单播传递的?


6.   每个主机的磁盘组的上限是多少?   比如磁盘组的数量,磁盘的容量,缓存盘的大小(vsan 6.7 U2,单个缓存盘最大为600GB)
  答:一台主机上磁盘组最多5个组,每组一个缓存盘,每组1~7个容量盘。
闪存缓存设备必须至少提供虚拟机需要使用的预期存储容量的10%(不包括镜像之类的副本)
例如:群集有100台VM,单个VM使用200GB的空间(没有做RAID,就单个虚拟机硬盘200GB),则缓存空间为100*200GB*10%=2TB。   即最小的缓存空间为,所有虚拟机不算副本的,占用的磁盘空间量的10%。






7. 用作缓存层和容量层的SSD有什么不同的要求,哪种更贵?   应该是缓存层的更贵
  答:用作缓存层的固态硬盘,应该采用更高级的闪存盘。即IOPS更高、TBW数量更大的闪存盘。因为闪存盘的读写比容量盘的要多。


8.   实验: 当缓存盘出现故障后,如何替换?   当容量盘出现故障后,如何替换?是像物理服务器一样,下电,直接更换就行了吗?其实也就是想问,对于一个容量盘,它的副本是存放在集群内的另一台服务器上的一个硬盘,还是多个硬盘? VSAN有什么机制来识别并处理RAID?
答: 缓存盘出现故障,这个磁盘组的所有数据都需要进行迁移;一个容量盘出现故障,将这个容量盘的数据迁移走。然后,更换硬盘。容量盘里存储的数据,跟存储策略相关,比如条带宽带,默认为1,也可以设置为其它;还有磁盘大小,超过255G的虚拟磁盘文件,会分成多个对象进行存放。
        如果设备临时下线,短时间内会恢复,选择确保数据访问;   如果永久下线,则可以选择迁移数据;   如果未做数据迁移,则vSAN会在1小时后,进行数据重建。


9.   每一台物理服务器,是否要求磁盘大小和品牌一致?是强制还是推荐?
答:为了获得更平衡和更好的性能,推荐使用一致的配置






11.   如果每台物理服务器配置的硬盘大小不一样,是否可以组成VSAN
    答:可以。


12.   如何对物理服务器增加硬盘组
答:通过vspere clinet,找到对应的主机,添加即可。


13.   如何对物理服务器某个硬盘组添加空间
答:前提是,这台服务器有空的,未分区,没有数据的磁盘,将其添加到某一个磁盘组即可。一个磁盘组需要1块SSD,最多7块HDD,SSD的容量应该不小于HDD的10%










16. 一个标准交换机,如果用来传输vMotion,是否一定要创建一个端口组? VMkernel端口附加到端口组是起什么作用?
答: 只有vDS上,每一个vMkernel端口才需要和一个端口组绑定;而虚拟标准交换机,则不需要。






17. esxi主机不能与NTP Server同步时间。当把主机的时区调好后,WEB端仍旧慢8小时。如何解决?
答: 有待进一步实验,在嵌套环境下,时间没有问题。








18. service-control --status --all 用来查看Vcenter服务的启动状态,










20. 对于vsan群集,一台机器因故障需要关机检修,那么它的容量层存储的数据应该如何处理?当我们发现有一台机器故障了,系统会自动把故障机器上面的数据同步到其他机器吗?
答:短时间内可恢复的,选择确保数据访问,然后,上线就可以了。   如果超过1小时不能上线的,可以将数据迁移到其他服务器上。   对于有系统资源的群集,在组件或见证缺失的情况下,一小时后进行数据同步。这里应该是说,标记为缺失的,等60分钟后再同步,标记为已降级的,立即进行同步。




21. 一个三台主机的群集,如果关闭了两台,会出现什么情况
答: 虚拟机访问不了。




22.   如果一个群集中的一台物理服务器永久不能上线了,该如何处理,主要是数据和虚拟机?分两种情况:一种是能进维护模式,迁移; 主要指的第二种,即突然间,机器故障了,那么运行在它上面的虚拟机和数据将需要怎么处理?
答: 如果数据没有迁移的话,当群集内资源足够,会在1小时后,自动进行数据重建。




23.   生产环境中,见证服务器部署得多吗?见证主机,在一个包含3-4台物理服务器的群集中,需要部署吗?   延伸群集是否一定要部署见证服务器?
答:在只有一个站点的群集中,不需要部署见证主机。见证组件会自动生成。


24. 在混闪架构vSAN存储中,有三台主机,数据是如何存储的?如何保证esxi01故障后,另两台机器能让数据有副本存储。
答:三台主机的环境中,数据可能是这样存储的,对于某个对象,esxi01存储数据,esxi02存储数据(UUID标识),esxi03存储见证组件。这样,无论哪台机器故障,都不影响数据完整性。


25. 查看并监控VSAN群集的磁盘可用空间


26. 在VSAN群集中使用raid5和Raid6,是否需要在全闪环境下实施?
      答: 需要在全闪环境下,才能使用raid5和raid6。因为这两种raid的写惩罚值高,不适合在混合存储环境下使用。


27. 如何设置vSAN中的RAID级别,条带宽度是什么? 数据是如何存储的,是否把每一台主机(磁盘组)看成一个磁盘,来组成的RAID?
答:在存储策略那里设置Raid级别,可以设置为Raid1、5、6三种。Raid5和6需要在全闪存存储架构下实现,它们比Raid1占用的空间少。
按默认存储策略Raid1,它会将硬盘、主机的主页文件、交换文件、快照文件等信息当成对象来看待。在默认存储策略下,每个对象都有两个副本和1个见证组件。至于数据的存储,需要看条带宽度,条带宽度默认为1,指小于255G的对象文件存放在1个硬盘上。
Raid不是按磁盘来组成的,而是按对象来组成的。单个对象大于255,会分条,不会存储在单个磁盘上。






28. 怎么设置群集的容错方法(RAID级别)和允许的故障数主要级别?它们是如何计算可用磁盘空间的?
  答:通过SPBM策略来管理,默认FTT=1,SW=1,Raid1.使用的Raid1,那么,就意味着只有一半的空间可以供虚拟机使用。即数据有两份副本,可以允许1台虚拟机故障。


答:例如,如果容错方法设置为 RAID-1 (镜像) - 性能且允许的故障数主要级别 (PFTT) 设置为 1,则虚拟机可使用大约 50% 的原始容量。如果 PFTT 设置为 2,则可用容量大   约为 33%。如果 PFTT 设置为 3,则可用容量大约为 25%。
但是,如果容错方法设置为 RAID-5/6 (擦除编码) - 容量且 PFTT 设置为 1,则虚拟机可使用大约 75% 的原始容量。如果 PFTT 设置为 2,则可用容量大约为 67%。有关 RAID 5/6 的详细信息,请参见 《管理VMware vSAN》。


29. 什么是:每个对象的磁盘带数大于1?
              磁盘条带数,指的每个对象存储到几个磁盘上,那么条带数为1,则说明这个数据只存储到了1个磁盘上,或者是1个磁盘组上吗?
虚拟机对象的每个副本所横跨的持久化层的盘的数量,也即每个副本的条带宽度。需要强调的是,VSAN目前主要是靠缓存层的SSD,来确保性能。所有的写操作都会先写入缓存层的SSD,因此增大条带宽度,不一定就带来性能的提升。只有混合配置下的两种情况,能确保增加条带宽度可以增加性能:一是写操作时,如果存在大量的数据从SSD缓存层Destage(刷)到HDD;二是读操作时,如果存在大量的数据在SSD缓存层中没有命中。因为,多块HDD的并发能在这两种情况下提升性能。默认值为 1。最大值为 12。VMware不建议更改默认的条带宽度。




31. 混合环境下,针对一台IO较大的数据库服务器,是否开启读缓存预留会增加DB性能?
答:如果没有明显的性能故障,可以保持默认。如果有性能故障,可以加大条带数或者开启读缓存预留。






34.   FTT设置为1,SW也为1的情况下,有一个4节点的Cluster。那么当Cluster中的一台主机出现故障宕机后,把故障主机下线,这个群集能实现存储的合规性自愈吗?
答: FTT为1的群集,至少需要2n+1台主机,也就是3台健康主机,才能组成一个合规的群集,那么当一个有4台主机的群集,其中有一台故障,还有3台可用,当你把有故障的机器直接下线后(不迁移数据),在1小时后,会自动重建Raid。


35. 如何更换硬盘,比如物理机的IDRAC显示为插槽10故障,需要更换。那么在esxi中,如何知道哪块盘是插槽10对应的硬盘呢?它们的对应关系怎么查看
答: 如果物理机磁盘故障,会闪烁橙色的灯,而在VSAN中,有一个定位符LED,(主机和群集--定位到某台主机--配置--磁盘管理)


36. 如果一台物理机,需要关机2小时进行维护,那么,需要关机以前将数据迁移走吗?   如果没有迁移走,会发生什么情况?如果这台机器永久不能上线了,数据又没有迁移走,那么,需要如何处理,让数据副本能合规。
答:根据王春海老师博客:   如果故障主机是在1小时内恢复,原有数据可以继续使用(如果数据有更新,只需要同步更新数据,vSAN会正确处理这些数据)。




37.   vm kernel端口和端口组要绑定是什么情况?迁移标准虚拟交换机的网络到VDS时,有一个关联端口组,为什么vmkernel端口需要绑定端口组?
答: VDS和VSS的一个不同之处在于,VDS上的每一个VMkernel端口都需要绑定到端口组。


38.   一台分布式虚拟交换机上的不同端口组,是共同使用DVUplinks链路吗?针对vSAN、vMotion、虚拟机网络,是建议创建多个分布式虚拟交换机,还是在同一个vds上创建不同的端口组来分隔流量?
答: 个人认为,如果使用的2端口万兆网络,因为只有两个物理适配器,所以,vMotion、vSAN、虚拟机、【管理网络】会共享这两个网络适配器进行流量转发。使用份额来管理NIOC。




39.   服务器报硬盘10故障,如何在vSAN中对应哪个硬盘?
        可以打开或关闭 vSAN 存储设备上的定位符 LED。打开定位符 LED 时,可以确定特定存储设备的位置。不再需要 vSAN 设备上的可视警示时,可以关闭选定设备上的定位符 LED。




40. 对于已有分区的硬盘,如何清除分区及数据,有没有esxcli命令可以做到?
【vSAN基础知识问答】     找到主机和群集,配置,VSAN,磁盘管理,选择主机以查看可用设备列表。   从显示下拉开菜单中,选择不合格。 从列表中选择一个设备。   单击   清除分区。 单击确定以确认。     这样可以将磁盘的分区信息和数据清除干净,以供vSAN使用。

    推荐阅读