php高效处理百万级数据 php千万级数据怎么优化( 二 )


3. IP负载均衡
IP负载均衡服务是工作在网络层(修改IP)和传输层(修改端口,第四层) , 比起工作在应用层(第七层)性能要高出非常多 。原理是,他是对IP层的数据包的IP地址和端口信息进行修改,达到负载均衡的目的 。这种方式,也被称为“四层负载均衡” 。常见的负载均衡方式,是LVS(Linux Virtual Server,Linux虚拟服务),通过IPVS(IP Virtual Server,IP虚拟服务)来实现 。
在负载均衡服务器收到客户端的IP包的时候,会修改IP包的目标IP地址或端口 , 然后原封不动地投递到内部网络中,数据包会流入到实际Web服务器 。实际服务器处理完成后,又会将数据包投递回给负载均衡服务器,它再修改目标IP地址为用户IP地址 , 最终回到客户端 。
上述的方式叫LVS-NAT,除此之外,还有LVS-RD(直接路由),LVS-TUN(IP隧道),三者之间都属于LVS的方式,但是有一定的区别 , 篇幅问题,不赘叙 。
IP负载均衡的性能要高出Nginx的反向代理很多,它只处理到传输层为止的数据包,并不做进一步的组包,然后直接转发给实际服务器 。不过 , 它的配置和搭建比较复杂 。
4. DNS负载均衡
DNS(Domain Name System)负责域名解析的服务,域名url实际上是服务器的别名 , 实际映射是一个IP地址 , 解析过程,就是DNS完成域名到IP的映射 。而一个域名是可以配置成对应多个IP的 。因此 , DNS也就可以作为负载均衡服务 。
这种负载均衡策略,配置简单,性能极佳 。但是 , 不能自由定义规则 , 而且,变更被映射的IP或者机器故障时很麻烦,还存在DNS生效延迟的问题 。
5. DNS/GSLB负载均衡
我们常用的CDN(Content Delivery Network,内容分发网络)实现方式,其实就是在同一个域名映射为多IP的基础上更进一步,通过GSLB(Global Server Load Balance,全局负载均衡)按照指定规则映射域名的IP 。一般情况下都是按照地理位置,将离用户近的IP返回给用户,减少网络传输中的路由节点之间的跳跃消耗 。
“向上寻找” , 实际过程是LDNS(Local DNS)先向根域名服务(Root Name Server)获取到顶级根的Name Server(例如.com的),然后得到指定域名的授权DNS,然后再获得实际服务器IP 。
CDN在Web系统中,一般情况下是用来解决大小较大的静态资源(html/Js/Css/图片等)的加载问题 , 让这些比较依赖网络下载的内容 , 尽可能离用户更近,提升用户体验 。
例如 , 我访问了一张imgcache.gtimg.cn上的图片(腾讯的自建CDN,不使用qq.com域名的原因是防止http请求的时候,带上了多余的cookie信息) , 我获得的IP是183.60.217.90 。
这种方式,和前面的DNS负载均衡一样,不仅性能极佳,而且支持配置多种策略 。但是,搭建和维护成本非常高 。互联网一线公司,会自建CDN服务,中小型公司一般使用第三方提供的CDN 。
Web系统的缓存机制的建立和优化
刚刚我们讲完了Web系统的外部网络环境,现在我们开始关注我们Web系统自身的性能问题 。我们的Web站点随着访问量的上升,会遇到很多的挑战,解决这些问题不仅仅是扩容机器这么简单 , 建立和使用合适的缓存机制才是根本 。
最开始 , 我们的Web系统架构可能是这样的,每个环节 , 都可能只有1台机器 。
我们从最根本的数据存储开始看哈 。
一、 MySQL数据库内部缓存使用
MySQL的缓存机制,就从先从MySQL内部开始,下面的内容将以最常见的InnoDB存储引擎为主 。

推荐阅读