简述http协议缓存原理及常用首部讲解

一、缓存概念
1、缓存的类型 页面缓存

  • 页面缓存是将动态页面直接生成静态的页面放在服务器端,用户调取相同页面时,静态页面将直接下载到客户端,不再需要通过程序的运行和数据库的访问,大大节约了服务器的负载。每次访问页面时,会检测相应的缓存页面是否存在,若不存在,则连接数据库得到数据渲染页面并生成缓存页面文件,这样下次访问的页面文件就发挥作用了。
浏览器缓存
  • 浏览器缓存机制,主要就是HTTP协议定义的缓存机制(如 Expires; Cache-control等),还包括非HTTP协议定义的缓存机制,如使用HTML Meta标签。
数据缓存
  • 数据缓存是最灵活的一种缓存。但是需要在代码中额外的步骤才能使用。当所有用户都在发布信息的时候,用户发布信息后想立即看到这些数据,就需要数据缓存来实现。
  • 目前的实现分为两种方式:
    1.内容缓存:将缓存数据存放在服务器的内存空间中。
    2.文件缓存:缓存数据存放在服务器的硬盘空间中
数据库缓存
  • 数据库的缓存一般由数据库提供,可以对表建立高速缓存。数据库中,用户可能多次执行相同的查询语句,为了提高查询效率,数据库会在内存划分一个专门的区域,用来存放用户最近执行的查询,这块区域就是缓存。
反向代理缓存
  • 就像代理服务器缓存和浏览器缓存一样,我们同样可以讲内容缓存在反向代理服务器上,所有缓存机制的实现仍然采用HTTP/1.1协议。
2、程序的运行具有局部性特征: 时间局部性:一个数据被访问过之后,可能很快会被再次访问到;
空间局部性:一个数据被访问时,其周边的数据也有可能被访问到
3、缓存应用特点 提高cache缓存命中,
增强热区局部性;
改善提高时效性:
在缓存空间耗尽时使用LRU(最近最少使用算法);
过期:缓存清理
4、缓存命中率:公式hit/(hit+miss) (0,1)
页面命中率:基于页面数量进行衡量
字节命中率:基于页面的体积进行衡量
查询命中率:基于数据查询数量进行衡量
缓存与否:
私有数据:private,private cache;
公共数据:public, public or private cache;
二、缓存有效性判断机制和对应首部:
1、Expires过期时间控制法
  • Expires是HTTP 1.0所提供的控制字段,是web服务器响应报文的字段,用于告诉客户端浏览器在Expires所指定的过期时间到来前,浏览器可直接从浏览器本地缓存中读取缓存响应请求,无需再次发送请求到服务器。
  • 而HTTP/1.1则使用相对时间控制法,通过Expires定义同一时区过期:

    简述http协议缓存原理及常用首部讲解
    文章图片
    示例
    如图上述图中,Data表示请求报文发送的时间,而Expires则表示缓存在此日期到来前都是有效的。因此客户再次访问这类资源时,浏览器会直接从本地缓存中响应。
2、Cache-control Cache-Control和Expires的作用差不多,都是用于指明当前资源的缓存有效期。通知客户端浏览器是从本地缓存中直接读取数据还是说重新发送请求到服务器中获取数据。Cache-control提供了多种资源有效期的选择,其优先级高于Expires。下面我们来一起看下Cache-control可使用的值。
prublic:用于指示客户端请求的资源科被任何缓存区所缓存。


private:用于指示对于当前某个用户的全部或部分响应信息,不能被共享缓存区所缓存处理。 简述http协议缓存原理及常用首部讲解
文章图片
image.png
no-cache:指示说明当前带请求或响应的消息不能被缓存。
no-store:用于防止重要的信息被无意的发布,在请求消息中附带此Cache-control值将使得请求和响应消息都不能使用缓存。


max-age:在响应报文中max-age通常用于告知客户端当前请求资源的缓存有效期的最大值(以秒为单位);而在请求报文中通常使用max-age=0,表示客户端向服务器发送请求确认,确认当前请求的资源是否有修改,如果没有则直接使用本地缓存,否则从服务器中获取请求资源。 简述http协议缓存原理及常用首部讲解
文章图片
image.png
min-fresh:要求缓存服务器返回至少还未过指定时间的缓存资源。
max-stale:该指令表示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。
3、Last-Modified/If-Modified-Since
Last-Modified/If-Modified-Since需要配置Cache-control一起使用。
Last-Modified:web服务器在响应请求时,会使用此字段来告诉浏览器,其请求的资源的最后修改时间。
If-Modified-Since:当资源过期时或者请求中带有Cache-Control:max-age=0,并且发现该资源的缓存具有Last-Modified声明,则向web服务器发送请求时带上If-Modified-Since。web服务器收到请求后,将比较If-Modified-Since与被请求资源的最后修改时间。如果最后修改时间比If-Modified-Since的值更新,说明资源已经被改动过,服务器会响应此请求的资源,响应状态码为200;否则,说明资源没更新,则响应HTTP 304,告知浏览器可继续使用本地缓存。

简述http协议缓存原理及常用首部讲解
文章图片
示例
4、Etag/If-None-Match Etag:web服务器响应请求时,告诉浏览器当前资源在服务器的唯一标识(生成规则由服务器决定)。Apache中,ETag的值,默认是对文件的索引节(INode),大小(Size)和最后修改时间(MTime)进行Hash后得到的。
Etag 可以解决 Last-Modified 无法解决的一些问题。

简述http协议缓存原理及常用首部讲解
文章图片
示例 三、条件请求优先级
1、一些文件也许会周期性的更改,但是他的内容并不改变(仅仅改变的修改时间),这个时候我们并不希望客户端认为这个文件被修改了,而重新GET;
2、某些文件修改非常频繁,比如在秒以下的时间内进行修改,(比方说1s内修改了N次),If-Modified-Since能检查到的变化时秒为单位的,这种修改无法判断。因此需要Etag来判断。
3、某些服务器不能精确的得到文件的最后修改时间;
如果Last-Modified与ETag一起使用时,服务器会优先验证ETag。而Last-Modified的优先级又高于Expires
也就是优先级:ETag>Last-Modified>Expires
If-None-Match:当资源过期时或者请求报文带有Cache-Control:max-age=0时,并且发现该资源的缓存具有Etage声明,则再次向web服务器请求时带上头If-None-Match (Etag的值)。web服务器收到请求后发现有头If-None-Match 则与被请求资源的相应校验串进行比对,决定返回200或304
总结:条件式请求有两个逻辑
  • Last-Modified/If-Modified-Since:自从缓存文件时间戳,基于文件的修改时间戳来判别;缺点精度不够,但优先使用
  • Etag/If-None-Match:基于文件的校验码来判别;缺点比较耗资源
    最好是合并使用,客户端到缓存过期使用,缓存到服务器用校验码判别
【简述http协议缓存原理及常用首部讲解】参考文献:https://www.jianshu.com/p/e948549f34ae
https://blog.csdn.net/zhengwish/article/details/51497164

    推荐阅读