终于有人把HTTP讲的一清二楚了——缓存篇

存储 存储软件
HTTP协议的缓存是通过6个报文头完成的,通过两层协商使web资源能够不那么频繁地在服务器与客户端之间传递,从而节约了流量,提高浏览速度。以从客户端到服务器的顺序,第一层协商为Cache-Control与Expires;第二层协商为Last-Modified与Etag。

 概述

HTTP协议的缓存是通过6个报文头完成的,通过两层协商使web资源能够不那么频繁地在服务器与客户端之间传递,从而节约了流量,提高浏览速度。以从客户端到服务器的顺序,第一层协商为Cache-Control与Expires;第二层协商为Last-Modified与Etag。

[[331402]]

相关的报文头

Cache-Control

请求/响应报文头,缓存控制字段,也就是用于给资源生命期,是http/1.1引入的属性。Cache-Control的取值可细分为两类,一类是对缓存有直接决定性的值,他们会导致后续的第二层协商被跳过,包括:no-store、public、private;另一类是类似Expires的值,只是规定了有效期,后续的第二层协商不受影响,包括no-cache、max-age=x、s-maxage=x。

Cache-Control的取值如下:

 

终于有人把HTTP讲的一清二楚了——缓存篇

 

形如:

  1. Cache-Control:max-age=0 

Expires

响应报文头,代表资源过期时间,由服务器返回提供,是http1.0的属性,在与Cache-Control共存的情况下,优先级要低。Expires的功能基本与Cache-Control的max-age相似,但它是指定一个过期时间点,而Cache-Control的max-age是指定了过期前的秒数。

形如:

  1. Expires:Fri, 10 Apr 2020 16:30:04 GMT 

Last-Modified

响应报文头,资源最新修改时间,由服务器告诉浏览器。

形如:

  1. Last-Modified:Mon, 23 Mar 2020 18:39:50 GMT 

If-Modified-Since

请求报文头,与Last-Modified相对应,浏览器把服务器最后一次给的Last-Modified返回,服务器将以此进行对比,判断资源是否需要更新。

形如:

  1. If-Modified-Since:Fri, 10 Apr 2020 14:45:24 GMT 

Etag

响应报文头,资源内容唯一标识,由服务器告诉浏览器。

形如:

  1. Etag:58b66ccbe349d0d931df877c00d8101d037243dc 

If-None-Match

请求报文头,与Etag相对应,浏览器把服务器最后一次给的Etag返回,服务器将以此进行对比,判断资源是否需要更新。

形如:

  1. If-None-Match:58b66ccbe349d0d931df877c00d8101d037243dc 

协商流程

以下假定资源已经获取过一次,并且运行在HTTP/1.1环境下,现在进行二次访问。

流程图如下:

 

终于有人把HTTP讲的一清二楚了——缓存篇

 

说明:

  • 客户端是有可能因为缓存原因不向服务器发起任何请求的,图中200状态(from cache)就是这种情况。
  • 服务器根据回传的If-Modified-Since与Last-Modified比对,如果不同则说明这个文件修改过,需要更新。但在这种判断精度是秒,如果是一秒内的改动,就需要进一步对比回传的If-None-Match与ETag的值。
  • 服务器返回304的意思就是不需要重新获取新资源,直接使用本地缓存即可。

缓存多久合适

生存时间(TTL)指令告诉浏览器应该缓存某个资源多久,即Cache-Control或Expires的值。找到给定资源的最佳TTL值并没有完美的科学方法,只能凭经验给出一些指导原则。

指导原则:

  • 纯静态内容,例如图片或带版本的数据,可以在客户端永久缓存;
  • CSS/JS和个性化资源,缓存时间大约是会话(交互)平均时间的两倍;
  • 其他类型资源取决于新数据对旧数据的容忍极限。

浏览器操作对HTTP缓存的影响

 

终于有人把HTTP讲的一清二楚了——缓存篇

 

缓存改进方案

md5/hash缓存:通过不缓存html,为静态文件添加MD5或者hash标识,解决浏览器无法跳过缓存过期时间主动感知文件变化的问题。

CDN缓存:CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。

责任编辑:武晓燕 来源: 今日头条
相关推荐

2021-05-11 09:28:54

开源项目网盘

2022-11-02 10:21:19

MIT健身

2019-04-08 12:14:59

Elasticsear程序员Lucene

2023-08-21 10:13:35

检测AI

2021-06-13 12:03:46

SaaS软件即服务

2021-10-09 00:02:04

DevOps敏捷开发

2022-03-27 20:32:28

Knative容器事件模型

2023-03-29 08:09:51

Spring@Service@Component

2022-05-01 22:09:27

数据模型大数据

2009-10-13 14:47:00

2021-03-25 11:24:25

爬虫技术开发

2020-11-03 07:04:39

云计算公有云私有云

2021-10-17 20:38:30

微服务内存组件

2022-04-27 18:25:02

数据采集维度

2021-10-12 18:31:40

流量运营前端

2021-12-03 18:25:56

数据指标本质

2023-04-13 15:10:58

AI模型

2021-09-10 18:23:14

Hadoop

2020-07-29 09:21:34

Docker集群部署隔离环境

2022-01-05 18:27:44

数据挖掘工具
点赞
收藏

51CTO技术栈公众号