网络编程HTTP协议进化史
一、Http报文格式
具有约定格式的数据块
请求报文 request
-
状态行:本次请求的请求方式(post get)资源路径url http 协议的版本号,中间用空格划分
本次请求的请求方式(post get)资源路径url http 协议的版本号,中间用空格划分
- 请求头:requestHeaders,用户代理信息cookie信息,客户端所接受的数据编码格式信息
- 请求正文:requestBody 数据
- post中以key-value 的形式存储
- get中这个部分是没有的
红框:固定空白行,HTTP约定了数据在传输的时候请求头和请求正文必须空出一行,用来判定请求头的内容是否被读取完了
当客户端发送请求之后根据请求头中的状态行是post还是get做出响应,然后把结果返回给客户端,
响应报文 response
- 状态行:http协议以及版本,状态码,statecode 中间用空格隔开
- 响应头:发送响应的时间,回应数据的格式,数据的长度等
- 响应正文:响应具体的数据,responseBody
由固定的传输格式形成了http协议,http是基于TCP传输的应用层协议,http只是约定了数据的格式,传输还是要靠TCP
二、HTTP协议进化史
Http1.0
Http1.0版本有个致命的问题,TCP的链接无法复用,每次建立一个Http 请求,都需要建立一个TCP链接,TCP链接是需要3次握手的
Http1.1
Http1.1为了解决这个问题约定了47种headers,其中包括了Connection:keep-alive 允许TCP链接数据发送完了之后继续存活一段时间,允许一段时间内继续复用这个链接,多次请求共用这次链接,具体复用时间长短由服务器控制,一般在15s 左右,这个keep-alive相当于线程池的keepAliveTime 当线程工作完成之后,线程存活一段时间,从而让发出的请求尽早的得到响应,跟这里同一个道理;
除此之外还引入了更多的缓存策略,比如Entity tag, lf-Unmodified-Since, If-Match,cache-control。所以在这个版本可以更加灵活的控制缓存数据;
还引入了range 这个headers 字段,允许只请求服务器资源的某一个部分,来达到带宽优化的问题,当客户端有了一部分资源之后只需要向服务器请求剩下的资源即可,这就是文件断点续传的基础
Http1.1是对Http1.0功能的扩展以及对已知问题的优化
存在的问题:
- *对于不同域名数据传输依旧是需要重新建立新的TCP连接,或者同一个域名在15s以后无法复用,断开了,接下来的请求也是需要重新创建连接
- Http所有传输内容都是明文,http无法验证对方身份,无法保证数据的安全性
- http请求报文当中header部分携带的数据内容过大,比如cookie 数据,这样在一定程度上增加了传输的成本
HTTPS
它的网络模型就是HTTP+SSL
也就是在http上面套了一层可以处理加密信息的模块,服务端和客户端的传输都可以通过SSL 来检测和校验
SSL 如何加密跟解密的?
- 客户端向服务器端发送请求,此时客户端还会把它所支持加密的协议算法种类以及版本发送给服务端,服务端接收到请求之后会从客户端支持的加密协议中选择一个合适的,并且向客户端确认,之后的会话通过这种方式来加密
- 于此同时还会把服务器的公钥证书发送给客户端,这个证书包含了公钥,颁发机构,过期时间等一些信息,采用了https协议的服务器,必须有一套数字证书的,这套证书可以自己制作,也可以向组织申请
- 客户端在收到这个证书之后进行有效的验证,这个验证是由SSL 来完成的,首先验证证书的公钥是否有效,然后颁发机构,证书的过期时间。如果证书有异常,就会弹出一个安全警告。如果证书有效,此时就会生成一个随机数,也就是本次会话密钥,然后用公钥来加密,为了安全,不能让第三方知道本次会话密钥,当服务端通过数字证书的私钥才能够去解密,才能拿到本次会话的数据内容
- 把加密后的会话密钥传送给服务端
- 服务端使用私钥来解密会话密钥,服务端拿到会话密钥之后,就将想给返回客户端的response 进行加密
- 将加密后的response返回给客户端
- 客户端通过之前生成的会话密钥进行解密
存在的问题:
由于加密导致传输慢,这个可以接受,毕竟互联网安全才是第一位的
免费签发证书机构 Let’a Encrypt
SPDY
基于TCP的应用层协议
目标是为了优化http协议的性能,通过数据压缩以及多路复用,以及请求优先级等多种技术缩短接口的等待时间,并且提高了数据传输的安全性,是对http协议的增强,综合了http和https
特性:
- 多路复用TCP通道,减少TCP连接握手的时间,降低http的高延时,提供了网络的响应速度
- 允许请求设置优先级,重要的请求可以得到优先的响应,比如在开发线程池组件的时候给每个任务设置优先级
- 对http请求报文的headers数据进行压缩,http1.0和http1.1可能出现重复和冗余的数据并且在1.1的时候只能压缩body的数据,spdy 可以对headers 进行强有力的压缩,能够在一定程度上提高传输的效率
- 同样基于SSL的安全传输,也能提高数据传输的可靠性
使用SPDY 的大厂:阿里,同时在使用https
缺点:
只能使用文本格式的数据传输
HTTP 2.0
在SPDY 基础上开发了2.0,对http协议的又一次加强升级
- 对数据报文重新定义了数据传输格式,摒弃了文本传输,采用了二进制格式,文本格式在各个平台的多样性,二进制只有0和1的组合。变成了一个个的数据帧,这些数据帧可以在不同的通道中交错的发送
- TCP 通道多路复用
- 支持降级成明文传输,SPDY 强制使用SSL/TLS
- 都对header 部分进行了压缩,http2.0采用HPACK专有算法进行压缩消息头
增加了二进制分帧层,在分帧层上面http2.0会将所有的传输信息,分为更小单位的消息体,称为帧,Frame ,http1.1 1.0的消息头都会被封装到header frame 里面,而body部分会被封装到Date Frame 里面。http2.0可以在共享TCP链接基础上同时的发送请求和响应,请求发送的时候会将数据帧交错的发送出去,原本一种请求在一个TCP 链接里面,在http2.0里面原本的数据被拆分成多个数据帧,这些数据帧可以在不同的TCP通道中交错的发送,通过这种技术http2.0性能得到极大的提高
http2.0速度的极大提升主要是因为数据编码格式的重新定义,多路复用,还有请求头数据的压缩
http2.0使用的大厂 阿里 腾讯 百度
Http3.0(还未商用)
最大改变使用UDP 作为传输协议
- 由于TCP 是面向连接的,每次连接需要3次握手,因此http存在高延迟的问题,UDP是无连接的,不需要三次握手
- 优化了失败重传
- 流量控制
在Android P上已经禁止了明文传输,在网络优化时可以采用SPDY 和http2.0或者headers 字段做断点续创缓存控制,链接保持以提高网络的响应速度