TCP分岔:优化云服务的性能
云服务器问题
对于搜索、电子邮件和社交网络等云服务,非常需要提供高水平的响应性,因此这些服务运行在自己的端系统(包括其智能手机)中
由于用户经常位于远离数据中心的地方,而这些数据中心负责为云服务管理的动态内容提供服务
如果端系统原理数据中心,则RTT(Round-Trip Time,往返时延)将会很大,会由于TCP慢启动潜在地导致低效率的响应时间性能
慢启动:
在慢启动状态,拥塞控制窗口cwnd的值以1个MSS(最大报文段长度)开始并且每当传输的报文段首次被确认就增加一个MSS。因此TCP发送速率起始慢,但是在慢启动阶段以指数增长
1->2->4->8->16->32->64->……
通常,服务器在慢启动期间交付响应要求三个TCP窗口。所以从某端系统发起一条TCP连接到它收到该响应的最后一个分组的时间粗略估计是4*RTT
4*RTT = 用于建立TCP连接的一个RTT + 用于三个数据窗口的三个RTT + 数据中心中处理的时间
对于一个简单的查询来说,这些RTT时延导致客户端显示搜索结果时会有明显的时延。并且在接入网络中可能有较大的丢包,导致TCP重传甚至更大的时延
优化云服务性能的途径
①部署邻近用户的前端服务器
②在该前端服务器利用TCP分岔(TCP splitting)来分裂TCP连接。借助于TCP分岔,客户向邻近前端连接一条TCP连接,并且该前端以非常大的窗口向数据中心维护一条TCP连接。
使用TCP分岔的方法,响应时间大致变为 4*RTTfe + RTTbe + 处理时间
其中RTTfe是客户与前端服务器之间的往返时间,RTTbe是前端服务器与数据中心(后端服务器)之间的往返时间
如果前端服务器邻近客户,则该响应时间大约变为 RTTbe + 处理时间,因为RTTfe极小,并且RTTbe约为RTT
总而言之:TCP分岔大约能将网络时延从4*RTT减少到RTT,极大的改善用户改善的性能,特别是对于远离数据中心的用户。
TCP分岔也有助于减少因接入网丢包引起的TCP重传时延。
Google和Akamai在接入网中广泛利用了它们的CDN服务器,为它们支持的云服务来执行TCP分岔