服务质量的艰难历程:从异步传输模式到内容网络、边缘计算和分布式互联网治理

1. 20世纪80年代:第一步

早在20世纪80年代,当互联网还基本上是一个研究网络时,人们认为未来的全球网络技术将通过电话网络向未来多业务网络的演进而从电信领域产生。20世纪80年代末,以同步数字体系/同步光网络(SDH/SONET)形式出现的数字传输基础设施推动了综合业务数字网(ISDN)的引入,这是语音、窄带视频和数据集成基础设施的最初形式,目标是在20世纪90年代进一步发展为宽带ISDN。这一演进,或者更准确地说是变革,将通过普遍引入异步传输模式(ATM) [1]作为基于分组的底层网络技术来实现。

ATM背后的关键设计原则是通过端到端网络信令为每个微流(即应用到应用的流)预留网络资源。这种方法起源于公共交换电话网(PSTN),其中七号信令系统(SS7)为每个方向预留一个64Kbps信道,共两个信道,用于传输电话呼叫的编码语音。在PSTN中,微流资源预留方法运行良好,因为每个交换机处理的资源类型完全相同,i.e.,每个信道恰好为64Kbps。然而,在基于ATM的多业务网络环境中,应用可根据其需求预留任意数量的带宽,交换机则必须处理大量差异极大的资源分配。尽管当时在此领域进行了广泛的研究和开发工作,但尚未明确证明核心网络开关能够成功应对由具有广泛不同特性的应用所提出的潜在极高数量的并发资源预留。

2. 20世纪90年代‐2000年代中期:尝试扩大规模(但大多失败)

20世纪90年代初万维网(WWW)的出现是改变网络格局的关键演进,推动互联网发展成为全球多业务网络以及当前信息基础设施的基础。此后,人们开始关注如何在互联网协议(IP)上提供具有保证服务质量/用户体验质量(QoS/QoE)的服务,最初的尝试形成了综合服务(IntServ)框架[2],该框架被设想为一种相对轻量级的类异步传输模式(ATM)的IP技术。其采用的方法是仍通过信令为每个微流预留资源,方式类似于异步传输模式,因此在核心网络路由器上面临相同的可扩展性问题,最终未能得到部署。20世纪90年代末至2000年代初,更具可扩展性的区分服务(DiffServ)框架[3]应运而生,该框架通过对有限数量的服务类别进行离线配置来实现资源预留,即本质上针对聚合宏流。在区分服务中,客户事先与服务提供商建立服务等级协议(SLAs),然后提供商根据这些服务等级协议的技术特性,即服务等级规范(SLSs)[4],对下一阶段的网络进行配置。该框架获得了一定程度的应用,并沿用至今,主要面向企业客户,但这也是一项服务质量/用户体验质量(QoS/QoE)技术,其实际应用范围并未达到最初预期的广泛程度。

在20世纪90年代后期,通过广泛使用网络流量工程[5],服务质量/用户体验质量的研究方向和探索发生了显著变化。其目标不再是预留资源以向愿意支付溢价的用户/应用提供所需的服务质量,而是通过流量工程更高效地利用整体网络资源,从而改善端到端延迟,消除丢包,并有效提升用户体验质量。对于所有应用而言,即提供“优于尽力而为”的服务。这得益于多协议标签交换(MPLS)的出现和广泛部署,MPLS支持从入口到出口节点的显式路由,并可采用多条路径,从而通过合理的路由规划均匀分布流量,实现相对均匀的最大链路利用率(MLU)。这些基于预期流量(即流量矩阵)在下一个预配置周期内的流量工程路由方案,是根据实际测量数据生成的,由此催生了NetFlow等技术的出现,该技术用于监控、报告并存储服务提供商网络中的所有流。

从2000年代中期开始,视频流逐渐主导互联网,并很快成为整体流量中最大的组成部分,且持续不断增长,这一趋势至今仍在延续,并预计将以指数级继续增长。为了以更低的延迟和更少的网络链路流量成本传输视频内容,内容分发网络(CDNs)应运而生。CDNs将内容对象放置在网络和应用的边缘多个位置,并提供重定向,使用户能够访问距离其最近的内容副本。该技术为终端用户提供了某种程度的服务质量/用户体验质量(QoS/QoE),更重要的是,在持续下载/流式传输的视频内容数量巨大的情况下,它使得全球网络负载保持在可管理范围内。与此同时,针对基于视频流元数据的网络状态进行网络内适应以及媒体感知路由的研究也在并行开展。

3 当前实践:网络难以驾驭——将内容更靠近用户以降低延迟

鉴于互联网越来越多地被用于多媒体对象访问,2000年代中后期的研究人员独立提出了类似的想法,将内容感知路由和未来的CDNs推向一个激进的结论:他们建议使网络成为一个全球CDN,以进行路由基于内容ID而非网络地址来传输数据包[8],[9],[10]。由于内容被显式寻址(而不是通过IP地址寻址通信通道的终端主机),内容可以在任何位置缓存,后续用户可以从较近的位置获取热门内容,从而提升服务质量/用户体验质量[11],[12],[13]。

这形成了以信息为中心的网络(ICN)([14],[15])的研究领域,该领域至今仍保持强劲发展势头。然而,考虑到当前全球互联网对IPv4(以及部分IPv6)的巨大投入,目前仍难以设想实现全球范围的网络层部署。在ICN网络内缓存[16],[17],[18],[19]以及ICN范式支持的原生多播[9],[10]方面,大量研究工作已表明其在视频传输等场景下能显著改善服务质量/用户体验质量。这一事实,加上内容发布者在及时视频传输成本不断上升和移动性支持[20],[21]方面所面临的压力,预计将推动ICN更接近实际部署[22]。关于ICN网络内缓存的研究还拓展到了其他领域,例如电信CDNs[23],其部分技术也可能应用于5G和物联网(IoT)。

另一种大约在2010年出现、在某种程度上与服务质量/用户体验质量相关的技术是软件定义网络(SDN)[24]。SDN的主要目标是将控制功能从数据平面分离,并将其移至网络设备之外的逻辑集中式控制器,从而提供可编程性、降低成本,并支持网络技术的便捷演进和创新[25]。这在一定程度上类似于公共交换电话网智能网(IN),后者也将控制功能置于网络外部的集中式计算节点,并将智能呼叫信令重定向至该节点。SDN将类似的原则应用于分组网络,i.e.,固定互联网以及未来的5G蜂窝网络。控制器在路由器/交换机中安装的转发规则用于指导数据平面分组转发,但还可能存在更为激进的方法,即根据控制器对网络状态的视图,动态地以每流为基础安装转发规则。总体而言,SDN有望提供近实时管理网络的能力,并实现对网络的细粒度控制。

从而实现更好、更细粒度的资源管理,这将带来更优的服务质量/用户体验质量。

4. 新的期望与需求:移动边缘与雾计算

在过去三四十年中,随着对通信网络中服务质量/用户体验质量(QoS/QoE)的追求,支持互联网的计算模型也发生了相应的转变。这一转变主要受到计算技术、计算机架构领域的技术进步,但最重要的是网络虚拟化的推动。最近在追求服务质量/用户体验质量(QoS/QoE)方面出现的最新演进是移动边缘计算(MEC)[27],[28],[29],大约始于2015年,最早的相关研究在2009[26]就已出现。尽管目前尚未就核心互联网基础设施达成广泛认可且可用的服务质量/用户体验质量(QoS/QoE)解决方案,但物联网(IoT)领域的发展正不断提高要求。从虚拟现实和增强现实到自动驾驶汽车,再到用于货物配送和空中出租车的无人机(UAV)集群等各类应用,都将以某种形式需要与基础设施进行通信。这些应用场景所要求的响应时间在往返时间(RTTs)上仅为几毫秒量级。鉴于这些应用在计算、硬件和软件方面已具备实现条件,网络领域正面临越来越大的压力,亟需在通信相关的标准和协议方面取得进展。

在过去的二十年左右,我们目睹了互联网内容交付和以应用为中心的计算持续向中心化发展的趋势。这种中心化推动了大规模数据中心(通常称为“云”)的发展,目前90%的用户请求最终都在这些数据中心中执行。尽管这一趋势很好地服务于当前我们所熟知的互联网需求,并符合规模经济的要求,但对于未来的应用而言显然已不再适用。目前正在设计、标准化和开发中的5G架构将对响应速度在亚毫秒级延迟的应用的需求。此类应用无法容忍被封闭在遥远数据中心内的集中式计算。

边缘/雾计算已被提出作为对云的补充范式[27],[29]。其核心思想是将云去中心化为多个小规模的计算设备,或称为云节点(范围从微型数据中心到Wi‐Fi接入点,再到树莓派),我们将其称为“计算节点”。

移动边缘/雾计算范式在某种程度上与90年代的缓存时代具有相似性。正如过去从服务器作为静态内容的唯一提供者转向代理缓存,以及近年来发展为无处不在的网络内缓存(在信息中心网络领域),边缘/雾计算范式正试图将计算推向更靠近用户的位置。总体而言,部署代理缓存的主要目的是减少:i)终端用户的响应延迟,ii)核心网络流量,以及iii)服务器负载。转向边缘/雾计算范式后,我们可以合理地认为其动机和期望大致相同:将网络功能和面向用户的应用推向用户附近,以减少响应延迟、网络流量,例如,在需要上传大量数据至云[30],[31]的情况下,减轻数据中心日益增加的压力[32]。

有趣的是,相较于代理缓存功能,在边缘计算场景下还有一个会严重影响服务质量(QoS)的维度需要解决。即,当前的DNS基础设施无法动态处理解析功能(i.e.,计算功能—性)。这些功能可能在几秒内被实例化或销毁,且需要在毫秒级完成解析和执行,而传统的DNS条目更新速度则慢几个数量级,i.e.,通常以分钟为单位,甚至更长。一种以计算为中心的范式再次展现出多个优势:将功能打包在轻量级虚拟化环境(e.g.,单体内核[33],[34])中,并使用独立ID进行显式命名——类似于前面讨论的内容对象。请求携带函数的输入参数,虽然函数是无状态的,这意味着它们可以在任何网络节点上执行(参见无服务器架构[35])。

新型以计算为中心的架构需要满足在网络边缘执行的网络功能的快速解析需求[36],[37]。此类架构的最终目的是减少对往返时延成本较高的类DNS解析服务的通信需求,从而提升终端用户和应用服务质量。

5. 新的挑战:消除信任

在分布式边缘与雾计算的情况下,还有一个额外的因素值得提出,它可能会显著影响系统在服务质量/用户体验质量方面的性能:互联网基础设施治理,换句话说,由谁拥有和管理边缘计算基础设施,以及在使用互联网服务时应信任谁当使用互联网服务时[38]。在当前互联网格局中,基础设施由谷歌、微软、亚马逊、脸书、阿卡迈等科技巨头组成的寡头垄断企业以不透明的方式拥有和运营。尽管到目前为止,这种模式在性能方面表现相对良好¹,但类似的模式是否适用于分布式MEC网络仍有待商榷。

首先,从技术上管理少数集中式计算中心(并为其提供相对可接受的服务质量)较为容易,但要管理和维护数十亿个计算节点几乎是不可能的。其次,当基础设施停留在封闭环境中时,创新将遭遇难以逾越的瓶颈。第三,令人尴尬的是,在经历了四十年的深入研究、工程与开发之后,一旦与集中式基础设施的连接中断,最基本互联网功能就会崩溃²。相反,可以合理地认为,移动边缘计算基础设施将负责关键任务应用,例如驾驶我们的汽车,将由众多更接近终端用户的参与者来运行。显然,服务质量需要成为关注的焦点,因为它将很快负责管理我们生活中关键且在许多情况下关乎生命安全的应用,例如,自动驾驶。

去中心化意味着从基础设施提供商处移除信任。无论是否信任科技巨头,使用其基础设施即意味着默许他们会尽力提供高性能、保障安全性并维护隐私。转向去中心化的分布式治理模型,并为了实现可接受的服务质量,用户将不得不信任未知的运营商/公司,这实际上会移除过去20年互联网生态系统中的信任,而当时正是这些科技巨头不断壮大。

密码学和分布式账本技术(即区块链)的最新进展在此刻可以发挥重要作用。分布式账本能够在不可变的历史记录中以无需信任的方式跟踪和记录任意两个实体之间的任何交易。安全性可以得到提升,隐私也可以得到保障。尽管当前区块链系统存在性能问题[41],[42](目前这些问题已受到广泛关注,并有望在不久的将来得到解决),但关键在于:计算基础设施可以分布到数十亿个计算节点,由任何能够在此基础上进行创新的人来运营,同时治理可以实现去中心化,提供比当前基础设施更高水平的安全性和隐私保护。[43]

此类发展对服务质量的影响巨大。在无需信任的节点之间进行分布式计算,能够推动普适计算的发展,使得地理位置上较近的位置中的任何空闲计算周期都可以被利用来执行对延迟敏感的应用。反过来,到达计算位置的延迟降低,在计算位置内的执行时间保持在最低水平,并且保证应用能够及时得到响应。

6. 一个及时的用例:自动驾驶汽车

汽车行业的一大变革是引入自动驾驶,这将严重依赖及时信息和结果计算(例如,交通流协调以避免事故)。预计每辆汽车每天将产生约4000吉字节的数据,³这一数字无疑将对未来网络构成挑战。

自动驾驶依赖于关于周边环境的非常详细的地图以及机器学习,以避免碰撞。车辆系统将配备传感器(e.g.,前后盲点摄像头、雷达系统或亮度传感器)来监测环境。自动驾驶汽车将相互之间以及与基础设施组件通信,以共享感知信息。

车辆自身处理如此大量的数据可能无法实现,而将所有数据上传到云则需要过高的带宽[30],但更重要的是会导致无法接受的往返延迟[44],[45]。

相比之下,支持网络内功能执行的网络可以在位于网络边缘且具备足够计算能力的节点上聚合车载传感器数据。在更接近所需地理位置的位置处理数据,可以降低延迟并减轻核心网络的负载。边缘网络功能用于处理输入信息,并计算周边环境的详细地图。返回的结果可供所有相关车辆重复使用。

当车辆发送计算结果请求时,网络会协调该计算。此过程包括将任务拆分为子计算,调度并分配这些子任务到合适的执行位置,并将中间结果整合为最终回复。

然而,要部署这样的系统,一个高效安全的支付系统至关重要,并可能决定其未来的成功。在一个开放、非封闭的花园云计算环境中,执行节点由多个利益相关者拥有,而请求方并不知道其任务将由哪些节点执行,因此无法提前确定支付对象。此外,即使知晓这些信息,他们也不愿为尚未完成或未经验证的任务提前付款。另一方面,接收请求的执行节点在未确保能够获得相应报酬的情况下,也不愿投入自身资源。

要使支付系统真正实现分布式,需要引入结果验证技术以确保其正确性。因此,需要一个分布式且安全的支付系统,以便在互不信任的请求方和执行节点之间进行资金转移。请求方将任务提交到区块链上,并允许任何节点认领任务并执行。该区块链不属于任何中心化实体,其完整性由成千上万的矿工维护,矿工仅收取最低费用[46]。当计算完成后,结果将返回给请求方,执行节点则因其工作而获得报酬。

此类解决方案可利用押金、支付通道[47]、智能合约以及可信执行环境(TEEs)[48],在无需建立任何信任关系的情况下,确保所有参与方的正确行为。

7. 结论与展望

尽管在为核心互联网中的静态通信构建服务质量框架方面进行了大量的研究和开发工作,但对于适当的解决方案仍缺乏广泛共识。因此,迄今为止尚未部署广泛的解决方案。

与此同时,随着过去几十年互联网的发展,基础设施需要适应普遍连接、通信与计算范式。新的应用要求在网络边缘(即用户设备中,i.e.,应用程序最需要的地方)实现严格延迟,而计算不能再局限于远程数据中心。

以信息为中心的网络、移动领域的最新发展边缘计算,以及信息安全领域的整体发展,有望弥补此类应用的需求和要求。因此,当前的挑战在于弥合已建立的互联网基础设施及相关协议与安全性、隐私和分布式账本技术领域的新开发活动之间的差距。从整体上看,这些领域的融合能够共同提供最终用户以及投资于未来技术和应用的行业所期望的服务质量。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐