短视频出海的关键指标、挑战及应对

文 / 王骏兴

整理 / LiveVideoStack

大家好,我是Akamai售前技术顾问Jason Wang-王骏兴,很荣幸今天有机会在LiveVideoStack的平台上进行分享,也感谢各位技术同行百忙之中前来参与。今天我演讲的主要内容是短视频出海的关键指标、挑战以及应对,希望通过今天的分享能够带给大家一些收获。

短视频出海的关键指标、挑战及应对

以上是今天分享的主要内容,首先会和各位分享一下过去在和客户的交流以及日常过程当中Akamai所看到的网络挑战,其次是在短视频行业中我们所观察到与性能相关的关键指标,并进行关键指标的剖析以及进一步的探讨,最后一部分会分享我个人及Akamai在网络实战中的经验和建议。

短视频出海的关键指标、挑战及应对

希望今天的分享可以给各位带来以上收获,包括如何了解短视频目标用户的网络情况,通过一定的方法论来确立短视频的关键指标,探索指标之间是如何作用的,最后根据关键指标的观察进行有目的性的优化。

1.复杂的网络环境下的网络挑战

短视频出海的关键指标、挑战及应对

这里我用了一个比较夸张的展示手法,不过也是不少人对于整体短视频访问链路的反映。在简单的认知中,我们认为用户仅需拿起手机接入网络,比如说连上WiFi或是开启蜂窝网络,即可从云端获取推送的短视频内容。那么对CDN以及云存储技术有所了解的人会知道,这里的源数据也代表内容分发的缓存服务和云存储,但真相并非如此简单。

短视频出海的关键指标、挑战及应对

在真实的访问过程中,我们面对的不仅仅是单一的手机、WIFI网络、蜂窝网络等等。这里简单的列举了我们可能会遇到的问题。第一就是手机类型,作为短视频从业人员我们都希望自己的APP以及网络能够跑在合适的设备上,比如说iOS阵营最新的iPhone 12,安卓阵营旗舰型的手机,通过“发烧级”的路由器发出网络请求。但事实上,我们无法决定市场中的设备是否如我们所愿,目标用户可能使用的是号称功能机的KaiOS phone或者安卓机中相对低端的机型,他的网络设备是N年前的百兆路由器。更重要的是真实的万维网如图所示,链路是错综复杂的,这是at&t绘制的世界互联网Topology,每一个骨干中都延伸出众多分支,最后用户要访问的短视频数据源可能是在相对较远的另一个数据端点。访问过程中一旦有任何闪失,都可能此次访问不成功,造成用户体验不佳等现象。如何让用户获取更加的网络体验也是本次分享要探讨的主要内容。

短视频出海的关键指标、挑战及应对

我们引用一个第三方移动网络报告机构OpenSignal的调研报告,在这四幅图中也列出了有代表性地、相对比较火热的短视频目标出海地区,比如两印地区、中东地区,以及南美的主要地区。从下面的下载速度以及维度来看,不仅在国家之间网络体验有性能差异,在每个国家主要运营商之间也有巨大的反差。此刻我们可以想象印尼的一个场景,在我们出海的过程中,如果将国内短视频的经验之间照搬至印尼且不分用户的网络环境,照样跑相同码率的视频,可想而知在Smartfren地区的用户体验将是灾难性的。

短视频出海的关键指标、挑战及应对

其他网络中的影响因素诸如DNS的影响,DNS解析是所有访问中至关重要的第一步,DNS包括LDNS以及权威DNS,它们都在DNS解析中扮演及其重要的角色,这是我们在做性能分析中不可忽略的一部分。第二点是劫持,主要的劫持手段有HTTP劫持和DNS劫持,我们以DNS劫持为例,运营商可以通过DNS劫持的方法对访问内容进行指向本地Local Cache的方式,以此达到节省出网带宽或跨网结算等目的。不过运营商毕竟不是短视频内容本身的提供商,设置一个错误的逻辑将导致短视频用户无法访问。我们可能还会考虑到短视频用户极致的体验,最成熟的做法是使用CDN内容分发服务,将短视频内容尽可能的缓存到靠近用户的节点上,通过较小的时间来改善关视频用户的网络体验。

在今天的网络传输中,我们大部分的请求都是跑在TCP之上,当选用了节点较少或者目标地区没有覆盖内容分发网络(如图2)。在传统的C/S架构中,首次建连的三次握手,不理想的覆盖将无法太好的改善用户的时延以及丢包情况。那么,就有可能因此影响用户的各类体验。

2.短视频关键指标方法论

短视频出海的关键指标、挑战及应对

上述那么多让人头疼并且不稳定的因素,作为短视频从业人员是不是感觉身体要被掏空。但是办法总比困难多,就像我们为了测量长度发明了度量单位和工具一样,我们也可以逻辑以及因果关系来推敲出短视频用户体验的关键指标。

短视频出海的关键指标、挑战及应对

在过去与客户交流过程中,许多客户经常会问Akamai“如何让我的短视频加载得更快,整体的业务更稳定。”这个答案归根结底还是需要技术团队制定出的衡量标准才能得出。这里我提倡的是3Q方法论,总结为三大类,QoE、QoS、QoP,特别强调一点本次所探讨的衡量标准为技术指标而非业务指标。因为业务指标比如说日活、用户留存等等,会受到用户喜好、内容、热门话题等影响,作为技术人员来说,在短视频性能优化过程中,我们需要有针对性的对性能相关指标进行关注和优化。

短视频出海的关键指标、挑战及应对

以上是3Q方法论中的一些细项,相信短视频的伙伴们看到第一个QoE都会特别亲切,这就是我每天都在接触的一些指标。就如它的名字Quality of Experience用户体验质量一样,每一项都与短视频播放体验息息相关。我们可以归纳QoE为一个现象,比如卡顿比或者卡顿次数上去了,用户体验都会非常直观地收到影响。我还列出了部分短视频业界会使用Synthetic数据,但是建议有条件的朋友使用与用户体验直接相关联的真实用户数据,这样我们所设立的指标会与QoE有直接的关系,毕竟我们所做的一切优化工作都是为了用户体验更佳,而不是让模拟数据变得更漂亮。

QoS就是我们使用的第三方服务质量监控,也就是Quality of Service,其中网络相关的有DNS、CDN、源站的性能以及其可用数据。以CDN举个例子,现在商用CDN报告平台中我们都可以看到诸如缓存命中率,带宽点击数、边缘、源站、HTTP状态码等等,这些QoS数据在我们后续调优中,都扮演关键的角色。我们可以将QoS归类为产生现象的原因。

QoP就是Quality of Performance指性能指标,举个例子右图QoE和QoS是两个不一样的集合,QoS中的点击数不一定和QoE有交集,不过失败率一定和DNS服务状态是有交集的,之间罗列的交集可以理解为QoP,当找到QoE和QoS关联时,我们调优目标也就浮出水面。这里罗列几个网络中QoP的关键指标供大家参考,也算是抛砖引玉。各位在之后性能调优的会议中,也可以参考右图的这种形式,定义出你们所理解的QoP,和技术团队、服务商进行探讨确立调优的方向。

短视频出海的关键指标、挑战及应对

上面阐述的3Q方法论,相信大家对这三大类的关键指标有了明确的认识,我也简单地总结了QoP的关键项,供各位参考。其中每一项都是可以供大家进行单独深入探讨,就不多加赘述了,在最后我会分享几个针对QoP应用优化示例,供大家参考。

3.从Akamai视角看待QoE

短视频出海的关键指标、挑战及应对

我想先分享一下Akamai不一样的QoE视角,作为全球规模最大且覆盖最广泛的内容分发提供商,Akamai平台上承载全球约三分之一的互联网流量,优化互联网体验和保证互联网安全性,一直是Akamai不变的信念之一。由于承载流量来自于各行各业,所以业务指标的需求也是多样化的,为了更好得提供参考建议,Akamai使用了多样化的筛选条件。比如客户的域名、ISP、地理位置、网络类型、访问协议类型等等,以此更加精确地命中我们所想要的结果。

短视频出海的关键指标、挑战及应对

我们承载的业务种类繁多,Akamai的网络专家们最后将专注点放在了网络中最重要的QoE指标上,比如说传输速度、传输时间、可用性等,结合前面描述的筛选条件,我们可以更直观地为Akamai平台内部调优或者中国出海用户提供目标网络中的表现情况以及确立调优目标。

短视频出海的关键指标、挑战及应对

我做了一个经典案例的分析,在案例中,Akamai为客户分析了当前业务所在目标国家的表现情况,做了吞吐速率的国家排名分析以及具有针对性的深度剖析目标国家运营商表现。这其实对于技术团队制定未来技术优化方案、技术选型都具有极大的参考价值。除此之外,不仅仅是对客户用例分析,Akamai内部对平台进行优化的前与后,我们都会通过KPI平台观察优化手段部署之后所产生的性能价值。

短视频出海的关键指标、挑战及应对

在未来工作中,无论是通过3Q方法论或是其中的QoE、QoS分析亦或是Akamai QoE的建议,所有的理论都会经过一轮头脑风暴以后落到实处,成为我们短视频用户体验优化方案。我想通过过去的一点经验,和各位分享一下关于优化方案的最佳实践和案例。

4.最佳实践案例

4.1 最佳实践案例——客户端

短视频出海的关键指标、挑战及应对

第一个是客户端和视频内容的优化,我总结了几个比较常见的关键要素,首先是合理应用连接。在过去的经验中,我们都知道为了减少客户端与服务端的建连过程,保持长连接都可以让用户的加载体验获得极佳提升。在APP里也是同理的,我们可以利用连接池的概念,让每一次的请求都加载在已经建立的连接之上,让TCP的三次握手或是TLS的协商,甚至是QUIC连接都不再成为加载时间的瓶颈之一。

第二点就是码率,在我们技术选型中,目标网络情况是不容忽视的,比如说最开始提到的4个地区之间不同的网络下载体验,因地制宜选用最合适当地网络情况的码率至关重要。

其次是大家耳熟能详的视频编码格式,随着编码格式的技术发展,H.265和VP9都为节省存储空间做出惊人贡献。在保证相同视频画质的前提下,H.265和VP9对标自身上一代的编码格式,都可以节省达50%的体积。应用到短视频中,正确的编码格式,可同时兼容短视频用户观感和加载体验。当然我们还是要兼顾到用户设备的兼容性,这里就不作展开。

在图片格式上也同理,多图的场景中,缩小每一个需要加载的个体,实现无缝衔接的加载体验,也可以通过选择正确的图片格式来做到。图1是Akamai视频图像优化方案的综合示例,通过和顾客协商策略后,自动化地在边缘网络质量上和格式对比节选出最优的输出。从示例中可以看到,图像和视频都得到字节数上的节约,以及质量上的保证。

4.2 最佳实践案例——DNS

短视频出海的关键指标、挑战及应对

接下来就是与网络息息相关的调优,对于DNS理解深刻的伙伴,可能会说DNS应该是有缓存的才对,权威DNS仅仅是做到少量的查询,好像并不是这么重要。不过在实际应用中,Akamai不止一次从客户案例中看到优质权威DNS为短视频业务带来的好处。在右图的案例中,海外客户使用了某家国内知名权威DNS服务商,以及Akamai权威DNS的对比。随着用户数量级的增长,迭代查询的数量也随之增加,迭代查询的性能差异如此之大是完全不容忽视的。同时,由于权威DNS可以说掌握了整个访问链的命脉,短时间之内短视频的不可用也可能会导致DNS不可用,对用户体验带来致命打击。考虑到大部分短视频出海业务都已经在国内有业务流量和稳定服务商,可能在运维层面不是这么容易进行替换。针对海外情况,我们不妨可以尝试使用国内外域名分离的方式区分服务商,除了可以获取性能、可用性上的提升,也更便于技术人员管理、区分这两块的业务。

短视频出海的关键指标、挑战及应对

另外,关于DNS的调优还想提及一个DOH的方案,这也是最近探讨比较火热的方案。基于HTTPS我们可以更好地避免DNS污染或是劫持的问题,另外我们在传统的CDN调度中,是通过LocalDNS IP,用户使用了LocalDNS IP来确认用户的地理位置和网络,以此判定最佳的网络覆盖。在DOH中,后端的Resolver可以携带ECS扩展字段,CDN调度系统也可以通过ECS字段来获取用户的准确IP信息,来避免LDNS设置错误让用户获取到错误边缘调度的情况。

当然,不同技术手段需要运用到不同的思维来实践,建议APP采用异步调用的方式,避免HTTP请求和响应时间的延迟问题。我们都知道HTTP请求肯定比DNS请求延时高一点,就像充分利用链接一样,我们可以采用提前预解析的方式,减少DNS在请求中所带来的解析时间。同时还要注意一点,在我们考虑DOH方案时,一定要和所使用的CDN厂商确认他们的调度系统是否可以识别ECS扩展字段。

4.3 最佳实践案例——服务端

短视频出海的关键指标、挑战及应对

关于服务端的调优,Akamai建议对拥塞算法以及传输协议进行有针对性的选择,在过去20年网络优化经验中,Akamai不停地去迭代自身的拥塞控制算法达到最佳的网络体验效果。如上图所示,Akamai观察到,在不同的网络环境下,每一种拥塞控制算法或是传输协议,都不是一招取胜的。在某一些网络环境下,BBR的效果可能会不如QDK等,这种例子数不胜数。Akamai内部的Dynamic Protocol Optimization应运而生,我们采用机器学习的手段时刻针对网络变化,推导出最适合当下网络环境的拥塞控制算法和协议,让最终用户可以获取到最优的传输体验。

短视频出海的关键指标、挑战及应对

与用户息息相关的缓存服务也是大有可为,与QoP相关的缓存命中率以及回源速度,Akamai的见解是,除了多年平台自身积累的优化经验以外,通过专属缓存的方案,我们可以达到单文件30天内回源仅一次的方式,以及源站直连链路的方式,来大大缩减回源时间。与此同时,我们也减小了源站的回源压力,以及公有云带宽成本。图2是一个应用案例,这是我们平台对缓存命中率的展示,在经过与这家短视频客户多轮配合调优以及缓存架构的调整后,缓存命中率达到令人满意的99%以上,结果是相当喜人的。相应这家短视频客户也观察到自身监控的QoE关键指标的提升。

4.4 最佳实践案例——动态传输

短视频出海的关键指标、挑战及应对

虽然大部分短视频的应用重点都在于短视频的播放跟体验相关,不过在整体访问过程中,动态请求也是决定用户对APP响应速度的体验,比如在动态加速回源拉取Feed流的过程中,任何性能瓶颈以及失败的情况都是不可容忍的。在Akamai的见解来看,利用Akamai全球28万台服务器的巨大网络,来进行回源链路的探测和择优是最优的方案。这不仅仅可以保障用户始终跑在最优的链路上,也可以在链路波动时,切换备用链路来保证整体动态请求的可用性。右图是一个实际使用的案例,用户的源站是一个新加坡的源站,在印度的用户跟新加坡源站之间,经过动态加速以后,产生近3倍的性能提升,同时丢包率也得到了一个不错的改善。

4.5 最佳实践案例——上传场景

短视频出海的关键指标、挑战及应对

上面总结的几点建议大多数围绕下行链路所展开的,由于短视频属于UGC范畴,用户在拍摄完视频上传的体验也是不容忽视的,这里也一样建议伙伴们采用成熟的上传技术来保障用户的上传体验。在上传场景中,Akamai的见解是借助于动态链路的择优技术,以及内部私有化协议的方式进行多倍包复制。同时可以选择部署Akamai的调优设备至目标机房中,让我们上传数据变得更快,更好地抵达用户源站,以此来保证中间上传链路的效果。

短视频出海的关键指标、挑战及应对

其实在出海过程中,网络安全合规也是不容忽视的,最近我们也聆听到很多的新闻,如果有机会Akamai的专家们在安全层面也可以为各位分享一些独到的见解。非常感谢各位的参与和聆听,同时也希望通过今天的短视频话题,可以给大家带来一些收获。不同的网络环境下会有不一样的网络体验,我们一定要了解如何对短视频目标用户的网络有进一步的认识,去影响我们的技术选型。通过一定的方法论,来确定短视频的关键技术指标具体有哪些。与技术团队的伙伴们在头脑风暴时,探索指标之间的因果关系以及它们之间是怎样互相影响互相作用的。最后根据头脑风暴的结果,掌握有哪些QoP指标是可以进行有针对性的调优,再根据这些QoP指标观察进行有目的的优化过程。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注