旗下微信矩阵:

“低延时”成音视频直播新焦点,谁能笑傲江湖?

5G时代的直播主流一定是低延时直播,*目标是零延时的实时直播,攻克延时问题,自然就成了接下来各大直播技术服务商竞逐的焦点。
2021-01-27 17:46 · 微信公众号:罗超频道 罗超频道

2020年,突如其来的疫情意外地让直播行业收获了高度繁荣。直播从泛娱乐这样的小众场景,成功破圈到各行各业,直播电商、直播教育、在线问诊、云旅游、云聚会等直播应用爆发式增长。直播已从各种应用的标配功能升级成各行业基础设施。

直播上下游产业链繁荣,直播技术服务商崛起

围绕直播的产业链同样获得高速增长,艾媒数据显示,2020年前三季度新增近2.5万家与直播相关的企业,较去年同步增长565.32%。直播相关的服务企业,有直播卖货机构,有直播网红MCN,有直播营销公司,有专业直播设备服务商,还有直播技术服务平台。

当一座金矿被发现时,挖矿者到来, “送水人”自然就会大量出现。作为直播行业的“送水人”,直播技术服务商以API形式,帮助企业快速、简单、低成本创建音视频直播应用。直播是一项复杂技术,涉及到编解码、传输、CDN、云存储等等技术,从0到1搭建直播系统对于大多数企业来说没有必要,不论是科技巨头还是传统企业均普遍采取第三方直播技术云服务,既可以避免“重复造轮子”进而降低成本、又可以让用户拥有更好的直播体验。

直播技术服务商,已成为直播产业的重要玩家。一方面,阿里云、腾讯云、金山云、UCloud等云计算巨头,针对视频直播行业,专门推出了针对性的云服务,抢占视频红利。另一方面,声网、即构科技等专业音视频直播服务商强势崛起,2020年声网IPO,即构科技获得腾讯领投的5000万美元C轮融资,音视频直播技术服务,成为资本新宠。

视频云市场正在高速增长。IDC发布的《中国视频云市场跟踪(2019下半年)》报告显示,2019年中国视频云市场规模达到46.2亿美元,同比增长46.3%。

在扑面而来的5G时代,直播场景将会进一步扩大,直播应用会继续爆发式增长,直播蛋糕会变得更大,直播云服务市场自然会获得对应增长。IDC报告预测,2019-2024年中国视频云市场年符合增长率预计达到36.9%,到2024年市场规模将会超过220亿美元。

5G时代,一众直播技术服务商的比拼焦点,将会从先前的稳定可靠,转变为在合适的成本范围内,提供更低延时甚至完全消除延时的直播服务。

成本与性能兼顾,“低延时”成直播技术新焦点

直播是实时互联网应用,理论上延时越低越好。不过,随着“直播+”的兴起,直播与不同行业结合形成了各种各样的直播应用,不同直播应用对互动、同步、成本、并发要求不同,直播技术也逐步出现分化来满足这样的不同。

最初直播普遍采取基于TCP的RTMP/HTTP-FLV/HLS 等流媒体协议的CDN直播,存在延迟大(3秒以上)、弱网抗性差以及观众端内容不同步等弊病,影响观看与互动体验。

TCP诞生于1981年,虽然经过多次改进,但其本质是面向传统互联网而设计,在传输图文、视频与网页等内容时不存在明显问题,但在实现直播应用时却会有较大的延时,往往超过3秒,观众看到的内容有滞后性,无法做到跟主播或其他观众良好互动。当然,CDN直播*优势是成本低,因此在观众与主播互动要求较低、观众可接受一定延迟、并发规模大成本敏感的场景被广泛应用,比如游戏直播、新闻直播、体育直播。

然而,在主播与观众互动要求高,对内容同步性要求高的直播场景,CDN直播技术就很难满足需求,比如在线会议,小班课这样的需要频繁互动的场景,比如直播大班课、直播电商、秀场直播这样的强互动场景,比如在直播大班课上,学生向老师提出一个问题,老师收到问题时往往都讲到下一个知识点了;再比如在娱乐秀场中,观众给主播送了礼物,主播往往要等很久才能收到表示感谢,降低了观众打赏积极性。

针对CDN直播技术的延时问题,市面上出现了实时音视频直播技术如WebRTC,延时可以做到小于400毫秒,然而这一技术成本高昂,只能用于小班课、在线会议这样的低并发场景,千万级并发场景很难应用,而这些场景往往可以接受600毫秒到1000毫秒的延迟,换言之,用实时音视频直播技术太“奢侈”且没必要。针对这样的矛盾,兼具低延时与低成本特性的低延时直播技术,正在兴起,且有望成为直播技术的新焦点。

各路玩家逐鹿低延时直播,即构如何脱颖而出?

2020年音视频直播技术服务领域的“Key Player”均在布局低延时直播:

阿里云推出超低延时直播产品RTS,基于直播全链路全局优化,应用在淘宝直播等场景中;

腾讯云基于WebRTC推出低(准)延时直播技术服务“快直播”,对标准直播拉流侧进行低延时改造;

声网瞄准轻互动(延时在800ms-3s之间)场景推出“极速直播”产品,主要面向对文字、白板等消息互动低延时要求相对高,或有低频互动需求的直播场景。

即构科技推出低延迟直播(Low-Latency Live,L3),在更底层的拉流侧与推流侧应用不同技术,具备实时音视频直播技术的低延时优势,与CDN直播技术的成本优势,成为其拳头产品。

八仙过海,各显神通,不同玩家以不同方式实现低延时直播,其中即构L3支持千万级并发拉流,相比标准 CDN 直播产品延迟更低(低于1秒)、同步性更强、弱网抗性更好,可为用户带来毫秒级的直播体验,同时具有显著成本优势,具体来说特点如下:

首先,基于端到端自研技术,成功突破性能边界。

媒体协议*程度决定直播低延时能力。基于TCP的RTMP/HTTP-FLV/HLS 等流媒体协议均存在3秒以上的延时,后来市面上出现WebRTC技术,且是开源的,其一定程度可以解决延时问题,然而该技术*支持30%丢包,在网络环境不好时表现一般,且对 H264 支持有限,增加了开发者负担。

2015年成立时,即构科技就确立了技术立业的路线:“*云通讯技术创造服务价值。”即构研发团队有20+在直播行业深耕20年以上的核心技术专家。在技术路线选择上,其选择专注于自研音视频引擎,在语音前处理、网络自适应和跨平台兼容性等方面,达到国际*水平,同时充分利用综合云商的基础云服务能力,构建于基础云服务之上的海量有序自学习网络。即构还自主研发了底层音视频引擎,因此不存在“黑盒子”,进而可以突破技术边界。

在解决直播延时问题上,即构科技自主研发媒体协议 AVERTP ,支持 H264,VP8和 HEVC 等多种编码格式,在 ABC(码率自适应)的基础上,结合包含 FEC(前向纠错)、ARQ(丢包重传)和 PLC(错误隐藏)的智能 QoS 信道策略,充分利用链路带宽,保证音视频传输的低延迟、弱网抗性和多端的同步性。

即构自主研发了MSDN ,基于音视频服务的特性、结合 SDN 架构,将不同供应商的 IDC、⽹络线路等资源整合成一张“虚拟网络”,具有中立弹性、路径*、可智能识别业务并在传输层优化、灵活可靠等特性,可以更好地解决大规模直播普遍存在的高并发、网络复杂与网络自适应等问题。

正因为重视技术且一开始就走自研路线,即构科技可以开发自己的媒体协议与虚拟网络,低延迟直播产品L3攻克了基于TCP的直播技术的延时问题,同时规避了WebRTC的短板。基于即构智能 QoS 策略,L3产品在 70% 丢包下,依然可以保证稳定的观看体验,在千万级并发规模下,可以做到毫秒级延迟新体验,相比市面上的直播技术服务更加稳定可靠。

其次,功能更加丰富实用,简单易用可扩展。

对于不同客户来说,CDN直播、低延时直播、实时直播、纯实时语音直播成本不同,应用场景不同。同时,几乎每一个客户在音视频直播技术服务本身外,还会有类似于白板、文件共享、云端共享、录制、互动等能力需求。

即构科技是一家音视频技术服务公司,截至目前,已服务覆盖全球212个国家/地区超过4000家客户,赢得泛娱乐、在线教育等行业70%头部客户的选择,日均音视频互动时长突破 20 亿分钟。市场的高速发展让其技术经受了锤炼、基础设施(如CDN节点)日趋完善,解决方案则已积累超过100+。

在这一过程中,即构已积累低延迟直播、实时音视频、实时语音等云通讯服务,且均采取一套底层的实时音视频引擎。同时即构SDK变得十分强大,提供300+API,客户可轻松构建连麦互动、实时消息、多路混流、录制点播、美颜*与跨房互动等应用,涵盖音视频服务从采集到渲染的各个环节,理想情况下,开发者仅需四步、三十分钟即可集成。

市面上的低延时直播技术往往与实时直播等技术无法直接互通,或者过于面向客户场景定制,导致扩展性与灵活性较低,限制了使用场景。即构L3则具有简单易用可扩展的特性,基于即构SDK强大的功能组件,客户可实现实时直播与低延迟直播的切换,实现“超级小班”,“一起看(电影/演出/竞技比赛)”等场景,定制直播大班课、秀场直播、电商直播、拍卖等千万级并发的直播+应用。

最后,提供顾问式贴身服务,助力客户业务成功。

如果直播服务不稳定、体验差,对客户业务的影响是很直接的,往往会导致客户流量直接浪费,甚至损害客户品牌形象。2020年某知名家电企业家在某知名短视频平台直播,就因为卡顿问题,最后销售额只有几十万,总裁直播“翻车”事件直接影响该平台与该家电企业的品牌声誉。专业、可靠与放心的服务,在直播技术服务中显得尤为重要。虽然即构科技是一家重视技术的公司,但跟一众视频云服务商不同的是,其在基本的集成技术支持外,很重视差异化咨询服务与VIP式技术支持。

即构不只是提供标准化产品,更会采取“用服务驱动产品,将服务作为战略”的发展路线,深入到客户端,一切以客户需求为中心,提供服务满足不同客户的复杂需求。即构的服务不只是简单的技术支持服务,涵盖产品基础服务、运营支持服务、场景化咨询服务等范畴。在服务客户过程中,即构去理解客户、理解场景、理解业务,将认知转化成更专业的服务能力,更好地服务更多客户。

在服务过程中,即构提供“VIP式技术支持”,其给每个客户配置五个岗位人员,涵盖售前方案、实施交付、售后维护等环节,这样的“5V1”配置在行业开了先河。除了按照客户需求提供大量专业驻场人员,关键时刻提供贴身保障,7*24小时技术团队在线支持外更提供随传随到的伴随式服务。

在L3低延迟直播解决方案中,即构的服务优势体现了出来。即构技术团队会提供7*24小时在线支持,同时可提供深度咨询服务,制定高性价比的技术、场景等解决方案;即构基于自主可控的音视频引擎与全套技术,可确保全年服务可用性高达99.99%;全球已部署500+可用节点,连接全世界5亿+终端用户,覆盖212个国家/地区;提供100+行业技术解决方案,不同接口可组合拼装,满足直播、教育、社交、游戏等多行业多业务场景的需求。

即构虽然没有基础云服务商“大而全”的能力,但其在音视频领域更加专注。在服务4000+客户的过程中,积累了更强大的音视频技术硬实力。“自研音视频引擎”与“服务驱动产品”的两大战略,则让即构在一众音视频云服务商中构建起差异化能力。基于此,即构不只是在低延迟直播技术上具有核心竞争力,在整个音视频直播技术服务赛道中,实力都不容小觑。

全面到来的5G时代,“更低延时”对直播日益重要。5G网络三大特性之一是低延时,基于此更多直播应用会爆发,VR/AR沉浸式直播让人们身临其境;5G云代驾让人们远程驾驶汽车或者操作挖掘机;5G云游戏让人们可以远程玩云端游戏;5G云手术,让偏远山区的病人获取一线城市医生的手术……然而,如果延时问题得不到解决,上述应用都无法落地,延时导致的后果可能会很严重,比如云手术时,可能会导致手术事故;再比如云代驾时,则可能会出现交通事故。

可与预见,5G时代的直播主流一定是低延时直播,*目标是零延时的实时直播,攻克延时问题,自然就成了接下来各大直播技术服务商竞逐的焦点。

【本文由投资界合作伙伴微信公众号:罗超频道授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。