『云视频会议』走红背后的技术突围战
文 | 琥珀 编辑 | 王刚
前沿:难以想象,突如其来的疫情彻底打乱了国内企业的运转节奏,但史无前例的线上复工潮,一夜之间意外带火了几乎所有主打视频会议的产品。不过,“短期崩溃”并不意味着平台被击垮,云视频会议背后还有诸多技术问题值得探讨。
借由契机,雷锋网独家对话了数家头部云视频会议服务商、云厂商,踏上跨越时空阻隔、惊险突围之旅,解读云视频会议产品背后深层次的核心技术。
2016年4月,国内SaaS行业尚还未进入第二次调整期,无招宣布在钉钉上首次推出多人视频会议功能。而Zoom正在国际市场风生水起。回望那个时候,很多人应该都没有发现其实彼时已经开始了第三代SaaS准备更迭。无论是国内的钉钉,还是北美的Zoom,正在悄悄的攻陷Polycom、Webex等上一代传统视频会议的战场。
两年后,视频会议的这场战争中,3亿在家办公的员工只识阿里钉钉、企业微信、腾讯会议、华为云WeLink与字节跳动飞书,并顺带致敬一下Zoom。
在此期间,2017年《政府采购法实施条例》的正式实施,信息安全与软件国产化等再次受到了越来越多的关注。2018年中美贸易战的爆发,加剧了国家对信息安全问题的政策倾向。2019年9月,Zoom国际版服务器封停的消息,终于让不少人开始意识觉醒:本土云视频会议产品的机会来了吗?
上至应用,下至底层技术研发,中国云视频会议服务提供商对于自主可控、自主研发的声音达到了空前高度。不到半年,WeLink、腾讯会议、TalkLine、蓝猫微会等多款可提供云视频会议服务的产品纷纷上线。
与此同时,由于疫情导致对云视频会议需求的猛增,刺激了国内云视频会议市场的发展。钉钉、WeLink等企业协同办公平台针对疫情期间启动了免费开放服务,腾讯会议为武汉大学师生提供远程协同服务,而武汉协和医院等单位启用好视通进行了远程会诊。
甚至有人说,整个云视频会议行业提速了5年,相较于此前,并发量、新增用户量、业务流量……这数字几乎爆发式增长直观地反映出国内云视频会议市场的走向。但这似乎并不意味着企业的服务能力也会随之提升,而这考验着的是各家企业的创新与反应速度。
1
重新定义音视频
尽管云视频会议系统需要解决的技术难点上有很多,但其背后的核心仍是音视频的实时通信,总结来讲主要有三个方面技术要素,分别是网络传输技术、音视频处理算法、多端融合技术。
一是网络传输技术,即如何适应复杂的网络环境以提高自适应能力。这其实是基于云视频会议系统自身的特点,不用专线,任何地方任何网络任何设备都可以接入,但问题就在于网络是不稳定的,如何在网络丢包的影响下提升音视频质量?
二是音视频处理算法,其实包含两个层面,对音频的降噪等处理技术,以及对视频的流畅和清晰度的保障。
三是多端融合技术,无论是网页、电话、APP的接入,还是监控视频系统、VR/AR设备、无人机视频等更为广阔的应用场景的打通,也是不少服务商所关注的。
不过从另一个角度讲,云视频会议产品也同时集结了AI、云计算、安全等各方面的能力。正如美颜降噪、背景虚化、抗丢包这些技术,也是当前云视频应用比较突出且难以突破的技术难点。
由于视频会议中涉及的信息量巨大,尤其在教育医疗场景下,有时可能会涉及敏感、不适宜内容等信息,阿里云视频云团队还会与阿里云安全团队、阿里达摩院机器智能技术团队协作,具备常规的违禁文字筛查能力。
通过华为云EI服务,得以让WeLink在视频美颜、会议发言人自动跟踪、会议纪要自动生成、语音操控等方面灵活应用;基于云视频分发服务,通过高清低码,用最小的带宽支撑最清晰的质量,以抵御更大的网络抖动和质量下降,这在疫情期小区集中上网的环境下尤为关键。
而腾讯会议背后的腾讯多媒体实验室,则利用AI技术能够将丢掉的网络包还原,能够做到视频丢包70%,音频丢包80%的情况下依然保持流畅。如果横向粗浅对比目前几家服务商的技术能力,功能的差异点并不会太大。腾讯视频云业务总经理李郁韬表示,“最大的差异点还是在音视频质量本身,如何保证更清晰的画质,更清晰的音频体验,这个是很考验内功的。”
图:复工后的腾讯会议日常
2
云服务的常态化挑战
严重占用CPU、很多功能只能手机上才能使用、存在鸡肋功能等体验问题、高并发时的视频卡顿……国内云视频会议产品最近遭到了不少用户的吐槽。尤以2月3日的全国复工首日和2月17日在线开学当天的先后两次服务器宕机事件备受关注。瞬间爆发的在线办公需求导致访问流量激增,作为大后方的云视频会议系统提供了怎样的支持?
从疫情高峰值、不可预测峰值的网络信号挑战来看,阿里云视频云资深技术专家楼剑总结为以下两点:
1、快速业务扩容、短期上线上万台机器,将业务应用快速部署并服务,对运维与服务体系是一个大的考验。
2、大业务量下的节点调度、质量保障能力:一是节点和设备数量的增加,以前小概率出现的设备问题,在海量节点面前,成为大概率事件;二是机器如果因硬盘、内存问题挂掉,需要随时监测并智能切割,并确保音视频服务无感知。
面对这样的挑战,楼剑和他的团队从音视频两方面入手:
一是语音的“听感”:在降噪和消除回声方面,采用深度调优的语音学习网络,针对开放办公室、开放户外、密闭会议室等不同的会议场景提供智能降噪。此外,由于实际移动设备媒体采集特征参数的差异,回声消除算法的稳定性与性能会受极大的影响,通过建立云特征库,持续覆盖和采集市场新出的移动设备,不断丰富兼容性。
二是视频的“观感”:自研实时窄带+SCC内容编码,可在通信构成中占用更小的带宽,有效提升视频流畅度;同时,SCC内容编码,通过对文本、纹理内容的优化编码,确保在视频会议共享中的文档文字更清晰。
值得注意的是,此次疫情带来用户需求的激增,让服务商纷纷扩容,直到近两日才可以稍稍“松懈”。据官方数据显示,阿里云已经为钉钉连续扩容了10万台服务器。
但这并不意味着,在支撑前端协同办公、视频会议的应用上,云服务只起到了弹性扩容的作用。峰值期大量用户涌入进行消息处理、文档传递、会议申请等需求,也严重考验着团队的抗压能力。
在单区域发生网络流量徒增后,我们会将网络流量调度带宽充裕区域,并通过传输算法确保体验不下降,如此可将全国的网络资源尽可用利用起来,并同时确保闲时复用、多业务复用。
由于视频会议是白天业务,在夜间,会将这些闲置的机器和带宽资源用在其他文娱网络业务上;同时闲时转码,在凌晨低业务期间,复用这些计算资源进行大规模的媒体转码,以降低文件的存储和传输大小。
3
不可忽略的安全问题
疫情“带火了”几乎所有具备视频会议能力的软件/系统,从不少服务商公开的数据得知,用户数量在短短数天内得到了暴增,甚至一度对云服务器扩容,7*24小时进行日夜维护。
然而,在紧急用上云视频会议的同时,大家把注意力放在了应用层面,如音视频质量、屏幕和文件共享、可使用的会议空间大小、登陆端口的便捷性,是否同时兼顾对了信息安全问题的重视?这对于需要部署疫情工作的各级政府、医院、卫计委等机关单位而言,尤为重要。
当前政府机构、大企业不仅仅关心开会、办公协同,更重要的是,尤其远程在家办公期间,要同事保护信息安全和应用的安全接入。他们仍然对音视频会议系统的建设有较高要求,对于将政务/核心业务搬上云端,很多部门目前仍是无法突破心理上的“防线”。
图:广东省委书记李希在东莞调研疫情与医生用WeLink视频会议截图
对此,对于华为云WeLink团队而言,则从五个层面对安全性防护进行了严密管控:
一是通过基于芯片的安全加密体系。企业不单提供了更安全的会议加密,更可决定一些密级特别高的会议只能通过某些受信的终端接入。
二是通过具有专利技术的视频、信息内容传输加密技术,让会议音视频和内容收到严格保护。
三是会议文档等存储在华为云上,通过具有最高等保级别的安全保护,确保不受泄露和供给。
四是在移动端上的安全沙箱技术,让会议文档、消息等使用之后即丢弃,不给泄露以可乘之机。
最后,在业务设计理念上,所有的信息和内容都100%归属企业,并只在企业内部流转,保障企业会议内容和文档不可向外界泄露。
华为云WeLink表示,对于中大型企业而言,会议不仅仅是进行一个沟通,还会承载很多商业机密、知识产权等。安全是中大型企业使用会议系统时尤为重要的功能。
4
自主可控的大命题
实际上,在云视频会议国产化替代的大潮下,阿里、华为、腾讯正逐渐可以做到在底层技术上的部分自主可控。阿里云有自研的飞天操作系统、神龙云服务器架构、含光芯片、盘古存储、分析型数据库等一众自研产品。华为云发布了两款云数据库Taurus和Gemini,并拥有华为自研的鲲鹏920、昇腾910、操作系统鸿蒙 OS等技术产品。
腾讯云自主研发了星星海服务器、TDSQL数据库。除此之外,私有云产品腾讯云TStack也和国内主流的操作系统/服务器做了很多兼容性认证。
一个典型案例是,疫情期间,腾讯会议扩容的100万核服务器资源是全部由腾讯云自研的服务器星星海提供支撑的。
正如腾讯视频云业务总经理李郁韬所言,“‘自主可控’这个命题对于中国企业而言挑战还是挺大的。大家也都知道音视频领域的发展,国外的技术力量还是起到了非常重要的作用。”
在自主可控部分,我们其实分了几步走。首先在音视频的应用层,不管网络传输还是云端的流控引擎,编解码的优化都属于自研;其次在硬件部分,需要承认突破需要一些时间,至少在服务器上我们先走出了一步,后续可能会在国产硬件和操作系统。
通过软硬件这两部分,我们可能需要一些时间逐步去实现完全的国产化和自主可控。
2019年11月29日,齐心好视通推出国产化MCU服务及麒麟云会议客户端,并与天津麒麟、天津飞腾、上海兆芯、中标软件等多家国产化产业链的核心厂商分别签署了战略合作协议,试图打造一个集国产芯片、国产操作系统、国产视频会议应用组成的国产化自主可控生态链。
齐心好视通CEO侯刚告诉雷锋网,此举背后其实是看到了巨大的市场空间。
为什么一定要国产化?其实还是离不开“自主、可控”二字。侯刚解释,
在国家政策、核心技术不断突破提升的情况下,国产化替代在关键行业的呼声越来越高。尤其在中美贸易战之后,其实是加剧了这个产业链的进程。
这样的战略背景下,对于国产化的门槛要求还是非常高的,除了公司资质背景外,要求底层的技术是属于自主研发的,包括使用的系统、芯片都是属于自主可控的清单范围之内。
图:钟南山与武汉ICU团队采用好视通视频连线
据了解,齐心好视通成立于2009年,诞生之初就是基于云计算的模式为用户提供视频会议服务。
这里有一个关键名词需要解释,MCU(多点控制单元),可以理解为数据媒体的交换中心,能够将不同终端连接起来。相比传统视频会议系统,MCU都是部署在本地,构建起来非常昂贵、复杂;而基于云MCU的方式,则将本地编解码的部分,全部放到了云端;同时在商业模式上的创新,不需要一次性购买整套系统,而是按需购买,从而降低使用成本。
能够发现,由国家信息安全管控导致的政策利好,不少厂商纷纷打出国产化的旗号,诉诸于实现音视频核心技术完全自主化,并在主芯片、数据库、云平台等底层架构上选择国产化替代的解决方案。
云视频会议正逐渐取代昂贵的传统视频会议产品,这是一个积极的信号。事实也证明,有些国内服务商的技术和应用效果已经可以与国外媲美,在服务和性价比方面,很多甚至超过了国外。
可能对于多数中小企业而言,稳定和效率则是第一位的,是否国产并不是很重要。对于金融等特殊行业,以及对信息安全极为敏感的党政军,则需要国内服务商们用长久的时间来证明自身的实力。