设为首页收藏本站 关注微博 关注微信

全球新闻在线

全球新闻在线 首页 科技新闻 技术解析 查看内容

视频会议卡成PPT?这套AI算法要帮使用者化解这类尴尬

2021-6-10 09:19| 发布者: wdb| 查看: 34| 评论: 0|原作者: [db:作者]|来自: [db:来源]

摘要: 视频会议卡成PPT?这套AI算法要帮使用者化解这类尴尬 ,更多科技新闻关注我们。

记者 | 袁伟腾

新冠疫情时期,大家更多地在网站上发展视频通话和会议。当通话发展时,模糊、卡顿、跳帧的景象却在网速不佳的概况下经常产生。英伟达(Nvidia)开发的一项新技艺有望能够解决这点难题,为使用者带来更为流畅的“云办公”体会。

近日,英伟达宣告为开发者公布一款名为Nvidia Maxine的新视频会议平台。据英伟达官方网络信息,经过装载神经元网站与人力智能技艺,Maxine能够更高效地料理通话进程中所生成的数据,将同等清楚度视频通话的宽带请求“下降到H.264流媒体视频紧缩准则请求的非常之一”,并在同等网站要求下生成更清楚、流畅的视讯影像。

在英伟达推出的一项演示中,视频通话所需数据速率在运用Maxine后从97.28KB/骤降至0.1165KB/帧——节省了近99.9%的数据传输量。英伟达称,Maxine技艺在未来将来会进一步下降通话进程中的流量消耗。

“经过AI技艺,咱们能够为使用者提供更没有问题视频通话体会。即便是在网站不佳的要求下,通话品质也能得到显著提高。”一位英伟达的技艺人士评价。

相片来自:英伟达

新算法背后的原理容易易懂。据探讨人士推荐,体系会起首捕捉通话者的静态面部照片,以此为参考,软件不必再将全个视频的像素发展流式传输,只要要剖析通话中每私人的要害面部点,便可行在另一边的视频中智能重现面部。英伟达顶级产物总监安德鲁·佩奇(Andrew Page)称,它们的解决方案的本质是将带宽难题变成算力难题,比较于增添带宽,增添算力没有疑更为简单。

该技艺在机器学习中采纳了一个名为“对抗生成网站”(generative adversarial network,GANs)的用具,它的原理是让两个神经网站相互竞争,以生成与原始图像高度吻合的虚假图像。GANs能够有用地降低机器学习中所配置的人工资源,大幅提高机器的学习效能。GANs近年来在人力智能及深度学习等范畴得到广大利用,昨年风靡一时的DeepFake软件也采纳了这项技艺。

经过GANs,Maxine能够运用静态照片与面部要害点重建人物面部,智能地调度通话者的面部朝向。“咱们能在必定方位内重构通话者的视线影像,”探讨人士显示,“咱们信任这能让使用者在网站上的交流愈加当然。”

相片来自:英伟达

Maxine却非一种干脆面向客户的软件,却是提供应第三方企业用来进级自家的视频通话体系。据英伟达官网显现,除了网站改良以外,Maxine还能为开发者提供视频清楚度提高、噪音消除、实时翻译、字幕转录等功效。

Maxine现已投入运用。之前,英伟达宣告与通信企业Avaya完成合作合同,后者将运用Maxine的部分功效,改良麾下多融合视频会讲和协作利用程序Avaya Spaces的使用者体会。