当前位置: 永利棋牌 > 书评随笔 > 正文

腾讯云首推一站式语音解决方案,如何实现

时间:2019-10-01 13:17来源:书评随笔
欢迎大家前往云加社区,获取更多腾讯海量技术实践干货哦~ 针对网络音频乱象,腾讯云近日基于领先的深度学习和人工智能技术推出了一站式语音解决方案,该方案能够精准检测和识别网

欢迎大家前往云加社区,获取更多腾讯海量技术实践干货哦~

针对网络音频乱象,腾讯云近日基于领先的深度学习和人工智能技术推出了一站式语音解决方案,该方案能够精准检测和识别网络音频中存在的色情呻吟、谩骂、违规广告等不良信息,助力应用服务商有效解决网络音频乱象,促进网络生态健康发展。

小米枪战的荒野生存模式(吃鸡),新增了百人团战的实时语音,支持“听声辩位”。具体功能是:

作者:腾讯游戏云

新推出的腾讯云一站式语音解决方案是在原有游戏多媒体引擎GME的基础上,作了功能迭代和性能优化,技术层面融入腾讯天御的AI内容审核技术,通过专利算法对海量音视频数据集深度学习,使其能够更安全、更稳定、更便捷的为多行业、多场景提供一站式语音服务。

1. 在地图中的两个玩家,走近至一定距离内,说话就自动能被对方听到。走远了,就无法听到。

导语:在刚刚结束的首届腾讯用户开放日上,腾讯音视频实验室带着3D位置音效解决方案,向所有用户亮相,为用户提供360度立体空间的沉浸式听觉体验,那么这项技术如何结合具体的场景提升用户听感和体验呢?这篇文章将会详细阐述。

近年来,除了图像和视频形式之外,色情、谩骂等违法违规信息也以音频形式在各大平台快速传播,给用户和众多软件服务商带来巨大的困扰。一方面,面对海量的UGC内容,大多数网络音频平台缺乏相关技术支持,无法投入大量的资源和人力进行审核;另一方面,即便少数平台具备检测识别技术,也难以应对海量业务需求,时效性和准确性无法得到保证。

  1. 两个在可听范围内的玩家,随着相对距离远近的变化,说话音量也会变化

 

针对这些不良信息和行业乱象,腾讯将历经海量内部业务验证过的内容安全技术,通过腾讯云对外开放。腾讯云一站式语音解决方案强大的语音过滤能力,基于领先的音频关键词唤醒、呻吟声识别、音转文、声纹识别等关键技术,不仅能够对色情呻吟、谩骂、违规广告等不良内容进行有效识别和过滤,并支持平台根据自身业务需求实现精准化、定制化识别。

3. 玩家的语音具有方位感,能够像游戏内置音效一样,判断出对方与自己的相对方位。

基于游戏开发引擎(例如Unreal、Unity)实现的3D音效在游戏中的应用已经非常普遍了,通过游戏引擎模拟重现空间中声源方位,例如CS中射击的枪声、中弹时的音效、附近敌人轻微的脚步声,可以显著提高游戏的沉浸感,造就身临其境的游戏体验。

目前,腾讯云一站式语音解决方案单日检测违规样本达到上千万条,识别准确率超过90%。并且已经在游戏、语音直播等行业得到了成功应用,为众多用户提供了优秀的语音服务。

本文将解读,如何实现上述功能。一共分三步:

这里我们可以听一段音视频实验室通过3D音效算法处理前后的音频对比(请带上耳机收听):

拿目前火爆的萌系生存射击游戏《香肠派对》来说,作为一款久居TapTap榜单前列的游戏,Q版的香肠主人公吸引了大批玩家。在游戏进行时的实时语音交流中,部分不文明玩家会出现谩骂和违规广告等行为,严重影响用户体验和游戏运营。在使用了腾讯云一站式语音解决方案的语音过滤功能后,游戏方只需接入SDK,即可轻松对语音内容进行实时识别,并将发现的不良信息及时通知游戏运营方。让玩家在畅玩游戏时不再受到粗言秽语的影响,游戏体验更加舒心,游戏环境也得到了净化。

1.可听范围的设定

处理前:

在娱乐社交场景下,语音直播社交应用同样面临着不良语音内容的困扰,以及对高品质语音听感的诉求。腾讯云一站式语音解决方案支持的48Khz超宽频音质,为用户提供高音质、高稳定的房间内音乐播放、实时唱歌和多人语音体验等多种功能;同时,面对海量的音频信息,平台方通过接入语音过滤功能,将人工审核变为系统自动检验,检验结果还可主动回调,通知平台方。人力成本得以大幅缩减,并能够最大限度规避风险。

2.通过声音体现玩家之间的相对距离

处理后:

值得一提的是,应用接入也非常简单,用户既可以接入SDK(目前支持移动端、PC端、Web端跨平台互通)实现实时语音,再通过实时语音服务器上传给语音过滤服务器,也可以直接上传音频至语音过滤服务器。无需繁琐的操作和大量的人力投入,即可轻松获得过滤结果。

3.通过声音反映玩家间的相对方位

可以听到,处理后的音频携带了更多的空间感和方位感信息,通过扩展音乐的延展度,让声场更大、声音位置感更准确、声音运动轨迹更加生动,提升音乐的临场感和沉浸感。

图片 1

其中,第2点和第3点其实都是声音的空间感,也就是“听声辩位”,下文会合并在一起讲。

然而,3D音效之前并没有大规模应用在实时语音沟通领域,这主要是由于之前重度游戏中玩法对于语音能力的定位更多是沟通方式而非创新玩法,使用场景对于实时语音携带方位感诉求也不强烈。

腾讯云一站式语音解决方案接入方式简单便捷

一.可听范围的设定

2017年一款游戏《绝地求生:大逃杀》,通过创新的百人大逃杀、胜者吃鸡玩法,短时间获得了全球玩家的青睐和追捧。除了游戏玩法本身的创意之外,游戏对于实时语音玩法也进行了颠覆式创新。游戏过程中玩家可以设置【全体模式】向附近的玩家喊话、挑衅、搭讪,这种语音模式可以与陌生人进行很有趣的沟通和互动。社交媒体上已经有很多用户基于这种语音模式,创作了很多趣味视频。

事实上,腾讯云一站式语音解决方案的功能远不止于此,作为一站式语音平台,还可以提供游戏内实时语音聊天、3D实时语音、离线语音消息及语音转文本等功能。

一场吃鸡游戏初始共100个玩家,那么游戏开始时,这100个玩家加入一个语音大频道,默认每个玩家的语音是静音状态。设定可听范围是以玩家为圆心,半径为R的圆形范围。有其它玩家走入这个圆形范围内,两者的语音自动解除静音,此时说话就能互相听到了。

而引入3D位置语音之后,玩家在喊话过程中会暴露自己的方位和位置信息,玩家的声音也会根据位置变化而实时改变。可以说,3D音效让《大逃杀》这种玩家间的沟通和战斗体验更真实,感受更加沉浸式、更加身临其境的吃鸡玩法。

实时语音功能支持超大房间和陌生人喊话、跨队员发言和权限管理模式,通过专利算法消除回声和环境音,还原清晰音质,为游戏、直播等行业用户提供更优质的语音通话体验;3D实时语音基于HRTF、3D空间处理技术以及针对距离的EQ补偿技术,将无方位感的语音虚拟为带有空间位置信息的声源,为游戏玩家带来沉浸式的游戏体验。此外,离线语音功能为全球用户提供120种语言的语音转文字服务,让语音交流无国界。

图片 2

编辑:书评随笔 本文来源:腾讯云首推一站式语音解决方案,如何实现

关键词: