最新it技术网

当前位置: 首页 > 网络营销资讯

科大讯飞发布会告诉你 原来直播还可以这么玩儿

本文作者:最新it技术网 更新时间:2019-09-02 10:06:29

  上周刚刚结束的科大讯飞年度发布会闹得沸沸扬扬,国内关于人工智能的话题再掀起一轮讨论高潮。关于发布会现场展示的智慧教育、万物互联讯飞输入法、讯飞听见多语种实时翻译等产品赚足了眼球;在另外一个世界,讯飞听见的直播字幕也在六大直播平台掀起一场轩然大波。

  实时字幕成大型会议标配 视频直播又有新玩法

  据了解,科大讯飞此次发布会通过腾讯视频及客户端、网易新闻客户端、喜马拉雅FM、咪咕直播、哔哩哔哩、ZAKER新闻进行全程视频直播。其实,企业大型发布会进行直播已成为企业扩大影响力、扩散传播的重要渠道,早已成为通用传播方式。科大讯飞此次直播的创新之处在于给各大直播平台的视频加上了实时字幕,而且基本没有延时。

  科大讯飞在2015年的年度发布会就已推出实时转写的讯飞听见智能会议系统,其高达95%的转写准确率和极快的转写速度惊艳业内外。自推出之后,讯飞听见已为300余场大型峰会、发布会提供实时转写服务,大型会议配备讯飞听见实时转写上屏似乎已成为行业标配。

  经过一年的产品迭代与技术打磨,科大讯飞终于在今年的年度发布会首次推出新的字幕展现形式。看各大直播平台的直播现场热闹非凡,很多观众都关注到讯飞听见的实时字幕。

\

  实时字幕为什么是双行显示?

  与传统的单行显示字幕不同,科大讯飞此次直播是双行显示。为什么要采取这种打破常规的方式呢?原来,讯飞听见的实时转写具有自动纠错功能,在持续转写的过程中,机器会根据上下文的语义进行纠错,这也就是在直播过程中我们会看到后面的文字出来后前面的文字有时会跳动改变的原因。

  同时,双行显示更便于观众阅读和观看。看视频走神儿或者被打扰错过一句两句,还可以看字幕获取相关内容,虽然是一个很小的细节,却延展了阅读的舒适度。

  其实,更重要的是,当遇到部分发音不清晰的演讲时,字幕的必要性就凸显出来了。

  语音转写方言是大敌 机器也晕菜?

\

  人工智能专家李德毅院士是江苏人,说话带有浓重的江苏口音,加之吞音、粘连等发音习惯,对于不懂江苏方言的观众来说,完全听懂李院士的发言确实很困难;对机器转写也是一个不小的挑战。

  其实,早在今年二月份,讯飞听见就已经在央视二套的《对话》栏目中为李德毅院士提供过实时转写服务,现场直接把李德毅院士的“我想问问科大讯飞”转成了“我想妹妹科大讯飞”,令人捧腹。李院士自己也表示,因为自己方言的原因,机器转写确实有难度。

  此次发布会直播的李德毅院士演讲部分,讯飞听见的直播字幕尤其吸引了直播观众的注意。当李院士演讲激动说话语速加快的时候,机器还是有点蒙圈的,讯飞听见甚至一度隐藏了字幕展示。但观看直播的观众集体刷屏要求展示字幕,表示没有字幕看直播太困难,呼声高涨,经过几分钟的暂停显示之后终于恢复字幕。其实,经过半年多的核心技术优化,机器对李德毅院士语音的转写效果有了很大提升。对普通观众来说,“看懂”比“听懂”来得更容易,更简单直接。

\

  透过字幕看传媒 语音技术的力量不可小觑

  除了用于网络视频直播外,实时字幕在传统媒体的应用也具有很大的想象空间。由于传统的字幕整理耗时费力,所以目前的新闻节目等电视节目均并未配套相应字幕。而随着移动互联网的发展,需要以字幕获取信息的场景越来越多。比如:在地铁、公交等电视节目播放场景往往因噪音问题而需要文字显示;在手机移动视频播放过程中,很多时候因为公众场所不方便放音而需要以字幕来获取信息;聋哑人通过字幕进行对视频内容的观看也有迫切需求,因为目前绝大多数节目尚无法提供手语。因此对新闻联播等节目提供实时字幕,不仅是移动互联网时代信息传播的大势所趋,也是对聋哑人等弱势群体人文关怀的重要需求。

  除了电视、网络视频节目的实时字幕应用外,智能语音技术对于媒资管理领域也有很高价值。当前传媒行业的音视频类节目资料库的原始数据标注大多仍采用人工标注的方式,不仅效率低下,而且耗费大量的人力、物力成本。通过智能语音转文字技术,可将海量历史音视频资源数据化,并与图片检索、语音标签检索、音视频监管相结合,大大提升资源利用率。

本文链接:科大讯飞发布会告诉你 原来直播还可以这么玩儿

上一篇:网络购火车票下月起将验证

下一篇:第五届广西发明展活动精彩纷呈

友情链接:

学佛 大悲咒念诵 心经讲解