电信网上营业厅:广东电信,江苏电信,山东电信,浙江电信,河南电信,四川电信,湖北电信,湖南电信,河北电信,福建电信,上海电信,北京电信,安徽电信,辽宁电信,陕西电信,江西电信,重庆电信,广西电信,天津电信,内蒙古电信,山西电信, 黑龙江电信,吉林电信,贵州电信,新疆电信,甘肃电信,海南电信, 宁夏电信, 青海电信, 西藏电信,

AI无障碍能为我们带来什么? 语音识别后又有手语

01-21 智慧家居

 什么是无障碍?手语翻译的代表人物韩清泉老师是这样解释的:对于大部分听障人士来说,观看各类频道内容的主要无障碍措施就是字幕。但这个字幕不仅仅是标题和概括性的描述,而是需要“即时逐字字幕”。即便目前的语音转文字技术无法实现100%准确,但足够听障朋友们接受和理解信息。

此前,B站为听觉障碍观众提供便利,推出了无障碍英雄联盟S11游戏解说直播间,实时AI语音识别生成字幕,解说的游戏“黑话”基本都能准确识别,赛后采访还有手语解说。虽然有明显高达三十秒的延迟,但也得到了收看观众的一片好评,弹幕反响热烈。网友表示:“这波,格局打开了。”
其实,像这种直播字幕背后的AI实时语音识别技术,市面上已有不少应用了,包括油管的直播字幕、谷歌移动设备的视频字幕和微软PPT演讲字幕等,都属于这类技术。
不过,专门为直播留出一个无障碍直播间的平台,相比平常的AI语音识别转换,技术难度增加了不少,因此实行起来更加困难。
为了让字幕流更加稳定(能输出整段整句)、准确率也更高,B站做出了不少努力:
其一,B站专门梳理了英雄联盟赛事相关的500+专有词汇,包括战队、选手、赛区、游戏英雄名称、比赛术语、解说相关术语、S赛名句等等,将这些词汇接入到讯飞听见服务器中,进行转译结果优化处理;
其二,在文字处理部分,B站将流式ASR输出的文字,根据阅读习惯进行自动换行,使之更符合用户的视觉理解;
其三,针对整体阅读体验,专门制作了一款辅助软件,将人工复查操作进一步流程化,进一步为听障人士提升字幕准确率。
这也解释了B站无障碍直播间有所延迟的原因——为了提升观众的字幕阅读体验。
那么,语音转文字后为什么还需要手语辅助呢?韩清泉老师在回答网友疑问时道:两个会手语的朋友在交流的时候,如果有文字和手语两种方式选择,他们一定会毫不犹豫地选择用手语交流,因为用手语交流有非常强烈的代入感。更重要的是,这能让听障朋友们强烈地感受到被这么多人关注着,特别温暖。
科技本身应该是无障碍的,有温度的。放眼整个互联网行业发展历程和社会环境,B站这种对残障人士的关怀思考,其道不孤。
腾讯优图实验室19年就通过自研算法实现了对复杂手语表达
的识别技术突破,并联合深圳市信息无障碍研究会,发布“优图AI手语翻译机”。听障人士只要面对摄像头做手语,经过后台计算机高速运算,翻译机就能快速把手语转换成文字,让健听人士秒懂。
这款翻译机能识别听障者大部分的日常手语表达用语。其背后的手语识别数据集覆盖了近千句日常表达,900个常用词汇,是全球最大的中文手语识别数据集。只需要一个普通摄像头和一台高性能电脑,就可以识别手语并快速翻译,让听障人士不再“尬聊”。
21年11月,央视新闻联合百度智能云推出的首个AI手语主播,旨在“用技术跨越声音的障碍”。这位AI主播形象亲切自然,不仅能报道冬奥新闻,还能进行准确及时的赛事手语直播。
依托百度智能云的语音识别、自然语言处理等人工智能技术,构建出一套复杂而精确的手语翻译引擎,实现了文字及音视频内容到手语的翻译。再通过专为手语优化的自然动作引擎,进行虚拟形象的互动,将手语实时演绎为数字或人的表情动作,使得特殊人群也能了解比赛动态,深切感受到比赛的激情。
人类费尽心力开发研究人工智能,提高唇语、手语识别的准确率,还有很多更为广泛的用途:比如应用于金融在线业务的生物识别、噪声环境下辅助语音识别、辅助听障人士交流、体育赛事暴力语言识别等多个领域,这些都是有着实际意义且颇为重要的应用场景。
 
图片来源于网络,如有侵权请联系删除。

版权保护: 本文由 电信网,中国电信,中国电信网上营业厅,中国电信客服电话,中国电信营业厅,中国电信宽带,电信宽带套餐价格表,电信宽带套餐,中国电信宽带官网 原创,转载请保留链接: http://www.189e.com/html/9359.html

公众号电信服务
电信网(189e.com)是一家有关电信固网业务、移动业务、通讯终端等服务的资讯平台!同时为用户提供附近营业厅带宽资费导航服务,详细资费以人工客服咨询为准。
  • 文章总数
  • 1514537访问次数
  • 建站天数
  • 标签