ZKX's LAB

让听障者“看见”声音

2020-09-03新闻13

智能手机和各种科技软件为无障碍服务提供技术支持。

随着科技的进步,智能手机的无障碍设计和应用设计也在不断提升。

近来聋哑外卖骑手因无法接听电话、工作艰辛屡上新闻,令人动容。如果在一款智能APP里,交谈对象的音频会被即时转换成字幕,以基本无误的高准确率显示在手机屏幕上,从而实现无缝交流;以自动语音识别为核心技术连接智能家居,听障人士在居家生活中将能像普通用户一样……这样的智能应用展现了一个无障碍的生活场景,开始慢慢帮助听障人士打开沟通的大门。

如今,装载无障碍功能和相关应用的智能手机在这些特殊群体里的生活中扮演着越来越重要的角色。越来越多的手机上下游服务商为无障碍措施提供技术支持,体现互联网科技浪潮下的越来越贴心的人文关怀。

文/广州日报全媒体记者吴阳煜 图@视觉中国

应用场景一: 听障人士看见“声音”打破沟通断层

根据世界卫生组织的估计,全球共有超过3.6亿的听力障碍者。而在中国,据北京听力协会评估认为,截至2017年,全国已有超过7200万名残疾性听力障碍人士。“如果技术能跨越声音的障碍,或许能带来很多改变。”面对听障人士和健听人群之间存在的沟通断层,专注解决这一交流痛点的广州音书科技有限公司创始人石城川向广州日报全媒体记者表示,“要结合语音识别技术,从而实现听障人士‘看见’别人说的话。”

随着语音识别技术向交互方向倾斜的趋势明显,在实现高准确率的语音与文字实时转换技术基础上,一台安装了无障碍功能对话应用的智能手机,就是生活在无声世界里的听障人士打通与社会外界交流断层的“福音”。

“音书”是音书科技创业团队在2017年通过语音识别底层技术开发的一款专属于听障人士的社交软件。通过该APP,交谈对象的音频会被即时转换成字幕,以基本无误的高准确率显示在手机屏幕上,从而实现无缝交流。随着音书APP的不断迭代,已经集成语音识别、语音合成以及语音评测引擎,提供包括远距离翻译、电话沟通字幕等在内的多场景个人字幕服务,同时,软件还加入了言语康复服务和手语服务等复健辅助功能,逐渐发展成为一个从延伸至线下不同实际场景的听力言语障碍群体服务平台。听障人士只需点开软件,即能将彼此的交流以字幕形式迅速呈现在眼前,实现即时交流,看见“声音”。

应用场景二: 在线课堂搭配速记字幕保证教学质量

完成适配这样的面对面交流场合后,在应用市场开发者的努力下,语音识别技术继续拓展延伸,深入到更多不同的实际生活场景中。

今年年初以来受疫情的影响,上网课成为学习必不可少的方式,而这对于听障学生而言,则迎来了更大的挑战。就在2月份,音书科技推出了智能字幕速记系统,帮助特教老师在线上备课或者线上直播授课时自动生成字幕,提高授课效率,以便听障学生更加高效获取授课的信息。

在具体使用场景中,老师使用录播软件提前备课,边播放PPT边讲解,即可自动生成视频字幕,无需进行后期剪辑工作,就能发送给听障学生。另外,特教老师如果通过直播软件进行线上教学,通过语音识别技术也可在线翻译老师的讲话内容,帮助听障学生们理解知识点,确保教学工作的正常运行。“我们做了统计,几个月里通过这套系统帮助了40所特殊教育学校、600多位特教老师。”石城川告诉全媒体记者,在远程授课的过程中,有听力障碍的学生可以一边观看老师的教学画面和课件内容,一边结合字幕理解,通过形成字幕培养其普通话的语感,还有利于这些特殊孩子们表达能力的提升。

应用场景三: 听障老人家对着字幕打电话

公开数据表明,中国广泛存在的听障人士中,老年人数量最多,达到约占83%以上的惊人比例。老人家情感需求增长强烈,面向这群听力受损的特殊老年人群体,沿用语音识别核心技术的字幕固定电话机也成为解决他们社交沟通问题的重要工具。

接打电话的时候,对方的音频内容会通过联网的电话机传回开发公司云端服务器,先经过预处理操作,将其中的噪声降到最低,音质的纯净值达到峰值后再做音频转化处理,将这些语音内容同步上传和翻译,逐字逐句显示在老人家接听的固定电话屏幕上。

“这样一台字幕固定电话机并不仅仅是纯粹实现手机APP功能这么简单,还需对底层硬件做优化,相当于一台智能终端。”在音书科技CTO陈国强看来,字幕固定电话机的研发更为重要的意义在于,自动语音识别服务听障人群技术逻辑的延伸,在未来将极大拓宽无障碍功能的延展空间,针对用户的需求更大程度丰富不同的应用场景:“未来配合物联网技术,可以通过不同新的智能硬件,就能适用服务于不同场景的听障人群,比如独居在家的老人家不小心跌倒或突然发病,无法动弹的情况下,还可以利用语音识别技术呼救向外界报告;再比如识别出车辆鸣笛声等交通信号,当后方有车辆接近时手机震动,及时为听障人士做安全提醒。”

“从科技发展的角度来看,各家品牌厂商对无障碍服务功能的投入研究并不在于技术难度,而是要用心从实际使用者的具体需求出发考虑。按照目前整体技术研发水平,完成一个产品或服务的闭环不是太大的问题,这也将使得开发者看到未来更多的商业机会。”艾媒咨询首席分析师张毅认为,除了基础沟通以外,使用语音识别技术帮助听障人士解决社交问题的移动端产品,如果能对后者提高社会参与度提供更为畅通的实现途径,必然会产生巨大的商业价值。

科技让无障碍服务愈发完善贴心

手机软件更新

加大无障碍设计力度

针对残障群体,各家手机厂商正逐步加大无障碍设计力度的考虑。今年4月,小米发布MIUI12系统,全面升级系统自带各项无障碍功能。在辅助视觉障碍用户使用上,添加日常使用场景提醒功能,屏幕锁定时主动提示屏幕已关闭,开启后主动提示时间与上滑解锁操作。特别是在拍照时,相机不仅支持检测到人脸,还支持提醒人脸在镜头的位置,让视力障碍人士也能举起手机记录生活片段。在辅助听觉障碍用户使用上,通话时只需先录制一段首句问候语,对方接听电话后便可直接播放。

此前2019年10月,正式发布的坚果Pro手机搭载了科大讯飞的听障模式语音转文字功能。苹果手机里自带的“旁白”屏幕内容阅读器,使得iOS系统内所有应用都能被朗读或提示出来,而对于弱视或是色盲用户,iOS自带的放大镜、反转颜色以及启用灰度模式等功能,都能够让这部分用户比较顺利地使用手机。

移动软件优化无障碍功能

除了手机厂商以外,更多的移动端开发公司也越来越关注残障人群的需求,在自家产品迭代升级中新增优化贴合残障人士实际需求的无障碍功能。视障人士把手机举到耳边,手指划过屏幕上一个个应用,手机里便能不断传出这些应用的名称从而准确定位应用位置;把视障人士所处的周围环境处理为3D空间模型,通过超声波传到他们耳中,通过耳机语音或是通过创造细微的智能手机震动,提供更加精准的定位和导航;定位器系统与手机联接后,不论失智老人或残障人士、儿童去向哪里,只要是有网络覆盖的地方就能知道他们身在何处,让监护人随时了解被监护人的精确位置……越来越多的手机上下游服务商为无障碍措施提供技术支持,体现互联网科技浪潮下更加贴心的人文关怀。

“基于互联网产品本身的无障碍优化,尤其是在对于视障者的优化上面,更重要的意义是在日常高频使用的社交产品中,对我们习以为常的功能做更加深度的改进升级,完成无障碍的适配后使其能够被更多的特殊用户上手。”深圳市信息无障碍研究会秘书长杨骅向全媒体记者表示,以我们在日常生活中熟悉的QQ社交产品为例,对于同样有社交需求的视障人士而言,只有各种因盲操产生的细节问题得到优化,这样的社交应用才具有实用意义:“用户上传到QQ空间的照片等社交内容,通过引入AI识图技术,视障人士在‘浏览’这些图片时就能了解到对应的文字描述,比如几个人在什么场合做些什么,让视障者有更生动的使用体验。”

#AI人工智能

随机阅读

qrcode
访问手机版