ZKX's LAB

更懂用户的功能升级!AI语音场景应用,隔着手机屏幕轻松操控

2020-12-14新闻8

原标题:更懂用户的功能升级!AI语音场景应用,隔着手机屏幕轻松操控

智能手机发展到如今,可谓是最为改变格局的产物,在学习、生活、工作的各方面起到了不仅是连接桥梁的作用,更多的是获取知识、交流沟通、娱乐休闲、操控应用等一系列的复杂操作。对于数码爱好者来说,玩过的智能手机太多,期待和改进都是并行的。离不开手机的操作,当然注重效率讲究的是速度和准确,这一点百度输入法满足了我很多场景的需求。

工欲善其事必先利其器,好的工具用起来得心应手、事半功倍,百度输入法最近更新不少新的功能,对于『滑行输入』、『手写模型升级』在前文已经和大家介绍了,这一次谈谈我日常用得最多的输入功能以及百度更新后带来的升级效果。语音输入带来的方便和效率确实让人离不开,因为方便啊高效啊快捷啊!

互联网企业开始注重新的技术投入,AI人工智能在硬件和软件方面实现全方位应用,这还是基于多年的搜索功能和大数据算法的条件下做了很多改变。百度的语音输入一直在突破,之前的几大功能应用起来已经很不错了。在线语音转文字,在不方便语音的情况下、快速输入文字显示的情况下、高效记录文字的情况下使用比较多,日常也是我重点使用的方式;其他三个方面:离线语音、中英自由说、方言自由说也是本子百度输入法升级的重点。

『全感官输入』AI时代讲究的是多方面体验,键盘、语音、表情、动作都是输入的重要方式呈现。以前有些输入法在没有网络的情况下,想要输入操作必须先下载很大的语音库,再慢慢去识别查找。百度离线语音操作就不用这么麻烦,中英自由说这种中英文混合输入之前就体验过了,日常多场景复杂使用可以自动识别和高效给出答案,将离线和中英自由说合起来就是带来新的离线中英自由说。中英文混合建模技术很好应用,百度提出基于低帧率、低比特的中英文SMLTA模型,并且采用神经网络语言模型替换传统的N元语言模型,这就离线识别体积就被大大缩小;基于Attention的端到端离线语音识别模型应用,保证了离线网络语音识别的速度大大提升,这也是百度此次领先于其他产品的强势竞争力。

实际离线下测试,看到文档第二段就是离线情况下的输入,普通话的时候自然识别中文;切换成中英自由说的时候,发现iPhone手机很好识别,自己知道字母的大小写;对于华为Mate来说应该是大写“M”,估计后续学习就能改正了。

方言其实是很有地域代表特色的,因为很多人的口音随着地理很难改变,而且习惯了用方言在输入法也要更多适配。之前百度输入法就支持太多方言,这一次新增支持3种地方方言(河北、昆明、武汉)和6种重口音南方话(福建、广东、湖南、江西、四川、吴语)的识别,给不少喜欢用方言的人带来更好的识别。估计快了,其他地区的方言也要适配了,这个等等就好了,你的家乡方言是啥呢?

语音输入其实很好玩,毕竟带来的识别以及其他功能可以应用场景很多,高效准确是我最看重的。没想到百度还可以带来更多惊喜,洞察用户的需求,用语音输入制作表情包,『表情斗图』丰富多彩更有意义。和妹子聊天可以玩玩俏皮增加气氛,给领导发信息可以丰富没有文字的表达。比如我就是“渺渺望水”,用这个标签是不是很赞啊?

语音输入更懂我,这是我百度输入法给我的直观感受,当然其他功能也很适合,喜欢输入的方式不同、习惯操作也不同。这就是百度多元化应用AI带来的全感官输入妙处,考虑到所有用户的需求,这样就使得小应用有着大功能的效果和体验。

#百度

随机阅读

qrcode
访问手机版