发布网友 发布时间:2022-04-21 00:07
共1个回答
热心网友 时间:2023-07-20 19:26
语音一定是趋势,但会不会是最主流的交互方式,还难说。
人机界面的演化轨迹,从偏向机器的一端(CLI),移向人的一端。
在没有智能机器的时代,「界面」也没有存在的意义。在技术发展的早期,「机弱于人」,于是人需要按照机器的逻辑和语言与之进行对话,于是有了 Command Line Interface。后来,机器性能逐步增强,人们就找了一套更人性化的语言 Graphical User Interface 套在机器的实现之上。
但是 GUI 依然有不少缺点,因为它还是不够「自然」,需要人们去学习和理解。为什么不够「自然」呢?因为在真实环境中,人与人、人与外界的互动,主要通过语言、姿势、动作等来完成。要让人在一块屏幕上面「假装」操作物体,其实非常别扭。
所以,当机器越来越强,到了「机强于人」的时候,人就可以回归到自然的状态,用早已习得的技能跟机器互动。于是语音、手势、其他身体运动都会成为未来交互设计的趋势。
当然,语音交互也不是万能的:
- 语音识别的准确率仍然不理想
- 语音输入受到环境的影响
- 有很多场景不适合用语音
- 语音不能传递所有信息
所以它不会成为独占式的交互方式,而更可能与其他交互方式(如手势)一起成为一套交互范式。
那么,目前语音交互主要能做到哪些事情呢?
- 识别和记录。比如讯飞,把一段语音识别出来,代替人去做记录的工作
- 辨别身份。比如微信的声音锁,用声音作为身份识别,提高安全性
- 执行简单命令。比如 Siri
- 在正常对话中智能应答。目前应该还没有真正做得好的产品
近两年深度学习研究为语音识别带来了不少突破性进展,2016年10月微软宣布他们的语音识别系统实现了和专业转录员相当甚至更低的词错率,达到了 5.9%。也是在这个月,Google 发布了神经网络翻译系统。这些进展会加速语音识别和语音交互的进展。不论未来语音会不会成为最主流的交互方式,它都一定会是人工智能、新的人机互动方式的重要入口。