全国统一服务热线 0791-87879191

新闻资讯
产品中心
楼宇自控 智能照明 智能建筑管理 智能传感 智慧物联 智能组态 阀门自控 智慧监管
经典案例
楼宇 工厂 酒店 文博 枢纽 行业
关于我们

康沃思以数字、 物联、 数据、 AI为基础,以自主研发的DDC产品和自主领先的物联网框架,聚焦智能建筑和行业数字化转型,建设物联网基础设施。

0791-87879191

搜狗王砚峰:智能家居语音交互要做什么,怎么做

时间:2022-11-22

2016年8月18日,深圳国际智能家居及智能硬件博览会正式开幕。全国多位智能建筑、智能家居专家、学者、商界领袖等业内人士出席,共同探讨“开放——共建共赢智能家居”“生态”主题分享交流。会上,搜狗语音交互技术中心高级总监王艳峰就智能家居语音交互的“为什么”、“做什么”、“怎么做”发表了自己的看法。

为什么在您的智能家居中使用语音交互?

互联网女王 Mary 的 2016 年《互联网趋势报告》指出,语音是目前最有效的输入和计算方式,2015 年有 65% 的美国用户使用过语音助手,其中 43% 使用在家中,凸显语音交互在智能家居中的重要性。

王艳峰表示,新技术、新产品的推广使用要有刚需,语音交互的刚需存在于驾驶、客厅、户外等不方便使用的场景。键盘打字。他认为,要想给用户带来价值,有必要在这三种场景下做出深沉的语音体验。

语音交互应该做什么?

王艳峰认为,实现语音的产品首先不应该是所谓的“中控”,因为“中控”并不是一个具体的产品;也不是所谓的“机器人”,因为目前的辅助机器人无法帮助人们解决任何实际问题。需求和问题;他说语音智能家居,“任何夸大人工智能在客厅产品中的作用都是流氓行为。”

王艳峰提出客厅语音应用的两个标准:好的产品和丰富的内容。他说,例如语音智能家居, Echo 就是一个很好的产品。首先,它是一款不错的音箱,适应了美国家庭用户的消费文化和习惯,所以在美国是一款不错的产品。

语音要在好产品中产生价值,需要丰富的消费内容资源。语音仅仅作为一个控制器并没有给设备增加太多价值,但在内容查询和更多交互方面,它是语音最有价值的使用场景。 “语音识别是耳朵,语义理解是大脑,智能家居要让语音自然交互,需要更灵敏的耳朵和更聪明的大脑。”王艳峰指出。

如何让语音交互更好?

如何让语音交互更好?王艳峰认为,训练语音识别“更灵敏的耳朵”需要海量的高质量语音训练数据和深度学习技术能力的积累,而搜狗在这方面具有巨大优势。据他介绍,搜狗拥有中国互联网上最大的语音语料库:作为中国最大的语音输入应用,搜狗输入法日语音输入频率1.4亿次,生成11.70,000 hours 语料规模大于国内任何语音技术团队使用的训练语料。另一方面,深度学习技术不断降低语音识别的错误率。从2013年开始,借助深度神经网络和海量用户数据,搜狗输入法的在线错误率在过去几年下降了60%以上。

借助语料数据的“燃料”和深度学习的“引擎”,目前搜狗输入法的语音识别准确率已超过97%。对于剩下的3%,以目前的技术水平无法做到,王艳峰指出,“这叫做语音识别最后一公里的问题。”随后他介绍,搜狗输入法今年推出了语音修改功能。借助自有词库、拆分字库和用户语料库,以及知识图谱的支持,用户错误率降低了80%,有效解决了语音识别“最后一步”的难题。公里”的问题。

至于更聪明的“大脑”,王艳峰表示,传统的通用语音助手不如基于场景的专用语音交互实用。他指出,通用语音助手很难解决用户的各种问题,面临着用户体验差、用户反复批评的困境;而搜狗则通过多轮对话、技术地图等方式提升了自己的技术能力,并明确了使用场景。为了降低问题的难度,“将对话能力、知识图谱和特定场景结合起来,语音交互的处理能力、智能性和实用性才能更好。”