基于机器人智能语音交互的大屏中央控制系统应用研究
赵静 文小庆 刘红
生成PDF 清样下载 引用

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

赵静 文小庆 刘红,. 基于机器人智能语音交互的大屏中央控制系统应用研究[J]. 中国电气工程,20225. DOI:10.12721/ccn.2022.157046.
摘要: 智能显示技术包括交互显示与控制,是显示技术与人工智能场景结合的交叉技术。设计一种人工智能型、交互方式简单、实用性强的大屏显示与控制系统具有重大意义。本文阐述了一种基于机器人智能语音交互的大屏中央控制系统,其将人工智能技术引入大屏显示领域,作为大屏显示系统提升应用范围、改变人机交互方式、增强用户体验和实用便捷度的重要方法。最终通过研究实现大屏系统的非接触式人工智能交互、中央控制能力提升、远程访问与管理水平提高,增强其智慧化水平和实用价值。
关键词: 机器人;智能语音;中央控制;大屏显示系统
DOI:10.12721/ccn.2022.157046
基金资助:

大屏显示系统在控制室的应用场景多体现其“中央”控制的地位。它一方面是所有外部信号聚集和可视化呈现的“中央”终端,另一方面还是用户用于分析数据、指导决策的“中央”中枢。大屏已从单一的显示设备升级为智能中央显示与控制系统。我们拥有具备自主知识产权的“综合性的基于拼接大屏幕的可视化综合管控应用平台系统”,其人机交互方式主要通过移动触摸终端(比如IPAD或智能手机)。开发一种人工智能的非接触式控制方式,不仅可以在“新冠疫情”背景下规避因接触带来的病毒传播风险,而且增加智能化水平和用户便捷度。因此,作者设计了一种基于机器人智能语音交互的大屏中央控制系统。

1 交互的人工智能升级

“综合性的基于拼接大屏幕的可视化综合管控应用平台系统”不仅能够实现大屏系统内的信号调度、管理和控制,也能通过控制系统实行对控制室内的所有“带电”设备进行综合管控,革新传统中控系统,降低成本。而可视化的触摸交互软件存在操作按钮与菜单设置复杂、界面切换的模式过多、容易出现失误操作、用户学习麻烦及增加病毒传播风险等一系列题。为进一步升级优化上述问题,我们针对控制系统进行人工智能升级。下图1为机器人智能语音交互+大屏中央控制系统技术逻辑。

1.png 

图1 基于机器人智能语音交互的大屏中央控制系统技术逻辑图

首先由用户发出声音指令到语音采集模块,再由MCU编译器解释语音并转换为可视化控制器的控制指令,指导控制器做出各类信号处理和控制操作。语音采集模块+MCU编译器为完整的智能机器人,其可以通过网络远程学习已设置好的远程语音包。同时我们也可以通过网络远程访问机器人,拉进与用户的距离。用户现场通过发出声音指令替代了原来的平板触控,实现了非接触式交互。

2 机器人智能语音包应用

智能语音是链接人与机器对话的媒介,语音交互是机器能够认识和认知人的声音语言的关键,实现人机无障碍的语音对话依靠机器不断学习语音包去实现。本文阐述的机器人智能语音将“人的声音”、“机器人语音包”和“控制器的指令”通过机器人统一起来,其中“人的声音”提前存储于“语音包”,且语音包已经通过机器人反复训练并识别,用户在现场发出同样的声音指令时,机器人就能够迅速做出反应。

具体的语音识别链为:首先由机器人捕获用户声音,由语音采集模块接收数据并识别判断,当识别和配对失败会直接不予响应,若识别正确,将转入MCU编译数据,转化为对应的控制指令并发送至可视化控制器,命令控制器做出相应的响应动作。

3 机器人训练与形态设计

机器人出厂前必须完成包括处理原始语音、特征提取、噪声消除等过程的“机器人学习与训练”反复测试,以提高对声音的辨识度和容忍度。尤其对口音不同的各类用户或使用对象要增加方言训练,做到最大限度的容忍性。同时,机器人必须能学位认识自己,我们给其命名为“小丽同学”。以大屏开关机与信号源管理为例:用户发出“小丽同学、开启大屏”,其回答“在,小丽已为您将大屏打开了”;接着发出“上信号1”,机器人回答并将信号1打开在大屏上呈现。整个过程简单明了,无需其他辅助操作。具体的训练流程如下图2。

2.png 

图2 机器人训练流程

我们遵循模块化、轻量化、标准化和可靠性强的设计原则,将语音机器人与可视化控制器配套,做成类似小型机顶盒样式并设置好与控制器的通信接口和对外的网络接口,直接植入可视化控制器,实现模块化的可插拔,便于出厂装配、使用者维护及其自身学习与远程通信。

4 远程访问与管理关键配置

设置语音服务器用于存储机器人语音包(库)较为关键,且该语音包(库)包含各类丰富的语音素材,我们将其分为可视化控制语音部分和其他语音部分。在机器人设计的过程中植入了自动更新模块,即其可在网络上(如用户非保密单位)寻找到我们的语音服务器,完成自动下载、更新的学习过程,无需上门更新,提高工作效率。例如,当控制器的指令集升级更新时,机器人可以自动访问学习并同步更新。

其中,语音包分为自我认识语音包、控制指令语音包、用户聊天/娱乐语音包等;双向远程访问模块包括机器人访问服务器模块、机器人下载模块、上传服务器模块、远程访问机器人模块和用户反馈模块等。

4总结

综上所述,能清晰地了解我们所设计的基于机器人智能语音交互的大屏中央控制系统的软、硬件关键配置与部署,将机器人语音识别控制、人机非接触互动控制、远程访问与诊断管理等技术方法集成到现有控制系统中来。使其智能中央控制水平、人工智能水平和用户使用便捷度都得到提升,体现较高的技术价值,且远程的访问、诊断和管理能力大幅增强用户体验和黏性。尤其在“新冠肺炎”常态化背景下,还能规避因接触带来的病毒传播风险,进一步增加其可用度,具有很好的应用前景。

参考文献:

[1]罗亮, 刘红, 秦迪,等. 基于拼接大屏幕的可视化综合管控应用平台系统设计[J]. 信息技术与信息化, 2020(3):2.

[2]胡钊龙, 李栅栅. 语音识别技术在智能语音机器人中的应用[J]. 电子技术与软件工程, 2021(13):2.

[3]孟繁中. 基于智能语音识别的机器人研究应用[J]. 电子乐园, 2020.

[4]辛卫华. 嵌入式专用MCU设计与实现[D]. 西北大学.

作者简介:

赵静,1989年07月,女,大学本科;籍贯:安徽;研究方向:展厅智能化设计;单位名称:上海济丽信息技术有限公司;单位所在地:上海;邮编:201908;