当前位置：首页 > article >正文

RPA除了和OCR、NLP技术结合，还能和什么技术结合？

article 2025/2/23 18:18:24

鉴于业内现在也经常把RPA称为数字员工，就虚拟一个人的形象来解答吧。

首先是头部，实现人的“听看说想”能力：

听：ASR（语音识别技术），主要用于听取和理解语音输入，让RPA能处理语音数据，可以用在需要用户互动或者语音控制的系统中。

看：OCR（光学字符识别技术），主要用于识别和提取图像或扫描文档中的文本，实现的是“看”文本部分功能，这个题主公司已经用到了，但还有一项CV（计算机视觉技术），这个技术主要用于识别、理解图像和视频，进一步补充RPA“看”的范围。

想：NLP（自然语言理解技术），主要用于理解和处理文本数据，能让RPA更好地理解任务信息，从而实现更广泛的应用范围。此外，这部分还可以引入机器学习、深度学习等技术，也就是现在很火热的大模型，能让RPA不断地自我深化学习，处理需要想象力、创造性、判断性的工作，比如决策判断、文章写作等。

说：TTS（语音合成技术），主要用于将文本转换为自然语音，让RPA可以与用户进行口头交流或提供口头反馈。

再往下就是人的四肢，实现“做”的能力：

做：RPA（机器人流程自动化），主要用于实现具备规则性的重复工作的自动化处理。

当然，除了通过技术结合强化RPA本身的应用之外，还可以通过流程挖掘技术进行RPA实施前的场景发掘、结合云计算技术使RPA能获得弹性计算资源、存储和分析工具，强化任务支持能力等。