面向服务的软件工程——面向过程的系统分析:流程挖掘(week10)
文章目录
- 一、前言
- 二、重点概念
-
-
- 面向过程的系统分析:流程挖掘
-
- 流程挖掘概述
- 流程挖掘与数据科学的关系
- 流程挖掘中的关键问题
- 关于流程挖掘的常见误解
- 应用场景
- 流程挖掘的总体概述
- 流程挖掘的三个技术场景
-
- 流程挖掘的起点:日志数据
- 流程挖掘中的一些符号
- 日志条目示例
- 事件日志的通用结构
- 事件日志
- 执行日志
- 执行日志格式
- 执行日志的进一步抽象
- Alpha算法
-
- 流程挖掘的定义
- 执行日志示例
- 顺序关系
-
- 执行日志分析(顺序关系)
- Alpha算法
-
- Alpha算法的基本思路
- Alpha算法的例子
- Alpha算法的完整性
-
- 三、题目
一、前言
本章内容主要是介绍流程挖掘,流程挖掘过程当中又会有一个重要的算法叫Alpha算法,这个部分概念与文字部分是比较难理解的,建议大家先看一遍概念之后,对这个算法的操作有一些具体的了解,之后开始看题目分析。其实很多概念是没有那么重要的,但是为了保证本章内容的全面性,我基本都纳入了进来。,重点我会提醒标注出来,这样可以提高效率。同时,这门串联性也是很强的,需要先学习之前的内容,才能快速的理解本节课的重点内容与题目。
二、重点概念
面向过程的系统分析:流程挖掘
流程挖掘概述
- 流程挖掘是一类用于流程管理的技术,这些技术通过分析事件日志来支持业务流程的分析。
- 在流程挖掘过程中,会应用专门的数据挖掘算法到事件日志数据上,以识别事件日志中记录的趋势、模式和细节。
- 流程挖掘的目标是提高流程的效率,并加深对流程的理解。
- 流程挖掘的主要目的是利用事件数据提取与流程相关的信息。
流程挖掘与数据科学的关系
- 流程挖掘可以看作是数据科学和流程科学之间的缺失环节。
流程挖掘中的关键问题
- 何时以及有多少个流程实例被执行?
- 在活动执行中是否存在重复的模式?
- 是否可以从数据中提取出流程模型?
- 在流程模型中,哪些执行路径被使用?
- 是否存在从未被使用的执行路径?
关于流程挖掘的常见误解
-
流程挖掘仅限于发现控制流:
- 实际上,流程挖掘不仅限于控制流的发现,还可以找到与组织模型、案例模型相关的信息,以及时间约束和其他信息。
-
流程挖掘仅限于离线分析:
- 通常,流程挖掘从历史事件数据中提取流程知识,但它也可以应用于正在运行的案例。
-
流程挖掘只是数据挖掘的简单应用:
- 事实上,流程挖掘支持并发语义的流程模型来表示挖掘的结果,而传统的数据挖掘技术无法有效解决这个问题。
应用场景
- 流程模型发现:从日志数据中挖掘流程模型。
- 合规性检查:通过比较模型和日志来监控偏离情况。
- 流程模型的演变/增强。
- 社交网络/组织挖掘。
- 自动生成仿真模型。
- 案例预测。
- 基于历史的推荐。
流程挖掘的总体概述
流程挖掘涉及从事件日志中提取信息,以发现、监控和改进流程。
流程挖掘的三个技术场景
-
流程发现(Process Discovery):
- 这是从日志数据中推导出流程模型的技术。
- 输入:带有时间戳和案例ID的活动的有序列表(执行日志)。
- 输出:能够生成执行日志的流程模型。
- 注意:案例ID通常不直接出现在数据中,需要在预处理阶段生成。