《智能决策技术及应用》笔记
团支部有读书会活动可以报销,我挑选买了一本《智能决策技术及应用》(刘丽兰 等著),这本书分三篇,第三篇实际应用是在智能制造产业上就对我没啥大用。
内容其实都是主流的,但是编排上是有独特组合的,所以我只放总结目录+一些我觉得有意思应该记录一下的东西,每个再写两句自己的备忘(其实基本都在研究生课程学过了)
第1章 绪论
智能制造支撑技术与平台:人工智能、工业大数据、云计算、工业互联网、边缘计算、信息物理系统、数字孪生
智能制造中的决策问题:设备级决策、产线级决策、系统级决策;设备管理决策、生产管理决策、柔性管理决策、智能调度决策、人机协作决策
第一篇智能决策方法
第2章 数据感知
现场总线及工业以太网技术
第3章 数据分析
3.1数据预处理
数据清洗(缺失值处理、离群值处理、噪声处理、异常值处理);
数据集成(冗余分析、相关分析、冲突值检测与处理);
数据变换(离散化、二元化、规范标准化、特征转换与创建、函数变换);
数据规约(数据聚集、数据抽样、维规约)
3.2数据仓库
规划、需求研究、问题分析、仓库设计(选取待建模事务、选取食物处理粒度、选取用于每个事实表记录的维、选取将安防再每个事实记录中的度量)、数据集成和测试、部署数据仓库。
3.3数据特征提取
主成分分析法(PCA)、线性判别分析(LDA)
3.4数据分析
关联分析;分类;聚类分析(K-means、K-medoids);
聚类基本方法(划分、层次、基于密度、基于网格)
第二篇智能决策方法
这本书是按照人工智能三大学派划分的,其实也可以按照“启发式算法”这种来划分。
第4章 统计推理
4.1贝叶斯决策
验后分析是统计分析的主要方法,而贝叶斯决策方法是验前分析的方法。
验后分析会牵扯到两个问题:是否需要对信息追加,如果追加信息应该采取什么样的策略行动?
再做调查,可以获取修正后的先验概率。
采集新信息的收益大于损耗时,决策者才会去收集新信息,否则只要选择最优的验前策略就能获得最大收益。
4.2马尔科夫决策
过程具有马尔可夫性质:给定现在状态,随机过程与过去状态是条件独立的。
过去对于预测将来的状态是无关的;每个状态的转移只依赖于之前的n个状态,这个过程被成为一个n阶模型,n是影响转移状态的数目。
马尔可夫模型可以视为一个随机的有限状态机。
隐马尔可夫模型:描述一个含有隐含位置参数的马尔可夫过程。从可观察参数中确定该过程的隐含参数,然后利用这些参数进行进一步分析。
4.3K近邻(KNN)
是一种基于统计的数据挖掘算法。
消极学习算法:局部加权回归、K近邻(KNN)
积极学习算法:支持向量机(SVM)、神经网络
4.4决策树
基本的分类与回归方法,本质上是通过一系列规则对数据进行分类的过程。
CLS、ID3、ID4、ID4.5;CART
特征选择、决策树的生成、决策树的修剪
第5章 生物进化与群智能
5.1遗传算法
遗传学 | 遗传算法 |
---|---|
群体 | 可行解集 |
个体 | 可行解 |
染色体 | 可行解的编码 |
基因 | 可行解编码的分量 |
基因形式 | 遗传编码 |
适应度 | 适应度函数 |
选择 | 选择操作 |
交叉 | 交叉操作 |
变异 | 变异操作 |
主要参数(群体规模、交叉概率、变异概率、遗传运算的终止进化代数)
流程(编码、种群初始化、适应度函数、选择操作、交叉操作、变异操作、算法寻优(局部最优作为新个体染色体继续优化))
5.2粒子群算法
粒子描述(位置、速度、适应度值)
粒子速度更新公式(粒子先前速度、“认知”部分、“社会”部分)
算法构成(群体大小、权重因子、最大速度、邻域的拓扑结构、停止准则、粒子空间的初始化、边界条件处理)
PSO算法引入惯性因子。
各种不同鸟类为了某个共同的目标第而无组织的聚集在一起。
较好的全局搜索能力。
因不同设定而衍生出的类型:鸟群、狼群
5.3 蚁群算法
启发式因子、信息素挥发度、蚁群数量、总信息量、最大进化代数。
是正反馈原理+启发式算法相结合的一种算法。
第6章 人工神经网络
6.1前馈神经网络(FNN)
单层感知器、多层感知器(MLP,多基于它来用反向传播算法)
6.2卷积神经网络(CNN)
一种包含卷积计算、具有深度结构的前馈神经网络。
卷积层、池化层(降维操作)、批量归一化层(数据集归一化,确保同一分布)、全连接层(提取出的特征分类)、输出层;
网络的误差反向传播机制:损失函数(loss,计算正向传播输出结果与样本标签之间的差异)、全连接层梯度计算、池化层梯度计算、卷积层梯度计算。
6.3长短期记忆网络(LSTM)
一种循环神经网络(RNN),时间循环神经网络,为解决一般RNN存在的长期依赖问题而专门设计出来的。
门控单元模型
6.4强化学习(再励学习)
主体是智能体,思想是智能体与环境交互试错,利用评价反馈实现决策优化。
四大要素:策略、回报、动作、环境。
目标:学习一个策略,使选择的动作能从环境获得最大回报。
回报的计算,回报函数,为衡量长期使用值函数来代替回报函数(积累),一般将值函数或策略用一个函数表示(常用的近似函数有:线性函数、核函数、神经网络)
深度强化学习:用深度神经网络作为强化学习的非线性近似函数。
深度确定性策略梯度算法(DDPG):谷歌Deep Mind团队提出的深度强化学习算法,解决了连续动作空间的强化学习问题。它是一种无模型的离线策略演员-评论家强化学习方法。它的策略是参数化的。
6.5迁移学习
预训练模型的复用与微调:训练整个模型、训练一些层而冻结其他层、冻结卷积层
第7章 智能决策综合评价
7.1权重系数法
权重差异三方面原因:主观重视程度、客观作用程度、可靠程度
7.2 层次分析法
将人的思维过程层次化、数量化,并用数学为分析、决策、预报或控制提供定量的依据。
将决策问题的有关元素分解成目标、准则、方案等层次,用一定标度对人的主关判断进行客观量化,在此基础上进行定性、定量分析的一种决策方法。
7.3 TOPSIS法(优劣解距离法)
多目标决策分析中的一种常用有效方法。
把备选方案与理想最好解、理想最差解做比较,若某个方案是最接近理想解,同时远离负理想解,则该方案是备选方案中的最好方案。
7.4动态加权综合法
不同于以上的定常权(权值均为常数),解决语言评价的模糊性,
各评价指标标准化处理;构造动态加权函数(分段变幂函数、偏大型正态分布函数、S型分布函数);评价模型构建。
7.5 灰色关联综合法
“灰”表示部分信息明确、部分信息不明确,是一种介于完全知道和一无所知之间的中介系统
用于解决的问题:评判对象的某些因素不完全了解使评判根据不足;由于事物变化导致认知落后;受到事物伪信息和反信息的干扰导致判断偏差;
手段:对某次观测资料加以数学处理,达到更高层次上了解系统内部变化趋势、相互关系机制。
第三篇 智能决策应用
第8章 设备级决策
第9章 产线级决策
第10章 系统级决策
最后,在一个封闭的、被迫的工作环境中,我好像是失去了那个高效、快意的自己。
人如果知道自己想做什么,熟练的会那些该做的事情,而且手边工具齐全,真是一个非常幸福的事情(怪不得拼装四驱车比玩四驱车更有意思)。
人终有一死,如何把过程活的对自己最有意义,这条路该怎么走?
总之,无论好坏,可能自己所做的已经有别人做的更好,那也不能自己束手束脚什么也不做啊。