当前位置：首页 > article >正文

《智能决策技术及应用》笔记

article 2025/4/2 15:42:47

团支部有读书会活动可以报销，我挑选买了一本《智能决策技术及应用》（刘丽兰等著），这本书分三篇，第三篇实际应用是在智能制造产业上就对我没啥大用。

内容其实都是主流的，但是编排上是有独特组合的，所以我只放总结目录+一些我觉得有意思应该记录一下的东西，每个再写两句自己的备忘（其实基本都在研究生课程学过了）

第1章绪论

智能制造支撑技术与平台：人工智能、工业大数据、云计算、工业互联网、边缘计算、信息物理系统、数字孪生

智能制造中的决策问题：设备级决策、产线级决策、系统级决策；设备管理决策、生产管理决策、柔性管理决策、智能调度决策、人机协作决策

第一篇智能决策方法

第2章数据感知

现场总线及工业以太网技术

第3章数据分析

3.1数据预处理

数据清洗（缺失值处理、离群值处理、噪声处理、异常值处理）；

数据集成（冗余分析、相关分析、冲突值检测与处理）；

数据变换（离散化、二元化、规范标准化、特征转换与创建、函数变换）；

数据规约（数据聚集、数据抽样、维规约）

3.2数据仓库

规划、需求研究、问题分析、仓库设计（选取待建模事务、选取食物处理粒度、选取用于每个事实表记录的维、选取将安防再每个事实记录中的度量）、数据集成和测试、部署数据仓库。

3.3数据特征提取

主成分分析法（PCA）、线性判别分析（LDA）

3.4数据分析

关联分析；分类；聚类分析（K-means、K-medoids）；

聚类基本方法（划分、层次、基于密度、基于网格）

第二篇智能决策方法

这本书是按照人工智能三大学派划分的，其实也可以按照“启发式算法”这种来划分。

第4章统计推理

4.1贝叶斯决策

验后分析是统计分析的主要方法，而贝叶斯决策方法是验前分析的方法。

验后分析会牵扯到两个问题：是否需要对信息追加，如果追加信息应该采取什么样的策略行动？

再做调查，可以获取修正后的先验概率。

采集新信息的收益大于损耗时，决策者才会去收集新信息，否则只要选择最优的验前策略就能获得最大收益。

4.2马尔科夫决策

过程具有马尔可夫性质：给定现在状态，随机过程与过去状态是条件独立的。

过去对于预测将来的状态是无关的；每个状态的转移只依赖于之前的n个状态，这个过程被成为一个n阶模型，n是影响转移状态的数目。

马尔可夫模型可以视为一个随机的有限状态机。

隐马尔可夫模型：描述一个含有隐含位置参数的马尔可夫过程。从可观察参数中确定该过程的隐含参数，然后利用这些参数进行进一步分析。

4.3K近邻（KNN）

是一种基于统计的数据挖掘算法。

消极学习算法：局部加权回归、K近邻（KNN）

积极学习算法：支持向量机（SVM）、神经网络

4.4决策树

基本的分类与回归方法，本质上是通过一系列规则对数据进行分类的过程。

CLS、ID3、ID4、ID4.5；CART

特征选择、决策树的生成、决策树的修剪

第5章生物进化与群智能

5.1遗传算法

遗传学	遗传算法
群体	可行解集
个体	可行解
染色体	可行解的编码
基因	可行解编码的分量
基因形式	遗传编码
适应度	适应度函数
选择	选择操作
交叉	交叉操作
变异	变异操作

主要参数（群体规模、交叉概率、变异概率、遗传运算的终止进化代数）

流程（编码、种群初始化、适应度函数、选择操作、交叉操作、变异操作、算法寻优（局部最优作为新个体染色体继续优化））

5.2粒子群算法

粒子描述（位置、速度、适应度值）

粒子速度更新公式（粒子先前速度、“认知”部分、“社会”部分）

算法构成（群体大小、权重因子、最大速度、邻域的拓扑结构、停止准则、粒子空间的初始化、边界条件处理）

PSO算法引入惯性因子。

各种不同鸟类为了某个共同的目标第而无组织的聚集在一起。

较好的全局搜索能力。

因不同设定而衍生出的类型：鸟群、狼群

5.3 蚁群算法

启发式因子、信息素挥发度、蚁群数量、总信息量、最大进化代数。

是正反馈原理+启发式算法相结合的一种算法。

第6章人工神经网络

6.1前馈神经网络（FNN）

单层感知器、多层感知器（MLP，多基于它来用反向传播算法）

6.2卷积神经网络（CNN）

一种包含卷积计算、具有深度结构的前馈神经网络。

卷积层、池化层（降维操作）、批量归一化层（数据集归一化，确保同一分布）、全连接层（提取出的特征分类）、输出层；

网络的误差反向传播机制：损失函数（loss，计算正向传播输出结果与样本标签之间的差异）、全连接层梯度计算、池化层梯度计算、卷积层梯度计算。

6.3长短期记忆网络（LSTM）

一种循环神经网络（RNN），时间循环神经网络，为解决一般RNN存在的长期依赖问题而专门设计出来的。

门控单元模型

6.4强化学习（再励学习）

主体是智能体，思想是智能体与环境交互试错，利用评价反馈实现决策优化。

四大要素：策略、回报、动作、环境。

目标：学习一个策略，使选择的动作能从环境获得最大回报。

回报的计算，回报函数，为衡量长期使用值函数来代替回报函数（积累），一般将值函数或策略用一个函数表示（常用的近似函数有：线性函数、核函数、神经网络）

深度强化学习：用深度神经网络作为强化学习的非线性近似函数。

深度确定性策略梯度算法（DDPG）：谷歌Deep Mind团队提出的深度强化学习算法，解决了连续动作空间的强化学习问题。它是一种无模型的离线策略演员-评论家强化学习方法。它的策略是参数化的。

6.5迁移学习

预训练模型的复用与微调：训练整个模型、训练一些层而冻结其他层、冻结卷积层

第7章智能决策综合评价

7.1权重系数法

权重差异三方面原因：主观重视程度、客观作用程度、可靠程度

7.2 层次分析法

将人的思维过程层次化、数量化，并用数学为分析、决策、预报或控制提供定量的依据。

将决策问题的有关元素分解成目标、准则、方案等层次，用一定标度对人的主关判断进行客观量化，在此基础上进行定性、定量分析的一种决策方法。

7.3 TOPSIS法（优劣解距离法）

多目标决策分析中的一种常用有效方法。

把备选方案与理想最好解、理想最差解做比较，若某个方案是最接近理想解，同时远离负理想解，则该方案是备选方案中的最好方案。

7.4动态加权综合法

不同于以上的定常权（权值均为常数），解决语言评价的模糊性，

各评价指标标准化处理；构造动态加权函数（分段变幂函数、偏大型正态分布函数、S型分布函数）；评价模型构建。

7.5 灰色关联综合法

“灰”表示部分信息明确、部分信息不明确，是一种介于完全知道和一无所知之间的中介系统

用于解决的问题：评判对象的某些因素不完全了解使评判根据不足；由于事物变化导致认知落后；受到事物伪信息和反信息的干扰导致判断偏差；

手段：对某次观测资料加以数学处理，达到更高层次上了解系统内部变化趋势、相互关系机制。

第三篇智能决策应用

第8章设备级决策

第9章产线级决策

第10章系统级决策

最后，在一个封闭的、被迫的工作环境中，我好像是失去了那个高效、快意的自己。

人如果知道自己想做什么，熟练的会那些该做的事情，而且手边工具齐全，真是一个非常幸福的事情（怪不得拼装四驱车比玩四驱车更有意思）。

人终有一死，如何把过程活的对自己最有意义，这条路该怎么走？

总之，无论好坏，可能自己所做的已经有别人做的更好，那也不能自己束手束脚什么也不做啊。

查看全文

http://www.kler.cn/a/159026.html

面试多线程八股文十问十答第三期

服务器无法访问外网是怎么回事

Docker的安装

数据中台学习和实战系列文章

AWS KeyPair密钥格式转换PPK＜＞PEM

XXL-JOB 日志表和日志文件自动清理

Ps：文字操作常用快捷键

UE5 - 把ArchvizExplorer项目改造成自己的数字孪生项目 - 开发记要

[nlp] id2str的vocab.json转换为str2id

Java第二十一章：网络通信

LeetCode [中等]矩阵置零

html css 布局layout

JS箭头函数

前端知识笔记（二十四）———快速创建桌面端(electron-egg)

java开发神器之ecplise的基本使用

【蓝桥杯】马的遍历

单机无锁线程安全队列-Disruptor

Django回顾6

Perl | Multi-line Strings | Here Document

十种接口安全方案！！！

第1章 绪论