当前位置: 首页 > article >正文

《智能决策技术及应用》笔记

团支部有读书会活动可以报销,我挑选买了一本《智能决策技术及应用》(刘丽兰 等著),这本书分三篇,第三篇实际应用是在智能制造产业上就对我没啥大用。

内容其实都是主流的,但是编排上是有独特组合的,所以我只放总结目录+一些我觉得有意思应该记录一下的东西,每个再写两句自己的备忘(其实基本都在研究生课程学过了)


第1章 绪论

智能制造支撑技术与平台:人工智能、工业大数据、云计算、工业互联网、边缘计算、信息物理系统、数字孪生

智能制造中的决策问题:设备级决策、产线级决策、系统级决策;设备管理决策、生产管理决策、柔性管理决策、智能调度决策、人机协作决策

第一篇智能决策方法

第2章 数据感知

现场总线及工业以太网技术

第3章 数据分析

3.1数据预处理

数据清洗(缺失值处理、离群值处理、噪声处理、异常值处理);

数据集成(冗余分析、相关分析、冲突值检测与处理);

数据变换(离散化、二元化、规范标准化、特征转换与创建、函数变换);

数据规约(数据聚集、数据抽样、维规约)

3.2数据仓库

规划、需求研究、问题分析、仓库设计(选取待建模事务、选取食物处理粒度、选取用于每个事实表记录的维、选取将安防再每个事实记录中的度量)、数据集成和测试、部署数据仓库。

3.3数据特征提取

主成分分析法(PCA)、线性判别分析(LDA)

3.4数据分析

关联分析;分类;聚类分析(K-means、K-medoids);

聚类基本方法(划分、层次、基于密度、基于网格)

第二篇智能决策方法

这本书是按照人工智能三大学派划分的,其实也可以按照“启发式算法”这种来划分。


第4章 统计推理


4.1贝叶斯决策

验后分析是统计分析的主要方法,而贝叶斯决策方法是验前分析的方法。

验后分析会牵扯到两个问题:是否需要对信息追加,如果追加信息应该采取什么样的策略行动?

再做调查,可以获取修正后的先验概率。

采集新信息的收益大于损耗时,决策者才会去收集新信息,否则只要选择最优的验前策略就能获得最大收益。

4.2马尔科夫决策

过程具有马尔可夫性质:给定现在状态,随机过程与过去状态是条件独立的。

过去对于预测将来的状态是无关的;每个状态的转移只依赖于之前的n个状态,这个过程被成为一个n阶模型,n是影响转移状态的数目。

马尔可夫模型可以视为一个随机的有限状态机。

隐马尔可夫模型:描述一个含有隐含位置参数的马尔可夫过程。从可观察参数中确定该过程的隐含参数,然后利用这些参数进行进一步分析。

4.3K近邻(KNN)

是一种基于统计的数据挖掘算法。

消极学习算法:局部加权回归、K近邻(KNN)

积极学习算法:支持向量机(SVM)、神经网络

4.4决策树

基本的分类与回归方法,本质上是通过一系列规则对数据进行分类的过程。

CLS、ID3、ID4、ID4.5;CART

特征选择、决策树的生成、决策树的修剪


第5章 生物进化与群智能


5.1遗传算法

遗传学遗传算法
群体可行解集
个体可行解
染色体可行解的编码
基因可行解编码的分量
基因形式遗传编码
适应度适应度函数
选择选择操作
交叉交叉操作
变异变异操作

主要参数(群体规模、交叉概率、变异概率、遗传运算的终止进化代数)

流程(编码、种群初始化、适应度函数、选择操作、交叉操作、变异操作、算法寻优(局部最优作为新个体染色体继续优化))


5.2粒子群算法

粒子描述(位置、速度、适应度值)

粒子速度更新公式(粒子先前速度、“认知”部分、“社会”部分)

算法构成(群体大小、权重因子、最大速度、邻域的拓扑结构、停止准则、粒子空间的初始化、边界条件处理)

PSO算法引入惯性因子。

各种不同鸟类为了某个共同的目标第而无组织的聚集在一起。

较好的全局搜索能力。

因不同设定而衍生出的类型:鸟群、狼群

5.3 蚁群算法

启发式因子、信息素挥发度、蚁群数量、总信息量、最大进化代数。

正反馈原理+启发式算法相结合的一种算法。

第6章 人工神经网络


6.1前馈神经网络(FNN)

单层感知器、多层感知器(MLP,多基于它来用反向传播算法)

6.2卷积神经网络(CNN)

一种包含卷积计算、具有深度结构的前馈神经网络。

卷积层、池化层(降维操作)、批量归一化层(数据集归一化,确保同一分布)、全连接层(提取出的特征分类)、输出层;

网络的误差反向传播机制:损失函数(loss,计算正向传播输出结果样本标签之间的差异)、全连接层梯度计算、池化层梯度计算、卷积层梯度计算。

6.3长短期记忆网络(LSTM)

一种循环神经网络(RNN),时间循环神经网络,为解决一般RNN存在的长期依赖问题而专门设计出来的。

门控单元模型


6.4强化学习(再励学习)

主体是智能体,思想是智能体与环境交互试错,利用评价反馈实现决策优化。

四大要素:策略、回报、动作、环境。

目标:学习一个策略,使选择的动作能从环境获得最大回报

回报的计算,回报函数,为衡量长期使用值函数来代替回报函数(积累),一般将值函数或策略用一个函数表示(常用的近似函数有:线性函数、核函数、神经网络)

深度强化学习:用深度神经网络作为强化学习的非线性近似函数

深度确定性策略梯度算法(DDPG):谷歌Deep Mind团队提出的深度强化学习算法,解决了连续动作空间的强化学习问题。它是一种无模型的离线策略演员-评论家强化学习方法。它的策略是参数化的。


6.5迁移学习

预训练模型的复用与微调:训练整个模型、训练一些层而冻结其他层、冻结卷积层

第7章 智能决策综合评价


7.1权重系数法

权重差异三方面原因:主观重视程度、客观作用程度、可靠程度

7.2 层次分析法

将人的思维过程层次化、数量化,并用数学为分析、决策、预报或控制提供定量的依据。

将决策问题的有关元素分解成目标、准则、方案等层次,用一定标度对人的主关判断进行客观量化,在此基础上进行定性、定量分析的一种决策方法。

7.3 TOPSIS法(优劣解距离法)

多目标决策分析中的一种常用有效方法。

把备选方案与理想最好解、理想最差解做比较,若某个方案是最接近理想解,同时远离负理想解,则该方案是备选方案中的最好方案。

7.4动态加权综合法

不同于以上的定常权(权值均为常数),解决语言评价的模糊性,

各评价指标标准化处理;构造动态加权函数(分段变幂函数、偏大型正态分布函数、S型分布函数);评价模型构建。

7.5 灰色关联综合法

“灰”表示部分信息明确、部分信息不明确,是一种介于完全知道和一无所知之间的中介系统

用于解决的问题:评判对象的某些因素不完全了解使评判根据不足;由于事物变化导致认知落后;受到事物伪信息和反信息的干扰导致判断偏差;

手段:对某次观测资料加以数学处理,达到更高层次上了解系统内部变化趋势、相互关系机制

第三篇 智能决策应用

第8章 设备级决策

第9章 产线级决策

第10章 系统级决策


最后,在一个封闭的、被迫的工作环境中,我好像是失去了那个高效、快意的自己。

人如果知道自己想做什么,熟练的会那些该做的事情,而且手边工具齐全,真是一个非常幸福的事情(怪不得拼装四驱车比玩四驱车更有意思)。

人终有一死,如何把过程活的对自己最有意义,这条路该怎么走?

总之,无论好坏,可能自己所做的已经有别人做的更好,那也不能自己束手束脚什么也不做啊。


http://www.kler.cn/a/159026.html

相关文章:

  • 使用WebSocket技术实现Web应用中的实时数据更新
  • Gin 框架中间件详细介绍
  • React中组件通信的几种方式
  • 有序数组的平方(leetcode 977)
  • day-83 最少翻转次数使二进制矩阵回文 II
  • 【操作系统不挂科】<Linux进程概念(4)>选择题(带答案与解析)
  • 面试多线程八股文十问十答第三期
  • 服务器无法访问外网是怎么回事
  • Docker的安装
  • 数据中台学习和实战系列文章
  • AWS KeyPair密钥格式转换PPK<>PEM
  • XXL-JOB 日志表和日志文件自动清理
  • Ps:文字操作常用快捷键
  • UE5 - 把ArchvizExplorer项目改造成自己的数字孪生项目 - 开发记要
  • [nlp] id2str的vocab.json转换为str2id
  • Java第二十一章 :网络通信
  • LeetCode [中等]矩阵置零
  • html css 布局layout
  • JS箭头函数
  • 前端知识笔记(二十四)———快速创建桌面端(electron-egg)
  • java开发神器之ecplise的基本使用
  • 【蓝桥杯】马的遍历
  • 单机无锁线程安全队列-Disruptor
  • Django回顾6
  • Perl | Multi-line Strings | Here Document
  • 十种接口安全方案!!!