当前位置：首页 > article >正文

论文阅读——Intrusion detection systems using longshort‑term memory (LSTM)

article 2024/11/23 23:03:10

一.基本信息

论文名称：Intrusion detection systems using longshort‑term memory (LSTM)

中文翻译：基于长短期记忆(LSTM)的入侵检测系统

DOI：10.1186/s40537-021-00448-4

作者：FatimaEzzahra Laghrissi1* , Samira Douzi2*, Khadija Douzi1* and Badr Hssina1*

发表年份：2021年

发表期刊：《Journal Of Big Data》

中科院分区：计算机科学2区

JCR分区：Q1

影响因子：IF(5):12.4

二.论文阅读

1.研究背景

1.网络威胁日益严重，入侵检测技术越来越关键。

2.目前许多入侵检测系统基于机器学习模型，但是经典的机器学习模型无法解决实时性问题。

3.深度学习模型在入侵检测方面的应用有所增加

2.主要贡献

在KDD99数据集上，对三个模型（即LSTM,LSTM-PCA,LSTM-MI）进行二分类和多分类的测试

3.研究过程

A.数据集的阐述：

1. KDD99 dataset：53个特征；4个攻击大类；

2. 存在的问题：攻击记录的数量远远大于正常记录

B.数据预处理：

二分类将标签分为两种类别：正常和攻击；接着 随机抽样来缓解数据集存在的问题

多分类分成三类：正常攻击，拒绝服务攻击和R2L类别中的所有其他攻击

C.数据降维

PCA方法：

原数据的特征是53个，用PCA方法降维，用 主成分1,2 或者 主成分1，2，3 即可描述重要特征（后面实验对比了2个主成分和3个主成分的效果）

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

MI方法：

1.定义： 互信息（Mutual Information ）是一种用来计算两个变量之间统计依赖性的方法，这里的两个变量是“特征”与“目标值/标签”，某个特征的互信息分数越高，说明该特征对标签结果的影响更大

2.本实验的设置：

本实验的选择：本实验分别用了4号特征和其余10个特征

D.数据集的划分

60%的预处理后的数据作为训练集；20%作为验证集；20%作为测试集

E.分类模型的设置

①分类模型：LSTM

②内部结构和参数设置：

        ▶整体模型及参数：



        ▶LSTM的结构：

4.研究结果

性能评价指标1：准确度，召回率，精确度，F1分数

结果：

对于二分类和多分类来比较：二分类的效果好

对于三种模型来比较：LSMT-PCA效果最好

对于具体模型来说：

LSTM-PCA：在选择两个主成分时效果更好

LSTM-MI：选择4号特征比选择10个特征效果好

--------------------------------------------------------------------------------------------------------------------------

性能评价指标2：处理时间

结果：

二分类比多分类快；LSTM-MI比其他模型快；添加更多的特征会增加处理时间

--------------------------------------------------------------------------------------------------------------------------

LSTM-PCA的最终评价：

        ①在 准确率和敏感度上超越其他模型。

        ②使用更少的特征 实现了 高效性能 ，适合 大规模实时环境 。

        ③模型具有通用性、高效性，在入侵检测系统中的潜在实用价值

5.总结

作者提出的 LSTM 模型能够有效区分正常网络流量和攻击流量。除此之外，模型结合主成分分析（PCA）和互信息作为降维方法。实验结果表明，基于 PCA 的模型（特别是使用2个主成分）在二分类和多分类任务中都表现最好，准确率分别达到 99.44% 和 99.39%。模型的准确性和敏感性优于其他比较方法，且使用少量特征（2个）使得模型训练更加高效，占用更少资源。