当前位置: 首页 > article >正文

论文阅读——Intrusion detection systems using longshort‑term memory (LSTM)

一.基本信息

论文名称:Intrusion detection systems using longshort‑term memory (LSTM)

中文翻译:基于长短期记忆(LSTM)的入侵检测系统

DOI:10.1186/s40537-021-00448-4

作者:FatimaEzzahra Laghrissi1* , Samira Douzi2*, Khadija Douzi1* and Badr Hssina1*

发表年份:2021年

发表期刊:《Journal Of Big Data》

中科院分区:计算机科学2区

JCR分区:Q1

影响因子:IF(5):12.4

二.论文阅读

1.研究背景

1.网络威胁日益严重,入侵检测技术越来越关键。

2.目前许多入侵检测系统基于机器学习模型,但是经典的机器学习模型无法解决实时性问题。

3.深度学习模型在入侵检测方面的应用有所增加

2.主要贡献

在KDD99数据集上,对三个模型(即LSTM,LSTM-PCA,LSTM-MI)进行二分类和多分类的测试

3.研究过程 

A.数据集的阐述:

      1.  KDD99 dataset:53个特征;4个攻击大类;
      2. 存在的问题:攻击记录的数量远远大于正常记录

B.数据预处理:

        二分类将标签分为两种类别:正常和攻击;接着 随机抽样来缓解数据集存在的问题
        多分类分成 三类 :正常攻击,拒绝服务攻击和R2L类别中的所有其他攻击

C.数据降维 

PCA方法:
        原数据的特征是53个,用PCA方法降维, 主成分1,2 或者 主成分1,2,3 即可描述重要特征(后面实验对比了2个主成分和3个主成分的效果)
                            

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

MI方法:
        1.定义: 互信息(Mutual Information )是一种用来计算两个变量之间统计依赖性的方法,这里的两个变量是“特征”与“目标值/标签”, 某个特征的互信息分数越高,说明该特征对标签结果的影响更大

        2.本实验的设置:

本实验的选择: 本实验分别用了4号特征和其余10个特

D.数据集的划分 

60%的预处理后的数据作为训练集;20%作为验证集;20%作为测试集

E.分类模型的设置

①分类模型:LSTM
②内部结构和参数设置:
        ▶整体模型及参数:

        

        ▶LSTM的结构:

4.研究结果 

性能评价指标1:准确度,召回率,精确度,F1分数

结果:

对于二分类和多分类来比较:二分类的效果好

对于三种模型来比较:LSMT-PCA效果最好

对于具体模型来说:

        LSTM-PCA:在选择两个主成分时效果更好

        LSTM-MI:选择4号特征比选择10个特征效果好

--------------------------------------------------------------------------------------------------------------------------

性能评价指标2:处理时间 

结果:

二分类比多分类快;LSTM-MI比其他模型快;添加更多的特征会增加处理时间

--------------------------------------------------------------------------------------------------------------------------

LSTM-PCA的最终评价:

        ①在 准确率和敏感度上超越其他模型。

        ②使用更少的特征 实现了 高效性能 ,适合 大规模实时环境
        ③模型具有通用性、高效性,在入侵检测系统中的潜在实用价值

5.总结

作者提出的 LSTM 模型能够有效区分正常网络流量和攻击流量。除此之外,模型结合主成分分析(PCA)和互信息作为降维方法。实验结果表明,基于 PCA 的模型(特别是使用2个主成分)在二分类和多分类任务中都表现最好,准确率分别达到 99.44% 和 99.39%。模型的准确性和敏感性优于其他比较方法,且使用少量特征(2个)使得模型训练更加高效,占用更少资源。

6.未来展望

研究LSTM的多种变体,以及其他神经网络算法和其他特征选择算法。

7.整个论文的思维导图

!!!声明!!!

这篇文章仅用于本人的学术学习,侵权即删,转载或学习请标明原论文的信息,正确引用!


http://www.kler.cn/a/406362.html

相关文章:

  • Easyexcel(1-注解使用)
  • MACOS开发、使用常见问题汇总
  • 用java和redis实现考试成绩排行榜
  • 索贝融媒体 Sc-TaskMonitoring/rest/task/search SQL注入漏洞复现
  • AJAX的基本使用
  • unity webgl点击链接后微信下面有导航条问题
  • 儿童玩具安全检测GB6675标准详细介绍
  • PHP 8.4 重磅发布了
  • 如何创建你的第一个 Telegram 机器人:一步步教程
  • 【Python TensorFlow】进阶指南(续篇三)
  • STM32(hal库)中,为什么DMA没有MSP函数?
  • C# 中Timer的三种用法
  • 代码随想录1016-Day17
  • 【bug】python常见的错误以及解决办法
  • 大数据环境下的高效数据清洗策略
  • 【信息系统项目管理师】第2章:信息技术发展 考点梳理
  • 泥石流灾害风险评估与模拟丨AI与R语言、ArcGIS、HECRAS融合,提升泥石流灾害风险预测的精度和准确性
  • CSS遮罩:mask
  • 使用minio cllient(mc)完成不同服务器的minio的数据迁移和mc基本操作
  • stm32 指定变量存储地址
  • 利用Python爬虫获取1688搜索词推荐:技术与实践
  • P1308 [NOIP2011 普及组] 统计单词数题解
  • [开源重构]Search(Elasticsearch/OpenSearch) Sync Tool
  • c++基础语法
  • shell脚本(三)
  • Java教程:SE进阶【十万字详解】(中)