当前位置: 首页 > article >正文

【论文阅读】Virtual Compiler Is All You Need For Assembly Code Search

阅读笔记:Virtual Compiler Is All You Need For Assembly Code Search

在这里插入图片描述

1. 研究背景

  • 逆向工程:逆向工程需要在庞大的二进制文件中快速定位特定功能(例如恶意行为)。传统方法依赖于经验和启发式算法,效率低下。
  • 汇编代码搜索:通过自然语言搜索汇编代码功能,能够更高效地处理二进制文件。
  • 数据集构建挑战:构建汇编代码搜索数据集困难重重,涉及复杂的编译过程,容易因编译失败而产生大量数据损失。

2. 研究动机

  • 虚拟编译器 (ViC):通过将CodeLlama模型继续预训练为虚拟编译器,使其可以虚拟编译任意源代码为汇编代码。这一方式可以扩大数据集规模,提升汇编代码搜索效果。

3. 研究贡献

  • 虚拟编译器引入:提出了虚拟编译器ViC,克服了传统编译方法中的障碍,生成了多样性强、规模大的汇编代码数据集。
  • 汇编代码搜索性能提升:构建了高质量的汇编代码数据集,模型在汇编代码搜索任务中性能提升了26%。

http://www.kler.cn/a/395308.html

相关文章:

  • 用枚举算法解决LeetCode第3348题最小可整除数位乘积II
  • linux上海康SDK安装并设置环境变量
  • 【安全通信】告别信息泄露:搭建你的开源视频聊天系统briefing
  • 新版 idea 编写 idea 插件时,启动出现 ClassNotFound
  • Python 随笔
  • 微擎框架php7.4使用phpexcel导出数据报错修复
  • 数位DP学习
  • 人工智能:重塑医疗、企业与生活的未来知识管理——以HelpLook为例
  • 【数字图像处理+MATLAB】基于 Sobel 算子计算图像梯度并进行边缘增强:使用 imgradientxy 函数
  • 《Java核心技术 卷I》Swing处理2D图形
  • 探索 Python HTTP 的瑞士军刀:Requests 库
  • JavaScript逆向爬虫教程-------基础篇之深入JavaScript运行原理以及内存管理
  • openwebui二改界面环境搭建
  • Ubuntu网络(prot)连通性检测
  • 当使用key-value方式进行参数传递时,若key对应的是一个对象或数组结构,如何利用API Post工具进行模拟操作。
  • thinkphp6 --数据库操作 增删改查
  • Flutter:使用Future发送网络请求
  • unity3d————插值运算补充点
  • 使用 Spring Security 实现基于角色的权限管理
  • ssm111基于MVC的舞蹈网站的设计与实现+vue(论文+源码)_kaic
  • C#笔记(3)
  • 解决Spring Boot整合Redis时的连接问题
  • 【Python · PyTorch】卷积神经网络(基础概念)
  • 长连接配置以及断线重连
  • Ubuntu 20.04配置ollama并下载安装调用本地大语言模型
  • 低光增强常用的损失函数pytorch实现