当前位置: 首页 > article >正文

CPU性能优化-磁盘空间和解析时间

即使考虑跟踪文件压缩格式编码后数据仍然占用很大磁盘空间通常每条指令不超过1字节但是考虑到CPU执行指令速度数据仍然非常多根据负载CPU编码100MB/s速度处理PT跟踪文件情况很常见解析后数据可能增加10(约1GB/s)使得PT工具并不适用长时间运行负载但是即使负载程序也可以PT运行小段时间在这种情况下用户可以只在问题发生绑定一小会运行进程此外也可以使用环形缓冲区环形缓冲区新的跟踪数据可以覆盖例如总是跟踪最后10s数据

用户可以通过多种方式进一步限制采集可以限制跟踪用户内核空间代码此外,还有一个地址过滤功能这样就可以动态控制跟踪开启关闭限制内存带宽使得我们可以跟踪一个函数甚至一个循环

解析PT跟踪文件很耗时Intel Core i5-8259U机器对于7ms负载程序 编码PT跟踪文件大概1MB. 使用perf script解析大概需要20s使用命令perf script-F time, ip, sym, symoff, insn 解析结果大概悍勇1.3GB磁盘空间

个人经验Intel PT工具被认为性能分析终极手段有着较低运行开销是非常强大分析工具然而20202为止perf script-F+srcline或者+srccode参数解析跟踪文件变得相当慢日常使用不太实用linux perf 工具实现有待提高Intel VTune profilePT技术支持还是处于实验阶段

6.5 本章总结

1 只有上层性能问题解决了才建议使用硬件特性进行底层调优

2 TMA方法是一种非常强大技术可以识别程序CPU微架构低效利用这是一个稳健并且正式方法

3 最后分支记录LBR 机制可以运行程序同时进行持续记录最近跳转分支指令输出产生性能损耗最小

4 基于处理器事件采样PEBS 另一个性能剖析增强技术通过不使用中断方式自动多次对特定缓冲区采样降低采样开销不过PEBS更广为人知名字精准事件可以精准定位导致某个性能事件具体指令Intel处理器支持特性AMD处理器也有类似特性基于指令采样

5 Intel处理器追踪PT技术是一个可以记录程序执行过程并把报文编码压缩率二进制文件技术压缩文件可以基于每条指令时间戳重建程序执行PT技术覆盖开销


http://www.kler.cn/a/445682.html

相关文章:

  • 29、基于springboot的网上购物商城系统研发
  • 【使用MCP协议连接本地和远程数据——以Claude的Windows客户端为例】
  • 深入了解Bootstrap:打造响应式网站的利器
  • SparkSQL案例
  • PostgreSql-学习06-libpq之同步命令处理
  • javax.net.ssl.SSLPeerUnverifiedException: Hostname 192.168.13.13 not verified:
  • 谷歌浏览器的扩展市场使用指南
  • 共享模型之无锁(乐观锁,CAS,原子类,LongAdder)
  • postman-9.12.2–安装包及汉化
  • 轨迹优化 | 基于Savitzky-Golay滤波的无约束路径平滑(附ROS C++/Python仿真)
  • OpenGL ES 01 渲染一个四边形
  • [Unity]【图形渲染】【游戏开发】Shader数学基础4-更多矢量运算
  • PC寄存器(Program Counter Register)jvm
  • 2024年云计算的发展趋势如何?
  • 【图像处理lec7】图像恢复、去噪
  • SSM 框架结合 Vue 实现电脑测评系统:助力用户明智选择
  • 在M系列芯片的Mac上使用Uniapp开发的依赖安装指南
  • 裸金属服务器的作用都有哪些?
  • GitHub年度报告发布!Python首次超越JavaScript
  • 高校教师成果管理小程序的设计与实现springboot+论文源码调试讲解
  • 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之分支结构(多分支结构)
  • 在VBA中结合正则表达式和查找功能给文档添加交叉连接
  • css 动画实现从中间到两边亮度逐渐变暗的流水灯效果
  • DNS 服务器是什么?有什么作用
  • MQTT入门:在Spring Boot中建立连接及测试
  • 面试题整理10----k8s集群架构是什么