当前位置:
文档之家› vtune的使用的心得精品PPT课件
vtune的使用的心得精品PPT课件
▪ EBS基于时间的 发生进行采样
sampling
▪ 基于时间采样的又可以 分为基于哪种事件,一 般我们用于试验的是时 钟周期,指令周期,浮 点数操作,cache命中 率等等
▪ Events=sample*sampl e after value
sampling
sampling
▪ 采样收集器收集运行于 系统的所有应用软件的 数据,从进程到应用程 序的线程,到应用程序 每个模块,再到热点, 结合源代码,可以分析 系统的瓶颈,修改源代 码,实现最优化的设置。
▪{
▪
clock_t t1=clock();
▪ // #print j=0;j<2;j++)
▪
{
▪
test();
▪ ▪ ▪ ▪ ▪ ▪}
} clock_t t2=clock(); printf("total time=%d\n",t2-t1); test(); return 0;
▪ 该图是线程柱状图,通 过分析该线程,我们可 以看到哪个线程占用了 cpu大量的时间,结合 源代码,我们能够进行 负载均衡。
module
▪ 通过模块图,我们可以 定位该应用程序的热点, 结合源代码,我们可以 分析出程序的瓶颈,即 可以并行化实现的地方。
Source view
▪ 这是通过模块定位的源 代码
▪ 加速比小于理想加速比 ▪ 左边这个图式timeline
的更加抽象的显示
加速比
▪ 通过实验得到的加速比 与程序代码运行的加速 比比较。
▪ 同时通过实验的加速比 与理想的加速比进行比 较。
调整
▪ 我们要求的尽量能接近 理想加速比,加速比与 不仅与系统,也与算法, 同时与我们任务的分解 都有关,左图给出了加 速比调整的一些参数, 根据这些参数我们利用 数据收集器结合源代码 进行调整
▪ 实验目的:通过一组实验让学生了解单核 与多核性能的差异
▪ 实验步骤:通过vs2005编写一个能够改写 成并行程序的程序,该程序要有测试程序 运行时间的函数,将该程序用OpenMP进行 改写,并行化,用vtune软件进行分析,通 过性能分析函数进行计算,并与程序运行 的结果相互比较。
▪ void test()
Thread profiler
Timeline主要是查看多线 程的运行,橘红色的线 代表了关键路径,绿色 的线代表并行运行区, 所有的图案都在右方的 运行图中有所标示。通 过上面的时间线,我们 来计算加速比
加速比=串行时间/并行时 间
Thread profiler
▪ 理想的加速比=1/S s表 示串行代码所占的比例
多核程序设计实践
▪ 掌握多核程序设计工具软件的使用; ▪ 进行多核程序设计实践; ▪ 尝试设计多核程序设计实验; 总结:我毕设的主要目的就是设计一组学生实
验,让学生通过实验来比较单核和多核处理 器,了解多核处理器在性能方面的优越性。
▪ 实验平台:Inter多核处理器
▪ 实验软件:vs2005 vtune
Counter Monitor
▪ 通过该图我们主要查看 来自系统级的瓶颈,就 是影响我们程序性能的 外部硬件环境
▪ 通过检测器图标下面的 数据我们可以查看来自 cpu,硬盘,网络,还 有内存方面的一些瓶颈。
Call graph
▪ 提供了一个虚拟的程 序的执行的图,红线代 表关键路径 ,不同的颜 色代表不同的权值,我 们主要根据关键路径来 确定运行的最大时间, 依靠关键路径,定位源 代码,查找瓶颈。
▪{
▪
int a=0;
▪
clock_t t1=clock();
▪
for(int i=0;i<100000000;i++)
▪
{
▪
a=i+1;
▪
}
▪
clock_t t2=clock();
▪
printf(“testtime=%d\n”,t2-t1);
▪}
▪ int main(int argc,char *argv[])
演讲人:XXXXXX 时 间:XX年XX月XX日
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
You Know, The More Powerful You Will Be
谢谢大家
荣幸这一路,与你同行
It'S An Honor To Walk With You All The Way
process
sampling
sampling
thread
module
hotspot
Source view
process
▪ 进程的图示显示了cpu 将大量的时间用在了系 统的哪个进程上,通过 图示我们发现柱状比较 长的花费的cpu的时间 是最多的,也就是这个 地方是可能存在瓶颈的。
thread
//初始时间
//结束时间 //运行时间
//初始时间
//结束时间 //串行时间
vtune performance analyzer
性能分析
vtune
sample
Call graph
Counter Monitor
三种性能监控方式的比较
sampling
▪ 采样收集器基于 两种形式
▪ TBS 基于一定的 时间间隔进行采 样