我的账户
中国电子DIY

科技成就未来

亲爱的游客,欢迎!

已有账号,请

如尚未注册?

北京赛车官网开奖: 基于AM57xOpenCL的加速性能测试

[复制链接]
620 0
Tronlong 发表于 2018-7-2 19:55:34 | 只看该作者 |只看大图 |阅读模式 打印 上一主题 下一主题
本帖最后由 茅草屋 于 2018-7-3 17:18 编辑

1  实验说明
本例程测试功能:读取指定的图像数据,然后对图像进行灰度转换和Canny算法处理,计算处理过程所耗的时间,并将处理后的图像保存到当前目录下。
本例程主要是测试OpenCL是否对这两种算法有优化效果,分别从禁用OpenCL和使能OpenCL两种情况来计算处理图像数据所用的时间,将测试的结果与官方提供的测试结果进行对比和验证。
例程源码路径:光盘“Demo/OpenCL/OpenCL_performance_test/src”
可执行文件以及测试脚本路径:光盘“Demo/OpenCL/OpenCL_performance_test/bin”
测试使用的图片路径:光盘“Demo/OpenCL/OpenCL_performance_test/data”
测试平台:TL5728-IDK开发板
开发板简介:
 基于TI AM5728浮点双DSPC66x+双ARMCortex-A15工业控制及高性能音视频处理器;
 强劲的视频编解码能力,支持1路1080P60或2路720P60或4路720P30视频硬件编解码,支持H.265视频软解码;
 双核PRU-ICSS工业实时控制子系统,支持EtherCAT、EtherNet/IP、PROFIBUS等工业协议;
 外设接口丰富,GPMC、USB 2.0、UART、SPI、QSPI、I2C、DCAN等工业控制总线和接口,支持高速接口PCle Gen2、USB 3.0、SATA 2.0;
 应用于工业 PC&HMI、工业机器人、机器视觉、 医疗影像、电力自动化等领域。



2  例程编译
将光盘资料“Demo/OpenCL/OpenCL_performance_test/src”例程源码拷贝到Ubuntu任意目录,进入该源码目录执行以下命令对源码进行编译:
Host#        cd AM57xx/OpenCL_performance_test/src/
Host#        make SDK_INSTALL_PATH=/home/tronlong/ti-processor-sdk-linux-am57xx-evm-03.01.00.06



编译完成之后会在当前目录下生成可执行文件canny,将其拷贝到开发板文件系统的“/home/root/”目录下。
将光盘资料“Demo/OpenCL/OpenCL_performance_test”下的bin文件夹以及data文件夹拷贝到开发板文件系统的“/home/root/”目录下。bin文件夹下包含opencl_off.sh和opencl_on.sh测试脚本,data文件夹下是两张大小和格式不同的图片文件TL5728_1080p.jpg和lena.png。



3  例程测试
以下分别从禁用OpenCL功能和使能OpenCL功能来进行对比测试,分别采用data文件夹下的图片TL5728_1080p.jpg和lena.png来测试。
3.1        禁用OpenCL
执行以下命令进行测试,先禁止运行OpenCL功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤5次,如下图所示:
Target#         source bin/opencl_off.sh
Target#         sync; echo 3 >/proc/sys/vm/drop_caches
Target#         ./canny data/TL5728_1080p.jpg



取以上5次测试结果的平均值:
        BGR2GRAY tdiff=55.01ms
        Canny tdiff=95.50ms
3.2        使能OpenCL
执行以下命令进行测试,先使能OpenCL功能,然后清理缓存再进行测试,重复清理缓存和测试的步骤6次,如下图所示:
Target#         source bin/opencl_on.sh
Target#         sync; echo 3 >/proc/sys/vm/drop_caches
Target#         ./canny data/TL5728_1080p.jpg



如上一共测试了6次,每一次测试之前记得先将系统内核缓存清理干净,否则测试结果有误。因为第一次运行时,内核在AM57xx上编译,OpenCL使能时会有额外的延迟,延迟时间大约为几十秒,所以第一次测试结果不作为参考。官方解释如下:
Please note that the first run, with OpenCL on, has additional delay of ~1min, due to kernel compilation on AM57xx. This is constrained to first run only, if "TI_OCL_CACHE_KERNELS" environemnt variable is set.
由以上6次的测试结果,取最后5次测试结果的平均值:
        BGR2GRAY tdiff=185.38ms
        Canny tdiff=17.71ms
3.3        测试结果对比
同理,按照如上操作步骤在分别禁用OpenCL和使能OpenCL的情况下,计算处理lena.png图片所用的时间,并对5次测试的数据取平均值。对比以上测试结果,如下表所示:



作用率=禁用OpenCL计算处理图像数据所用的时间/使能OpenCL计算处理图像数据所用的时间。
以下是官方的测试数据:



BGR2GRAY作用率=0.345
Canny作用率=1.690
从测试结果可以看出来,本次测试与官方测试结论是一致的:OpenCL对BRG2GRAY算法不但没有性能上的提升反而存在着负面的效果;而对Canny算法则有着非常明显的提升效果,与官方的作用率进行对比,本次测试得出的作用率要大于官方提供的作用率数据,这与待测试的图像文件有一定的关系。
官方提供的其他OpenCL内核的测试数据:
链接://
processors.wiki.ti.com/index.php/OpenCV









收藏
收藏0
分享
分享
支持
支持0
反对
反对0
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关注我们
中国电子DIY官方微信

客服电话:000-000-0000

客服邮箱:[email protected]

周一至周五 9:00-18:00

公司地址:深圳市南山区美丽湾大厦B座

Powered by Discuz! X3.4@ 2001-2013 Comsenz Inc.

  • 周源:把握正确舆论导向 营造风清气正的网络空间 2019-03-24
  • 从稳中向好发展态势看我国经济良好前景 2019-03-24
  • 苗山脱贫影像志——父母在 不远行 2019-03-23
  • 环球 —频道 春城壹网 七彩云南 一网天下 2019-03-23
  • 美说唱歌手在迈阿密购买摩托遭遇中枪 疑似身亡说唱中枪-国际博览 2019-03-22
  • 人民日报为人民,70年办报不容易,办报人付出了心血和汗水,记录了中国的发展过程,祝愿办得越来越好! 2019-03-22
  • 淮海实业集团新时代传习中心揭牌 2019-03-21
  • 一语惊坛(5月7日):宏志展翅挫愈奋,青春闪耀益人寰。 2019-03-21
  • 2017年首届中国汽车公益盛典隆重举行 2019-03-20
  • 全球最新私人飞机定制之旅来了!水晶天际1号即将首飞 2019-03-20
  • 陕西援藏医生索杰成功为一名外籍患者实施急诊手术 2019-03-19
  • 北京市北京捷亚泰中实4S店【在线咨询】 2019-03-19
  • 绿博会开放普通观众注册通道 2019-03-18
  • 稳中有进 稳中向好——国家统计局新闻发言人毛盛勇解读经济运行态势 2019-03-18
  • 你做我的腿 我做你的眼 失明老人背妻生活30年 2019-03-17
  • 102| 932| 955| 930| 274| 812| 443| 130| 158| 741|