当前位置: 首页 > news >正文

免费咨询劳动仲裁win10优化大师好用吗

免费咨询劳动仲裁,win10优化大师好用吗,网站顶部轮播怎么做的,淄川政府网站建设哪家好什么是OpenCL? 1.概述 OpenCL(Open Computing Language 开放计算语言)是一种开放的、免版税的标准,用于超级计算机、云服务器、个人计算机、移动设备和嵌入式平台中各种加速器的跨平台并行编程。OpenCL是由Khronos Group创建和管理的。OpenCL使应用程序…

什么是OpenCL?

1.概述

  • OpenCL(Open Computing Language 开放计算语言)是一种开放的、免版税的标准,用于超级计算机、云服务器、个人计算机、移动设备和嵌入式平台中各种加速器的跨平台并行编程。OpenCL是由Khronos Group创建和管理的。OpenCL使应用程序能够使用系统或设备中的并行处理能力,从而使应用程序运行得更快、更流畅。

2.OpenCL是如何工作的?

  • OpenCL是一种编程框架和运行时,它使程序员能够创建称为内核程序(或内核)的小程序,这些程序可以在系统中的任何处理器上并行编译和执行。处理器可以是不同类型的任意组合,包括cpu、gpu、dsp、fpga或张量处理器——这就是为什么OpenCL经常被称为异构并行编程的解决方案。
  • OpenCL框架包含两个api。platform layer API在主机CPU上运行,首先用于使程序能够发现系统中可用的并行处理器或计算设备。通过查询哪些计算设备可用,应用程序可以在不同的系统上便携地运行—适应加速器硬件的不同组合。一旦发现了计算设备,platform layer API就允许应用程序选择并初始化它想要使用的设备。
  • 第二个API是Runtime API,它使应用程序的内核程序能够为它们将要运行的计算设备编译,并行加载到这些处理器上并执行。一旦内核程序完成执行,将使用Runtime API收集结果。

在这里插入图片描述

  • 为了更好使用与不同的处理器,OpenCL抽象出来了四大模型:
    1. 平台模型:描述了OpenCL如何理解拓扑连接系统中的计算资源,对不同硬件及软件实现抽象,方便应用于不同设备
    2. 存储模型:对硬件的各种存储器进行了抽象
    3. 执行模型:程序是如何在硬件上执行的
    4. 编程模型:数据并行和任务并行

3.平台模型

在这里插入图片描述

  • OpenCL中,需要一个主机处理器(Host),一般为CPU。而其他的硬件处理器(多核CPU/GPU/DSP等)被抽象成Compute Device。每个Compute Device 包含多个 Compute Unit,每个Compute Unit 又包含多个Processing Elements(处理单元)
  • 举例说明:计算设备可以是GPU,计算单元对应于GPU内部的流多处理器(streaming multiprocessors(SMs)),处理单元对应于每个SM内部的单个流处理器。处理器通常通过共享指令调度和内存资源,以及增加本地处理器间通信,将处理单元分组为计算单元,以提高实现效率。

4.存储模型

  • OpenCL中定义了不同类型的存储区域

  • Host memory:主机CPU可用,可以通过直接传输/共享内存的方式与设备端进行数据传输;

  • Global/Constant memory:对计算设备上的所有计算单元可用

  • Local memory:对计算单元中所有处理单元可用的

  • Private memory:对单个处理单元可用,在硬件实现上通常映射为寄存器在这里插入图片描述

  • 在 OpenCL 中,全局存储器中的数据内容通过存储对象来表示(Memory Object),在 OpenCL 中较为常用的两个存储对象为:Buffer Objects 和 Image Objects在这里插入图片描述

5.执行模型

  • 主机应用程序使用OpenCL命令队列将内核和数据传输函数发送到设备以执行。通过将命令入队到命令队列中,内核和数据传输函数可以与应用程序主机代码并行异步执行。在这里插入图片描述

重要概念:

  • Context:每个Context支持多个Device,Host端通过Context与Device端进行交互和管理
  • Commend Queue:Host端发送命令到队列中让Device端去执行(顺序乱序执行都行),一个命令队列只能管理一个设备。
  • Kernel Objects:OpenCL核心计算部分,类似C语言的代码。在需要设备执行计算任务时,数据会被推送到Device端,然后Device端的计算单元会并发执行内核程序
  • Program Objects:Kernel Object的集合,OpenCL中可以使用cl_program表示

执行流程:

  1. 查询可用的OpenCL平台和设备
  2. 在平台上为OpenCL设备创建一个context
  3. 在context上为OpenCL设备创建并编译程序
  4. 选择kernel去执行程序
  5. 为内核创建为其操作的内存对象
  6. 在一个OpenCL Device上创建一个命令队列去执行命令
  7. 如果需要,将数据传输命令排队到内存对象中
  8. 将内核排队到命令队列中去执行
  9. 如果需要,将命令入队,以便将数据传输回主机

高效并行计算:

  • 为了提高执行效率,处理器通常会将处理元素分组为计算单元。因此,当使用clEnqueueNDRangeKernel命令时,程序指定了一个工作组大小,该工作组大小表示可以在计算单元上容纳的nrange中的单个工作项组。相同工作组中的工作项能够共享本地内存,使用工作组屏障更容易地同步,并使用工作组函数(如async_work_group_copy)更有效地合作,这些在单独工作组中的工作项之间是不可用的。
    在这里插入图片描述

6.编程模型

OpenCL 定义了两种不同的编程模型:任务并行数据并行

  • 数据并行:划分计算数据,分配给不同的计算单元进行同时计算,适用于数据相互独立的计算任务。
  • 任务并行:计算步骤的每一个步骤有前后依赖,这使得我们无法将计算任务并行执行。于是,我们只能对每一个步骤的数据进行并行,之后将整个流程进行异步/同步串行执行,为了协调整个流程的先后关系,OpenCL 提供了Event 机制用来进行流程同步控制。
http://www.dt0577.cn/news/29288.html

相关文章:

  • 国外不织布网站做的教具近三年成功的营销案例
  • 网站权重怎么提高技能培训网
  • 做网站和SSH四川省人民政府
  • 平台搭建教程天津优化公司哪家好
  • 南宁市千界网络科技有限公司seo网站怎么搭建
  • 建网站公司耳机套市场调研的四个步骤
  • 网站内容维护费用产品推广计划怎么写
  • 可以做家教的网站有哪些seo chinaz
  • 河北区做网站公司seo文章排名优化
  • 早晨网站建设上海百度seo公司
  • 体验做愛网站登录百度账号注册
  • 提供网站建设哪家好seo网站优化多少钱
  • 网站建设与维护一般需要多少钱每年百度首页快速排名系统
  • 网站文章更新注意什么推广赚钱app哪个靠谱
  • 温州大军建设有限公司网站2345浏览器
  • 网站案例比较多的公司百度指数有三个功能模块
  • 做慕斯蛋糕那个网站有视频嘉兴网站建设制作
  • 公众号编辑器名称品牌关键词优化
  • 网站建设那个公司好新手小白怎么做跨境电商
  • 做一人网站要多少钱免费网站alexa排名查询
  • 做一个网站需要多少钱 怎么做在线视频用什么网址
  • c语言也能干大事网站开发网络营销的推广方法有哪些
  • 网站功能模块有哪些国内最新十大新闻
  • 青岛网站建设 百度常见的网络营销策略都有哪些
  • wordpress做网站优点如何自己搭建一个网站
  • 网站建设及服务招标公告端口扫描站长工具
  • 教做炸鸡汉堡视频网站竞价托管推广哪家好
  • php框架做网站的好处aso优化服务站
  • 做网站哪种编程语言好百度明星搜索量排行榜
  • 南阳做网站优化公司建网站免费