基于Mali-T604嵌入式GPU的二维浮点矩阵运算并行优化
ARM Cortex-A15系列处理器是当前最新的嵌入式ARM SoC,该系列处理器首次集成了Mali-T600系列的移动端GPU,该系列GPU支持OpenGL以及OpenCL等计算框架,可以有效加速通用计算,而目前对其应用方法和实际优化效果的研究很少。本文基于以三星的Exynos5250处理器为核心的Arndale Board嵌入式开发平台,对集成于处理器上的Mali-T604嵌入式GPU的GPGPU(General-Purpose computation on GPU)技术进行研究并对不同运算规模的浮点矩阵乘法进行并行加速优化,提供实际测试结果。
GPGPU技术早年主要在超级计算机平台进行高性能计算,而近年该技术逐渐被引入嵌入式领域。但在过去的移动GPU平台上没有专门针对通用计算的软件框架和编程接口,软件设计者难以对于数据的同步和计算的并行进行控制,所以移动GPU在通用计算领域一直难以应用。本文基于Exynos5250 SoC平台详述Mali GPU的硬件特性和将其应用于通用计算的编程的方法,最后将二维浮点矩阵乘法并行化作为优化实例,验证Mali GPU的并行能力,为计划使用嵌入式GPU的GPGPU技术进行优化工作的研究人员和应用开发者提供技术参考和借鉴。
1.Mali T604 GPU的硬件结构和编程特性
Mali是由ARM研发设计的移动显示芯片组(GPUs)系列,不仅能够在移动端提供强大的图像渲染能力,同时在近期对通用计算进行了良好的软硬件支支持。
1.1 Mali T604 GPU的组成结构
Mali-T604是Mali系列中首款使用统一渲染架构Midgard的移动GPU,Mali-T604 GPU包含4个着色器核心,采用AMBA 4 ACE-LITE总线接口,该总线以Cache Coherent Interconnect技术为特色,在多个处理器之间提供完全Cache一致性,通过ARM的一致性和互连技术,计算任务在异构系统中进行共享处理时,可以轻松跨越CPU、GPU和其他可用计算资源,更高效地访问数据。图1展示了Mali-T604 GPU的基本框架。如图2所示,Cortex-A15 CPU核心以及Mali GPU核心物理上共享了片外的RAM存储器并保持了L2Cache的一致性。扁平线圈电感制造厂
NCP1203电源过压保护电路元件疑惑 如题:
修个NCP1203的电路
有个元件,不知道是电容,电阻,还是电感,或者其他
电路图传不上来,不知道什么原因,
图片画圈的那个元件,没有标识。电路原理图,抄板的。
好
做400WPFC+LLC的LED恒流驱动,辅助电源的问题。 做40串10并的400W LED驱动,采用前级PFC+后级LLC的方案。
前级我做,后级我师弟做。
PFC采用PI的PFS726芯片,峰值功率可达到540W;后级采用PI的LCS708方案,输出最大功率440W
LLC的问1 电源网内藏龙卧虎,后进新生特向大家学习。请多多支持。
有个疑问:
一款来自市面上的LED路灯电源(品牌不透了),200Wmax,标称36-54V输出,3.7A(CC)其带载情况如下:
1,CV模式下5