基于多级片上总线的并行图像处理系统设计

作者:潘波;杨根庆;孙宁;尹增山 刊名:计算机应用研究 上传者:李磊

【摘要】采用基于平台级FPGA的SOC设计方法,设计了一种基于多级PLB总线的可扩展并行图像处理系统。系统采用总线桥并行扩展处理单元来增加系统处理性能和扩展存储访问带宽;通过数据分发模块实现图像数据输入与处理流水线操作。时序功能仿真与硬件实现表明,该设计能灵活高效地实现系统结构的并行扩展,显著提高了系统并行处理性能。

全文阅读

片上系统(SOC)能在单个硅芯片上集成各种功能子模块,通过片上总线互连实现系统级处理性能。特别是基于FPGA的可编程片上系统(SOPC),由于它能满足系统对于体积、灵活性以及稳定性的要求,在实时图像处理系统中得到了广泛的应用。随着图像精度的不断提高,在满足系统实时性要求的情况下,处理任务负载将会大大增加。SOC通过在内部扩展多个处理单元,显著地提高了系统处理能力。但应该指出的是系统总线必须具备相应的数据吞吐速率才能提高系统的整体性能。特别是较底层的图像处理任务虽然算法简单但是需要对数据进行频繁的访问和操作。当处理单元所需的数据访问带宽大于总线传输能力时将会造成总线竞争,进而影响到图像处理系统的实时性。本文在基于平台的SOPC设计技术基础上,从系统并行扩展的同时提高存储访问带宽的角度出发,设计了一种基于多级片上总线的可扩展并行图像处理系统。本文首先介绍了系统结构框架与功能;然后对系统的总线带宽以及并行扩展性能进行了分析与介绍;最后进行时序仿真与硬件验证。结果表明,本设计在灵活实现系统并行扩展的同时,显著提高了系统并行处理性能。1基于多级总线SOPC系统结构设计随着图像精度的不断提高,在满足系统实时性情况下必然要加大系统的计算性能,如在系统总线上扩展处理单元,同时相应地扩展存储带宽以提供相应的数据访问速率。单总线结构由于总线带宽固定,势必会成为系统数据传输的瓶颈,进而影响到系统的实时性。不同于ASIC(专用集成电路),SOC主要通过IP核复用来实现系统级功能,通过标准片上总线接口,可以使SOC系统中的IP功能单元具有较好的可移植性。本文设计了一种基于多级PLB的可扩展并行处理架构,如图1所示。通过片上总线扩展了多个处理单元。处理器PE-m是主控制器,功能为配置其他从单元;Distribution模块为数据分发控制模块,用来实现图像数据输入与处理的流水线操作;处理单元PE1和PE2为并行图像处理单元,它们作为从设备通过PLB-PLB总线桥挂接于总线PLB-m之上,同时也是局部总线PLB-1和PLB-2的惟一主设备。高速同步双口SRAM作为局部总线上的从设备,用来存储原始图像数据与数据处理结果。并行处理流程如下,外部输入的图像数据在distribution模块控制下以分块形式输入,前一个数据块通过片内逻辑互连写入SRAM的端口A,随后启动PE1通过端口B进行数据访问与处理;同时后一个数据块写入PE2处理单元的局部存储器,随后启动PE2进行处理。PE1和PE2处理完成后以中断方式通知主控制器进行后续操作。总线占用情况如图1所示,除了与主控制器交互以外,从处理单元PE1和PE2将一直占用局部总线;主控制器PE通过distribution模块访问存储器来得到处理结果,图像数据的输入通路不占用系统总线。整个操作过程满足数据驱动原则,即由数据块的输入来驱动整个流水线操作。对于图像精度的增加,即单位时间增加了输入图像的数据量,则可通过总线桥在PLB-m总线上并行扩展如图1虚线框内部所示单元来增加系统处理性能。2系统性能分析本文通过多级总线扩展并行处理单元来满足SOPC图像处理系统对实时性的要求,主要分析了该系统的各级总线带宽以及采用该结构的并行系统加速比性能。21总线带宽分析本文采用的PLB片上总线是IBM公司研究开发的高端SOC的片上系统CoreConnect-v3.5[1]总线协议的其中一部分。相对于其他常用的片上总线,如AMBA总线与Wishbone总线,CoreConnect更适合高性能与复杂计算系统的互连。PLB作为系统总线主要挂接多主从设备、可地址流水、

参考文献

引证文献

问答

我要提问