基于TS101的多DSP并行视频实时处理系统硬件设计

第 31 卷第 2 期                   子 工 程 师                   电 Vol. 31 No. 2 2005 年 2 月  ELECTRONIC ENGINEER   Feb. 2005

基于 TS101 的多 DSP 并行视频实时处理系统硬件设计
黄   , 周建江 昕
( 南京航空航天大学信息科学与技术学院 , 江苏省南京市 210016)

【摘     要】 为了满足空中微型传感器双目视频导航图像数字化处理系统的实时需求 , 文中在介 绍了在并行处理技术应用背景的基础上 ,提出了一种基于 TS101 的多数字信号处理器 (DSP) 并行双通 道视频处理系统的解决方案 ,并给出了具体硬件实现 。目前 ,该系统能够实现对双目视频图像的实时 采集 、 数字视频合成和实时存储 ,从而为双目视频图像导航的实时处理奠定了基础 。 关键词 : 实时信号处理 , 多 DSP , 并行处理 , 图像处理 中图分类号 : TN911. 73 提高 。但是 ,仅仅依靠器件的进展而达到的速度提高 , 远不能满足现代科学技术 、 工程和其他许多领域对高 速运算能力的需要 。这就要求人们改进计算机结构 , 采用各种并行处理技术 , 以便大幅度地提高处理速度 和解题能力 。 并行处理计算机的结构特点主要表现在两个方 面 : 一是在单处理机内广泛采用各种并行措施 ; 二是由 单处理机发展成各种不同耦合度的多处理机系统 。本 文提出的并行处理系统解决方案把这两种并行处理机 结构特点结合在一起 , 最大限度地提高系统的处理能 力。 ADI 公司的 TS101 在一个处理器中集成了两个独 立的运算单元 ,是单指令多数据 ( SIMD) 结构 ,同时 ,处 理器之间使用了分布式松耦合连接 , 是多指令多数据 (MIMD) 结构 。由于器件的发展 ,并行处理计算机系统 具有较好的性能价格比 ,而且还有进一步提高的趋势 。

0    引 言
在实时信号处理领域 , 对运算速度的要求在不断 提高 ,尤其是在雷达 、 、 声纳 图像处理等领域 ,数据吞吐 量大 ,算法复杂 ,运算量大 ,与此同时 ,传统单处理器系 统受到自身特性的限制 , 运算速度的进一步提高变得 越来越困难 。因此 ,为了满足对运算速度的巨大需求 , 只能 通 过 并 行 处 理 技 术 来 实 现 。数 字 信 号 处 理 器 (DSP) 制造商也适时地推出了适合构成多 DSP 系统的 处理器 。
ADI 公司的 TigerSHARC 系列处理器中的 TS101 是

目前性能很高的一款 , 它拥有很高的运算速度 , 它的 4 个 链 路 口 ( linkport ) 使 IO 数 据 的 吞 吐 量 可 以 达 到
1 G s ,能方便地实现处理器间的各种网络连接 。在 B/

构建并行处理系统时 , 系统的网络拓扑结构是必须考 虑的主要因素之一 ,它与系统的算法模型密切相关 。 为了满足空中微型传感器双目视频导航图像数字 化处理系统的实时需求 , 本文提出了一种基于 TS101 的多 DSP 并行双通道视频处理系统的解决方案 , 并给 出了具体硬件实现 。该系统由 4 片主频 250 MHz 的 TS101 DSP 构成 ,利用现场可编程门阵列 ( FPG ) 实现 A 多 DSP 网络拓扑结构的互连及视频数据的输入输出 缓冲 ,从而可根据系统不同的算法模型和软件流程 ,方 便地实现多 DSP 系统网络拓扑结构的软件重构 。目 前 ,该系统能够实现对双目视频图像的实时采集 、 视频 合成和实时存储 ,为双目视频图像导航的实时处理奠 定了基础 。

2  系统的硬件方案
基于 TS101 的多 DSP 并行处理系统的设计目的是 为了实现对双目视频图像的实时采集 、 数字视频合成 、 实时存储和回放 ,因此要求所设计开发的硬件系统具 有很大的通用性和灵活性 , 以及很高的运算速度 。该 系统主要由 4 片 TS101 处理器 ,1 片 Xilinx 公司的 Ver2 tex2 系 列 FPG 构 成 , 再 加 上 2 片 视 频 输 入 芯 片 A S5D0127 ,1 片模拟视频输出芯片 ADV7176 、 个数字视 1 频输出接口 、 个硬盘接口和 1 个 CF 卡接口 , 这样使 1 得系统能够同时实时地处理双目视频图像 , 并且实现 存储 、 回放等功能 ,也能满足上述通用性 、 灵活性 、 快速 的要求 。 系统的硬件结构如图 1 所示 。

1  并行处理系统的应用背景
随着电子器件的发展 ,计算机的处理能力有显著
收稿日期 : 2004210208 ; 修回日期 : 2004212211 。

?64 ?

第 31 卷第 2 期           ,等 : 基于 TS101 的多 DSP 并行视频实时处理系统硬件设计   信息处理与显示技术? 黄 昕 ?

XC1000 系列 Vertex2 。 2. 3  视 频 解 码 芯 片 KS0127 与 视 频 编 码 芯 片 AD V7176 KS0127 是三星公司开发的能够把模拟 NTSC 、 PAL

或 SECAM 视频信号转换成 YCbCr 或 RG 格式输出的 B 视频解码芯片 。KS0127 具有很强的适应性 , 能够自动 检测输入视频信号的制式 , 具有 6 路视频信号输入并 且可以随意在这 6 路视频信号之间切换 。这样 , 系统 就 可 以 支 持 NTSC 、 PAL 两 种 信 号 的 多 路 输 入 。 ADV7176 是 AD 公司开发的能够把 YCbCr 、 B 等格式 RG 的数字视频信号转换成 PAL 或 NTSC 制式模拟输出的 编码芯片 。这两款芯片内部都集成了 I2 C 总线接口 , 这样只需要两根线就可以很容易地配置 KS0127 与 ADV7176 的内部寄存器 ,控制它们的各种工作参数 。 2. 4   硬盘与 CF 卡接口 硬盘具有存储量大 、 通用性强等特点 ,对硬盘的操 作是通过 IDE 接口来实现的 。CF 卡具有体积小 、 容量 大的特点 ,广泛用于便携式设备中 。CF 卡有 3 种接口 模式 : PC 卡存储器模式 、 卡 I/ O 模式和 True IDE 模 PC 式 。为了更方便地实现硬盘和 CF 卡的接口 , 本系统 使用 IDE 方式来对 CF 卡进行操作 ,这样就可以对硬盘 和 CF 卡统一用 IDE 方式进行访问 ,使软件设计更加方 便。

图1  系统的硬件结构

2. 1  TigerSHARC 系列 ADSP2TS101 ADSP2TS101 ( 简称 TS101) 是 ADI 公司新推出的 32

 

位高性能定/ 浮点 DSP 。它拥有丰富的片内资源 ,包括 6 MB 片内 SRAM 、 片内 SDRAM 控制器 、 主机接口 、 DMA 控制器 、 链路口以及可以无缝组成多处理器的共享总 线连接 。这样 ,使用 TS101 就可以方便地与外部设备 接口而不需要很多的逻辑控制 。TS101 的工作频率是 250 MHz ,采用静态超标量结构 , 既有超标量处理器所 具备的大容量指令缓冲池和指令跳转预测能力 , 又可 以在程序执行前就对指令级进行并行操作并用编译器 预测出来 , 这使得它具有极高的处理能力 。TS101 具 有两个独立的计算单元 ,每个单元都有算术逻辑单元 、 乘法器 、 移位器 、 寄存器组及相关的数据对齐缓冲器 , 这就使得 TS101 能对定点或者浮点数据进行多字宽度 的处理 。鉴于以上特性 , TS101 很适合用于图像处理 等运算量巨大的实时应用场合 。 2. 2  Xilinx 公司的 Vertex2 系列 FPGA Xilinx 公司推出的 Vertex2 系列 FPG 是目前广泛 A 使用的高性能 、 高密度的 FPG 之一 。Vertex2 系列 FP2 A G 的内部配置逻辑主要包括配置逻辑块 、 RAM 、 A 块 乘 法器和数字时钟管理器 4 部分 。配置逻辑块主要用来 完成组合和同步逻辑设计 ,是 FPG 的基本组成部分 。 A 块 RAM 资源是 10 kB 的双端口 RAM ,再使用 Xilinx 公 司提供的 IP 核 ,可以很方便地设计出同步和异步先进 先出 ( FIFO) 。数字时钟管理器提供了分频 、 频率综合 、 相移等时钟分配解决方案 , 可以满足很多复杂的时钟 分配要求 。片内的嵌入式乘法器是 18 × 位二输入 18 高速乘法器 。此外 , 片内还有输入输出块 ( IOB ) 、 数字 阻抗控制 (DCI) ,每个 IOB 可以支持 19 种电平标准 ,可 以方便地跟外部不同电平的总线相连 , 而 DCI 可以使 用参考电阻的值来对总线进行匹配 , 这种把匹配放在 片内的方法节约了很多印制电路板 ( PCB ) 空间以及减 少了布线难度 。 由于 FPG 在整个系统中是用来实现视频输入 、 A YCbCr 和 RG 视频输出 、 B 图像帧缓冲 FIFO 、 的接 DSP 口、 系统时序控制以及少量的一些信号处理 ,主要的应 用并 不 是 数 字 信 号 处 理 , 所 以 选 用 了 10 万 门 的

3  并行处理系统中处理器的拓扑结构
并行处理的目的是采用多个处理单元同时对任务 进行处理而减少任务的执行时间 , 如何能以最短的时 间完成任务是设计时最需要关心的问题 , 对这一问题 的反映表现在处理机的两个基本性能指标 : 加速比和 并行效率 。 并行处理机的这两个基本性能取决于组成并行处 理机的 3 个要素 : 处理单元 、 并行处理网络结构 、 并行 算法和任务分配方法 , 三者之间紧密联系 、 互相依赖 。 处理单元是并行处理的核心 ,通用并行 DSP 是完成实 时信号处理的最佳选择 。并行处理时处理单元之间的 数据通信是不可避免的 , 并行处理机网络为各处理单 元提供数据交换的通路 , 并负责子任务传送和控制调 度信号的传递 。处理单元之间的网络结构大致可分为 两类 : 一类是共享总线和共享存储器系统 ,称为紧耦合 式并行系统 ; 另一类是各处理单元有各自独立的数据 存储器而通过通信口相联的分布式并行系统 , 又称为 松耦合式并行系统 。 主要的紧耦合和松耦合分布式系统的连接形式如 图 2 所示 。 ?65 ?

? 信息处理与显示技术?              子 工 程 师                 电 2005 年 2 月

并行处理系统硬件结构搭建好后 , 为了很好地发 挥其超强的处理能力 , 要靠软件设计来实现 。ADI 公 司的 Visual DSP + + 是 TigerSHARC 系列 DSP 的集成开 发环境 ,支持汇编 、 、 + + , 并且提供了一个嵌入式 C C 操作系统核 VDK ,让程序员使用这些工具编写出高性
   (a)   紧耦合成        (b)   松耦合式

图2  紧耦合和松耦合分布式系统结构  

   由于本并行处理系统的要求是要实现对双目视频 图像的实时采集 、 数字视频合成和实时存储及回放 ,这 样就要求系统具有非常强的灵活性 , 因此把 4 片 DSP 的数据线分别接到 FPG 上 , 这样 4 片 DSP 都可以从 A 两路视频解码器得到视频图像的数据 。在实现并行算 法时 ,处理器之间的数据传输速度尤为重要 ,如果传输 时间太长 ,则并行处理的优势体现不出来 ,反而成为瓶 颈 。TS101 处理器的链路口作为一个可选的通信方 式 ,旨在实现多 DSP 系统中 DSP 之间的点对点通信 , 每个 TS101 有 4 个半双工链路口 , 每个链路口的最高 传输速率是 250 MB/ s ,非常方便并行系统中处理器之 间的通信 。在该并行处理系统中 ,4 片 DSP 每两片之 间用链路口进行连接 ,这样就构成了分布式并行系统 。 这种结构对于各种复杂算法可以分割成小的任务给各 片处理器来流水完成 ,同时由于具有丰富的接口 ,还可 以给各处理器分配独立的任务从而实现复杂的功能 。

能的应用程序 ,发挥并行处理系统的强大处理能力是 硬件设计的最终目的 。图 4 是利用该系统得到的将 2 路视频合成 1 路视频后的一幅图像画面的示例 。

图 4   路视频合成 1 路视频的图像画面示例 2  

5  结束语
本文介绍了一种基于 TS101 的并行图像处理系统 的硬件设计与实现 , 详细说明了 4 片 TS101 的网络拓 扑结构 、 A 在该系统中的功能以及各接口在系统中 FPG 的作用 。目前 ,该系统能够实现对双目视频图像的实 时采集 、 数字视频合成和实时存储 ,为双目视频图像导 航的实时处理奠定了基础 。下一步 , 该并行处理系统 将用于空中微型传感器中双目视频导航试验样本数据 获取 、 算法模型的实时验证等 。当然 ,该系统也可作为 其他各种复杂算法研究与应用的试验开发平台 。
参      考 文 献
[1 ] ADSP2TS101 TigerSHARC Processor HARDware Reference. Ana2 log Devices Inc , 2003 Inc ,2003 [3 ] VirtexTM2 Ⅱ Platform FPG : Complete Data Sheet. Xilinx ,2003 As [4 ] Virtex2 Ⅱ Platform FPG User Guide. Xilinx , 2004 A [5 ] 苏   ,等 . 高性能 DSP 与高速信号处理第 2 版 . 西安 : 西 涛

4  系统的硬件实现
在该 TS101 构成的多处理器系统中 , 由于采用的 是松耦合结构 , 所以各 DSP 的 ID 都应该设为 0 , 保证 它们能对各自的总线完全控制 。另外 , 多处理器系统 的时钟 、 复位信号是决定系统能否正常工作的关键信 号 。在本系统中 , 复位信号从看门狗接到 FPG , 再由 A FPG 分发到各个 DSP ,保证了复位的稳定性 。时钟信 A 号必须在阻抗可控的传输线中传输 ,为保证各 DSP 的 时钟信号之间不存在相位差 , 或者说相位差在系统允 许的范围内 ,一般应采取始端连接的方式 。图 3 给出 系统时钟分配的例子 , 它允许在不同的路径中存在延 时 ,每个设备必须是在线的终端 。传输路径必须均匀 分布 ,以使各路径上的传输延时相互匹配 。

图3  时钟分发示意图

?66 ?

[2 ] ADSP2TS101TigerSHARC Processor Data Sheet. Analog Devices

安电子科技大学 ,2002

[6 ] 吴敏渊 ,等 . ADSP 系列数字信号处理器原理 . 北京 : 电子工

业出版社 ,2002 社 ,2002

[7 ] 陈国良 , 等 . 并行计算机体系结构 . 北京 : 高等教育出版

( 下转第 73 页)

第 31 卷第 2 期            花振峰 ,等 : . NET 组件和 COM 组件的应用集合研究       计算机与自动化技术? ?

组件 ,然后可以把 NXMLProcess 组件当成 COM 组件一 样使用 。如何使用 COM 组件已经是成熟的技术 。下 面是利用 NXMLProcess 组件在 VC 平台下读取到的短 消息类型的 XML 文件结构和数据 。
< ! - - The phonenumber Info of sender center - - > < Infosc author = ” ”time = ” huazf 20041014” > < ! - - The kind of sender center - - > <K indList headvalue = ”” 1 > < ! - - The use is unknown - - > < KindRef name = ” ”value = ””text = ” K01 8 unknown” > / < ! - - Use for international - - > < KindRef name = ” ”value = ””text = ” ” > K02 9 inter / < ! - - Use for homeuse - - > < KindRef name = ” ”value = ” ”text = ” K03 A home” > / < ! - - Leave for other use - - > < KindRef name = ” ”value = ””text = ” ” > K04 F other / </ K indList > < ! - - The List of phonenumber - - > < PhList > < ! - - the use is unknown - - > < phRef name = ” ”value = ””text = ” P01 0 unknown” > / < ! - - the mortal use - - > < phRef name = ” ”value = ””text = ” P02 1 ISDN” > /

< ! - - leave for other use - - > < phRef name = ” ”value = ””text = ” ” > P03 F other / < / phList > < / Infosc >

   至此 ,完成了在非 . NET 平台上调用 . NET 组件 。 在 . NET 平台上调用 COM 组件的原理相同 ,并且比较 简单 ,这里不再介绍 。

3  结束语
本 文基于手机接口平台介绍了融合 COM组件和 . NET 组件的手机接口系统的体系结构 。本文所述的 程序在手机接口平台上得到了很好的使用 , 实践证明 这样的体系设计是合理的 。
参      考 文 献
[1 ] Kruglinski D J . Visual C++ 技术内幕 . 潘爱民 , 王国印 , 译 .

北京 : 清华大学出版社 ,1999
[2 ] Robinson S , Allen K S. C # 高级编程 . 杨   ,等译 . 北京 : 浩

清华大学出版社 ,2004
[3 ] 裴剑锋 , 高   , 徐继伟 . XML 高级编程 . 北京 : 机械工业 伟

出版社 ,2002

A Study on the Application of . NET and COM Components
Hua Zhenfeng , Yang Weiming , Zhang Sheng (University of Shanghai for Science and Technology , Shanghai 200093 , China)

( 上接第 66 页)

【Abstract】 COM refers to component object model . It provides a model and an object oriented technical   standard for code reuse. . NET component , provided by Microsoft , is a new generation component model . We dis2 cuss the integration of the COM and . NET components across two different platforms based on the technique of mo2 bile phone interface. According to the potential requirements , we propose a system design , architecture and func2 tions application scenario and investigated the invocation . NET Component on the non . NET platform in detail . Keywords : . NET Component , COM , interactive , XML , program collection , CCW , strong name

【Abstract】 In real2time signal processing domain , with the increasing of algorithmic complexity , the re2   quirement for processing speed of a processor is also increased. The application background of parallel processing technology is introduced. In order to satisfy the real2time demanding of video navigation processing system for two video input , a project of multi2DSP parallel dual channel video processing system and its detail application are pre2 sented. At present , real2time collection , digital video synthesization , storage can be implemented in this system. Thereby it lays a foundation for future complex dual channel video navigation real - time processing. Keywords : real2time signal processing , multi2DSP , parallel processing , image processing

H ardware Design of Multi2DSP Parallel Real - time Video Processing System Based On TS101
Huang Xin , Zhou JianJiang (Nanjing University of Aeronautics and Astronautics , Nanjing 210016 , China)

?73 ?


相关文档

多DSP并行处理系统的设计与开发
基于DSP的实时视频图像处理系统设计
基于多核任务并行处理的DSP软硬件设计
基于多DSP的并行实时视频处理系统
DSP_FPGA的实时图像处理硬件系统设计
基于DSP的视频监控系统硬件设计
基于多DSP的高速通用并行处理系统研究与设计_周滨
基于DSP_FPGA的实时视频信号处理系统设计
基于DSP 的视频监控系统的硬件设计
基于DSP的Retinex实时视频图像处理系统设计
电脑版