一般说明
ADSP-21062 SHARC超级哈佛结构计算机是一种信号处理微型计算机,提供了新的功能和性能水平。ADSP-21062 SHARC是为高性能而优化的32位处理器,数字信号处理器应用。ADSP-21062以ADSP-21000数字信号处理器为核心,构成一个完整的片上系统,增加了一个双端口片上SRAM和一个专用I/O总线支持的集成I/O外设。
ADSP-21062采用高速低功耗CMOS工艺制造,指令周期为25ns,工作速度为40MIPS。通过片上指令缓存,处理器可以在一个周期内执行每一条指令。表一显示了ADSP-21062的性能基准。
ADSP-21062 SHARC代表了一种新的信号计算机集成标准,它将高性能浮点数字信号处理器内核与集成的片上系统功能相结合,包括一个2兆位的SRAM存储器(ADSP-21060上的4兆位)、主处理器接口、DMA控制器、串行端口和链路端口以及无胶的并行总线连接数字信号处理器多处理。
图1显示了ADSP-21062的框图,说明了以下架构特性:
带有共享数据寄存器文件;数据地址生成器(DAG1、DAG2);带指令缓存的程序序列器;片上定时sram;与片外存储器和;外围设备;主机端口和多处理器接口;DMA控制器;串行端口和链路端口;JTAG测试访问端口。
ADSP-21000系列核心架构
ADSP-21062包括ADSP-21000系列核心的以下架构特征。ADSP-21062处理器与ADSP-21020的代码和功能兼容。
独立的并行计算单元
算术/逻辑单元(ALU)、乘法器和移位器都执行单周期指令。这三个单元并行排列,最大化了计算吞吐量。单个多功能指令执行并行运算单元和乘法器操作。这些计算单元支持ieee 32位单精度浮点、扩展精度40位浮点和32位定点数据格式。
数据寄存器文件
通用数据寄存器文件用于在计算单元和数据总线之间传输数据,并用于存储中间结果。这个10端口,32寄存器(16个主寄存器,16个次寄存器)寄存器文件,结合ADSP21000哈佛体系结构,允许计算单元和内部存储器之间的无约束数据流。指令和两个操作数的单周期获取ADSP-21062具有增强的哈佛体系结构,其中数据存储器(DM)总线传输数据,程序存储器(PM)总线传输指令和数据(见图1)。由于其独立的程序和数据存储总线以及片上指令缓存,处理器可以在一个周期内同时获取两个操作数和一条指令(从缓存)。
指令缓存
ADSP-21062包括一个片上指令高速缓存,该高速缓存支持三总线操作以获取一条指令和两个数据值。缓存是选择性的,只缓存取数与pm总线数据访问冲突的指令。这允许全速执行核心、循环操作,如数字滤波器乘法累加和fft蝶形处理。带硬件循环缓冲区的数据地址生成器ADSP-21062的两个数据地址生成器(DAG)在硬件上实现循环数据缓冲区。圆形缓冲器允许有效编程延迟线和数字信号处理所需的其他数据结构,通常用于数字滤波器和傅里叶变换。ADSP-21062的两个DAG包含足够的寄存器,可以创建多达32个循环缓冲区(16个主寄存器集,16个次寄存器集)。DAG自动处理环绕的地址指针,减少了开销,提高了性能并简化了实现。循环缓冲区可以在任何内存位置开始和结束。
灵活指令集
48位指令字可容纳各种并行操作,以实现简洁的编程。例如,ADSP21062可以有条件地在一条指令中执行乘法、加法、减法和分支。
ADSP-21062/ADSP-21062L功能扩充ADSP-21000系列核心,ADSP-21062增加了以下架构功能:
双端口片上存储器
adsp-21062包含两个兆位的片上sram,每一个都被组织成两个1 mbits的块,可以为不同的代码和数据存储组合进行配置。每个内存块都是双端口的,由核心处理器和I/O处理器或DMA控制器进行单周期独立访问。双端口存储器和独立的片上总线允许在一个周期内从内核传输两个数据,从I/O传输一个数据。在ADSP-21062上,存储器可配置为32位数据的最大64K字、16位数据的128K字、48位指令的40K字(或40位数据),或不同的字大小的组合高达两兆字节。所有内存都可以作为16位、32位或48位字访问。支持16位浮点存储格式,有效地将可存储在芯片上的数据量加倍。32位浮点和16位浮点格式之间的转换是在一条指令中完成的。
虽然每个存储块可以存储代码和数据的组合,但是当一个块存储数据时,使用dm总线进行传输,而另一个块存储指令和数据时,使用pm总线进行传输,访问效率最高。以这种方式使用dm总线和pm总线,每个内存块有一个专用的总线,确保了两次数据传输的单周期执行。在这种情况下,指令必须在缓存中可用。当其中一个数据操作数通过ADSP21062的外部端口传输到片外或从片外传输时,也保持单周期执行。
片外存储器和外设接口ADSP-21062的外部端口提供处理器与片外存储器和外围设备的接口。4G的片外地址空间包含在ADSP-21062的统一地址空间中。用于pm地址、pm数据、dm地址、dm数据、i/o地址和i/o数据的独立片上总线在外部端口上多路复用,以创建具有单个32位地址总线和单个48位(或32位)数据总线的外部系统总线。
通过对高阶地址行进行片上解码以生成存储库,从而方便了外部存储设备的寻址选择信号。为了简化页面模式dram的寻址,还生成了单独的控制线。ADSP-21062提供可编程内存等待状态和外部内存确认控制,允许以可变访问、保持和禁用时间要求与DRAM和外围设备进行接口。
主机处理器接口
ADSP-21062的主机接口允许轻松连接到16位和32位的标准微处理器总线,不需要额外的硬件。支持以高达处理器全时钟速率的速度进行异步传输。主机接口通过ADSP-21062的外部端口访问,并将内存映射到统一地址空间。主机接口有四个dma通道;代码和数据传输以较低的软件开销完成。主机处理器使用主机总线请求(hbr)、主机总线授权(hbg)和就绪(redy)信号请求adsp-21062的外部总线。主机可以直接读写ADSP-21062的内部存储器,并可以访问DMA通道设置和邮箱寄存器。为有效执行主机命令提供了矢量中断支持。
DMA控制器
ADSP-21062的片上DMA控制器允许零开销数据传输,无需处理器干预。dma控制器对处理器核心独立且不可见地操作,允许在核心同时执行其程序指令时进行dma操作。dma传输可以发生在adsp-21062的内部存储器和外部存储器、外部外设或主机处理器之间。dma传输也可以发生在adsp-21062的内部存储器与其串行端口或链路端口之间。外部存储器和外部外围设备之间的dma传输是另一种选择。在dma传输期间执行16、32或48位字的外部总线打包。
ADSP-21062-2通过链路端口提供10个DMA通道,4个通过串行端口,4个通过处理器的外部端口(用于主机处理器、其他ADSP-21062S、内存或I/O传输)。另外四个链路端口DMA通道与串行端口1和外部端口共享。程序可以下载到ADSP21062使用DMA传输。异步片外外设可以使用dma请求/授权线(dmar1-2、dmag1-2)控制两个dma信道。其他dma功能包括在dma传输完成时生成中断,以及用于自动链接dma传输的dma链。
串行端口
ADSP-21062具有两个同步串行端口,为各种数字和混合信号外围设备提供廉价的接口。串行端口可以在处理器的全时钟速率下工作,为每个数据速率提供40 Mbit/s的最大数据速率。独立的发送和接收功能为串行通信提供了更大的灵活性。串行端口数据可以通过dma自动地在片上存储器之间传输。每个串行端口都提供TDM多通道模式。
串行端口可以使用小端或大端传输格式,字长可从3位到32位选择。它们提供可选的同步和传输模式以及可选的μ-律或a-律压扩。串行端口时钟和帧同步可以在内部或外部生成。
多重处理
adsp-21062提供了为多处理器dsp系统量身定制的强大功能。统一地址空间(见图4)允许处理器间直接访问每个ADSP21062的内部存储器。分布式总线仲裁逻辑包含在芯片上,用于简单、无胶连接最多包含六个ADSP-21062S和一个主机处理器的系统。主处理器转换只产生一个周期的开销。总线仲裁可以选择固定优先级或旋转优先级。总线锁允许信号量的不可分割的读-修改-写序列。为处理器间命令提供矢量中断。处理器间数据传输的最大吞吐量是在链路端口或外部端口上的240兆字节/秒。广播写入允许将数据同时传输到所有ADSP-21062S,并可用于实现反射信号量。
链接端口
ADSP-21062具有六个4位链路端口,提供额外的I/O功能。链路端口可以每周期计时两次,允许每个端口每周期传输八位数据。链路端口I/O对于多处理系统中的点到点处理器间通信特别有用。链路端口可以独立地同时操作,最大数据吞吐量为240兆字节/秒。链路端口数据被打包成32位或48位字,并且可以直接由核心处理器或DMA传输到片上存储器。每个链路端口都有自己的双缓冲输入和输出寄存器。时钟/应答握手控制链路端口传输。传输可编程为发送或接收。
程序启动
ADSP-21062的内部存储器可以在系统通电时从8位EPROM、主机处理器或通过其中一个链路端口启动。引导源的选择由bms(引导内存选择)、eboot(eprom引导)和lboot(链接/主机引导)管脚控制。32位和16位主机处理器可用于引导。
EZ-ICE探头靶板连接器
ADSP-2106X EZ-ICE仿真器采用ADSP-2106X的IEEE1149.1JTAG测试接入端口,在仿真过程中对目标板处理器进行监控。Ezice探针要求ADSP-2106X的CLKIN、TMS、TCK、TRST、TDI、TDO、EMU和GND信号可通过14针连接器(2行×7针条头)在目标系统上访问,如图5所示。EZ-ICE探针直接插在该连接器上,用于板上模拟芯片。如果要使用ADSP-2106X EZ-ICE,则必须将此连接器添加到目标板设计中。EZ-ICE连接器和共享EZ-ICE JTAG引脚的最远设备之间的总迹线长度应限制在保证操作的最大值15英寸。此长度限制必须包括路由到一个或多个ADSP-2106X设备的EZ-ICE JTAG信号,或ADSP2106X设备和链上其他JTAG设备的组合。
14针,两排针条集管在针3的位置键入-必须从收割台上拆下销3。销必须为0.025平方英寸,长度至少为0.20英寸。销间距应为0.1×0.1英寸。可从3M、McKenzie和Samtec等供应商处获得销带头。
提供BTMS、BTCK、BTRST和BTDI信号,以便测试访问端口也可用于板级测试。当连接器不用于仿真时,如图5所示,在BXXX引脚和XXX引脚之间放置跳线。如果您不打算使用测试访问端口进行板测试,请将BTRST连接到GND,并将BTCK连接或向上拉到VDD。必须在通电后(通过连接器上的BTRST)或保持低位以使ADSP-2106X正常工作,才能断言TRST引脚。EZ-ICE探针上未连接任何BXXX引脚。
软件启动时,TRST被驱动至低电平,直到模拟器打开EZ-ICE探头。软件启动后,trst被驱动高。图6显示了包含多个ADSP-2106X处理器的系统的JTAG扫描路径连接。将CLKIN连接到EZ-ICE割台的插脚4是可选的。Emulator仅在被指示以同步方式执行诸如启动、停止和单步执行多个ADSP-2106XS的操作时使用clkin。如果不需要在多个处理器上同步执行这些操作,只需将EZ-ICE头的引脚4连接到地上。
如果需要同步多处理器操作
CLKIN已连接,多个ADSP21062处理器和EZ-ICE头上的CLKIN管脚之间的时钟偏差必须最小。如果偏差过大,同步操作可能会在处理器之间关闭一个或多个周期。对于同步多处理器操作,tck、tms、clkin和emu应被视为倾斜方面的关键信号,并且应该在你的董事会上尽可能短的时间安排。如果tck、tms和clkin正在驱动大量adsp-21062s(超过8个)在您的系统中,然后将它们视为“时钟树”使用多个驱动程序来最小化偏差。(见图7中的“JTAG时钟树”和“时钟分布”ADSP2106X用户手册第二版的“高频设计注意事项”部分。)
如果不需要同步多处理器操作(即clkin未连接),只需在tck和tms上使用适当的并行终端。TDI、TDO、EMU和TRST在倾斜方面不是关键信号。
定时规格
将提供两种速度等级的ADSP-21062,40MHz和33.3MHz。所示规范基于40 MHz的clkin频率(tck=25 ns)。dt降额允许在其他clkin频率下的规格(在tck规格的最小-最大范围内;见下面的时钟输入)。dt是实际clkin周期和25 ns clkin周期之间的差异:
使用给定的精确计时信息。不要试图从其他的加法或减法中导出参数。虽然加法或减法会对单个设备产生有意义的结果,但本数据表中给出的值反映了统计变化和最坏情况。因此,不能有意义地添加参数以获得更长的时间。
有关电压参考水平,请参见测试条件下的图27。
开关特性指定处理器如何更改其信号。您无法控制处理器外部的定时电路必须设计为与这些信号特性兼容。开关特性告诉你处理器在给定的情况下会做什么。您还可以使用切换特性来确保连接到处理器的设备(如内存)的任何计时要求都得到满足。
时间要求适用于由处理器外部电路控制的信号,如用于读取操作的数据输入。时序要求保证处理器与其他设备一起正常工作。
开发工具
ADSP-21062支持一整套软件和硬件开发工具,包括EZ-ICE内循环模拟器、EZ-Lab®开发板、EZ-Kit和开发软件。EZ-Lab包含一个评估板带有ADSP-21062(5 V)处理器并提供与PC的串行连接。SHARC EZ-KIT将用于PC的ADSP21000系列开发软件和EZ-Lab ADSP-21062的开发板组合在一个软件包中。除ez-lab开发板外,ez-kit还包含优化编译器、汇编程序、指令级模拟器、运行时库、诊断实用程序和一整套示例程序。
同样的ez-ice硬件可以用于adsp-21060/adsp-21061,以完全模拟adsp-21062,除了显示和修改两个新的运动寄存器。模拟器不会显示这两个寄存器,但您的代码可以使用它们。
模拟设备的ADSP-21000系列开发软件包括基于代数语法的易于使用的汇编程序、汇编库/库、链接器、指令级模拟器、ANSI C优化编译器、CBUG™C源代码级调试器,以及一个包含dsp和数学函数的c运行库。优化编译器包括基于ansi数值c扩展组工作的数值c扩展。数值c为c语言提供了数组选择、向量数学运算、复杂数据类型、循环指针和变量的扩展。
ADSP-21062 EZ-ICE仿真器采用ADSP-21062处理器的IEEE1149.1JTAG测试访问端口,在仿真过程中对目标板处理器进行监控。EZ-ICE提供全速仿真,允许检查和修改内存、寄存器和处理器堆栈。通过使用处理器的jtag接口确保了非侵入式电路内仿真。仿真程序不会影响目标系统的加载或定时。
ADSP-21000系列硬件和软件开发工具数据表(ADDS-210XX-TOOLS)中提供了更多详细信息和订购信息。本数据表可向任何模拟设备销售办公室、经销商或文献中心索取。
除了模拟设备提供的软件和硬件开发工具外,第三方还提供了一系列支持sharc处理器系列的工具。硬件工具包括sharc pc插件卡、多处理器sharc vme板和具有多个sharc和附加内存的子卡模块。这些模块基于sharcpac™模块规范。第三方软件工具包括ada编译器、dsp库、操作系统和框图设计工具。
管脚功能说明
ADSP-21062管脚定义如下所示:ADSP-21062和ADSP-21062L上的所有管脚都相同。被标识为同步的输入必须符合CLKIN(或用于TMS、TDI的TCK)的定时要求。标识为异步(a)的输入可以异步断言为clkin(或异步断言为trst的tck)。
除了ADDR31-0、DATA47-0、FLAG3-0、SW和具有内部上拉或下拉电阻器(CPA、ACK、DTX、DRX、TCLKX、RCLKX、LXDAT3-0、LXCLK、LXACK、TMS)的输入外,未使用的输入应与VDD或GND连接或拉动和TDI)-这些引脚可以保持浮动。这些引脚有一个逻辑电平保持电路,防止输入内部浮动。
A=异步G=接地I=输入;O=输出P=电源S=同步;(A/D)=主动驱动(O/D)=开漏;t=三种状态(当sbts被断言时,或当ADSP-21062是总线从站)。