基于SystemC的存储器模型设计

元器件信息   2022-11-28 14:47   264   0  

目录

1.SystemC

2.存储器建模

2.1存储器模型概述

2.2存储器接口

2.3存储器实体

2.4存储器控制器

2.5参数配置

3.应用实例
结束语

  建立芯片模型是在早期进行芯片架构决策的有效方法,通过建模不仅可以对芯片的性能做出分析,还可以在硬件没有完成之前开发软件,不仅提高了产品成功率,而且缩短了研发周期。设计人员早期采用C/C++语言进行硬件建模。但是随着软硬件复杂度的提高,C/C++语言难以再满足要求。OSCI适时推出了SystemC语言来适应新的需求。如今SystemC已经被广泛应用于SoC软硬件建模中。本文提出了一个可配置的通用存储器SystemC模型,可以作为构造SoC的通用IP模型。

  1.SystemC

  SystemC可被视作C++硬件建模和仿真的扩展库,特别适合集成电路的建模,但它事实上可以用来描述更多的系统。SystemC通过确定仿真(simulation kernel)算法定义了处理并行事件和仿真时间的机制。SystemC还定义了模块、端口、接口、通道等概念来组成一个复杂SoC的连接关系和层次结构。因此,它解决了标准C++语言用于复杂硬件建模时的难题。

  2.存储器建模

  2.1存储器模型概述

  为了能帮助设计人员分析系统性能并选择合适的存储器构造,存储器模型需要反映出对性能造成影响的关键参数,即带宽、延时和仲裁机制。而这些参数又是由存储器的结构以及其它参数决定的。另一方面,本文希望提出一个通用的存储器模型,因此会有更多的参数用于配置存储器以模拟某种特定类型的存储器特征,比如多端口SRAM。

  图1给出了所设计的存储器模型的结构。它包括三个部分:一是模型接口;二是端口及bank可配置的存储器;三是由读写通路及仲裁机制构成的存储器控制器。接口部分采用了事务级建模,而内部模块采用了时钟精准的建模,这样在保证时间精度的同时,方便了接口连接以及提高了仿真速度。

可配置存储器模型结构

  图1 可配置存储器模型结构

  2.2存储器接口

  基于SystemC的存储器模型接口,由SystemC定义的接口基类派生而来。整个存储器模型是一个SystemC模块,由于实现了所定义的存储器模型接口,它成为SystemC概念中的hierarchal channel。因此,该存储器模型将如同其它SystemC定义的通道,比如FIFO,一样作为基本组件来连接其它的模块从而构造出SoC硬件系统。所设计存储器具有如下所述事务级SystemC接口。

  阻塞读接口:该接口用来读取给定地址的给定大小的数据,当数据没有读出时,调用这个接口的模块线程将被堵塞,直到数据读出为止。除了地址和数据,该接口还包含调用者的标志信息。

  非阻塞读接口:与阻塞读接口不同的是,如果在调用时读指令不能被接受,则返回失败。否则,不等待数据返回便成功退出。这样调用接口的模块线程可以在等待时间做其它事情。调用者通过监听存储器模型广播的当前读出数据多对应调用者标记来在之后读出数据。

  阻塞写接口:该接口用来向存储器给定地址写入给定大小的数据。当指令或写数据不能被存储器模型接收时,调用的线程被堵塞直到接受为止。除了地址和数据,该接口还包含调用者的标志信息。

  非阻塞写接口:与阻塞写接口不同的是,当指令或数据不能被接受时,返回失败而不等待。否则返回成功。

  复位接口:用于复位存储器模型。

  为了不强制要求外部提供存储器模型需要的时钟,存储器模型接口中不包含时钟输入。模型内部有一个专门的时钟产生线程。

  2.3存储器实体

  存储器模型中的存储器实体可以由多个bank组成,并构成一个子模块。根据bank的数量和种类,该存储器子模块具有不同数量的只读端口、只写端口和读写端口。为了能尽可能模拟不同的存储器类型,存储器子模块可配置参数如表1所示。

表1存储器配置参数

  2.4存储器控制器

  存储器控制器由指令队列、数据缓存、以及仲裁器构成。这一部分对系统的性能有重要影响。读指令队列和写指令队列用来分别缓存读写指令。当它们写满时,新的读写操作将失败或堵塞。指令队列的数量取决于访问存储器模型的模块有几个优先级。相同优先级的指令会被放到同一个队列。读仲裁器和写仲裁器分别根据队列中的读地址和写地址,读写数据缓存器的状态,以及指令优先级来决定发送哪个指令到哪个端口。而如果读指令和写指令指向了相同的读写端口,读写仲裁器将再做出仲裁。这里的每个仲裁器除了上述功能外,具体的仲裁机制以虚函数的形式由具体的实现来决定。在该存储器模型中实现了默认的基于优先级的轮询算法。存储器控制器的配置参数如表2所示。

表2存储器控制器的配置参数

  2.5参数配置

  存储器模型的众多参数需要在构造函数中配置完成。在运行阶段,不能再更改配置。运行阶段的配置更改将是我们下一步的研究内容,可以用于类似于文献[8]的自演化系统。

  3.应用实例

  图2所示为一个H.264解码器模块框图。该解码器共包括四个模块以流水线方式工作在宏块级别。其中熵解码产生运动矢量,变换系数等信息。残差恢复模块通过反量化、反变换操作得到残差。宏块预测模块进行帧内或帧间预测并和残差一起重建出宏块数据。去快效应模块实现H.264去块效应滤波。这四个模块通过一个共享的SRAM 来交换数据。RTL设计人员根据设计指标率先完成了各模块微架构的设计,平均解码每个模块所需时间在指标范围内。

H.264解码器模块框图

  图2 H.264解码器模块框图

  为了确定共享SRAM 引入的性能损失和确定SRAM 的设计,采用本文存储器模型进行分析。存储器的大部分参数已经被确定,需要决定采用几个bank(每个bank是一个单端口SRAM)。另一方面,各模块读写存储器的时间也基本确定从而有了可靠地负载模型。通过改变存储器模型的bank数,得到结果如图3所示。

不同bank数所对应的单个宏块平均解码时间占允许时间的比例

  图3 不同bank数所对应的单个宏块平均解码时间占允许时间的比例

  由于bank的增加可以减少访问存储器的冲突,模型仿真得到的处理时间随bank数量的增加而减少。但是可以看到bank数量对所消耗的时间影响不大,这说明各解码模块访问存储器的时间分布已经比较均匀。由于一个bank的情况已经可以满足要求,所以确定bank数为1。RTL全部完成后的仿真结果所消耗的时间比模型所给出的略少一些,原因是RTL设计对访问共享SRAM 的时间安排做了进一步细化的工作。

  结束语

  以上就是基于SystemC的存储器模型设计介绍了。通过一系列的参数配置,该模型能够帮助设计人员快速实现系统建模并在存储器设计和选择上做出合理判断。借助其通用性,它还可以帮助保持一致性和减少重复劳动。该模型被应用于视频解码中,成功预测了共享SRAM 的bank数对性能的影响,证明了其有效性。

登录icspec成功后,会自动跳转查看全文
博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。