列表多图
上一页 1 下一页

异构多核实现十倍嵌入式内存性能的三种方法


从理论上讲,异构多核设备可以配备针对给定用例可投入使用的,针对任何类型的操作进行了优化的计算块。用于视频处理的GPU,用于对象识别的神经网络处理器,用于运行OSCPU等。与同类同类处理器相比,不同的适用内核为SoC提供了更大的灵活性,从而在更大的工作负载范围内提供了更高的性能和更低的功耗。

但是,当开始考虑基于边缘的AI,计算机视觉等应用程序的需求时,事实是,I / O和内存的限制与原始处理性能一样,甚至更多。

以下是嵌入式存储器体系结构为满足下一代异构多核处理器需求而不断发展的三种方法。

1内核专用SRAM

如果您查看许多此类嵌入式处理器,它们过去一直都使用SRAM。现在,对于每个特定的单元,我们都有本地SRAM,可从DRAM获取数据,将其存储在本地并进行处理,然后发送回最终输出。

特定于内核的SRAM具有两个优势,首先是由于不必将临时数据写回到片外DRAM而获得的存储性能提升。

该架构还具有降低功耗的额外优势,因为非常低电压的SRAM块位于SoC中相应逻辑IP的附近或附近。

2增加系统内存

如今,嵌入式处理器具有多达4 MB8 MB的系统内存。该系统内存不专用于任何一个特定的内核,可以在CPUGPU和加速器等元素之间共享。

与专用SRAM相似,共享更多系统内存的主要好处是更少的DRAM访问。例如,传统的视频编码序列如下所示:

DRAM->视频编码器-> DRAM->附加计算-> DRAM

增加的系统缓存可实现以下目的:

DRAM->视频编码器->系统内存->附加计算-> DRAM

如前所述,区别在于单独的内核不必连续从片外DRAM获取数据,因为大的系统内存消除了对该中间步骤的需要。

3增加缓存大小

最后,随着更新的处理技术使更大容量的存储器更便宜,缓存大小将不可避免地增加。在异构SoC上找到的用于CPUGPUDSP和其他核心体系结构的更大的缓存也会减轻DRAM流量。


0755-88879880
QQ联系方式:52609913
地址:深圳市南山区西丽龙珠三路光前工业区21栋4楼


深圳市朗锐智科实业有限公司专注于物联网方案实施,高效硬件开发(嵌入式主板,工控机,rk3399),提供从云到端的全流程产品研发和生产服务,硬件设计涵盖单片机、arm、x86、DSP等平台,应用技术从数据采集,工业通讯,自动化控制到机器视觉等等,服务领域从电梯安全、油田监控、环保监测、铁路安全、现代化农业到医疗健康等。以物联网综合解决方案为基础,通过高效软硬件开发,服务客户的垂直行业应用,帮助客户实现物联网项目实施