“玄铁930既支持RV定义的拓展,也在玄铁自定义上实现了8T配置能力,这使得其战力充沛,还支持了灵活的算力配比。此外,解耦实现方式让用户在能效比优先还是性能优先之间能够自主选择。通过这样的设计,相比其他友商,C930在GEMM算力利用率上实现了2-3倍的性能提升。”贾昊龚总结说。
作为IP提供商,仅仅提供一个CPU,对于构建SoC来说,只是其中关键一环。为此,玄铁团队过去几年里一直致力于以最高的质量完善玄铁处理器的完整灵活的系统解决方案。公司在处理器核心、互连、中断、LMU等方面在不断的创新迭代。
此外,达摩院还在大力投入以支持社区定义拓展、规范,也在PMU基础上实现了性能分析工具,这在C930的性能优化过程当中起到非常关键的作用。“玄铁C930YE也支持DIVI虚拟中断直通技术,适配PSE5.0 IO MMU设计,这都非常非常有效助力搭建系统。”贾昊龚强调。
他指出,玄铁已经有了成熟的解决方案满足客户的需求,团队也在积极研发,未来玄铁也能真正实现全系统的玄铁IP覆盖。在演讲中,贾昊龚着重介绍了玄铁XL-300、IO MMU、可靠性和安全性以及玄铁DSA可拓展接口方面的技术和进展。
据介绍,XL-300是一个弹性可配置架构,最多可支持8处理器的核心,支持大小核的搭配配置,从L3开始,XL-300最大可支持到23兆,还有丰富的对外接口的支持。XL-300还对特定的场景进行性能优化,支持容量分配、带宽分配,同ID上的DPC独显也会进行另行的加速设计。
“在团队不断优化下,相比XL-200,XL-300的频率提升20%,带宽翻倍,同时我们的面积增加5%。大大控制了硬件成本,也会实现很高的设计质量。”贾昊龚表示。
至于IO MMU,则是玄铁推出的一款面向服务器领域的功能完备高性能的分布式IO MMU,实现了全栈软件生态的支持。用贾昊龚的话来说,这是玄铁在系统方面的重要补充,据他介绍,玄铁团队在IO MMU上采用了一个分布式高并发的IO TLB设计,支持灵活集成,采用独立CU设计,适配多种接口TCIE,集成了IO MPT,还支持虚拟化。面向加速器场景,玄铁的IO MMU还支持了GIPC,也支持了设备QS管控和众多RISC-V社区的IO MMU规范。
当然,如上所说,这款处理器在安全上也有很好保障。玄铁也在支持社区定义的多项RISC和安全规范的基础上,对服务器场景还进行了更加充分的可靠性支持。
最后,贾昊龚还分享了玄铁C930在DSA及可拓展接口方面的布局。
通过协处理器拓展接口,玄铁C930可以实现灵活应用的协处理的拓展支持。通过玄铁预定义的一些自定义指令集拓展,以及译码接口,则可以帮助客户快速高效的参照使用运力,实现对自己特定应用场景的加速。
再通过玄铁自定义的协处理接口标准,能在实现高速的C930和协处理器之间的数据信息传递之余,探讨高效定制指令和工具链,让客户只需要根据指令规范,就能依据实际的需求进行定义、编写、拓展、描述文件,包括不同的格式,依据流程自动就生成工具链,完成对玄铁处理器的适配。在贾昊龚看来,这能大大节省开发的周期和成本。
过去几年,AI时代的迅速发展,让各类算力需求不断提升RISC-V正是乘着这个机会迅速崛起。作为国内的先锋之一,笔者坚信玄铁团队未来必然能在中国高性能处理器市场取得一席之地。返回搜狐,查看更多