推理加速存储AS3000G7发布：以存代算节省算力消耗

sinrry• 2025年07月31日 14:04 • 互联网• 162

7月31日消息，据媒体报道，2025（第二届）产融合作大会在北京召开。会上，浪潮存储重磅发布了推理加速存储产品AS3000G7，旨在解决大模型推理中因KVCache重复计算导致的算力浪费和时延问题，...

7月31日消息，据媒体报道，2025（第二届）产融合作大会在北京召开。会上，浪潮存储重磅发布了推理加速存储产品AS3000G7，旨在解决大模型推理中因KV Cache重复计算导致的算力浪费和时延问题，为金融、科研等领域的模型规模化落地提供关键支撑。

当前，大模型推理高度依赖昂贵的GPU服务器，其利用效率直接决定了模型从“实验室”走向“生产线”的速度。

与此同时，IDC预测未来五年智能算力规模将增长1.7倍，且到2027年，推理工作负载占比将超过70%，提升GPU利用效率的需求愈加迫切。

浪潮存储AS3000G7创新性地提出“以存代算”方案。该产品能够集中存储所有KV Cache及多轮对话结果。

其架构将KV Cache从GPU本机内存，通过高速网络缓存至AS3000G7。在后续对话中，系统可按需直接拉取缓存，彻底避免了重复计算。

这一突破性设计显著节省了算力消耗，提升了宝贵的GPU资源利用率，加速了大模型在实际场景中的高效应用。

本文转载于快科技，文中观点仅代表作者个人看法，本站只做信息存储

阅读前请先查看【免责声明】本文内容由互联网用户自发贡献，该文观点仅代表作者本人，本站仅供展示。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 1217266901@qq.com 举报，一经查实，本站将立刻删除。转载请注明出处：https://jingfakeji.com/tech/93821.html

3 4

中国互联网企业用户规模一览：昔日BAT变DAT 百度跌出前三

上一篇 2025年07月31日 14:04

2025日本最可爱初一、高一女生选出：这颜值如何

下一篇 2025年07月31日 14:05

互联网

世界田联新规女性运动员须检测性别保证公平性：网友点赞早该如此

7月31日消息，据国外媒体报道称，越来越多的国际比赛开始对性别模糊的女运动员进行阻止，以保证比赛的公平。世界田联宣布，自2025年9月1日起，所有参加世界排名赛事（如世界锦标赛）的女性运动员，需通过基...

sinrry
2025年07月31日
200
互联网

华为自研！仓颉编程语言正式开源

7月31日消息，日前，华为在Gitcode上正式开源自研仓颉编程语言，开源内容包括编译器、运行时和标准库等。据了解，仓颉运行时是仓颉Native后端（CJNative）的核心组件之一，以高性能和轻量化...

sinrry
2025年07月31日
161
互联网

2025日本最可爱初一、高一女生选出：这颜值如何

7月31日消息，相信大家都听说过日本举行各种各样很奇葩评选活动，如此前举行“千年一遇美少女”、“最可爱大学生”等活动，而现在日本“最可爱高一、初一女生”选举结果出炉了，据介绍称，日本网友票选“最可爱高...

sinrry
2025年07月31日
193
互联网

中国互联网企业用户规模一览：昔日BAT变DAT 百度跌出前三

7月31日消息，目前中国互联网大厂的格局早已发生了改变，昔日的BAT变成了DAT，而百度已经悄然被字节跳动超越。现在，调研机构QuestMobile送出最新报告显示，截止到2025年6月，中国移动互联...

sinrry
2025年07月31日
134
互联网

俄堪察加半岛8.7级强震后欧亚大陆最高活火山喷发：火焰滔天

7月31日消息，据央视新闻报道，在俄罗斯远东地区堪察加半岛附近海域发生8.7级地震后，当地的克柳切夫火山也开始喷发。俄罗斯科学院地球物理研究所堪察加分院，在社交媒体上发布了此次喷发的相关消息，并表示有...

sinrry
2025年07月31日
141
互联网

中国移动互联网月活用户创新高：人均每天上网近8小时、以刷短视频为主

7月31日消息，作为移动互联网用户之一，你每天上网的时间跑赢平均值没？调研机构QuestMobile给出今年上半年中国移动互联网报告中指出，截至2025年6月，中国移动互联网月活跃用户规模已达到创纪录...

sinrry
2025年07月31日
156

联系我们

在线咨询： QQ交谈

邮箱：1217266901@qq.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信