同花顺(300033)金融研究中心06月08日讯,有投资者向紫光股份(000938)提问, 针对AIGC应用的全面落地,公司在推理侧算力基础设施上有哪些针对性布局?
公司回答表示,您好,公司依托自身软硬件集成与全栈优化能力,构建专为AI设计的“下一代内存层”,减轻GPU显存的压力,从而在系统层面实现了存算资源的新平衡,并打造了效能兼备的大模型推理场景加速方案。公司推出的H3C UniStor X20000 AI原生存储与面向推理场景的KV Cache推理加速软件XCache,可以形成面向“长上下文、多并发、多轮对话”的协同支撑能力。X20000负责提供高性能、高可靠、可扩展的数据访问底座,XCache面向KV Cache数据管理与推理加速,帮助缓解GPU显存压力、提升推理资源利用效率。
