大模型部署

共 2 篇文章

排序

发布更新浏览点赞评论

谷歌发布TurboQuant算法：AI内存压缩技术获突破，效率提升6倍以上

谷歌发布TurboQuant算法：AI内存压缩技术获突破，效率提升6倍以上

人工智能的算力瓶颈正迎来一次关键性突破。最新行业动态指出，一项名为TurboQuant的新型AI内存压缩算法被披露，该技术宣称能将大型语言模型在推理阶段的工作内存（KV Cache）占用减少至少6倍...

Ai新闻 # AI内存压缩 # AI推理优化 # DeepSeek

1个月前

0630

vLLM商业化公司Inferact获1.5亿美元融资，AI推理市场迎来爆发前夜

vLLM商业化公司Inferact获1.5亿美元融资，AI推理市场迎来爆发前夜

随着AI竞赛进入下半场，一个关键战场正从模型训练转向推理部署 (Inference)。最新市场动态显示，旨在让大模型运行更快、更便宜的底层技术，正成为资本追逐的新焦点。近日，开源项目vLLM的创始团队...

Ai新闻 # AI基础设施 # AI推理 # Andreessen Horowitz

3个月前

0800