这家分布式数据存储初创企业欲挑战大型云服务商
随着人工智能公司数量激增,计算需求达到前所未有的高度。CoreWeave、Together AI和Lambda Labs等公司凭借提供分布式计算能力,成功抓住这一机遇,吸引了大量关注与资本投入。
传统云存储的局限
目前绝大多数企业仍将数据存储在三大云服务商(AWS、谷歌云和微软Azure)的系统中。这些存储系统的设计初衷是将数据紧邻自有计算资源存放,而非跨越多云或多区域分布。
Tigris Data联合创始人兼首席执行官奥瓦伊斯·塔里克指出:“现代AI工作负载和AI基础设施正转向分布式计算,而非依赖单一大型云服务。我们希望为存储提供同等选择——因为没有存储,计算将失去意义。”
分布式存储的创新方案
由开发优步存储平台的团队创立的Tigris,正在构建本地化数据存储中心网络。该公司声称其AI原生存储平台能随计算资源动态迁移,自动将数据复制至GPU所在位置,支持数十亿个小文件,并为训练、推理和智能体工作负载提供低延迟访问。
为达成这一目标,Tigris近期完成了2500万美元的A轮融资。本轮由Spark Capital领投,现有投资者Andreessen Horowitz等跟投。这家初创公司正挑战被塔里克称为“大云”的行业巨头。
传统云服务的双重痛点
塔里克认为,传统云服务商不仅收费高昂,效率也显不足。AWS、谷歌云和微软Azure长期向迁移至其他云服务商或需要下载转移数据的客户收取“流出费”(业内称为“云税”)。这好比健身会员终止合约时还需额外付费。
据Tigris客户Fal.ai工程负责人巴图汉·塔斯卡亚透露,这类费用曾占其云支出的最大比重。
除费用问题外,塔里克指出大型云服务商还存在延迟缺陷:“流出费只是深层问题的表象——集中式存储无法跟上去中心化高速AI生态的步伐。”
精准满足AI企业需求
Tigris的4000多家客户多为开发生成式AI模型的初创企业,这些涉及图像、视频和语音的模型通常需要处理庞大且对延迟敏感的数据集。
塔里克举例说明:“设想与处理本地音频的AI智能体对话,你需要最低延迟。既要求计算本地化,也要求存储本地化。”他补充道,传统大云并未针对AI工作负载优化,在跨区域流式传输大规模训练数据或运行实时推理时,会产生延迟瓶颈,拖慢模型性能。
分布式存储的实践价值
通过就近存取数据,开发者能更可靠、更经济地在分布式云环境中运行AI工作负载。塔斯卡亚证实:“Tigris让我们能在任何云端扩展工作负载,通过统一文件系统实现跨平台数据访问,且不收取流出费。”
企业选择就近存储数据还存在其他动因:在金融、医疗等强监管领域,数据安全是采用AI工具的重要前提;同时,越来越多的企业希望掌控自身数据所有权——正如Salesforce今年初禁止AI竞争对手使用Slack数据所展现的趋势。
塔里克强调:“企业日益认识到数据作为AI和大语言模型燃料的重要性,他们希望加强控制权,而非交由他人掌控。”
未来发展规划
获得新资金后,Tigris将继续扩建数据存储中心以满足增长需求。这家自2021年11月成立以来年均增长达8倍的初创公司,目前已在美国弗吉尼亚、芝加哥和圣何塞设立三处数据中心,并计划在美国、欧洲和亚洲的伦敦、法兰克福及新加坡继续扩展。