深度求索:关于这款人工智能聊天机器人应用你需要了解的一切
深言科技(DeepSeek)正在席卷全球。
这家中国人工智能实验室的聊天机器人应用本周登顶苹果App Store及谷歌Play商店下载榜,引发主流社会关注。其采用高效计算技术训练的AI模型,已促使华尔街分析师与技术专家开始质疑:美国能否保持AI竞赛的领先地位?市场对AI芯片的需求是否可持续?
深言科技从何而来?又为何能迅速获得国际声誉?
量化交易的基因
深言科技由幻方量化支持——这家中国量化对冲基金运用AI辅助交易决策。
AI爱好者梁文峰于2015年参与创立幻方量化。据称他在浙江大学求学期间便涉足交易,并于2019年正式成立幻方量化管理公司,专注开发与应用AI算法。
2023年,幻方量化设立深言实验室,旨在开展独立于金融业务的AI工具研究。在幻方等资本支持下,实验室分拆为独立公司,即如今的深言科技。
自成立之初,深言科技便自建数据中心集群进行模型训练。但与中国其他AI公司一样,其发展受美国硬件出口禁令制约。为训练新一代模型,公司被迫使用英伟达H800芯片——这是美企可用H100芯片的性能削弱版。
深言技术团队以年轻成员为主。据《纽约时报》报道,公司积极从中国顶尖高校招募AI博士研究员,同时聘用非计算机背景人才,以增强模型对多元学科的理解能力。
卓越的模型性能
2023年11月,深言推出首批模型(DeepSeek Coder/LLM/Chat)。但直到去年春季发布新一代DeepSeek-V2系列,才真正引起行业瞩目。
这款通用文本图像分析系统在多项基准测试中表现优异,且运行成本远低于同期竞品。这迫使字节跳动、阿里巴巴等国内竞争对手纷纷下调模型使用价格,甚至免费开放部分服务。
2024年12月推出的DeepSeek-V3更巩固了其行业地位。内部测试显示,V3性能超越Meta的Llama等开源模型,以及OpenAI的GPT-4o等闭源模型。
同样令人瞩目的是今年1月发布的R1“推理”模型。深言宣称其关键基准测试表现堪比OpenAI的o1模型。
作为推理模型,R1具备自我事实核查能力,能有效规避常规模型的缺陷。虽然求解耗时比普通模型长数秒至数分钟,但在物理、科学、数学等领域可靠性显著提升。
但深言模型存在局限性:作为中国开发的AI,需接受网信部门合规审查以确保“体现社会主义核心价值观”。例如其聊天机器人会回避关于天安门广场、台湾自治等议题。
据Similarweb数据,深言3月访问量超1650万次,虽环比下降25%,仍稳居行业第二。但与ChatGPT同期超5亿的月活用户相比仍有差距。
5月,深言在Hugging Face平台发布R1推理模型更新版;9月推出实验模型V3.2-exp,显著降低长文本推理成本。
颠覆性发展路径
深言的商业模式始终成谜:其产品定价远低于市场水平,部分服务完全免费;尽管风投兴趣浓厚,却坚持不融资。
公司宣称通过效率突破实现极致成本控制,但部分专家对其公布的数据存疑。
尽管如此,开发者仍青睐其模型——这些模型虽非传统意义上的开源,但采用允许商用的宽松许可。据Hugging Face首席执行官透露,其平台已衍生出500多个R1改进模型,累计下载量达250万次。
深言的成功被评价为“颠覆AI格局”与“过度炒作”。其崛起直接导致英伟达1月股价下跌18%,并引发OpenAI首席执行官公开回应。路透社报道称,美国商务部3月已禁止员工在政府设备使用深言。
微软宣布将深言纳入Azure AI Foundry服务体系;扎克伯格在财报会议中强调AI基础设施仍是Meta战略优势;OpenAI则指认深言受“国家补贴与控制”,建议美国政府考虑封禁。
英伟达首席执行官黄仁勋肯定深言的“卓越创新”,指出推理模型将大幅提升计算需求。与此同时,韩国、纽约州等地相继禁止政府设备使用深言。
5月,微软副总裁布拉德·史密斯在参议院听证会上表示,因数据安全与宣传顾虑,禁止员工使用深言。
深言的未来充满变数:模型迭代升级毋庸置疑,但美国政府对外国影响力的戒心日益增强。《华尔街日报》3月报道称,美国很可能全面禁止政府设备使用深言。
本文最初发布于2025年1月28日,将持续更新。