深度求索：关于这款人工智能聊天机器人应用你需要了解的一切

深言科技（DeepSeek）正在席卷全球。

这家中国人工智能实验室的聊天机器人应用本周登顶苹果App Store及谷歌Play商店下载榜，引发主流社会关注。其采用高效计算技术训练的AI模型，已促使华尔街分析师与技术专家开始质疑：美国能否保持AI竞赛的领先地位？市场对AI芯片的需求是否可持续？

深言科技从何而来？又为何能迅速获得国际声誉？

量化交易的基因

深言科技由幻方量化支持——这家中国量化对冲基金运用AI辅助交易决策。

AI爱好者梁文峰于2015年参与创立幻方量化。据称他在浙江大学求学期间便涉足交易，并于2019年正式成立幻方量化管理公司，专注开发与应用AI算法。

2023年，幻方量化设立深言实验室，旨在开展独立于金融业务的AI工具研究。在幻方等资本支持下，实验室分拆为独立公司，即如今的深言科技。

自成立之初，深言科技便自建数据中心集群进行模型训练。但与中国其他AI公司一样，其发展受美国硬件出口禁令制约。为训练新一代模型，公司被迫使用英伟达H800芯片——这是美企可用H100芯片的性能削弱版。

深言技术团队以年轻成员为主。据《纽约时报》报道，公司积极从中国顶尖高校招募AI博士研究员，同时聘用非计算机背景人才，以增强模型对多元学科的理解能力。

卓越的模型性能

2023年11月，深言推出首批模型（DeepSeek Coder/LLM/Chat）。但直到去年春季发布新一代DeepSeek-V2系列，才真正引起行业瞩目。

这款通用文本图像分析系统在多项基准测试中表现优异，且运行成本远低于同期竞品。这迫使字节跳动、阿里巴巴等国内竞争对手纷纷下调模型使用价格，甚至免费开放部分服务。

2024年12月推出的DeepSeek-V3更巩固了其行业地位。内部测试显示，V3性能超越Meta的Llama等开源模型，以及OpenAI的GPT-4o等闭源模型。

同样令人瞩目的是今年1月发布的R1“推理”模型。深言宣称其关键基准测试表现堪比OpenAI的o1模型。

作为推理模型，R1具备自我事实核查能力，能有效规避常规模型的缺陷。虽然求解耗时比普通模型长数秒至数分钟，但在物理、科学、数学等领域可靠性显著提升。

但深言模型存在局限性：作为中国开发的AI，需接受网信部门合规审查以确保“体现社会主义核心价值观”。例如其聊天机器人会回避关于天安门广场、台湾自治等议题。

据Similarweb数据，深言3月访问量超1650万次，虽环比下降25%，仍稳居行业第二。但与ChatGPT同期超5亿的月活用户相比仍有差距。

5月，深言在Hugging Face平台发布R1推理模型更新版；9月推出实验模型V3.2-exp，显著降低长文本推理成本。

颠覆性发展路径

深言的商业模式始终成谜：其产品定价远低于市场水平，部分服务完全免费；尽管风投兴趣浓厚，却坚持不融资。

公司宣称通过效率突破实现极致成本控制，但部分专家对其公布的数据存疑。

尽管如此，开发者仍青睐其模型——这些模型虽非传统意义上的开源，但采用允许商用的宽松许可。据Hugging Face首席执行官透露，其平台已衍生出500多个R1改进模型，累计下载量达250万次。

深言的成功被评价为“颠覆AI格局”与“过度炒作”。其崛起直接导致英伟达1月股价下跌18%，并引发OpenAI首席执行官公开回应。路透社报道称，美国商务部3月已禁止员工在政府设备使用深言。

微软宣布将深言纳入Azure AI Foundry服务体系；扎克伯格在财报会议中强调AI基础设施仍是Meta战略优势；OpenAI则指认深言受“国家补贴与控制”，建议美国政府考虑封禁。

英伟达首席执行官黄仁勋肯定深言的“卓越创新”，指出推理模型将大幅提升计算需求。与此同时，韩国、纽约州等地相继禁止政府设备使用深言。

5月，微软副总裁布拉德·史密斯在参议院听证会上表示，因数据安全与宣传顾虑，禁止员工使用深言。

深言的未来充满变数：模型迭代升级毋庸置疑，但美国政府对外国影响力的戒心日益增强。《华尔街日报》3月报道称，美国很可能全面禁止政府设备使用深言。

本文最初发布于2025年1月28日，将持续更新。

Ai新闻 # DeepSeek

文章版权归作者所有，未经允许请勿转载。

谷歌升级Play商店新增AI功能及其他改进

Ai新闻

4周前

0170

提交IPO申请一年后仍未上市的Cerebras Systems公司融资11亿美元

Ai新闻

3周前

090

新项目让维基百科数据更易于AI获取

Ai新闻 # Anthropic

3周前

0110

华纳兄弟 Discovery 起诉 Midjourney 涉嫌侵犯版权

Ai新闻

1个月前

0230

暂无评论

暂无评论...

深度求索：关于这款人工智能聊天机器人应用你需要了解的一切

量化交易的基因

卓越的模型性能