原标题:DeepSeek又被挤崩!“找他们的人踏破门槛了”
作 者 | 赵云帆 朱艺艺 尹华禄
速报!刚刚,DeepSeek服务再次“宕机”。1月27日11点左右,DeepSeek官网一度显示“DeepSeek网页/API不可用”,截至发稿,功能已恢复。
而在昨日(26日),DeepSeek也“崩”了一次。DeepSeek随后回应称,1月26日下午DeepSeek确实出现了局部服务波动,但问题在数分钟内得到解决。此次事件可能与新模型发布后的访问量激增有关,而官方状态页未将其标记为事故。
1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。
更为关键的是,该模型每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%,而且允许开源。
吓懵!科技权重股集体大跌
DeepSeek让华尔街算力板块投资人感受到了凉意。
就在刚刚,寒武纪一度大跌近10%,天孚通信、中际旭创、工业富联、中兴通讯等多只科技权重股也有不同程度下跌。
英伟达美股夜盘跌超5%,博通跌超4%。美股期货持续走低,纳斯达克指数期货跌超1.7%。
与此同时,主导星际之门计划的软银集团股价一度下跌近6%,创下去年11月1日以来的最大跌幅;藤仓大跌超8%,东京电子和Disco均跌超3%。
“中国模型”震动华尔街
网络社群里,越来越多的人把DeepSeek的出现与近期英伟达的回调联系在一起。
美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek 创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。“如果击败 OpenAI 所需要的金额是 5500万美元(包括5000个 H800 GPU和500万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。”
包括海外媒体 Vital Knowledge,德国世界报知名市场评论员 Holger Zschaepitz,都不约而同地把 DeepSeek 称之为“美国股市最大的威胁”。
揭秘背后操盘手
天眼查显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”),该公司成立于2023年7月份,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋共同持股。
据了解,深度求索背后的操盘手梁文锋是金融圈成名已久的高手。他创立的幻方量化,为国内量化私募巨头之一。
据湛江发布,来自湛江的梁文锋近日现身《新闻联播》,以DeepSeek创始人的身份参加了一场国家超高规格座谈会,并现场发言。
梁文锋是湛江市吴川市覃巴镇米历岭村人,父母都是小学语文老师。梁文锋一直是学校里的“尖子生”,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学。
目前,梁文锋持股宁波程恩50.1%,宁波程信柔兆企业管理咨询合伙企业(有限合伙)持股49.8%,宁波程普商务咨询有限公司持股0.1%。而宁波程信由梁文锋、郑达韡、李欢、陈哲等自然人共同持股。
DeepSeek微信公众号信息显示,1月20日,深度求索正式发布DeepSeek-R1大模型,并同步开源模型权重。“DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。”深度求索在发布信息中表示。
《黑神话:悟空》的主创冯骥也高度评价和推荐DeepSeek,他指出存在六大优点:
1、强大。比肩o1的推理能力,暂时没有之一;
2、便宜。参数少,训练开销与使用费用小了一个数量级;
3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;
4、免费。官方目前提供的服务完全免费,任何人随时随地可用;
5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持);
6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。
此外,在美国硅谷,多位人工智能行业意见领袖对DeepSeek-R1表达由衷赞美。据证券日报报道,微软CEO萨蒂亚・纳德拉公开表示:“他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”曾投资过OpenAI的投资人马克·安德里森在社交平台表示,DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
值得注意的是,据湛江发布消息,性能比肩GPT-4o的DeepSeek-V3,投入研发费用为558万美元,训练成本不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。
市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期,已有多家券商发布相关研报。
实地探查Deepseek
DeepSeek是家极为低调的创业公司,一度游离在主流视野之外,但在2024年12月上线并同步开源DeepSeek-V3模型之后突然爆火。在这突然爆红之际,深度求索却选择了“深潜”,不想与外部有任何形式的交流互动。
杭州深度求索的注册地位于杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。
1月14日上午,21世纪经济报道记者实地探访了杭州汇金国际大厦。
汇金国际大厦由4幢写字楼组成,均需要刷卡进入,其中AB楼的前台人员向21世纪经济报道记者确认,“这里是西1幢”,其表示,“需联系公司的对接人才能刷卡进电梯上楼”,拒绝了记者的进一步探访要求。
而21世纪经济报道记者多次拨打公开电话,均提示“暂时无法接通”。
“找他们的人踏破门槛了”,“最近几波我们去约都没约上”,有投资人向21世纪经济报道记者透露。
此外,1月14日,21世纪经济报道记者加入了深度求索的“官方交流98群”。该群的群公告写道,“暂不对外进行项目合作,不提供私有化部署及相关支持服务;DeepSeek将集中研发精力奉上更强的模型,尽情(敬请)期待!”
21世纪经济报道记者曾注意到,群里一度讨论氛围热烈,不时有人提问,“请问什么时候发布 ios端?”“什么时候出图转视频的功能?”
诸多迹象表明,外界对神秘的DeepSeek充满了好奇和期待。
概念股引爆A股,多家上市公司回应
1月27日,DeepSeek概念股引爆A股,网传的多只成分股高开或涨停。
南财快讯记者以投资者身份致电了10余家上市公司,但由于今日是春节假期前最后一个交易日,仅有3家上市公司进行了回应。
南财快讯记者注意到,A股已有多家上市公司披露与DeepSeek的合作情况。
如昆仑万维(维权)披露,公司携手新加坡南洋理工大学成功开发Q*算法,显著提升现有大模型推理能力。在MATH数据集上,Q*帮助DeepSeek-Math-7b提升至55.4%的准确率,超越了Gemini Ultra。
每日互动也表示,随着行业进入大模型时代,公司也在第一时间接入ChatGPT、文心一言、ChatGLM、通义千问、DeepSeek等国内外通用大模型,结合自身的数据积累和挖掘能力以及对特定行业深刻洞察,开发出垂直场景类大模型应用在商业营销和公共服务领域。
不过也有公司表示未与DeepSeek合作。卓创资讯就称,公司尚未与DeepSeek深度求索建立业务合作关系。
(部分资料来自财联社、Wind、东方财富、湛江发布)
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)
SFC
本期编辑 刘雪莹
21君荐读
发表评论
2025-01-27 17:13:12回复
2025-01-27 15:15:57回复