详细调试信息 - getPostsByCategory:
当前 cat_name: 即时中国
传入的 cat_slugs: %e5%8d%b3%e6%99%82%e4%b8%ad%e5%9c%8b
当前页码: 1
is_lifetime: false
时间条件: 即时新闻 - 3个月以内
查询结果:
找到文章数: 1805
最大页数: 181
当前返回文章ID数: 10
文章IDs: 7526539, 7526526, 7526529, 7526484, 7526460, 7526413, 7526402, 7526407, 7526416, 7526419
第1页第一篇文章日期: 2026-06-05
第1页最后一篇文章日期: 2026-06-05

AI教母︱李飞飞花20美金26分钟造出新模型 效果媲美DeepSeek、OpenAI

内地低成本高效的AI模型DeepSeek,推出后震撼科技界后,有AI教母之称的美籍华裔科学家李飞飞,率领其团队仅花了20美元及26分钟,便创造出一个“s1”的AI推理模型,表现媲美OpenAI o1和DeepSeek R1等尖端推理模型。

仅用16块H100 GPU训练

综合外媒报道,李飞飞是史丹福大学首位红杉讲席教授,美国国家工程院院士。她与史丹福大学和华盛顿大学的研究团队,在一个月内便研发出s1模型,因像DeepSeek一样并非从零开始。s1是以阿里巴巴的通义千问Qwen2.5 -32B-Instruct开源模型为底座,在16块辉达(NVIDIA)H100 GPU上监督微调26分钟,训练出新模型。

美籍华裔科学家李飞飞有“AI教母”之称。@drfeifei
美籍华裔科学家李飞飞有“AI教母”之称。@drfeifei

 

李飞飞及其团队只用了20美元,便创出效能媲美DeepSeek R1的新AI模型。路透社
李飞飞及其团队只用了20美元,便创出效能媲美DeepSeek R1的新AI模型。路透社

 

李飞飞是史丹福大学首位红杉讲席教授。Stanford University
李飞飞是史丹福大学首位红杉讲席教授。Stanford University

 

DeepSeek的估值存在巨大分歧,估值区间在10亿美元到1550亿美元之间。路透社
DeepSeek的估值存在巨大分歧,估值区间在10亿美元到1550亿美元之间。路透社

 

DeepSeek近期崛起成为全世界热话。
DeepSeek近期崛起成为全世界热话。

 

相关新闻:DeepSeek︱关键人物潘梓正曾任NVIDIA  哈佛教授慨叹美国“失了AI钱学森”

表现媲美OpenAI o1及DeepSeek R1

报道指,李飞飞团队在研究中提出了“预算控制”策略,透过加入“wait指令”等方式,强制延长模型推理过程、思考时间,以此促使模型自我检查并修正错误的推理步骤,提升推理品质。

根据李飞飞等人的研究论文《s1:Simple test- time scaling》,该模型在数学和编码能力测试中的表现,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在竞赛数学问题上更较o1-preview高出27%。

相关新闻:DeepSeek︱专家估算梁文锋身家最高近万亿 超越黄仁勋

内媒每日经济新闻报道,复旦大学计算机学院副教授郑骁庆受访时表示:“像DeepSeek或类似的公司,在寻找有效的整合解决方案时,需要进行大量的前期研究与消融实验。”这意味着前期是需要大量“烧钱”的。

由于s1是基于现成模型进行监督微调,而微调一个模型和从零开始训练一个模型的成本是无法相提并论的。其次50美元是否包含了其他数据、设备和消融实验等费用,如DeepSeek-V3不到600万美元的训练成本,其实也只包含了训练时的GPU算力费用。

 

*/

---------------------------------------------

>>>星岛网WhatsApp爆料热线(416)6775679,爆料一经录用,薄酬致意。

>>>立即浏览【生活百答】栏目:新移民抵埗攻略,老华侨也未必知道的事,移民、工作、居住、食玩买、交通、报税、银行、福利、生育、教育。
点击以下6大平台 接收加拿大新闻及生活资讯

延伸阅读

延伸阅读

《给阿嬷的情书》︱3周独占内地票房榜首 6‧18登港

外交部:两日本人员吉林处理日遗化武时染毒

双汇子公司猪肉抗生素超标37倍 国务院食安办挂牌督办

AI应用工具︱豆包预告增付费版本 活跃用户应声跌600万