DeepSeek据报用华为芯片训练失败 推迟发布新模型
内地人工智能初创DeepSeek据报因使用华为芯片训练失败,因而推迟发布新模型,反映中国芯片在关键任务上仍落后于美国竞争对手,凸显中国在技术自给自足面临的挑战。
被鼓励采用华为升腾处理器
据英国《金融时报》引述消息报道,DeepSeek今年1月发布R1模型后,被鼓励采用华为的升腾(Ascend)处理器,而非使用Nvidia的芯片来训练AI模型。然而,DeepSeek使用升腾芯片训练R2模型过程中遇到技术问题,促使其改用Nvidia芯片作训练,用华为芯片作推理。
事实上,DeepSeek-R2大模型原定5月推出,其后再传计划于8月15日至30日期间发布,但最终未有落实日子。
---------------------------------------------
>>>星岛网WhatsApp爆料热线(416)6775679,爆料一经录用,薄酬致意。
>>>立即浏览【生活百答】栏目:新移民抵埗攻略,老华侨也未必知道的事,移民、工作、居住、食玩买、交通、报税、银行、福利、生育、教育。
>>>星岛网WhatsApp爆料热线(416)6775679,爆料一经录用,薄酬致意。
>>>立即浏览【生活百答】栏目:新移民抵埗攻略,老华侨也未必知道的事,移民、工作、居住、食玩买、交通、报税、银行、福利、生育、教育。
