美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型|钛媒体AGI

2025-05-02 16:18来源:钛媒体APP

 中国开源AI公司深度求索(DeepSeek)的热潮的文章。它已经成为全民热议的话题,同时也掀起一股新的AI热潮。目前,美国企业界、学术界、政府机构都在开启“反击”热潮。 首先,美国企业层面,OpenAI公司对o3-mini和o3-mini high模型进行了更新,为免费和付费用户增强推理步骤的透明度,同时为GPT服务增加内存,以及公开o3-mini推理思维链。谷歌也发布了“满血版”Gemini 2.0模型,将推理AI模型Gemini 2.0 Flash Thinking引入应用以回答复杂问题。 其次,学术界也参与其中。斯坦福大学教授李飞飞等AI研究人员,仅花费不到50美元(约合人民币364.61元)云计算资源,以阿里通义Qwen2.5-32B-Instruct为基础模型,通过SFT监督微调方式,最终训练出开源AI“推理”模型s1,在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。该论文作者表示,训练s1所需的租用计算成本最终仅大约在20美元(约合146元)。 最后,立法机构也出台了相关法案。据报道,美国众议员拉胡德(R-Ill.)和戈特海默(D-N.J.)以数据安全为由,将在美国国会出台一项针对DeepSeek的法案,禁止在联邦政府的设备上使用该产品。 国内AI行业人士李丹表示,DeepSeek的成功至少证明现阶段美国无法通过限制芯片出口卡死中国AI发展,通过开源技术和有限的算力仍能追上。但长期来看,算力和数据限制下,未来中国AI创新技术依然“无法超越”美国技术。中国需要在商业化应用层面做更多的工作。 总的来说,DeepSeek的热潮引发了全球范围内的关注和讨论。它不仅展示了中国在AI领域的创新实力,也引发了全球对于AI未来的思考和讨论。

美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型|钛媒体AGI

钛媒体APP

信息线索追踪


革命性芯片问世 大模型能耗骤降50%

美国俄勒冈州立大学的研究团队在IEEE定制集成电路会议上发布了一项重要成果。他们成功开发出一种新型AI芯片,能够将大语言模型的能耗降低50%。这一突破性进展为解决当前大语言模型高能耗问题提供了新的技术路径。目前,以GPT-4为代表的大语言模...

科技日报 | 2025-05-18 08:59

"大语言模型能耗减半 新型芯片技术取得突破"

美国俄勒冈州立大学的科研团队近日取得了一项重要突破,成功开发出一种能够大幅降低大语言模型能耗的新型AI芯片。该成果已在波士顿举办的IEEE定制集成电路会议上正式发布,为解决当前大语言模型高能耗问题提供了创新方案。研究团队发现,现有大语言模型...

| 2025-05-18 08:59

GPT-4.1全新发布:编程能力大幅提升

OpenAI近日宣布推出新一代GPT-4.1模型,为用户带来全新体验。此次更新采用分级推送方式,付费订阅用户可优先使用完整版GPT-4.1,而所有用户都能体验轻量级GPT-4.1 mini版本。旧版GPT-4.0 mini将正式退出市场。从...

快科技 | 2025-05-18 08:59

理想汽车智能系统升级 破解行业难题

在2025年5月7日举办的"理想AI Talk第二季"活动中,理想汽车董事长兼CEO李想详细介绍了公司最新研发的VLA司机大模型技术。这项技术旨在将人工智能从辅助工具升级为真正的生产工具,让AI能够像人类司机一样独立完成驾驶任务。李想将AI...

车质网 | 2025-05-18 08:59

苹果新模型曝光:三张照片秒变3D场景

苹果公司机器学习团队近日发布了一款名为Matrix3D的创新3D人工智能模型。这款模型在3D重建领域取得了重要突破,仅需三张2D图片就能生成精细的3D物体和场景。该模型采用了先进的摄影测量技术,通过整合图像、相机参数和深度数据,大大简化了传...

| 2025-05-18 08:59

可灵2.0登顶全球视频生成榜单

近日,快手旗下可灵AI 2.0模型在全球权威AI评测机构Artificial Analysis的最新榜单中表现突出。该模型以1124分的Arena ELO评分,成功超越自身1.6版本,连续第三个月保持全球图生视频领域的领先地位。这一成绩进一...

快科技 | 2025-05-18 08:59

苹果新突破:三张照片秒变3D场景

苹果公司近日发布了一款名为Matrix3D的创新3D人工智能模型,该模型在3D重建领域取得重要突破。据悉,这款模型仅需三张2D图片就能完成精细的3D物体和场景重建,大大降低了3D建模的门槛。Matrix3D采用了先进的摄影测量技术,通过整合...

| 2025-05-18 08:59

美国升级芯片禁令 限制对华出口GPU及华为AI芯片

美国商务部于5月14日宣布升级对华半导体技术出口管制措施,新规将于5月15日正式生效。此次政策调整重点针对华为昇腾AI芯片,明确禁止全球范围内使用该芯片,并警告使用美国AI芯片训练中国人工智能模型可能带来的后果。同时,美国商务部还废除了原定...

快科技 | 2025-05-18 08:59

AI重塑网络安全:大模型时代的攻防新格局

随着人工智能技术从实验室走向实际应用,网络安全领域正面临前所未有的挑战与变革。安恒信息高层在公开场合指出,大模型技术的普及虽然提升了效率,但也带来了数据安全、模型滥用等新型风险。传统基于规则的防御体系已难以应对AI驱动的智能化攻击,勒索病毒...

21世纪经济报道 21财经APP | 2025-05-18 08:59

警银联手重拳出击 严打金融诈骗黑灰产

近日,公安部经济犯罪侦查局与国家金融监督管理总局稽查局联合部署为期半年的金融领域"黑灰产"专项打击行动,重点整治非法存贷款中介、恶意逃废债及反催收等违法行为。作为积极响应监管要求的金融机构,新网银行迅速成立专项工作组,主动配合公安机关开展线...

| 2025-05-18 08:59

商务部重拳出击严打战略矿产走私出口

商务部新闻发言人于5月12日就打击战略矿产走私出口专项行动回答了记者提问。发言人指出,加强战略矿产资源出口管制对国家安全和发展至关重要。自实施部分战略矿产出口管制以来,发现境外实体与境内不法人员勾结,企图通过走私等手段规避管制措施。为此,国...

| 2025-05-18 08:59

浙江重拳整治涉企乱执法!8大问题线索公开征集

浙江加大力度规范涉企行政执法行为,持续优化法治化营商环境。日前,浙江省司法厅在官网发布公告,面向全省公开征集涉企行政执法突出问题线索,范围包括乱收费、乱罚款、乱检查、乱查封、违...

南方财经全媒体集团 | 2025-05-18 08:59

鱼文资讯网声明:未经许可,不得转载。

其他索引智库

主菜单