DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外领军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型首个版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外领军大模型,且成本更低。
DeepSeek 系列大模型引发全球广泛关注,海内外巨头科技公司及云服务 平台厂商已相继接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春节期间,DeepSeek 系列大模型火爆出圈,引 发全球广泛关注。根据新浪财经 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 个市场中成为下载量最多的移动应用。根据 Appfigures 的 数据,DeepSeek 的推理人工智能聊天机器人在 1 月 26 日登上苹果公司 App Store 的榜首,并自那时以来一直保持全球第一的位置。同时,全球 也开始了对 DeepSeek 大模型的复刻。以港科大团队为例,港科大助理教 授 何 俊 贤的 团 队, 只 用了 8K 个 样 本, 就 在 7B 模型 上 复刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。当前,海内外巨头科技公 司及云服务平台厂商已相继接入了 DeepSeek 大模型,部分 AI 应用领域 相关企业也已开始了 DeepSeek 大模型的部署和应用。DeepSeek 大模型 获得了全球的广泛关注,认可度持续提升。我们认为,DeepSeek大模型的开源、低成本和高性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在 B 端和 C 端应用场景的落地。另外,DeepSeek 大模型的出 圈将对全球大模型产业的竞争格局产生重要影响,将对海外领军大模型厂 商的领先性产生冲击,并同时将对算力的未来发展产生重要影响。
DeepSeek 大模型的出圈预计不改算力整体需求向上的态势,但推理和端 侧算力有望增长更快。DeepSeek 在算法效率和计算成本方面有着较大的 优势,短期内可能对训练算力的增长有一定的平抑效应,但是不改 AI 算 力整体需求长期上升的态势。AI 作为全球智能化发展的主要抓手,大模型 当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用领域广阔。DeepSeek 低成本而且开源的解决方 案,大幅降低了 AI 在各行各业应用的技术和成本门槛,为 AI 的产业化落地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时,较低训练成本以及开源的 DeepSeek,有望带来更低 的大模型开发和使用门槛,基于该大模型开发的主体可能更多,也一定程度上为训练算力需求提供了支撑。DeepSeek 并不 是压缩了算力市场,反而为算力市场增加了更多的想象空间。DeepSeek 也在积极与国产 AI 算力平台合作。DeepSeek 大模 型与国产 AI 芯片适配的逐步成熟,将加快推动国产 AI 芯片在国内大模型训练端和推理端的应用,加快国产 AI 芯片产业链的 成熟,为国产 AI 芯片产业带来发展机遇,同时加快我国大模型产业的发展。
资料获取 | |
服务机器人在展馆迎宾讲解 |
|
新闻资讯 | |
== 资讯 == | |
» DeepSeek大模型赋能高校教学和科研 | |
» 实用DeepSeek赋能家庭教育,在各学 | |
» 面向工程审计行业的DeepSeek大模型 | |
» 我们该如何看待DeepSeek_what | |
» 2025DeepSeek爆火详细报告,低 | |
» DeepSeek从入门到精通干货 7大场 | |
» 详解DeepSeek:模型训练,优化及数 | |
» DeepSeek中小学生使用手册,提问的 | |
» DeepSeek 7天指导手册(从入门到 | |
» Deepseek1小时快速入门教程(适合 | |
» DeepSeek大模型概念,技术与应用实 | |
» DeepSeek大模型及其企业应用实践( | |
» DeepSeek:智能时代的全面到来和人 | |
» DeepSeek原理与落地应用,基于上下 | |
» DeepSeek私有化部署和一体机,低成 | |
== 机器人推荐 == | |
![]() 服务机器人(迎宾、讲解、导诊...) |
|
![]() 智能消毒机器人 |
|
![]() 机器人底盘 |
![]() |