《DeepSeek深度:市场表现、发展展望、产业机遇及相关公司深度梳理-250214(30页).pdf》由会员分享,可在线阅读,更多相关《DeepSeek深度:市场表现、发展展望、产业机遇及相关公司深度梳理-250214(30页).pdf(30页珍藏版)》请在薪酬报告网上搜索。
1、1/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告行业研究报告慧博智能投研DeepSeek深度:深度:市场表现、发展展望、产市场表现、发展展望、产业机遇及相关公司深度梳理业机遇及相关公司深度梳理DeepSeek 近期分别发布大模型 DeepSeek-v3 和推理模型 R1,前者在大模型主流榜单的开源模型中位列榜首,并与世界上最先进的闭源模型不分伯仲;后者性能对标 OpenAI 的 o1 正式版,在数学、代码和自然语言推理等任务上表现卓越。以上两个模型均通过算法和架构的创新,大幅降低了训练成本和推理成本,为 AI 技术的普及与创新作出了卓越的贡献。DeepSeek
2、相关模型自从推出后,立刻占据全球科技头条并引发巨大关注,相关人士认为,DeepSeek 呈现出的算法创新、性能表现、开源属性等多重因素,将对 AI 应用与算力行业产生深远的影响。DeepSeek 开源模型将直接推动 AI 产业模型能力普遍提升,同时低廉的使用成本搭配卓越的性能倒逼OpenAI 降低 GPT 使用成本、加速模型迭代,促进产业生态繁荣。大模型能力普遍提升一方面将利好 AI应用开发,尤其小模型易于在端侧落地;另一方面,从更长远的角度看,DeepSeek 带来的也将是算力层面的杰文斯悖论,整体 AI 应用生态繁荣将带来推理算力的更大需求。以下内容我们就将聚焦 DeepSeek,对产业相
3、关问题展开分析。DeepSeek 当前呈现怎样的基础现状?其发布以来市场表现如何?在技术创新方面,DeepSeek 有哪些创新之处?在应用场景上,DeepSeek 将对相关场景带来怎样的赋能?以及 DeepSeek 的加速适配,将会对哪些层面带来市场机遇?相关企业发展情况如何?后续产业将会呈现怎样的发展趋势?立足以上问题,我们为大家一一解析。目录目录一、行业概况.1二、市场表现.3三、技术创新解析.7四、应用场景.15五、产业机遇.18六、相关公司.22七、发展展望.26八、参考研报.30一、行业概况一、行业概况1、版本有序落地,版本有序落地,DeepSeek 的产品体系不断丰富的产品体系不断
4、丰富模型厚积薄发,技术能力不断突破模型厚积薄发,技术能力不断突破。DeepSeek(中文名为深度求索)成立于 2023 年,是一家位于杭州的人工智能公司,为量化巨头幻方量化的子公司。公司自成立以来就不断研发迭代大模型,幻方目前拥有 1 万枚英伟达 A100 芯片,2023 年 4 月幻方宣布成立新组织,集中资源和力量,探索 AGI(通用人工智能)的本质,在一年多时间里进展迅速。2/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeek 的产品体系不断丰富,每个模型都在不同的领域和任务中展现出了独特的优势和性能特点。随着时间的推移,DeepSeek 在不断优
5、化模型性能的同时,也在推动着人工智能技术的发展和应用。从版本迭代来看,公司历经一年已然迭代多个版本,目前模型能力可比肩 OpenAI o1-mini,从下载量来看,根据 AI 产品榜数据显示,DeepSeek 成为全球增速最快 AI 应用,上线 20 天日活突破 2000 万。2、Deepseek:AI 生产函数的根本性改变生产函数的根本性改变简单来说,DeepSeek 是一款大语言模型(LLM),主打“极致性价比”。它能写代码、解数学题、做自然语言推理,性能优越,但成本却低到离谱训练费用仅 557.6 万美元,是 GPT-4o 的十分之一,API调用成本更是只有 OpenAI 的三十分之一。
6、3、科技巨头纷纷接入科技巨头纷纷接入 DeepSeek,推动全球,推动全球 AI 生态发展生态发展gZjVrQsQmPrNtObRaO8OsQnNoMtOkPnNoMkPmNqP9PoOuNuOmMyRxNqNrQ3/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告英伟达英伟达于 2025 年 1 月 30 日正式宣布,DeepSeek-R1 模型已作为 NVIDIANIM 微服务预览版上线;2025 年1 月 29 日,微软微软正式宣布将 DeepSeek-R1 模型纳入 Azure AI Foundry 平台。企业可以在 Azure AIFoundry 上通过模
7、型目录以无服务器端点的形式访问 DeepSeek-R1。此外 DeepSeek-R1 还上线了 GitHubModels,开发者可以在 GitHub 上免费试用该模型;2025 年 2 月 1 日,硅基流动硅基流动和华为云华为云团队双方联合首发并上线基于华为云昇腾云服务的 DeepSeek R1/V3 推理服务。得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的 DeepSeek 模型可获得持平全球高端 GPU 部署模型的效果。提供稳定的、生产级服务能力,让模型能够在大规模生产环境中稳定运行,并满足业务商用部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。二、二、市场表现
8、市场表现1、DeepSeek-V3 性能表现不输全球顶尖模型性能表现不输全球顶尖模型2024 年 12 月 26 日,杭州深度求索(DeepSeekAI)发布 DeepSeek-V3 并同步开源,据介绍,DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。具体而言,DeepSeek-V3 在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模
9、型 Anthropic 公司于 2024 年 10 月发布的 Claude-3.5-Sonnet-1022;在长文本评测(DROP、FRAMES 和 LongBenchv2)方面,V3 平均表现也超越其他模型。在算法类代码场景(Codeforces),V3 远远领先于市面上已有的全部非 o1 类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。而在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3 大幅超过了其他所有开源闭源模型。4/302025 年年 2 月月 14 日日
10、行业行业|深度深度|研究报告研究报告另外,DeepSeek-V3 通过算法和工程上的创新,将生成吐字速度从 20TPS(Transactions Per Second 每秒完成的事务数量)大幅提高至 60TPS,相比 V2.5 模型实现了 3 倍的提升,可以带来更加流畅的使用体验。同时,模型 API 服务定价也将调整为每百万输入 tokens0.5 元(缓存命中)/2 元(缓存未命中),每百万输出 tokens8 元,因此,V3 模型在性能实现领先的同时,定价大幅低于市面上所有模型,性价比优势明显。5/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告2、R1 模型实
11、现了比肩模型实现了比肩 OpenAI o1 的推理能力的推理能力2025 年 1 月 20 日,DeepSeek 再次扔出重磅炸弹,发布了推理模型 R1,该模型在后训练阶段大规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数据、代码、自然语言推理等领域均实现了比肩 OpenAI o1 模型的能力。DeepSeek 不仅开源了 R1-Zero 和 R1 两个 660B 模型,还通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。同时,DeepSeek 还
12、修改了产品协议,支持用户进行“模型蒸馏”,即允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。6/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告除了开源相关模型外,DeepSeek-R1 上线 API,对用户开放思维链输出,服务定价为每百万输入 tokens1元(缓存命中)/4 元(缓存未命中),每百万输出 tokens16 元,与 OpenAI o1API 调用相比,继续保持超高的性价比。与此同时,DeepSeek 还上线了 APP 并更新官网,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。3、DeepSeek-V3、R1
13、模型在产业中引发巨大反响模型在产业中引发巨大反响DeepSeek-V3DeepSeek-V3、R1R1 两款模型最让人印象深刻的不仅在于其比肩业内最佳表现的性能,更在于超低的训练两款模型最让人印象深刻的不仅在于其比肩业内最佳表现的性能,更在于超低的训练成本成本:DeepSeek 在 V3 相关的论文中披露,V3 仅仅使用 2048 块 H800 GPU 训练 2 个月的时间,共消耗278.8 万 GPU 小时,而按照 OpenAI 创始成员之一 Andrej Karpathy 介绍,Llama3-405B 则消耗了 3080万 GPU 小时,是 V3 的 11 倍;如果按照 H800 GPU
14、每小时 2 美金的租赁费用计算,意味着 V3 模型正式训练仅仅需要 557.6 万美金,而此前同等性能的模型则需要 0.6-1 亿美金。而 R1 模型是在 DeepSeekV3 的基础上,通过引入大规模强化学习(Reinforcement Learning)和多阶段训练,进一步提升推理能力的模型,据专家判断,在 V3 的基础上生产 R1 模型的成本可能非常低廉。DeepSeek-V3DeepSeek-V3、R1R1 两款模型的推出,犹如在两款模型的推出,犹如在 AIAI 行业投入了两颗重磅炸弹,行业投入了两颗重磅炸弹,DeepSeekDeepSeek 迅速成为科技产业迅速成为科技产业最耀眼的明
15、星企业,并引发了巨大的讨论与关注最耀眼的明星企业,并引发了巨大的讨论与关注。相较于各科技巨头不断构建更大规模算力集群来训练7/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告更强大的模型,DeepSeek 向大家展示了通过精巧的算法优化,可以在低一个数量级算力消耗的情况下生产出顶尖性能的模型。DeepSeekDeepSeek 已经成为众多科技领域领袖重点关注的对象已经成为众多科技领域领袖重点关注的对象:微软 CEO 纳德拉在财报电话会议上称 DeepSeek“有一些真的创新”,并透露 R1 模型已经可以通过微软的 AI 平台获取;Meta CEO 扎克伯格表示Met
16、a 将 DeepSeek 视为竞争对手并正在学习;ASML CEO 则在接受采访时表示 DeepSeek 这样的低成本模型将带来更多而非更少的 AI 芯片需求;Anthropic 创始人认为 V3 是真正的创新所在;人工智能专家吴恩达也发文认为中美 AI 差距正在迅速缩小。OpenAI CEO 山姆奥特曼更是在发布 o3-mini 后罕见地承认“在开源上 OpenAI 站在了历史的错误一方”。在超高的热度下,DeepSeek 成为了全球增速最快的 AI 应用,仅上线 18 天日活就达到了 1500 万,而ChatGPT 过 1500 万花了 244 天,增速是 ChatGPT 的 13 倍;1
17、 月 26 日同时登顶苹果 AppStore 和谷歌PlayStore 全球下载榜首,目前仍然在 100 多个多家/地区维持领先。三、技术创新解析三、技术创新解析1、模型蒸馏增强小模型推理能力,视觉解耦统一多模态理解和生成模型蒸馏增强小模型推理能力,视觉解耦统一多模态理解和生成DeepSeekDeepSeek 采用模型蒸馏技术,极大提升模型推理能力采用模型蒸馏技术,极大提升模型推理能力。DeepSeek 官方技术文档显示,研究人员使用DeepSeek 模型遴选了 80 万个样本,并且基于 DeepSeek-R1 模型的输出对阿里 Qwen 和 Meta 的 Llama 开源大模型进行微调。评测
18、结果显示,基于 DeepSeek-R1 模型蒸馏的 32B 和 70B 模型在多项能力上可对标OpenAI o1-mini 的效果。DeepSeek 研究结果表明,蒸馏方法可以显著增强小模型的推理能力。8/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeekDeepSeek 采用蒸馏技术得到的模型效果优于同等条件下使用强化学习(采用蒸馏技术得到的模型效果优于同等条件下使用强化学习(RLRL)的效果)的效果。技术文档显示,DeepSeek-R1-Zero-Qwen-32B 模型是研究人员在 Qwen-32B-Base 模型基础上使用数学、代码、STEM 数
19、据进行超过 10,000 步的 RL 训练得到,其各项测评结果均差于 DeepSeek-R1 模型通过蒸馏得到的 DeepSeek-R1-Distill-Qwen-32B 模型。考虑 RL 方法需要大量的计算资源,蒸馏方法在性能和性价比方面均呈现出显著的优势。anus-Proanus-Pro 是是 DeepSeekDeepSeek 发布的一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大发布的一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能提升了模型在不同任务中的适配性与性能。其中,Janus-Pro 的 SigLIP 编码器专
20、门负责理解图像,能提取图像的高层语义特征,并关注图像的整体含义和场景关系;而 VQ tokenizer 编码器,专门用于创作,将图像转换为离散的 token 序列,这样架构创新使得 Janus-Pro 在 7B 参数规模下,仅用 32 个节点、256 张 A100 和 14 天的时间就完成训练并取得出色性能表现。9/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告2、DeepSeek 创新技术架构:打破传统内存和算力瓶颈创新技术架构:打破传统内存和算力瓶颈DeepSeekDeepSeek 通过多方面创新实现在低算力的同时性能优异通过多方面创新实现在低算力的同时性能优
21、异。DeepSeek 模型对算力要求相比以往大模型大幅降低,主要得益于其在架构设计、训练策略、算法优化以及硬件适配等多方面的创新。多头潜注意力(MLA)、深度求索混合专家系统(DeepSeekMoE)的创新架构显著降低训练和推理时的内存占用和计算量。传统计算方式存在对 KV 矩阵重复计算的问题,这不仅浪费了大量的计算资源,还会导致显存消耗过大,影响模型的运行效率。而 MLA 技术巧妙地解决了这个难题,它通过独特的算法设计,减少了对 KV 矩阵的重复计算,大大降低了显存的消耗。而 MOE 技术将模型分解为多个专家模型和一个门控网络,门控网络根据输入数据的特点,智能地选择合适的专家模型来处理,这样
22、不仅减少了知识冗余,还提高了参数利用效率。在自然语言处理的语言模型任务中,使用 MOE 结构的 DeepSeek 模型可以用相对较少的参数,保持甚至提升语言生成的质量,同时显著降低训练和推理时的内存占用和计算量,根据 CSDN,DeepSeekMoE 在保持性能水平的同时,实现了相较传统 MoE 模型 40%的计算开销降低。10/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeek-R1 在继承了 V3 的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标注数据的情况下
23、,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek 在 AIME2024 测评中上获得79.8%的 pass1 得分,略微超过 OpenAI-o1;在 MATH-500 上,获得了 97.3%的得分,与 OpenAI-o1 性能相当,并且显著优于其他模型。DeepSeekDeepSeek 的蒸馏技术为模型的广泛运用打开想象空间的蒸馏技术为模型的广泛运用打开想象空间。模型蒸馏(Knowledge Distillation)是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术。在深度学习领域,模型参数数量通常被视为衡量模型复杂度和能力的一个重要指标
24、,一般认为参数越多,模型能够学习到的知识和模式就越丰富,性能也就越强。然而,大参数模型也带来了诸多问题,如训练成本高昂,需要大量的计算资源和时间;部署和运行时对算力要求极高,限制了其在一些资源有限场景下的应用。11/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeekDeepSeek 的蒸馏模型在计算资源、内存使用和推理速度方面都实现了显著的优化的蒸馏模型在计算资源、内存使用和推理速度方面都实现了显著的优化。蒸馏模型的参数量大幅减少,例如 DeepSeek-R1-Distill-Qwen-7B 的参数量仅为 7B,相比原始的 DeepSeek-R1(67
25、1B 参数),计算复杂度显著降低。由于参数量的减少,蒸馏模型在内存占用方面也表现出色。且 DeepSeek的蒸馏模型在推理速度上实现了显著提升。例如,DeepSeek-R1-Distill-Qwen-32B 在处理复杂的推理任务时,推理速度比原始模型提高了约 50 倍。且在多个基准测试中,DeepSeek 的蒸馏模型表现优异。例如,DeepSeek R1-Distill-Qwen-7B 在 AIME2024 基准测试中实现了 55.5%的 Pass1,超越了 QwQ-32B-Preview(最先进的开源模型)。DeepSeek-R1-Distill-Qwen-32B 在 AIME2024 上实
26、现了 72.6%的 Pass1,在 MATH-500 上实现了 94.3%的 Pass1。这些结果表明,蒸馏模型在推理任务上不仅能够保持高性能,还能在某些情况下超越原始模型。3、多层面技术提升训练效率,测试性能领跑开源模型多层面技术提升训练效率,测试性能领跑开源模型(1)模型层:在多项测评中能力领先其他开源模型模型层:在多项测评中能力领先其他开源模型模型采用模型采用 MoEMoE 架构,运用架构,运用 R1R1 提炼推理能力提炼推理能力。据 DeepSeek-V3 Technical Report,DeepSeek-V3(以下简称模型)采用 MoE(专家混合模型)架构,总参数量达 6710 亿
27、,每个 Token 激活 37 亿参数。在预训练阶段,模型使用 14.8T 的高质量数据集进行训练,并在后续对模型进行了两个阶段的上下文长度扩展,第一阶段将上下文长度扩展至 32K,第二阶段进一步扩展至 128K。在后训练部分,DeepSeek 使用了监督微调(SFT)和强化学习(RL)来提升模型能力,并从 DeepSeek R1 系列模型中提炼推理能力,以提高模型在实际运用中的表现。在实际测评中,在实际测评中,DeepSeekDeepSeek 表现领先开源模型,并进一步缩小与闭源模型的差距表现领先开源模型,并进一步缩小与闭源模型的差距。知识层面知识层面:在教育类基准测试如 MMLU、MMLU
28、-Pro 上,模型超越了目前所有开源模型,其表现与领先的闭源模型如 GPT-4o 和Claude-Sonnet-3.5 相当。在常识性测试中,模型在 SimpleQA 和 Chinese SimpleQA 中的评分领先,在英语事实性知识(SimpleQA)方面稍逊于 GPT-4o 和 Claude-Sonnet-3.5;代码、数学与推理层面代码、数学与推理层面:在数学相关测试中,模型在所有非思维链推理模型中表现出色,在 MATH-500 等特定测试中超越了 o1-preview。模型在编程竞赛基准测试中表现领先,在工程类任务中模型表现略逊于 Claude-Sonnet-3.5。12/30202
29、5 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告(2)架构层:基本沿用架构层:基本沿用 V2 架构,引入架构,引入 MTP 等全新技术等全新技术沿用沿用 V2V2 基本架构,引入无辅助损失的负载均衡策略基本架构,引入无辅助损失的负载均衡策略。模型在架构层面沿用 V2 模型中的多头潜在注意力(MLA)以及 DeepSeekMoE 架构,以实现经济训练。在此基础上,模型引入了无辅助损失的负载均衡策略,以减少因负载均衡所带来的性能下降。MLA 架构用于减少注意力键值(KV)缓存时的空间占用,通过对注意力键和值进行低秩压缩来实现,帮助模型在维持性能的同时减少计算资源的消耗。13/30
30、2025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeekMoEDeepSeekMoE 较传统较传统 MoEMoE 有多方面改进有多方面改进。与传统 MoE 架构相比,DeepSeekMoE 使用了更细粒度的专家,并将部分专家设置为共享专家,能够更精确地针对特定的问题提供解决方案。同时,传统 MoE 架构采用辅助损失来鼓励负载平衡,以免不平衡的专家载荷导致计算效率降低,但这可能在某些情况下影响模型性能。DeepSeekMoE 引入了无辅助损失的负载平衡策略,在每个专家模型的任务匹配程度评分中添加一个偏置项,用于调整每个专家在决定哪些专家应该处理哪些任务时的负载,同
31、时使用补充序列级辅助损失,以此来优化整个系统的性能和效率。模型通过模型通过 MTPMTP 提升数据利用效率提升数据利用效率。DeepSeek 在模型训练时设定了多 Token 预测(MTP)目标,将预测范围扩展到每个位置的多个未来 Token。MTP 增加了模型训练过程中的信号密度,提高模型对数据的整体利用效率,同时增强模型生成文本的连贯性。MTP 策略主要旨在提高主模型的性能,在推理过程中可直接丢弃 MTP 模块,主模型独立正常运行。(3)训练层:通过工程优化,进一步实现成本控制训练层:通过工程优化,进一步实现成本控制为了促进模型的高效训练,为了促进模型的高效训练,DeepSeekDeepS
32、eek 实施了工程优化实施了工程优化。首先,模型使用了 DualPipe 算法,以实现高效的管道并行。与现有方法相比,DualPipe 具有更少的管道气泡(等待数据处理或通信延迟形成的停滞区域),在模型训练的前向和后向传播过程实现了重叠计算和通信,从而提高了整体的训练效率。其次,DeepSeek 引入了 FP8 混合精度训练,优化了训练期间的内存占用。DualPipeDualPipe 技术优化通信成本技术优化通信成本。在大规模分布式训练系统中,每个计算节点需要频繁地与其他节点交换信息,导致部分时间在等待数据的传输,计算资源不能持续进行数据处理,资源利用率低下。以 DeepSeek-V3 为例,
33、在模型训练时跨节点的专家并行性带来的通信开销导致计算与通信的比率约为 1:1。为了解决这一问题,DeepSeek 在单独的前向和后向块内部重叠计算和通信,通过采用双向管道调度,同时从管道的两端供给数据,使大部分通信可以完全重叠,从而实现通信成本的降低。14/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告使用使用 FP8FP8 数据格式提升训练效率数据格式提升训练效率。DeepSeek 在训练模型时提出了使用 FP8 数据格式的细粒度混合精度框架,大部分计算密集型操作在 FP8 精度下进行,少数关键操作保持在原始的数据格式中。这种设计理论上使计算速度比传统的 BF1
34、6 方法提高了一倍。同时,使用 FP8 精度存储可以减少内存需求,使得训练过程更加高效。然而,低精度计算可能会引入更多的数值不稳定性和精度损失,为了解决这一问题,DeepSeek 在 GEMM(通用矩阵乘法)操作的内部维度引入了每组缩放因子,根据较小的元素组调整缩放比例,使量化过程能更好地适应离群值,从而保障了低精度训练结果的准确性。(4)推理层:将推理层:将 R1 推理能力迁移至模型中推理能力迁移至模型中推出类推出类 o1o1 推理模型,为推理模型,为 V3V3 模型提供基础模型提供基础。2024 年 11 月 20 日,DeepSeek 发布 DeepSeek-R1-Lite,R1系列模型
35、使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字,在数学、代码以及各种复杂逻辑推理任务上,取得了与 o1-preview 相似水准的推理效果。目前该系列模型仍处于迭代开发阶段,正式版 DeepSeek-R1 模型技术仍未开源。以以 R1R1 推理能力为底座,将能力迁移至推理能力为底座,将能力迁移至 V3V3 中中。在后训练部分中,对于推理相关的数据集,DeepSeek 利用内部的 DeepSeek-R1 模型生成数据。DeepSeek 首先开发一个专门针对特定领域(如编程、数学或一般推理)的专家模型,使用结合了监督式精调(SFT)和强化学习(RL)的训练管道,使用这个专家模型
36、作为最终模型的数据生成器。这种方法确保了最终训练数据保留了 DeepSeek-R1 的优势,使用此训练数据训练的 V3 模型能够极大的提升自身的推理能力。对于非推理数据,DeepSeek 使用 DeepSeek-V2.5 生成响应,并招募人类注释员来验证数据的准确性和正确性。通过从 DeepSeek-R1 系列模型中提取推理能力,V3 模型实现了在数学、编程等领域性能上的提升。推理算力包含 GB300、博通、marvell 等各类 asic 芯片。15/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告四、应用场景四、应用场景DeepSeek 的技术创新不仅降低了成本
37、,还推动了 AI 技术在各行各业的应用。以下是具体的应用场景分析:1、AI+影视:重塑影视创作与生产影视:重塑影视创作与生产AIGC(生成式 AI)在影视生产全环节得到广泛应用,从剧本生成到场景渲染,AI 技术大幅降低了影视制作的成本和时间。例如,AI 可以根据导演的创意快速生成剧本大纲,甚至生成详细的场景描述和对话。在后期制作中,AI 可以自动完成特效渲染、画面修复等工作,提高制作效率。此外,AI 还可以通过分析观众反馈,实时调整剧情走向,提升影视作品的吸引力和观众满意度。16/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告2、AI+游戏:提升游戏开发效率与体验
38、游戏:提升游戏开发效率与体验AI 技术在游戏资产生成、仿真场景渲染等多个环节的应用,提升了游戏开发的效率和多样性。AI 可以自动生成游戏中的角色、道具、场景等资产,减少人工设计的工作量。同时,AI 驱动的 NPC(非玩家角色)能够根据玩家的行为做出更智能的反应,增强游戏的互动性和趣味性。此外,AI 还可以优化游戏的渲染效果,提高画面质量和帧率,为玩家带来更流畅的游戏体验。3、AI+社交陪伴:满足个性化社交需求社交陪伴:满足个性化社交需求AI 驱动的虚拟助手和虚拟角色能够提供情感支持和个性化服务,满足用户的社交需求。例如,虚拟助手可以根据用户的兴趣爱好、情绪状态等,主动发起对话,提供陪伴和安慰。
39、在社交平台上,AI 可以生成虚拟角色,与用户进行互动,甚至参与社交活动。这些虚拟角色可以根据用户的反馈不断学习和优化,提供更贴心的服务,缓解用户的孤独感。17/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告4、AI+电商:提升运营效率与用户体验电商:提升运营效率与用户体验AI 技术通过分析用户行为数据,实现精准推荐和自动化客户服务,提升了电商平台的运营效率和用户体验。AI 可以根据用户的浏览历史、购买行为等,精准推荐符合用户需求的商品,提高用户的购买转化率。同时,AI 驱动的聊天机器人可以实时解答用户的问题,提供 24 小时不间断的客户服务。此外,AI 还可以优化
40、电商平台的物流配送、库存管理等环节,降低运营成本,提高运营效率。5、AI+营销领域营销领域:实现个性化的营销策略:实现个性化的营销策略在 AI+营销领域,DeepSeek 凭借其强大的 AI 能力,为营销行业带来了新的变革。DeepSeek 能够通过深度学习和数据分析,精准地识别和预测消费者的偏好和需求,实现个性化的营销策略。它可以根据用户的浏览历史、购买行为等多维度数据,构建详细的用户画像,为每个用户推荐符合其兴趣的商品,从而提高用户的购买转化率。同时,DeepSeek 的 AI 技术还可以优化广告投放策略,实时调整广告的投放时18/302025 年年 2 月月 14 日日行业行业|深度深度
41、|研究报告研究报告间和渠道,确保广告能够在最合适的时机触达目标受众。此外,DeepSeek 的生成式 AI 能力能够自动生成高质量的营销文案、图片、视频等内容,为品牌商提供多样化的创意素材。这些内容不仅具有高度的创意和吸引力,还能精准传达品牌的核心价值。通过这些创新应用,DeepSeek 帮助企业在海量用户中精准触达目标客户,提升营销效果和投资回报率,为营销行业注入新的活力。五五、产业机遇产业机遇1、产业加速适配产业加速适配 DeepSeek,“Jevons 悖论悖论”下算力需求或将提升下算力需求或将提升(1)国产国产 Deepseek 模型爆火,高端算力模型爆火,高端算力/高集群能力并非唯一
42、解高集群能力并非唯一解R1 模型在技术上实现了重要突破用纯深度学习的方法让 AI 自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的 o1 模型正式版,该模型同时延续了该公司高性价比的优势。深度求索公司 R1 模型训练成本仅为 560 万美元,远远低于美国开放人工智能研究中心、谷歌、“元”公司等美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。根据新智元援引外媒报道,他们在短短两个月时间,在 2048 个 H800GPU 集群上,训出 6710 亿参数的 MoE 语言模型,比顶尖 AI 效率高出 10 倍。DeepseekDeep
43、seek 突破不是用突破不是用 CUDACUDA 实现的,而是通过大量细粒度优化以及使用英伟达的类汇编级别的实现的,而是通过大量细粒度优化以及使用英伟达的类汇编级别的 PTXPTX(并(并行线程执行)编程行线程执行)编程。在训练 V3 模型时,DeepSeek 对英伟达 H800GPU 进行了重新配置:为了最大化性能,DeepSeek 还通过额外的细粒度线程/线程束级别调整,实现了先进的流水线算法。这些优化远超常规CUDA 开发水平,但维护难度极高。然而,这种级别的优化恰恰充分展现 DeepSeek 团队的卓越技术实力。(2)“Jevons 悖论悖论”或说明算力需求有望持续提升或说明算力需求有
44、望持续提升19/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告DeepSeekDeepSeek 激活激活 AIAI 产业链,云厂商加速适配产业链,云厂商加速适配。基于 DeepSeek 的开源属性,AI 产业链企业正加速适配DeepSeek。据不完全统计,2 月以来,已有超 20 家云服务和智算企业宣布支持 DeepSeek,包括华为云、腾讯云、阿里云、百度智能云、火山引擎、京东云、三大运营商云、国家超算互联网平台等。同时,海外科技巨头微软、英伟达、英特尔、AMD、亚马逊等也已上线 DeepSeek。DeepSeek 作为开源的大模型技术,正持续激发产业拥抱新技术
45、,加速 AI 技术升级迭代。DeepSeekDeepSeek 持续火爆,官网多次宕机持续火爆,官网多次宕机。据 AI 产品榜数据显示,1 月 20 日 DeepSeekR1 模型发布后,1 月DeepSeek 用户增长达 1.25 亿(含网站(Web)、应用(App)累加不去重);1 月 27 日,DeepSeek 应用登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜;同时,根据 QuestMobile 数据显示,DeepSeek 日活跃用户数在 2 月 1 日突破 3000 万大关,成为史上最快达成这一里程碑的应用。与此同时,访问量激增导致 DeepSeek 服务状态在 1 月 2
46、7 日多次出现异常,影响 API 服务和网页对话服务;2 月 6 日,DeepSeek 开放平台由于服务器资源紧张,暂停了 API 服务充值。在服务需求高增的同时,算力不足仍是目前制约产业发展的瓶颈之一。“JevonsJevons 悖论悖论”或说明算力需求有望持续提升或说明算力需求有望持续提升。“Jevons 悖论”指出:当资源利用效率提高时,实际上可能会导致资源消耗的增加,而不是减少。由于 DeepSeek 的技术突破使得大模型训练成本大幅优化,或将驱动企业开发此前因预算受限而搁置的创新项目,最终加大了整体技术支出。同时,随着人工智能变得更加高效,其使用量也将激增。因此,长期视角下,高质量开
47、源低价模型将带动 AI 大繁荣,算力需求不增反降。DeepSeekDeepSeek 加速加速 AIAI 平权,算力需求或将持续提升平权,算力需求或将持续提升。随着 DeepSeek 在大幅降低 AI 大模型使用成本的同时,进一步提升了应用质量,或将在其基础上催生大量垂类应用,并加速 AI 应用落地,进而进一步带动算力需求的爆发。(3)多家云厂适配多家云厂适配 DeepSeek,第三方云厂有望受益,第三方云厂有望受益20/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告云资源成为云资源成为“硬通货硬通货”,云厂商手握算力资源,打开阈值上限,云厂商手握算力资源,打开阈值
48、上限。DeepSeek 通过开源实现了与 OpenAI 的o1 模型性能相媲美的 R1 系列模型,不仅降低了技术门槛,还为中小企业和初创公司提供了平等的技术获取机会,从而推动了 AI 生态的完善。广大研究人员、开发者以及企业,无需依赖商业公司的闭源模型,能够基于 DeepSeek 的开源成果进行更深入的研究和开发。企业争相部署 DeepSeek 模型的背景下,算力模型的平铺最后,云厂商会因后天积累的算力资源而受益。DeepSeek 模型的部署不仅降低了算力门槛,还为云厂商带来了新的收益机会。在大模型之间的差距被拉平的的趋势下,能赢得“胜局”的决定权落回到算力层面,云厂商在具备充足的算力“弹药”
49、与广泛的用户覆盖的天然优势前提下,有望迅速反哺。算力短缺让模型的使用捉襟见肘算力短缺让模型的使用捉襟见肘。在 DeepSeek-R1 发布后,用户访问量短时间内激增,导致服务器压力过大。DeepSeek 在 1 月 26 日发布 R1 模型后连续多日出现了服务中断的情况,DeepSeek 表示出自服务的不稳定性源自多重复杂因素:突发流量激增、系统升级适配中的问题以及底层基础设施的临时性波动。云厂商有望通过提供云厂商有望通过提供 MaaSMaaS 服务(模型即服务)受益于服务(模型即服务)受益于 AIAI 应用爆发中推理需求的崛起应用爆发中推理需求的崛起。对于很多不具备专业数据科学团队、缺乏模型
50、开发能力以及算力部署和管理能力的 AI 应用企业,云厂可通过 MaaS 服务将人工智能模型、机器学习模型等以服务的形式通过互联网提供给用户,用户无需自行搭建复杂的模型开发和训练环境,只需通过 API 接口或其他指定方式调用模型,就能获得模型的预测、分析等能力,实现特定的业务功能。用户可以确保基础模型的稳定运行、又能在需求变化时弹性扩展算力。云厂纷纷上线云厂纷纷上线 DeepSeekDeepSeek 模型模型。目前,华为云、天翼云、腾讯云、阿里云、百度智能云、火山引擎、京东云、联通云、移动云、浪潮云、中国电子云(深桑达控股公司)等中国头部云厂均已上架 DeepSeek。而无问芯穹、硅基流动、优刻
51、得、首都在线、PPIO 派欧云、云轴科技、青云科技、并行科技等独立云厂商均已宣布适配及上架 DeepSeek 模型服务。DeepSeekDeepSeek 带来的模型平权有益于第三方中立云厂的持续发展带来的模型平权有益于第三方中立云厂的持续发展。DeepSeek 带来的模型平权有望打破原有产业价值链分配,打破模型优势给大模型厂商和互联网厂商带来的壁垒。另外,相比于头部云厂,第三方云厂在赋能下游客户模型微调等方面更有优势,且具有中立性的优势。过年期间,优刻得云平台上线过年期间,优刻得云平台上线 DeepSeek-R1DeepSeek-R1 系列模型,并发布了部署及使用攻略系列模型,并发布了部署及使
52、用攻略。优刻得科技股份有限优刻得科技股份有限公司公司在云计算领域实力强劲,技术研发成果显著。公司持续投入资源,自主研发出 IaaS、PaaS、大数据21/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告流通平台、AI 服务平台等一系列云计算产品,能高度适配不同行业的多样化需求。公司构建了涵盖公有云、混合云、私有云、专有云在内的综合性行业解决方案,业务广泛渗透到互联网、政府、运营商、工业互联网、教育、医疗、零售、金融等多个行业,精准满足不同客户的个性化需求,积累了大量优质客户资源和良好口碑。2 2 月月 6 6 日,首都在线云平台上线日,首都在线云平台上线 DeepS
53、eek-R1DeepSeek-R1 系列模型,还提供为期系列模型,还提供为期 1 1 个月的免费使用权限个月的免费使用权限。早在 23年初,公司就部署了大量的推理算力。公司基于英伟达 GPU、国产卡等适配 DeepSeek 模型,并打造异构算力池。另外,公司有望在 AI 出海中受益。DeepSeek 在全球火爆,有望在全世界广泛使用。而首都在线全球布局云服务,业务遍布五十多个国家和地区,且具有服务海外客户的核心经验。2、Deepseek 降本利好应用端侧降本利好应用端侧爆发爆发端侧端侧 AI:Deepseek 推动端侧推理成本压缩,眼镜推动端侧推理成本压缩,眼镜+耳机耳机+学习机学习机+玩具四
54、面开花玩具四面开花DeepseekDeepseek 对推理算力的压缩能够降低端侧对推理算力的压缩能够降低端侧 AIAI 成本成本。近日,英特尔公布,Deepseek 目前能够在英特尔产品上运行,也可以在 AIPC 上实现离线使用。在其最新发布的酷睿 Ultra200H(ArrowLakeH)平台上,Deepseek-R1-1.5B 模型能够顺利运行,在因式分解演示中,能够迅速演绎逻辑思维,并最终解决数学难题,突破难关。小米小米、比亚迪比亚迪等企业迅速接入 API,特斯拉中国区客服宣布测试 Deepseek 语音助手,称其“中文理解能力优于现有系统”。OPPOOPPO、荣耀荣耀宣布年内推出搭载
55、Deepseek 轻量版模型的智能眼镜,可实现实时同声传译和 AR 导航。AIAI 眼镜眼镜:有望成为最能承载 AI 应用的新硬件产品,参与玩家众多,深耕手机算法的计算机厂商有望受益。目前该赛道的玩家包括 AR 眼镜厂商、互联网大厂、手机厂商、AI 创业公司等,在 2025CES 中参展的 AI 及 AR 眼镜数量达到 47 个,提供的主要功能包括拍摄、AR 显示、语音交互、翻译等,竞争较为激烈。根据 Wellsenn 预测,2025 年全球 AI 智能眼镜将进入新品密集发布期,出货量有望达 400 万副,到2030 年出货量有望增长至 8000 万副。AI 眼镜在软件技术方面与智能手机有较多
56、相似之处,在手机领域布局较深的产业链公司有望收益:比如雷鸟雷鸟 V3 使用虹软科技虹软科技的 AI 视觉算法猎鹰影像系统;闪极闪极 AI 拍拍镜由云天励飞云天励飞提供万物识别功能、由科大讯飞科大讯飞提供复杂环境语音识别、多语言翻译等核心技术。AIAI 耳机耳机:主要提供办公效率辅助功能,多款产品接入第三方大模型。目前 AI 耳机赛道中的玩家包括:传统手机厂商如华为华为、小米小米、三星三星等,AI 耳机通常与手机绑定,可以用于唤醒手机端智能体;传统耳机制造商,如飞利浦飞利浦、纽曼纽曼等,使用腾讯腾讯、百度百度等第三方大模型,可唤醒对应的手机 APP;互联网及 AI 厂商,科大讯飞科大讯飞相关团队
57、自 2011 年起专注 AI+耳机领域,最新推出的 Pro2 提供三种录音转写、viaimai助理、多语种翻译等功能,产品定位商务人群价格较高。各家 AI 耳机均定位为生产力工具,提供同传翻译、语音转文字等功能,功能较为局限,若后续能够拓展至生活娱乐场景、AI 语音交互等功能延伸至耳机端侧、或与其他硬件融合,则相关产品销量有望大幅提升。AIAI 学习机学习机:学习平板销量稳步增长,融合 AI 功能的高端学习机占比提升明显。根据洛图科技洛图科技数据,2024 年,中国学习平板市场全渠道销量为 592.3 万台,同比 2023 年增长 25.5%,受到学生寒暑假影响,6 月、12 月销量较高;全年
58、销售额为 190.6 亿元,同比 2023 年增长 37.6%。学习平板线上市场的零售量达 393.7 万台,在全渠道中的占比为 66.5%;学而思学而思、作业帮作业帮、科大讯飞科大讯飞为线上销售额 top3,市场份额分别为 28%、25%、13%。从价格区间来看,价格在 6,000 元以上的高端学习机多搭载更优质的教学资源和 AI 功能,24 年其线上市场份额达 12%,较 23 年增加 5.4pct,在这一细分市场中,学而思和科大讯飞的贡献较大,分别位列线上市场的销量和销售额首位。22/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告AIAI 玩具玩具:目前发布
59、的产品核心功能基本一致,包括语音识别、自然语言处理和机器学习,希望通过拟人、拟动物,以及拟 IP 的方式,与用户进行视/听/触多维度交互。受到功能和 IP 溢价影响,AI 玩具的价格差异较大。相较于 AI 眼镜、AI 学习机、智能音箱等产品,AI 玩具依托玩偶、宠物和知名 IP 为载体,能够提供更多陪伴和情感支持,该领域更容易出现爆款产品,比如官方售价 449 元的 AIGC 玩具挂件BubblePal,开售首月 GMV 突破 400 万。六、相关公司六、相关公司1、国产算力及算力服务企业国产算力及算力服务企业长期看,DeepSeek 方法带来的应是算力层面的杰文斯悖论(当技术进步提高了使用资
60、源的效率,但成本降低导致需求增加,令资源消耗的速度是上升而非减少),整体 AI 应用生态繁荣应带来推理算力的更大需求。(1)润建股份润建股份:DeepSeek 催生行业红利,阿里云有望开启公司全新机遇催生行业红利,阿里云有望开启公司全新机遇部署部署 DeepSeekDeepSeek 赋能智能体应用开发赋能智能体应用开发。润建股份曲尺平台升级部署 DeepSeek-R1(满血版,671B)及基于其蒸馏的 DeepSeek-R1-Distill-Qwen-32 模型,赋能公司内部数智化转型,助力 AI 应用业务发展。公司自 2024 年 8 月起,在自有五象云谷智算中心私有化部署了 DeepSee
61、k-V2-Lite,用于公司内外部业务的 AI 智能体应用开发。目前在曲尺部署的 DeepSeek 开源模型有 DeepSeek-R1-Distill-Qwen-32、DeepSeek-R1、DeepSeek-V2-Lite 以及 DeepSeek-V3。同时,基于 DeepSeek 模型,润建股份开发了多个智能体应用,包括内部知识库“润小知”、政务和电网营业厅的“数字导办”、马来西亚教育司阅卷机器人等。除近期完成升级部署 DeepSeek 外,公司此前在 AI(算力和应用)持续布局,取得较多成效。算算力业务前瞻布局,五象云谷力业务前瞻布局,五象云谷 AIDCAIDC 迎高速发展机遇迎高速发展
62、机遇。公司前瞻布局算力业务,利用自身五象云谷数据中心,进行算力业务拓展。五象云谷是面向国内及东盟国家客户提供数据服务、算力服务的高等级数据中心。三期规划建设 20000 个机柜,一期已投资建成 6000 个机柜规模。在算力业务拓展方面,公司目前已有较好客户资源,阿里云、百度等需求有望成为公司算力重要支柱与增量。2023 年,五象云谷与阿里云签署了合作协议,拟就“中国-东盟智算云”项目及“数字经济创新中心”项目开展合作,为客户提供算力服务与数字化云。与百度智能云紧密合作,正式部署百度大模型到五象云谷智算中心。与华为签署合作,加强与华为在新能源、算力、人工智能、数字化等领域的合作,双方还计划在智算
63、中心、AI 大模型、大模型应用与云资源平台等领域拓展合作,并在润建股份五象云谷启动搭建基础云服务平台与昇腾算力中心测试环境。算力运维领域也实现中标,24 年成功中标全球运营商最大单体智算中心内蒙古某单位智算中心运维项目,为智算中心提供全方位智能运维服务。B B 端应用持续布局,迎接应用开花时代端应用持续布局,迎接应用开花时代。公司自 2023 年发布自研“曲尺”人工智能开放平台以来,已在多个行业场景成功实现应用落地。润建人工智能展厅将 Bytepiping 开发者作业平台、数据标注、AI 模23/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告型生产线等复杂技术的演
64、绎化繁为简,让体验更加直观。同时,大家还可感受结合 AIAgent 能力的全新数字人交互体验。在应用布局体现在:进入 2024 年,CV 大模型已成功部署在五象云谷智算中心,在 CV 大模型及 AI 智能助手等人工智能技术的赋能下,润建股份全面升级了数智城管系列产品,借助“人工智能+城市治理”创新模式,推动城市管理与服务更加精细化。润建股份在南宁中关村成立了数据标注基地,同时与国内多所高校合作,组建数据标注团队,专注于为行业内 AI 应用提供精准、丰富的标注数据,可支撑内外部在做大数据交易规模、增强数据流通效率、发挥数据要素乘数作用等探索服务,不断挖掘激活数据要素价值,加快培育发展更多新质生产
65、力。低空经济领域布局。润建股份作为全品类无人飞行平台与低空经济 AI+行业应用专家,为天津宝坻区打造农村人居环境长效管理平台,该平台通过 AI 视觉识别大模型、无人机等现代技术,基于 AI 非现场执法系统,创新实现将乡村低空基础设施纳入公共基础设施体系。部署 DeepSeek-R1,DeepSeek-R1 的逻辑推理能力显著减少了提示词设计和部分工作流设计的复杂性,使得开发智能体的效率提升了 15%左右。随着 DeepSeek-R1 的部署上线,润建股份曲尺私有化部署以及微调过的模型已经超过 15+,大大丰富了在大模型应用开发的选择。(2)中科曙光中科曙光:业绩稳健增长,计算产业生态持续完善业
66、绩稳健增长,计算产业生态持续完善公司发布 2024 年第三季度报告,2024 年前三季度公司实现营业收入 80.41 亿元,同比增长 3.65%,实现归母净利润 7.70 亿元,同比增长 2.57%,实现扣非归母净利润 4.45 亿元,同比增长 8.66%。第三季度公司实现营收 23.29 亿元,同比下滑 1.19%,实现归母净利润 2.06 亿元,同比增长 0.41%,实现扣非归母净利润 0.79 亿元,同比下滑 24.55%。主营业务表现相对稳定,公司逐步向服务器上游领域转型主营业务表现相对稳定,公司逐步向服务器上游领域转型。公司第三季度收入小幅下滑,扣非归母净利润相对承压,主要因公司向服
67、务器上游领域转型,重点发力服务器解决方案,聚焦高价值业务。未来随着公司业务结构优化,生态及产业竞争力提升,盈利能力有望逐步回升。保持高强度研发投入,打造全栈自主可控计算生态保持高强度研发投入,打造全栈自主可控计算生态。2024 年前三季度公司销售/管理/研发费用率分别为6.45%/3.03%/12.22%,同比变动+0.56/+0.49/+1.15pcts,保持高研发投入力度,发力高性能计算机、高性能存储、浸没液冷等方向,核心部件自研能力及比例持续提升,联合上下游企业共同打造全栈自主可控计算生态,助力国产算力产业发展。参控股公司业绩表现优异,为公司增长提供助力参控股公司业绩表现优异,为公司增长
68、提供助力。公司重点参控股公司海光信息、中科星图、曙光数创业绩持续高增,根据上述公司 2024 年三季度报告,海光信息、中科星图、曙光数创 24Q3 净利润分别为8.81 亿元(同比+171%)、1.23 亿元(同比+21%)、0.01 亿元(同比+105%),为公司业绩增长提供保障。展望未来,公司与上述参控股公司在通用&AI 芯片、地理信息产业、低空经济、商业航天等领域将进一步加大合作,具备广阔发展前景,有望持续为公司增长赋能。(3)海光信息海光信息:DCU 持续投入巩固国产算力份额,大模型生态适配优化加快应用落持续投入巩固国产算力份额,大模型生态适配优化加快应用落地地通用计算国内领先,通用计
69、算国内领先,DCUDCU 产品快速迭代发展产品快速迭代发展。2024 年,公司的 CPU 产品进一步拓展市场应用领域、扩大市场份额,支持了广泛的数据中心、云计算、高端计算等复杂应用场景;在 AIGC 的时代背景下,公司DCU 产品快速迭代发展,得到市场更广泛认可,以高算力、高并行处理能力、良好的软件生态支持了算24/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告力基础设施、商业计算等 AI 行业应用,进一步促进了公司业绩的较快增长,预计实现营业收入872,000.00 万元到 953,000.00 万元,同比增长 45.04%-58.52%。公司始终围绕通用计算市
70、场,通过高强度研发投入,不断实现技术创新、产品性能提升,保持了国内领先的市场地位。深算系列进展顺利,持续加大深算系列进展顺利,持续加大 DCUDCU 投入投入。公司的深算系列产品进展顺利,且公司持续加大在 DCU 软件方面投入。公司 DCU 产品打造了自主开放的完整软件栈,包括“DTK(DCU Toolkit)”、开发工具链、模型仓库等,其完全兼容“CUDA”、“ROCm”生态,支持 TensorFlow、Pytorch 和 PaddlePaddle 等主流深度学习框架与主流应用软件。依托开放式生态,公司构建了拥有完善的层次化软件栈的统一底层硬件驱动平台,其能够适配不同 API 接口和编译器,
71、并支持常见的函数库、AI 算法与框架等。DeepSeekV3DeepSeekV3 和和 R1R1 模型完成海光模型完成海光 DCUDCU 适配并正式上线适配并正式上线。DeepSeekV3 和 R1 模型基于 Transformer 架构,采用了 Multi-Head Latent Attention(MLA)和 DeepSeekMoE 两大核心技术。MLA 通过减少 KV 缓存显著降低了内存占用,提升了推理效率;DeepSeekMoE 则通过辅助损失(auxiliary loss)实现了专家负载的智能平衡,进一步优化了模型性能。此外,DeepSeek 还引入了多令牌预测、FP8 混合精度训练
72、等创新技术,显著提升了模型的训练效率和推理性能。DeepSeek R1 还引入了强化学习技术,进一步增强了模型的思考能力和决策效率,使其在复杂任务处理中表现出色,尤其适用于需要高智能决策的场景。近日,海光信息技术团队成功完成 DeepSeekV3 和 R1 模型与海光 DCU 的国产化适配,并正式上线。海光DCU 技术团队还将持续推动大模型迭代适配与优化更新,凭借卓越的算力性能和完备的软件生态,海光DCU 已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。2、AI 应用应用类企业类企业DeepSeek 开源模式有望快速提升其他大模型综合实力,大模型能力普遍提升利好 AI 应用开发。
73、(1)金山办公金山办公:智能化、国产化、云化三浪叠加智能化、国产化、云化三浪叠加信创深化落地,国产操作系统带动信创深化落地,国产操作系统带动 WPSWPS 份额提升份额提升。2023 年以来,信创进入深化落地阶段,党政、8 大重点行业信创进一步深化,制造业等其他行业也陆续开始信创,万亿国债以及地方化债有望为信创带来支持。微软 Office 凭借在 Windows 系统预装优势占据市场份额,当前 WPS 产品足以替换 Office,随着国产操作系统市场份额的增加,WPS 份额有望持续扩大。机构业务蓬勃发展机构业务蓬勃发展。2023 年公司推出 WPS365,通过 SaaS 服务为企业同时提供文档
74、、AI、协作服务,满足一个组织的办公需求。WPS365 可满足对企业数据安全的保护以及协同办公这两大区别于个人端的场景。针对党政客户,公司发力公文领域,提供黑马智能校对、公文排版功能。近年来,公司机构客户 SaaS化趋势明显,机构订阅占收入比从 2021 年的 13.6%增长至 2023 年的 21.0%。未来,大模型深入企业已成趋势,由于大模型具有较高的私有化部署成本,因此预计将有更多机构客户上云。AIAI 持续升级,带来全新体验持续升级,带来全新体验。目前,WPSAI 已升级至 2.0,面向个人、企业、党政客户均有相应版本。针对企业客户,WPSAI 可利用其内部文档构建私域知识库,从而更好
75、地利用企业数据资产,这种 B 端 AI思路得到了企业客户的认可。此外,WPS 灵犀 Beta 版本上线,除了常规大模型功能外,可直接阅读 WPS云文档中的内容而无需用户再次上传,带来便捷体验。25/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告(2)彩讯股份彩讯股份:从信创到从信创到 AI 应用,应用,Rich AI 超级工厂打开成长空间超级工厂打开成长空间三大产品线呈向好态势,发布股权激励彰显未来发展信心三大产品线呈向好态势,发布股权激励彰显未来发展信心。公司三大产品线情况:协同办公产品线:公司的邮箱产品是中国 500 强的首选邮箱,围绕着邮箱、统一办公平台,今
76、年将结合 AI 及元宇宙朝着“数字员工”方向继续推进。智慧渠道产品线:主要是服务企业数据化运营和管理,通过彩讯 AIBox 一站式 AI 应用平台,助力企业客户实现个性化、智能化的应用场景;此外,公司过去为客户完成了多个亿级用户规模的软件开发,后续也将根据客户需求推进软件鸿蒙版本的开发。同时,公司未来也将结合AIBox 相关技术让产品更加智能化。云和大数据产品线:公司是移动云的核心供应商,未来将结合传统云的优势,朝智算中心的方向进行深度延伸。公司发布了2024 年限制性股票激励计划(草案),已完成授予,其中公司层面业绩考核指标之一为 2024-2026 年每年剔除有效期内正在实施的所有股权激励
77、计划和员工持股计划所涉股份支付费用后扣非净利润同比增长达到 16%及以上,彰显未来发展信心。深度布局人工智能开发深度布局人工智能开发 RichRich AIAI 超级工厂,围绕超级工厂,围绕 AI+AI+元宇宙构造全景生态元宇宙构造全景生态。在 AI 的浪潮下,彩讯股份开发了 Rich AI 超级工厂,Rich Al 超级工厂是公司围绕 AI+元宇宙构造的全景生态,由下至上大致分为三层,从下往上的第一层是智算基础设施底座 Rich AICloud,AICloud 的底层是下一代 AI 原生云计算架构 RichNet,中间层是可实现万卡集群管理的 RichMoss 超大规模算力集群管理平台,顶层
78、是针对大语言模型/文生图/视频的 RichBoost 高性能大模型训推平台;第二层为 Rich AIBox,它的定位非常清晰,旨在帮助大中型国有企业以及所有 B 端客户快速定制化开发 AI 应用,公司的 AI 邮箱和 AI 云盘均通过AIBox 进行产品开发升级,彩讯 AIBox 一站式 AI 应用开发平台在行业内被广泛认可,同类平台还有文心智能体平台、字节扣子、Dify 等平台;第三层是 AI 应用层,包含 toB 和 toC 的 AI 应用以及相关行业解决方案能力。目前彩讯 AI 应用有:AI 智能邮箱、数字人、AIGC 新通话、彩灵图歌乐。发布图生音乐发布图生音乐 AIAI 应用彩灵图歌
79、乐,未来应用场景可观应用彩灵图歌乐,未来应用场景可观。彩灵图歌乐是彩讯股份基于新一代多模态大模型技术,构建的 AI 音乐生成产品,它将 AI 算法、音乐制作与数据分析完美融合,为用户带来前所未有的音乐创作体验。公司综合技术可实现性、算力成本、可玩性等方面发现图生音乐当前仍然是一个较为空白的点,经过半年的不断迭代尝试和用户测试,公司重点研发了图生音乐的场景,极大降低音乐制作26/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告的门槛,这是一个充满潜力的场景。在公司尚未全面推广的情况下,彩灵图歌乐产品用户量级已达到了几十万级别,用户体验较好。(3)同花顺同花顺:乘资本市
80、场东风,启乘资本市场东风,启 AI 赋能新篇赋能新篇深耕金融信息服务行业近三十年,收入增长与资本市场活跃度紧密相关深耕金融信息服务行业近三十年,收入增长与资本市场活跃度紧密相关。公司是国内领先的互联网金融信息服务提供商以及头部网上证券交易系统供应商之一,始终保持技术与应用的创新,推出爱基金网、iFind 金融数据终端、i 问财、AI 投资机器人、AI 开放平台、智能投顾、智能客服等产品及功能,2024年初发布业内首个金融对话大模型问财 HithinkGPT。公司收入增长与国内资本市场活跃程度密切相关,比如在 2015 年、2020 年牛市环境下公司收入增长表现强劲,同比增速分别达到 443%、
81、63%。在 2024 年四季度资本市场交易活跃度明显提升(单季沪深两市股基成交额同比增长 123%)的背景下,投资者对金融信息服务需求的高涨预计带动公司收入增长取得良好表现。以庞大以庞大 C C 端用户与渠道网络为基,四大主营业务发展前景广阔端用户与渠道网络为基,四大主营业务发展前景广阔。增值电信:为公司收入端支柱,2019至 2023 年收入占营收比重平均达到 46%。在同类产品中,公司产品拥有行业领先的用户活跃度与流量优势,同花顺 App 长期位列证券应用类 App 活跃度排名第一的位置。公司已经拥有庞大的 C 端用户基础,截至 2024 上半年,同花顺金融服务网累计注册用户约 6.25
82、亿人。广告推广:基于领先的 C 端用户规模与合作券商数量,公司广告推广类收入规模遥遥领先于可比同业。公司在广告导流领域具备较强的竞争优势,也将充分受益于市场行情的提振。基金销售:同花顺基金保有规模位于独立销售机构前列,公司将受益于 ETF 加速扩张带来的市场扩容,基金销售业务空间有望进一步打开。软件销售:面向 B 端,收入规模主要取决于证券公司对网上交易系统的扩容需求,在交易活跃的年份,可以看到公司该项收入增速相对更高,该业务或将受益于市场交易活跃度提升与证券行业 IT 投入力度的加大。坚持技术驱动提质增效,前瞻布局坚持技术驱动提质增效,前瞻布局 AIAI 大模型及应用大模型及应用。大模型方面
83、,公司推出金融垂类基座大模型HithinkGPT,实现对话交互与多模态融合。2019 年公司提出“ALL in AI”战略,2024 年 1 月,同花顺发布金融对话大模型问财 HithinkGPT,能够高分通过多个金融领域的专业考试。公司旗下投顾对话机器人同花顺问财基于 HithinkGPT 升级,成为国内金融领域首个应用大模型技术的智能投顾产品。视频算法方面,同花顺的图像团队研发了一整套语音驱动人脸算法,推出 2.5D 虚拟人模型,支持原声、合成声、中英文语音驱动,口唇同步率达到 99%以上,目前已落地多家券商保险行业公司,用于金融营销领域。基于公司丰富的行业经验与领先的大模型能力,当前,公
84、司已在大模型+金融投顾、大模型+智能客服、大模型+智能投研、大模型+代码生成、大模型+法律咨询、大模型+办公助手、大模型+翻译、大模型+医疗等多个领域推出了产品。针对金融垂类领域,公司的 AI 应用百花齐放,相关人士认为问财对话机器人、同花顺 AIPC 版、智能编码助手 Hi Pilot、金融垂类 Agent 平台同创智能体平台等 AI 产品未来值得重点关注。七、发展展望七、发展展望1、DeepSeek 推动推动 AI 平权时代降临平权时代降临,加速应用端,加速应用端 Android 时刻时刻到来到来DeepSeekDeepSeek 开源开源 R1R1 推理模型对标推理模型对标 OpenAIO
85、penAI o1o1,同时展示官方集成案例鼓励,同时展示官方集成案例鼓励 AIAI 应用开发,实现应用开发,实现 AIAI 平权、平权、鼓励鼓励 AIAI 应用开发应用开发。2025 年 1 月,DeepSeek 发布 R1 推理模型,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版;DeepSeek 通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。此外,官方还开放了大量
86、实用集成案例,推动 AI 应用发展。27/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告参考智能手机产业发展历程,苹果推出划时代的 ios 以及苹果手机之后,Google 推出开源智能手机操作系统 Android,成为当前市场市占率最高的操作系统、也推动了智能手机产业的快速发展;智能手机普及之下,移动互联网用户数及渗透率快速提升,移动互联网应用产业迎来爆发。高效低成本且开源的 DeepSeek 为代表的开源大模型生态有望成为 AI 时代的 Android,加速端侧硬件及应用生态成熟。2、DeepSeek 推动推动 AI 生态繁荣生态繁荣(1)DeepSeek 进一
87、步驱动高质量模型平价化进一步驱动高质量模型平价化算法的改进和优化带来模型能力提高的同时成本降低,持续提升模型性价比算法的改进和优化带来模型能力提高的同时成本降低,持续提升模型性价比。根据 Semi Analysis 估计,算法的进步速度为每年 4 倍,这意味着每过一年,实现相同功能所需的计算量就会减少 4 倍。Anthropic 首席执行官 Dario 认为,算法的进步速度更快,可以带来 10 倍的改进。在近一年已看到算法的改进和优化使成本降低了 10 倍,而模型能力则有进一步提升。DeepSeekDeepSeek 进一步驱动高质量模型平价化进一步驱动高质量模型平价化。DeepSeek-R1A
88、PI 服务定价为每百万输入 tokens1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens16 元。对比最新发布的 OpenAIo3-mini,o3-miniAPI 服务定价为每百万输入 tokens1.1 美元(约 8 元人民币),每百万输出 tokens4.4 美元(约 31 元人民币),仍约为 R1 的 8 倍。28/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告(2)DeepSeek 直接拉高模型能力下限,将驱动直接拉高模型能力下限,将驱动 AI 应用进展应用进展DeepSeekDeepSeek 迅速集成进各云厂商的平台中,直接拉高模型能力
89、下限,迅速集成进各云厂商的平台中,直接拉高模型能力下限,AIAI 应用开发提速升级应用开发提速升级。2 月 1 日,华为云宣布上线基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务,华为昇腾云服务支持部署的 DeepSeek 模型可获得持平全球高端 GPU 部署模型的效果,且让模型能够在大规模生产环境中稳定运行,并满足业务商用部署需求。2 月 2 日,腾讯云宣布在高性能应用服务 HAI 上支持一键部署 Deepseek-R1 模型,开发者可以在三分钟内完成模型的启动和配置,无需手动处理复杂的安装和调优过程,同时,开发者还能将 DeepSeek-R1 与其他腾讯云 CloudStudi
90、o、对象存储等服务无缝集成,高效率构建基于 DeepSeekR1 的完整 AI 应用。2 月 3 日,百度智能云宣布 DeepSeek-R1 和 DeepSeek-V3 模型已在百度智能云千帆平台上架,同步推出超低价格方案,并提供限时 2 周的免费服务。阿里云 PAIModelGallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1。此外,国外平台也在加速接入 DeepSeek-R1。目前,包括英伟达、微软、亚马逊、Cursor 在内的多家美国公司陆续采用 DeepSeek-R1 模型。(3)AI 行业迭代速度加快行业迭代速度加快2025 年 1 月 31 日 Open
91、AI 发布最新推理模型 o3-mini,实现低成本、低延迟、高性价比,且针对 STEM推理进行优化;2 月 3 日进一步发布面向深度研究领域的智能体产品 DeepResearch,旨在帮助用户进行深入、复杂的信息查询与分析。OpenAIo3-mini 已在 ChatGPT 和 API 中提供,这一模型保持了 OpenAIo1-mini 的低成本和低延迟,同时针对 STEM 推理进行优化,尤其擅长科学、数学和编码。根据 OpenAI 评估,o3-mini 的中等推理努力与o1 在数学、编码和科学方面的表现相当,同时响应速度更快。o3-mini 还在中等推理工作量的额外数学和事实性评估中表现出色。
92、在 A/B 测试中,o3-mini 的响应速度比 o1-mini 快 24%,平均响应时间为 7.7秒,而 o1-mini 为 10.16 秒。目前 o3-mini 可供免费用户使用。Deep Research 是一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,旨在帮助用户进行深入、复杂的信息查询与分析。Dee pResearch 能够针对复杂任务在互联网上开展多步骤调研,并在几十分钟内完成人类需耗费数小时才能完成的工作,该功能专为金融、科学、政策、工程等领域的高强度知识工作者设计。2025 年 1 月 22 日,字节跳动字节跳动正式发布了豆包大模型 1.5Pro 版本。豆包
93、大模型 1.5Pro 不仅增强了对知识、代码和推理的处理能力,同时也优化了中文交互,在处理复杂任务时的表现较以往版本更加出色,尤其是在自然语言理解和生成能力上,用户将享受到更流畅和自然的对话体验。此外,豆包实时语音模型 Doubao-1.5-realtime-voice-pro 辅以创新的 Speech 2 Speech 端到端框架,具备了丰富的语音表现力,能够根据语境流畅地表达快乐、悲伤等情绪,更能使用方言,甚至具备唱歌的能力,这在业界尚属首次。29/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告3、美国持续加码、美国持续加码 AI 出口管制,中国出口管制,中国
94、 AI 模型芯片瓶颈亟待突破模型芯片瓶颈亟待突破(1)美国持续加码)美国持续加码 AI 出口管制,多国限制出口管制,多国限制 DeepSeek 使用使用美国封锁美国封锁 16nm16nm 以下先进制程,并将中国、新加坡的多个实体列入实体清单以下先进制程,并将中国、新加坡的多个实体列入实体清单。2025 年 1 月 16 日,BIS 发布两条规则,一项是更新先进计算半导体的出口管制,增加对芯片工厂和封装公司的出口管控,涵盖 14纳米或 16 纳米及以下节点的芯片,美国还将加强代工调查并防止先进芯片流向中国。另一项是将 25 家中国公司和 2 家新加坡公司列入实体名单。DeepSeekDeepSe
95、ek 反映出中美在反映出中美在 AIAI 领域的差距在缩小,再次引发地缘政治角度的热议领域的差距在缩小,再次引发地缘政治角度的热议。美国 AnthropicCEO 达里奧阿莫迪呼吁美国政府继续维持芯片管制,将 H20 芯片也纳入限制范围。据彭博社报道,OpenA!和微软针对 DeepSeek2024 年使用 OpenAIAPI 接口的账进行审查,并以涉嫌违反服务条款的模型蒸馏为由取消访问权限。爱尔兰、意大利等国针对 DeepSeek 的数据安全问题提起质询 DeepSeekApp 已在意大利国内的应用市场全面下架。(2)中国)中国 AI 模型积极进行工程创新,芯片瓶颈亟待突破模型积极进行工程创
96、新,芯片瓶颈亟待突破中国中国 AIAI 企业依靠工程创新持续进步,先进算力仍需突破企业依靠工程创新持续进步,先进算力仍需突破。伴随美国 BIS 会进一步加码对芯片、模型的管制,争取美国 AI 产业的发展时间,中美科技领域差距仍可能拉大。因此,突破先进制程梏,实现半导体自主可控将是中国 AI 产业发展关键。30/302025 年年 2 月月 14 日日行业行业|深度深度|研究报告研究报告台积电持续加大资本开支,先进制程产能储备全球领先,中国大陆仍存在代差台积电持续加大资本开支,先进制程产能储备全球领先,中国大陆仍存在代差。2025 年台积电资本开支预计将提升至 380-420 亿美金。约 70%
97、将投资于先进制程技术,包括 3 纳米及 2 纳米。7nm 月产能预计在 15-20 万片/月,5nm 月产能预计超 20 万片/月,3nm 扩产积极预计 24 年底月产能在 12.5 万片/月,2nm 预计在 25 年下半年量产,预计月产能达 5-6 万片,并在 26 年实现产能翻倍。中国大陆 7nm 及以下先进制程产能与台积电等代工厂依然有数量级差距,对应晶体管数量约有几十倍的差距,先进制程供应能力亟待提升。八、参考研报八、参考研报1.民生证券-计算机行业深度研究:为什么 DeepSeek 最受益方向是云产业链2.兴业证券-电子行业深度报告:Deepseek 加速端侧 AI 渗透,电池产业链
98、有望实现量价齐升3.国信证券-传媒行业 2 月投资策略:春节档票房创新高,DeepSeek 加速 AI 应用安卓时刻到来4.招商证券-计算机行业 AIGC 系列报告之 DeepSeek 深度解析:DeepSeek 推动高性能 AI 普惠,AI生态繁荣发展5.华西证券-计算机行业深度:Deepseek,国产 AI 应用的“诺曼底时刻”6.东方证券-计算机行业深度报告:DeepSeek 惊艳世界,算力与应用将迎来结构性变化7.国金证券-计算机行业专题研究报告:DeepSeek 推动“算力平权”,关注端侧 AI 和 Agent 投资机会8.国泰君安-电子元器件行业:Deepseek,开源 AI 补齐国产 AI 产业链短板9.国信证券-计算机行业 2025 年 1 月投资策略:国产 deepseek+豆包发力,海内外大模型刺激推理算力10.天风证券-润建股份-002929-DeepSeek 催生行业红利,阿里云有望开启公司全新机遇11.华鑫证券-海光信息-688041-公司事件点评报告:DCU 持续投入巩固国产算力份额,大模型生态适配优化加快应用落地12.天风证券-彩讯股份-300634-从信创到 AI 应用,RichAI 超级工厂打开成长空间免责声明:以上内容仅供学习交流,不构成投资建议。