计算机行业2025年1月投资策略:国产DEEPSEEK+豆包发力 海内外大模型刺激推理算力

证券之星 2025-01-28 08:42:17
股市要闻 2025-01-28 08:42:17 阅读

  海外资本支出呈现持续上扬的态势,而国内资本支出近期承压。全球云计算厂商资本开支进入新一轮增长浪潮,AI 基础设施成为核心驱动力。国外厂商中,微软24Q3 资本开支同比增78.6%,主要投向AI 和云服务;谷歌维持高位,聚焦服务器和数据中心;亚马逊连续五季环比增长,全年预计750 亿美元。国内厂商中,阿里巴巴24Q3 同比增239.63%,加码AI 基础设施;腾讯同比增113.54%,布局GPU、CPU 服务器及数据中心;百度虽承压,预计24年底或25 年初迎来回升,重点投入AI 模型和智能云服务。

      全球服务器出货同比回升,B+C 端应用逐步落地,思维链等新技术拉动推理算力需求增长。C 端应用如ChatGPT 访问量持续增长,国内多款AI 产品MAU快速上升;B 端AI 赋能商业增长显著,AppLovin、Palantir 等公司业绩大幅提升。AI 推理侧需求因思维链(CoT)技术及模型参数量增加快速增长。

      CoT 对千亿参数模型显著提升推理能力,同时推理次数和算力需求快速增加。

      中国AI 芯片市场规模23 年达1038.8 亿元,预计25 年增长至1780 亿元,推理算力占比24 年有望升至67.7%。国内外厂商如博通、Marvell、寒武纪等积极布局AI 推理硬件,助推算力发展。

      国产科技巨头在AI 大模型与算力领域持续突破。字节跳动发布豆包Pro 对标GPT-4o,API 调用量大增,多场景渗透;召开冬季FORCE 原动力大会,推出数据飞轮2.0,强化全模态数据管理;正式推出情感大模型,在豆包APP全量开放。小米升级MiLM2 模型,参数灵活扩展,端云结合适配多场景;加速GPU 集群建设提升算力。阿里倚天710 芯片大规模落地,阿里云为双11提供百万核级算力。腾讯升级星脉网络2.0,优化网络协议与通信库,提升大模型训练效率。

      多层面技术提升训练效率,测试性能领跑开源模型。2024 年12 月26 日,DeepSeek 上线并开源DeepSeek - V3 模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE 架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2 架构,引入新技术,如无辅助损失负载均衡策略、MTP 提升数据利用率。训练层通过DualPipe 算法和FP8 混合精度训练实现成本控制与效率提升。推理层先推出R1 - Lite 模型,后将R1 推理能力迁移至V3 提升其性能,推理算力包含GB300、博通、marvell 等各类asic 芯片。2025 年1 月发布的DeepSeek - R1 模型在多测试中超越OpenAI 的o1,在数学、编程及多种测试中表现出色。

      风险提示:大模型研发进展不及预期、云厂商资本开支投入不及预期、国产算力迭代及供应不及预期。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点