近段时间,随着深度求索公司(DeepSeek)发布其最新开源模型DeepSeek-R1在国内外引发热烈关注,百度智能云腾讯云阿里云华为云等多平台宣布上线DeepSeek旗下模型。业内人士认为,DeepSeek的新进展透露出2025年大模型竞争的新动向,有望激发一波创新浪潮,各家企业将探索具有成本效益的AI开发和部署方法,推动全球AI继续进步。
据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学代码自然语言推理等任务上,测评性能与美国开放人工智能研究中心(OpenAI)开发的GPT-o1模型正式版接近。
赛智产业研究院人工智能研究所副所长安赟在接受记者采访时表示,DeepSeek-R1通过开源策略低成本高效推理及强化学习结合混合专家架构(MoE)等创新,实现了突破性的技术进展。“开源打破了大企业的技术垄断,促进了AI技术的普惠化。其低成本的算法优化模式改变了长期以来对算力堆砌的依赖,推动了效率导向的竞争格局。”
“DeepSeek将开启全球大模型开发和应用的新阶段。”北京前沿未来科技产业发展研究院院长陆峰认为,DeepSeek的高性价比和低训练成本极大地降低了大模型的投资开发运营成本,开放开源性降低了融合应用的技术门槛,为大模型的千行百业广泛落地普及应用提供了更多可能。
记者注意到,DeepSeek凭借其强大的语言处理能力和技术优势吸引了众多国内外企业的关注。连日来,百度智能云华为云阿里云腾讯云360数字安全集团等多个平台宣布上线DeepSeek旗下大模型。此外,在1月31日,英伟达亚马逊和微软这三家美国科技巨头在同一天宣布接入DeepSeek-R1。
例如,腾讯云方面表示,腾讯云TI平台全面支持DeepSeek系列模型的一键部署。作为企业级机器学习平台,TI平台还提供模型服务管理监控运营资源伸缩等能力,帮助企业和开发者将DeepSeek模型高效稳定地接入实际业务中。
与此同时,DeepSeek的低成本和高效推理模式也影响到AI产业的上下游,并波及资本市场。春节前已有不少投资机构对多家AI芯片机器人等产业链相关领域的上市公司展开调研。
陆峰表示,随着DeepSeek带来AI模型的优化,本地设备上的AI计算能力有望得到提升,推动个人计算机智能手机智能音箱智能手表等智能终端产业更新换代,获得更强大的智能交互能力和功能升级,拓展市场应用空间。此外,以DeepSeek为代表的中国大模型崛起,有望带动软件芯片操作系统云平台等人工智能产业链上下游发展,推动国产人工智能大模型产业生态构建。
在安赟看来,未来的大模型竞争将从单纯的算力竞赛转向算法效率和推理能力的提升,深度优化算法成为新的焦点。其中,随着开源生态的崛起,更多企业将借助开源模式吸引开发者和创新者。同时,硬件与软件的协同创新将加速,特别是专用AI芯片和边缘计算设备的发展,有望推动行业的全链条协作。
安赟还表示,伦理和安全问题的关注也将伴随技术进步而加强,确保AI的透明性和数据隐私保护成为未来发展的重要方向。(记者 郭倩)