昇腾赋能DeepSeek:中国速度推动AI大模型应用落地

2025年1月以来,DeepSeek团队开发的系列大型语言模型,例如拥有6710亿参数的DeepSeek-R1,迅速在全球范围内引起关注。其先进技术和卓越性能吸引了众多开发者和科技企业。国内外企业纷纷上线DeepSeek系列大模型,而昇腾强大的算力和技术协同能力,则显著加速了这一进程,实现了技术与应用的高效对接。

早在DeepSeek模型发布初期,昇腾就已深度参与其中。2024年12月26日发布的DeepSeek-V3就已原生支持昇腾,可在昇腾硬件和MindIE推理引擎上高效运行。2025年春节期间,多家企业基于昇腾成功上线DeepSeek相关服务,成果集中爆发。例如,潞晨科技推出基于昇腾算力的DeepSeek-R1系列推理API及云镜像服务;SiliconCloud(硅基流动)上线基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1;中国移动基于昇腾生态,在其13个智算中心全面上线DeepSeek系列产品;中国电信天翼云“息壤”智算平台支持DeepSeek-R1从满血版到轻量化蒸馏模型的灵活部署;中国联通云则基于联合创新和自研加速引擎,构建昇腾智算底座,与DeepSeek-R1模型深度对接。此外,DeepSeek-R1、V3、V2、Janus-Pro等模型还在昇腾社区和电信魔乐社区上线,方便用户在昇腾硬件平台上快速部署。

DeepSeek的成功,彰显了中国在人工智能领域的创新实力,加速了大模型的广泛应用,为人们生活带来便利。这预示着AI行业将迎来更广阔的发展空间,中国在全球大模型发展中将扮演越来越重要的角色,持续贡献‘中国速度’和‘中国力量’。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注