【首个】国内首个国产AI推理千卡集群落地,采用云天励飞全自研AI推理芯片

来源:爱集微 #云天励飞#
999

1.国内首个国产AI推理千卡集群落地,采用云天励飞全自研AI推理芯片

2.晶合集成:近期产能利用率维持在高位,正在进行四期项目建设

3.本田警告:电动汽车需求低迷,将计提157亿美元损失

4.《连线》揭秘:OpenAI为何在AI编程赛道被Claude Code反超?

5.存在起火风险,宝马在中国召回147830辆汽车

6.2月特斯拉中国制造电动汽车销量飙升91%


1.国内首个国产AI推理千卡集群落地,采用云天励飞全自研AI推理芯片

3 月 12 日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。项目将基于云天励飞自研的国产AI推理加速卡,建设国产AI推理千卡集群。

该集群将搭载DeepSeek等国产大模型,为政务、产业及各类应用场景提供更加便捷、低成本的AI能力,探索打造“国模国芯”的AI生态样板。

一、AI算力从“训练优先”走向“推理优先”

智算集群是人工智能时代的基础设施。如果说电力支撑了工业时代,互联网支撑了信息时代,那么智算正在成为支撑AI时代的重要底座。

在AI算力体系中,算力大体可以分为训练算力与推理算力。训练算力决定模型如何完成“从0到1”的能力构建,而推理算力则直接支撑AI应用落地。无论是春节期间大热的SeeDance,近期广泛讨论的“小龙虾”,还是各行业不断上线的AI Agent应用,背后都离不开推理算力的支撑。根据Gartner预测,到2026年,约55%的AI专用云基础设施支出将用于推理工作负载。

过去,国内许多智算中心普遍采用“训推一体”的建设模式。而此次在湛江建设的集群,则定位为专注推理任务的AI推理集群,主要面向各类行业应用场景,为传统产业的AI化提供直接支撑。

湛江也是国产大模型DeepSeek创始人梁文峰的家乡。近年来,当地在“DeepSeek+”应用探索方面动作频频。2025年初,DeepSeek-R1发布后,湛江即完成本地部署——基于国产技术栈的DeepSeek-R1大模型率先在湛江政务云上线。该模型在处理通用政务事务的同时,还能够持续学习本地产业知识与方言表达,逐渐形成具有地方特色的“湛江智慧”。

此次云天励飞建设的AI推理集群,也将与DeepSeek等国产模型进行深度适配,为更多行业应用提供算力支撑。

二、面向推理时代的千卡集群架构

在大模型应用场景中,推理系统通常需要同时满足高并发、高吞吐与低延迟三项要求。为提升整体效率,当前业界普遍采用“Prefill–Decode分离”的推理架构,通过对不同阶段进行资源优化,实现系统性能的整体提升。

其中,Prefill阶段主要负责对长上下文进行理解和计算,计算量大、带宽需求高;而Decode阶段则负责持续生成Token,对系统延迟更加敏感。如何在两个阶段之间进行合理的资源配置,成为推理系统架构设计的重要问题。

与此同时,随着大模型上下文长度不断增加,大量中间状态需要以KV Cache的形式存储。业内普遍认为,未来推理系统的性能瓶颈将越来越多来自数据访问效率,而不仅仅是计算能力。

在这一背景下,算力、存储与网络之间的协同设计,正逐渐成为AI基础设施的重要竞争力。

此次在湛江落地的千卡推理集群,正是围绕这一思路进行构建。

该集群采用云天励飞自主研发的AI推理芯片,并在系统架构上确立了“优先优化Prefill、兼顾Decode”的技术路线。通过在芯片设计中对计算资源与存储带宽进行针对性配置,使系统在长上下文推理场景下依然能够保持较高的吞吐效率。

在网络互联方面,系统采用统一高速互联架构,通过400G光网络构建集群物理层网络,实现节点之间的高带宽、低延迟通信。与传统在节点内和节点间分别采用不同协议构建网络的方式相比,这种同构互联架构减少了协议转换带来的额外开销,也简化了系统部署。

在部署能力上,该架构既可以支持单节点数十卡规模扩展,也能够平滑扩展至千卡级集群规模,从而适配不同规模的AI应用需求。

此外,针对大模型推理中KV Cache访问带来的压力,系统在计算互联与存储互联层面进行了协同优化。通过计算网络与存储网络的联合调度,可以显著提升数据读取效率,使模型在长上下文推理场景下依然保持稳定性能。

通过芯片架构、网络互联以及系统调度等多层优化,这一推理集群在整体效率与成本控制方面形成了明显优势,为AI规模化应用提供了更加经济的算力方案。

三、自研芯片构建低成本推理能力

据悉,本次AI推理集群将分三期建设,并全部采用云天励飞自研的国产AI推理加速卡。

其中,一期项目将部署云天励飞 X6000 推理加速卡;二、三期建设将率先搭载公司最新一代芯片产品。

根据公司规划,未来三年云天励飞将推出三代AI推理芯片产品。

第一阶段,将推出面向长上下文场景优化的Prefill芯片,通过提升计算效率与内存访问能力,为OpenClaw、各类AI Agent提供基础算力支撑。

第二阶段,将研发专注于Decode阶段低延迟优化的芯片产品,进一步提升实时推理能力。

第三阶段,则通过系统级协同优化,实现Prefill与Decode性能的整体提升,向毫秒级推理时延目标迈进。

其中,首款Prefill芯片DeepVerse100预计将在年内完成流片,并计划在湛江集群中率先部署。

在更长期的规划中,云天励飞提出“1001计划”,即以“百亿Token一分钱”为长期目标,通过芯片与系统协同优化持续降低大模型推理成本。

过去几年,AI算力建设往往以“堆算力”为主要路径——通过不断扩大GPU规模来获得更高性能。但随着大模型逐渐进入应用阶段,产业关注点正从“算力峰值”转向“单位成本效率”。

换句话说,未来AI产业竞争的重要维度,不仅在于模型能力本身,还在于谁能够以更低成本提供稳定的大规模推理能力。

湛江项目的落地,也为这一目标提供了重要的实践场景。千卡级推理集群不仅能够满足当前AI应用需求,同时也为更大规模算力系统提供技术部署平台。

在典型架构下,一个千卡级集群通常由多级扩展结构组成:从单节点8卡、32卡,到64卡甚至百卡级超节点,再到跨节点的大规模集群。通过这一规模系统的实际运行,可以充分验证卡间互联、节点通信和负载均衡等关键技术,为未来更大规模AI算力系统建设积累经验。

随着大模型逐步进入产业应用阶段,AI基础设施的发展逻辑也正在发生变化——从单纯追求算力规模,转向更加注重效率与成本。

在业内看来,推理算力将成为决定AI应用规模化落地的关键基础设施。谁能够以更高效率、更低成本提供稳定的大规模推理能力,谁就有机会在新一轮人工智能产业竞争中占据先机。

此次湛江AI推理千卡集群的建设,不仅为当地产业数字化转型提供了重要算力底座,也为国产模型与国产芯片协同发展提供了实践场景。在“国模”与“国芯”的深度协同下,AI基础设施正逐步从技术探索走向规模化应用,为人工智能产业的下一阶段发展打开新的空间。

2.晶合集成:近期产能利用率维持在高位,正在进行四期项目建设

近日,晶合集成在接受机构调研时表示,目前总产能约16万片/月,现在正在进行四期项目的建设。近期各项业务经营正常,产能利用率维持在高位。

据介绍,公司四期项目将建设一条产能为5.5万片/月的12英寸晶圆代工生产线,布局40nm及28nm的CIS、OLED、逻辑等工艺,产品可广泛应用于OLED显示面板、AI手机、AI电脑、智能汽车、人工智能及存储等领域。

晶合集成主要从事12英寸晶圆代工业务及配套服务,拥有150nm-28nm多元化制程工艺,目前具备显示驱动芯片(DDIC)、CMOS图像传感器芯片(CIS)、电源管理芯片(PMIC)、逻辑芯片(Logic)、微控制器芯片(MCU)等工艺平台晶圆代工的技术能力,产品应用涵盖智能手机、平板显示、安防、汽车电子、家用电器、工业控制、物联网、存储等领域,可为客户提供丰富的产品解决方案。

目前,55nm全流程堆栈式CIS芯片实现批量生产;55nm逻辑芯片实现批量生产;40nm高压OLED显示驱动芯片实现批量生产;28nm逻辑工艺平台完成开发。

从过去几年来看,DDIC的营收占比在不断下降,CIS占比不断上升,从2023年半年度营收占比约4%,成长到2025年度营收占比超20%,成长较快。

另外,公司目前部分产品的代工价格已有所上调,后续公司将通过优化产品结构、提升运营效率、拓展应用领域等方式积极应对市场变化,并结合客户需求与市场动态,制定合理的定价策略。

3.本田警告:电动汽车需求低迷,将计提157亿美元损失

本田汽车表示,由于重新评估其电动汽车战略,公司预计将计提最高达2.5万亿日元(约157亿美元,约合人民币1082亿元)的费用。随着电动汽车转型受挫,这家日本汽车制造商也加入了越来越多遭受冲击的全球车企行列。

该公司表示,将取消原计划在北美推出的三款电动汽车车型的开发和上市。本田预计,截至3月的财年亏损2700亿~5700亿日元。

今年2月,本田还曾警告称其电动汽车业务相关支出正在激增,但最新公告凸显了电动汽车需求放缓所带来的巨大成本压力。其损失规模与多家全球车企相当,例如Stellantis正因调整电动汽车战略计提超过220亿欧元(约250亿美元)的损失费用,而福特的战略重组也带来了195亿美元的冲击。

根据岩井Cosmo证券分析师Taku Sugawara的说法,这些影响也可能延续到下一个财年(从2026年4月开始)。他说:“目前还不确定本田能否在本财年消化这些损失,还是会延续到下一财年。”

本田表示,在美国关税以及亚洲竞争力下降的背景下,其汽车业务面临压力,尤其是在中国市场。本田预计将在中国的投资上计提资产减值损失。

全球汽车制造商正面临共同困境:欧洲正在重新审视此前激进的燃油车淘汰时间表,而美国也削弱了燃油经济性和排放标准,这些政策曾是支撑电动汽车发展的重要因素。

与此同时,随着消费者越来越倾向于选择更能满足需求的本土品牌,外国车企在中国市场的份额迅速下降。比亚迪在这一趋势中处于领先地位,并在2025年成为全球最大的电动汽车制造商。

本田还表示,鉴于北美市场需求放缓,公司将通过重新分配资源并精简车型阵容来加强混合动力汽车产品线。同时,公司还计划加强在印度的业务布局,因为印度是汽车和摩托车市场的重要增长地区。

本田表示,将在下一个财年公布修订后的中长期业务战略。

4.《连线》揭秘:OpenAI为何在AI编程赛道被Claude Code反超?

3月12日,据《连线》报道,OpenAI正在加速推进其AI编程产品Codex,试图在快速增长的AI编程工具市场追赶竞争对手Anthropic的Claude Code。知情人士透露,Claude Code目前已贡献Anthropic约五分之一收入,年化规模超过25亿美元,而Codex年化收入约为10亿美元。这一差距意味着,在被认为可能达到数万亿美元规模的AI编程市场中,OpenAI正从早期领先者变成追赶者

OpenAI Codex产品团队

事实上,OpenAI曾在这一领域占据先发优势。2021年,公司基于GPT-3推出Codex模型,并为微软的代码助手GitHub Copilot提供核心技术支持。该产品在2022年推出后迅速吸引数十万开发者使用。但随着ChatGPT在2022年底爆发式增长,OpenAI将更多资源转向通用大模型与多模态系统研发,一度没有专门团队持续推进AI编程产品。

与此同时,Anthropic选择集中资源强化编程能力。公司在模型训练中加入大量真实代码仓库数据,并针对复杂编程任务进行优化。2024年发布的Claude Sonnet 3.5被开发者普遍认为在代码生成和调试方面表现突出,也推动了一批AI编程工具快速增长。开发者平台Cursor在接入该模型后用户规模迅速扩大。报道指出,OpenAI曾尝试收购Cursor,但该公司创始团队拒绝了这一提议。

蒂博·索蒂奥(Thibault Sottiaux), OpenAI的Codex负责人

随着竞争压力上升,OpenAI在2024年开始重新整合内部资源推进AI编程产品研发。由前DeepMind研究员蒂博·索蒂奥(Thibault Sottiaux)领导的团队与产品负责人亚历山大·恩比里科斯(Alexander Embiricos)等人展开合作,开发新的AI编程代理原型。其中一个名为“Jam”的内部项目可以直接通过命令行运行代码,而不仅仅生成代码片段,被视为AI编程代理的重要转折点。

亚历山大·恩比里科斯(Alexander Embiricos),OpenAI Codex产品负责人

在这一过程中,OpenAI还试图通过收购来加速追赶。公司曾计划以30亿美元收购AI编程初创公司Windsurf,希望借此获得成熟产品和企业客户基础。然而该交易在与微软的合作谈判过程中陷入停滞,最终未能达成。随后,Windsurf创始人团队被谷歌聘用,其余团队成员被另一家AI编程公司Cognition收购。

随着推理模型o1和后续模型o3推出,OpenAI开始强化Codex的代码生成与自动调试能力。知情人士透露,2025年9月Codex使用量仅为Claude Code的约5%,但到2026年1月已上升至约40%,显示出追赶趋势。OpenAI CEO山姆·奥特曼(Sam Altman)认为,AI编程不仅具有巨大商业价值,还可能成为实现通用人工智能(AGI)的重要路径。

企业市场成为双方竞争的核心。OpenAI应用业务负责人菲吉·西莫(Fidji Simo)表示,公司计划将Codex能力整合进ChatGPT及其他产品,以扩大企业用户基础。一些大型企业已开始鼓励员工使用相关工具,例如Cisco管理层公开表示,未来不使用AI编程工具的员工可能会在竞争中处于劣势。

随着AI编程工具能力持续增强,围绕软件开发自动化的讨论也在科技行业不断升温。OpenAI联合创始人格雷格·布罗克曼(Greg Brockman)表示,随着越来越多任务被AI代理完成,人类工程师可能逐渐转向监督和管理系统的角色,而不是亲自编写代码。

(来源: 凤凰网)

5.存在起火风险,宝马在中国召回147830辆汽车

3月11日,国家市场监督管理总局发布公告指出,日前,宝马(中国)汽车贸易有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求,向国家市场监督管理总局备案了召回计划。召回编号S2026M0027V:自2026年3月16日起,召回生产日期从2020年7月31日至2022年12月22日的部分进口宝马2系、4系、5系、6系、7系、X4、X5、X6、Z4系列汽车,共计147830辆。

公告称,本次召回范围内部分车辆,由于起动机生产原因,车辆在多次启动后,起动机内部可能发生异常磨损,造成车辆启动困难。极端情况下,可能引发起动机内部短路,局部过热,存在起火风险。宝马(中国)汽车贸易有限公司将为召回范围内的车辆免费更换改进后的起动机,以消除安全隐患。

6.2月特斯拉中国制造电动汽车销量飙升91%

特斯拉中国2月份电动汽车销量连续第四个月增长,去年同期基数较低,抵消了季节性因素带来的不利影响。

3月11日,特斯拉中国表示,其上海工厂生产的Model 3和Model Y车型上月销量(包括出口到欧洲等市场)总计58600辆,同比增长91%,1月份增幅为9.3%。但与1月份相比,销量下降了15.2%。

中国汽车工业协会的另一项数据显示,特斯拉上海工厂上月出口量同比增长近五倍,达到20000辆。

由于春节期间新款Model Y部分生产线停产,特斯拉2025年2月在中国交付的电动汽车数量受到影响。

由于农历新年日期的变动,每年头两个月的销量往往波动较大。

特斯拉推出的七年低息贷款计划促使比亚迪等竞争对手在世界最大的汽车市场纷纷效仿。随着政府补贴的缩减,市场竞争预计将更加激烈。比亚迪上个月的全球销量创下疫情以来的最大跌幅,其中中国市场同比下降65%。为了重振销量,比亚迪上周发布了六年来的首次重大电池升级。

责编: 爱集微
来源:爱集微 #云天励飞#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...