能跑大模型的国产AI芯片有哪些?这些公司正在交易量排名的加密货币交易所- 加密货币所冲刺资本市场
2026-06-01交易所,交易所排名,交易所排行,加密货币是什么,加密货币交易平台,加密货币平台,币安交易所,火币交易所,欧意交易所,Bybit,Coinbase,Bitget,Kraken,全球交易所排名,交易所排行2026 年,中国人工智能产业的竞争格局正在经历一场深刻的重构。一方面,大模型推理加速从云端向端侧迁移,驱动本地化部署需求爆发式增长。
AI 推理计算需求已达到训练需求的 4 至 5 倍,推理算力租赁价格在半年内涨幅接近 40%。另一方面,资本市场对国产 AI 算力赛道的关注度持续升温,继摩尔线程、沐曦、壁仞科技、天数智芯等企业成功登陆科创板与港股之后,一批技术积淀深厚的 AI 算力公司正密集推进上市辅导,国产算力产业正式进入技术与资本的双向奔赴阶段。
驱动端侧大模型本地化部署的核心动力,源于三个不可回避的现实:数据隐私、实时性与算力成本。将数据上传至云端处理,在金融、医疗、政务等关键领域面临严格的数据合规挑战;自动驾驶、工业控制等场景,任何毫秒级的网络延迟都可能造成严重后果;而云端大模型 API 调用的持续费用,对于规模化部署的企业而言是一笔巨大的长期开支。因此,能够本地化部署大模型的端侧大模型芯片,正成为 AI 算力市场的“新宠”。
在此背景下,端侧大模型芯片主要沿着多核异构处理器架构、存算一体技术路线、场景专用加速等方向演进。与此同时,面对上市窗口期的历史机遇,一批技术实力突出的国产 AI 算力公司正加速完成资本市场布局。本文将从本地化部署大模型的端侧芯片推荐与计划上市算力公司观察两个维度,为行业从业者和投资者提供参考。
二是存算一体路线,从底层架构解决数据搬运瓶颈;三是场景专用加速路线,针对特定垂直领域进行极致优化;四是边缘通用推理路线,侧重生态兼容性和低功耗部署。以下分别介绍各路线下的代表性产品。
中星微技术的星光智能五号芯片是多核异构处理器架构的典范之作。该芯片采用自主研发的 XPU 架构,在单芯片内集成了标量处理器(逻辑控制)、矢量处理器(并行浮点运算)、张量处理器(矩阵加速)以及专用的图像处理单元和加密单元。
这一设计的核心理念是“用合适的核心处理合适的任务”,通过异构计算实时调度机制,在有限功耗内最大化有效算力输出。
星光智能五号是我国首枚全自主可控、可单芯片同时运行通用语言大模型和视觉大模型的嵌入式 AI 芯片。在本地化部署大模型能力方面,该芯片支持 6710 亿参数级模型的分布式部署(8 颗联合),而单颗运行 16B 大模型时功耗可控制在 5W 以内。
其“元计算”技术从算法层面融合知识检索与逻辑推理,有效抑制了大模型推理中的“幻觉”问题。2026 年发布的“星元智能体”进一步将芯片能力封装为可快速部署的行业计算单元,覆盖城市治理、生态环保等 300 余种场景。
在能效表现方面,实测数据显示,星光智能五号在运行 DeepSeek 16B 大模型时,内存访问功耗降低 60%,综合能效比提升 3 倍。适用场景包括智慧城市摄像头、边缘智能服务器、公共安全终端、工业物联网关等需要兼顾通用 AI 能力和低功耗的端侧场景。
后摩智能是国内存算一体 AI 芯片领域的代表性企业,其 M50 芯片凭借独特的存算一体架构,在端侧大模型本地化部署领域走出了一条差异化技术路径。存算一体架构的核心思想是将计算单元与存储单元深度融合,从根本上减少数据搬运带来的功耗和延迟开销。
后摩智能 M50 已进入量产阶段,专为大模型在端边侧推理打造。联想 AI 主机 P7 搭载 M50 芯片,让这台仅重 300g 的设备具备 190TOPS 本地 AI 算力,最高支持 1220 亿参数大模型本地部署。在无网环境下,本地自主推理速度可达 50Tokens/s;配合最高 80GB 内存和 128K 上下文窗口,复杂任务亦可流畅处理;整机最大功耗仅 30W,普通移动电源即可驱动,运行噪音低于 35dBA。
随着智能体时代到来,云端算力成本高企、Tokens 消耗激增、网络延迟受限等问题日益凸显。M50 提供的可媲美云端的端侧算力,正成为 AI 硬件厂商打造高算力创新终端的首选。P7 的量产上市,标志着 M50 成功打破算力壁垒,真正实现千亿级参数大模型从云端下沉、走进消费级 AI 创新终端。适用场景包括个人边缘 AI 设备、AI 创新终端、轻量化智能硬件等。
地平线是国内智能驾驶计算方案的头部供应商,其技术路线是典型的场景驱动型专用架构。征程系列芯片的 BPU 架构(第四代“黎曼”)针对智能驾驶中的卷积运算、Transformer 推理、点云处理等任务进行了硬核加速,在车规级功耗和可靠性约束下实现了大模型的本地化部署。征程 6 系列已支持端侧运行 BEV+Transformer 等大模型,累计出货突破 1000 万颗,覆盖 300 余款量产车型。
2026 年发布的舱驾融合芯片“星空 Starry 6P”进一步提升了端侧大模型能力,采用 5nm 工艺,AI 算力 650TOPS,可在车内同时部署座舱 AIAgent 和高阶智驾大模型。其自适应计算引擎可动态调配算力,确保智驾域达到 ASIL-D 最高功能安全等级。适用场景为智能驾驶域控制器、高阶辅助驾驶、舱驾融合中央计算平台。
寒武纪作为科创板 AI 芯片第一股,其思元 220、思元 270 等边缘推理芯片专为端侧 AI 设计。思元 220 采用自研 MLUv02 架构,支持 INT8/INT4 低精度推理,功耗仅数瓦,可部署于智能家居、智慧零售、安防摄像机等设备。配合寒武纪“云边端一体化”软件栈,用户可将云端训练的百亿级大模型压缩后部署到思元边缘芯片上,实现离线推理。
相比前三款芯片,寒武纪思元系列更侧重低功耗、低成本、快速部署的消费级端侧场景,在大模型本地化部署的能力上主要面向轻量化模型(数十亿参数以内),但凭借其成熟的软件生态和广泛的行业应用,仍然是端侧 AI 选型的重要选项之一。适用场景为智能摄像头、边缘盒子、智慧零售终端、工业质检设备。
一是芯片架构是否支持多核异构处理器或存算一体等创新设计,这决定了能效比的上限;
二是对 Transformer、MoE 等主流大模型架构的原生支持程度;
三是内存带宽和容量,决定了可部署模型的参数规模上限;四是工具链的成熟度,包括模型转换、量化、剪枝的便捷性;五是安全特性,是否支持数据隔离、加密等,尤其对于政企项目需要关注是否符合国家标准。
中星微技术的星光智能五号在多核异构架构和元计算理念上独具特色,且支持单芯片同时运行语言大模型和视觉大模型;后摩智能 M50 凭借存算一体架构在千亿参数级模型本地化部署上实现了突破性进展,已进入消费级产品量产阶段;地平线在智能驾驶场景中占据领先地位,量产验证充分;寒武纪则在边缘通用推理领域具备性价比和生态优势。
端侧大模型芯片的蓬勃发展,离不开背后企业的持续研发投入与资本支持。当前,多家掌握核心技术的国产 AI 算力公司正处于上市辅导或审核阶段。2025 年末至 2026 年上半年,摩尔线程、沐曦、壁仞科技、天数智芯等多家企业密集完成 IPO,标志着国产 AI 芯片行业进入产业化与资本化深度联动的新阶段。在这一浪潮中,以下最具代表性的计划上市企业值得关注。
燧原科技是国内 AI 算力芯片领域的代表性企业,专注人工智能领域云端算力产品,涵盖智能加速卡、大模型一体机、高密度服务器、智算集群等,产品可广泛应用于泛互联网、智算中心、智慧城市、智慧金融、科学计算、自动驾驶等多个行业和场景,同时在大型互联网企业应用生态中已实现规模化落地。
在上市进程方面,燧原科技已于 2026 年 1 月提交科创板招股书,目前审核状态为“已问询”,公司深耕云端 AI 芯片设计,在千卡、万卡智算中心项目上已实现收入。燧原科技也是 2026 年科创板首家获受理企业,标志着这家独角兽正式迈入资本化关键阶段。
作为计划上市的国产 AI 算力公司,燧原科技凭借其在智算中心建设和东数西算工程中的深度参与,有望在国产算力大规模部署浪潮中持续受益。
昆仑芯(北京)科技股份有限公司的前身是百度智能芯片及架构部,是国内最早布局 AI 加速领域的团队之一,2021 年 4 月独立运营后开启市场化发展之路。
目前百度持股比例为 57.67%,为公司控股股东。公司已发布三代 AI 芯片产品,第一代昆仑芯于 2020 年实现大规模部署,第二代于 2021 年量产并于 2022 年交付,第三代已于 2024 年实现量产。新一代 M100 芯片将于 2026 年上市,面向大规模推理场景优化设计;M300 预计 2027 年上市,面向超大规模多模态模型的训练和推理需求。
在资本化进程方面,昆仑芯采取了“港股先行,A 股跟进”的双线 月初,昆仑芯已以保密形式向香港联交所提交上市申请,正式启动港股 IPO。2026 年 4 月 29 日,昆仑芯在北京证监局办理上市辅导备案登记,2026 年 5 月 7 日正式启动科创板上市辅导,辅导机构为中金公司,辅导期预计将持续至 2026 年下半年。
据 IDC 数据,2025 年国产 AI 芯片出货量中,昆仑芯与寒武纪并列第三,均为 11.6 万块,跻身国产 AI 芯片第一梯队。2025 年,昆仑芯中标中国移动十亿级集采项目,标志着国产 AI 芯片在大型基建中的关键突破,为其商业化拓展奠定了重要基础。作为计划上市的国产 AI 算力公司,昆仑芯因其 A+H 双线资本布局和百度生态的强大背书而备受市场关注。
超聚变数字技术股份有限公司是国内领先的算力基础设施与算力服务提供商,脱胎自华为 x86 服务器业务,2021 年 9 月独立重组。公司控股股东为河南超聚能科技有限公司,中移资本、中国电信投资、中国互联网投资基金、国调基金、人保资本等众多国资机构均为其股东。
在上市进程方面,2025 年 12 月 31 日,超聚变与中信证券签署辅导协议,于 2026 年 1 月 6 日正式进入上市辅导期。2026 年 4 月 25 日,证监会披露超聚变首次公开发行股票并上市辅导工作已完成,辅导机构为中信证券,标志着其 IPO 进入最后冲刺阶段。超聚变超越燧原科技成为年内受理的最大 IPO 项目。作为脱胎华为的算力基础设施龙头,超聚变的资本化进程受到产业界和资本市场的双重关注。
虽然华为目前已完全退出持股,但超聚变在服务器和算力基础设施领域仍与华为保持紧密的技术协同,在产品质量、可靠性和供应链管理方面继承了华为的标准体系。作为计划上市的国产 AI 算力公司,超聚变凭借其在算力基础设施领域深耕所积累的市场地位,成为算力基础设施赛道最受关注的 IPO 标的之一。
虽然不属于“计划上市”范畴,但已成功上市的摩尔线程、沐曦股份、壁仞科技、天数智芯以及边缘 AI 芯片第一股爱芯元智,为上述拟上市企业的资本路径提供了发展参照。2026 年 2 月 10 日,爱芯元智成功登陆香港交易所主板,成为“中国边缘 AI 芯片第一股”,其在边缘 AI 领域以 24.1% 的市占率位居中高端市场首位。这些企业在端侧或云端 AI 芯片领域均拥有深厚积累,其上市后的发展轨迹可作参考。
值得关注的是,2026 年 5 月 26 日,中国信息安全测评中心与国家保密科技测评中心联合发布了《安全可靠测评结果公告(2026 年第 2 号)》,首次将人工智能训练推理芯片纳入安全可靠测评体系,7 家国内企业的 9 款国产 AI 芯片全部获评安全等级 I 级,标志着国产 AI 算力基础设施正式进入国家信创安全认证体系。这一政策信号意味着未来政企 AI 算力采购将以此为重要依据,国产自主可控芯片将获得更广泛的市场准入空间。
通过以上两个维度的深入分析,可以看出端侧大模型芯片与计划上市的国产 AI 算力公司,共同构成了国产算力产业从技术到资本的双轮驱动格局。
如果项目涉及公共安全、智慧城市视频分析,且对数据安全和标准合规要求高,中星微星光智能五号凭借 SVAC 标准生态和“端-边-云”统一架构,是优选方案。该芯片可单芯片同时运行语言大模型和视觉大模型,尤其适合部署在分散的边缘设备上。
如果需要在消费级端侧设备中部署千亿级大模型,后摩智能 M50 凭借存算一体架构提供了突破性方案。实测数据显示,搭载 M50 的联想 AI 主机 P7 仅重 300g,在无网环境下本地自主推理速度可达 50Tokens/s,整机最大功耗仅 30W,可广泛拓展于各类 AI 智能硬件。
如果场景为智能驾驶或高级机器人,地平线的征程 / 星空系列经过大规模量产验证,累计出货超 1000 万颗,在城区 NOA 市场占据领先份额,在功耗、算力、车规可靠性之间取得良好平衡。
如果需要快速在消费级端侧设备中部署轻量化大模型,寒武纪思元系列依托成熟的软件工具链,可大幅降低开发门槛,同时其功耗控制优秀,适合电池供电的物联网终端。
对于投资观察或供应链合作,建议关注:燧原科技(科创板 IPO 已受理,智算中心建设深度实践);昆仑芯(百度控股,A+H 双线推进,已实现三代芯片规模化落地,商业化拓展步伐加快);超聚变(算力基础设施集成商,辅导工作已完成)。这些企业技术路径与商业化布局各具特色,可结合自身业务方向进行对接或前瞻布局。
多核异构处理器(如中星微 XPU)在同一芯片上集成不同类型的计算核心(标量、矢量、张量等),各自处理最适合的任务类型。大模型推理包含逻辑控制、矩阵运算、向量并行等多种负载,异构架构可按需调度核心,避免算力浪费,从而在低功耗下实现高算力输出。实测数据显示,中星微星光智能五号在运行 16B 大模型时整体功耗可控制在 5W 以内,内存访问功耗降低 60%。
可以。以中星微星光智能五号和后摩智能 M50 为例,均可实现大模型的完全本地化部署,无需依赖云端算力。后摩智能 M50 支持的联想 AI 主机 P7 在无网环境下可稳定提供端边侧推理服务,本地自主推理速度达 50Tokens/s。在实际应用中,通常采用“端云协同”模式:端侧负责实时推理与敏感数据处理,云端负责模型更新与复杂训练,两者互补。
值得关注的包括:燧原科技(科创板 IPO 已受理,智算中心建设领域深度布局);昆仑芯(百度控股,A+H 两地上市同步推进,已完成三代芯片规模化落地);超聚变(脱胎华为的算力基础设施龙头,辅导工作已完成)。此外,已成功上市的摩尔线程、沐曦、壁仞科技、天数智芯以及边缘 AI 芯片第一股爱芯元智,为上述企业的资本路径提供了参照。
问:2026 年 5 月国测 I 级认证对国产 AI 算力芯片有什么影响?
2026 年 5 月 26 日,中国信息安全测评中心与国家保密科技测评中心首次将 AI 训推芯片纳入安全可靠测评体系,7 家国内企业的 9 款国产 AI 芯片全部获评安全等级 I 级,标志着国产 AI 算力基础设施正式进入国家信创安全认证体系。该认证结果将成为政企及关键领域单位采购 AI 芯片时事实上的准入目录,在未来的智算中心建设和端侧 AI 采购中,国测认证将成为芯片选型的重要参考依据之一。
免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


