AI算力底座,爱芯元智社区推广半年总结

Release time:2026-06-23

一、背景概述

过去半年,公司迎来多个重要里程碑:港股成功上市、高阶智驾芯片M97首次亮相、普惠智驾芯片M57定点量产、入门级机器人芯片快速推广、大模型推理芯片稳步推进、产品线解决方案陆续交付、开源生态持续拓展。与此同时,公司产品战略也升级为 “感知—理解—行动” 的新方向。

由于近期内部事项密集、节奏较快,社区成果推广的推文未能及时跟上,因此借本次 “半年总集篇” 集中向开发者朋友们同步最新成果,希望能给生态中的小伙伴们带来启发。

二、模型仓库与生态建设

2.1 模型仓库规模

截至2026年6月15日,公司在 Hugging Face 和 ModelScope 魔搭社区上的模型仓库总数已超过 200个。

Hugging Face地址:https://huggingface.co/

ModelScope地址:

word_6a3b3ed9691ae.png

word_6a3b3ed9661cf.png

2.2 生态开放度持续提升,社区资源全面开放

年初,OpenClaw的发布显著推动了端侧与边缘侧AI产品需求的增长。为帮助更多开发者以更低成本、更便捷的方式体验公司AI芯片的强大性能,我们正式推出AX8850 SDK社区版本(基于v3.10.2版本)。

该社区版SDK现已开放全部核心生产资料,涵盖硬件资料、软件工具、开发文档以及NPU工具链。此举旨在全面支持以下产品形态的开发者进行直接、快速的评估:

AIBOX

龙虾盒子

AI-NVR

AI-NAS

M.2算力卡(随附完整PCB Layout资料,可直接投板,实现快速量产)

SO-DIMM算力模组

获取链接:

AXCL运行时开源,助力高效驱动适配

为方便开发者(尤其是“天才程序员”)快速将基于AX8850算力卡的驱动适配至各类主控硬件平台,我们同步开源了AXCL运行时源码,并提供了配套的驱动适配技术文档(Skill.md),旨在显著提升开发效率。

目前,已有客户基于该开源方案,成功实现了ARM64 + OpenWrt + 8850算力卡的平台适配。

开源仓库地址:

AX-Monitor/axmon:轻量级命令行性能监控工具

word_6a3b3ed969a3d.jpeg

word_6a3b3ed95ad22.png

axmon是一款专为AX嵌入式开发板设计的紧凑型终端监控工具,其设计灵感源自nvitop。该工具特别适用于GTK图形化仪表盘使用不便,而通过SSH、串口控制台或本地Shell运行终端界面更为便捷的场景。

核心功能与特性:

动态终端仪表盘,配备彩色使用率进度条,显示直观。

支持一次性纯文本输出模式,便于集成至脚本与日志系统。

在Linux ARM64环境下通过npm正常安装,无需Rust工具链。

直接读取AX系统指标,无Python或GTK依赖,资源占用极低。

对root用户友好,支持启用NPU监控及加载带宽模块。

主要监控指标:

CPU使用率:读取自 /proc/stat

DDR操作系统内存:读取自 /proc/meminfo

DDR CMM内存:读取自 /proc/ax_proc/mem_cmm_info

NPU使用率:读取自 /proc/ax_proc/npu/top

SoC温度:读取自 /sys/class/thermal/thermal_zone0/temp

AX带宽:读取自 /proc/ax_proc/bw/bw

开源仓库地址:

三、NPU 社区工具链更新

3.1 Pulsar2 6.0

作为算力产品的核心软件工具,NPU工具链 Pulsar2 迎来 6.0正式版本,主要更新包括:

新增模型支持:Qwen3.5、Gemma4、MiniCPM-V 4.6、MiniCPM5-1B、Qwen3-ASR、Qwen3-TTS 等端侧大模型,推动端侧智能体(Agent)方案落地

新增芯片支持:AX637、AX615、AX88x0 系列,方便开发者快速评估新芯片的AI能力

获取地址:https://modelscope.cn/models/AXERA-TECH/Pulsar2/tree/master/6.0

3.2 axllm

我们重构了 AX8850/AX620E/AX637 系列的大模型Infra方案,基本实现 ‌OpenAI API Compatible‌,推动端侧大模型产品快速落地量产。

OpenAI API Compatible:‌是指遵循 OpenAI 官方 API 规范(包括 URL 路径、请求参数、响应格式)的接口标准,允许开发者使用同一套代码调用不同的大模型服务。这意味着只要模型服务商支持该协议,你只需修改‌Base URL‌和‌API Key‌即可无缝切换模型,无需重写业务逻辑。

获取地址:https://github.com/AXERA-TECH/ax-llm

3.3 ax-remote-infer

迭代 NPU 模型时,每次改动都要scp model.axmodel + 推理脚本到板子上跑,体验很糟。这个项目把这一步消掉了:

板子上跑一个小 daemon,你的 PC 上用pyaxengine加上 remote provider — 写起来跟在板子上跑没区别,代码人一直在 PC 上;

让任何一台 Python 工作站,通过局域网驱动AX NPU 推理,让家庭智能中枢的算力通信无碍。

word_6a3b3ed95ebc2.png

获取地址:

3.4 QAT.Ultralytics

95%的端侧AI应用都离不开目标检测任务,为了进一步提升低比特量化精度,我们分享了基于 Ultralytics 的 QAT 方案,尽可能的减少量化精度调优的烦恼。以支持 YOLOv5、YOLO11、YOLO26 方案。

获取地址:https://github.com/AXERA-TECH/QAT.Ultralytics

四、解决方案初探

针对端侧AI、边缘计算领域客户零散但总量巨大的“中长尾市场”,公司提炼出多个共性场景方案,配套开放软硬件资料SDK,助力产品公司低成本评估、快速量产。

4.1 AIBOX 解决方案

针对多路视频解码和智能分析场景,充分利用芯片硬件编解码器和NPU资源。针对AX8850系列芯片开发多路视频解码+AI模型推理解决方案。

word_6a3b3ed95bc2a.png

算力卡方案只要有PCIe的主控均可适配,已开源PCIe驱动源码和Code Agent Skill,最快1小时完成新主控平台适配。

获取地址:https://github.com/AXERA-TECH/ax-pipeline

4.2 AI NVR 解决方案

联合业内优秀开源项目 Frigate NVR,利用AX8850系列本地算力,打通智能分析中小(物体检测)- 中(语义搜索)- 大(生成式AI/智能体)三个维度,将整套方案完全离线部署,推动家庭智能中枢产品落地。

word_6a3b3ed963f66.png

4.3 双目深度估计

基于AX8850N、AX8910平台,利用芯片高能效AI处理器高帧率运行Transformer模型,开发双目深度估计解决方案,赋能移动机器人和具身智能产品。

word_6a3b3ed95d7c2.png

4.4 智能体(Agent)盒子

结合AX8850系列芯片本地部署端侧多模态大模型的技术特点,推出Agent BOX端云协同方案,为智能体装上本地计算的感知传感器模型(VLM多模态理解、ASR语音识别、TTS语音合成),最多可降低40%云端token费用。

4.5 本地语音助手

适配 FireRedASR2(1.2B参数),中文方言识别准确率全网开源最高

适配 Kokoro TTS 和 ZipVoice 多国语音实时生成模型

适配业界优秀语音推理平台 Sherpa-ONNX

已有行业头部客户基于此完成离线大模型智能会议机量产

4.6 多人会议转录摘要解决方案

支持浏览器麦克风实时分段转录,会议结束后自动进行说话人聚类+ASR,并调用本地大模型的OpenAI兼容接口生成会议纪要。支持AX8850主控和算力卡协处理两种硬件形态,其中M.2算力卡形态已在某国产笔记本AIPC上完成兼容性适配。

word_6a3b3ed96a1b6.png

https://modelscope.cn/models/AXERA-TECH/3D-Speaker-MT.axera

4.7 视频理解智能体

基于AX8850系列芯片构建多模态VideoAgent,面向视频理解与检索,支持长视频智能分析与自然语言问答。

核心功能:

芯片平台部署:基于AX8850系列部署全部模型,端到端运行完整流程

视频智能索引:自动分段、特征提取、多模态信息融合(ASR+VLM)

向量检索:高效相似度检索与结果融合,支持跨模态查询

自然语言问答:基于视频内容生成回答,实现智能体功能

word_6a3b3ed95c514.png

https://zhuanlan.zhihu.com/p/2043079393539618546

4.8 文字识别智能体

基于 PaddleOCR-VL + Qwen3-Embedding + Qwen3 + LangChain RAG 的文档智能问答系统,支持PDF、扫描件及常见图片格式的端到端识别与检索问答。

支持格式:PDF(文字型/扫描版)、PNG、JPG、JPEG、BMP、TIF、TIFF

word_6a3b3ed966d40.png

https://zhuanlan.zhihu.com/p/2051768095803548852

4.9 内容合规解决方案

pp-nsfw_Inspector 是一个运行在Axera NPU上的图片内容审核Pipeline,结合OCR、NSFW检测、二维码扫描和关键词规则匹配,将图片分类为PASS/REVIEW/REJECT三档。

word_6a3b3ed95f31c.png

4.10 智能相册 Immich 更新

持续更新全球最火的智能相册开源项目 Immich

完善手机端APP交互体验;

基于最新的 Release v2.7.5 完成 AX8850 平台适配。

word_6a3b3ed967823.png

获取地址:

https://huggingface.co/AXERA-TECH/immich

https://zhuanlan.zhihu.com/p/2051749029223183792

五、自研模型开源

5.1 YOLO-Fun

将各类目标检测模型归类为长期维护项目 YOLO-Fun,在适配Ultralytics最新检测模型的同时,定制训练垂类场景检测模型。

word_6a3b3ed96038f.png

word_6a3b3ed96a9dd.png

5.2 中英文语义检索

基于 mobileclip2-s2 微调轻量级多语言文搜多模态模型,利于下游产品客户快速适配量产,适用于PC、手机、NAS、NVR、IPC、相机、行车记录仪等具备图片存储能力的设备。

获取连接:https://modelscope.cn/models/AXERA-TECH/MobileCLIP/tree/master/mobileclip2_s2/AX650

5.3 开集目标检测

word_6a3b3ed95e41c.png

六、大模型适配(2026年)

6.1 LLM(大语言模型)

word_6a3b3ed9689ba.png

6.2 VLM(视觉语言模型)

word_6a3b3ed9626fd.png

6.3 VLA(视觉语言动作模型)

word_6a3b3ed960bd8.png

七、语音模型适配

7.1 ASR(语音识别)

word_6a3b3ed96b317.png

7.2 TTS(语音合成)

word_6a3b3ed95cde1.png

八、新增AI硬件

8.1 LLM8850-Kit 4GB

word_6a3b3ed961587.png

8.2 NanoKVM-GO

word_6a3b3ed95fbca.jpeg

九、致谢

感谢 Hugging Face 和 ModelScope 魔搭社区提供免费的云存储资源;

感谢社区开发者 ivanshi1108、zihan987 贡献AX_DashBoard 和AX-Monitor 工具。

  •  
    Email Addresses
    Contact Sales

    Business@axera-tech.com

    Automotive Sales

    auto@axera-tech.com

    Algorithm Cooperation

    DL-AITech-ST@axera-tech.com

    IR Contact

    ir@axera-tech.com

    Join Us

    hr@axera-tech.com

    Legal Contact

    legal@axera-tech.com

    PR

    axerapr@axera-tech.com

    Complaint

    complaints@axera-tech.com