以终为始+系统融通——爱芯元智车载领域的技术发展路径
2023年10月25日,以“科技引领汽车产业高质量发展”为主题,第30届中国汽车工程学会年会暨展览会(SAECCE 2023)在北京北人亦创国际会展中心盛大开幕。
凭借在智能驾驶赛道上强大的芯片自研能力和落地成果,爱芯元智受邀发表《如何打造高性能的自动驾驶芯片——以终为始+系统融通》主题演讲,分享针对行业痛点问题,爱芯元智对探索车载芯片最优化解决方案道路上的体会。同时,现场也展出了应用于车载领域的系列芯片、开发套件/Demo及已量产落地的合作伙伴样件,获得一致好评。
爱芯元智车载事业部智能算法高级总监李琛
最近20年来,我国汽车产业在实践中探索出了一条以科技创新为牵引的转型发展之路,产业技术创新持续深入,关键核心技术不断突破,重大创新成果接续涌现,支撑产业规模不断壮大,发展质量效益稳步提升。
随着汽车电动化、网联化和智能化的提速,汽车芯片对车辆可靠性、安全及性能的重要性不言而喻,汽车行业亟需围绕汽车芯片开展应用及创新攻关,以满足当前产业变革下的新需求。
爱芯元智认为,自动驾驶中看不清、看不懂、测不准、检不全、部署掉点多、部署效率低是行业的6大痛点问题。依托于两大自研核心技术——爱芯智眸AI-ISP和爱芯通元混合精度NPU,以及大规模量产经验,爱芯元智可助力行业伙伴落地高性能、低功耗、安全可靠的智能驾驶解决方案。全面的产品线,针对性解决行业6大痛点问题,满足客户的多样化需求。
问题1 看不清
在进出隧道的大光比场景、夜路黑车的低光场景、雨雾雪等恶劣天气场景,以及高速行驶时的运行拖影等场景中,对动态范围需求高,在低光场景感知性能受限。爱芯元智基于自研核心技术——爱芯智眸AI-ISP,提出了车载HDR系统解决方案和车载低光系统解决方案。将HDR以及降噪的处理效果提升,大幅改善以上场景中的影像性能体验。
问题2 看不懂
看不懂,是指机器视觉做感知时,检测不出来。爱芯元智通过带入后端CV/语义应用,形成图像质量感知闭环评价体系,解决看上去还好但实际效果不佳的问题,使车载智能影像达到智能画质闭环、智能场景控制。
简单来说,基于爱芯智眸AI-ISP技术,爱芯元智一方面对传感器特性做精细化建模,对影像处理策略进行极致优化设计,如将2D降噪升级为3D降噪;另一方面,充分利用AI算法的数据驱动特性,获取更高维度的效果“助推”,全面提升智能驾驶疑难场景下的表现力,帮助实现出色的感知性能,确保行车安全。
问题3 测不准
测不准是指,感知模块本身对于空间信息测不准,如一般障碍物、目标跟踪、里程计、动态标定、地图构建、测距测速等场景的检测。爱芯元智通过对深度、光流的硬化加速,有效提升感知方案的准确性和可靠性。深度/光流算法则是CV类算法中计算复杂度最高的部分。CV深度引擎拥有1080p30的性能,双目支持224点范围的视差搜索,支持对称全向聚合;CV光流引擎则可以满足多尺度范围拓展、支持基于多ROI的跟踪点密度控制,支持迭代精度优化。
对多源融合定位、地图拓扑构建、CV几何感知等方面,爱芯元智集强大算力与超低功耗于一体,自研两大核心技术——爱芯智眸AI-ISP和爱芯通元混合精度NPU,从SoC层面到SDK层面,支撑搭建不同Slam算法的灵活框架。针对不同的行泊应用、视觉或Lidar输入方案、局部定位/地图定位/在线建图等不同功能,Slam可以组合出多种不同的变种方案,提供一系列计算密集型算子的优化函数库,以助力Slam应用高效快速落地。
问题4 检不全
针对一般障碍物检不全的限制。爱芯元智设计了一套多路并发处理、在线图像格式转换、裁切、缩放,一气呵成的硬件加速器,基于几何物理建模的CV算法,发挥尺子的测量作用,在一般障碍物感知、测距测速、目标跟踪等多个方面,可以对基于AI的语义感知进行有效补充。高效支持多尺度、多ROI感知,大幅优化了处理延迟、带宽资源消耗,有效避免高倍率下采样时的混叠效应。
爱芯元智预处理系统支持Task-Aware Filter,根据不同任务如光流、特征匹配、NPU感知等,灵活配置下采样滤波系数,使得后端任务各自发挥其最佳效果。不同硬件之间还可根据业务需求做灵活数据流配置,以及离线、在线模式切换,兼顾自由度的同时,最优化延迟、带宽等系统性能。
问题5 部署掉点多
感知模型的部署常常会碰到上板性能不足,掉点多的情况。爱芯元智依托于自研爱芯通元混合精度NPU的特有设计,实验论证Transformer模型能够通过混合精度优化的方式,快速实现PTQ部署,且能够有效保持模型精度。另一方面,通过针对Transformer特性优化向量核与数据IO的设计,实现了各类Transformer模型的高效部署论证,对于Transformer模型具有非常好的性能表现。爱芯元智从SoC系统角度出发,涉及NPU、CPU、DSP、GPU以及各ASIC单元的系统级异构调度优化等方面。
问题6 部署效率低
对于部署过程繁琐冗长等实际工程问题,爱芯元智拥有成熟工具链,部署建议手册,货架化参考设计。NPU是感知的大脑,爱芯通元混合精度NPU采用高效异构多核架构,张量向量和IO引擎,配合丰富的专用算子加速器,通过灵活调度能够实现各类车载AI模型的高效推理。混合精度设计支持低比特模型加速,或高比特/浮点精度提升。应用算法协同设计可以让支持的模型库随着行业迭代不断更新,保证NPU对所运行任务的高利用率和低功耗。
经过多年量产迭代,爱芯元智工具链积累出很多优秀的特性。如高效的PTQ部署、深度的QAT量化、支持精确模型仿真等等。简单易用的特性,也收获了从无到有,1小时上手的客户评价。
对于车载场景常用的模型(比如BEV),基于对自身平台的深刻认识与深度优化,爱芯元智提供从主干网络、时空融合、到各类检测头的API,将适配爱芯平台的各个最佳设计模块化、货架化,给到客户做灵活集成。同时,还提供车载模型设计建议手册、以及更为完整的感知模型参考设计,进一步助力客户高效部署落地。
在车载领域中,爱芯元智明确定位Tier2,坚持“以终为始,系统融通”,从业务实际需求出发,结合场景特点分析,指导SoC设计合理取舍;从SoC整体系统层面,拉通各功能子模块间的交互,使得SoC芯片真正成为一个有机的片上整体系统,携手合作伙伴助力客户快速量产落地,充分发挥出自身平台的价值,实现生态共赢。
根据高工智能汽车研究院发布的《2023年1-8月份中国市场乘用车标配行车ADAS功能国产SoC方案市场份额》榜单,爱芯元智排名第二。