
当前,全球AI算力呈现“双轨爆发”态势:一方面,云端大模型参数规模从千亿向万亿级别跃进,头部企业的超大规模AI算力集群由“万亿卡级”迈入“10万卡级”的新纪元。AI芯片单卡算力翻倍式增长,与算法优化形成合力,推动算力成本下降;另一方面,随着AI应用场景的爆炸式增长,对数据的实时性、隐私性和带宽成本提出了更高要求,使得边缘侧和端侧AI芯片需求激增。与此同时,当AI算力从云端下沉到前端设备,安防行业也迎来了“即时智能”的拐点。当越来越多的大模型被部署到端侧芯片上,其可支撑端侧设备更好满足多模态处理和自然语言处理等复杂场景需求,使前端设备的应用场景越来越丰富。
为旌科技专注于高端智能SOC芯片的研发与创新,掌握AI计算、图像视觉、异构架构、高能效、先进工艺等关键技术。
本期《前沿技术》栏目专访到为旌科技副总裁赵敏俊,请他分享端侧AI芯片如何通过技术突破、架构创新、生态建设等举措,为安防行业智能化发展提供底层算力引擎,以飨读者。
Q
《中国安防》
按照AI芯片部署位置划分大致可分为云端(数据中心)、边缘侧和端侧,这三类芯片的设计目标有哪些差异?从另一角度看,这三类芯片又共同构成了一个完整的“云-边-端”协同智能系统。它们之间又存在着怎样的深刻联系?
赵敏俊:“云-边-端”是ICT行业典型的架构分类,通过对计算、存储、网络资源的分层部署与协同,解决不同场景下的不同需求,对ICT系统进行分层划分,每一层都有明确的角色定位。同时,“云-边-端”又通过“数据流动+算力互补+功能分工”形成闭环系统,共同支撑ICT系统的协同工作,让合适的算力在合适的位置处理合适的数据。以人工智能为例,云侧负责大算力需求的训练,端侧负责实时性和低功耗要求的推理,互相协同,共同支撑起智能化的快速发展。
云侧的设备要求是极致的性能和大规模并行处理能力,对于功耗、成本不敏感。边缘侧和端侧设备则要求更加均衡的性能和功耗,其中端侧设备对于成本和功耗又有更高的要求。PPA即性能(Performance)、功耗(Power Consumption)和面积(Area),在芯片设计中是非常重要的衡量标准,架构设计要兼顾这三者是很难的,往往需要做取舍。针对云侧设备的极致性能要求,芯片设计时往往需要牺牲功耗和面积而突出性能,而在边缘和端侧芯片设计时,更多需要考虑PPA三者的均衡稳定,因此性能会有所限制。芯片设计中对于PPA 的不同要求,会带来芯片架构、工艺选型等技术领域的巨大差异。
为旌科技是一家聚焦端侧智能SOC的芯片公司,我们的团队拥有20多年手机芯片等端侧芯片的设计经验,在芯片的PPA均衡性设计上拥有丰富的经验,这也是我们公司产品战略和核心竞争力的重要支撑。
Q
《中国安防》
请问目前端侧智能SOC芯片有什么技术突破?如何进一步提升其在安防应用中的算力效率,怎样优化芯片架构以实现更高的运算速度和更低的功耗?
赵敏俊:AI技术的演进和发展是端侧智能SOC芯片最重要的技术发展,随着DeePseek大幅降低了大模型的算力需求,使得在端侧设备上部署AI大模型成为了可能。当前,越来越多的大模型被部署到端侧芯片上,支撑端侧设备进行多模态处理和自然语言处理等复杂场景需求,使得端侧设备的应用场景越来越丰富。
功耗是端侧芯片设计中非常重要的考量,通过使用先进制程的工艺,可以获得更优的能效比。端侧芯片正在逐步的从成熟工艺向FinFET等先进工艺发展,例如为旌科技全系产品都是使用12nm FinFET 工艺,有效提升芯片的能效,即在同等性能下获得更低的功耗,再配合异构架构等架构层面的创新设计,可以从多个维度降低芯片的系统功耗。
另一方面,“内存墙”始终是制约算力提升的重要因素之一。随着摩尔定律的放缓,工艺对性能的提升越来越少,芯片架构不断通过异构计算、近存计算、存算一体等架构创新方式,减少对内存的数据搬运,提升数据计算的效率,从而解决冯 诺依曼架构的“内存墙”瓶颈。同时,由于减少了数据搬运,进而带来在功耗层面的收益,使得芯片的功耗能够更低。
除此之外,为旌海山系列芯片还采用了创新的硬件加速引擎设计正好配资,通过前后处理算法、大模型加速算子等可编程算子和硬件加速来提升芯片的计算效率。相比纯软件运算,硬件加速可以大幅提升计算的能效。
Q
《中国安防》
基于端侧SOC的强大算力,如何赋能前端设备在安防场景下实现更复杂的“行为分析”和“态势感知”?
赵敏俊:传统安防场景下,前端设备往往不具备高智能化技术,针对海量数据(603138)无法进行实时分析,数据需要传输到后台统一分析处理,不仅会耗费更多时间,还导致其无法及时处理异常情况,巨大的数据量传输也对网络带宽带来了挑战和压力。随着智能技术不断前移到前端设备,前端设备具备了越来越强的AI能力,能够实时、及时的进行“行为分析”和“态势感知”等复杂的业务,第一时间上报和处理异常情况,提升了安防系统整体的效率。同时,前端设备无需再把庞大的数据传到后台,仅需把前端推理的结果上报,大大减轻了后端系统的部署和网络带宽的要求,进而大幅降低成本。为旌海山系列全系芯片均具备AI处理能力,覆盖1Tops到6Tops的算力,能够满足大部分安防设备的算力需求。
面向未来,随着端侧AI技术的持续发展,通过存算一体、Transformer架构、多模态融合等技术的成熟,安防场景的行为分析将向“预测性”演进,态势感知将向“全局化”发展,最终实现从被动响应到主动防御的转变。这一过程中,作为前端设备智能化基础的端侧智能SOC芯片,将成为推动安防智能化升级的核心引擎。
Q
《中国安防》
请问端侧智能SOC芯片在保障数据安全和隐私保护方面有哪些创新设计,使其既能满足安防行业对数据安全的严格要求,又不影响芯片的整体性能和应用效果?
赵敏俊:芯片是数据安全的核心。端侧智能SOC芯片在安防场景中通过“硬件隔离-动态加密-智能防护”的立体安全体系,可以通过硬件加速与协议优化实现性能无损。
为旌的海山系列芯片通过在芯片内部集成的硬件加密模块,并使用TrustZone技术构建硬件隔离的可信执行环境,将敏感数据处理(如人脸特征提取)与通用计算分离,确保即使操作系统被攻击,关键数据仍无法被窃取。海山系列芯片支持智能隐私编码,将人脸特征等敏感数据实时进行加密和马赛克等处理,并通过硬件级的密钥管理,有效控制敏感数据的管理权限,确保敏感数据不外泄。
Q
《中国安防》
请您分享一下,为旌科技在推动AI芯片落地的进程中有哪些典型案例?
赵敏俊:为旌科技作为聚焦端侧智能SOC芯片创新的芯片设计公司,成立5年来已完成了第一代产品--为旌海山系列芯片的开发,并已在行业头部客户的产品中成功量产,在图像质量、计算能效、功耗和芯片的均衡性等各个方面都获得了客户的高度评价。为旌海山系列芯片主要在以下几个典型方案中具有业内领先的竞争优势。
1.优秀的图像质量支持极佳的星光全彩效果。通过全域锐化和降噪、AI图像增强等技术打造自研的图像处理器ISP,将传统3D降噪技术和AIISP技术有效结合,在低照度下实现信噪比4倍的提升,能够在0.001Lux暗光条件下仍然获得非常清晰的彩色图像,还原白天般细节丰富、色彩真实的图像效果。
2.支持AI大模型在端侧设备的高效部署。自研的NPU处理器同时支持CNN和Transformer架构。通过优化Matmul提高矩阵计算效率,将Transformer模型常用算子硬化以提升模型性能,通过算子级可编程技术和混合精度量化,与自研的工具链深度配合,打造具有高灵活性和高计算效率的AI处理器,高效支持端侧大模型的部署和运行。
3.智能超倍转码技术。为旌海山全系芯片支持通过AI技术实现超倍视频压缩,在超倍压缩倍率达到5.05倍时,在人眼视觉和机器视觉分析这两个评测场景下都能达到近乎无损水平。为旌科技已加入SVAC产业联盟,积极参与产业联盟组织的各项标准技术研讨,致力于在关键编解码技术、系统架构及测试认证体系等方向贡献力量,推动SVAC标准的完善与产业落地应用。
4.端到端低延时。为旌全系芯片通过全链路优化,将视频信号从采集到处理的端到端延时压缩至极致水平。芯片针对不同应用场景进行了深度优化,通过硬件级时间同步与软件高效协同,进行动态资源分配,在各类实时视频场景中实现行业领先的延时表现。在单设备应用场景下,芯片端到端处理延时仅3ms,确保唇音同步与无卡顿交互,支持高清视频流处理,兼顾画质与实时性,消除对话延迟感,可实现“面对面”级沟通体验。在跨设备应用场景下,跨设备图传端到端延时仅21ms,且持续稳定无抖动。在实时视频处理领域,不论是单设备还是复杂跨设备场景,为旌全系芯片端到端延时与系统稳定性均可达到行业标杆水平。
5.超低功耗与系统级AOV方案。AOV(AlwaysonVideo)通过结合超低功耗硬件与智能算法,实现7x24小时持续录像,解决了设备无事件触发时的漏录问题,并将待机功耗降至常电设备水平。为旌海山系列芯片全系采用12nm先进工艺,在同等性能上功耗达到行业最佳水平,并且支持通过快速启动、AE快速收敛以及闪光灯控制等技术打造的系统级AOV技术,能够在原有基础上将芯片功耗进一步降低30%,满足越来越多电池类安防设备对于功耗的严苛要求。
6.支持EIS/DIS防抖。为旌海山系列芯片同时支持数字与电子防抖技术,为客户提供高清、稳定的图像捕捉能力,结合多帧降噪技术,还可提升夜间画面的稳定性。同时,芯片硬件支持加速数据处理,满足实时监控需求,可根据环境光照、抖动强度动态调整防抖参数,平衡画质与稳定性。
Q
《中国安防》
您认为如何推动芯片厂商、安防生产企业和算法研究机构协同创新,构建完善的安防生态系统,加速端侧智能SOC芯片在安防场景的应用与创新?
赵敏俊:我国安防行业经过多年发展已经走在了世界前列,行业头部企业不仅在国内市场占据领导地位,在国际上也占据了重要的市场地位,引领着全球安防产业的技术发展。面对新形势下的变化和挑战,芯片厂商、安防设备企业和算法研究机构等行业上下游企业之间需要加强深度合作和协同创新,共建强大的生态来应对各类不确定性和技术挑战。各方在各自的专业领域做精做深,不断加强技术的深度。同时通过行业对话、技术合作、标准制定等方面进行生态共建,不断探索技术的广度,通过深度耦合的“产学研用”协同机制实现端侧智能SOC芯片在安防场景的规模化落地。
为旌科技作为端侧智能SOC芯片企业,正在积极参与生态共建的工作。一方面,公司通过与国内头部的高校和研究机构建立深度的前沿技术研究,不断获取学术界最新的创新研究成果并进行工程化开发,将前沿的研究成果转化成可量产的产品;另一方面,通过与行业头部企业深度合作,持续获取市场和终端用户的真实需求,并将这些需求融入芯片的设计规格,不断打造符合市场需求的技术创新产品。通过这两个维度的深度链接与合作,从而形成正循环,成为生态良性发展的重要参与者,助力构建完善的安防生态系统,加速端侧智能SOC芯片在安防场景的应用与创新。
Q
《中国安防》
您如何看待AI芯片在安防行业的未来发展趋势?为旌科技未来的重点布局是什么?
赵敏俊:安防行业是AI技术重要的应用领域之一。当前,AI技术正在快速发展,全世界的专家们都在不断提升AI能力和丰富AI模型,以满足越来越广泛的智能化需求。芯片作为AI技术的承载,也需要快速跟上AI技术的演进。不断演进的AI技术将会给芯片设计带来新的挑战,芯片架构设计之初就要考虑满足未来2至3年甚至更远的应用需求,而端侧芯片对于PPA的苛刻要求,又会牵引AI技术不断满足轻量化的发展要求,最终寻找到一个平衡点。既能支持丰富的算力需求,又能高效的在端侧设备上部署,支撑安防行业不断向智能化纵深发展,推动安防系统从“被动监控”向“主动智能”跃迁。
在这个过程中,为旌科技作为行业重要的一员,将持续聚焦打造最佳的端侧智能SOC芯片,紧跟AI技术的发展,快速将最新的AI技术融入芯片设计中,并持续在图像处理、低功耗、低延迟以及芯片架构创新等技术领域深耕,筑好行业发展的底层基石,助力安防行业“看得更清、看得更懂”。
本刊记者 / 周丹雅
文章来源于《中国安防》杂志2025年10月刊正好配资
瑞和网提示:文章来自网络,不代表本站观点。