
学位论文简介
本论文聚焦于解决多视图神经网络在具身智能终端上面临的计算冗余与性能瓶颈问题。研究围绕“冗余优化”这一核心思想,系统性地探索了从推理、训练到未来量子计算的全链路加速技术。取得了以下主要创新性研究成果:
(1) 面向多视图推理的卷积神经网络加速器扩展架构(CAMVA)。主要创新点提出多视角动态匹配算法,利用SIFT特征实现多视图间近似区域的精准匹配;设计冗余宏块剪枝策略与动态特征恢复机制,在硬件层面实现细粒度计算跳过与特征重建;引入边缘特征误差纠正策略,保障剪枝后模型的识别精度;构建CAMVA扩展架构,兼容现有CNN加速器,显著提升推理速度与能效,适用于自动驾驶等实时系统。
(2) 面向多视图训练的卷积神经网络加速器扩展架构(EA²-TMV)。主要创新点提出EA²-TMV算法,结合CNN与图像处理技术,识别并剪枝多视图冗余特征;设计中间结果重用机制,通过RPC通信与双线性插值恢复缺失特征,减少重复计算;构建四引擎硬件架构(CV/OA/Aggregator/T-Engine),支持异步并行与负载均衡;实现训练阶段计算与存储开销的显著降低,保持模型精度同时提升训练效率。
(3) 多视图三维物体识别的高效结果重用训练系统(FCR²Sys)。主要创新点提出多视图重叠区域匹配与视图关系重构方法,构建多视图扩展阵列图;设计基于图结构的洗牌算法与智能缓存管理机制,优化数据加载与特征重用;实现前向与反向传播中的中间结果复用,减少数据传输与计算冗余;在PyTorch中集成FCR²Sys,显著提升训练速度与能效,适用于多视图三维识别任务。
(4) 三维量子架构下的量子神经网络高效映射方法。主要创新点提出基于立方体的三维量子架构,增强量子比特连接性与系统可扩展性;设计LE3D方法,首次实现三维架构中量子算法映射延迟的快速准确估计;提出启发式量子算法映射策略,结合多路径映射与量子比特映射算法,降低SWAP门开销;构建优化映射器,显著减少映射延迟与硬件开销,为大规模QNN在三维架构上的实现提供支持。
主要学术成果
[1] Junjie Chen, et.al. CAMVA: An Extension Architecture of CNN Accelerators for Multi-View Acceleration [J]. IEEE Transactions on Computers, 2025. (CCF-A类, 第一作者)
[2] J. Chen, et.al. Quantum Algorithm Mapping Latency Estimation in Three-Dimensional Quantum Architectures [J]. IEEE Transactions on Consumer Electronics, 2025, doi: 10.1109/TCE.2025.3610871.(SCI 2区, 第一作者)
[3] J. Chen, et.al. An Efficient Mapping Framework for 2D Quantum Architecture [C]. Neural Computing for Advanced Applications, 2025.(EI, 第一作者)
[4] J. Chen, et.al, Mapping Quantum Algorithms on A 3D Fault Tolerant Quantum Architecture, IEEE Transactions on Consumer Electronics.(大修,第一作者,SCI 2区)