当前位置: 首页 > news >正文

高并行度NPPC 高模板SIZE的图像算法时序问题优化

一、8TAP算法设计存在的挑战性1.关于8TAP的算法设计并行度太大那么位宽就很大那么时序是有点难通过2.在设计一个算法模块需要8Tap的时候发现时序很难满足特别是你时钟需要跑200MHZ以上那么时序往往过不去3.特别是设计中存在乘法乘加累加还有除法这种尝试了很多办法时序有些许改善但是还是达不到要求4.如果设计的多个步骤都有加法乘法除法并且你还是8个并行度如你还有滤波模板那么这个资源面积就很大说实话你想时序过去只有把II降低了II1,这种情况是很难通过的所以你只能让II2,但是这个你肯定不能接受。5.还有一种处理方式就是不要将所有逻辑放在一个约束了pipeline的大for循环下这样势必对你的时序有很高的要求那么你可以尝试拆分逻辑将这些设计放在多个串行的for循环中然后for循环之间是串行的状态机这样通过将latency加大的情况下来改善时序。二、优化的方式1.表达式均衡#pragma HLS EXPRESSION_BALANCE这个优化效果不大2.将关键代码使用函数封装然后约束最大latency这个有时候会改善有时候会恶化时序3.使用static变量赋值从而引导综合工具插入寄存器这个方式几乎没有效果4.将DSP使用LUT加法树的约束方式这个有改善但是改善不是很大5.拆分逻辑(这个属于比较好的方式也是比较推荐的方式)将for循环的复杂逻辑进行拆解拆分成多个独立的for循环进行处理这样latency会稍微大一点但是整个时序会好很多。
http://www.zskr.cn/news/1402918.html

相关文章:

  • LibreCAD完全指南:为什么这款免费CAD工具能替代AutoCAD
  • 抖音批量下载技术方案:高效自动化内容采集架构设计
  • Winhance中文版:Windows系统优化终极指南,让你的电脑焕发新生
  • 华硕笔记本终极控制方案:G-Helper轻量化替代工具完整指南
  • Minicor:数分钟构建 RPA,自修复代理降错率,助企业突破业务瓶颈!
  • 如何用Text-Grab实现Windows高效OCR文字识别?4大模式+3步上手全指南
  • 小型轧机选型指南:专业机构如何精准匹配
  • 华硕笔记本终极性能管理方案:GHelper轻量级控制工具完全指南
  • Taotoken用量看板与账单追溯功能带来的成本管理清晰度体验
  • Simon Cipher位串行硬件实现与Simontool验证实战
  • 基于ARM TrustZone的区块链轻钱包安全架构设计与工程实践
  • 后端转全栈学习-Day2-CSS 基础
  • 基于布尔函数优化的FPGA模运算单元设计:从算术到逻辑的范式转换
  • 后端架构技术04-Node.js事件循环深度剖析:从“回调地狱“到“性能怪兽“的进化之路
  • 揭秘植物大战僵尸C++重制版:104关完整游戏开发实战指南
  • 如何利用LiveTalking快速构建AI数字人客服系统:企业数字化转型的终极指南
  • Obsidian插件汉化终极指南:基于AST与大模型驱动的完整本地化解决方案
  • 5分钟快速部署CookieCloud:终极浏览器数据安全同步指南
  • 免费开源英汉词典数据库ECDICT:构建智能语言应用的终极解决方案
  • Linux CPU 占用过高怎么排查?top、ps、pidstat
  • YgoMaster游戏王离线模拟器:免费畅玩大师决斗完整指南
  • 基于GitHub Actions的Android应用自动化发布流水线实践
  • 从怀疑到驾驭:AI编程工具实战心路与效率提升指南
  • 30秒从图片变3D模型:Unique3D如何让3D建模像拍照一样简单
  • Cobalt Strike免杀实战:绕过AV/EDR的几种Payload生成与混淆技巧(2024版)
  • 基于混沌LSTM与序列增殖的地理信息加密系统设计与ZYNQ实现
  • 全面解析:2026年最值得关注的6款简历工具,效率与ATS兼容性兼得!
  • 讲讲硬、软中断、DMA、网卡 网卡驱动
  • ChromaControl终极指南:如何用一款免费软件统一控制所有RGB设备灯光效果
  • 5分钟快速上手:Windows窗口强制调整工具完整指南