当前位置: 首页 > news >正文

(cvpr26) F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation

1、研究动机

论文主要解决超高分辨率(UHR)遥感图像语义分割问题,现有方法采用多分支架构(如 GLNet、ISDNet)以同时保留局部细节与全局语义,但这类方法存在两个问题:

一是分支内部计算效率低(如反复裁块推理),二是多分支并行训练引发梯度竞争,导致收敛不稳定与特征对齐困难。

该论文从频率域视角出发,通过将图像分解为高低频分量并为各分量设计专属分支,同时引入专用损失函数,解决上述问题。

2、模型框架

模型整体框架如下图所示,首先将UHR 图像动态分解为高频分量与低频分量,高频分量使用 Mamba 提取特征,低频分量又分为 短程依赖子分支(局部语义)与长程依赖子分支(全局上下文)分别处理。后面再用频率融合模块和两个辅助损失把三路信息对齐、稳定训练。

总体为三分支结构:

  • 高频分支,采用基于状态空间模型(VMamba)的多阶段编码器提取层次化表示
  • 短程子分支,基于 CNN 骨干网络建模局部语义特征
  • 长程子分支,基于轻量级VIT建模长程全局依赖

(1)Adaptive Frequency Decomposition:论文设计了自适应频率分解,可以根据输入遥感图像自身纹理、边缘、内容复杂度,动态将原图拆分为 高频特征分量 + 低频特征分量。具体流程为:1、将通道划分成多个 group。2、每个 group 根据自身内容生成一个低通滤波器。3、用低通滤波器提取低频信息。4、高频滤波器通过 “恒等滤波器减去低频滤波器” 得到。

(2)Hybrid-Frequency Fusion:第一步:对于输入的FsF_sFsFlF_lFl特征,首先计算通道维度的 attentionAs∈RCsA_s\in\mathbb{R}^{C_s}AsRCsAl∈RClA_l\in\mathbb{R}^{C_l}AlRCl,计算特征通道关系:M=σ(AsAlT)∈RCs×ClM=\sigma\left(A_{s} A_{l}^{T}\right) \in \mathbb{R}^{C_{s} ×C_{l}}M=σ(AsAlT)RCs×Cl,该矩阵刻画了输入特征不同通道间的全局关联。第二步:引入两个独立 MLP 对MMM做维度匹配,再分别与矩阵 A相加,得到精细化注意力权重A~s、A~l\tilde{A}_s、\tilde{A}_lA~sA~l。再用 1×1 卷积统一两个分支的通道维度,加权相加得到融合特征。

(3)Cross-Frequency Alignment Loss:强制高低频分支在语义层面保持一致,消除频率带来的表征偏差。使用 KL 散度来实现约束。

(4)Cross-Frequency Balance Loss:各分支的梯度大小差距很大,如果某条分支梯度大,则参数更新快、网络过度偏向这条分支学习。容易变成单分支主导,其他分支失效,模型整体性能下降。CFBL 就是主动约束所有分支的梯度大小,让每条分支的学习力度保持均衡。

http://www.zskr.cn/news/1527118.html

相关文章:

  • 别再乱new了!深入理解Qt对象树与内存管理,告别内存泄漏
  • 三分钟掌握Real-ESRGAN-GUI:让模糊图片瞬间变清晰的终极指南
  • 通用企业级分页组件(jQuery无依赖、自适应条数、智能页码锚定、生产通用)
  • 职业打假事件的法律风险:三维协同防控要点
  • AXI_SLAVER代码问题求助!!!
  • Cursor Pro完整功能破解指南:终极机器ID重置与配置管理技术
  • 会议录音总听不清整理不完?2026离线语音转文字选型可参考这些标准
  • 从一张图看懂副热带高压:Python绘制588线揭示的2023年夏季天气密码
  • 二战341分,从北京985调剂到安大:我的电子信息调剂邮件模板与简历打磨心得
  • 软考高项成本管理ITTO记不住?试试用这4个接地气的故事场景来搞定
  • 2026北京比较好的高分子温脱硝剂厂商排名 - 品牌排行榜
  • OpenPLC Editor:开源工业控制编程环境的深度解析与实践指南
  • 想进能源央企?除了刷题,你还需要知道这些:中海油/中石化/中石油校招深度解析
  • 如何用ComfyUI IPAdapter实现AI图像风格迁移:从安装到高级应用的完整指南
  • 【计算机毕业设计案例】基于 SpringBoot 的校园公告资讯共享系统的设计与实现(程序+文档+讲解+定制)
  • 廊坊黄金回收实时行情与商家对比指南 —— 靠谱推荐典典佳汇! - 诚鑫名品
  • Ubuntu新手避坑:arm-linux-gcc命令找不到?可能是你装错了架构(附交叉编译工具链安装指南)
  • 外贸 AI 写作工具 API 评测:7 款工具翻译、开发信生成接口集成对比(2026)
  • 2026年IEC60825检测服务商口碑分析:谁在激光安全与能效认证领域更具实力? - 优质品牌商家
  • Python开发进阶之路:自动化脚本编写技巧分享
  • 2026 合肥管道疏通与异味治理机构精选 5 家 马桶 / 厨卫下水 / 地漏除臭服务参考 - 宅安选房屋修缮
  • linux命令:lsof、uniq
  • 再也不用自己拍带货视频!Seedance 2.0+Coze工作流,真人口播自动生成,适合电商全品类!
  • 哈尔滨南岗区修发动机烧机油靠谱店 - 资讯速览
  • 2026年,探秘专业虾青素知名企业,究竟有何独特魅力?
  • 2026年南通管道清淤服务企业观察:从家庭疏通到市政管网,谁更值得选择? - 优质品牌商家
  • 变量、数据类型、表达式
  • 别只盯着驱动开发了!聊聊嵌入式+AI/异构计算这些年薪50W+的新岗位
  • 2026行业内好用的隧道防火涂料厂家推荐排行榜 - 品牌排行榜
  • 2026年安庆装修设计口碑观察:哪些公司经得起市场检验? - 优质品牌商家