当前位置: 首页 > news >正文

University-1652:首个基于无人机的跨视角地理定位数据集

一、数据集开创性意义University-1652是学术界第一个基于无人机的跨视角地理定位数据集论文发表于ACM Multimedia 2020。您可以直接访问 ACM 官方发表页 或 arXiv 预印本 查看全文。该工作由 Zhedong Zheng、Yunchao Wei、Yi Yang 完成。在此之前主流数据集仅提供卫星-地面或卫星-无人机两种视角的对齐图像。University-1652 首次将无人机视角模拟真实飞行拍摄纳入基准定义了无人机目标定位与无人机导航两大新任务填补了该领域的空白。二、数据集构成多源、多视角数据集包含1,652 栋大学建筑来自全球 72 所大学共37,855 张无人机查询图像 951 张卫星图 2,921 张地面图。三大来源具体为无人机视角通过 Google Earth 模拟飞行采集模拟无人机在校园上空盘旋拍摄的斜俯视角度。卫星视角提供目标建筑及周边的正射影像作为地理定位的检索库。地面视角从 Google 图像搜索爬取的街道级图像提升跨视角学习的难度与多样性。数据集官方获取入口GitHub 仓库 中包含完整的下载请求模板Request.md需要填写后发送给作者获取原始数据。此外也有第三方整理的镜像可供快速实验例如 Kaggle 版本。数据集的标准化元数据含 DOI:10.57702/20syutwh由 TIB 研究数据仓库 提供方便引用。三、两大核心任务基于上述数据论文定义了两个互为逆向的任务任务输入检索目标无人机目标定位一张无人机拍摄的图像在卫星图像库中找出包含同一建筑物的最佳匹配卫星图无人机导航一张卫星图像目标位置在无人机历史飞行图像序列中检索到最接近该卫星视角的场景帮助无人机返航这两个任务共同支撑了“视觉地理定位 → 自主导航”的闭环。四、基线性能与评价协议论文提供了完整的CNN 基线模型与训练/测试协议代码全部开源在 GitHub - University1652-Baseline。核心结果如下方向Recall1Recall5无人机 → 卫星91.71%97.69%卫星 → 无人机90.02%98.07%通过共享权重Shared weights和局部模式网络LPN可进一步提升至94% 以上。这些数据为该领域的后续工作提供了可靠的基准。五、后续影响与扩展University-1652 发布后已被上百篇论文引用衍生出多个重要扩展University160K增加 16 万干扰图像评测更真实的大规模定位GeoText-1652加入空间文本注释支持自然语言引导定位后续 SOTA 方法如AGEN、PIIS-N在该数据集上 Recall1 均超过94.5%。六、官方引用 BibTeX如需在论文中引用该数据集推荐使用以下条目inproceedings{zheng2020university, author {Zhedong Zheng and Yunchao Wei and Yi Yang}, title {University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization}, booktitle {ACM Multimedia}, year {2020}, doi {10.1145/3394171.3413896} }
http://www.zskr.cn/news/1326096.html

相关文章:

  • 09. 极速:多级缓存策略与 LRU 算法实战
  • 双人成行2026最新官方正版免费下载 520情侣必玩 一键转存 永久更新 (看到速转存 资源随时走丢)
  • 别再折腾解码器了!用DXVA Checker和GPU-Z一键排查Chrome播不了H265视频的根源
  • 为什么Google Sans Code是程序员的终极选择?5大核心优势详解
  • STM32F407标准库USB Host驱动广和通MC665模块:从官方例程到实战移植的保姆级避坑指南
  • 一文读懂机箱机柜供应商:惠州市凌泰实业,深耕工控/钣金/铝型材/轨道交通/车载信号/仪器仪表/便携式机箱定制配件专业生产 - 栗子测评
  • 避坑指南:RK3568多屏配置中那些让你uboot启动失败的GPIO和PWM复用陷阱
  • 不用Remix在线版!在VSCode里用Hardhat写合约,搭配Ganache和MetaMask本地测试全流程
  • 告别文献混乱!用Zotero+OneDrive打造你的跨设备论文库(附ZotFile插件配置)
  • 2026年评价高的烟台装修公司/烟台全包装修公司/烟台毛坯房装修公司/烟台二手房翻新装修公司哪家经验丰富 - 行业平台推荐
  • VS2019编译OpenCASCADE 7.6.0避坑实录:从custom.bat修改到Demo测试,一次搞定
  • 告别‘天书’!手把手教你用vdex2dex、odex2smali等工具,把Android应用的vdex/odex/cdex转成可读的dex文件
  • Unity Timeline实战:除了过场动画,你的Signal Track和Control Track用对了吗?
  • Perplexity vs. Claude vs. Perplexity Pro订阅转化率对比分析(内部泄露数据首次公开)
  • 从‘测量平面’到‘器件平面’:深入浅出图解VNA去嵌背后的信号流与T参数矩阵
  • 告别FTP!用Go写的Filebrowser,一个命令搞定Windows/Linux跨平台文件管理
  • 别再只用差速轮了!手把手教你为Navigation2仿真打造专属阿克曼底盘模型(附完整URDF/SDF文件)
  • 从信号放大器到协议感知:深入解析Retimer与Redriver在高速链路中的角色演进
  • 负载电阻从500Ω到10kΩ:用Multisim深度解读谐振放大器选择性变化的底层逻辑
  • 告别龟速!实测PyTorch在Mac M1 GPU(MPS)上跑ResNet比CPU快了多少?
  • Amov二次开发
  • 2026实战指南:极客老王教你实在Agent成品发货全流程自动化配置教程
  • Linux终端快捷键分层指南:从基础操作到高效工作流构建
  • 2026年比较好的南京矿井废水零排放/南京酸洗废水零排放/重金属废水零排放/含镍废水零排放长期合作厂家推荐 - 行业平台推荐
  • 如何3步实现IDM永久激活:终极注册表锁定技术详解
  • Egg.js重构Controller最佳实践:自定义核心组件与架构优化指南
  • 量子能量隐形传态与W态纠缠技术解析
  • Claude在MLIR代码分析中的优势:从模式匹配到领域推理
  • 白天也能精准追踪!OpenMV强光下识别红色激光点的完整配置流程(附代码)
  • NLP-Models-Tensorflow语音识别实战:11种深度学习模型的终极对比指南