一、数据集开创性意义University-1652是学术界第一个基于无人机的跨视角地理定位数据集论文发表于ACM Multimedia 2020。您可以直接访问 ACM 官方发表页 或 arXiv 预印本 查看全文。该工作由 Zhedong Zheng、Yunchao Wei、Yi Yang 完成。在此之前主流数据集仅提供卫星-地面或卫星-无人机两种视角的对齐图像。University-1652 首次将无人机视角模拟真实飞行拍摄纳入基准定义了无人机目标定位与无人机导航两大新任务填补了该领域的空白。二、数据集构成多源、多视角数据集包含1,652 栋大学建筑来自全球 72 所大学共37,855 张无人机查询图像 951 张卫星图 2,921 张地面图。三大来源具体为无人机视角通过 Google Earth 模拟飞行采集模拟无人机在校园上空盘旋拍摄的斜俯视角度。卫星视角提供目标建筑及周边的正射影像作为地理定位的检索库。地面视角从 Google 图像搜索爬取的街道级图像提升跨视角学习的难度与多样性。数据集官方获取入口GitHub 仓库 中包含完整的下载请求模板Request.md需要填写后发送给作者获取原始数据。此外也有第三方整理的镜像可供快速实验例如 Kaggle 版本。数据集的标准化元数据含 DOI:10.57702/20syutwh由 TIB 研究数据仓库 提供方便引用。三、两大核心任务基于上述数据论文定义了两个互为逆向的任务任务输入检索目标无人机目标定位一张无人机拍摄的图像在卫星图像库中找出包含同一建筑物的最佳匹配卫星图无人机导航一张卫星图像目标位置在无人机历史飞行图像序列中检索到最接近该卫星视角的场景帮助无人机返航这两个任务共同支撑了“视觉地理定位 → 自主导航”的闭环。四、基线性能与评价协议论文提供了完整的CNN 基线模型与训练/测试协议代码全部开源在 GitHub - University1652-Baseline。核心结果如下方向Recall1Recall5无人机 → 卫星91.71%97.69%卫星 → 无人机90.02%98.07%通过共享权重Shared weights和局部模式网络LPN可进一步提升至94% 以上。这些数据为该领域的后续工作提供了可靠的基准。五、后续影响与扩展University-1652 发布后已被上百篇论文引用衍生出多个重要扩展University160K增加 16 万干扰图像评测更真实的大规模定位GeoText-1652加入空间文本注释支持自然语言引导定位后续 SOTA 方法如AGEN、PIIS-N在该数据集上 Recall1 均超过94.5%。六、官方引用 BibTeX如需在论文中引用该数据集推荐使用以下条目inproceedings{zheng2020university, author {Zhedong Zheng and Yunchao Wei and Yi Yang}, title {University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization}, booktitle {ACM Multimedia}, year {2020}, doi {10.1145/3394171.3413896} }