当前位置: 首页 > news >正文

Polyvore数据集完整使用指南

Polyvore数据集完整使用指南

【免费下载链接】polyvore-datasetDataset used in paper "Learning Fashion Compatibility with Bidirectional LSTMs"项目地址: https://gitcode.com/gh_mirrors/po/polyvore-dataset

Polyvore数据集是时尚搭配研究领域的标杆性资源,为AI时尚推荐系统提供了丰富的训练素材。这个开源数据集包含了数十万套精心设计的服装搭配组合,是研究计算机视觉、推荐算法和时尚AI的必备工具。

数据集概述

Polyvore数据集来源于流行的时尚网站Polyvore.com,用户可以在该网站上创建和上传服装搭配数据。该数据集包含21,889套服装搭配,其中17,316套用于训练,1,497套用于验证,3,076套用于测试。

快速开始

获取数据集

首先克隆项目仓库:

git clone https://gitcode.com/gh_mirrors/po/polyvore-dataset

解压数据文件

数据集的核心数据存储在polyvore.tar.gz压缩文件中,解压命令如下:

tar -xzf polyvore.tar.gz

数据结构详解

服装搭配数据格式

数据集中的每个JSON项目包含以下信息:

{ "name": "服装搭配名称", "views": "搭配被查看的次数", "items": [ { "index": "在搭配中的索引位置", "name": "时尚单品描述", "price": "单品价格(美元)", "likes": "单品被点赞次数", "image": "单品图片URL", "categoryid": "单品类别ID" } ], "image": "搭配图片URL", "likes": "搭配被点赞次数", "date": "上传日期", "set_url": "搭配URL", "set_id": "搭配ID", "desc": "搭配描述" }

类别系统

数据集包含丰富的时尚类别,涵盖从服装到配饰的各个领域:

  • 服装类:连衣裙、上衣、外套、裤子等
  • 鞋履类:靴子、高跟鞋、平底鞋、运动鞋等
  • 配饰类:包包、珠宝、眼镜、帽子等
  • 家居类:家具、装饰、照明等
  • 美妆类:化妆品、护肤品、香水等

完整的类别映射关系可以在category_id.txt文件中找到。

核心任务类型

1. 服装搭配推荐

训练数据存储在train_no_dup.jsonvalid_no_dup.jsontest_no_dup.json文件中,分别对应训练集、验证集和测试集。

2. 填空式时尚推荐

fill_in_blank_test.json文件包含用于评估填空式时尚推荐任务的问题。每个问题包含:

  • question:形成问题的时尚单品序列
  • answers:可供选择的多项选项集
  • blank_position:需要填充的空白位置

3. 时尚兼容性预测

fashion_compatibility_prediction.txt文件包含约7,000套搭配,其中4,000套不兼容,3,000套兼容。

数据处理最佳实践

数据预处理技巧

  1. 类别过滤:数据集已删除非时尚类别的单品,如背景、文字和装饰品
  2. 数量限制:对于包含过多时尚单品的搭配,只保留前8个单品
  3. 索引处理:搭配中的单品索引可能不连续

特征工程建议

  • 利用单品描述文本进行自然语言处理
  • 结合价格信息进行经济价值分析
  • 使用点赞数据评估受欢迎程度

应用场景

学术研究

  • 时尚搭配推荐算法研究
  • 跨模态检索技术开发
  • 视觉语言模型训练
  • 个性化推荐系统构建

工业应用

  • 电商平台服装搭配推荐
  • 虚拟试衣间技术开发
  • 时尚趋势分析预测

注意事项

  1. 数据时效性:数据集爬取于2017年2月,部分搭配可能已过时
  2. 图片可用性:原始图片URL已不可用,可通过Kaggle获取相关图片
  3. 版权合规:使用时请遵守相关许可协议

引用说明

如果本数据集对您的研究有帮助,请引用相关论文:

@inproceedings{han2017learning, author = {Han, Xintong and Wu, Zuxuan and Jiang, Yu-Gang and Davis, Larry S}, title = {Learning Fashion Compatibility with Bidirectional LSTMs}, booktitle = {ACM Multimedia}, year = {2017}, }

常见问题解答

Q: 如何获取原始图片数据?A: 原始图片可以通过Kaggle上的Maryland Polyvore Images数据集获取。

Q: 数据集是否包含重复的搭配?A: 数据集文件以"no_dup"命名,表示已去除重复项。

Q: 如何处理搭配中单品数量不一致的问题?A: 建议使用填充或截断技术来处理变长序列。

通过本指南,您可以快速上手Polyvore数据集,开展时尚AI相关的研究和开发工作。

【免费下载链接】polyvore-datasetDataset used in paper "Learning Fashion Compatibility with Bidirectional LSTMs"项目地址: https://gitcode.com/gh_mirrors/po/polyvore-dataset

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/168521.html

相关文章:

  • 终极漏洞赏金工具集合:快速安全测试神器大全
  • DiffSynth-Studio AI视频创作工具完整配置与使用指南
  • 告别Vim多文件编辑困扰!这些缓冲区管理神器让你效率翻倍 [特殊字符]
  • YOLO模型训练日志监控系统上线,进度实时掌握
  • 2025年口碑好的防火阀执行机构厂家推荐及选购指南 - 品牌宣传支持者
  • 3分钟掌握Open-AutoGLM手机控制术:零代码实现智能自动化(限时揭秘)
  • STM32CubeMX实现PID控制的系统学习指南
  • 继电器厂家如何选择更可靠?2025年终十大品牌综合评测与最终推荐! - 品牌推荐
  • Sparrow-WiFi:Linux系统下最强大的图形化无线网络分析神器
  • 终极指南:掌握Dexmaker在Android测试中的完整应用
  • free5GC完整实战指南:5分钟快速部署开源5G核心网
  • LosslessSwitcher:Mac无损音频自动切换终极解决方案
  • Topaz项目使用指南:高性能Ruby实现深度解析与实战应用
  • 基于微信小程序的智慧社区娱乐服务管理平台系统(毕设源码+文档)
  • YOLO模型训练超参设置指南:lr、batch size推荐值
  • Orbion_3D_Space_Mouse:重新定义三维空间交互的开源硬件
  • Keil5新建工程完整指南:嵌入式开发入门必看
  • 零基础也能玩转AutoGLM,轻松实现AI建模自动化(附完整代码模板)
  • 让微信更好用的macOS神器:WeChatPlugin-MacOS深度体验
  • Frappe框架完整指南:从零开始构建企业级应用
  • YOLO模型支持PyTorch 2.0,编译更快兼容更强
  • PhpRedis SSL配置完全指南:7步实现安全加密传输
  • Kronos金融时序预测终极指南:从入门到精通
  • 如何快速上手Awesome Icons:终极图标资源指南
  • 基于微信小程序的新冠疫情防控信息管理系统(毕设源码+文档)
  • API测试自动化整合全流程指南
  • webframe generaldb 的一个优化:pageresultError等
  • YOLO目标检测准确率低?可能是这几点没做好
  • 自动化测试维护成本降低50%的策略
  • ARM仿真器入门实战案例:点亮第一个LED