当前位置: 首页 > news >正文

DINO版本进化

1.蒸馏 KD  与 自蒸馏 SD

  普通蒸馏,是有监督(软标签),老师是外部预训练的大模型

  自蒸馏,无监督,老师是 自己的历史版本EMA

 

2.EMA机制

  有一个问题,如果学生和老师输出的内容是一致的,那学生什么也学不到。所以

  老师网络的参数 = 0.996*老师旧参数 + 0.004*学生参数,这样老师也能在不断的学习,又不会因为学生某次的剧烈波动过大的影响老师

 

3.输入数据策略

  多视角增强,随机裁剪,旋转,变换颜色

  老师为大视角,做好分类

  学生为小视角,自己学习细节特征,但又能从老师那里学到全局语义

 

4.稳定机制(防止特征塌陷)

  1.中心化处理(centering)

    老师的数据h_i = h_i - 历史平均

    在没有中心化处理时。模型输出的判断倾向与“有点像猫、狗”。所以输出集中在[0.6,0.6]附近,这样就可能后续造成特征塌陷

    如果中心话处理,输出可能被调整为[0.05,0.05]和[-0.05,-0.05],强制去偏向一边

  2.温度调节

             截屏2025-10-26 11.12.39

    结果:老师输出的很尖锐,例如[0.1, 0.8, 0.1]

       学生输出比较平滑,学习更丰富,细腻的特征

 

 

gram锚定

   在增加训练数据后,虽然在分类等任务上一直在改进,但是在密集型特征任务上就退化

  使用gram矩阵:描述一张图片内部所以图像块特征之间的关系网(预先相似度)

  锚定过程:保存一个训练早期,密集特征还不错的模型作为gram老师。然后后面要求,学生的gram和老师的gram要尽量一致

  

截屏2025-10-26 11.20.59

 

综合的损失

反向传播更新学生,EMA更新老师

 

http://www.zskr.cn/news/30714.html

相关文章:

  • 2025 年 10 月餐饮厨房设备厂家最新推荐,实力品牌深度解析采购无忧之选!
  • 欧拉定理
  • 手把手在 Linux 上安装 Docker 与 Docker Compose(包含 Ubuntu、CentOS 等 11 个发行版)
  • 2025年10月长白山亲子酒店推荐榜:四季主题与温泉度假对比排行
  • 2025年10月工装设计公司推荐榜:全国服务力对比评测
  • 2025年10月法律咨询律所推荐榜:盈科多领域权威排名一览
  • 2025 年 10 月仿石漆厂家最新推荐,专业制造与品牌保障口碑之选
  • 2025年10月防脱生发产品排名榜:术后修复与日常防脱对比
  • Level 0~8 WP
  • 详细介绍:[特殊字符]️ Spring Cloud Eureka 三步通:搭建注册中心 + 服务注册 + 服务发现,通俗易懂!
  • 2025年10月中国办公家具定制公司推荐:口碑排行榜与权威解析
  • 2025年10月中国办公家具定制公司推荐:主流口碑排行榜与避坑指南
  • 芯片落地之道
  • 107.计组--四章
  • 2025 年 10 月铝合金切削液厂家最新推荐,高性能与可靠性兼具的优质品牌
  • 2025 年 10 月硬质合金切削液厂家最新推荐,精准检测与稳定性能深度解析
  • 读AI赋能10助手
  • 深入解析:GESP25年9月编程题解析
  • Anthropic Agent Skills 技术解析与实践
  • 深入解析:【FPGA+DSP系列】——(2)DSP最小核心板进行ADC采样实验(采集电位器输出电压)
  • 2025年耐用的北美款三防灯,单双管三防灯厂家推荐及选择指南
  • 2025年靠谱的广场音乐喷泉,水秀音乐喷泉行业内口碑厂家排行榜
  • 2025年有实力贴体机,手压式真空贴体机用户好评厂家排行
  • 2025年靠谱的汽车改装,别克gl8汽车改装厂家实力及用户口碑排行榜
  • 完整教程:构建融合扩散模块的知识引导式联邦图注意力学习网络用于阿尔茨海默病诊断|文献速递-文献分享
  • 2025年诚信的涂料色浆,浙江环保水性色浆厂家推荐及采购指南
  • 2025年优秀的肌电图针电极,术中针电极厂家推荐及选购参考榜
  • 2025年比较好的二手单板烘干机生产线,滚筒式单板烘干机优质厂家推荐榜单
  • 2025年评价高的家具涂装生产线,涂装生产线实力厂家TOP推荐榜
  • 2025年质量好的240KW充电桩,交流充电桩热门厂家推荐榜单