当前位置: 首页 > news >正文

huggingface 模型权重文件

文件类型文件名示例用途
模型权重 pytorch_model.bin 或 model.safetensors 包含模型训练后的参数权重
配置文件 config.json 包含模型架构和超参数配置
词汇表文件 vocab.jsonvocab.txttokenizer.json 分词器所需的词汇映射
分词器配置 tokenizer_config.json 分词器的配置参数
特殊标记文件 special_tokens_map.json 定义特殊标记(如[CLS], [SEP]等)

 

PyTorch 格式

model/
├── pytorch_model.bin      # 模型权重
├── config.json            # 模型配置
├── tokenizer.json         # 分词器
├── tokenizer_config.json  # 分词器配置
└── vocab.txt              # 词汇表

TensorFlow 格式

model/
├── model.ckpt.index       # 模型权重索引
├── model.ckpt.data-00000-of-00001  # 模型权重数据
├── config.json            # 模型配置
└── vocab.txt              # 词汇表

SafeTensors 格式(推荐)

model/
├── model.safetensors      # 安全的模型权重格式
├── config.json            # 模型配置
└── tokenizer.json         # 分词器

 

http://www.zskr.cn/news/7208.html

相关文章:

  • P4147 玉蟾宫(悬线法)
  • 「Java EE开发指南」如何用MyEclipse开发Java EE企业应用程序?(二)
  • TENGJUN防水TYPE-C 16PIN连接器技术解析:从结构设计到认证标准的全面解读 - 实践
  • MMoE学习笔记:利用门控专家网络高效建模多任务关系
  • SpringMVC使用jasypt加密配置文件 - Commissar
  • 基于Python+Vue开发的口腔牙科预约管理系统源码+运行步骤
  • ECT-OS-JiuHuaShan 框架实现元推理,是人类文明的金种子
  • MATLAB实现连续投影算法
  • PS辉光眩光特效插件 BBTools Glow Glare 2 V2.4.3 For Photoshop
  • 深入解析:Model Context Protocol (MCP) 安全风险与攻击方式解析
  • 剑指offer-31、整数中1出现的次数
  • Centos7非LVM根分区容量不足后扩容,对调硬盘挂载/
  • 详细介绍:Vue3》》eslint Prettier husky
  • Java-Spring入门指南(十)纯Java类配备与@Configuration实战
  • TechInsights 拆解:蔚来“亚当(Adam)”超级计算机
  • 一根网线搞定远程运维,GL-RM1PE 深度体验:远程运维、装机、开机一体化的 KVM over IP - 详解
  • 在AI技术快速实现功能的时代,挖掘电子书阅读器新需求成为关键突破点
  • jtag协议处理流程 - 指南
  • 读人形机器人15未来城市
  • 解锁智能检索新境界:CriticGPT 赋能检索模型洞察人类偏好
  • US$39.99 3+1 Button Remote Key for Nissan 315Mhz FCC ID KBRASTU15 10pcs/lot
  • 编译Unity4.3.1f1
  • US$19 Smart Key Fob For Nissan Micra/Juke/Note Renault Alaska 433MHz
  • 【R课堂-电机专栏】为什么提高电机的电压时,转速会随之上升?
  • Java学习第四天
  • 在线咨询(本地实现—跟练)
  • 02020308 .NET Core核心基础组件08-结构化日志和集中日志服务
  • zookeeper的配置
  • 攻防世界-parallel-comparator-200 - xxx
  • 2025.9.17总结