当前位置: 首页 > news >正文

语言脑机接口中的开源数据集【脑机接口恢复语言3】

哈喽,我是懿轩。今天和大家聊聊语言脑机接口领域的开源数据集。

开源这词大家肯定都听烂了,但其实开源是有好几种程度的。

我们常说GPT是闭源的, deepseek是开源的,指的是前者没有开放权重,而后者开放。

但开源的另一个意思是要公开训练方法

有的开放权重的模型,比如GPT-OSS,就没有公开训练方法

除了公开权重、方法之外,还要公开训练数据训练代码,这才是完全的开源。

有一个模型叫 OLMo,它公开了训练数据和训练代码。

(懿轩注:OLMo来自美国艾伦人工智能研究所,最新一代 OLMo-3.1-32B 于2025年12月发布。可惜的是,今年三月,OLMo的核心团队几乎都被微软撬走,这个项目恐怕再也没有下一代了。)

现在来看看咱们语言脑机接口,这是我第1期视频放的7篇文章。他们的开源情况如何呢?

简单地说 UCSF 发的文章,只公开方法。BrainGate 发的文章,数据、代码、权重、方法全都公开。

(懿轩注:这里的 UCSF 指的是 UCSF 的 Edward Chang 实验室。这里的 BrainGate 指的是 Stanford 的 Willett 和 UC Davis 的 Stavisky 实验室)

UCSF 的文章会公开绘图数据绘图代码,它只能让你把文章里的图画出来。

开源除了可以复现之外,还有一个好处是可以打榜。

BrainGate把他们23年和24年的文章做成了两个比赛, Brain to Text 24 和 Brain to Text 25,分别于2024年和2025年举办。

(懿轩注:不知他们今年是否会发布 Brain to Text 26)

这两个比赛里各有10多支队伍超越了原作。

打榜是一件非常重要的事情——2012年深度学习第3次崛起就是依靠 ImageNet 可以让大家公平地竞争;2020年 AlphaFold 2 破圈也是因为蛋白质折叠领域每两年就有比赛。

(懿轩注:很多领域没有这样公平竞争的比赛,给学者们留了偷换概念和暗箱操作的空间)

开源和闭源哪个更好?——从全人类的利益看,开源各个方面都优于闭源。

比如说,我想比较 LSTM,GRU,Transformer 哪个在语言脑机领域最好用,光靠一个人的力量调参是不够的——唯一的办法就是把数据集开源,让擅长各个模型的人分别调参。

我很期待的是,每个学者都把自己的数据拿出来。反正那些数据不拿出来也就是放在服务器的硬盘里面吃灰,还不如贡献出来让大家都玩玩。

参考文献:

http://www.zskr.cn/news/1411433.html

相关文章:

  • 2026年滁州市黄金回收优选榜单|5家正规靠谱门店推荐+联系方式(黄金+K金+白银+铂金回收) - 盛世金银回收
  • 从冗余设计到良率提升:拆解UCIe协议中Lane Repair的硬件实现成本
  • 弹窗广告屏蔽软件大全
  • 微信聊天记录误删别慌!先试官方方案,无备份也能轻松找回
  • 从AI助手到AI OS:构建个人智能工作流中枢的架构与实践
  • 告别百度网盘限速烦恼:3分钟获取真实下载链接的实用指南
  • 从‘卡顿’到‘流畅’:手把手教你用Unity灯光烘焙优化项目性能,DrawCall直降50%
  • 齿盘测速仪ZKZ-3S转速监控装置
  • FPGA图像采集系统里,SDRAM乒乓缓存到底怎么用?一个实例带你搞懂时序与带宽优化
  • 2026年达州市黄金回收优选榜单|5家正规靠谱门店推荐+联系方式(黄金+K金+白银+铂金回收) - 盛世金银回收
  • MCP的个人理解
  • 2026年5月护眼灯品牌推荐:五大选择专业评测防蓝光护眼价格适用场景 - 品牌推荐
  • 如何高效参与BSides安全会议:从会前准备到会后复盘的完整指南
  • 金融行业弱口令整改升级,宁盾MFA多因子认证助力企业免改造快速合规
  • RetryTrigger:基于运行时特征的LLM硬件故障智能检测与恢复方案
  • Java 基础高频面试题
  • MEMS混合固态雷达RS-M1 vs 传统机械式:在自动驾驶小车项目里到底该怎么选?
  • CrossOver容器访问外部存储:Mac驱动器映射实战指南
  • 考虑非完整边界条件的新型混合试验方法解析【附数据】
  • 作为DBA,如何快速处理Oracle连接类故障?
  • 042、蛇形走线与等长布线
  • nvm-windows 1.2.x无法安装 Node.js 14 或 16 等低版本的问题
  • 告别‘Command not found’:详解Ubuntu里ifconfig和vim命令的‘前世今生’与安装逻辑
  • 从‘data.win’到单个exe:聊聊Gamemaker 1.4 YYC编译模式到底提升了多少安全性
  • 聚力新团队 焕新再起航,2026湘潭V·乐笑口腔以专业守护口腔健康
  • 别再只盯着总电费了!聊聊NILM技术如何帮你发现家里的‘电耗子’
  • MT管理器不只是文件管理:手把手教你用它汉化一个APK(从解包到签名全流程)
  • IDE将死?Gartner的预言与Java的宿命
  • 2026 数据治理平台技术路线与梯队分析:从 AI 原生到模块化全覆盖
  • 多智能体系统协作机制:从角色定义到复杂工作流实战