不开颅能读脑电,Meta 无创准确率近 8 倍于同类
- Meta 发布 Brain2Qwerty v2,佩戴 MEG(脑磁图)设备就能把大脑产生的磁信号实时解码成连贯句子,全程不需要任何手术。
- 字词准确率达 61%,约是其他无创脑机接口方法(8%)的 7.6 倍;最佳参与者达 78%,超半数句子只差一个词。
- 核心是两层叠加:端到端深度学习直接从原始脑磁信号解码,再叠加一个在神经数据上微调的大语言模型做语义纠错。
- 9 名参与者各录制约 10 小时打字任务,合计约 2.2 万句训练数据;准确率随数据量呈对数线性提升。
- v1/v2 训练代码完整开源,合作机构 BCBL 同步释放 v1 数据集,面向全球数百万因脑损伤丧失沟通能力的患者。
戴个头盔,脑电波能变成文字了
Meta AI 于 2026 年 6 月发布 Brain2Qwerty v2,这是目前性能最高的非侵入式脑机接口系统,能实时把 MEG(脑磁图)信号解码成连贯句子,并同步开源了 v1 与 v2 的完整训练代码。
戴上一个不开颅、不接触皮肤的头盔,系统就能把你打字时大脑产生的微弱磁信号实时还原成文字,整句的字词准确率做到了 61%。
同类不需要手术的无创方法,此前字词准确率只有 8%,几乎不可用。v2 的 61% 约是它的 7.6 倍。这是无创脑机接口第一次在整句实时解码上,逼近那些需要往大脑里植入电极的侵入式技术。
旧办法要么没效果,要么得开颅
为什么这个数字值得看,要先看清脑机接口长期卡在哪。把脑信号变成文字,过去只有两条路,各有一道过不去的坎:一条准但要动刀,一条安全但不准。
| 维度 | 侵入式(SEEG / ECoG) | 旧的无创方法 |
|---|---|---|
| 字词准确率 | 高,已能恢复沟通 | 仅 8%,基本不实用 |
| 是否需要手术 | 需开颅,把电极植入或贴在脑皮层 | 戴头盔即可,全程无创 |
| 信号质量 | 干净、信噪比高 | 嘈杂,细节损失多 |
| 可推广性 | 有手术风险,难大规模推广 | 安全易用,但准确率撑不起应用 |
侵入式里的立体定向脑电(SEEG)和皮层脑电(ECoG)已经证明:把神经信号喂给 AI 解码器,可以帮失语者重新沟通。问题是它要做手术,没法铺到千万级人群。安全和好用,过去不能兼得,这正是 v2 要解决的矛盾。
侵入式像把麦克风直接插进演唱者的嗓子里,录得清楚但要动刀;非侵入式像在演唱会场外录音,安全是安全,可隔着颅骨和头皮,噪声大、细节丢得多。难点就在:怎么用场外的嘈杂录音,听出场内唱的每个字。
两层创新:自学加语言模型补意思
v2 把准确率从 8% 拉到 61%,靠的是两层叠加的改动。一层让模型自己从原始信号里学规律,另一层用语言模型把猜出来的碎片补成完整句子。
旧方法是一条多步的手工流水线:先靠人工规则检测「这段磁场波动等于某个手指按了键」,再做特征工程,再喂给分类器,每一步都在替信号猜含义,误差一层层累加。v2 把这套全扔掉,让原始脑磁信号直接进入一个深度学习模型,从 2.2 万句、9 个人的数据里自己学出从信号到文字的映射,中间不再人工插手。
从噪声里挤出来的解码结果,往往是一串残缺的碎片文字。v2 再叠一个在神经数据上微调过的大语言模型,把上下文拉进来,根据语义把碎片补全、纠错,让嘈杂的脑信号和通顺的句子接上。
在地铁里,对方一句话你只听清了一半,但凭语境和经验,你能把整句猜出来。这一层大语言模型做的就是这件事:原始解码给出半句模糊的话,它用语义把完整的那句还原出来。
旧流水线 vs 新模型,点一下看结构差异
约七个手工环节首尾相接,每一道接缝都在替信号猜含义,误差逐级累加。
原始信号直通一个模型,再由语言模型补意思,中间不再有人工流水线。
旧方法像教学生解方程:先讲公式,再带步骤,再套题型,一步步喂。端到端是把 10 万道题连答案一起扔给它,让它自己悟出规律,中间不告诉它该怎么解。
关于 AI 调参的一个细节
Meta 还用 AI 智能体去探索解码流程的优化方向,但最终的训练配置由工程师人工挑选确定,不是全自动产出。
信号怎么来:戴头盔打字 10 小时
模型再聪明,也要有数据喂。v2 的数据来自一个朴素的范式:让人真的去打字,同时用 MEG 记录每次按键时大脑磁场的变化。
注意一个关键点:参与者是真实打字,不是「想象说话」。打字这个动作带来的神经信号更稳定、更可靠,按键时刻也能和文字精确对齐,配对出来的训练样本质量更高。
MEG 是一种头盔式传感器,用超灵敏的磁力计去捕捉神经元放电时产生的极微弱磁场变化,比普通脑电帽(EEG)精度更高。它像给大脑装了一组磁场麦克风阵列,录的不是声音,而是神经元放电的「电磁嗡嗡声」。
61%、78%、一词误差,数字有多实
把三组数字摆在一起,就能看清这次跃升的幅度,以及 61% 在实际使用里到底是什么体验。
61% 意味着一句 10 个词的话,平均能对 6 个。到了最佳参与者的 78%,体验已经相当可用:超过半数的句子,整句只差一个词,或者完全正确,一句 10 个词只错 1 个。
指解码出的句子里,预测正确的单词占全部单词的比例。61% 就是平均每 10 个词对 6 个,78% 是对将近 8 个。
Meta 还发现一条规律:解码准确率随数据量呈对数线性增长,数据每翻一倍,准确率就稳定往上抬一截。这意味着光靠系统性地扩充数据,剩下与侵入式手术方案的差距,就有望继续收窄。
谁能用上,距实用还差多远
这项研究最直接的指向,是那些「想说但说不出」的人,以及它目前还没跨过的门槛。
- 直接受益群体:因中风、ALS(肌萎缩侧索硬化)等脑损伤失去语言能力、但运动皮层仍完整的患者,全球有数百万人。无创意味着他们无需承担开颅手术的风险就有望使用。
- 当前限制:系统目前需要为每个人定制训练,要先录约 10 小时的个人数据,还做不到拿来即用的通用化。
- 推进路径:开源训练代码、BCBL 数据集,加上 Meta 通过 Digital Brain Project 设立的 500 万美元基金,目标是用更大规模的开放数据,把系统推向通用。
开源了什么,怎么找
为了让更多团队能直接接手往下做,Meta 这次把训练代码和数据集一起放了出来。
- 训练代码:Brain2Qwerty v1 与 v2 的完整训练代码均已开源。
- 数据集:合作机构 BCBL(巴斯克认知、脑与语言研究中心)释放了 v1 数据集,托管在 HuggingFace(仓库 bcbl190626/SpanishBCBL)。
背景:Meta 的开放脑科学基础模型体系
这项工作属于 Meta 构建开放脑基础模型的一部分,配套还有:Tribev2,负责感知编码;NeuralSet,大规模处理脑数据;NeuralBench,系统化评估模型。Meta 称希望以开放方式协作,比各自闭门研究更快地识别、诊断和治疗神经系统疾病。
Brain2Qwerty v2 是目前性能最高的端到端系统,能从非侵入式脑记录中实时解码整句,正在接近此前只有需要脑外科手术的技术才能达到的准确率水平。 Meta AI Blog · From Brain Waves to Words(2026 年 6 月)