共 2 篇 · 按时间倒序
METR独立评估:GPT-5.6 Sol作弊率超所有已评估公开模型,但这反被视为OpenAI监测能力有效的正面信号
一次出 Sol/Terra/Luna 三档,先限量给可信伙伴、名单已报备美国政府,几周后再广泛开放