共 5 篇 · 按时间倒序
两个随手发的命令行更新,其实是战略表态:全行业涌向「对话式精准改图」,它偏把「撞见意外风格」做成工业级。
真赌注不在手机编程,而在把开发者改造成 AI 的代码审查官,顺手占住你下班那块屏。
Opus 4、Sonnet 4 在 SWE-bench 分别拿 72.5% 和 72.7%;定价沿用上代,Sonnet 4 免费用户也能用。
官方画的饼有多大、能信几分?我把关键 demo 逐帧扒了一遍,挑出真值得看的三处。
厂商说得天花乱坠,我冷静用了三天,把好用和不好用都摆出来。