最近 DeepSeek v4 在 GitHub 和 X 上吵翻了天。大家都在吹它 SWE-Bench 83.7% 的逆天分数,但我盯着 GitHub Issue #1088 里的那份“诊断报告”,背后却是一阵发凉。
3 月 3 日,Google 把 Gemini 3.1 Flash-Lite 上线到了 Gemini API 和 Vertex AI(预览版)。没有太多铺垫,但圈子里讨论很集中:速度是真的快;而“Lite”这两个字,这次有点误导人。
微软最近发布的 Copilot Cowork 在技术圈引起了不小的轰动。这不仅仅是因为它是一个新的办公助手,更重要的是,它的核心驱动模型选择了 Anthropic 的 Claude,而不是自家的 OpenAI GPT 系列。
这两天在 X(推特)和 GitHub 上刷了一圈,发现大家都在讨论 Google 刚刚发布的 Gemini Embedding 2。
深夜刷 GitHub,偶然看到 Google 悄悄发布了 Gemini Embedding 2。
Claude 终于把 100 万 token 的口子彻底放开了。
Anthropic 刚在 X 上发了条推,Claude 现在支持 100万 Token(1M Context Window) 上下文了。这消息在圈子里传得挺快,GitHub 上相关讨论也不少。
就在刚刚,Anthropic 官方在 X(原 Twitter)上正式宣布:Claude Opus 4.6 和 Sonnet 4.6 的 100万 Token(1M Context Window)上下文窗口正式 GA(Generally Av
昨晚 OpenAI 悄无声息地扔出了 GPT-5.4 mini 和 nano。没有预热,直接就上线了。
昨晚,OpenAI 毫无预兆地上线了两个小模型:GPT-5.4 mini 和 nano。
Anthropic 刚把 Claude Opus 4.7 推出来,网上的反应就很典型地分成了两拨。
我半夜刷着 X(原推特),看这帮大佬放出的测试图,感觉这行真是不给人喘息的机会。
ChatGPT Images 2.0(GPT Image-2)发布不到 24 小时,我的信息流已经被各种生成的图片刷屏了。
GPT-5.5 发布之后,很多开发者第一反应是两句:“又贵了”和“好像真强了”。如果只看这两个结论,其实不够。
GPT-5.5 这次出来,我最明显的感受不是“它又强了一点”,而是很多人突然不再把它当成一个聊天模型看了。
GPT-5.5 发布后,很多讨论都集中在“它代码更强了”这件事上。但如果只把它理解成一个更会写代码的模型,我觉得有点看窄了。
GPT-5.5 发布之后,关于它的讨论很快分成了两条线。
GPT-5.5 发布之后,围绕它的讨论很快升温。外界最关心的,并不是它是不是又刷新了某个极限分数,而是另一个更实际的问题:GPT-5.5 到底强在哪,为什么很多人会觉得它更接近真正可用的 AI 工作系统?
如果只用一句话概括,我的判断是:GPT-5.5 引发讨论,不是因为它又把“大模型有多聪明”这件事往前推了一点,而是因为它把“模型能不能直接接工作”这件事,往前推了一步。
GPT-5.5 发布那天,我看了不少资料,也翻了很多首批测试反馈。看完以后,我脑子里一直绕着一个感觉:这次好像不是模型又涨了几分,而是它开始更像“同事”了。