博客

探索 AI 技术的前沿动态与深度洞察

Anthropic 指控 DeepSeek 月之暗面 MiniMax 蒸馏 Claude,马斯克怒斥贼喊捉贼

2 月 23 日,美国 AI 公司 Anthropic 发布报告,指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 三家中国 AI 公司利用大规模假账号对 Claude 模型实施知识蒸馏攻击。报告随即引发争议,马

2026-02-26AI科技新闻与事件
Anthropic 怒告 DeepSeek 月之暗面 MiniMax 蒸馏 Claude,马斯克一句话让全网炸锅

2 月 23 日,美国 AI 公司 Anthropic 发了一份报告,直接点名 DeepSeek、月之暗面和 MiniMax 三家中国公司,说它们对 Claude 模型搞了"工业级蒸馏攻击"。

2026-02-26AI科技新闻与事件
Anthropic 蒸馏指控技术分析:AI 模型 API 输出有没有知识产权?

Anthropic 2 月 23 日发了一份报告,指控 DeepSeek、月之暗面和 MiniMax 三家公司通过大规模调用 Claude API 来蒸馏模型能力。作为开发者,我更关心这件事背后的技术和法律问题,因为它直接影响我们日常使用

2026-02-26AI科技新闻与事件
Gemini 3.1 Pro 的三档思考等级,你不一定需要开 HIGH

Gemini 3.1 Pro 这次更新里有一个变化相对低调,但对开发者来说很实用:在原来 LOW 和 HIGH 两档之间加了 MEDIUM。这个改动说小不小,因为之前很多人要么完全关掉推理链用最快速度,要么开最高档等半天,MEDIUM 正好

2026-02-25模型使用技巧
Gemini 3.1 Pro thinking_level 选择指南:LOW、MEDIUM、HIGH 三档怎么选

Gemini 3.1 Pro 新增了一个 MEDIUM 思考等级(thinking_level 参数)。之前 Gemini 3 Pro 只有 LOW 和 HIGH 两个极端,要么不怎么想,要么想到死。Gemini 3.1 Pro 的 MED

2026-02-25模型使用技巧
把一部电影扔给谷歌新 AI,它的反应让我有点发毛……

我们都知道现在的 AI 能读文章、能看图。但如果我直接扔给它一部 1 小时的电影视频,它能看懂吗?

2026-02-25模型能力对比评测
扒完全网测评,Gemini 3.1 Pro 到底能不能打?

Google 又放大招了。

2026-02-25模型能力对比评测
从 MCP Atlas 到 BrowseComp,Gemini 3.1 Pro 的智能体任务成绩怎么读

Model Card 里有一批智能体(Agentic)相关的基准测试,这类测试是现在 AI 圈讨论最多的评测维度。和做一道数学题或者背知识点不同,智能体任务要求模型连续决策、调用工具、在失败时自己修正——更接近真实工作中的使用场景。我把 G

2026-02-25模型能力对比评测
Gemini 3.1 Pro 做 Agent 到底行不行,我把跑分一项项拆了

2026 年最热的 AI 话题不是"模型有多聪明",而是"模型能不能自己干活"。智能体(Agent)——让模型自主决策、调用工具、完成多步骤任务——是各家厂商押注最重的方向。

2026-02-25模型能力对比评测
Gemini 3.1 Pro 智能体能力拆解:MCP Atlas 和 BrowseComp 跑分背后的真相

2026 年最热的 AI 话题不是"模型有多聪明",而是"模型能不能自己干活"。智能体(Agent)——让模型自主决策、调用工具、完成多步骤任务——是各家厂商押注最重的方向。

2026-02-25模型能力对比评测
把一小时视频扔给 Gemini 3.1 Pro,它能做什么,不能做什么

"原生多模态"这个说法 Google 用了很久,但我一直觉得它有点抽象。Gemini 3.1 Pro 支持图片、音频、视频、PDF 同时输入,听起来很全面。不过具体的上限和限制藏在 Vertex AI 的技术文档里,把它们挖出来才能知道实际

2026-02-25模型能力对比评测
Gemini 3.1 Pro 传了一小时视频进去,结果有点意外

Google 反复说 Gemini 3.1 Pro 是"原生多模态"模型——图片、音频、视频、PDF 都能一起处理。这个说法从 Gemini 1.0 就开始用了,到 Gemini 3.1 Pro 已经是第四代了。

2026-02-25模型能力对比评测
Gemini 3.1 Pro 多模态能力实测:一小时视频扔进去能看懂多少

Google 反复说 Gemini 3.1 Pro 是"原生多模态"模型——图片、音频、视频、PDF 都能一起处理。这个说法从 Gemini 1.0 就开始用了,到 Gemini 3.1 Pro 已经是第四代了。

2026-02-25模型能力对比评测
百万 token 的上下文窗口,Gemini 3.1 Pro 真的解决了「越长越烂」的问题吗

Gemini 3.1 Pro 支持 100 万 token 的输入上下文。官方宣传说解决了"迷失在中间"(Lost in the Middle)问题,100 万 token 下检索准确率接近 100%。听起来很厉害,不过我把 Model C

2026-02-25模型能力对比评测
Gemini 3.1 Pro 百万 token 上下文实测:塞进去的信息它真的记得住吗

Gemini 3.1 Pro 支持 100 万 token 的上下文窗口,是目前公开模型中最大的。Google 在宣传里说 Gemini 3.1 Pro 解决了"迷失在中间"问题,检索准确率接近 100%。

2026-02-25模型能力对比评测
上一页16869707172100下一页