把一部电影扔给谷歌新 AI,它的反应让我有点发毛……

把一部电影扔给谷歌新 AI,它的反应让我有点发毛……

我们都知道现在的 AI 能读文章、能看图。但如果我直接扔给它一部 1 小时的电影视频,它能看懂吗?

谷歌刚发布的 Gemini 3.1 Pro 说它能行。

我不信邪,决定替大家试一试。这不仅是测 AI,更是测我的胆量。

01 "我看完了,凶手是那个穿红衣服的"

我找了一部情节比较碎、没有字幕的悬疑短片(为了不剧透就不说名字了),直接传到了 Gemini 的对话框里。

文件挺大,几百兆。上传花了一会儿,但 AI 处理的速度快得吓人。

我问它:"这一小时里发生了什么?"

几秒钟后,它甩给我一份几千字的"观影报告"。

这就有点吓人了。它不仅把剧情梗概说对了,甚至还捕捉到了很多细节:

"在第 12 分 30 秒,男主角拿起杯子的时候手抖了一下,这暗示他当时很紧张。" "背景里的那幅画在第 40 分钟变了,这可能是导演留下的伏笔。"

我背脊一凉。这不仅是"看懂",这简直是拿着显微镜在看啊!

以前的 AI 处理视频,是把视频切成几张图片看 PPT。Gemini 3.1 Pro 给我的感觉是,它真的把视频"流"进脑子里了。它能理解时间、因果、甚至角色的微表情。

02 但它也会"发疯"

虽然厉害,但也没到完美的程度。

当我问它一个特别刁钻的问题:"那个路人甲的手机屏保是什么"时,它开始胡说八道了。

它信誓旦旦地告诉我屏保是一只猫。我倒回去暂停了半天,发现那明明是一张风景照。

这就是 AI 目前的通病——幻觉。虽然谷歌宣称 Gemini 3.1 Pro 的幻觉率降了一半,到了 50%,但这也意味着:它每说两句话,可能就有一句在忽悠你。

所以,如果你想用它来做会议纪要、或者帮你省时间看烂片,它绝对是神器。但如果你想用它来做法庭证据分析,或者让它帮你找钱包掉哪了,还是省省吧。

03 脑洞时间:未来的 AI 会怎么看我们?

试想一下,如果未来的摄像头都连上了这种 AI。

它不需要睡觉,不需要休息,能同时盯着几千个屏幕。它能记住你每天几点出门、穿什么颜色的袜子、甚至能在你摔倒前的一秒钟判断出你重心不稳。

Gemini 3.1 Pro 展示的这种"长视频理解能力",既让人兴奋,又让人有点细思极恐。

它是最好的助手,也可能是最可怕的观察者。

不过现在嘛,我还是先用它把那一堆没时间看的网课视频给总结了吧。真香!

← 返回博客列表