正文

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

发布于AI新闻资讯

发布时间 :2026-1-28 21:17

阅读 :1分钟

谷歌近日为其轻量级模型 Gemini3Flash 推出了一项名为“Agentic Vision（代理视觉）”的重磅功能。这一升级改变了以往 AI 视觉模型“看一眼就猜”的局限，让 AI 能够像人类专家一样，通过主动探索和深度推理来分析图像。

过去，AI 在面对信息密集的图片（如远处的路牌、复杂的电路图或微小的文字）时，往往因为只能一次性处理全局信息而导致细节丢失。而 Agentic Vision 引入了一种“思考、执行、观察”的循环机制。简单来说，当用户提出一个复杂视觉问题时，Gemini3会先制定分析计划，随后通过自动生成并执行 Python 代码，对图像进行局部剪裁、旋转或标注，最后再基于这些高清细节给出最终答案。

这种类似“调查员”的工作模式，使 Gemini 在处理高难度视觉任务时的准确性提升了5% 到10%。它不再仅仅是死板地识别像素，而是学会了根据需要“拉近镜头”去寻找证据。

目前，这项能力已率先在 Gemini AI Studio 和 Vertex AI 平台上线，开发者只需开启“代码执行”功能即可调用。谷歌表示，该功能未来也将通过“Thinking 模式”直接面向普通用户开放，让移动端的 AI 助手也能具备这种深度视觉推理能力。

		自动登录	找回密码
密码			立即注册

首页

今日事

出海头条

知识体系

跨境干货

更多分类

跨境技术栈

AI星球岛

AI星球岛
AI新站点
AI机器人

网站首页

AI工具集

AI设计工具 AI写作工具 AI视频工具 AI图形处理 AI绘画工具 AI智能助手 AI编程开发 AI办公工具 AI对话聊天 AI工具箱 AI音频工具 AI创意工具 AI营销工具 AI翻译工具 AI学习平台

AI指南

AI指南分类

视频制作法律服务创意设计教育培训知识管理职场办公音频制作

AI指南分类

生活服务自媒体AI入门指南编程开发营销推广

AI指南分类

AI指南分类

AI资讯

AI变现

AI分类

关于我们

个人中心

我的收藏

我提交的

火星计划

热门频道推荐

蛙知AI测评

AIZ123导航

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

如何从 DeepSeek 获得提示词提升文章写作技巧

如何从豆包获得提示词进行高效 AI 对话

如何用 DeepSeek 为电商主播设计直播话术

如何用 DeepSeek 生成爆款标题

AI萌宠“刀盾”短视频爆火变现案例：两集播放破千万，打造治愈系

常见问题

如何登录可灵网站？

怎样明确视频主题与需求？

如何预览视频？

怎样导出与分享动画短片？

1000W

热门分类

服务支持

更多分类

跨境技术栈

AI指南 AI指南分类 视频制作法律服务创意设计教育培训知识管理职场办公音频制作 AI指南分类 生活服务自媒体AI入门指南编程开发营销推广

AI指南分类

AI指南分类

个人中心

热门频道推荐

​​谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

如何从 DeepSeek 获得提示词提升文章写作技巧

如何从豆包获得提示词进行高效 AI 对话

如何用 DeepSeek 为电商主播设计直播话术

如何用 DeepSeek 生成爆款标题

AI萌宠“刀盾”短视频爆火变现案例：两集播放破千万，打造治愈系

常见问题

如何登录可灵网站？

怎样明确视频主题与需求？

如何预览视频？

怎样导出与分享动画短片？

AI星球岛官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

每日新知60秒

AI进化全知晓

扫码关注

AI火什么

每天看AI星球岛

扫码关注

每天官微五分钟

一年萌新变大神

扫码关注

1000W

热门分类

服务支持

AI指南

AI指南分类

视频制作法律服务创意设计教育培训知识管理职场办公音频制作

AI指南分类

生活服务自媒体AI入门指南编程开发营销推广

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

微信扫码添加管理员招财

微信号：扫码添加