正文

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

发布于AI新闻资讯

发布时间 :2026-1-28 21:17

阅读 :1分钟

谷歌近日为其轻量级模型 Gemini3Flash 推出了一项名为“Agentic Vision（代理视觉）”的重磅功能。这一升级改变了以往 AI 视觉模型“看一眼就猜”的局限，让 AI 能够像人类专家一样，通过主动探索和深度推理来分析图像。

过去，AI 在面对信息密集的图片（如远处的路牌、复杂的电路图或微小的文字）时，往往因为只能一次性处理全局信息而导致细节丢失。而 Agentic Vision 引入了一种“思考、执行、观察”的循环机制。简单来说，当用户提出一个复杂视觉问题时，Gemini3会先制定分析计划，随后通过自动生成并执行 Python 代码，对图像进行局部剪裁、旋转或标注，最后再基于这些高清细节给出最终答案。

这种类似“调查员”的工作模式，使 Gemini 在处理高难度视觉任务时的准确性提升了5% 到10%。它不再仅仅是死板地识别像素，而是学会了根据需要“拉近镜头”去寻找证据。

目前，这项能力已率先在 Gemini AI Studio 和 Vertex AI 平台上线，开发者只需开启“代码执行”功能即可调用。谷歌表示，该功能未来也将通过“Thinking 模式”直接面向普通用户开放，让移动端的 AI 助手也能具备这种深度视觉推理能力。

		自动登录	找回密码
密码			立即注册

首页

今日事

出海头条

知识体系

跨境干货

更多分类

跨境技术栈

AI星球岛

AI星球岛
AI新站点
AI机器人

网站首页

AI工具

AI图像生成 AI平面设计 AI个人助手 AI视频生成 AI视频编辑 AI写作助手 AI代码助手 AI幻灯片 AI开发助手 AI音乐生成文本转生音 AI学习教育 AI设计工具 AI翻译工具 AI笔记助手

AI知识库

AI指南分类

视频制作法律服务创意设计教育培训知识管理职场办公音频制作

AI指南分类

生活服务自媒体AI入门指南编程开发营销推广

AI指南分类

AI指南分类

AI资讯

变现指南

AI分类

Skills社区

个人中心

我的收藏

我提交的

星球计划

热门频道推荐

AI技术社区

跨境电商社区

AI工具导航

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

如何用指令句式让豆包生成个性化学生评语库

如何用 AI工具生成论文选题

如何用豆包+即梦快速进行海报设计

如何用豆包进行海报设计

如何使用豆包生成图片

1000W

热门分类

服务支持

更多分类

跨境技术栈

AI知识库 AI指南分类 视频制作法律服务创意设计教育培训知识管理职场办公音频制作 AI指南分类 生活服务自媒体AI入门指南编程开发营销推广

AI指南分类

AI指南分类

个人中心

热门频道推荐

​​谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

如何用指令句式让豆包生成个性化学生评语库

如何用 AI工具生成论文选题

如何用豆包+即梦快速进行海报设计

如何用豆包进行海报设计

如何使用豆包生成图片

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

每日新知60秒

AI进化全知晓

扫码关注

AI火什么

每天看优设

扫码关注

每天官微五分钟

一年萌新变大神

扫码关注

1000W

热门分类

服务支持

AI知识库

AI指南分类

视频制作法律服务创意设计教育培训知识管理职场办公音频制作

AI指南分类

生活服务自媒体AI入门指南编程开发营销推广

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图 ...

微信扫码添加管理员招财

微信号：扫码添加