新智元报道
编辑:倾倾
【新智元导读】Nano Banana Pro要登场了?传言说,它能自己排版、搭UI,甚至一键生成整张设计稿。如果真是这样,那设计师的得力助手或许不再是PS,而是Nano Banana Pro了。
谷歌的下一张王牌,终于藏不住了!
就在刚刚,谷歌DeepMind CEO Demis Hassabis,亲手置顶了一条「预告」!
更有意思的是,这个传说中的Nano Banana Pro,昨晚就在社交媒体与开发者社区出现踪迹。
多方爆料称,它疑似采用了Gemini 3.0 Pro级的多模态推理内核,分辨率与文字渲染被明显拉高,界面生成更有「结构感」,还有传闻说首次出现系统级UI工作流的雏形。
按TestingCatalog的说法,发布时间可能在11月中下旬。
入口没开放、功能没官宣,但讨论已经把社区搅得热气腾腾。
谷歌到底在憋什么大招?
全面升级:速度、4K、清晰度一起拉满
关于Nano Banana Pro,出现频率最高的词,是「升级幅度超乎想象」。
Pro不是NB1和NB2的简单叠加,而是基于 Gemini 3.0 Pro级多模态引擎,彻底重做了图像生成逻辑。
在如此专业的支撑下,Nano Banana Pro的定位也从「创意玩具」上升到了「专业制作级工具」。
最直观的变化,是速度。
爆料者在内测版里跑过一条复杂场景,生成时间压到十几秒以内。
这种时长放在NB1时代根本无法想象,而现在它几乎能跟摄影棚级构图、产品渲染、广告光效同步输出。
画质也迎来一次真正的飞跃。
据爆料Nano Banana Pro支持高达4K的分辨率,16:9至9:16比例的尺寸,方便用户根据需求调节。
作品具备真实相机才能捕捉的质感,金属反射、皮肤纹理、光影衔接,不再是「AI风格」,而是「工作流可用级别」。
输入正确完整的prompt后,Nano Banana Pro生成的图不论是从颜色搭配,文字排版等各方面看,均达到专业水平。
Prompt:Create a wide infographic titled "How Solar Power Works" with a clean flat design. Include: a sun icon, solar panel diagram, arrows showing energy flow to a house and battery, four numbered steps with short captions, and a comparison bar chart of "Day vs Night usage".
输入以上prompt,就能得到这样一张堪称完美的「太阳能发电原理图」。
概念工作流程它也行。上传二维草图,就能渲染出超级逼真的三维产品图像,材质和光照都能表现出来。
Prompt:A clean, 3D isometric visual explainer of a "Smart Home Ecosystem." Show a cross-section of a house with icons connecting different devices: a thermostat, a smart fridge, and security cameras. Use a pastel color palette with soft lighting.
更令人惊喜的是,Nano Banana Pro支持同时上传6张图片,并且可以进行「风格迁移」。
你甚至能在上传的图片上涂鸦、圈选或添加注释,以便Gemini根据指示行动。
Prompt:A cinematic, wide-angle view of Istanbul during the golden hour. In the foreground, intricate Ottoman tile patterns on a balcony railing are in sharp focus. In the background, the Hagia Sophia and the Blue Mosque dominate the skyline across the Bosporus, silhouetted against a warm, hazy orange and purple sunset. Seagulls are flying in the distance. Photorealistic, 8k resolution.
Nano Banana Pro生成的伊斯坦布尔日落时分的全景电影画面
Nano Banana Pro的目标很明确。它不只生成图像,还要试图理解图像,力求把每一次渲染、每一处细节推进到「可用于严肃创作」的等级。
懂界面的AI:从「像UI」到「会搭界面」
很多测试者发现,Nano Banana Pro好像比以前更有逻辑、更像人了?
这不是幻觉,而是谷歌有意为之。
从目前的公开爆料来看,Pro版在UI方向的变化很一致:
界面不再是「像UI的图片」,更像是被模型按结构拆解并重新组织之后的结果。
标题区、功能区、按钮区、背景信息层,都开始呈现出合理的界面关系,而不是NB1那种风格化堆叠。
提示词:生成一张Windows 11操作系统的桌面截图,截图中已打开Google Chrome浏览器,并在浏览器窗口内展示YouTube网站上Mr. Beast的视频缩略图。
提示词:以赛马娘的东海帝皇为主角的大型游戏实机画面
底层推理更强,模型自然能把界面当成「信息结构」,而不是简单地画图。
与此同时,文字渲染也出现大幅改善。
按钮字体不再漂移、标题不再糊成块、英文字符的笔画明显更稳。
提示词:手账风格,出一个冰激凌制作步骤教程图,步骤说明要中文。
这些提升与UI生成是高度相关。如果没有更高分辨率、更稳的排版,界面就不可能看起来像真的。
Pro版本第一次让界面图呈现出一种「可作为设计参考」的质感。
它不是生成一个长得像软件的图,而是生成一个你能一眼看懂的界面。
对于任何图像模型来说,这已经不止是画风升级,而是能力层级被整体往上推了一格。
创作力爆表:插画、动漫、产品图一键到位
如果说NB1让图像生成进入了全民创作时代,那么Nano Banana Pro则更进一步:它开始进入专业领域。
在NB1时代,虽然单张图看起来不错,但复杂光效——比如逆光、棚拍布光、玻璃反射生成不稳定。
Pro的推理底层更强,使得它在渲染高动态范围光效时,更像是一个能理解场景逻辑的系统。
提示词:生成一张巨龙眼睛的特写照,写实。
尤其是在广告图里,金属质感、纹理细节、阴影衔接,都比NB1更接近真实布光。
Prompt :A professional studio product shot of a futuristic, transparent smart-watch resting on a piece of dark slate. The watch interface is glowing holographic green. Soft dramatic lighting, 8k resolution, macro photography style, shallow depth of field.
传统的NB1可以保持人物五官相似,但在不同角度、不同姿势,往往容易跑偏。
Pro则更关注「更强的角色保持与风格一致性」。在动漫、二次元、真人写实三种风格之间,人物的做工会更稳定,不再出现换角度就换人的情况。
提示词:请生成蜡笔小新和小白在《清明上河图》的一角卖大福的场景。
这对漫画分镜、角色设定、虚拟偶像创作者来说,是一种史诗级别的增强。
提示词1:这是一张动画跨界截图,画面背景是蟹堡王餐厅,瑞克和莫蒂正坐在桌旁
提示词2:海绵宝宝走了过来,来到他们的桌前。
提示词3:显然感到厌烦的瑞克,随即将一个传送门射开在了海绵宝宝的脚下。
显然,Nano Banana Pro正在逼近真正的专业创作。
从插画到动漫,再到商业级产品图,每一个方向都在悄悄被Pro 推到可用的边界上。
而这,也许才是Pro真正的含义。
如何抢先体验Nano Banana Pro?
那么,如何才能体验如此神奇的Nano Banana Pro呢?只需四步:
第一步,浏览器进入该网址:discord.gg/UuYfh5KR,加入该频道。
第二步,在频道中找到「lyra-chat」分区,输入「/new」建立一个子区。当然,你也可以加入别人建立的子区。
第三步,进行步骤1后,直接进行步骤4。
第四步,在子区中,点击Change Model切换模型,在新的对话中选择2或者3。
这样就能先人一步体验到强大的Nano Banana Pro了!
种种证据显示,Nano Banana Pro即将隆重登场。
谷歌没说一句话,但空气里已经有了山雨欲来的气息。
如果这些爆料最终成真,Pro不会是NB的常规升级,而是图像模型迈进「专业级时代」的第一步。
接下来,只能等谷歌的官宣了。
参考资料:
https://www.geeky-gadgets.com/google-gemini-3-0-pro-leaks/?utm_source
秒追ASI