新闻资讯
新闻资讯

谷歌AI图像生成工具更新:擅长“图文并茂”,近

记者|编辑董文舒|高宇蕾 11月20日晚,Google Nano Banana 2代工具更新上线。纳米香蕉(gemini 2.5 flash镜像)于8月首次发布,迅速引发巨大反响。它曾被誉为“最强大的图像生成引擎”。例如,Nano Banana为社交平台上流行的“Make Yourself a Figure”游戏提供图像生成服务。通过这次升级,谷歌似乎正在努力将这个工具从一个爱好工具进一步升级为一个效率和创造神器。据官方介绍,Nano Banana 2(Nano Banana Pro)提供了更高的图像质量、更一致的编辑、更强大的3D生成以及针对复杂任务更深入的推理能力。全网实测结果也支持了这种效果的描述。有网友在实际测试后表示:“我已经分不清AI和AI了纳米香蕉2发布后,《发电厂》也获得了包月会员并进行了测试。根据实测,该模型的新文本理解能力令人惊叹,这也将图像生成模型的能力扩展到生成PPT等带有图像和文本的解释性图像。很多情况下,纳米香蕉2生成单张图像一般消耗75点(作为对比,纳米香蕉2生成单张图像消耗50点); Nano Banana 2 比第一代模型稍慢,但仍然可以在内部控制半分钟,“用图像来解释为什么人们关注,用图像风格图像、图像和文字。”“电厂”先输入了这个命令,结果显示 Nano Banana 2 生成了以下图片,可以看出该模型不仅遵循绘画风格等基本指令,而且还独立生成了图像。有关近视成因的相关内容。在《2025年华北粮食生产反思,PPT风格图片报道图》的指导下,纳米香蕉2生成的图片标注了华北主要省份的地理位置、粮食生产模拟数据等信息。用户只需修改数据即可直接使用。为了进一步展示 Nano Banana2 相比第一代模型的性能提升,接下来,“发电厂”分别向两代模型输入指令,并比较生成的结果。根据提示语“用图解说三国历史故事,水墨风格”,模型输出为:(上-纳米蕉2代结果;下-纳米蕉2代结果)可以看出,在二代作品中,基本还原了魏王三国的相对地理位置,即什么王中王、武王,这比较符合事实,而且画的主体不存在错别字等问题。相比之下,第一代模型对历史故事的理解更加“扁平”,不反映地理位置,并且存在大量错别字。也就是说,在 Nano Banana 2 的帮助下,它现在已经具备了生成 PPT、相册等说明性图像内容的能力。此外,在生成真实内容方面,《纳米香蕉2》还实现了“以假乱真”的效果。在“街角拍摄的照片,一名女子正在走路并用手机进行视频通话,路边有行人”的提示语下,纳米香蕉2生成的图像不仅呈现了行人、视频通话等基本元素,还独立添加了道路、斑马线、街头咖啡店等元素。值得一提的是,咖啡厅的形式图片右侧的广告也“小心翼翼”地保持了中英文店名的一致性,即“咖啡-咖啡”,充满了现实生活的画面。面对漫画生成这样的创意作品,《纳米香蕉2》也表现出了合格的审美。以直接措辞“四格漫画展示理性逃离烈火的方法”为例。生成的图像几乎可以直接打印并用作消防海报。谈到图像生成产品的“阴暗面”,市场关注点普遍集中在图像版权滥用、Deepfake 创作等问题上。截至目前,市场尚未探索出明确的解决方案。这次《发电厂》也使用纳米香蕉2成功生成了各种“名人照片”。 。 Business Insight最新报告预测,到2030年,全球AI成像市场预计将增至917.45万美元,2023年至20年复合年增长率为17.4%30、nano蕉2在用户群体中引发的讨论将是谷歌在大市场多模态能力竞争中的一大优势。 11月18日晚,谷歌新一代Gemini 3完成更新。市场普遍认为Gemini 3的多模成像能力得到了大幅提升。目前尚不清楚Gemini 3是否与纳米香蕉2的底层能力有关。不过,纳米香蕉官方网页写道:“谷歌尚未正式公布Gemini与纳米香蕉之间的具体关系,(但)纳米香蕉的性能和能力表明它是建立在Gemini家族人工智能基础上的。特别声明:以上内容(包括照片或视频,如有)由自媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(含图片和视频(如有)由网易号用户上传和发布,网易号是一个社交媒体平台,仅提供信息存储服务。