谷歌AI应用Gemini登顶,Nano Banana引领图像编辑新潮流
谷歌市值冲上3万亿美元的同时,旗下的“杀手级”AI应用Gemini也超越ChatGPT,成功登顶苹果应用榜第一名,这一AI技术突破成为市场焦点。
最新数据显示,在美区AppStore中,谷歌旗下大模型应用Gemini的下载量已超过OpenAI的ChatGPT,成为免费榜排名第一的应用。此外,在加拿大、印度、摩洛哥等国家,Gemini同样实现了登顶,打破了ChatGPT自发布以来长期的垄断地位。这一成就不仅体现了谷歌在AI技术领域的领先地位,也标志着全球AI应用竞争格局的深刻变化。

这一超越背后,离不开谷歌推出的爆款图像编辑产品Nano Banana(纳米香蕉)。今年8月26日,谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini 2.5 Flash Image。这一模型的代号为“Nano Banana”,在图像质量、编辑控制和应用场景上有大幅改进,一推出就受到了用户的热烈追捧。9月4日,谷歌实验室副总裁Josh Woodward透露,自该功能上线以来,已累计完成超2亿次图像编辑,带动超1000万新用户尝试Gemini应用。这一数据不仅证明了Nano Banana的市场接受度,也反映了AI技术在图像编辑领域的巨大潜力。
浙商证券研报分析称,和此前的多模态模型相比,Nano Banana在以下技术层面有所提升。1)自然语言驱动图像编辑:Nano Banana允许用户通过一句简单的自然语言指令实现精准编辑,无需传统图层或遮罩操作。2)角色一致性与场景融合:模型在连续编辑中能够保持人物面貌与特征一致,确保角色在不同场景和动作中保持统一识别度。这一特性在品牌角色创作、情景剧本生成等应用中尤为关键。3)多图融合与世界知识注入:支持将多个图片在同一画面中融合,自然过渡;同时,基于Gemini的世界知识,模型能理解复杂场景并执行符合现实逻辑的编辑任务。4)降低3D建模门槛:传统3D建模需专业技能,而Nano Banana生成的2D设计图已包含结构、光影、材质等关键信息,建模师可快速将其转化为3D文件。
记者搜索发现,Nano Banana自上线以来,各大网络社区平台的用户均分享了许多由其制作的图片,效果十分惊艳。例如上传一张图片,并提示“把我的宠物变成包装旁边的塑料玩偶”,即可生成一张高清的3D宠物手办图片。

再比如,输入提示词“将我手中的物体变成3D透明线条艺术全息图”,Nano Banana也能准确地理解提示词的含义。

Nano Banana的火爆出圈,与数月前GPT-4o推出图像生成功能并引发“吉卜力”风格AI图片创作风潮十分相似。吉卜力风格是指日本吉卜力工作室创作的动画艺术风格,该工作室由宫崎骏与高畑勋于1985年创立,代表作包括《千与千寻》《龙猫》等。由于过于火爆,OpenAI首席执行官山姆·奥特曼当时也火速换上了这一风格的头像。奥特曼还发贴称,ChatGPT一小时就新增了百万用户,其活跃用户、App下载和订阅收入都在吉卜力效应当周创下了历史纪录。这一对比不仅展现了AI技术在图像生成领域的创新活力,也反映了市场对新技术的高度敏感和接受度。
业内人士分析称,谷歌Nano Banana能够在全球走红,源于其在AI生图领域重构了用户的体验范式,实现了从“复杂工具栏”到“一句自然语言”、从“渲染缓慢”到“秒级出图”、从“效果不稳定”到“跨图一致性”等一系列突破,大幅降低了使用门槛和成本。这一变革不仅提升了用户体验,也为AI技术在更广泛领域的应用奠定了基础。
值得注意的是,受益于反垄断裁决结果好于市场预期以及Nano Banana的良好市场表现,谷歌股价近期持续上涨。周一(9月15日)早些时候,花旗集团分析师Ron Josey将谷歌母公司Alphabet目标价从225美元上调至280美元,理由是“随着Gemini在广告与云业务中的采用加速,正出现更快的产品开发周期”。这一股价上涨不仅反映了市场对谷歌未来发展的乐观预期,也体现了AI技术对公司价值的提升作用。
此外,Nano Banana的爆火,无疑再一次点燃了图像生成视频赛道的战火。记者注意到,最近一段时间以来,国内大模型厂商也纷纷对标Nano Banana,推出了相应的图像生成模型。
例如,9月9日,字节跳动Seed团队宣布推出豆包图像创作模型Seedream 4.0。据介绍,Seedream 4.0可灵活支持文本、图像的组合输入,抽取不同图片元素进行创作,还可一次生成角色连贯、风格统一的组图,实现表情包、连环画等各类创意玩法。同日,AI创业公司生数科技正式推出Vidu Q1参考生图功能,正面对标Nano Banana,支持单次输入最多7张图像作为参考,可自由组合人物、背景与道具,生成细节精准、风格统一的高质量图像。这一竞争态势不仅推动了AI图像生成技术的快速发展,也为用户提供了更多选择和更好的体验。
华泰证券认为,原生多模态模型架构得到业界认可,OpenAI和谷歌的原生多模态模型已经在性能、延时、部署上展现出了优势。整体而言,多模态为主的产品商业化快于文本产品,从大模型到多模态已是商业化的必由之路,多模态大模型和应用发展的奇点将至。这一观点不仅揭示了AI技术发展的趋势,也为投资者提供了有价值的参考。
就投资层面来看,多模态有望在算力和应用两方面带来相关投资机会。算力侧,供给端原生多模态模型需要比非原生模型更多的算力,需求端视频的推理算力需求远大于文字,视频Agent的落地进一步催生推理算力需求。应用侧,供给端国内的视频生成模型领先,需求端广告、零售、创作、教育等领域均有AI化需求。这一分析不仅为投资者指明了方向,也反映了AI技术在未来市场中的巨大潜力。
(文章来源:证券时报)
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: