计算机行业周观察:谷歌I/O大会跟踪 重点关注大模型多模态能力提升

证券之星 2025-05-26 07:39:31
股市要闻 2025-05-26 07:39:31 阅读

  5 月21 日,谷歌发布以人工智能为核心的一系列重大更新,其中AI 搜索引擎和多模态大模型亮眼,国内昆仑万维于5 月22 日发布天工超级智能体,聚焦于生产力场景。大模型多模态能力持续提升,建议关注。

      搜索侧:AI 搜索引擎全面上线,发布Shopping Graph 2.0 升级AI 搜索购物推荐体验。谷歌搜索推出AI Mode 模式,以类似聊天机器人的方式回答用户的搜索查询,而不是显示传统的蓝色链接列表。据谷歌,AI Mode 的核心竞争力是其多模态搜索技术,通过整合文本、图片、语音与视频输入,使结果页摒弃曾经那些标准的网页链接展示形式,利用 “先进的推理、思考和多模态能力” 来构建问题的答案。未来AI Mode 还将上线Deep Search 模式、SearchLive 功能以及Project Mariner 智能体等多项新功能。此外,谷歌推出ShoppingGraph 2.0,包含种草、推荐、下单三个环节:在种草上,新图谱拥有500 亿商品节点,每小时刷新20 亿条价格与库存信息;在购物环节,能帮用户进行实时比价,结合用户的个人爱好和品味推荐最优选择,另外还有AI 试衣;在买单环节,用户通过Agentic Checkout 设定心仪价格,谷歌在后台监控降价并可“一键代购”。

      大模型侧:更新LLM 语言大模型,发布最新视频生成模型Veo3、图像生成模型Imagen4。基础大语言模型方面,推出Gemini 2.5 Flash 升级版,推理效率提升22%,新增原声功能;Gemini 2.5 Pro 新增Deep Think 模式,通过生成多条推理链并互相交叉核验的方式提高推理结果准确性。多模态大模型方面,发布最新视频生成模型Veo3,首次实现原生音画同步生成,无论是城市街道的车流声、公园中的鸟鸣,甚至是角色对话,均可通过文本提示生成。用户只需用提示讲述一个短故事,模型就能生成栩栩如生的视频片段。新一代图像生成模型Imagen4 速度比Imagen3 快10 倍,支持多种纵横比与最高2K 分辨率,文字拼写与排版能力显著提升,生成的图像在精细细节上表现更出色,同时擅长写实与抽象风格。

      终端侧,发布基于Android XR 的智能眼镜。据雷科技,谷歌与三星联手开发的安卓XR 平台去年项目公布后,已获得了数百家软件开发商的支持。此次大会上,谷歌基于该平台的两款XR 设备——三星的Project Moohan 以及Xreal的Project Aura 正式亮相。谷歌表示,与AI 深度融合的安卓XR 平台,支持第一人称视角智能辅助和无接触辅助功能,用户可通过自然语言与设备交互,完成信息查询、日程管理、实时导航等操作。例如在XR 设备之上,用户可以与Gemini 谈论看到的一切现实世界或屏幕显示的内容。Google 在主题演讲中宣布将与三星、Gentle Monster 和Warby Parker 合作,打造人们真正想戴的智能眼镜。

      投资建议:科技巨头全力押注AI,人工智能产业持续迭代发展,建议关注云、算力芯片、应用等关键产业链环节投资机会。云计算厂商有望迎来一轮量价齐升的盈利周期,公有云领域重视龙头产业链,阿里系关注数据港、润建股份(通信)、奥飞数据、万国数据、世纪互联,华为系关注神州数码、拓维信息,私有云&混合云重点推荐深信服、品高股份。资本开支上行周期拉动芯片和服务器需求提升,关注海光信息、中科曙光、浪潮信息、寒武纪。小参数模型高能力开源模型利好私有化部署需求,关注星环科技、智微智能等。

      AI 应用推荐卡位优质场景的细分龙头,关注金山办公、用友网络、金蝶国际、泛微网络、卫宁健康、讯飞医疗科技、科大讯飞、同花顺等。

      风险提示:贸易摩擦持续升级;供应链风险;行业竞争加剧风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点