在科技界的旋风般的两天里,两场主要会议成为焦点:OpenAI 推出突破性的 GPT-4o 和谷歌在 2024 年 I/O 开发者大会上的强劲反应,给竞争对手带来了巨大压力。
北京时间5月15日凌晨,谷歌的报复行动迅速而全面,他们宣布了十几项产品更新。其中的亮点包括轻量级的 Gemini 1.5 Flash 模型、AI 通用智能项目 Astra、强大的 AI 搜索、视频生成模型 Veo 和第六代 TPU Trillium,Gemini 1.5 Pro 的上下文窗口从 100 万个代币扩展到 200 万个代币。
在两个小时的主题演讲中,“AI”被提及了惊人的121次,同时在谷歌官网上发布了11篇与AI相关的博文。这似乎是谷歌的不懈努力。5 月 14 日,谷歌股价 (GOOGL) 上涨 0.71%,达到每股 170.34 美元,尽管会后下跌了 0.27%。
在会议开始前,猎豹移动董事长兼首席执行官傅生表示,虽然OpenAI的活动令人印象深刻,但谷歌在审查后没有理由担心。他表示,OpenAI对工程能力的关注旨在增强现有技术,使其更加高效、集成和用户友好,这是谷歌等大公司可以实现的壮举。
谷歌毫不气馁,推出了类似的视觉识别和语音交互产品,例如 Project Astra,被视为对 GPT-4o 的直接挑战。
“我们一直致力于开发能够协助日常生活的通用人工智能代理。”
Google DeepMind首席执行官Demis Hassabis表示,这是他在I/O大会上首次亮相。他将 Astra 描述为一种先进的视觉和对话智能代理,这是谷歌在构建未来 AI 助手方面迈出的重要一步。
Astra 项目展示了多模态理解和实时对话能力。在谷歌的演示中,这个人工智能助手可以帮助理解屏幕上的代码,通过摄像头定位眼镜等物品,并掌握“薛定谔的猫”等概念。
然而,Hassabis承认,实现类似于人类交互的实时对话能力是一项艰巨的挑战,并指出人工智能需要理解复杂、不断变化的环境,并积极主动地适应个性化需求。
与 GPT-4o 相比,Astra 似乎表现出更长的响应时间,谷歌的演示没有解决助手是否可以在讲话过程中被打断或像 GPT-4o 那样有效地传达类似人类的情感。
OpenAI的另一个对手是谷歌的视频生成模型Veo。2 月初,OpenAI 的 Sora 视频生成模型在网上引发了热烈的讨论,使谷歌的 Gemini 1.5 Pro 公告黯然失色。
谷歌的Veo与Sora竞争,声称是“最强大的视频生成模型”,能够制作各种电影风格的高质量1080p分辨率视频。尽管Veo的功能令人印象深刻,但一些人指出,尽管谷歌在其博客上展示了精致的例子,但它的细节不如Sora那么清晰。
除了视频生成之外,谷歌还更新了其图像生成模型 Imagen 3,强调减少视觉伪影。他们还推出了 Music AI Sandbox,这是一套用于音乐创作和声音转换的 AI 工具。
改革搜索
会后,英伟达高级科学家Jim Fan赞扬了谷歌将人工智能整合到搜索中的努力,认为这是一项重大举措。他强调了谷歌的分销能力,暗示Gemini不需要成为全球使用最广泛的最佳模型。
谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)吹捧了Gemini对谷歌搜索的变革性影响,并强调了该公司在其核心产品方面的持续创新。他推出了 AI Overview,允许用户在搜索栏中输入问题并接收 AI 汇总的答案,甚至可以处理复杂的查询,例如寻找波士顿最好的瑜伽或普拉提工作室。
利用 Gemini 的多模态功能,Google 搜索推出了“Circle to Search”等功能,支持根据图像的选定部分进行搜索。“询问照片”是另一项新功能,有助于从个人画廊轻松检索照片和视频。
谷歌展示了用户如何实际利用这些功能,例如从一组照片中快速识别汽车的车牌。
谷歌还引入了视频搜索功能,使用户能够通过录制视频查询来解决机械问题,从而节省描述问题的时间和精力。AI 概述功能最初将在美国推出,并计划在全球范围内扩展。
谷歌庞大的产品生态系统和用户群为部署人工智能应用程序提供了优势。Pichai 指出,超过 150 万开发人员使用各种包含 Gemini 模型的 Google 工具,为全球超过 20 亿用户提供服务,包括通过 Gemini Nano 集成到 Android 设备中。
Gemini 的旅程随着 Gemini 1.5 Flash 的发布而继续,这是一款针对低延迟和具有成本效益的部署进行了优化的轻量级模型,可满足特定的应用程序需求。
此外,谷歌还推出了第六代 TPU Trillium,其每芯片的计算性能是其前代产品的 4.7 倍,满足了对机器学习计算能力激增的需求。
尽管谷歌在人工智能方面取得了重大进展,但皮查伊承认该公司在人工智能平台转型方面处于早期阶段,强调了它为创作者、开发者、初创公司和个人带来的巨大机会,强调了谷歌双子座时代在推动这些机会方面的重要性。