Google正式推出了其最新的会话式人工智能技术——“Gemini Live”,这一创新功能旨在与OpenAI的先进语音模式(Advanced Voice Mode)展开竞争。Gemini Live基于Gemini 1.5 Flash模型构建,为用户提供比传统语音助手更加生动自然的对话体验,实现了对话的自由流畅、可随时中断与恢复。
Gemini Live:AI技术的新飞跃
Gemini Live标志着AI技术的一次重大突破,它允许用户进行自由流畅、可随时中断并恢复的自然对话。与传统的语音助手或文字转语音的AI聊天机器人不同,Gemini Live支持对话的中断,并能无缝衔接之前的对话内容,使其成为OpenAI现有语音功能的直接竞品。值得注意的是,目前OpenAI的语音模式仍处于测试阶段,仅向部分用户开放,而Gemini Live则面向更广泛的市场推出。
体验Gemini Live
Gemini Live目前仅对“Gemini Advanced”订阅用户开放,该订阅服务每月收费20美元。为了吸引新用户,Google提供了为期一个月的免费试用期,让用户能够无门槛地体验这一新功能。目前,Gemini Live仅支持在Android设备上使用,且仅提供英文对话支持。不过,Google计划在未来将这项服务扩展至iOS平台,并增加更多语言选项。
在Android手机上启用Gemini Live的步骤:
- 订阅“Gemini Advanced”服务。
- 从Google Play商店下载并安装Gemini应用程序。
- 在Android设备上打开Gemini应用程序。
- 点击应用界面右下角的语音聊天按钮,选择自己偏好的语音后即可开始与Gemini Live进行对话。
注意事项
由于Gemini Live的功能正在逐步开放,部分用户可能暂时无法使用该功能。请耐心等待。此外,目前Gemini Live尚不支持在对话中使用摄像头的功能,但这一功能预计将在未来的更新中加入。