品玩5月22日讯,据 The Verge 报道,xAI 正在为其 Grok 聊天机器人添加多模态输入。这意味着,用户很快就可以向 Grok 上传照片,并获得基于文本的回答。
xAI 在上个月的一篇博文中首次预告了这一消息,称 Grok-1.5V 将提供 "多个领域的多模态模型"。开发者文档的最新更新似乎显示了新模型的发布进展。
在开发者文档中,一个 Python 脚本示例演示了开发者如何使用 xAI 软件开发工具包库生成基于文本和图像的响应。该脚本读取图像文件,设置文本提示,然后使用 xAI SDK 生成响应。
