智能眼镜仍然是一个尚未完全成熟的未来概念,但生成式人工智能的到来显著提升了这些设备的能力。Meta 的 Ray-Ban 智能眼镜被许多人视为当今最好的选择之一,而现在 Solos AirGo Vision 正在为其带来竞争,这款眼镜还集成了 Google Gemini 支持。
尽管 Solos 不是一个大名鼎鼎的品牌,但他们已经推出了一些价格合理的智能眼镜。该公司本周宣布了其最新一代产品 Solos AirGo Vision,这款眼镜看起来是一个坚实的多模态 AI 智能眼镜选择。
与 Meta 的 Ray-Ban 型号类似,AirGo Vision 为产品添加了一个摄像头,而之前的版本只有扬声器。摄像头安装在镜框的右侧,可以与语音提示一起使用,利用 AI 模型——特别是 OpenAI 的 GPT-4o——通过摄像头捕捉到的信息来回答问题。Solos 在新闻稿中解释道:AirGo Vision 搭载 AI 技术,能够根据视觉输入提供实时信息,识别人物和物体(“我在看什么?”),或导航并讲述方向或地标(“给我指路到埃菲尔铁塔”)。用户无需用手操作就可以拍照,这在烹饪、家居装修、教育和学习,甚至购物等活动中尤其方便,可以记录视觉进度和后续步骤(“我在看什么,它多少钱?别的地方有更好的价格吗?”)。AI 还可以总结这些活动,以增强组织和协助能力。除了 GPT-4o,AirGo Vision 还可以使用 Anthropic 的 Claude 以及 Google Gemini。然而,目前尚不清楚这两种选项是否能够像 GPT-4o 一样利用摄像头。
摄像头还可以用于捕捉常规图像
除了 AI 功能,这款眼镜还配备了扬声器和一个 LED 灯,可以传递来自手机的通知。Solos 指出,这在安静和嘈杂的环境中都非常有用,同时也是一个有助于无障碍使用的功能。
硬件的另一个值得注意的方面是,Solos 设计了一个可更换镜框系统。这使用户在某些场合可以去掉摄像头,或者更轻松地在透明镜片和太阳镜之间切换。额外的镜框起价为 89 美元。Solos 将从 7 月开始销售 AirGo Vision,起价为 249 美元,但这是不带摄像头的基础型号(只有扬声器和 LED 灯),因此完整配置的价格可能会高出不少。如果你想要一副能够进行免提视频录制并配备 AI 语音助手的眼镜,目前选择不多,而 Ray-Ban Meta 智能眼镜是明显的领导者。
但 Solos 表示,其目前仅具备音频功能的智能眼镜将在今年晚些时候推出一个带摄像头的版本,并搭载 OpenAI 的新 GPT-4o AI 模型,让摄像头识别物体并回答关于你所见问题。Solos AirGo Vision 还采用了与其他 Solos 眼镜相同的可更换镜框系统,因此如果你去的地方不适合使用摄像头,或者你只是想要不同的外观或一些太阳镜,可以更换镜框。额外的镜框价格在 89 到 129 美元之间。
该公司表示,AirGo Vision 还将配备通知 LED 灯,用于提醒你来电或电子邮件,并声称这些眼镜还可以与 Google Gemini 和 Anthropic 的 Claude AI 模型集成。与 Meta 的 Ray-Ban 智能眼镜类似,AirGo Vision 会通过音频回答问题——除了 LED 灯外,没有其他显示屏。Ray-Ban智能眼镜目前的起售价依然是 299 美元。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/131124.html
OpenAI昨日发布了全新的小型AI模型GPT-4o mini,这一模型在性能和成本效益方面都取得了重大突破,Sam Altman惊呼:通往智能的成本,已变得如此低廉。性能与成本的完美平衡GPT-4o mini在性能上显著超越了其前身GPT-3.5 Turbo,同时将成本降低了60%以上。每百万个输入token的价格仅为15美分,输出token为60美分。对比Claude 3和Gemini 成本明...
Coze 官方宣布,他们已经成功集成了 OpenAI 推出的最新AI 助手 GPT-4o,为用户带来了更智能、更强大的聊天体验。GPT-4o 是 OpenAI 的力作,它的加入将为 Coze 用户提供更便捷、更高效的沟通和交流方式。这里演示创建一个Google Web Search和DALLE 3插件的的聊天机器人。项目实操步骤1、点击链接打开官网,https://www.coze.com/hom...
在最近的大模型战争中,OpenAI似乎很难维持霸主地位。虽然没有具体的数据统计,但Claude3.5出现后,只是看网友们的反响,就能感觉到OpenAI订阅用户的流失:既然Claude3.5比GPT-4o好用,为什么我们不去订阅Claude呢?而这长达数月的批评声中,OpenAI似乎尽显颓势,除了GPT-4o mini这个小模型以外,似乎再也没有什么创新点。甚至就在前几日,GPT-4o还被开源的大模...
摘要:程序员不仅应致力于让程序员失业,也应致力于让所有人失业。源代码公开是一个热议话题,当问到对源代码公开的个人观点时,说到虽然对程序员是一件好事,可以让程序员研究源代码,但我并不认为所有软件的源代码必须公开,源代码公开涉及到知识产权等各种问题。 为打破外界对程序员简单平面的偏见,一系列程序员访谈正在进行中。 第一个接受访谈的程序员 Gemini,在 SegmentFault 主要负责 An...
7月5日,在2024世界人工智能大会可信大模型助力产业创新发展论坛上,蚂蚁集团公布其自研百灵大模型最新研发进展:百灵大模型已具备能看会听、能说会画的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。原生多模态被认为是通往AGI的必经之路,在国内,目前只有为数不多的大模型厂商实现了这一能力。从大会现场的演示看到,多模态技术可以让大模型更像人一样感知和互动,支撑智能体体验升级,百灵的多...
阅读 167·2024-11-07 17:59
阅读 217·2024-09-27 16:59
阅读 352·2024-09-23 10:37
阅读 398·2024-09-14 16:58
阅读 262·2024-09-14 16:58
阅读 364·2024-08-29 18:47
阅读 593·2024-08-16 14:40
阅读 318·2024-08-14 17:54