资讯专栏INFORMATION COLUMN

OpenAI加持,“地表最强”人形机器人亮相:AI推理能力大幅增强

UCloud小助手 / 721人阅读

号称“地表最强”人形机器人,来了。

当地时间周二早晨,获得微软、英伟达、OpenAI投资的硅谷著名智能创业公司 Figure 正式发布了自己的新一代人形机器人Figure 02。基于机载算力和各个组件的全方位升级,AI人形机器人朝着“进厂打工”又迈进了一大步。


据介绍,此次它的手有着惊人的16个自由度,能承受与人类相当的重量。

除了样子够科幻,这种机器人也有着足够通用的智能,它可以与人类实时对话,自动学习如何装配零件。事实上,Figure 02目前正在宝马位于 Spartanburg 的工厂实习工作,我们仿佛已经进入了未来。

全面改进:通用 + 人形 + 实用化

比较明显可以看到的是,与2023年发布的第一代产品相比,Figure 02在外观上最为明显的区别在于外观的彻底重构——机器人完全采用外骨骼结构(由外皮承担负载和压力),机器人的电源和算力布线集成在机体内部,从而提高了机器人的可靠性,也使得封装更加紧实。


此外,Figure 02 的导航系统使用了 VLM(视觉语言模型),这使得机器人上的摄像头能够进行语义基础研究和快速常识性视觉推理。VLM 是当前众多造车新势力正在研究的智能驾驶新方向,在机器人领域,这种方法显然也可以在很多任务上实现突破性的效果。



续航能力可以说是人形机器人实用化面临的最大挑战之一。Figure 02 机器人躯干内定制有容量为2.25 KWh 的电池组,可以比 Figure 01 多提供50% 以上的能量,从而最大程度地延长机器人的运行时间。Figure AI 的创始人、CEO Brett Adcock 表示,他们希望 Figure 02 每天能够实现约 20 小时以上的有效工作。


在今年 3 月,OpenAI 宣布与 Figure 合作开发具身智能,让人形机器人拥有了实时有效的对话能力。背靠 OpenAI,Figure 能够快速迭代机器人语音到语音的能力。Figure 表示,由于 Figure 02 的端侧算力大幅提升,已经可以完全自主地在现实世界中执行各种任务。

在 Figure 02 上,机器人语音推理的实现主要得益于内置的麦克风和扬声器连接到与 OpenAI 合作训练的定制 AI 模型上。


为了能像人类一样理解世界,Figure 02 通过多摄像头 + AI 驱动的视觉系统来进行感知与推理。其在头部、前躯干和后躯干共有 6 个板载 RGB 摄像头,使得机器人具有超越人类的视觉能力。



最后还有灵巧的手指。Figure 02 搭载了第四代机械手,有 16 个自由度,并具有与人类相当的力量,可以胜任各种复杂任务,整个手包含了机械、电气、控制和传感器等技术。

而且Figure 02的计算和AI推理能力是Figure 01的3倍,能够完全自主执行实际应用中的AI任务。

AI数据引擎将提供最新AI模型,这些模型将在机器人的GPU上运行。

image.png

看到 Figure 02 这么精彩的亮相,让人不禁想起了马斯克家的擎天柱,两者相比,不知道谁更胜一筹。

图片



还有网友表示「Figure 02 预示着一个新时代的开始,这是目前世界上最先进的机器人,未来已来。

图片

创业公司 Figure:半个硅谷都在投资,初代机器人已进宝马打工

Figure 由 Brett Adcock 于 2022 年创立,是一家总部位于美国的机器人公司,专门开发人形机器人。该公司的目标是开发通用人形机器人,为人类带来积极影响,为后代创造更美好的生活。

在生成式 AI 技术爆发后,很多以具身智能为目标的机器人公司不断出现,而 Figure 在其中显得尤为亮眼。2023 年 3 月,Figure 走出隐身模式,推出了原型机器人 Figure 01,其外观和动作都与人类相似。这是一款专为体力劳动设计的双足机器人,最初针对的是物流和仓储行业。

2023 年 5 月,该公司从 Parkway Venture Capital 领投的投资者手中筹集了 7000 万美元。

同年 10 月,Figure 放出 Figure 01 双足机器人行走视频。


图片


到了今年 1 月,Figure 01 已经学会了煮咖啡。

图片

2024年1月18日,Figure 宣布与宝马合作,在汽车制造工厂部署人形机器人。此时的 Figure 01 号称已经可以自主完成现实世界中的任务了。

图片

今年 3 月,Figure 宣布完成惊人的 6.75 亿美元 B 轮融资,公司估值达到 26 亿美元。投资者包括微软、英特尔、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英伟达、贝索斯、「木头姐」的方舟投资、Parkway Venture Capital、Align Ventures 等。

从直立行走,完成复杂任务到与人自然交互。这些技术亮点也是 Figure 和一直希望回归机器人领域的 OpenAI 达成合作协议的重要原因之一 —— 将 OpenAI 的研究与 Figure 的机器人经验结合起来,为人形机器人开发下一代 AI 模型。

就在 Figure 02 发布后,高度集成的硬件与 VLM 等新一代 AI 技术结合,让我们距离真正具有通用能力的人形机器人更近了一步。

很快,物理世界也要迎来 AI 带来的变革了?

总结:值得关注的新兴公司 令人激动的科技项目

今年年初,人形机器人一度迎来爆发式开局。从斯坦福机器人大秀厨艺做大餐,到特斯拉擎天柱化身保姆叠衣服,再到两家创企的机器人比赛煮咖啡。除了Figure之外,另一家机器人企业1X也获得OpenAI等知名投资者的巨额投资支持。

除此之外,还需考虑扩大机器人的运动范围,以确保它能在更短的时间内做更多的事情。这也是波士顿动力公司在其新推出的 Atlas 人形机器人系列中考虑的问题。

FigureAI是2024年初投资界的宠儿。据外媒报道,目前该公司已筹集6.75亿美元。借助 Figure AI 的雄厚资金,联合创始人兼首席执行官布雷特·艾德考克称正“全力以赴”,争取在未来两到五年内将自主双足机器人推向市场竞争中。

半年多过去,人形机器人的热度有所退却,不过Figure 02的发布又为这个赛道添了一把火。Figure 02在软硬件诸多方面展现出了显著的升级与突破,但由于演示视频的局限性,也面临着网友的质疑与期待。

科技的进步从来不是一蹴而就,每一次的创新都伴随着挑战与争议。后续Figure能否不断优化Figure 02,交出更亮眼的答卷,特斯拉擎天柱等同类产品又能否实现新的突破,值得持续关注。


文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/131148.html

相关文章

  • 英伟达开始引领下一波浪潮:物理AI

    这可能会是AI技术形态的一个转折点,大模型的下一个形态,不再是人和模型一轮一轮的即时问答了。当地时间 7 月 29 日,在美国丹佛举行的第 51 届 SIGGRAPH 计算机图形学会议上,英伟达创始人、CEO 黄仁勋与 Meta 创始人、CEO 马克・扎克伯格进行了一场全球瞩目的炉边谈话。这场对话主要围绕生成式 AI 技术,及其在各种领域上的应用展开。会议中,面向全球领先的机器人制造商、AI 模型...

    UCloud小助手 评论0 收藏0
  • 一直爆料OpenAI「草莓」的账号,竟然是个智能体?Agent Q横空出世,AI界新秀or营销大师

    当炒作出了「泼天的流量」,已经没人关心产品厉不厉害了。近日,OpenAI 的秘密项目「Q*」引起了业内人士的广泛关注。上个月,代号为「草莓(Strawberry)」的项目曝光,据说它是「Q*」的延续,并可能具备高级推理能力。而就在最近几天,关于这个项目,网络上又来了几波「鸽死人不偿命」的传播。尤其是一个「草莓哥」的账号,不间断地宣传,给人期望又让人失望。网友们对Agent Q背后的技术充满了好奇。...

    UCloud小助手 评论0 收藏0
  • 问鼎最强计算,华为云计算连续斩获三项大奖

    摘要:年月,由中国信息通信研究院和中国计算机学会高性能计算专业委员会联合主办的首届中国高性能云计算创新大赛中,华为云计算一举摘得优秀性能奖和性能表现优异两项大奖。华为云异构计算包含全系列实例。华为云计算服务秉承硬、专、快、稳的核心理念,发挥软硬结合及全栈能力的深厚积累,倾力打造地表最强计算品牌,18年计算服务全面升级换代,结合了新一代定制CPU、高性能GPU、自研25G智能网卡,深度契合多种企业应...

    raoyi 评论0 收藏0
  • 再见GPT3.5, GPT-4o mini大模型正式发布,地板价格

    OpenAI昨日发布了全新的小型AI模型GPT-4o mini,这一模型在性能和成本效益方面都取得了重大突破,Sam Altman惊呼:通往智能的成本,已变得如此低廉。性能与成本的完美平衡GPT-4o mini在性能上显著超越了其前身GPT-3.5 Turbo,同时将成本降低了60%以上。每百万个输入token的价格仅为15美分,输出token为60美分。对比Claude 3和Gemini 成本明...

    UCloud小助手 评论0 收藏0
  • 和 Hinton 一起发明了深度信念网络,他们选择加入 DeepMind

    摘要:取得博士学位后,他加入的团队,在多伦多大学攻读博士后,在年跟和合著了提出深度信念网络的论文。只有充分了解,才能做出强有力的战略决策。这带来的一个重大问题是,个人隐私数据被其他人控制。机器学习是数据驱动的,与统计数据紧密相关。 昨天,谷歌 DeepMind 联合创始人 Demis Hassabis 发布了这样一条消息:很高兴 Yee Whye Teh 和 Simon Osindero 加入团队...

    oneasp 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<