常用: 学生 教职工 校友 OA系统 邮件系统 VPN系统 图书馆 智慧门户 EN
首页 世界杯赛程 2026世界杯竞猜(中国)官网 苹果连发 3 项 AI 商议,鼓动空间策划与 V

2026世界杯竞猜(中国)官网 苹果连发 3 项 AI 商议,鼓动空间策划与 Vision Pro 头显标的

发布时间:2026-05-15 来源:世界杯赛程 作者:admin 浏览:60

2026世界杯竞猜(中国)官网 苹果连发 3 项 AI 商议,鼓动空间策划与 Vision Pro 头显标的

导语:科技媒体 Appleinsider 昨日(5 月 11 日)发布博文,报谈称基于最新公开的 3 项商议,苹果仍在积极鼓动空间策划和 Vision Pro 头显。

IT 之家  5 月 12 日音书,科技媒体 Appleinsider 昨日(5 月 11 日)发布博文,报谈称基于最新公开的 3 项商议,苹果仍在积极鼓动空间策划和 Vision Pro 头显。

明陞M88体育中国官网

IT 之家 4 月征引 MacRumors 媒体报谈,苹果公司里面已放弃研发新款 Vision Pro,团队要点转向 Siri 和 AI 智能眼镜。

但从最新公示的商论说文来看,苹果公司并未消除 Vision Pro 头显名目,本轮公开了 3 项商议,分离波及多模态大模子空间推理评测、好意思式手语视频标注,以及 3D 头部重建。

其中最径直的一项,是苹果在机器学习博客发布的《From Where Things Are to What They ’ re For:Benchmarking Spatial-Functional Intelligence for Multimodal LLMs》。

这篇论文提倡 SFI-Bench,用来测试多模态大模子是否既看懂空间布局,NBA下注(中国)官网入口也认知物体"能作念什么"。原文提到,这套视频基准包含 134 段室内视频扫描,并整理出 1555 谈巨匠标注问题。

SFI-Bench 不单问模子"这是什么、在那儿",还会追问"它怎么用、出了故障怎么办"。举例,模子可能需要从柜子里找出同品牌数目最多的一组瓶子,认知洗衣机现时门径如何取消,2026世界杯竞猜中国官网偶而判断电视遥控器的用途。比拟只测空间识别的旧循序,这更接近浩荡家庭场景,也更像未来空间助手需要处分的真正任务。

苹果公司的东谈主工智能商议东谈主员测试了智能体(LLM)对周围天下的认知智商。图源:苹果公司

测试效果清楚,Google Gemini 3.1 Pro 总分最高,OpenAI GPT-5.4-High 排行第二,Gemini-3.1-Flash-Lite 排行第三。

但论文也点出共同短板:险些扫数模子都不擅长"带要求的全局计数",而况在空间缅想、功能学问整合,以及把目下画面和外部学问连起来这几件事上仍有彰着兑现。

手语论文《Bootstrapping Sign Language Annotations with Sign Language Models》尝试用 AI 自动生成候选标注,减少数百小时手工标注老本。

苹果公司的商议东谈主员探索了使用东谈主工智能进行好意思国手语(ASL)标注的可能性。图源:苹果公司

原文称,团队栽培了近 500 条东谈主工英翰墨词到术语标注,并扩张到逾越 300 小时 ASL STEM Wiki 和 7.5 小时 FLEURS-ASL 数据。其手指拼写模子在 FSBoard 上达到 6.7% CER,在 ASL Citizen 数据集上达到 74% top-1 准确率。

第三项商议《Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures》则聚焦 3D 头像重建。

苹果公司的东谈主工智能商议东谈主员探索了如何应用 LLM(层级建模)本领,从多角度拍摄的图像中创建 3D 头部模子。图源:苹果公司。

苹果提倡 HeadsUp 循序,可从大鸿沟多录像头采都集重建高质地 3D Gaussian 头部模子。测试使用了一个逾越 10000 名受试者的里面数据集,鸿沟比现存多视角东谈主头数据集高一个数目级。这可能和 Vision Pro 的 Persona,或 visionOS 中更当然的东谈主脸捕捉与样子渲染关联。

苹果公司人人营销高档副总裁格雷格 · 乔斯维亚克(Greg Joswiak)此前暗示,Vision Pro 展示了数字天下与物理天下会通的未来样子,这种会通具有势必性。当被问及具体时辰表时,他坦言无法琢磨"空间策划"何时能成为主流,但笃信这一标的不成逆转。

参考

(著述为作家寥落不雅点2026世界杯竞猜(中国)官网,不代表艾瑞网态度)