英特尔AI模型可根据文本生成3D图像-世界时讯

(资料图)

英特尔研究院日前宣布与Blockade Labs合作发布LDM3D模型，这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程生成深度图的模型，进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验，改变包括娱乐、游戏、建筑和设计在内的许多行业。

英特尔致力于推动AI普及，通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展，特别是在生成式AI方面。然而，当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比，LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下，能够为图像中的每个像素提供更精准的相对深度，增强人类创造力并节省时间。

这项研究有望改变用户与数字内容的互动方式，基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力，可以即时增强整体真实感和沉浸感，使各行各业的创新应用成为可能，包括娱乐、游戏、室内设计、房产销售，以及虚拟博物馆与沉浸式VR体验等。

LDM3D是在LAION- 400M数据集包含1万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集，包含超过4亿组图文对。对训练语料库进行标注时，研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large，为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的，以便广大研究人员和其他兴趣社群能在更大规模上测试训练模型。

可口可乐和百事可乐的区别有哪些？百事可乐是哪个国家的？

《阴阳师》中国邮政主题邮局联动开启焦点速递

美式和黑咖啡的区别有哪些？意式浓缩是黑咖啡吗？

重庆绘就万亿级新能源汽车新蓝图

香港经典电视剧有哪些？港台怀旧电视剧推荐

英特尔AI模型可根据文本生成3D图像-世界时讯

热点新闻

《炉石传说》暴雪嘉年华活动时间表公布

EA公布云游戏平台计划云玩家或将成为未来主流

《辐射76》PC测试版出BUG：删除50GB后重新下载

SE官方宣布《勇者斗恶龙建造者2》多人玩法和截图

MLXG或将在S9转会？被4支战队抢着要

《荒野大镖客2》似乎已为次世代主机开启重制

《怪物猎人GU》今日更新简体与繁体中文补丁

网络诚信建设亮出四大“法宝” 共享信用信息共治失信顽症

可口可乐和百事可乐的区别有哪些？百事可乐是哪个国家的？

《阴阳师》中国邮政主题邮局联动开启 焦点速递

美式和黑咖啡的区别有哪些？意式浓缩是黑咖啡吗？

重庆绘就万亿级新能源汽车新蓝图

香港经典电视剧有哪些？港台怀旧电视剧推荐

英特尔AI模型可根据文本生成3D图像-世界时讯

热点新闻

《炉石传说》暴雪嘉年华活动时间表公布

EA公布云游戏平台计划 云玩家或将成为未来主流

《辐射76》PC测试版出BUG：删除50GB后重新下载

SE官方宣布《勇者斗恶龙建造者2》多人玩法和截图

MLXG或将在S9转会？被4支战队抢着要

《荒野大镖客2》似乎已为次世代主机开启重制

《怪物猎人GU》今日更新简体与繁体中文补丁

网络诚信建设亮出四大“法宝” 共享信用信息共治失信顽症

《阴阳师》中国邮政主题邮局联动开启焦点速递

EA公布云游戏平台计划云玩家或将成为未来主流