每日学术速递3.21
创始人
2025-05-31 17:20:46

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.NeRFMeshing: Distilling Neural Radiance Fields into Geometrically-Accurate 3D Meshes

标题:NeRFMeshing:将神经辐射场提取为几何精确的 3D 网格

作者:Marie-Julie Rakotosaona, Fabian Manhardt, Diego Martin Arroyo, Michael Niemeyer, Abhijit Kundu, Federico Tombari

文章链接:https://arxiv.org/abs/2303.09431

摘要:

        随着神经辐射场 (NeRFs) 的引入,新颖的视图合成最近取得了巨大飞跃。NeRF 的核心是提出每个 3D 点都可以发出辐射,从而允许使用可区分的体积渲染进行视图合成。虽然神经辐射场可以准确地表示用于计算图像渲染的 3D 场景,但 3D 网格仍然是大多数计算机图形和模拟管道支持的主要场景表示,支持实时渲染和基于物理的模拟等任务。从神经辐射场获得 3D 网格仍然是一个开放的挑战,因为 NeRFs 针对视图合成进行了优化,而不是在辐射场上强制执行准确的底层几何结构。因此,我们提出了一种新颖的紧凑且灵活的架构,可以通过任何 NeRF 驱动的方法轻松进行 3D 表面重建。训练完辐射场后,我们将体积 3D 表示提炼到带符号的表面近似网络中,从而可以轻松提取 3D 网格和外观。我们最终的 3D 网格在物理上是准确的,并且可以在一系列设备上实时渲染。

2.DeepMIM: Deep Supervision for Masked Image Modeling

标题:DeepMIM:蒙版图像建模的深度监督

作者:Sucheng Ren, Fangyun Wei, Samuel Albanie, Zheng Zhang, Han Hu

文章链接:https://arxiv.org/abs/2303.08817

项目代码:https://github.com/OliverRensu/DeepMIM

摘要:

        深度监督涉及对神经网络中间特征的额外监督,在早期深度学习时代被广泛用于图像分类,因为它显着降低了训练难度并简化了优化,例如避免了普通训练中的梯度消失。然而,随着归一化技术和残差连接的出现,图像分类中的深度监督逐渐被淘汰。在本文中,我们重新审视了掩蔽图像建模 (MIM) 的深度监督,该模型通过掩蔽和预测方案预训练视觉转换器 (ViT)。通过实验,我们发现深度监督驱动浅层学习更有意义的表示,加速模型收敛,并扩大注意力多样性。我们的方法称为 DeepMIM,显着提高了每一层的表示能力。此外,DeepMIM 与一系列重建目标的许多 MIM 模型兼容。例如,使用 ViT-B,MAE 上的 DeepMIM 在 ImageNet 上达到 84.2 top-1 精度,比 MAE 高出 +0.6。通过将 DeepMIM 与更强大的标记器 CLIP 相结合,我们的模型在各种下游任务上实现了最先进的性能,包括图像分类(ImageNet-1K 上的 85.6 top-1 精度,优于 MAE-CLIP +0.8),对象检测(COCO 上的 APbox 为 52.8)和语义分割(ADE20K 上为 53.1 mIoU)。

3.A Theory of Emergent In-Context Learning as Implicit Structure Induction

标题:作为内隐结构归纳的紧急情境学习理论

作者:Michael Hahn, Navin Goyal

文章链接:https://arxiv.org/abs/2303.07971

摘要:

        扩展大型语言模型 (LLM) 会产生从示例演示中进行上下文学习的能力。尽管取得了进展,但对这种现象的理论理解仍然有限。我们认为,上下文学习依赖于自然语言数据中发现的组合操作的重组。我们推导出一个信息论界限,显示在语言动机假设下,当预训练分布具有足够数量的组成结构时,上下文学习能力如何从通用的下一个标记预测中产生。第二个边界为促使 LLM 输出中间步骤以获得答案的经验成功提供了理论依据。为了验证理论预测,我们引入了一种受控设置来诱导情境学习;与以前的方法不同,它解释了语言的组合性质。训练有素的转换器可以以与理论结果一致的方式为一系列任务执行上下文学习。在微型设置中镜像真实世界的 LLM,在缩放参数和数据时出现上下文学习,并且在提示输出中间步骤时模型表现更好。探测表明,输入的组成结构的表示支持上下文学习。总而言之,这些结果为从理论上理解大型语言模型中的涌现行为迈出了一步。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

相关内容

热门资讯

4月广州消费品市场表现强劲 1-4月,随着消费品以旧换新等促消费政策持续发力和各类会展活动陆续开展,政策相关消费快速增长,升级类...
金价,又跌了! 人民财讯5月31日电,5月30日,COMEX黄金期货收跌0.92%,报3313.1美元/盎司。 从高...
10万吨改性项目!巴斯夫、金发... 【DT新材料】获悉,6月3日,沪市主板新股海阳科技将启动申购,上市在即! 资料显示,海阳科技前身为南...
湾财周报|大事记 比亚迪驳斥“... 一周大事记(5月26日-6月1日) 头条 比亚迪驳斥! 长城“车圈恒大论”是行业警示还是危言耸听?...
通源石油跌1.96%,成交额1... 5月30日,通源石油跌1.96%,成交额1.03亿元,换手率4.40%,总市值23.54亿元。 异动...
中国邮储银行浙江分行2025校... 点这里 ↑ 老满说高考 作者 l 老满 生涯规划师l 升学顾问l 拆书家 这是 老满说高考公众号 的...
公募基金规模首次突破33万亿元... 每经记者:肖芮冬 每经编辑:叶峰 天赐良基日报第654期 一、今日基金新闻速览 1、华润元大基金贾...
湾财周报 大事记 比亚迪驳斥“... 一周大事记(5月26日-6月1日)头条比亚迪驳斥!长城“车圈恒大论”是行业警示还是危言耸听?近日,关...
EL表达式JSTL标签库 EL表达式     EL:Expression Language 表达式语言     ...
关于测试,我发现了哪些新大陆 关于测试 平常也只是听说过一些关于测试的术语,但并没有使用过测试工具。偶然看到编程老师...
工信部、中汽协紧急发声!汽车“... 文/刘育英新一轮汽车价格战再起。近日,工信部、中汽协纷纷发声表示反对。工业和信息化部表示,将加大对汽...
3 ROS1通讯编程提高(1) 3 ROS1通讯编程提高3.1 使用VS Code编译ROS13.1.1 VS Code的安装和配置...
募资39亿,全亏光了,账上不到... 关于天然气,用户的感觉是价格一直在上涨,但很奇怪,不管怎么涨,天然气企业仍然亏,还亏得一塌糊涂。这是...
资阳房产评估公司 这是(tel-15828298733)整理的信息,希望能帮助到大家 在当今社会,随着经济的发展和城...
华桥汇利(中国)投资基金管理有... 今年第一季度,美国企业利润出现大幅下降,且面临着来自关税上升的持续压力,这一局面可能会在今年进一步加...
ESG 报告合规与鉴证:全球政... 在当下全球经济格局里,ESG(环境、社会和公司治理)已然成为衡量企业可持续发展能力的关键指标。随着全...
【Unity 手写PBR】Bu... 写在前面 前期积累: GAMES101作业7提高-实现微表面模型你需要了解的知识 【技...
与锤巨子生物的大嘴博士持股同一... 医美龙头巨子生物“成分争议”风波持续发酵。日前,美妆博主大嘴博士(香港大学化学博士郝宇)发文,质疑巨...
Linux之进程间通信 目录 进程间通信介绍 一、为什么要进行进程间通信? 二、进程间通信目的 三、进程间通信...
从“造城”到“留客”,文旅局长... 你有没有刷到最近各地文旅局局长全体“尬舞”的视频?领导们放下架子开始跳魔性舞蹈,这场舞的背后啊,可不...
Hazel引擎学习(十一) 我自己维护引擎的github地址在这里,里面加了不少注释,有需要的可以看...
孩子的教育金,分享3个「有效」... 点击 “简七读财” ,发送消息“ 理财小工具 ”免费领取“40个赚钱工具资源包”晚上好,我是简七编...
iZotope RX 10(专... iZotope RX 10是一款专业的音频修复和增强软件,具有音频修复工具、音频增强工...
我的docker随笔40:cl... 本文介绍 clickhouse 数据库的容器化部署。 起因 某项目需生产环境数据库,因...
透视一周牛熊股:最牛股路桥信息... 过去一周(5月26日—5月30日)A股三大指数集体下跌。截至5月30日收盘,上证指数报3347.49...
基于matlab创建地面固定雷... 一、前言此示例演示如何创建和显示包含地面固定雷达、转弯飞机、等速飞机和移动地面车辆的多平台方案。二、...
暗夜发光,独自闪耀,盘点网页暗... 众所周知,网页的暗黑模式可以减少屏幕反射和蓝光辐射,减少眼睛的疲劳感&#...
C语言-程序环境和预处理(2) 文章目录预处理详解1.预定义符号2.#define2.1#define定义的标识符2.2#defin...
MySQL数据库知识整理 MySQL数据库知识整理 MySQL事务详解 事务四大特性ACID 原子性(Atomi...
Docker基础篇——最全讲解 文章目录一、CentOS安装docker二、启动帮助类命令三、镜像命令1.名词概念2.常用命令2.1...