arXiv每日更新-20220512(今日关键词:detection, recognition, classification)
三维视觉 3篇
* HULC: 3D Human Motion Capture with Pose Manifold Sampling and Dense Contact Guidance
* 链接: https://arxiv.org/abs/2205.05677
* 作者: Soshi Shimada,Vladislav Golyanik,Patrick Pérez,Weipeng Xu,Christian Theobalt
* 摘要: 无标记的单眼3D人类运动捕获(MOCAP)与场景相互作用是一个充满挑战的研究主题,与扩展现实,机器人技术和虚拟头像生成有关。由于单眼环境的固有深度歧义,使用现有方法捕获的3D运动通常包含严重的人工制品,例如不正确的身体场景互穿,抖动和身体漂浮。为了解决这些问题,我们提出了HULC,这是一种新的3D人类MOCAP方法,它知道场景几何形状。 HULC估计3D姿势和密集的身体环境表面接触,以改善3D定位以及受试者的绝对尺度。此外,我们基于新的姿势歧管采样,引入了3D姿势轨迹优化,该采样解决了错误的身体环境互穿。尽管所提出的方法与现有场景感知的单眼MOCAP算法相比需要较少的结构化输入,但它会产生更加可行的姿势:HULC显着且一致地在各种实验和不同指标上都优于现有方法。
* AggPose: Deep Aggregation Vision Transformer for Infant Pose Estimation
* 链接: https://arxiv.org/abs/2205.05277
* 作者: Xu Cao,Xiaoye Li,Liya Ma,Yi Huang,Xuan Feng,Zening Chen,Hongwu Zeng,Jianguo Cao
* 其他: To appear in the 31th International Joint Conference on Artificial Intelligence (IJCAI 2022)
* 摘要: 对新生儿的运动和姿势评估使经验丰富的儿科医生可以预测神经发育障碍,从而可以早期干预相关疾病。但是,大多数用于人类姿势估计方法的最新AI方法都集中在成年人上,缺乏公开基准的婴儿姿势估计。在本文中,我们通过提出婴儿姿势数据集和深度聚合视觉变压器来填补这一空白,以进行人姿势估计,该姿势估计引入了一个快速训练的完整变压器框架,而无需使用卷积操作在早期阶段提取功能。它将变压器 + MLP概括为特征图内的高分辨率深层聚集,从而在不同视力级别之间实现信息融合。我们在可可姿势数据集上预先训练,并将其应用于新发布的大规模婴儿姿势估计数据集。结果表明,凝集可以有效地学习不同分辨率之间的多尺度特征,并显着提高婴儿姿势估计的性能。我们表明,在婴儿姿势估计数据集中,凝集优于混合模型hrformer和tokenpose。此外,在可可瓣姿势估计上,我们的凝集表现优于HRFormer 0.7%AP。我们的代码可在此HTTP URL上找到。
* On Scale Space Radon Transform, Properties and Image Reconstruction
* 链接: https://arxiv.org/abs/2205.05188
* 作者: Nafaa Nacereddine,Djemel Ziou,Aicha Baya Goumeidane
* 摘要: 我们在本文中描述了数学变换必须具有的基本属性和比例空间ra ra tronvolum(SSRT)的基本属性和逆变换。为了重建SSRT Sinogram的图像,使用两种不同的方式使用了过滤后的反射(FBP)技术:(1)Deconvolve SSRT以获得估计的radon变换(RT),然后使用经典FBP或(2)适应FBP来重建图像SSRT的技术使得经典FBP中使用的ra射光谱被SSRT和Wiener过滤取代,并在频域中表达。使用S