今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

来源:雷锋网发布:02-28 11:52阅读:1144原文链接
导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块。
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

  目录

JRMOT:一个实时3D多对象跟踪器和一个新的大规模数据集

SD-GAN:重建被遮挡脸部部分的结构和去噪GAN

像词一样表达对象:用于图像-文本匹配的循环视觉嵌入

ADAM:一种随机优化方法

小冰乐队:流行音乐的旋律与编排生成框架

  JRMOT:一个实时3D多对象跟踪器和一个新的大规模数据集

论文名称:JRMOT: A Real-Time 3D Multi-Object Tracker and a New Large-Scale Dataset

作者:Shenoi Abhijeet /Patel Mihir /Gwak JunYoung /Goebel Patrick /Sadeghian Amir /Rezatofighi Hamid /Martin-Martin Roberto /Savarese Silvio

发表时间:2020/2/19

论文链接:https://paper.yanxishe.com/review/12209?from=leiphonecolumn_paperreview0228

推荐原因

这篇论文考虑的是自主导航的问题。自主导航代理需要感知并跟踪周围物体和其他代理的运动,以实现健壮和安全的运动计划和动作执行。尽管自主导航需要多对象跟踪系统来提供3D信息,但是大多数已有研究都是通过RGB视频在2D多对象跟踪中完成的。这篇论文提出了一个新的3D多对象跟踪系统JRMOT,它将来自2D RGB图像和3D点云的信息集成到实时执行框架中。这篇论文还将JRMOT合并到多模式递归卡尔曼架构中的联合概率数据关联框架中,以实现在线实时3D多对象跟踪。这篇论文同时还发布了一个新的大规模2D与3D数据集,在超过54个室内和室外场景中标注了超过200万个边框和3500种时间一致的2D+3D轨迹。

  SD-GAN:重建被遮挡脸部部分的结构和去噪GAN

论文名称:SD-GAN: Structural and Denoising GAN reveals facial parts under occlusion

作者:Banerjee Samik /Das Sukhendu

发表时间:2020/2/19

论文链接:https://paper.yanxishe.com/review/12208?from=leiphonecolumn_paperreview0228

推荐原因

这篇论文考虑的是脸部重建的问题。

在人脸识别中,如果显著的面部特征被遮挡了,模型的识别能力会大大下降。为此这篇论文提出了一个名为SD-GAN的生成模型来重建被遮挡脸部部分,并保留原始图像中的光照变化以及脸部身份信息。这篇论文还提出了一种新的对抗“结构性”损失函数,该函数包括两个部分:整体损失和局部损失,分别由SSIM和逐块MSE进行构建。在真实和合成的遮挡人脸数据集的实验表明,即使是在提高人脸识别性能方面,这篇论文提出的技术也比其他基准模型具有更大的优势。

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

  像词一样表达对象:用于图像-文本匹配的循环视觉嵌入

论文名称:Expressing Objects just like Words: Recurrent Visual Embedding for Image-Text Matching

作者:Chen Tianlang /Luo Jiebo

发表时间:2020/2/20

论文链接:https://paper.yanxishe.com/review/12207?from=leiphonecolumn_paperreview0228

推荐原因

这篇论文考虑的是图像-文本匹配问题。

图像-文本匹配方法通常通过捕获和聚集文本与图像的每个独立对象之间的亲和度来推断图像-文本对的相似性,但是这类方法忽略了语义相关对象之间的连接。这篇论文提出了一个名为DP-RNN的双路径循环神经网络,给定一个输入的图像-文本对,根据图像对象在文本中最相关的词的位置对图像对象进行重排序。与从单词嵌入中提取隐藏特征相同,新模型利用RNN从重新排序的对象输入中提取高级对象特征。为计算图像-文本相似度,这篇论文将多注意交叉匹配模型合并到DP-RNN中,通过跨模态引导的注意和自注意机制聚集了对象和单词之间的亲和力。Flickr30K和MS-COCO数据集上的实验证明了DP-RNN的有效性。

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

  ADAM:一种随机优化方法

论文名称:ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION

作者:Diederik P. Kingma /Jimmy Lei Ba

发表时间:2017/1/30

论文链接:https://paper.yanxishe.com/review/12206?from=leiphonecolumn_paperreview0228

推荐原因

核心问题:神经网络的优化是一个重要的课题,比如梯度下降算法,动量梯度下降算法,本文介绍一种新优化算法。

创新点:Adam 是一种可以替代传统随机梯度下降(SGD)过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重,该方法实现简单,计算效率高,对内存的要求很小,使得神经网络训练很快。

研究意义:Adam比其他随机优化方法要好很多。

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

  小冰乐队:流行音乐的旋律与编排生成框架

论文名称:XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music

作者:Hongyuan Zhu / Qi Liu /Nicholas Jing Yuan /Chuan Qin /Jiawei Li

发表时间:2018/8/19

论文链接:https://paper.yanxishe.com/review/12205?from=leiphonecolumn_paperreview0228

推荐原因

核心问题:这篇文章简单的看了看,虽然和自己的研究领域不同,但是看着挺有意思的。他们做了一个小冰乐队,一个用于歌曲生成的端到端旋律和编曲生成框架。

创新点:提出基于和弦的节奏和旋律交叉生成模型来生成给定和弦进行为条件的旋律。然后论文作者引入多乐器联合编曲模型用于多轨音乐,这两个任务相互协调。

研究意义:对现实世界数据集的广泛实验证明了我们的模型相对于单轨和多轨音乐生成的基线模型的优势。

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等
今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

  论文作者团队招募

为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块,希望以论文作为聚合 AI 学生青年的「兴趣点」,通过论文整理推荐、点评解读、代码复现。致力成为国内外前沿研究成果学习讨论和发表的聚集地,也让优秀科研得到更为广泛的传播和认可。

我们希望热爱学术的你,可以加入我们的论文作者团队。

加入论文作者团队你可以获得

    1.署着你名字的文章,将你打造成最耀眼的学术明星

    2.丰厚的稿酬

    3.AI 名企内推、大会门票福利、独家周边纪念品等等等。

加入论文作者团队你需要:

    1.将你喜欢的论文推荐给广大的研习社社友

    2.撰写论文解读

如果你已经准备好加入 AI 研习社的论文兼职作者团队,可以添加运营小姐姐的微信(ID:julylihuaijiang),备注“论文兼职作者”

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

雷锋网(公众号:雷锋网)雷锋网雷锋网

相关文章:

今日 Paper | 联合多任务模型;3D人体重建;可视化理解机器翻译;深入研究整流器等

雷锋网原创文章,未经授权禁止转载。详情见转载须知

今日 Paper | 重建结构和去噪GAN;循环视觉嵌入;一种随机优化方法;小冰乐队等

文章声明

本文仅代表作者观点,不代表本站立场。文章来源于网络,如有侵权或不实报道,请联系站长删除。【联系我们】

分享:

扫一扫在手机阅读、分享本文

评论

精彩评论
暂无留言!