谷歌CVPR最全总结(doubleburst多少钱一包)

日期:11-06

大家好,下面小编给大家分享一下。很多人还不知道谷歌CVPR最全面的总结(doubleburst多少钱一包)。下面详细解释一下。现在让我们来看看!

2018新智元-CVPR青奥会专题

来源:谷歌,iangoodfellow.com

整理:小秦

[新智元简介] 谷歌在今年的CVPR表现强劲。200多名谷歌员工将在大会上提交论文或被邀请发表演讲,45篇论文将被接受。在计算机视觉领域,对抗网络的生成无疑是最受关注的话题之一。本文带来了谷歌员工研究科学家兼GAN创始人伊恩·古德菲勒在2018年CVPR大会上关于GAN的演讲PPT。

地址:https://ai.googleblog.com

http://www.iangoodfellow.com/slides/2018-06-18.pdf

今天,2018年计算机视觉与模式识别大会(CVPR 2018)正在盐湖城举行。它是计算机视觉领域最重要的年度学术会议,包括主会议和若干研讨会和教程。作为大会的钻石赞助商,谷歌在今年的CVPR上也表现强劲。200多名谷歌员工将在大会上提交论文或受邀发表演讲。谷歌还组织并参与了几次研讨会。

根据谷歌官方博客,CVPR 2018谷歌共收到了45 篇论文。这些论文主要关注下一代智能系统和机器感知领域的最新机器学习技术,包括Pixel 2和Pixel 2 XL智能手机的人像模式背后的技术,Open Images数据集的V4版本等等。

谷歌CVPR 2018大会

组织者

财务主席:Ramin Zabih 领域主席:Sameer Agarwal, Aseem Agrawala, Jon Barron, Abhinav Shrivastava, Carl Vondrick, Ming-Hsuan Yang

论文列表

Orals/Spotlights

无监督发现作为结构表征的对象标记

作为结构表示的对象界标的无监督发现

、郭、、金以信、罗以军、、李洪立

DoubleFusion:使用单个深度传感器实时捕捉人体内部体型

DoubleFusion:通过单个深度传感器实时捕捉人体内部形状

陶瑜、郑泽荣、、郭、赵建辉、、郝莉、杰拉德·庞斯-莫尔、刘

用于无监督运动重定向的神经网络

用于无监督运动重定向的神经运动学网络

鲁本·比列加斯、杨笈每、杜伊古·塞兰、洪拉克·李

用核预测网络去噪

利用核预测网络的突发去噪

本·米尔登霍尔,陈嘉文,乔纳森·巴伦,罗伯特·卡罗尔,狄龙·沙雷特,吴

量化和训练神经网络,实现高效的整数运算推理

用于有效的仅整数算术推理的神经网络的量化和训练

Benoit Jacob、Skirmantas Kligys、、、朱梦龙、、Dmitry Kalenichenko、Hartwig Adam

AVA:一个时间空本地化的原子视觉动作视频数据集

AVA:时空定位原子视觉动作的视频数据集

顾春辉,,,Carl Vondrick,Caroline Pantofaru,,Sudheendra Vijayanarasimhan,George Toderici,Susanna Ricco,Rahul Sukthankar,Cordelia Schmid,Jitendra Malik

视觉-视觉问答中的文本关注焦点

焦点视觉-视觉问答的文本注意力

梁、、、曹、李、等

从阴影推断光场

从阴影推断光场

Manel Baradad、Vickie Ye、Adam Yedida、Fredo Durand、William Freeman、Gregory Wornell、Antonio Torralba

在多个视图中修改非局部变量

跨多个视图修改非本地变体

塔尔·特卢斯蒂、托梅尔·米凯利、程昕婷·德克勒、利希·泽尔尼克-马诺尔

超越卷积的迭代视觉推理

超越卷积的迭代视觉推理

陈、李丽佳、费、阿比纳夫·古普塔

3D变形模型回归的无监督训练

用于3D变形模型回归的无监督训练

凯尔·吉诺瓦,福雷斯特·科尔,亚伦·马斯奇诺特,丹尼尔·维拉西奇,亚伦·萨纳,威廉·弗里曼

了解可扩展图像识别的可转换架构

学习用于可伸缩图像识别的可转移架构

巴雷特·佐夫,维贾伊·瓦苏德万,黄邦贤·施伦斯,阔克·勒

生物物种分类和检测数据集

非自然物种分类和检测数据集

格兰特·范·霍恩、奥辛·麦克·奥德哈、宋洋、尹翠、孙辰、亚历克斯·谢泼德、哈特维格·亚当、彼得罗·佩罗娜、塞尔日·贝隆吉

通过观察世界学习内在图像分解

从看世界中学习内在图像分解

李正奇,诺亚·斯内夫利

学习智能对话框用于边界框注释

学习用于边界框注释的智能对话框

Ksenia Konyushkova,Jasper Uijlings,Christoph Lampert,Vittorio Ferrari

Posters

重新审视培训对象类别检测器的知识转移

再谈训练对象类检测器的知识转移

贾斯珀·尤林斯,斯特凡·波波夫,维托里奥·法拉利

用更快的R-CNN架构重新思考时间动作定位

重新思考用于时间动作定位的更快的R-CNN架构

于、Sudheendra Vijayanarasimhan、Bryan Seybold、、Jia Deng、Rahul Sukthankar

视觉对象识别的分层新颖性检测

用于视觉对象识别的分层新颖性检测

李基博,李金敏,凯尔敏,张玉婷,申镇宇,李洪拉

COCO-Stuff:上下文中事物和材料的分类

COCO-Stuff:上下文中的事物和材料类

霍尔格·凯撒,贾斯珀·尤林斯,维托里奥·法拉利

用于视频分类的外观关系网络

用于视频分类的外观和关系网络

王利民、李玮、李文、吕克·范古尔

MorphNet:深度网络的快速简单资源约束结构学习

MorphNet:Fast & amp;深度网络的简单资源受限结构学习

阿里尔·戈登、埃拉德·埃班、陈博、奥菲尔·纳丘姆、杨天柱、爱德华·崔

图形卷积自动编码器的可变形形状完成

用图形卷积自动编码器完成可变形形状

或Litany,亚历克斯布朗斯坦,迈克尔布朗斯坦,阿梅什马卡迪亚

MegaDepth:从互联网照片学习单视角深度预测

MegaDepth:从互联网照片学习单视角深度预测

李正奇,诺亚·斯内夫利

无监督发现作为结构表征的对象标记

作为结构表示的对象界标的无监督发现

、郭、、金以信、罗以军、、李洪立

用核预测网络去噪

利用核预测网络的突发去噪

本·米尔登霍尔,陈嘉文,乔纳森·巴伦,罗伯特·卡罗尔,狄龙·沙雷特,吴

量化和训练神经网络,实现高效的整数运算推理

用于有效的仅整数算术推理的神经网络的量化和训练

Benoit Jacob、Skirmantas Kligys、、、朱梦龙、、Dmitry Kalenichenko、Hartwig Adam

Pix3D:单幅图像3D形状建模的数据集和方法

Pix3D:用于单图像3D形状建模的数据集和方法

孙兴元,吴家军,,,张,薛天凡,约书亚·特南鲍姆,威廉·弗里曼

用于表示和编辑图像的稀疏智能轮廓

稀疏、智能的轮廓来表示和编辑图像

程昕婷·德克,陈爱龙·克里希南,庄甘,刘策,威廉·弗里曼

MaskLab:通过使用用于实例分割的语义和方向特征来优化对象检测

MaskLab:通过用语义和方向特征改进对象检测来进行实例分割

陈良杰,亚历山大·赫尔曼斯,乔治·帕潘德里欧,弗洛里安·施罗夫,王鹏,哈特威格·亚当

大规模细粒度分类和特定领域迁移学习

大规模细粒度分类和特定领域迁移学习

尹翠、宋洋、孙辰、安德鲁·霍华德、塞尔日·贝隆吉

改进有损网络压缩,初始值和自适应比特率在空 之间

针对递归网络,使用启动和空间自适应比特率改进有损图像压缩

Nick Johnston、Damien Vincent、David Minnen、Michele Covell、Saurabh Singh、Sung Jin Hwang、George Toderici、Troy Chinen、Joel Shor

MobileNetV2:反向残差和线性瓶颈

MobileNetV2:反向残差和线性瓶颈

马克·桑德勒、、朱梦龙、安德烈Zhmoginov、陈良杰

scan complete:3D扫描的大规模场景完成和语义分割

scan complete:3D扫描的大规模场景完成和语义分割

安吉拉·戴、丹尼尔·里奇、马丁·博克罗、斯科特·里德、于尔根·斯特姆、马蒂亚斯·尼尔内

Sim2Real通过循环控制查看不变视觉伺服

通过递归控制实现真实视图不变视觉伺服

费雷什特·萨德吉,亚历山大·托舍夫,埃里克·张,谢尔盖·莱文

交替立体声VINS:可观测性分析和性能评估

交替立体声VINS:可观测性分析和性能评估

斯特吉奥斯·鲁梅利奥蒂斯·坎蒂·保罗先生

桌上足球

足球在你的桌面上

康斯坦丁诺斯·雷玛塔斯,艾拉·凯梅尔马赫,布莱恩·柯尔斯,史蒂夫·塞茨

使用3D几何约束从单目视频无监督学习深度和自运动

使用3D几何约束从单目视频无监督学习深度和自我运动

Reza Mahjourian、Martin Wicke、Anelia Angelova

AVA:一个时间空本地化的原子视觉动作视频数据集

AVA:时空定位原子视觉动作的视频数据集

顾春辉,,,Carl Vondrick,Caroline Pantofaru,,Sudheendra Vijayanarasimhan,George Toderici,Susanna Ricco,Rahul Sukthankar,Cordelia Schmid,Jitendra Malik

从阴影推断光场

从阴影推断光场

Manel Baradad、Vickie Ye、Adam Yedida、Fredo Durand、William Freeman、Gregory Wornell、Antonio Torralba

在多个视图中修改非局部变量

跨多个视图修改非本地变体

塔尔·特卢斯蒂、托梅尔·米凯利、程昕婷·德克勒、利希·泽尔尼克-马诺尔

用于单目深度估计的孔径监控

用于单目深度估计的孔径监控

Pratul Srinivasan、Rahul Garg、Neal Wadhwa、Ren Ng、Jonathan Barron

实例嵌入转移到无监督的视频对象分割

实例嵌入转移到无监督视频对象分割

李思阳,布莱恩·塞博尔德,阿列克谢·沃罗比约夫,阿里雷扎·法蒂,秦煌

帧回放视频超分辨率

帧重现视频超分辨率

迈赫迪·萨贾迪、拉维特加·维穆拉帕里、马修·布朗

稀疏时间池网络的弱监督行为定位

稀疏时间池网络的弱监督动作定位

阮福、刘汀、高塔姆·普拉萨德、韩博勇

超越卷积的迭代视觉推理

超越卷积的迭代视觉推理

陈、李丽佳、费、阿比纳夫·古普塔

学习和使用时间箭头

学习和使用时间之箭

魏东来,安德鲁·齐泽曼,威廉·弗里曼,约瑟夫·林

HydraNets:用于高效推理的专用动态架构

HydraNets:用于高效推理的专用动态架构

拉维·泰贾·穆拉普迪、诺姆·沙泽尔、威廉·马克、凯冯·法塔哈利安

在有限的监督下识别和定位胸部疾病

有限监督下的胸部疾病识别和定位

李哲、王冲、韩梅、薛源、魏巍、李丽佳、费-李非

推断分层文本-图像合成的语义布局

推断用于分层文本到图像合成的语义布局

洪成勋,杨,崔钟国,李洪烈

深层语义脸部去模糊

深层语义脸部去模糊

沈子怡、赖伟生、许廷发、简·考茨、明·

3D变形模型回归的无监督训练

用于3D变形模型回归的无监督训练

凯尔·吉诺瓦,福雷斯特·科尔,亚伦·马斯奇诺特,丹尼尔·维拉西奇,亚伦·萨纳,威廉·弗里曼

了解可扩展图像识别的可转换架构

学习用于可伸缩图像识别的可转移架构

巴雷特·佐夫,维贾伊·瓦苏德万,黄邦贤·施伦斯,阔克·勒

通过观察世界学习内在图像分解

从看世界中学习内在图像分解

李正奇,诺亚·斯内夫利

PiCANet:关注像素级别的上下文注意以检测显著性

PiCANet:学习用于显著性检测的逐像素上下文注意

、韩、、明

Tutorials

机器人和驾驶中的计算机视觉

机器人和驾驶的计算机视觉

桑娅·菲德勒·阿内莉亚·安热洛娃

无监督视觉学习

无监督视觉学习

阿内莉亚·安热洛娃·皮埃尔·塞尔马内

对人、物体和环境的超快速3D感测、重建和理解

对人、物体和环境的超快速3D感知、重建和理解

肖恩·法内洛、朱利安·瓦伦丁、乔纳森·泰勒、克里斯托夫·莱曼、阿达什·科德尔、于尔根·斯特伦、克里斯蒂娜·凯泽-陈、帕维尔·皮德立宾斯基、罗希特·潘迪、安德烈亚·塔利亚萨基、萨迈赫·哈米斯、戴维·金、·窦、·郭、唐丹航、沙赫拉姆·伊扎迪

生成对抗网络

生成性对抗网络

朱俊彦,朴泰成,米哈埃拉·罗斯卡,菲利普·伊索拉,伊恩·古德菲勒

伊恩·古德贝罗瓦:生成对抗网络(35 PPT)

世代建模:密度估计

训练数据→密度函数

生成建模:样本生成

训练数据(CelebA)→样本生成

对抗网络的框架

自我关注甘

ImageNet上的最佳FID:1000个类别,128x128像素

自己玩

你能用GAN做什么?

模拟环境和训练数据缺失数据半监督学习多个正确答案逼真的生成任务基于模型的优化自动化定制域适应

自动驾驶数据集

甘用来模拟训练数据

GAN用于缺失数据

从上面这张图像能看出什么呢?用GAN模型看出它是一张脸

GAN用于半监督学习

半监督学习的监督鉴别器

半监督分类

MNIST: 100训练标签 -> 80 测试错误SVHN: 1000 训练标签 -> 4.3% 测试误差 CIFAR-10: 4000 标签 -> 14.4% 测试误差

GAN用于预测下一个视频帧

GAN用于现实的发电任务

iGAN图像到图像翻译无监督的图像到图像翻译CycleGAN文本-图像合成

GAN用于基于模型的优化

设计DNA以优化蛋白质结合的研究

GAN用于自动定制

个性化的GANufacturing

GAN用于域适配

域对抗网络

甘的一些小技巧

在鉴别器和生成器中 (Zhang et al 2018) 都进行频谱归一化 (Miyato et al 2017)生成器和鉴别器的学习率不同(Heusel et al 2017)不需要比生成器更频繁地运行鉴别器(Zhang et al 2018) 许多不同的损失函数都能很好地工作(Lucic et al 2017); 可以花费更多时间调整超参数,而不是尝试不同的损失函数

以上解释了谷歌CVPR最完整的总结(doubleburst多少钱一包)。这篇文章已经分享到这里了,希望对大家有所帮助。如果信息有误,请联系边肖进行更正。

标签: cvpr 机器学习 gan 深度学习

0.038238s