Jian Ren

Selected Media Coverage

Image Generation Models: TechCrunch (1, 2), The Verge, Snap Newsroom (1, 2)

3D Generation and Rendering: YouTube, Reuters

Video Generation Models: TechCrunch (1, 2)

2025

SnapGen: Taming High-Resolution Text-to-Image Models for Mobile Devices with Efficient Architectures and Training
Dongting Hu, Jierun Chen, Xijie Huang, Huseyin Coskun, Arpit Sahni, Aarush Gupta, Anujraaj Goyal, Dishani Lahiri, Rajesh Singh, Yerlan Idelbayev, Junli Cao, Yanyu Li, Kwang-Ting Cheng, S.-H. Gary Chan, Mingming Gong, Sergey Tulyakov, Anil Kag, Yanwu Xu, Jian Ren
CVPR, 2025 (Highlight)

Project arXiv PDF

Wonderland: Navigating 3D Scenes from a Single Image
Hanwen Liang, Junli Cao, Vidit Goel, Guocheng Qian, Sergei Korolev, Demetri Terzopoulos, Konstantinos N. Plataniotis, Sergey Tulyakov, Jian Ren
CVPR, 2025

Project / arXiv / PDF

SnapGen-V: Generating a Five-Second Video within Five Seconds on a Mobile Device
Yushu Wu, Zhixing Zhang, Yanyu Li, Yanwu Xu, Anil Kag, Yang Sui, Huseyin Coskun, Ke Ma, Aleksei Lebedev, Ju Hu, Dimitris Metaxas, Yanzhi Wang, Sergey Tulyakov, Jian Ren
CVPR, 2025

Project / arXiv / PDF

Lightweight Predictive 3D Gaussian Splats
Junli Cao, Vidit Goel, Chaoyang Wang, Anil Kag, Ju Hu, Sergei Korolev,
Chenfanfu Jiang, Sergey Tulyakov, Jian Ren
ICLR, 2025

arXiv / PDF

2024

AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation
Anil Kag, Huseyin Coskun, Jierun Chen, Junli Cao, Willi Menapace, Aliaksandr Siarohin,
Sergey Tulyakov, Jian Ren
NeurIPs, 2024

Project / arXiv / PDF

SF-V: Single Forward Video Generation Model
Zhixing Zhang, Yanyu Li, Yushu Wu, Yanwu Xu, Anil Kag, Ivan Skorokhodov, Willi Menapace, Aliaksandr Siarohin, Junli Cao, Dimitris Metaxas, Sergey Tulyakov, Jian Ren
NeurIPs, 2024

Project / arXiv / PDF

BitsFusion: 1.99 bits Weight Quantization of Diffusion Model
Yang Sui, Yanyu Li, Anil Kag, Yerlan Idelbayev, Junli Cao, Ju Hu, Dhritiman Sagar,
Bo Yuan, Sergey Tulyakov, Jian Ren
NeurIPs, 2024

Project / arXiv / PDF

Efficient Training with Denoised Neural Weights
Yifan Gong, Zheng Zhan, Yanyu Li, Yerlan Idelbayev, Andrey Zharkov,
Kfir Aberman, Sergey Tulyakov, Yanzhi Wang, Jian Ren
ECCV, 2024

Project / arXiv / PDF

E²GAN: Efficient Training of Efficient GANs for Image-to-Image Translation
Yifan Gong, Zheng Zhan, Qing Jin, Yanyu Li, Yerlan Idelbayev, Xian Liu,
Andrey Zharkov, Kfir Aberman, Sergey Tulyakov, Yanzhi Wang, Jian Ren
ICML, 2024

Project / arXiv / PDF

TextCraftor: Your Text Encoder Can be Image Quality Controller
Yanyu Li, Xian Liu, Anil Kag, Ju Hu, Yerlan Idelbayev, Dhritiman Sagar, Yanzhi Wang,
Sergey Tulyakov, Jian Ren
CVPR, 2024

arXiv / PDF

Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis
Willi Menapace, Aliaksandr Siarohin, Ivan Skorokhodov, Ekaterina Deyneka,
Tsai-Shien Chen, Anil Kag, Yuwei Fang, Aleksei Stoliar, Elisa Ricci, Jian Ren, Sergey Tulyakov
CVPR, 2024 (Highlight)

Project / arXiv / PDF

Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers
Tsai-Shien Chen, Aliaksandr Siarohin, Willi Menapace, Ekaterina Deyneka,
Hsiang-wei Chao, Byung Eun Jeon, Yuwei Fang, Hsin-Ying Lee, Jian Ren, Ming-Hsuan Yang, Sergey Tulyakov
CVPR, 2024

Project / code / arXiv / PDF

SPAD: Spatially Aware Multiview Diffusers
Yash Kant, Ziyi Wu, Michael Vasilkovsky, Guocheng Qian, Jian Ren, Riza Alp Guler,
Bernard Ghanem, Sergey Tulyakov, Igor Gilitschenski, Aliaksandr Siarohin
CVPR, 2024

Project / code / arXiv / PDF

HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion
Xian Liu, Jian Ren, Aliaksandr Siarohin, Ivan Skorokhodov, Yanyu Li,
Dahua Lin, Xihui Liu, Ziwei Liu, Sergey Tulyakov
ICLR, 2024

Project / OpenReview / arXiv / PDF

Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors
Guocheng Qian, Jinjie Mai, Abdullah Hamdi, Jian Ren, Aliaksandr Siarohin, Bing Li,
Hsin-Ying Lee, Ivan Skorokhodov, Peter Wonka, Sergey Tulyakov, Bernard Ghanem
ICLR, 2024

Project / OpenReview / arXiv / PDF / code

2023

SnapFusion: Text-to-Image Diffusion Model on Mobile Devices within Two Seconds
Yanyu Li, Huan Wang, Qing Jin, Ju Hu, Pavlo Chemerys, Yun Fu, Yanzhi Wang,
Sergey Tulyakov, Jian Ren
NeurIPs, 2023

Project / arXiv / PDF

LightSpeed: Light and Fast Neural Light Fields on Mobile Devices
Aarush Gupta, Junli Cao, Chaoyang Wang, Ju Hu, Sergey Tulyakov,
Jian Ren, László A Jeni
NeurIPs, 2023

Project / arXiv / PDF

iNVS: Repurposing Diffusion Inpainters for Novel View Synthesis
Yash Kant, Aliaksandr Siarohin, Michael Vasilkovsky, Riza Alp Guler,
Jian Ren, Sergey Tulyakov, Igor Gilitschenski
SIGGRAPH Asia, 2023

Project / arXiv / PDF

Rethinking Vision Transformers for MobileNet Size and Speed
Yanyu Li, Ju Hu, Yang Wen, Georgios Evangelidis, Kamyar Salahi, Yanzhi Wang,
Sergey Tulyakov, Jian Ren
ICCV, 2023

code / arXiv / PDF

COMCAT: Towards Efficient Compression and Customization of Attention-Based Vision Models
Jinqi Xiao, Miao Yin, Yu Gong, Xiao Zang, Jian Ren, Bo Yuan
ICML, 2023

code / arXiv / PDF

Real-Time Neural Light Field on Mobile Devices
Junli Cao, Huan Wang, Pavlo Chemerys, Vladislav Shakhrai, Ju Hu, Yun Fu,
Denys Makoviichuk, Sergey Tulyakov, Jian Ren
CVPR, 2023

Project / arXiv / code / PDF

SINE: SINgle Image Editing with Text-to-Image Diffusion Models
Zhixing Zhang, Ligong Han, Arnab Ghosh, Dimitris N. Metaxas, Jian Ren
CVPR, 2023

Project / arXiv / code / PDF

Unsupervised Volumetric Animation
Aliaksandr Siarohin, Willi Menapace, Ivan Skorokhodov, Jian Ren, Hsin-Ying Lee,
Menglei Chai, Kyle Olszewski, Sergey Tulyakov
CVPR, 2023

Project / arXiv / code / PDF

Make-A-Story: Visual Memory Conditioned Consistent Story Generation
Tanzila Rahman, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Shweta Mahajan,
Leonid Sigal
CVPR, 2023

arXiv / PDF

Invertible Neural Skinning
Yash Kant, Aliaksandr Siarohin, Riza Alp Guler, Menglei Chai, Jian Ren,
Sergey Tulyakov, Igor Gilitschenski
CVPR, 2023

Project / arXiv / code / video / PDF

3D Generation on ImageNet
Ivan Skorokhodov, Aliaksandr Siarohin, Yinghao Xu, Jian Ren, Hsin-Ying Lee,
Peter Wonka, Sergey Tulyakov
ICLR, 2023 (Oral)

Project / OpenReview / arXiv / code / PDF

Discrete Contrastive Diffusion for Cross-Modal and Conditional Generation
Ye Zhu, Yu Wu, Kyle Olszewski, Jian Ren, Sergey Tulyakov, Yan Yan
ICLR, 2023

Project / OpenReview / arXiv / code / PDF

2022

EfficientFormer: Vision Transformers at MobileNet Speed
Yanyu Li, Geng Yuan, Yang Wen, Ju Hu, Georgios Evangelidis, Sergey Tulyakov,
Yanzhi Wang, Jian Ren
NeurIPs, 2022

code / arXiv / PDF

Layer Freezing & Data Sieving: Missing Pieces of a Generic Framework for Sparse Training
Geng Yuan, Yanyu Li, Sheng Li, Zhenglun Kong, Sergey Tulyakov, Xulong Tang,
Yanzhi Wang, Jian Ren
NeurIPs, 2022

code / arXiv / PDF

R2L: Distilling Neural Radiance Field to Neural Light Field for Efficient Novel View Synthesis
Huan Wang, Jian Ren, Zeng Huang, Kyle Olszewski, Menglei Chai, Yun Fu, Sergey Tulyakov
ECCV, 2022

Project / code / arXiv / PDF

Cross-Modal 3D Shape Generation and Manipulation
Zezhou Cheng, Menglei Chai, Jian Ren, Hsin-Ying Lee, Kyle Olszewski, Zeng Huang,
Subhransu Maji, Sergey Tulyakov
ECCV, 2022

Project / code / arXiv / PDF

Show Me What and Tell Me How: Video Synthesis via Multimodal Conditioning
Ligong Han, Jian Ren, Hsin-Ying Lee, Francesco Barbieri, Kyle Olszewski,
Shervin Minaee, Dimitris Metaxas, Sergey Tulyakov
CVPR, 2022

Project / code / arXiv / PDF

Are Multimodal Transformers Robust to Missing Modality?
Mengmeng Ma, Jian Ren, Long Zhao, Davide Testuggine, Xi Peng
CVPR, 2022

PDF / arXiv

In&Out: Diverse Image Outpainting via GAN Inversion
Yen-Chi Cheng, Chieh Hubert Lin, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov,
Ming-Hsuan Yang
CVPR, 2022

Project / arXiv / code / PDF

F8Net: Fixed-Point 8-bit Only Multiplication for Network Quantization
Qing Jin, Jian Ren, Richard Zhuang, Sumant Hanumante, Zhengang Li, Zhiyu Chen,
Yanzhi Wang, Kaiyuan Yang, Sergey Tulyakov
ICLR, 2022 (Oral)

OpenReview / PDF / arXiv / code

2021

Lottery Ticket Implies Accuracy Degradation, Is It a Desirable Phenomenon?
Ning Liu, Geng Yuan, Zhengping Che, Xuan Shen, Xiaolong Ma, Qing Jin, Jian Ren,
Jian Tang, Sijia Liu, Yanzhi Wang
ICML, 2021

arXiv / PDF

Flow Guided Transformable Bottleneck Networks for Motion Retargeting
Jian Ren, Menglei Chai, Oliver Woodford, Kyle Olszewski, Sergey Tulyakov
CVPR, 2021

arXiv / PDF

Motion Representations for Articulated Animation
Aliaksandr Siarohin, Oliver Woodford, Jian Ren, Menglei Chai, Sergey Tulyakov
CVPR, 2021

Project / arXiv / code / PDF / YouTube

Teachers Do More Than Teach: Compressing Image-to-Image Models
Qing Jin, Jian Ren, Oliver J. Woodford, Jiazhuo Wang, Geng Yuan, Yanzhi Wang, Sergey Tulyakov
CVPR, 2021

Project / arXiv / code / PDF / Tutorial ( Image To Image Translation) / Blog

A Good Image Generator Is What You Need for High-Resolution Video Synthesis
Yu Tian, Jian Ren, Menglei Chai, Kyle Olszewski, Xi Peng, Dimitris Metaxas,
Sergey Tulyakov
ICLR, 2021 (Spotlight)

Project / OpenReview / arXiv / code / PDF / Talk & Slides

SMIL: Multimodal learning with severely missing modality
Mengmeng Ma, Jian Ren, Long Zhao, Sergey Tulyakov, Cathy Wu, Xi Peng
AAAI, 2021

arXiv / code / YouTube / PDF