Publications

Fan Ma, Xiaojie Jin, Heng Wang, Yuchen Xian, Jiashi Feng, Yi Yang (2024). Vista-LLaMA: Reliable Video Narrator via Equal Distance to Visual Tokens. CVPR 2024.

Dewei Zhou, You Li, Fan Ma, Xiaoting Zhang, Yi Yang (2024). MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis. CVPR 2024.

Yucheng Suo, Fan Ma, Linchao Zhu, Yi Yang (2024). Knowledge-Enhanced Dual-stream Zero-shot Composed Image Retrieval. CVPR 2024.

Ruijie Quan, Wenguan Wang, Zhibo Tian, Fan Ma, Yi Yang (2024). Psychometry: An Omnifit Model for Image Reconstruction from Human Brain Activity. CVPR 2024.

Ruijie Quan, Wenguan Wang, Fan Ma, Hehe Fan, Yi Yang (2024). Clustering for Protein Representation Learning. CVPR 2024.

Zhenglin Zhou, Fan Ma, Hehe Fan, Yi Yang (2024). HeadStudio: Text to Animatable Head Avatars with 3D Gaussian Splatting. Arxiv.

Chao Liang, Fan Ma, Linchao Zhu, Yi Yang (2024). CapHuman: Capture Your Moments in Parallel Universes. CVPR 2024.

Fan Ma, Xiaojie Jin, Heng Wang, Jingjia Huang, Linchao Zhu, Jiashi Feng, Yi Yang (2023). Temporal Perceiving Video-Language Pre-training. AAAI 2024.

Xingjian He, Sihan Chen, Fan Ma, Zhicheng Huang, Xiaojie Jin, Zikang Liu, Dongmei Fu, Yi Yang, Jing Liu, Jiashi Feng (2023). VLAB--Enhancing Video Language Pre-training by Feature Adapting and Blending. arxiv.

Fan Ma, Zheng Shou, Linchao Zhu, Haoqi Fan, Yilei Xu, Yi Yang, Zhicheng Yan (2022). Unified Transformer Tracker for Object Tracking. CVPR 2022.

Fan Ma, Linchao Zhu, Yi Yang (2022). Weakly Supervised Moment Localization with Decoupled Consistent Concept Prediction. IJCV 2022.

Fan Ma, Yu Wu, Xin Yu, Yi Yang (2021). Learning With Noisy Labels via Self-Reweighting From Class Centroids. TNNLS 2021.

Fan Ma, Deyu Meng, Xuanyi Dong, Yi Yang (2020). Self-paced Multi-view Co-training. JMLR 2020.

Fan Ma, Linchao Zhu, Yi Yang, Shengxin Zha, Gourab Kundu, Matt Feiszli, Zheng Shou (2020). SF-Net: Single-Frame Supervision for Temporal Action Localization.

Hao Wang, Cheng Deng, Fan Ma, Yi Yang (2020). Context modulated dynamic networks for actor and action video segmentation with language queries. AAAI 2020.

Xuanyi Dong, Liang Zheng, Fan Ma, Yi Yang, Deyu Meng (2017). Few-example object detection with model communication. TPAMI 2018.

Xuanyi Dong, Deyu Meng, Fan Ma, Yi Yang (2017). A dual-network progressive approach to weakly supervised object detection. ACM MM 2017.

Fan Ma, Deyu Meng, Qi Xie, Zina Li, X Dong (2017). Self-Paced Co-training. ICML 2017.