菜单

Research
- Research Index
- Demo
Blog
About
Career

ICCV

VideoLLaMB: Long-context Video Understanding with Recurrent Memory Bridges

TACO: Taming Diffusion for in-the-wild Video Amodal Completion

GWM: Towards Scalable Gaussian World Models for Robotic Manipulation

Trace3D: Consistent Segmentation Lifting via Gaussian Instance Tracing

Embodied VideoAgent: Persistent Memory from Egocentric Videos and Embodied Sensors Enables Dynamic Scene Understanding

Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation

PrimHOI: Compositional Human-Object Interaction via Reusable Primitives

UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-aware Curriculum and Iterative Generalist-Specialist Learning

ARNOLD: A Benchmark for Language-Grounded Task Learning with Continuous States in Realistic 3D Scenes

IntentQA: Context-aware Video Intent Reasoning

文章分页

1 2 后一页 →

Copyright © 2023 BIGAI:Beijing Institute for General Artificial Intelligence

Facebook-f Twitter Google-plus-g Pinterest

Scroll to Top