Imagine2Real: Towards Zero-shot Humanoid-Object Interaction via Video Generative PriorsarXiv cs.CV2026年5月25日原文