📖 论文基本信息 项目 内容 标题 When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models 作者 Zhengyang Sun, Yu Chen, Xin Zhou, Xiaofan Li, Xiwu Chen 机构 待补充 发布时间 2026-04-09 arXiv 编号 PDF 下载 点击下载 💡 一句话总结 Text-to-video diffusion models have enabled open-ended video synthesis, but often struggle with generating the correct number of objects specified in a prompt. We introduce NUMINA , a training-free id…
🎯 研究背景 这部分需要深入分析论文要解决的核心问题
📖 论文基本信息 项目 内容 标题 In-Place Test-Time Training 作者 Guhao Feng, Shengjie Luo, Kai Hua, Ge Zhang, Di He… 机构 待补充 发布时间 2026-04-07 arXiv 编号 2604.06169v1 PDF 下载 点击下载 💡 一句话总结 The static ``train then deploy" paradigm fundamentally limits Large Language Models (LLMs) from dynamically adapting their weights in response to continuous streams of new information inherent in real…
🎯 研究背景 这部分需要深入分析论文要解决的核心问题
现有挑战 待补充:现有方法的局限性 研究动机 待补充:为什么这个问题重要 🔬 核心创新 这部分需要提炼 3-5 个技术突破点