Organize literature review
结果:我现在已经收集了全面的搜索结果。接下来,我将整理最终的文献综述。 --- ## 视觉概念树相关文献综述 基于你的 `vis_concept_tree.py` 和 6 类实体树(human, animal, object, scene, action, visual_style)的项目,我通过 arXiv API 检索了相关文献,按主题分组如下: ### 一、组合性视频生成与概念分解 | Paper | Venue/Year | Method | Key Result | 与本项目的关系 | |-------|-----------|--------|------------|----
WebSearch is returning empty results. Let me try using the arXiv API directly and also try different search approaches.
Good, arXiv API is working. I found a few relevant papers. Let me now do more targeted searches for the specific subtopics most relevant to this project.
好的。现在我来搜索一些更具体的领域——视频理解分类学、视觉本体、结构化提示视频生成以及数据集组织。
我找到了一些重要的论文。现在我来详细搜索我需要的关键论文——特别是 T2V-CompBench、VidGen-1M、LLM-Grounded Video Diffusion,以及一些更基础的论文。
现在让我再搜索几篇更具体的论文——特别是关于视频生成、概念分解和 T2V 评估基准中的组合性的论文。
Now let me also fetch the GenMAC and Sora survey papers' details, and search for a couple more important areas.
我现在已经收集了全面的搜索结果。接下来,我将整理最终的文献综述。 --- ## 视觉概念树相关文献综述 基于你的 `vis_concept_tree.py` 和 6 类实体树(human, animal, object, scene, action, visual_style)的项目,我通过 arXiv API 检索了相关文献,按主题分组如下: ### 一、组合性视频生成与概念分解 | Paper | Venue/Year | Method | Key Result | 与本项目的关系 | |-------|-----------|--------|------------|--------------| | **T2V-CompBench** (Sun et al., 2024) | arXiv 2407.14505 | 构建组合性 T2V 评测基准,将 prompt 拆分为 object/attribute/action/motion 维度 | 首个系统评估 T2V 模型组合能力的 benchmark | **最直接相关** — 其 object-attribute-ac