经验库 / 773be2b0…

Organize literature review

结果：我现在已经收集了全面的搜索结果。接下来，我将整理最终的文献综述。 --- ## 视觉概念树相关文献综述基于你的 `vis_concept_tree.py` 和 6 类实体树（human, animal, object, scene, action, visual_style）的项目，我通过 arXiv API 检索了相关文献，按主题分组如下： ### 一、组合性视频生成与概念分解 | Paper | Venue/Year | Method | Key Result | 与本项目的关系 | |-------|-----------|--------|------------|----

auto_approved敏感 · lowresegmentedclaude-opus-4-7q=0.00复用 0访问 05/3/2026, 8:07:54 AMextraction: donesanitize: done#resplit#orig:d59f2a6a#seg2of2奖励标注

/var/lib/expool/trajectories/773be2b0-3a5d-4337-b966-a6dc53901451.json23 turn

用户#1

用户#2

助手#3

WebSearch is returning empty results. Let me try using the arXiv API directly and also try different search approaches.

助手#4

用户#5

助手#6

Good, arXiv API is working. I found a few relevant papers. Let me now do more targeted searches for the specific subtopics most relevant to this project.

助手#7

用户#8

助手#9

好的。现在我来搜索一些更具体的领域——视频理解分类学、视觉本体、结构化提示视频生成以及数据集组织。

助手#10

用户#11

助手#12

用户#13

助手#14

我找到了一些重要的论文。现在我来详细搜索我需要的关键论文——特别是 T2V-CompBench、VidGen-1M、LLM-Grounded Video Diffusion，以及一些更基础的论文。

助手#15

用户#16

助手#17

现在让我再搜索几篇更具体的论文——特别是关于视频生成、概念分解和 T2V 评估基准中的组合性的论文。

助手#18

用户#19

助手#20

Now let me also fetch the GenMAC and Sora survey papers' details, and search for a couple more important areas.

助手#21

用户#22

助手#23

我现在已经收集了全面的搜索结果。接下来，我将整理最终的文献综述。 --- ## 视觉概念树相关文献综述基于你的 `vis_concept_tree.py` 和 6 类实体树（human, animal, object, scene, action, visual_style）的项目，我通过 arXiv API 检索了相关文献，按主题分组如下： ### 一、组合性视频生成与概念分解 | Paper | Venue/Year | Method | Key Result | 与本项目的关系 | |-------|-----------|--------|------------|--------------| | **T2V-CompBench** (Sun et al., 2024) | arXiv 2407.14505 | 构建组合性 T2V 评测基准，将 prompt 拆分为 object/attribute/action/motion 维度 | 首个系统评估 T2V 模型组合能力的 benchmark | **最直接相关** — 其 object-attribute-ac

导出 JSON