启动 Streamlit 浏览处理后的数据
结果:全部完成。 **产出文件**: `/inspire/qb-ilm/project/video-generation/public/pipeline/lance/20260206_pretrian/sample50000_action_l2l3.jsonl` **Streamlit 预览**: 你之前的代理 URL 应该可以用: `https://nat2-notebook-inspire.sii.edu.cn/ws-6e6ba362-e98e-45b2-9c5a-311998e93d65/project-7e0957fb-eaa7-4ded-8dca-dd508b2ae01d/user-ef4936dd-0231-4485-ba30-34e92bf3ea53/vscode/<CARD>efd-84fd-43fc2db17b42/2126a854-2749-48db-8db9-8d8465bad303/proxy/8521/` 注意:preview_app.py 默认读的是旧字段,你可能需要在 app 里手动浏览 `sample50000_action_l2l3.jsonl`,新字
我看已经好了 启动个streamlit感觉可以看下
完成了!50k 全部跑完,49953 ok / 47 fail,26.4 分钟。 现在启动 streamlit 预览。
Streamlit 已启动。不过注意 preview_app.py 是为旧字段(entity_L2, action_L2, quality_issues 等)设计的,新输出文件是 `sample50000_action_l2l3.jsonl`(只有 action_L2, action_L3),你可能需要在 app 里手动选择这个文件。 **打标结果统计**: - 50,000 条,26.4 分钟完成 - ok=49,953 / fail=47(99.9% 成功率) - L2 Top: basic manipulation(7811) > performance & leisure(6074) > electronic device(4604) > vehicle(4347) - L3 Top: expression(8836) > hold(7936) > communication(6626) > music(4374) > phone(3958)
全部完成。 **产出文件**: `/inspire/qb-ilm/project/video-generation/public/pipeline/lance/20260206_pretrian/sample50000_action_l2l3.jsonl` **Streamlit 预览**: 你之前的代理 URL 应该可以用: `https://nat2-notebook-inspire.sii.edu.cn/ws-6e6ba362-e98e-45b2-9c5a-311998e93d65/project-7e0957fb-eaa7-4ded-8dca-dd508b2ae01d/user-ef4936dd-0231-4485-ba30-34e92bf3ea53/vscode/<CARD>efd-84fd-43fc2db17b42/2126a854-2749-48db-8db9-8d8465bad303/proxy/8521/` 注意:preview_app.py 默认读的是旧字段,你可能需要在 app 里手动浏览 `sample50000_action_l2l3.jsonl`,新字段 `action_L2`/`action_L3` 会显示在数据表里但不会有专门的过滤器。