方案总览

Case Study 入口

这里聚合了 2 个静态可视化方案。目录 ID 统一保留完整的 `method__vs__baseline` 信息,页面里则自动压缩长标签,避免总览页被长路径撑坏。

目录:visualization 方案数:2 命名:method__vs__baseline
Overview

总体概览

整体均分与评分汇总 JSON 的 `all_rows.overall` 保持一致,按题型宏平均计算。

已收录方案

2

可直接进入每个方案站点

累计共享样本

1000

按各方案 manifest 直接累加

累计显著分化案例

242

两类分化案例总和

平均净增益最佳

+3.97

方案:video_avic_v2_...20260319-114937

按全部共享样本平均

总净增益最佳

+1030.00

方案:video_avic_v2_...20260319-114937

按全部共享样本累计分差求和

Schemes

方案卡片

方法名做主标题,baseline 和目录 ID 压缩展示,既保留来源信息,也不再让整页看起来像文件列表。

Table

方法数据总表

首列合并方案、基线和目录 ID;整体均分按题型宏平均计算,右侧保留题型均分做横向对照。

方案 / 基线共享样本显著分化方法整体均分基线整体均分平均净增益总净增益obj_appearance_order(60)object_abs_distance(81)object_counting(55)object_rel_direction_easy(21)object_rel_direction_hard(37)object_rel_direction_medium(37)object_rel_distance(69)object_size_estimation(93)room_size_estimation(28)route_planning(19)
video_avic_v2...0260319-114937
vs qwen3vl-8b-instr...32frame_subset500
video_avic_v2_0-su...e_32frame_subset500
50013360.6556.69+3.97+1030.0075.0044.0769.4561.9043.2443.2460.8767.9667.8652.63
video_avic_v1...0260318-142842
vs qwen3vl-8b-instr...et500_multi_image
video_avic_v1-subs...bset500_multi_image
50010963.0662.62+0.44+10.0081.6748.7773.8261.9051.3551.3562.3270.7566.0747.37