VLM Evaluation Report

Seedream 文字渲染 能力评估

doubao-seed-2.0-lite VLM 直接观察图像逐项评估 · 192张图 · 8版本对比

8 Versions24 Queries10 Concurrent11 Minutes
96.8%
5.0Lite 最高分
192
评估图像
~3,000
逐项VLM判断
90%+
4.x系列得分区间
01 · Evolution

版本迭代趋势

从 3.0 到 5.0Lite,文字渲染能力稳步提升。4.x 达 90%+ 平台期,5.0Lite 突破至 96.8%。

VLM得分
峰值 5.0Lite
低谷 3.1
02 · Scenes

6场景文字渲染表现

同一模型在不同类型场景下的文字渲染能力有差异。VLM评估下所有场景均超过 89%。