SVGenius 论文笔记:Benchmarking LLMs in SVG Understanding, Editing and Generation
记录 SVGenius 基准的任务框架、数据构建、评估指标、实验结果与局限。
UniSVG 论文笔记:A Unified Dataset for Vector Graphic Understanding and Generation with Multimodal Large Language Models
记录 UniSVG 论文的数据构建、任务设计、评估指标、实验结果与局限。
SWE-bench 论文笔记:Can Language Models Resolve Real-World GitHub Issues?
记录 SWE-bench 论文的背景、构造方法、执行验证、实验结果与局限。