什亭之匣 - 记录技术、阅读与日常

找不到相关结果。

主题色相

250

壁纸模式

壁纸设置

特效设置

看板娘

文章布局

论文笔记 5 Notes 1

置顶

2026-05-29

浏览量 --

博客迁移ing...

RegMix 论文笔记：Data Mixture as Regression for Language Model Pre-training

2025-09-14

浏览量 --

记录 RegMix 如何把数据配比优化转化为回归预测问题，以及排序不变性、狄利克雷采样和实验结论。

#RegMix #Data Mixture #LLM #Pretraining #Regression

Cover Image of the Post

DoReMi 论文笔记：Optimizing Data Mixtures Speeds Up Language Model Pretraining

2025-09-12

浏览量 --

记录 DoReMi 如何用小代理模型优化预训练数据配比，以及 Group DRO、excess loss 和实验结论。

#DoReMi #Data Mixture #LLM #Pretraining #Group DRO

Cover Image of the Post

SVGenius 论文笔记：Benchmarking LLMs in SVG Understanding, Editing and Generation

2025-09-08

浏览量 --

记录 SVGenius 基准的任务框架、数据构建、评估指标、实验结果与局限。

#SVGenius #SVG #LLM #Benchmark #Vector Graphics

Cover Image of the Post

UniSVG 论文笔记：A Unified Dataset for Vector Graphic Understanding and Generation with Multimodal Large Language Models

2025-09-07

浏览量 --

记录 UniSVG 论文的数据构建、任务设计、评估指标、实验结果与局限。

#UniSVG #SVG #MLLM #Benchmark #Vector Graphics

Cover Image of the Post

SWE-bench 论文笔记：Can Language Models Resolve Real-World GitHub Issues?

2025-09-01

浏览量 --

记录 SWE-bench 论文的背景、构造方法、执行验证、实验结果与局限。

#SWE-bench #Benchmark #LLM #Software Engineering

Cover Image of the Post

千早爱音

记录技术、阅读与日常的个人站点。

Benchmark Blog Data Mixture DoReMi Group DRO LLM MLLM Pretraining RegMix Regression Software Engineering SVG SVGenius SWE-bench UniSVG Vector Graphics

文章

6

分类

2

标签

16

总字数

27,544

运行时长

0 天

最后活动

0 天前

文章目录