Knowledge Base

全部笔记

这里汇集了所有的学习笔记(共 2 篇),你可以通过分类筛选或标签来查找感兴趣的内容。

Ref COCO系列

BenchmarkDetectionCOCO
AI

GRPO之前的强化学习算法

综述GRPO之前的RL历史

强化学习PPOSurvey