2026  3

April  3

Agentic RL 的本质:从"给模型接工具"到"给模型放进环境"

April 25, 2026 · 3 min · Chaoyu Wang

Agent-World:看清当下开源与闭源 Agent 能力差距的一面镜子

April 24, 2026 · 3 min · Chaoyu Wang

RL 训练中该看哪些指标:从 entropy 到 faithfulness 的尺度梳理

April 24, 2026 · 4 min · Chaoyu Wang