新溪-gordon

V2025.05

AI

1. 常用
2. 理论
3. 大模型
4. RAG相关
5. NLP
6. 函数库
7. 学习框架
8. 关键网站
9. 实践
- 9.1. OCR
  - 9.1.1. 常用
- 9.2. AIML
  - 9.2.1. 常用
  - 9.2.2. AIML 2.1 Documentation
10. 开源项目
11. 数据集
12. 常见模型
13. 图形&计算加速技术
- 13.1. 常用
- 13.2. cuda
14. Evaluate评测
15. 传统AI

新溪-gordon

Docs »
2. 理论 »
2.14. RL-强化学习
View page source

On This Page

2.14. RL-强化学习
- 2.14.1. RL算法

2.14. RL-强化学习¶

2.14.1. RL算法¶

GRPO
A3C
TRPO

Next Previous

© Copyright 2010-2025, 新溪-gordon.

备案号京ICP备16018553号

Built with Sphinx using a theme provided by Read the Docs

.