新溪-gordon

V2025.02

书籍
极客时间
Matter 协议
rfc
iana
IEEE
ITU
- 常用
  - 电信标准化
    - 研究组
- X-Series
  - DIRECTORY
  - ASN.1
  - 参考
- G-Series
  - 参考
- H-Series
  - 参考
ISO
中标
- GB/T28181安全技术视频监控联网系统信息传输, 交换, 控制技术要求
pep
论文
临时
- 学习记录
  - 局域网内的服务发现会有什么方法
    - mDNS协议
    - 命令工具
  - 组播&广播

新溪-gordon

Docs »
论文 »
Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models
View page source

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models¶

https://arxiv.org/abs/2401.01335

Next Previous

© Copyright 2010-2025, 新溪-gordon.

备案号京ICP备16018553号

Built with Sphinx using a theme provided by Read the Docs

.