Code and documentation to train Stanford's Alpaca models, and generate the data.
An automatic evaluator for instruction-following language models. Human-validated, high-quality, cheap, and fast.
A simulation framework for RLHF and alternatives. Develop your RLHF method without collecting human data.
GPT4 based personalized ArXiv paper assistant bot
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Align your LM to express calibrated verbal statements of confidence in its long-form generations.
Code Release for "On the Inductive Bias of Masked Language Modeling: From Statistical to Syntactic Dependencies"
Fast ImageNet training code with FFCV
Theo dõi Tatsu's shared repositories với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này