Fine-Tuning

01 Intro Basics (0)

02 Prepare Dataset (0)

Agent Tracing (0)

Available models (0)

Azure OpenAI Fine-Tuning (0)

Basics (0)

Build with Fireworks AI (0)

Checkpoints and Resume (0)

Classification Finetuning (0)

Classifier Factory (0)

Cleanup and Teardown (0)

Cookbook Reference (0)

Cookbook: Distillation (0)

Cookbook: DPO (0)

Cookbook: Reinforcement Learning (0)

Cookbook: SFT (0)

Cost Estimator (0)

Create RL Training Job (0)

Create SFT Training Job (0)

Creating a fine-tuned LoRA (0)

Data Preparation (0)

Data Security (0)

Debug SFT tokenization (0)

Deploy Finetuned Command Models from AWS Marketplace (0)

Deploy your finetuned model on AWS Marketplace (0)

Deploying a Fine-tuned Model (0)

Deploying Fine Tuned Models (0)

DeploymentManager (Compatibility) (0)

DeploymentSampler (0)

Direct preference optimization (0)

Direct Preference Optimization (0)

Distillation (0)

Distillation Trainer (0)

Distributing Training (0)

download the validation and reformat script (0)

Evaluators (0)

Fine Tuning FAQs (0)

Fine-tuning (0)

Fine-Tuning Across Providers (0)

Fine-tuning best practices (0)

Fine-tuning BYOM (0)

Fine-tuning Guide (0)

Fine-Tuning Large Language Models (0)

Finetuning Agents (0)

Finetuning Cohere Models on AWS Sagemaker (0)

Finetuning on Cohere's Platform (0)

FiretitanServiceClient & TrainingClient (0)

Fireworks Agent Overview (0)

Fireworks Agent: Classification (0)

Fireworks Agent: Evaluator Authoring (0)

Fireworks Agent: Preference Learning (DPO/ORPO) (0)

Fireworks Agent: Supervised Fine-Tuning (0)

FireworksClient (0)

Function Calling Fine-tuning (0)

General Online Logit Distillation (GOLD) Trainer (0)

Generalized Knowledge Distillation Trainer (0)

get data from hugging face (0)

Get Training Job (0)

Get Training Job Events (0)

Glossary (0)

GPU Clusters Overview (0)

Graders (0)

How to use Serverless SFT (0)

Hugging Face Accelerate (0)

Incremental Snapshots (ARC2) (0)

Introduction (0)

Ledger & Debugging for RL Rollouts (0)

LLM Course (0)

Log distributed training experiments (0)

LoRA Fine-Tuning and Inference (0)

Loss Functions (0)

Managed Fine-Tuning Overview (0)

Model customization (0)

Model optimization (0)

Monitor Training (0)

NLP Course (0)

OpenAI Fine-Tuning (0)

openapi (0)

OpenEnv Integration for Training LLMs with Environments (0)

OpenReward Integration for Training LLMs with Environments (0)

Optimizing LLM Accuracy (0)

Orthogonal Finetuning (OFT and BOFT) (0)

Overview (0)

Overview (0)

Parameter Tuning (0)

Post-Training Toolkit Integration (0)

Practical Deep Learning for Coders (0)

Preference Fine-Tuning (0)

Prerequisites (0)

Price comparison vs Tinker (0)

Pricing (0)

Quickstart (0)

Reasoning Fine-tuning (0)

Reinforcement fine-tuning (0)

Reinforcement fine-tuning use cases (0)

Remote Agent Quickstart (0)

Remote Environment Setup (0)

RFT parameters reference (0)

RL Rollouts with Your Own Trainer (0)

Saving and Loading (0)

Secure Training (BYOB) (0)

Single-Turn Training Quickstart (0)

Speeding Up Training (0)

Supervised Fine Tuning - Text (0)

Supervised Fine Tuning - Vision (0)

Supervised fine-tuning (0)

Supported Models (0)

Text & Vision Fine-tuning (0)

The Cookbook (0)

Together AI (0)

Together AI Skills (0)

TrainerJobManager (Compatibility) (0)

Training (0)

Training and Sampling (0)

Training customization (0)

Training Guide: UI (0)

Training Overview (0)

Training Overview (0)

Training Prerequisites & Validation (0)

Training Shapes (0)

Training with Jobs (0)

Understanding LoRA performance (0)

Upload a Model (0)

Usage information and limits (0)

Use Fireworks Agent with Claude Code, Cursor, Codex, and other coding agents (0)

Use model after training (0)

Use Serverless LoRA Inference (0)

Use Weave with W&B training runs (0)

Use your trained models (0)

Using Secrets (0)

Verifiers (0)

Vision fine-tuning (0)

Vision Inputs (0)

Vision-Language Fine-tuning (0)

W&B Mobile App (iOS) (0)

W&B Training (0)

Warm Start from Fine-Tuned Models (0)

Weight sync (0)

Weighted Training (0)

WeightSyncer (Legacy) (0)

Welcome to LLM University! (0)

Workspaces (0)