Experiments | Applied Models

Experiments

A compact evaluation suite for planning, tool choice, self-correction, and distractor resistance in smaller open models.

2026-02-28 · In progress · Eval suite