HealthBench Concensus

HealthBench Concensus - Benchmark Leaderboard & Model Performance | AI Stats

Organisation	Model	Reported	Top Score	Info	Self Reported	Source
OpenAI	GPT OSS 120b	05 Aug 2025	90.80%	Medium Reasoning Effort	Yes	Source
OpenAI	GPT OSS 20b	05 Aug 2025	84.90%	Low Reasoning Effort	Yes	Source