AlignBench

0.82 - Qwen 72B

AlignBench - Benchmark Leaderboard & Model Performance | AI Stats

Models Using This Benchmark

Organisation	Model	Reported	Top Score	Info	Self Reported	Source
Qwen	Qwen 72B	-	0.82	inferred family alias from qwen-2.5-72b-instruct (score=0.3060; benches=14)	Yes	Source
DeepSeek	DeepSeek V2.5 (2024-12-10)	10 Dec 2024	0.80	inferred alias from deepseek-v2.5	Yes	Source
DeepSeek	DeepSeek V2.5 (2024-09-05)	05 Sept 2024	0.80	inferred alias from deepseek-v2.5	Yes	Source
Qwen	Qwen 7B	-	0.73	inferred family alias from qwen-2.5-7b-instruct (score=0.3083; benches=14)	Yes	Source
Qwen	Qwen 2 Audio 7B	-	0.72	inferred modality/version alias from qwen2-7b-instruct	Yes	Source
Qwen	Qwen 2 Math 7B	-	0.72	inferred high-confidence family alias from qwen2-7b-instruct (score=0.4706; benches=14)	Yes	Source