NYT Connections

NYT Connections - Benchmark Leaderboard & Model Performance | AI Stats

Models Using This Benchmark

Organisation	Model	Reported	Top Score	Info	Self Reported	Source
Google	Gemini 3.1 Pro Preview	19 Feb 2026	98.40	940 puzzles	No	Source
OpenAI	GPT 5.5	23 Apr 2026	97.50	xHigh reasoning; 940 puzzles	No	Source
Google	Gemini 3 Pro Preview	18 Nov 2025	96.30	940 puzzles	No	Source
Google	Gemini 3.5 Flash	19 May 2026	95.20	940 puzzles	No	Source
Anthropic	Claude Opus 4.6	05 Feb 2026	94.70	High reasoning; 940 puzzles	No	Source
Anthropic	Claude Opus 4.8	28 May 2026	94.10	xHigh reasoning; 940 puzzles	No	Source
OpenAI	GPT 5.4	05 Mar 2026	94	xHigh reasoning; 940 puzzles	No	Source
xAI	Grok 4.20 Multi Agent Beta	17 Feb 2026	93.40	940 puzzles	No	Source
xAI	Grok 4.1 Thinking	17 Nov 2025	91.80	Fast reasoning; 940 puzzles	No	Source
Moonshot	Kimi K2.6	20 Apr 2026	91.40	940 puzzles	No	Source
xAI	Grok 4.20	17 Feb 2026	90.40	Reasoning; 940 puzzles	No	Source
Qwen	Qwen 3.7 Max	21 May 2026	89.80	940 puzzles	No	Source
OpenAI	GPT 5.2	11 Dec 2025	88.60	xHigh reasoning; 940 puzzles	No	Source
Google	Gemini 3 Flash Preview	17 Dec 2025	88.40	940 puzzles	No	Source
Anthropic	Claude Sonnet 4.6	17 Feb 2026	85.70	High reasoning; 940 puzzles	No	Source
OpenAI	GPT 5.2 Pro	11 Dec 2025	85.70	940 puzzles	No	Source
z.AI	GLM 5.1	07 Apr 2026	84.40	940 puzzles	No	Source
Qwen	Qwen 3.6 Max Preview	-	82.20	940 puzzles	No	Source
z.AI	GLM 5	11 Feb 2026	81.80	940 puzzles	No	Source
Google	Gemma 4 31B	02 Apr 2026	79.50	Reasoning; 940 puzzles	No	Source
Moonshot	Kimi K2.5	27 Jan 2026	78.30	Thinking; 940 puzzles	No	Source
DeepSeek	DeepSeek V4 Pro	24 Apr 2026	75.70	940 puzzles	No	Source
OpenAI	GPT 5.4 Mini	17 Mar 2026	71.80	xHigh reasoning; 940 puzzles	No	Source
Qwen	Qwen 3.6 Plus	01 Apr 2026	71.30	940 puzzles	No	Source
Qwen	Qwen 3.5 397B A17B	16 Feb 2026	69.30	940 puzzles	No	Source
xAI	Grok 4.3	30 Apr 2026	67.50	940 puzzles	No	Source
Qwen	Qwen 3.5 122B A10B	24 Feb 2026	63.60	940 puzzles	No	Source
Anthropic	Claude Opus 4.5	24 Nov 2025	62.60	16K thinking; 940 puzzles	No	Source
Qwen	Qwen 3.5 27B	24 Feb 2026	60.80	940 puzzles	No	Source
DeepSeek	DeepSeek V4 Flash	24 Apr 2026	53.20	940 puzzles	No	Source
DeepSeek	DeepSeek V3.2	01 Dec 2025	50.20	940 puzzles	No	Source
Anthropic	Claude Sonnet 4.5	29 Sept 2025	49.40	16K thinking; 940 puzzles	No	Source
Xiaomi	MiMo V2.5 Pro	22 Apr 2026	48	940 puzzles	No	Source
ByteDance	Seed 2.0 Pro	14 Feb 2026	42.10	940 puzzles	No	Source
Qwen	Qwen3 Max 2026 01 23	-	42.10	940 puzzles	No	Source
Anthropic	Claude Opus 4.7	16 Apr 2026	41	High reasoning; 940 puzzles	No	Source
Xiaomi	MiMo V2 Pro	18 Mar 2026	41	940 puzzles	No	Source
StepFun	Step 3.5 Flash	-	36.70	940 puzzles	No	Source
MiniMax	MiniMax M2.7	18 Mar 2026	35.30	940 puzzles	No	Source
Meituan	Longcat Flash Cat	-	31	Thinking; 940 puzzles	No	Source
Tencent Hunyuan	Hy3 Preview	23 Apr 2026	30.20	940 puzzles	No	Source
MiniMax	MiniMax M2.5	12 Feb 2026	29.60	940 puzzles	No	Source
Arcee AI	Trinity Large Thinking	01 Apr 2026	29.50	940 puzzles	No	Source
MiniMax	MiniMax M2	27 Oct 2025	27	940 puzzles	No	Source
Nvidia	Nemotron 3 Super	11 Mar 2026	26.90	940 puzzles	No	Source
Anthropic	Claude Haiku 4.5	15 Oct 2025	26	940 puzzles	No	Source
Mistral	Mistral Medium 3.5	29 Apr 2026	25.20	High; 940 puzzles	No	Source
xAI	Grok 4.1 Non Thinking	17 Nov 2025	25.10	Fast non-reasoning; 940 puzzles	No	Source
Qwen	Qwen 3 Max Thinking	26 Jan 2026	24.20	940 puzzles	No	Source
MiniMax	MiniMax M2.1	23 Dec 2025	22.70	940 puzzles	No	Source
Baidu	Ernie 5.0	22 Jan 2026	21.20	940 puzzles	No	Source
Google	Gemini 3.1 Flash Lite Preview	03 Mar 2026	19.70	940 puzzles	No	Source
Meta	Llama 4 Maverick	05 Apr 2025	18.40	940 puzzles	No	Source
Mistral	Mistral Large 3.0	02 Dec 2025	17.20	940 puzzles	No	Source
Mistral	Mistral Medium 3.1	12 Aug 2025	15.50	940 puzzles	No	Source
Inclusion AI	Ling 2.6 1T	-	10.80	940 puzzles	No	Source

Recorded Results

Average Score

Score Range

Leading Model

Models Using This Benchmark