claude-opus-4-1-20250805 vs grok-4.20-beta-0309-reasoning Benchmark Comparison

Direct benchmark comparison between claude-opus-4-1-20250805 and grok-4.20-beta-0309-reasoning based on LMArena Elo and the latest 2026 API pricing.

Direct Technical & Pricing Comparison

Frontier Model	LMArena Elo	API Cost (1M)	Throughput
claude-opus-4-1-20250805	1447	$0.000015	13
grok-4.20-beta-0309-reasoning	1479	$0.000002	107

*These models represent the Pareto Frontier (optimal cost-to-performance).*

Comparison Summary: grok-4.20-beta-0309-reasoning is the more capable model in this pair, leading by 32 Elo points.