Chatbot Arena 2026年4月：Anthropicが上位4枠独占、オープンソースとの差が縮まる

2026年4月末現在、LMSYS Chatbot Arenaの最新ランキングは明確な構図を示している：Anthropicがテキストとコードの両トラックでリードする一方、オープンソース阵营の追い上げが加速している。

テキストTop 10：Anthropicが4枠を独占

ArenaテキストリーダーボードのTop 10（Eloスコア、高いほど良い）：

4つの重要な観察ポイント：

Anthropicのthinkingモードが明確な優位性を示す。 claude-opus-4-7-thinkingが1503で1位、thinkingなしの同バージョン（1493）より10ポイント高い。コードリーダーボードではこの差がさらに顕著で、thinkingモードは1571に達する。

OpenAI GPT-5.5が期待を下回る。 gpt-5.5-highが1488で7位、Claude全バリアントとGemini 3.1 Proに後れを取る。±10の誤差範囲はTop 10中で最大、ユーザー評価のばらつきが最も大きいことを示す。

Meta muse-sparkが初めてTop 6入り。 1489でGPT-5.5を上回り、Anthropic/Google以外で最高位のモデルとなった。

Googleの双子は安定だがブレイクスルーなし。 gemini-3.1-pro-preview（1493）とgemini-3-pro（1486）の差が小さく、3.0から3.1 Proへの改善がユーザー側で限定的であることを示唆。

GLM-5.1とKimi-K2.6はそれぞれ1534と1529で、コードArenaにおける中国モデルの最高成績を記録している。

オープンソース1位とクローズドソース1位のスコア差は1年前の50+ポイントから15-20ポイントに縮小。実世界でのユーザビリティにおいて、オープンソースモデルがクローズドソースフラッグシップに近づいている。

主要ソース：