Pony Alphaの正体が判明:GLM-5はZhipu AIが放つClaudeとGPTへのオープンソース挑戦者#
この1週間、AI業界はある謎に夢中になっていました。2026年2月6日、「Pony Alpha」と名乗るステルスモデルがOpenRouterに突如登場しました。ブランド名なし、企業名なし——ただ圧倒的な性能だけが、Redditの開発者たちを騒然とさせていたのです。
そして今、その正体が明らかになりました。Pony AlphaはGLM-5——Zhipu AI(Z.ai)が開発した次世代フラッグシップモデルであり、オープンソースAIモデルとして史上最も注目すべき存在の一つです。
AIミステリー:Pony Alphaとは何だったのか?#
Pony AlphaがOpenRouterに初めて登場した時、その出自を知る者は誰もいませんでした。しかし、手がかりはいくつもありました:
- リリース時期がZhipu AIの「GLM-5は旧正月前後に公開予定」という発表と一致していた
- 出力スタイルがGLMシリーズの特徴と合致していた
- 出自を尋ねると、モデル自身が「Zhipuが開発したGLMモデル」と回答した
- 「Pony」は中国の干支における午年(馬年)を指しており、開発チームの遊び心が込められていた
Redditでは推測が飛び交いました。DeepSeek V4なのか?OpenAIの秘密実験なのか?正体の発表を受けて、Zhipu AIの株価は2日間で60%急騰し、時価総額は1,500億香港ドル(約190億米ドル)を突破しました。
GLM-5のスペック#
GLM-5は前世代のGLM-4.7から大幅に進化しています。主要スペックは以下の通りです:
| スペック | GLM-5 | GLM-4.7(前世代) |
|---|---|---|
| 総パラメータ数 | 745B | 355B |
| アクティブパラメータ数 | 44B(MoE) | 32B |
| エキスパート構成 | 256基中8基がアクティブ | — |
| コンテキストウィンドウ | 200Kトークン | 128K |
| 事前学習データ | 28.5Tトークン | 23T |
| 学習ハードウェア | Huawei Ascend | Huawei Ascend |
| ライセンス | MIT(オープンソース) | MIT |
Mixture of Experts(MoE、混合エキスパート)アーキテクチャにより、GLM-5は総パラメータ数745Bでありながら、推論時にアクティブになるのは44Bのみです。これにより、大規模モデルでありながら高速かつコスト効率の良い推論を実現しています。
ベンチマーク性能:トップモデルとの比較
GLM-5はオープンソースモデル同士の競争にとどまりません。世界で最も高価なプロプライエタリモデルと真正面から渡り合っています。
コーディングベンチマーク
| ベンチマーク | GLM-5 | Claude Opus 4.5 | GPT-5.2 |
|---|---|---|---|
| SWE-bench Verified | 77.8 | 80.9 | 80.0 |
| SWE-bench Multilingual | 73.3 | 77.5 | — |
| Terminal-Bench 2.0 | 56.2 | 59.3 | 54.0 |
推論ベンチマーク
| ベンチマーク | GLM-5 |
|---|---|
| AIME 2026 | 92.7 |
| GPQA-Diamond | 86.0 |
| Humanity's Last Exam | 30.5(ツール使用時:50.4) |
エージェント性能
| ベンチマーク | GLM-5 | GPT-5.2 |
|---|---|---|
| BrowseComp | 75.9 | 65.8 |
| Vending Bench 2 | $4,432(オープンソース1位) | — |
| MCP-Atlas Public Set | 67.8 | — |
BrowseComp(ウェブブラウジングタスク)では、GLM-5はGPT-5.2を大幅に上回るスコアを記録しています。また、Z.aiのテストによると、ハルシネーション(幻覚)率も過去最低を達成しました。
GLM-5の注目ポイント#
1. 「Slime」強化学習フレームワーク#
GLM-5は、Slimeと呼ばれる新しいオープンソースの強化学習(RL)基盤を導入しています。従来の大規模モデル向けRL学習は低速でボトルネックが多いものでした。Slimeはデータ生成とポリシー更新を分離することで、従来手法と比較して最大3倍のスループットを実現しています。
これは単なる学習テクニックではありません。GLM-5が長期的なエージェントタスクに優れている理由そのものです。このフレームワークは、表面的な指標の最適化ではなく、タスク完了の一貫性を重視して設計されています。
2. DeepSeek Sparse Attention(DSA)#
GLMシリーズとして初めて、GLM-5はDeepSeekのSparse Attention(疎注意機構)を統合しています。従来のTransformerはコンテキスト長に対して二次関数的な計算量が必要でした——コンテキスト長を2倍にすると計算コストは4倍になります。DSAはこの制約を打破し、GLM-5が200Kトークンのフルコンテキストウィンドウを性能劣化なく処理することを可能にしています。
3. エージェント型エンジニアリングに最適化#
チャット向けに最適化されたモデルとは異なり、GLM-5はマルチステップのエンジニアリングワークフロー向けに設計されています。Vending Bench 2(1年間のビジネス運営をシミュレーション)の評価では、GLM-5は365日間のシミュレーションを通じて、一貫したリソース配分、動的な戦略調整、リスク管理を実証し、オープンソースモデルの中で1位を獲得しました。
4. 中国製ハードウェアのみで学習#
GLM-5はHuawei AscendチップとMindSporeフレームワークのみを使用して学習されており、米国製半導体からの完全な独立を達成しています。これは中国の国内AIインフラにとって重要なマイルストーンであり、NVIDIAのハードウェアなしでもフロンティアレベルのモデルを構築できることを証明しています。
価格:Claudeの約7分の1#
開発者にとって特に魅力的なのが、この価格設定です:
| モデル | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| GLM-5 | $0.80 – $1.00 | $2.56 – $3.20 |
| Claude Opus 4.5 | $5.00 | $25.00 |
| GPT-5.2 | $1.25 | $10.00 |
GLM-5はClaude Opus 4.5のコーディング性能の約90%を、コストわずか約14%で提供します。大量のAIワークロードを処理するチームにとって、そのコスト削減効果は絶大です。
さらに嬉しいことに、GLM-5は現在Kilo Codeで期間限定無料で利用可能です。APIキーもサブスクリプションも不要です。
GLM-5の利用方法#
方法1:OpenRouter API#
GLM-5は2026年2月11日よりOpenRouterで利用可能です。OpenRouter対応のあらゆるツールやフレームワークから使用できます。
方法2:Z.aiプラットフォーム#
Zhipu AIの公式プラットフォームZ.aiから直接GLM-5にアクセスできます。
方法3:Kilo Code(無料)#
Kilo Codeではローンチ期間中、GLM-5を無料で提供しています。VS Code拡張機能をインストールし、モデルドロップダウンからGLM-5を選択するだけで、すぐにコーディングを始められます。
方法4:WaveSpeed API#
WaveSpeedは競争力のある価格で最適化されたAPIアクセスを提供しています。
方法5:セルフホスト(近日対応予定)#
MITライセンスでHuggingFaceとModelScopeにウェイトが公開されているため、自社インフラへのデプロイも可能になります。745Bパラメータのモデルなので相応のハードウェアが必要ですが、アクティブパラメータが44Bという設計のおかげで、想像よりも現実的な運用が可能です。
GLM-5 vs GPT-5.2 vs Claude Opus 4.5:総合比較#
| 項目 | GLM-5 | GPT-5.2 | Claude Opus 4.5 |
|---|---|---|---|
| パラメータ数 | 745B(44Bアクティブ) | 非公開 | 非公開 |
| コンテキストウィンドウ | 200K | 入力400K / 出力128K | 200K |
| オープンソース | ✅ MITライセンス | ❌ クローズド | ❌ クローズド |
| SWE-bench | 77.8 | 80.0 | 80.9 |
| BrowseComp | 75.9 | 65.8 | — |
| Terminal-Bench | 56.2 | 54.0 | 59.3 |
| 入力価格/100万トークン | $0.80–1.00 | $1.25 | $5.00 |
| 出力価格/100万トークン | $2.56–3.20 | $10.00 | $25.00 |
| 学習ハードウェア | Huawei Ascend | NVIDIA | NVIDIA |
| 無料枠 | ✅(Kilo Code) | ❌ | ❌ |
結論: GLM-5は現時点でAI業界最高のコストパフォーマンスを誇るモデルです。全ベンチマークでClaude Opus 4.5を上回っているわけではありませんが、驚くほど肉薄しています。しかもオープンソースで、価格は約7分の1、さらに無料でも利用可能です。実際のコーディングや推論タスクにおいて、その性能差はほとんど気にならないレベルです。
GLM-5はこんな方におすすめ#
- コスト重視の開発者 — フロンティアに近い性能を、フロンティア価格なしで手に入れたい方
- オープンソース支持者 — 中身を確認でき、ファインチューニングやセルフホストが可能なモデルを好む方
- エージェント型AIの開発者 — GLM-5の長期タスク性能は、オープンモデルの中で真にトップクラスです
- 多言語チーム — GLM-5は優れた多言語対応を備えています(特に中国語+英語)
- 「Pony Alpha」の正体が気になっていた方 — インターネットを騒がせたあのモデルを、ぜひお試しください
まとめ
Zhipu AIはAI史上最も巧みなマーケティング戦略の一つを成功させました。GLM-5を「Pony Alpha」として匿名でリリースすることで、企業PRや誇大広告に頼ることなく、モデルの性能そのもので語らせたのです。その結果、AI業界全体が注目する存在となりました。
その成果は明確です。オープンソースAIがプロプライエタリの最高峰と、コストのごく一部で競争できることを証明したモデルが誕生しました。GLM-5は完璧ではありません——コーディングベンチマークではClaude Opus 4.5に数ポイント及ばず、レイテンシの問題も報告されています。しかし、MITライセンスで価格が7分の1であることを考えれば、極めて魅力的な選択肢であることは間違いありません。
馬は厩舎を飛び出しました。そして、全速力で駆けています。
もっとAIツールを探してみませんか?最新のAI開発ツール、コーディングアシスタントなどは、AIツールディレクトリでご覧いただけます。
