ノートPCのQwen3.6-35B-A3BがClaude Opus 4.7よりきれいなペリカンを描いた
https://simonwillison.net/2026/Apr/16/qwen-beats-opus/- Simon WillisonがローカルでQwen3.6-35B-A3Bを実行し、SVGのペリカン描画でOpus 4.7を上回った
- 128GB M5 MacBook ProでMLX経由で動作
- ローカルLLMの品質がフロンティアモデルとの差を縮めつつあることを示す
ディスカッション
- コーディングベンチマークのコメントによると、Qwen 3.6は98タスク中11問しか解けなかった一方、Opusは95問を解決——創造的なタスクでの勝利は汎用性を意味しない
- Opus/Sonnetはバージョン4.1以降、コーディング以外のタスクで品質が低下しているという指摘も
- ローカル用途でのQwen 3.5 35Bのエージェント的なtool-call品質を評価する声もあった
- ペリカンベンチマークは陳腐化しており、オーバーフィット(特定の入力に最適化されている状態)しやすいという懐疑的な意見も
原文(英語): Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7
| Type | Link |
| Added | Apr 16, 2026 |
| Modified | Apr 16, 2026 |