ノートPCのQwen3.6-35B-A3BがClaude Opus 4.7よりきれいなペリカンを描いた

https://simonwillison.net/2026/Apr/16/qwen-beats-opus/

Simon WillisonがローカルでQwen3.6-35B-A3Bを実行し、SVGのペリカン描画でOpus 4.7を上回った
128GB M5 MacBook ProでMLX経由で動作
ローカルLLMの品質がフロンティアモデルとの差を縮めつつあることを示す

ディスカッション

コーディングベンチマークのコメントによると、Qwen 3.6は98タスク中11問しか解けなかった一方、Opusは95問を解決——創造的なタスクでの勝利は汎用性を意味しない
Opus/Sonnetはバージョン4.1以降、コーディング以外のタスクで品質が低下しているという指摘も
ローカル用途でのQwen 3.5 35Bのエージェント的なtool-call品質を評価する声もあった
ペリカンベンチマークは陳腐化しており、オーバーフィット（特定の入力に最適化されている状態）しやすいという懐疑的な意見も

HN（Hacker News）で議論を見る

原文（英語）: Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7

Type	Link
Added	Apr 16, 2026
Modified	Apr 16, 2026

📰 トップストーリー 195 items