ノートPCのQwen3.6-35B-A3BがClaude Opus 4.7よりきれいなペリカンを描いた

https://simonwillison.net/2026/Apr/16/qwen-beats-opus/
  • Simon WillisonがローカルでQwen3.6-35B-A3Bを実行し、SVGのペリカン描画でOpus 4.7を上回った
  • 128GB M5 MacBook ProでMLX経由で動作
  • ローカルLLMの品質がフロンティアモデルとの差を縮めつつあることを示す

ディスカッション

  • コーディングベンチマークのコメントによると、Qwen 3.6は98タスク中11問しか解けなかった一方、Opusは95問を解決——創造的なタスクでの勝利は汎用性を意味しない
  • Opus/Sonnetはバージョン4.1以降、コーディング以外のタスクで品質が低下しているという指摘も
  • ローカル用途でのQwen 3.5 35Bのエージェント的なtool-call品質を評価する声もあった
  • ペリカンベンチマークは陳腐化しており、オーバーフィット(特定の入力に最適化されている状態)しやすいという懐疑的な意見も

HN(Hacker News)で議論を見る


原文(英語): Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7


Type Link
Added Apr 16, 2026
Modified Apr 16, 2026