Anthropicが誤ってClaude Codeのソースコードを流出

· media coding policy · Source ↗

FireshipがAnthropicによる誤ったClaude Codeソースリーク事件を解説。anti-distillationトラップ、undercover mode、そして「Chyus」と呼ばれるバックグラウンドエージェントを含む隠し機能フラグが明らかになった。

  • Anthropicが公開したClaude Codeのnpm v2.1.88に、57 MBのソースマップが含まれていた。500,000行以上のTypeScriptが対象で、セキュリティ研究者のChiao Fan Shaが発見した。
  • 原因はAnthropicが最近買収したBun.jsの既知の問題とみられる。BunがプロダクションでソースマップをServeしてしまうバグはGitHubのオープンIssueとして報告されていた。
  • Claude Codeにはanti-distillationのpoisonがある。これはClaudeの出力を学習データに使う競合他社を誤誘導するための偽ツール参照だ。
  • Undercover modeは、コミットメッセージや出力にClaude自身の名前を含めないよう指示する。表向きはモデル名の漏洩防止だが、AIの関与を隠すための仕組みとも読める。
  • 正規表現パターンマッチャーがプロンプトの不適切な語句をスキャンし、ユーザーのフラストレーションを検知してイベントをログに記録する。AIは使われていない。
  • 流出した機能フラグには、Opus 4.7、Capiara というモデル名、ultra plan、coordinator mode、demon mode、そして日次ジャーナルとdream-modeによるメモリ統合機能を持つバックグラウンドエージェント「Chyus」への言及がある。
  • OpenAI Codexを使ったPython版リライト「Claw Code」はGitHub Stars 50,000件到達の最速リポジトリになった。任意のモデルに対応したフォーク「OpenClaw」も登場している。
  • コードベースにはAI可読な指示として解釈できるコメントが多数あり、ClaudeがこのCodingツール自体の開発に関与していたことが示唆される。

2026-04-01 · YouTubeで視聴


英語版: Tragic mistake… Anthropic leaks Claude’s source code · Watch on YouTube