Anthropicが誤ってClaude Codeのソースコードを流出
FireshipがAnthropicによる誤ったClaude Codeソースリーク事件を解説。anti-distillationトラップ、undercover mode、そして「Chyus」と呼ばれるバックグラウンドエージェントを含む隠し機能フラグが明らかになった。
- Anthropicが公開したClaude Codeのnpm v2.1.88に、57 MBのソースマップが含まれていた。500,000行以上のTypeScriptが対象で、セキュリティ研究者のChiao Fan Shaが発見した。
- 原因はAnthropicが最近買収したBun.jsの既知の問題とみられる。BunがプロダクションでソースマップをServeしてしまうバグはGitHubのオープンIssueとして報告されていた。
- Claude Codeにはanti-distillationのpoisonがある。これはClaudeの出力を学習データに使う競合他社を誤誘導するための偽ツール参照だ。
- Undercover modeは、コミットメッセージや出力にClaude自身の名前を含めないよう指示する。表向きはモデル名の漏洩防止だが、AIの関与を隠すための仕組みとも読める。
- 正規表現パターンマッチャーがプロンプトの不適切な語句をスキャンし、ユーザーのフラストレーションを検知してイベントをログに記録する。AIは使われていない。
- 流出した機能フラグには、Opus 4.7、Capiara というモデル名、ultra plan、coordinator mode、demon mode、そして日次ジャーナルとdream-modeによるメモリ統合機能を持つバックグラウンドエージェント「Chyus」への言及がある。
- OpenAI Codexを使ったPython版リライト「Claw Code」はGitHub Stars 50,000件到達の最速リポジトリになった。任意のモデルに対応したフォーク「OpenClaw」も登場している。
- コードベースにはAI可読な指示として解釈できるコメントが多数あり、ClaudeがこのCodingツール自体の開発に関与していたことが示唆される。
2026-04-01 · YouTubeで視聴
英語版: Tragic mistake… Anthropic leaks Claude’s source code · Watch on YouTube