どんなAIエージェントにもClaude.aiやChatGPT並みの記憶を与えるOSSメモリレイヤー

· ai ai-agents databases · Source ↗

まとめ

  • Stashは、PostgreSQL + pgvectorを使ったセルフホスト型・MCP対応のメモリレイヤー。Apache 2.0ライセンスで、Docker Composeコマンド3つで起動できる。

主なポイント

  • パイプラインは6つのコアステージで構成される:生のEpisodes(出来事)、合成されたFacts(事実)、Relationship edges(関係エッジ)、Causal Links(因果リンク)、抽象的なPatterns(パターン)、Contradiction/confidence decay(矛盾・信頼度の減衰)。
  • 新たに追加された3ステージ(Goal Inference、Failure Pattern検出、Hypothesis passingスキャン)により、エージェントが同じ失敗を繰り返さなくなる。
  • 名前空間は階層パス形式(/users/alice/projects/restaurant-saas)。/projectsからの読み取りはサブ名前空間を再帰的に含み、書き込みは特定パスを指定する。
  • remember/recallから因果チェーン、エージェント自己モデリング用の/selfスキャフォールドまで、28種類のMCPツールがフルスタックをカバー。
  • STASH_VECTOR_DIMは初回起動前に設定する必要があり、変更後はデータベースの完全リセットが必要になる。

Hacker Newsコメントまとめ

  • 技術的な議論の核心:複数のコメントが、RAGとの差別化を謳うマーケティングにもかかわらず、Stashは実質的にRAGシステム(pgvector + MCP recall/remember)だと指摘しており、検索精度が優れているというベンチマークも存在しない。
  • ツールよりメモリアーキテクチャが重要:実際のエージェントワークフローを持つコメント者は、エージェント自身が記憶を書くStashのモデルは、Claude.aiのようなバックグラウンド・パッシブ統合に比べてパフォーマンスが低いと指摘。記憶が具体性を欠くか、セッションをまたいでドメイン汚染を引き起こすかのどちらかになりがち。
  • チームや複数コントリビューターのワークフローは未解決の課題:複数の開発者が変更をマージすると単一エージェントの記憶がすぐに乖離するため、現状はソロまたは単一エージェントの用途に最も適している。

注目コメント

  • @aprilnya:エージェントが能動的に記憶を書くアプローチと、Claude.aiのバックグラウンド・パッシブ方式を比較し、後者の方が「はるかに、はるかによく機能する」と述べている。
  • @jFriedensreich:「Stripeを使うな」という一つの記憶が無関係なセッションを無期限に歪めるような、記憶の腐敗・汚染リスクを指摘。
  • @ting0:「mdファイルと比べてどのように、なぜ機能するのかが不明瞭」としてベンチマークを求めている。

原文 | HNで議論


英語版: Open source memory layer so any AI agent can do what Claude.ai and ChatGPT do · Original source