DeepSeek-V4をDay 0に対応:SGLangとMilesが推論からVerified RLまでカバー

· ai · Source ↗

要点まとめ

  • SGLangとMilesが、DeepSeek-V4のリリース当日にオープンソースとして初めて推論・RL学習の両方に対応したスタックとして公開された。

注目ポイント

  • LMSYSはDeepSeek-V4に対してDay-0サポートを提供し、推論とRL学習を同時にカバーした——単なるサービング対応にとどまらない点が特徴的。
  • 推論レイヤーをSGLangが、RL学習サイドをMilesが担い、両者が組み合わさったオープンソースパイプラインを形成している。
  • 「Verified RL」という表現は、このスタックがデプロイだけでなく、ポストトレーニングやアライメントのワークフローにも対応することを示唆している。
  • フロンティアモデルのリリースに合わせたDay-0協調対応は、vLLMやTRTLLMに対するSGLang/Milesエコシステムの競争力を示すシグナルといえる。

Hacker Newsコメント概観

  • vLLMも同日にDeepSeek-V4対応の記事を公開しており、両エコシステムが新モデルリリース時のファーストムーバーとしての地位を争っている構図が明確になっている。
  • InferenceXがDeepSeek-V4のスループットベンチマークを公開しているが、エンジンごとに計測条件が異なるため、クロススタックでの性能比較は難しい状況だ。
  • コミュニティでは、SGLang・vLLM・TRTLLMがかつては行っていた相互ベンチマークをいつの間にか止めており、暗黙の了解が生まれているのではないかという指摘も出ている。

注目コメント

  • @Palmik: 「sglang、vLLM、TRTLLMが互いのベンチマークを公開しなくなったのが不思議だ。以前はやっていたのに、今は何か暗黙のルールでもできたかのように見える。」

原文 | HNで議論する


英語版: DeepSeek-V4 on Day 0: From Fast Inference to Verified RL with SGLang and Miles · Original source