DeepSeek-V4をDay 0に対応:SGLangとMilesが推論からVerified RLまでカバー
要点まとめ
- SGLangとMilesが、DeepSeek-V4のリリース当日にオープンソースとして初めて推論・RL学習の両方に対応したスタックとして公開された。
注目ポイント
- LMSYSはDeepSeek-V4に対してDay-0サポートを提供し、推論とRL学習を同時にカバーした——単なるサービング対応にとどまらない点が特徴的。
- 推論レイヤーをSGLangが、RL学習サイドをMilesが担い、両者が組み合わさったオープンソースパイプラインを形成している。
- 「Verified RL」という表現は、このスタックがデプロイだけでなく、ポストトレーニングやアライメントのワークフローにも対応することを示唆している。
- フロンティアモデルのリリースに合わせたDay-0協調対応は、vLLMやTRTLLMに対するSGLang/Milesエコシステムの競争力を示すシグナルといえる。
Hacker Newsコメント概観
- vLLMも同日にDeepSeek-V4対応の記事を公開しており、両エコシステムが新モデルリリース時のファーストムーバーとしての地位を争っている構図が明確になっている。
- InferenceXがDeepSeek-V4のスループットベンチマークを公開しているが、エンジンごとに計測条件が異なるため、クロススタックでの性能比較は難しい状況だ。
- コミュニティでは、SGLang・vLLM・TRTLLMがかつては行っていた相互ベンチマークをいつの間にか止めており、暗黙の了解が生まれているのではないかという指摘も出ている。
注目コメント
- @Palmik: 「sglang、vLLM、TRTLLMが互いのベンチマークを公開しなくなったのが不思議だ。以前はやっていたのに、今は何か暗黙のルールでもできたかのように見える。」
英語版: DeepSeek-V4 on Day 0: From Fast Inference to Verified RL with SGLang and Miles · Original source