DeepSeek-V4をDay 0に対応：SGLangとMilesが推論からVerified RLまでカバー

Apr 26, 2026 · ai · Source ↗

要点まとめ

SGLangとMilesが、DeepSeek-V4のリリース当日にオープンソースとして初めて推論・RL学習の両方に対応したスタックとして公開された。

注目ポイント

LMSYSはDeepSeek-V4に対してDay-0サポートを提供し、推論とRL学習を同時にカバーした——単なるサービング対応にとどまらない点が特徴的。
推論レイヤーをSGLangが、RL学習サイドをMilesが担い、両者が組み合わさったオープンソースパイプラインを形成している。
「Verified RL」という表現は、このスタックがデプロイだけでなく、ポストトレーニングやアライメントのワークフローにも対応することを示唆している。
フロンティアモデルのリリースに合わせたDay-0協調対応は、vLLMやTRTLLMに対するSGLang/Milesエコシステムの競争力を示すシグナルといえる。

Hacker Newsコメント概観

vLLMも同日にDeepSeek-V4対応の記事を公開しており、両エコシステムが新モデルリリース時のファーストムーバーとしての地位を争っている構図が明確になっている。
InferenceXがDeepSeek-V4のスループットベンチマークを公開しているが、エンジンごとに計測条件が異なるため、クロススタックでの性能比較は難しい状況だ。
コミュニティでは、SGLang・vLLM・TRTLLMがかつては行っていた相互ベンチマークをいつの間にか止めており、暗黙の了解が生まれているのではないかという指摘も出ている。

注目コメント

@Palmik: 「sglang、vLLM、TRTLLMが互いのベンチマークを公開しなくなったのが不思議だ。以前はやっていたのに、今は何か暗黙のルールでもできたかのように見える。」

原文 | HNで議論する

英語版: DeepSeek-V4 on Day 0: From Fast Inference to Verified RL with SGLang and Miles · Original source