Kimi K2.6がFireworks AIに登場:月之暗面がSFT/DPO/RL全工程のトレーニングを開放

Kimi K2.6がFireworks AIに登場:月之暗面がSFT/DPO/RL全工程のトレーニングを開放

オープンソースモデルの価値は「使えるか」だけでなく「改造できるか」にある。Fireworks AIトレーニングプラットフォームでのKimi K2.6の登場は、中国モデルのカスタマイズ性を新たな段階に引き上げた。

概要

Fireworks AIはKimi K2.6がManagedおよびTraining APIワークフローに接続されたことを発表した。開発者はFireworksプラットフォーム上で直接K2.6に対して以下を行える:

  • SFT(教師あり微調整):自社データでモデル出力スタイルと能力を微調整
  • DPO(直接選好最適化):選好データでモデル動作をアライメント
  • RL(強化学習):カスタム損失関数で強化学習トレーニング

なぜ重要か

「使える」から「トレーニングできる」へ

ほとんどのオープンソースモデルは推論APIで終わる。Kimi K2.6のFireworksでのフルトレーニングサポートはこの制限を打破する。

265Kコンテキストのトレーニング価値

多くのモデルのトレーニングコンテキストは32K-128Kに制限される。Kimi K2.6の265Kコンテキストはトレーニングシナリオで独自の優位性を持つ。

まとめ

Kimi K2.6のFireworks AIトレーニングプラットフォームへの登場は、中国モデルがトレーニングレベルで米国クローズドソースモデルと同等のカスタマイズ性を実現したことを意味する。

ソース: