C
ChaoBro

3,5-Часовое Интервью Ло Фули: После Закрытия Разрыва в Pre-train, Agent RL Стает Решающим Фактором

3,5-Часовое Интервью Ло Фули: После Закрытия Разрыва в Pre-train, Agent RL Стает Решающим Фактором

Основная Оценка

Ло Фули, руководитель команды больших моделей Xiaomi, дала 3,5-часовое техническое интервью в конце апреля 2026 года.

Ключевые Мнения

1. Разрыв в Pre-train Почти Закрыт

Разрыв между ведущими китайскими командами и Anthropic в pre-training быстро сокращается.

2. Agent RL — Следующее Поле Боя

Когда pre-training больше не является преимуществом, конкуренция переходит к Agent Reinforcement Learning.

3. Отбор Талантов: Пустая Чашка

Ло Фули раскрыла критерии выбора стажёров — люди с сильной способностью к обучению и любопытством.

Рекомендации

РольДействие
Разработчики моделейСделать Agent RL ключевым направлением
Разработчики приложенийИспользовать бесплатные токены MiMo Orbit
СоискателиУсилить опыт работы с Agent-фреймворками