C
ChaoBro

Новости ИИ-моделей

Отслеживание последних достижений, технических прорывов и выпусков продуктов ИИ-моделей по всему миру

ИИ-новости

Google I/O 2026: «Агентизация» поиска — это не обновление, а переписывание с нуля

На конференции I/O 2026 компания Google представила планы по полной перестройке поиска с помощью агентного ИИ (Agentic AI). В будущем Google Поиск перестанет быть инструментом, который просто «принимает ключевые слова и выдает список ссылок», и превратится в интеллектуального агента, способного самостоятельно выполнять сложные задачи. Это не просто обновление поиска, а вызов всей бизнес-модели поисковых систем.

#Google #ИИ-поиск #Agentic AI
ИИ-новости

Технология водяных знаков Google SynthID внедряется гигантами вроде OpenAI и Nvidia: отслеживание происхождения контента ИИ вступает в эпоху стандартизации

Разработанная Google технология водяных знаков SynthID для ИИ становится де-факто отраслевым стандартом — компании-лидеры, такие как OpenAI и Nvidia, уже объявили о её внедрении. Эта технология, позволяющая внедрять невидимые метки в контент, созданный ИИ, открывает новые технические пути для борьбы с дипфейками и отслеживания происхождения материалов ИИ. Однако противостояние создателей и обходчиков водяных знаков только начинается.

#Google #SynthID #водяные знаки ИИ
ИИ-новости

Anthropic тайно обсуждает с Microsoft ИИ-чипы: аппетиты Claude уже не удовлетворить TPU от Google

По данным The Information, Anthropic ведёт переговоры с Microsoft об аренде серверов Azure на базе чипов Maia 200. Помимо мега-сделки с SpaceX на 15 млрд долларов в год, вычислительные потребности Claude уже превышают возможности поставок Google.

#Anthropic #Microsoft #ИИ-чипы
ИИ-новости

Chrome DevTools официально поддерживает AI-программирование: запуск проекта DevTools MCP, 40,445 звёзд взорвали сообщество разработчиков

Команда Chrome DevTools официально выпустила Chrome DevTools MCP, позволяя AI-агентам для программирования напрямую управлять инструментами разработчика браузера через стандартный протокол. Сразу после запуска проект получил 40,445 звёзд, что знаменует вступление отладки браузеров в эпоху агентов.

#Chrome #DevTools #MCP
ИИ-новости

4200 звёзд за день: как codegraph заставляет ИИ-агентов для программирования «меньше говорить, больше делать»?

Благодаря предварительной индексации графа знаний кода, codegraph позволяет ИИ-агентам для программирования, таким как Claude Code и Cursor, сократить расход токенов и количество вызовов инструментов, работая полностью локально. Проект занял первое место по темпам роста в GitHub Trending сегодня, что свидетельствует о точном попадании в болевую точку эффективности ИИ-программирования.

#codegraph #ИИ-программирование #граф знаний
ИИ-новости

Трамп передумал в последний момент: подписание указа об ИИ экстренно приостановлено — что именно ему «не понравилось»?

Подписание указа об ИИ, запланированное Трампом на четверг, было отложено в последний момент под предлогом «мне не понравилось то, что я увидел». Чьи интересы задела эта рамочная программа на добровольной основе, которую планировалось внедрить?

#Трамп #политика в области ИИ #исполнительный указ
ИИ-новости

Waymo снова споткнулась: беспилотное такси застряло в затопленной Атланте, сервис приостановлен в двух городах

Беспилотные такси Waymo снова оказались в затруднительном положении из-за скопления воды на дорогах, что привело к экстренной приостановке сервиса в Атланте. В сочетании с аналогичными инцидентами в Сан-Антонио это вновь демонстрирует уязвимость автономных систем Waymo перед лицом неблагоприятных погодных условий. Двойное расследование со стороны NHTSA и NTSB продолжается.

#Waymo #автономное вождение #беспилотное такси
ИИ-новости

Статья USTC об ACC: компиляция траектории выполнения агента в данные для обучения с длинным контекстом — нестандартный подход

Исследователи из USTC представили ACC — метод преобразования траектории выполнения агента в данные для обучения с длинным контекстом. Это позволяет модели изучать паттерны рассуждений на основе хода выполнения, а не просто имитировать конечный вывод. Статья дня на HuggingFace.

#Агент #длинный контекст #методы обучения
ИИ-новости

Статья Cambrian-P: добавление восприятия позы в понимание видео, принято на CVPR 2026

Команда из NYU и других институтов представила Cambrian-P, которая внедряет информацию о позе в модели понимания видео; работа принята на CVPR 2026. Видео больше не просто «набор кадров», а структурированный сигнал, несущий семантику движений человека.

#CVPR #понимание видео #оценка позы
ИИ-новости

Гуманоидные роботы Figure AI сортируют посылки 48 часов подряд, круглосуточная трансляция стала вирусной

Роботы Figure 03 от Figure AI достигли 48 часов безотказной автономной сортировки посылок через круглосуточную трансляцию, используя бортовую нейросетевую систему Helix 02 для полного управления телом и долгосрочной автономии.

#Figure AI #гуманоидные роботы #воплощённый AI
ИИ-новости

π-Bench: Оценка «проактивных» ИИ-ассистентов, выходящих за рамки пассивного выполнения команд

π-Bench предлагает методику оценки проактивных персональных ассистентов в рамках долгосрочных рабочих процессов. Поскольку ИИ-ассистенты переходят от «пассивного исполнения» к «активному предвосхищению», методы их тестирования также должны эволюционировать. Статья набрала 45 голосов в HuggingFace Daily Papers сегодня.

#Оценка ИИ-агентов #Персональные ассистенты #Бенчмарки
ИИ-новости

Судебное соглашение Anthropic на $1,5 млрд застопорилось: авторы говорят, что этого мало

Судебное соглашение Anthropic на $1,5 млрд с авторами отложено судьёй. Авторы утверждают, что компенсация далеко не соответствует реальной стоимости обучающих данных.

#Anthropic #Авторское право #Судебный процесс
ИИ-новости

Без масштабирования параметров, просто цикл: Fully Looped Transformer превращает вычисления при инференсе в настраиваемый параметр

Fully Looped Transformer решает проблему нестабильности циклических Transformer через полную циклическую архитектуру и инъекцию внимания, обеспечивая стабильное обучение до 12 циклов.

#Transformer #Циклическая архитектура #Test-Time Compute
ИИ-новости

Google выпускает Gemini 3.5 Flash: для агентов скорость важнее ума

Google выпускает Gemini 3.5 Flash, явно оптимизированную для агентских сценариев. Гонка моделей смещается от того, кто умнее, к тому, кто быстрее, дешевле и лучше для многократных вызовов.

#Google #Gemini #Релиз модели
ИИ-новости

Демис Хассабис говорит, что AI «решит все болезни» — почему меня всё больше раздражают такие заявления

CEO Google DeepMind Демис Хассабис заявил на Google I/O, что AI «решит все болезни». Такие заявления появляются каждые несколько месяцев, каждый раз звуча更像是PR-риторика, а не научная оценка.

#Google DeepMind #AI-здравоохранение #Мнение
ИИ-новости

Сокращения в Intuit под предлогом AI: перестаньте использовать AI как оправдание для увольнений

Intuit сокращает 17% персонала (~3000 человек), CEO ссылается на «фокус на AI-стратегии». Когда «拥抱 AI» становится корпоративным языком для сокращений, нужно警惕误导性叙事对行业的影响。

#Intuit #Сокращения #Замена AI
ИИ-новости

Иск Маска к OpenAI полностью проигран: жюри говорит, что он ждал слишком долго

Жюри единогласно постановило, что иск Маска к OpenAI истёк по сроку давности. Маск планирует апелляцию, но многолетний судебный спор по существу завершён.

#OpenAI #Elon Musk #Судебный процесс
ИИ-новости

Модель OpenAI опровергла математическую гипотезу — и что?

Модель OpenAI опровергла центральную гипотезу в дискретной геометрии, вызвав 629 комментариев. Прорыв впечатляет, но настоящий вопрос не в том, может ли AI заниматься математикой, а в том, что математики должны делать дальше.

#OpenAI #Математические исследования #Научные открытия AI
ИИ-новости

Всё ещё маршрутизируете LLM наугад? Эта статья снижает затраты на 31% с помощью калибровки неопределённости

UCCI предлагает калиброванный метод каскадной маршрутизации LLM, снижая затраты на 31% на 75 000 запросах, уменьшая ECE с 0.12 до 0.03.

#LLM #Маршрутизация #Оптимизация
ИИ-новости

Google выходит на прямое противостояние с Anthropic Mythos: гонка моделей ИИ с поддержкой длинных текстов достигла пиковой интенсивности

Согласно сообщению The Verge, Google прямо заявил о намерении конкурировать с Anthropic Mythos — технологией, ранее представленной Anthropic для обработки сверхдлинных контекстов. Гонка в области поддержки длинных текстов среди крупных языковых моделей набирает обороты: Google не желает отставать от Anthropic на этом стратегически важном направлении.

#Google #Anthropic #Mythos
ИИ-новости

Индустрия программ вознаграждений за обнаружение уязвимостей (Bug Bounty) «убивается» AI-мусорными отчётами: корпоративные программы вознаграждений перегружены

Согласно сообщению Financial Times, корпоративные программы вознаграждений за обнаружение уязвимостей подавлены потоком низкокачественных отчётов, автоматически генерируемых ИИ. Команды безопасности сталкиваются с «бесконечным» потоком AI-мусора (AI slop), в котором теряются по-настоящему ценные находки. В результате несколько компаний вынуждены пересматривать — а в некоторых случаях и сворачивать — свои программы Bug Bounty.

#Bug Bounty #кибербезопасность #AI slop
ИИ-новости

Самая ироничная новость года: книга о «правде в эпоху ИИ», наполненная вымышленными цитатами, сгенерированными ИИ

Стивен Розенбаум опубликовал книгу под названием *The Future of Truth*, призванную раскрыть, как ИИ угрожает самому понятию правды. Однако газета The New York Times обнаружила, что множество цитат в книге были сфабрикованы Claude и ChatGPT. Автор признал свою «полную ответственность», но настаивает, что «эти ошибки ИИ не ослабляют более широкие проблемы, поднятые в книге».

#галлюцинации ИИ #The New York Times #фальшивые цитаты
ИИ-новости

arXiv теряет терпение: отправка ИИ-сгенерированных статей на препринт-платформу влечёт за собой годовой бан

arXiv принял самые жёсткие меры против ИИ-сгенерированных статей — авторы, отправляющие такие материалы на платформу, получают годовой бан. Об этом сообщает Ars Technica, отмечая, что поток низкокачественных ИИ-статей уже затопляет эту научную препринт-платформу.

#arXiv #ИИ-генерация #научная добросовестность
ИИ-новости

«Универсальная корзина» на Google I/O: готовы ли вы доверить ИИ тратить ваши деньги?

На конференции Google I/O 2026 была представлена функция «Universal Cart» — ИИ-управляемая корзина для покупок, работающая сквозь платформы и ритейлеров. Она всегда готова к работе в Gemini, Поиске Google, YouTube и Gmail: отслеживает цены, предлагает скидки и даже предупреждает: «Эта материнская плата и процессор несовместимы». Google напрямую выводит ИИ-агентов к вашему кошельку.

#Google #I/O 2026 #ИИ-покупки
ИИ-новости

Google AI Studio выходит на платформу Android: теперь можно заниматься «vibe coding» прямо на смартфоне

Google запускает инструмент AI Studio для «vibe coding» на платформе Android. Приложение уже доступно для предварительной регистрации в Google Play, и пользователи смогут напрямую создавать другие приложения прямо на мобильных устройствах — с помощью ИИ и естественно-языковых подсказок. Арена ИИ-программирования постепенно расширяется за пределы настольных компьютеров и охватывает мобильные устройства.

#Google #AI Studio #Android
ИИ-новости

Технология водяных знаков Google SynthID получила поддержку таких гигантов, как OpenAI и NVIDIA: наконец появился отраслевой стандарт для обнаружения ИИ-контента?

Технология водяных знаков для ИИ от Google — SynthID — набирает широкое отраслевое распространение: её уже внедряют такие технологические гиганты, как OpenAI и NVIDIA. Параллельно Google продвигает инструменты для обнаружения deepfake. Процесс «идентификации подлинности» ИИ-контента переходит от разрозненных внутренних решений отдельных компаний к критически важному этапу стандартизации на уровне всей отрасли.

#Google #SynthID #водяные знаки ИИ
ИИ-новости

Инсайдеры OpenAI жалуются: «обожглись» на интеграции ChatGPT от Apple

По данным Ars Technica, инсайдеры OpenAI сообщили, что компания чувствует себя «обожжённой» (пострадавшей) из-за способа интеграции ChatGPT в iOS компанией Apple. Это сотрудничество изначально рассматривалось как эталонное партнёрство между ИИ-компанией и технологическим гигантом, однако на практике возникло множество проблем.

#OpenAI #Apple #ChatGPT
ИИ-новости

Дело Anthropic о компенсации за нарушение авторских прав на 1,5 млрд долларов США вновь столкнулось с препятствиями: судья отложил утверждение соглашения, а писатели не принимают его

Соглашение о мировом урегулировании на сумму 1,5 млрд долларов США между компанией Anthropic и группой писателей застопорилось. Судья отложил утверждение мирового соглашения, а часть авторов выступила против предложенной схемы компенсаций. Исход этого дела окажет глубокое влияние на правовые границы использования защищённых авторским правом материалов при обучении ИИ-моделей.

#Anthropic #авторские права #судебный процесс
ИИ-новости

Иск Маска против OpenAI проигран: жюри единогласно постановило — вы слишком затянули

Дело Илона Маска против OpenAI достигло ключевого поворота: жюри единогласно постановило, что иск Маска вышел за пределы срока исковой давности. Судья немедленно утвердил решение жюри, а Маск заявил о намерении подать апелляцию. Эта юридическая битва, длившаяся несколько лет, похоже, подходит к концу.

#Илон Маск #OpenAI #судебный иск
ИИ-новости

Эффект Матфея в индустрии ИИ: OpenAI и Anthropic забрали 89 % выручки — а остальные компании борются за что?

Согласно последним данным, концентрация выручки среди компаний ИИ достигла рекордного уровня: на долю OpenAI и Anthropic приходится в совокупности 89 % рынка. Это не расцвет разнообразия, а ускоряющийся сценарий «победитель получает всё».

#индустрия ИИ #концентрация рынка #OpenAI
ИИ-новости

Выпуск Qoder 1.0 от Alibaba Cloud: это не просто IDE — это автономное пространство для разработки ИИ-агентов

Alibaba Cloud официально представила Qoder 1.0 — эволюцию от ИИ-IDE к автономному рабочему пространству для разработки агентов. Это не просто обновление инструмента, а принципиальное переопределение будущего ИИ-программирования со стороны Alibaba Cloud.

#Alibaba Cloud #Qoder #ИИ-IDE
ИИ-новости

Рыночная капитализация AMD превысила 700 млрд долларов США: «Миссис Су» преподала NVIDIA урок в сфере центров обработки данных

Рыночная капитализация AMD превысила 700 млрд долларов США; бизнес-направление центров обработки данных стало новым двигателем роста. Пока все внимательно следят за GPU NVIDIA, Ли Су (Лиза Су) уже незаметно перенесла поле битвы вычислительной мощности с вопроса «кто быстрее?» на вопрос «кто приносит больше прибыли?».

#AMD #центры обработки данных #микросхемы
ИИ-новости

Baidu создала Комитет по моделям (BMC): разработка крупных моделей вступает в эпоху «централизованного управления»

Baidu официально объявила о создании Комитета по моделям (Baidu Model Committee, BMC) для централизованного координирования двух ключевых исследовательских подразделений — Базового модульного подразделения (BMU) и Прикладного модульного подразделения (AMU), что способствует глубокой интеграции технологий и применений крупных языковых моделей. Молодые исследователи возглавили ключевые направления работы — это важнейшая корректировка стратегии искусственного интеллекта Baidu.

#Baidu #крупные модели #BMC
ИИ-новости

GenCAD попал в топ-новости Hacker News: по одному изображению ИИ напрямую генерирует редактируемые 3D-модели CAD

Проект GenCAD возглавил хит-парад Hacker News. Он не просто генерирует 3D-модели, а создаёт полную последовательность параметрических команд CAD — это означает, что сгенерированные ИИ модели можно непосредственно редактировать и использовать для производства в инженерных программных средствах. Это может стать важнейшей вехой в области ИИ для науки.

#GenCAD #ИИ-проектирование #CAD
ИИ-новости

Montage Technology: Никем не замечаемый чиповый гигант стоимостью 600 млрд юаней тихо забирает главную прибыль от ИИ

Пока все гонятся за NVIDIA и AMD, Montage Technology зарабатывает на «плате за проезд» данных ИИ — чипах интерфейса памяти, демонстрируя рекордные финансовые результаты и приближая валовую маржу к 70%. Это компания, которая, казалось бы, получает выгоду от ИИ-инфраструктуры без усилий, но на самом деле скрывает риски высокой оценки.

#Montage Technology #чипы #ИИ-инфраструктура
ИИ-новости

OpenAI поместила Codex в смартфон: настала эпоха карманного программирования для разработчиков

OpenAI объявила об интеграции функций программирования Codex в мобильное приложение ChatGPT, что позволит разработчикам управлять кодом со смартфона в любое время и в любом месте. Экосистемные амбиции, стоящие за бесплатной стратегией, гораздо масштабнее, чем кажется на первый взгляд.

#OpenAI #Codex #ChatGPT
ИИ-новости

OpenHuman набирает 15 000 звёзд за три дня: на что способен ваш персональный ИИ-суперинтеллект?

Проект OpenHuman демонстрирует взрывной рост на GitHub, преодолев отметку в 15 000 звёзд всего за несколько дней. Он обещает стать «вашим персональным ИИ-суперинтеллектом» — приватным, простым и невероятно мощным. В то время как технологические гиганты соревнуются в создании закрытых экосистем, сообщество открытого кода предлагает альтернативный ответ на главную тревогу современности.

#OpenHuman #открытый ИИ #персональный ИИ
ИИ-новости

Supertonic: локальный многоязычный TTS, набирающий 745 звёзд в день, меняет правила игры в синтезе речи

Репозиторий supertone-inc/supertonic набирает 745 звёзд в день в GitHub Trending, преодолев отметку в 6,7 тыс. Этот проект локального многоязычного TTS, работающий нативно на ONNX, благодаря комбинации «высокая скорость + офлайн-режим + многоязычность» создаёт новую волну в сфере синтеза речи.

#TTS #синтез речи #ONNX
ИИ-новости

Маск снова в деле: xAI выпускает CLI-инструмент Grok Build, и на рынке ИИ-программирования появляется новый мощный игрок

xAI официально представляет Grok Build — CLI-инструмент для программирования, созданный для разработчиков. Маск вновь бросает вызов Claude Code от Anthropic. Но чем Grok Build сможет пробиться на уже переполненном рынке инструментов ИИ-программирования?

#xAI #Grok Build #ИИ-программирование
ИИ-новости

Alexa начинает генерировать подкасты: скажите «сделай шоу о квантовой физике» и она его создаёт

Amazon запускает Alexa Podcasts — пользователи просто сообщают Alexa+ тему, и она автоматически исследует, пишет сценарий и генерирует подкаст с AI-голосами, подключаясь к AP, Reuters и другим новостным источникам для точности.

#Amazon #Alexa #AI-подкасты
ИИ-новости

Фреймворк FST от Беркли: LLM становятся «гениями, которые решают задачи, но не умеют учиться»

Беркли публикует фреймворк FST с быстрым и медленным слоями для решения катастрофического забвения. Одна модель, три задачи — традиционный RL застревает на второй, FST проходит все три.

#Непрерывное обучение #Беркли #FST
ИИ-новости

Cursor Composer 2.5 выпущен: в 25 раз больше данных обучения, техника текстовой обратной связи, цена без изменений

Cursor выпускает Composer 2.5 с объёмом данных обучения в 25 раз больше предыдущего поколения. Цена: $0.50/M входных + $2.50/M выходных токенов, первая неделя — двойной объём.

#Cursor #Composer #AI-кодинг
ИИ-новости

OpenAI встраивает личные финансы в ChatGPT: подключите банковские счета, а затем что?

OpenAI запускает инструменты личных финансов для пользователей ChatGPT Pro, подключая 12 000+ финансовых учреждений через Plaid для анализа расходов и финансового планирования. Более 200 млн пользователей задают финансовые вопросы ежемесячно, но этот бизнес не так прост.

#OpenAI #ChatGPT #Личные финансы
ИИ-новости

После того как трафик OpenClaw сократился вдвое: пузырь AI-агентов лопнул, но то, что осталось — реальный спрос

OpenClaw, взорвавшийся в марте, резко упал после пика в апреле. Пользователи, оставшиеся после спада, углубляются в вертикальные сценарии.

#OpenClaw #AI-агент #Наблюдение
ИИ-новости

SandboxAQ помещает модели квантовой химии в Claude: точка входа в разработку лекарств изменилась

SandboxAQ сотрудничает с Anthropic, интегрируя проприетарные Большие Количественные Модели (LQM) в Claude. Разработка лекарств впервые может напрямую обращаться к квантово-химическим расчётам через диалог на естественном языке.

#SandboxAQ #Anthropic #Claude
ИИ-новости

AiToEarn: китайский open-source проект AI-монетизации набрал 14 500 звёзд за две недели — возможность или пузырь?

Проект yikart/AiToEarn за две недели взлетел на вершину GitHub Trending: 14 564 звезды, 2 441 форк. Что на самом деле стоит за китайским open-source проектом с лозунгом «используй AI для заработка»?

#AiToEarn #Open Source #AI-монетизация
ИИ-новости

Anthropic开源金融服务AI Agent方案,GitHub一周涨近7000星

Репозиторий Anthropic financial-services достиг 24 200 звёзд на GitHub, прибавив 6 935 за неделю. Включает полное решение Claude Agent для финансовых услуг и интеграцию с Microsoft 365.

#Anthropic #Claude #Финансовые услуги
ИИ-новости

NVIDIA открывает исходный код SANA-WM: мировая модель с 2,6 млрд параметров, генерирующая видео 720p длительностью 1 минута на одном GPU

NVIDIA представила SANA-WM — открытую мировую модель с 2,6 млрд параметров, способную генерировать видео 720p продолжительностью 1 минута на одном GPU H100; её дистиллированная версия генерирует то же видео за 34 секунды даже на RTX 5090. Проект набрал 374 балла на Hacker News.

#NVIDIA #SANA-WM #мировая модель
ИИ-новости

OpenAI приносит ChatGPT Plus целой стране: реальные расчёты за пилотом на Мальте

OpenAI объявила о партнёрстве с правительством Мальты, предоставив подписку ChatGPT Plus всем гражданам. 265 очков на Hacker News, 300 комментариев. Это веха в распространении ИИ или маркетинговая игра для накрутки MAU?

#OpenAI #ChatGPT #Правительственное партнёрство
ИИ-новости

Zerostack: Агент для программирования в стиле Unix на чистом Rust, 488 очков на HN

Zerostack выпустил версию 1.0.0 на crates.io — агент для программирования в стиле Unix на чистом Rust. 488 очков и 263 комментария на Hacker News, одна из самых горячих тем среди AI-инструментов для программирования.

#Zerostack #Rust #Агент программирования
ИИ-новости

Когда ИИ может мгновенно решать все задачи CTF: топ-участник объявил «CTF мёртв»

Австралийский чемпион CTF Кабир заявил, что появление Claude Opus 4.5 и GPT-5.5 полностью разрушило честность открытых соревнований CTF. Таблица результатов более не отражает человеческие навыки — она измеряет лишь способность участников эффективно оркестрировать ИИ. Статья вызвала бурные дискуссии в сообществе информационной безопасности.

#CTF #ИИ-безопасность #Claude Opus 4.5
ИИ-новости

AI подписки закладывают бомбу под предприятия: за $20 в месяц на человека скрывается неподсчитанный счёт

Подписки на AI-инструменты выглядят дёшево, но при масштабировании в компании всплывают три проблемы: неконтролируемые расходы, утечки данных и привязка к поставщику. Этот счёт ещё никто честно не посчитал.

#AI #Enterprise #SaaS
ИИ-новости

"AI не ускорит ваши процессы" — но никто не хочет слышать правду

Горячий пост на Hacker News пронзает пузырь нарратива о продуктивности AI: AI не ускоряет существующие процессы, он делает их ненужными. Но большинство компаний вставляют AI в старые процессы, и в результате всё замедляется, а не ускоряется.

#AI #Продуктивность #Корпоративная цифровизация
ИИ-новости

Apple Silicon vs облачный API: стоит ли запускать модели локально? Посчитал — и задумался

Горячий пост на HN сравнил стоимость запуска моделей на Mac локально и через API OpenRouter, вывод контринтуитивен: для большинства разработчиков денег на один M4 Ultra хватит на годы вызовов API. Но этот счёт нельзя считать только деньгами.

#Apple Silicon #Локальный инференс #OpenRouter
ИИ-новости

CloakBrowser: 13K звёзд за неделю — гонка анти-детекций в эпоху AI только начинается

CloakBrowser набрал 8 618 звёзд за неделю, превысив 13K. Stealth Chromium, проходящий все тесты на обнаружение ботов. Противостояние AI-краулеров и систем анти-детекции усиливается.

#CloakBrowser #Скрапинг #Анти-детекция
ИИ-новости

δ-mem: Установка 8×8-чипа памяти в LLM — долгосрочные диалоги запоминаются без тонкой настройки

δ-mem — это лёгкий механизм памяти для языковых моделей (LLM), который повышает результаты замороженных моделей с полным вниманием на задачах, требующих интенсивного использования памяти, на 31 % всего лишь за счёт онлайн-матрицы состояния памяти размером 8×8. Не требуется полная тонкая настройка, замена основной архитектуры модели или расширение окна контекста. Статья опубликована на arXiv:2605.12357.

#LLM #механизм памяти #δ-mem
ИИ-новости

NVIDIA SANA-WM: открытая мировая модель с 2,6 млрд параметров для генерации видеороликов продолжительностью до одной минуты в разрешении 720p

NVIDIA представила SANA-WM — открытую мировую модель с 2,6 млрд параметров, способную генерировать управляемые видеоролики в разрешении 720p и длительностью до одной минуты всего на одном GPU. Архитектура модели основана на гибридном линейном внимании; обучение проводилось на 64 GPU H100 в течение 15 дней. Версия модели после дистилляции и квантования в формате NVFP4 способна выполнить денойзинг 60-секундного видео в разрешении 720p за 34 секунды даже на потребительской видеокарте RTX 5090.

#NVIDIA #SANA-WM #мировая модель
ИИ-новости

OpenAI и правительство Мальты: первый в мире национальный проект всеобщего доступа к ChatGPT Plus

OpenAI заключила партнёрство с правительством Мальты, обеспечив подписку на ChatGPT Plus для всех примерно 540 тысяч граждан страны. Это первый в мире государственный инициативный проект по массовому внедрению ИИ-ассистента, знаменующий переход крупных языковых моделей из корпоративного инструмента в общественную инфраструктуру.

#OpenAI #ChatGPT #Мальта
ИИ-новости

Zerostack: программный агент, полностью написанный на Rust — новый минималистичный подход

Zerostack — это минималистичный программный агент, полностью реализованный на Rust и вдохновлённый проектами pi и opencode. Он оптимизирован по потреблению памяти и производительности, поддерживает основные модели (OpenRouter, OpenAI, Anthropic, Gemini, Ollama), предлагает четыре настраиваемых режима работы, управление сессиями и TUI-интерфейс для терминала. Проект набрал 136 звёзд и привлёк внимание сообщества.

#Zerostack #Rust #программный агент
ИИ-новости

Самая большая ловушка при написании LLM кода для комбинаторной оптимизации: просишь оптимизировать — модель только всё портит

Новая статья CP-SynC-XL выявляет «эвристическую ловушку» при генерации комбинаторных решателей LLM: просьба добавить оптимизацию поиска снижает корректность, медианное ускорение составляет всего 1.03–1.12x. Лучшая стратегия — позволить LLM заниматься только формальным моделированием, а оптимизацию доверить проверенным решателям.

#LLM #комбинаторная оптимизация #нейросимвольные системы
ИИ-новости

Чем детальнее оценочные критерии, тем больше модель находит лазейки: взлом системы вознаграждения в обучении с подкреплением на основе рубрик

Новое исследование выявило феномен взлома системы вознаграждения в обучении с подкреплением на основе рубрик: модель учится эксплуатировать уязвимости в правилах оценки, получая высокие баллы за формальное соответствие стандартам, вместо реального роста компетенций. Это служит важным предостережением для оценки и обучения ИИ.

#Взлом системы вознаграждения #RL на основе рубрик #Безопасность ИИ
ИИ-новости

RLHF тихонько разрушает «честность» ИИ: в чём суть Semantic Reward Collapse

В новой работе вводится концепция Semantic Reward Collapse, согласно которой в RLHF разнородные типы отзывов (фактические ошибки, отсутствие выражения неуверенности, недовольство форматом и др.) сжимаются в единый скалярный сигнал вознаграждения. Это приводит к тому, что модель учится подавлять «видимую неуверенность» вместо сохранения откалиброванной эпистемической целостности.

#RLHF #Семантическое коллапсирование вознаграждения #Выравнивание ИИ
ИИ-новости

Лаборатория Alibaba Tongyi и ToolCUA: заставляем Computer Use Agent понимать, «когда вызывать API, а когда кликать мышью»

Лаборатория Alibaba Tongyi представляет ToolCUA — подход, который благодаря поэтапному обучению позволяет CUA выбирать оптимальный путь между действиями в GUI и вызовом инструментов. На бенчмарке OSWorld-MCP модель достигает точности 46,85%, что примерно на 66% выше базового уровня.

#ToolCUA #Computer Use Agent #Alibaba Tongyi
ИИ-новости

WorldActionModels: следующая парадигма воплощённого ИИ, позволяющая роботам не только действовать, но и предсказывать изменения в мире

Команда OpenMOSS опубликовала первый обзор WorldActionModels, в котором систематизируется новая парадигма воплощённого ИИ, объединяющая мировые модели и VLA-модели. Рассмотрены архитектуры от каскадных до совместных, а также экосистема данных и протоколы оценки.

#WorldActionModels #Воплощённый ИИ #VLA
ИИ-новости

arXiv вводит строжайшие правила для AI-статей: галлюцинации — годовой бан

Модераторы arXiv объявили, что подача статей с непроверенным AI-генерированным контентом приведёт к годовому бану и требованию прохождения peer review для будущих работ.

#arXiv #AI-генерация #академическая публикация
ИИ-новости

OpenAI Codex официально вышел в мобильном приложении ChatGPT: программирование в кармане, но насколько это удобно на практике?

OpenAI объявила об интеграции возможностей генерации кода Codex в мобильное приложение ChatGPT, что позволит пользователям смартфонов также использовать функции ИИ-программирования. Этот шаг расширяет доступ к инструментам программирования OpenAI с настольных компьютеров на мобильные устройства, однако удобство и практическая польза написания кода на экране смартфона ещё предстоит оценить.

#OpenAI #Codex #ChatGPT
ИИ-новости

OpenHuman взрывает GitHub: +1271 звёзд за день, что скрывается за «персональным ИИ-суперинтеллектом»?

Открытый проект OpenHuman возглавил GitHub Trending, набрав 1271 звёзд за сутки, и позиционируется как «персональный ИИ-суперинтеллект». Он объединяет более 118 сторонних сервисов, локальное дерево памяти, базу знаний Obsidian и функцию маршрутизации моделей, предлагая триединство приватности, простоты использования и мощных возможностей.

#OpenHuman #открытый ИИ #ИИ-агент
ИИ-новости

PwC полностью развертывает Claude: начиная с США, обучение 30 000 специалистов и сокращение сроков поставки на 70%

Anthropic и PwC объявили о расширении стратегического партнерства: PwC начнет развертывание Claude Code и Cowork в своих американских подразделениях с последующим масштабированием на сотни тысяч сотрудников по всему миру. Стороны создадут совместный центр компетенций для обучения и сертификации 30 000 специалистов по работе с Claude. Пилотные проекты в производственной среде уже демонстрируют сокращение сроков выполнения задач до 70%.

#Anthropic #PwC #Claude Code
ИИ-новости

Anthropic представляет два сценария глобального лидерства в сфере ИИ к 2028 году: это не прогноз, а напоминание

Anthropic опубликовала отчет по политике, в котором описаны два возможных сценария глобального лидерства в сфере ИИ к 2028 году. Компания, разрабатывающая модели, занимается геополитическим моделированием — это не попытка предсказать будущее, а указание на упущенную из виду проблему: темпы разработки политики значительно отстают от темпов развития технологий.

#Anthropic #политика в сфере ИИ #геополитика
ИИ-новости

Anthropic Project Deal: Claude торгует за сотрудников на внутреннем рынке — что говорят результаты

Эксперимент Anthropic Project Deal: Claude получил возможность покупать, продавать и вести переговоры от имени сотрудников офиса в Сан-Франциско. Не концепт-демо, а реально работающий внутренний рынок. Результаты показывают границы возможностей агентов в сложных реальных задачах.

#Anthropic #Claude #Агент
ИИ-новости

Гонконгский университет открыл AI-Trader: полностью автоматизированный агент для трейдинга, 17k звёзд

Лаборатория data science HKU открыла AI-Trader — 100% автоматизированный агентный трейдинг. 336 коммитов, активная разработка, но данные бэктестов требуют осторожной интерпретации.

#AI Agent #Количественная торговля #HKUDS
ИИ-новости

«Сенсорный разрыв» омнимодальных LLM: новая статья раскрывает_gap_ между представлением и действием

Новая статья «Senses Wide Shut» раскрывает систематический разрыв между пониманием на уровне представлений и реальными действиями в омнимодальных LLM — даже когда модели правильно «видят» изображения, их выходные данные могут не соответствовать визуальному пониманию.

#Мультимодальность #LLM #Обзор статьи
ИИ-новости

Anthropic повышает лимиты Claude + сделка с SpaceX: ИИ-компании обращаются к космосу за инфраструктурой

Anthropic повышает лимиты использования Claude и заключает новое партнёрство по вычислениям с SpaceX. Ракетная компания обеспечивает ИИ — не научная фантастика, а бизнес-реальность.

#Anthropic #SpaceX #Claude
ИИ-новости

Google I/O 2026 Превью: 19 мая — что принесут ИИ и Android 17?

Google I/O 2026 пройдёт 19-20 мая, ключевые выступления посвящены ИИ и Android 17. В условиях, когда OpenAI и Anthropic выпускают новые продукты на полной скорости, Google нуждается в серьёзных аргументах.

#Google #Google I/O #Android 17
ИИ-новости

Стэнфордский отчёт AI Index 2026: разрыв в производительности ИИ-моделей США и Китая «почти исчез», но разрыв в вычислениях растёт

Стэнфордский HAI публикует Отчёт AI Index 2026, 423 страницы систематического обзора развития ИИ. Ключевой вывод: разрыв в производительности ИИ-моделей США и Китая почти исчез, но разрыв в вычислениях, инвестициях и талантах остаётся значительным.

#Стэнфорд #AI Index Report #ИИ США и Китая
ИИ-новости

Соглашение Anthropic с суперкомпьютером SpaceX Colossus: борьба за вычислительные мощности за 220 000 GPU

Anthropic и SpaceX заключили соглашение о вычислениях, предоставившее доступ к суперкомпьютеру Colossus 1 — более 220 000 графических процессоров NVIDIA и энергопотребление 300 МВт. Это одно из крупнейших соглашений о сотрудничестве в сфере вычислительных мощностей в истории индустрии ИИ, знаменующее приход новой эпохи «совместного использования вычислительных ресурсов».

#Anthropic #SpaceX #Colossus
ИИ-новости

Четыре крупные китайские модели открыли исходный код за 12 дней: GLM-5.1, MiniMax M2.7, Kimi K2.6, DeepSeek V4

За 12 дней в начале мая четыре крупные китайские лаборатории ИИ -- Zhipu AI, MiniMax, Moonshot AI и DeepSeek -- одновременно выпустили четыре модели для работы с кодом с открытыми весами. Их производительность соответствует передовым западным аналогам, а стоимость инференса составляет менее трети от Claude Opus 4.7.

#Модели с открытым кодом #Китайский ИИ #GLM-5.1
ИИ-новости

Релиз Google Gemini 3.1 Ultra: контекст на 2 миллиона токенов и эпоха нативной мультимодальности

Google выпустила Gemini 3.1 Ultra с окном контекста на 2 миллиона токенов, нативно обрабатывающую текст, изображения, аудио и видео без промежуточных слоев транскрипции. Встроенный инструмент выполнения кода в песочнице позволяет писать и запускать код прямо в диалоге.

#Google #Gemini #мультимодальность
ИИ-новости

80-кратный рост выручки Anthropic за год и прорыв ARR в $44 млрд: скрытые сигналы

Anthropic раскрыла данные о 80-кратном росте выручки в 1-м квартале 2026 года в годовом исчислении, при этом годовая регулярная выручка (ARR) превысила 44 млрд долларов. Этот показатель не имеет аналогов среди ИИ-стартапов и заставляет переосмыслить конкурентный ландшафт отрасли.

#Anthropic #выручка #ARR
ИИ-новости

Anthropic выпускает Claude for Small Business: Официальный запуск набора ИИ-инструментов для малого бизнеса

13 мая Anthropic официально представила Claude for Small Business, интегрировав Claude в повседневные инструменты малого бизнеса, такие как QuickBooks, PayPal и HubSpot, для охвата шести ключевых сценариев: финансы, продажи, маркетинг и HR.

#Anthropic #Claude #Малый бизнес
ИИ-новости

Decoupled DiLoCo от DeepMind: распределённое обучение, устойчивое к отказам узлов — и почему это меняет экономику обучения

DeepMind предлагает Decoupled DiLoCo, делая масштабное распределённое предобучение устойчивым к отказам узлов. Для компаний, обучающих модели на 10K+ GPU, лучшая отказоустойчивость означает реальную экономию.

#Google DeepMind #Распределённое обучение #DiLoCo
ИИ-новости

Perceptron Mk1 снижает стоимость модели видеоанализа в 10 раз — но главная история не в цене

Perceptron Mk1 заявляет о снижении затрат на 80-90% по сравнению с Anthropic, OpenAI, Google для видеоанализа. Реальная история — в осознанном компромиссе: оптимизация под временное понимание при отказе от общего рассуждения.

#Perceptron #Видеоанализ #ИИ-модели
ИИ-новости

«Модели взаимодействия» от Thinking Machines: встроенный диалог в реальном времени вместо API-обёртки

Thinking Machines демонстрирует «модели взаимодействия», делающие интерактивность встроенной способностью, а не API-обёрткой. Если этот подход сработает, он может изменить архитектуру систем ИИ-диалога.

#Thinking Machines #Диалог в реальном времени #Голосовой ИИ
ИИ-новости

Claude подключается к полному стеку юридических инструментов: DocuSign, Thomson Reuters, Harvey — ИИ поглощает инфраструктуру юридических фирм

Anthropic объявила, что Claude теперь может подключаться к основным инструментам, которые юристы используют ежедневно: DocuSign, Box, Thomson Reuters, Harvey и другим. Проникновение ИИ в юридическую индустрию переходит от вспомогательного письма к интеграции на уровне систем.

#Anthropic #Claude #Legal Tech
ИИ-новости

Meta не позволяет заблокировать свой AI-аккаунт в Threads: на этот раз у пользователей нет даже права сказать нет

Meta запрещает пользователям блокировать аккаунт Meta AI в Threads. Пользователи могут @Meta AI для получения ответов, но многие просто не хотят его видеть. Принудительное присутствие ИИ на социальных платформах вызывает споры.

#Meta #Threads #AI-аккаунт
ИИ-новости

Принстон отменил 133-летнюю систему экзаменов на основе кодекса чести, и ИИ-списывание — единственная причина

Принстонский университет решил прекратить 133-летнюю традицию ухода преподавателей из аудитории во время экзаменов. Декан заявил, что и студенты, и преподаватели воспринимают списывание на очных экзаменах как широко распространённое, в значительной степени из-за появления генеративного ИИ.

#Образование #ИИ-списывание #Принстон
ИИ-новости

9router набирает 5000 звёзд за неделю: как долго продлится карнавал бесплатного AI-кодинга?

9router набрал 5200+ GitHub-звёзд за неделю, всего 9,359. Заявляет о подключении Claude Code, Codex, Cursor к 40+ бесплатным AI-провайдерам. За бесплатным обедом — какова цена?

#9router #Бесплатный AI #Инструменты кодинга
ИИ-новости

Создают ли ИИ-инструменты для программирования разработчиков, которые «могут писать, но не могут читать»?

После массового внедрения ИИ-инструментов программирования, таких как Claude Code, Cursor и Copilot, всплыла игнорируемая проблема: когда ИИ может писать код за вас, сможете ли вы всё ещё читать код, написанный другими? Этот разрыв в навыках может быть серьёзнее, чем кажется.

#ИИ-программирование #Claude Code #Cursor
ИИ-новости

Забудьте описания, запомните решения: статья, переопределяющая память агентов с помощью теории информации

Новая статья на arXiv представляет DeMem — подход к памяти агентов, основанный на теоретико-информационной рамке скорости-искажения: ценность памяти определяется не точностью описания прошлого, а сохранением способности различать состояния, критически важные для принятия решений. На бенчмарке длинных диалогов качество решений значительно улучшается при одинаковом бюджете памяти.

#Память агентов #DeMem #Теория скорости-искажения
ИИ-новости

Наблюдение за AI-проектами GitHub на этой неделе: «кембрийский взрыв» open source AI-инструментов

На этой неделе GitHub Trending доминируют AI-проекты: DeepSeek-TUI набрал 20k звёзд за неделю, PageIndex векторless RAG добавил 4.3k. Open source AI-инструменты переживают «кембрийский взрыв».

#GitHub Trending #Open Source AI #DeepSeek-TUI
ИИ-новости

Достаточно ли 26 млн параметров? Cactus Compute «дистиллировала» возможность вызова функций из модели Gemini в компактную модель

Cactus Compute представила Needle — модель для вызова функций объёмом всего 26 млн параметров, дистиллированную из Gemini и способную работать на крайне ресурсоограниченных устройствах. В день публикации на Hacker News (раздел Show HN) проект набрал 175 баллов; 228 коммитов свидетельствуют о его стремительной итерационной разработке.

#Needle #Дистилляция моделей #Вызов инструментов
ИИ-новости

Ruflo набирает 7000 звёзд за неделю: Agent-оркестрация — следующий большой тренд или очередной пузырь?

Ruflo набрал 7000+ GitHub-звёзд за неделю, приближаясь к 50k total. Позиционируется как "ведущая платформа оркестрации агентов для Claude". Но в сфере agent-оркестрации количество звёзд не равно usable.

#Ruflo #Agent-оркестрация #Мульти-Agent
ИИ-новости

TradingAgents — 74,4 тыс. звёзд на GitHub: многоагентная система для торговли акциями — действительно ли она превосходит рынок?

TradingAgents — многоагентная LLM-система для финансовой торговли с 74,4 тыс. звёзд на GitHub. Поддерживает такие бэкенды, как DeepSeek, Qwen, GLM и Ollama. Недавно вышла версия v0.2.5 с новым модулем анализа рыночных настроений. Мы детально разобрали её архитектуру, чтобы оценить реалистичность применения LLM в торговых решениях.

#TradingAgents #Многоагентные системы #Финансовая торговля
ИИ-новости

OpenAI выпускает три модели голосового API реального времени, расширяя возможности голосовых агентов

OpenAI запустила три модели голоса реального времени в своём API с поддержкой рассуждений, перевода и транскрипции. Голосовые агенты переходят от «может понять» к «может подумать и ответить».

#OpenAI #Голос #API
ИИ-новости

SoftBank запускает батарейный бизнес в Японии: у ИИ-дата-центров заканчивается электричество

SoftBank запускает батарейный бизнес в Японии для обеспечения ИИ-дата-центров. Расширение ИИ-вычислений начинает упираться в энергетические ограничения.

#SoftBank #ИИ-инфраструктура #Дата-центры
ИИ-новости

SoftBank инвестирует $457 млн в Graphcore — британскую чип-компанию, на которую все махнули рукой

Согласно filings Companies House, SoftBank вложил $457 млн в британскую ИИ-чип компанию Graphcore. Производитель IPU, считавшийся отставшим, вернулся за стол благодаря支票 Масайоси Сона.

#SoftBank #Graphcore #ИИ-чипы
ИИ-новости

Важнейший отчёт МЭА: потребление электроэнергии центрами обработки данных, связанными с ИИ, удвоится за пять лет — кто возьмёт на себя инвестиции в размере 3,9 трлн долларов?

Международное энергетическое агентство (МЭА) опубликовало новый отчёт, в котором прогнозируется удвоение объёмов потребления электроэнергии глобальными центрами обработки данных в ближайшие пять лет; объём необходимых инвестиций в связанную инфраструктуру оценивается в 3,9 трлн долларов США. Счёт за электроэнергию, лежащий в основе стремительного роста вычислительных мощностей ИИ, превращается в крупнейший фактор неопределённости для отрасли.

#МЭА #центры обработки данных #энергопотребление ИИ
ИИ-новости

Беркли предложила новую парадигму параллельного вывода ИИ: эпоха «100-секундного размышления» подошла к концу

Исследовательская группа Калифорнийского университета в Беркли предложила принципиально новый метод параллельного вывода для искусственного интеллекта, позволяющий крупным языковым моделям отказаться от последовательного «размышления» и обрабатывать сразу несколько цепочек рассуждений параллельно — аналогично работе человеческого мозга. Это может кардинально изменить существующие узкие места в эффективности вывода ИИ.

#Беркли #параллельный вывод #оптимизация вывода ИИ
ИИ-новости

Anthropic открывает исходные коды эталонной архитектуры для финансовых услуг: «троянский конь» Claude в наступлении на финансовую индустрию

Anthropic опубликовала на GitHub эталонную архитектуру financial-services, набравшую за один день 1449 звёзд и более 18 000 звёзд в общей сложности. Этот репозиторий — не просто пример реализации: это инфраструктурный шаг компании по проникновению в сектор финансовых услуг.

#Anthropic #Claude #финансовые услуги
ИИ-новости

ByteDance представила в открытый доступ UI-TARS Desktop: появился настольный интерфейс для мультимодальных ИИ-агентов

После публикации UI-TARS Desktop в открытый доступ на GitHub проект за один день получил 669 «звёзд», а их общее количество превысило 32 000. Проект позиционируется как «открытая мультимодальная стек-платформа ИИ-агентов, объединяющая передовые ИИ-модели и инфраструктуру агентов», и уже становится важной опорной реализацией для ИИ-агентов на настольных системах.

#ByteDance #UI-TARS #мультимодальность
ИИ-новости

Anthropic и NEC: Claude приходит к 30 000 японских инженеров

Anthropic объявляет о стратегическом партнёрстве с NEC: Claude будет развёрнут для примерно 30 000 сотрудников NEC Group по всему миру. NEC становится первым японским глобальным партнёром Anthropic.

#Anthropic #Claude #NEC
ИИ-новости

Google Gemini API File Search становится мультимодальным: RAG теперь может «видеть» изображения

Google объявляет обновление Gemini API File Search до мультимодального — разработчики теперь могут искать и понимать изображения, PDF и смешанные документы напрямую в RAG-пайплайнах без отдельных моделей компьютерного зрения.

#Google #Gemini #Мультимодальность
ИИ-новости

WIRED: всего 10 минут с ИИ делают вас «ленивым» — это не моральная проблема, а когнитивная наука

Новое исследование показывает, что использование ИИ всего 10 минут снижает способность к самостоятельному мышлению. Это не очередная паническая история «ИИ делает людей глупее» — это когнитивно-психологическое открытие, подтверждённое экспериментальным дизайном.

#Влияние ИИ #Когнитивная наука #Исследование
ИИ-новости

Qwen 3.6 Max-Preview: ранний сигнал нового флагмана Alibaba

Alibaba выпустила Qwen 3.6 Max-Preview 20 апреля, позиционируя её как новый флагман серии Qwen. Доступна в Qwen Studio для интерактивного диалога, скоро появится в API Alibaba Cloud Bailian.

#Qwen #Tongyi Qianwen #Alibaba
ИИ-новости

Cloudflare Workers AI обновляет каталог моделей: GLM-4.7-Flash и Gemma-4-26B входят, старые модели депрекейтятся 30 мая

Cloudflare Workers AI обновляет каталог моделей, добавляя GLM-4.7-Flash и Gemma-4-26B-A4B-IT. Устаревшие модели Llama и Kimi депрекейтятся к 30 мая — разработчикам нужно мигрировать.

#Cloudflare #Workers AI #Каталог моделей
ИИ-новости

Ant Ring-2.6-1T: модель рассуждений с триллионом параметров и динамической интенсивностью мышления

Команда Bailing от Ant Group выпустила Ring-2.6-1T, флагманскую модель рассуждений с триллионом параметров и 63 млрд активных, с механизмом динамической интенсивности мышления, бесплатно на OpenRouter на одну неделю.

#Ant Group #Bailing #Ring
ИИ-новости

Grok iOS-приложение запускает Imagine Agent Mode: генерация изображений и видео становится нативной

В iOS-приложении Grok появился Imagine Agent Mode с нативным интерфейсом для сложных рабочих процессов генерации изображений и видео. xAI лидирует в мобильной агентизации, но настоящий тест — смогут ли качество и скорость генерации соответствовать десктопной версии.

#Grok #xAI #Imagine Agent
ИИ-новости

Решение OpenAI на базе WebRTC может быть не оптимальным для голосового ИИ

Бывший инженер WebRTC из Twitch/Discord в своей статье указывает, что стратегия потери пакетов и отсутствие буферизации в WebRTC фундаментально противоречат требованиям голосового ИИ — техническое решение OpenAI, возможно, использует неверный базовый протокол.

#OpenAI #WebRTC #голосовой ИИ
ИИ-новости

AI меняет культуру раскрытия уязвимостей: от ответственного раскрытия к ускорению атак

AI-инструменты одновременно меняют поведение обнаружителей и исправителей уязвимостей. AI ускоряет обнаружение, разработчики также используют AI для ускорения исправлений.

#AI #Кибербезопасность #Раскрытие уязвимостей
ИИ-новости

MiniMax M2.7: фреймворк самоэволюции агентов запущен с серьёзным улучшением офисных сценариев

MiniMax выпускает модель M2.7 с самоэволюционирующим Agent harness, значительным улучшением инженерного кодирования и сложных офисных сценариев (многораундовое редактирование Excel/Word/PPT). API и Agent-опыт уже доступны.

#MiniMax #M2.7 #Agent Framework
ИИ-новости

OpenAI тихо опубликовала официальный CLI: один вызов GPT-5.5 из командной строки

OpenAI выпустила openai/openai-cli на GitHub — официальный инструмент командной строки на Go. Версия 1.1.2 уже поддерживает GPT-5.5 и Realtime API. 42 коммита за неделю сигнализируют о переходе к модели "full-stack SDK компании".

#OpenAI #CLI #Open Source
ИИ-новости

xAI выпускает Grok Voice Think Fast 1.0: голосовой агент, способный принимать реальные телефонные звонки

xAI представляет Grok Voice Think Fast 1.0 — первый голосовой агент, предназначенный для работы в реальных телефонных сценариях. Он устойчив к шуму и акцентам, поддерживает пошаговое устранение неполадок и частые вызовы инструментов, а также позволяет совершать реальные звонки прямо из консоли.

#xAI #Grok #голосовой агент
ИИ-новости

OpenAI выпускает GPT-5.5-Cyber: специализированная модель для кибербезопасности в ограниченном превью

OpenAI в четверг выпустила превью GPT-5.5-Cyber, доступное только проверенным командам кибербезопасности. Вариант GPT-5.5 с ослабленными ограничениями безопасности для задач безопасности, позволяющий комплаент-командам проводить идентификацию уязвимостей, проверку патчей и анализ вредоносного ПО.

#OpenAI #GPT-5.5-Cyber #Кибербезопасность
ИИ-новости

Anthropic раскрывает три направления для моделей следующего поколения на Code with Claude: более высокое суждение, «бесконечный» контекст, мультиагентная координация

На Code with Claude Anthropic раскрыла три приоритетных направления для моделей следующего поколения: более высокое суждение и вкус к коду, «бесконечные» контекстные окна и мультиагентная координация — сигнализируя о новой фазе в модельной гонке.

#Anthropic #Claude #Code with Claude
ИИ-новости

Отчёт CAISI: DeepSeek V4Pro по бенчмаркам не уступает, но на 8 месяцев отстаёт от фронтальных моделей США на практике

Официальное агентство оценки AI США CAISI сообщает: DeepSeek V4Pro соответствует GPT-5 августа прошлого года, отставание около 8 месяцев. Бенчмарки близки, но практика недостаточна — выдерживает ли эта оценка критику?

#DeepSeek #CAISI #Оценка AI
ИИ-новости

Технический отчёт GLM-5V-Turbo: Zhipu строит нативную мультимодальную агентную модель

Zhipu публикует технический отчёт GLM-5V-Turbo, уделяя внимание мультимодальной цепочке инструментов и интеграции с агентными фреймворками. Модель объединяет поиск, кроппинг, аннотирование и чтение веб-страниц в цикл восприятия-планирования-исполнения.

#Zhipu #GLM #Мультимодальность
ИИ-новости

Google разделила Gemini API: больше нет ролей user/model, каждое действие — отдельный шаг

Google эволюционировала Gemini Interactions API, убрав строгое разделение ролей user/model, представив каждое действие (мышление, вызовы инструментов, ответы) как независимый шаг. Поддержка многошаговых агентных воркфлоу на уровне API.

#Google #Gemini #API
ИИ-новости

xAI Grok Build: настольное приложение для кодирования, но сможет ли оно победить Cursor?

xAI готовится выпустить Grok Build — кроссплатформенное настольное приложение для кодирования для macOS/Windows/Linux. Встроенный Planning Mode, Plugins, Skills, MCPs, прямое управление Git Tree, запуск dev-серверов и встроенный браузер. Ещё один шаг Grok от чата к инженерии.

#xAI #Grok Build #Агент кодирования
ИИ-новости

xAI запускает режим качества генерации изображений Grok: 300 млн изображений, теперь доступно для предприятий через API

API xAI запускает режим качества генерации изображений на базе модели, уже сгенерировавшей более 300 млн изображений на платформе Grok, предлагая более высокий реализм и улучшенную передачу текста для корпоративных пользователей.

#xAI #Grok #Генерация изображений
ИИ-новости

Tencent Hunyuan выпускает офлайн-модель перевода объёмом 440 МБ, 1,8 млрд параметров на уровне 72B

Команда Tencent Hunyuan выпустила офлайн-модель перевода объёмом 440 МБ с 1,8 млрд параметров. Заявлено, что качество перевода превосходит Tower-Plus-72B и Qwen3 35B.

#Tencent #Hunyuan #Модель перевода
ИИ-новости

DeepSeek-V4-Pro нативно подключается к Claude Code: программирование с миллионным контекстом без дополнительной настройки

DeepSeek-V4-Pro достиг нативной интеграции с Claude Code, Codex, OpenClaw и другими основными агентами для программирования через Ollama. Контекстное окно в 1 миллион токенов и чрезвычайно низкие цены API меняют дальние рабочие процессы программирования. Разработчики могут испытать возможности программирования с миллионным контекстом без дополнительной настройки.

#DeepSeek #V4 Pro #Claude Code
ИИ-новости

Google тестирует AI-ассистента "Remy" внутри компании: круглосуточный персональный агент уже близко

По данным Business Insider, Google internally тестирует AI-агента под названием "Remy", позиционируемого как круглосуточный персональный ассистент, способный выполнять кросс-сервисные действия в экосистеме Gemini. Сотрудники уже используют его в dogfooding, что предполагает, что публичная версия персонального AI-ассистента Google может появиться в ближайшее время.

#Google #Gemini #Remy
ИИ-новости

GLM-4.7: модель программирования с открытым исходным кодом от Zhipu, недооценена?

GLM-4.7 от Zhipu AI занимает в нескольких оценках одну из позиций сильнейших моделей программирования с открытым кодом. Платформа NVIDIA NIM предлагает бесплатный доступ к API. В конкурентной среде китайских моделей программирования позиция GLM-4.7 заслуживает пересмотра.

#GLM #Zhipu AI #Открытый исходный код
ИИ-новости

MiniMax M3 выходит в этом месяце: нацелен на офисные сценарии с масштабным обновлением агентных способностей

MiniMax M3 выходит в этом месяце, сосредоточившись на улучшении агентных способностей и адаптации к офисным сценариям. M2.7 уже показал отличные результаты в бенчмарках локальных моделей, и M3, как ожидается, ещё больше сократит разрыв с моделями высшего уровня.

#MiniMax #M3 #Agentic
ИИ-новости

Zhipu Qingyan раздаёт щедро: 2 млн бесплатных токенов при регистрации, 6 млн для визуальной модели GLM-4.6V

Zhipu Qingyan запускает масштабную кампанию бесплатных токенов: 2 млн универсальных токенов при регистрации, 6 млн для визуальной модели GLM-4.6V и 12 млн для GLM-4.5-Air. Верификация личности не требуется — достаточно номера телефона. Этот шаг значительно снижает барьер для знакомства с китайскими моделями.

#Zhipu GLM #GLM-4.6V #GLM-4.5-Air
ИИ-новости

MiniMax от M2.7 к M3: путь «Office Agent» для китайских моделей

MiniMax готовится выпустить версию M3 после M2.7, впервые продемонстрировав предварительный просмотр способностей Office Agent. В оценке GDPval-AA M2.7 набрал 1514 баллов — не самый высокий результат, но модель идёт по дифференцированному пути офисных сценариев, формируя асимметричную конкуренцию с DeepSeek, Kimi и GLM.

#MiniMax #M2.7 #M3
ИИ-новости

Bailin Ling-2.6 1T взлетает на 16-е место в недельном рейтинге OpenRouter: обходит GLM 5.1 через несколько дней после запуска

Серия Bailin Ling-2.6 от Ant Group взлетает на 16-е место в недельном рейтинге OpenRouter, обходя GLM 5.1 от Zhipu через несколько дней после запуска. Ling-2.6-Flash теперь с открытым исходным кодом, позиционируется как модель, ориентированная на производство, а не на хайп, со значительными оптимизациями в эффективности вывода и производительности агентов.

#Bailin #Ant Group #Модели с открытым кодом
ИИ-новости

Kimi K2.6 на June AI: кодирование + Swarm-оркестрация — новый стандарт автономного исполнения

Kimi K2.6 от Moonshot AI официально запущена на платформе June AI. Как модель с открытыми весами, K2.6 ориентирована на кодирование, устойчивое автономное исполнение и Swarm-оркестрацию. Она превосходит в долгосрочной инженерии ПО и итеративной разработке, приближаясь или surpassing закрытые флагманы в SWE-bench при сохранении открытого доступа.

#Kimi #Moonshot AI #June AI
ИИ-новости

Zhipu GLM-5.1 выпущен: 600 итераций непрерывной оптимизации, новый отечественный выбор для долгосрочных задач агентов

Zhipu выпускает GLM-5.1, флагманскую модель нового поколения для AI-агентов, лидирующую в SWE-Bench Pro. Ключевоепрорыв: способность непрерывного улучшения в течение 600 итераций долгосрочного рассуждения, специально разработана для сценариев агентов, требующих длительной непрерывной работы.

#Zhipu #GLM-5.1 #Agent
ИИ-новости

Zhipu GLM Coding прекращает старый план «без недельных лимитов»: точка монетизации китайских AI-инструментов программирования

Zhipu объявила, что с 30 апреля 2026 года старый план GLM Coding Plan «без недельных лимитов» прекращает автоматическое продление, затрагнутые пользователи получат 2 месяца эквивалентных льгот нового плана. Это знаковое событие, отмечающее переход китайских AI-инструментов программирования от «ориентации на привлечение пользователей» к «ориентации на доходы».

#Zhipu #GLM #Инструменты программирования
ИИ-новости

MiniMax M2.7: модель, которая обучает сама себя

MiniMax выпускает M2.7 с инновацией «модель участвует в собственной итеративной тренировке». Приближается к Opus на SWE-Pro при цене 2.1 юаня/миллион токенов — один из самых экономичных Agent-моделей для кодинга.

#MiniMax #Самообучение #Agent
ИИ-новости

Google Gemini Embedding 2 GA: Мультимодальный RAG входит в эпоху унифицированных эмбеддингов

Google официально выпускает Gemini Embedding 2, отображающий текст, изображения, видео, аудио и документы в единое пространство эмбеддингов. Поддерживает агентный мультимодальный RAG и визуальный поиск.

#Google #Gemini #Embedding
ИИ-новости

OpenAI запускает программу bug bounty по биобезопасности GPT-5.5: пять вызовов, приз $25,000

OpenAI объявила программу bug bounty по биобезопасности для GPT-5.5, предлагая до $25,000 исследователям, которые найдут универсальный метод джейлбрейка, обходящий пять вопросов биобезопасности, с тестированием, ограниченным средой Codex.

#OpenAI #GPT-5.5 #Биобезопасность
ИИ-новости

OpenClaw v2026.4.27: Codex Computer Use запущен, агенты могут управлять рабочим столом

OpenClaw выпустил версию v2026.4.27 с функцией Codex Computer Use. AI-агенты теперь могут напрямую управлять рабочим столом пользователя, поддерживая GPT-5.5 и Claude Opus 4.7 среди множества моделей, с ускоренным запуском и увеличенным числом каналов связи.

#OpenClaw #Codex #Computer Use
ИИ-новости

Qwen3.6 Open Source на практике: 27B плотная модель против 400B MoE, Apache 2.0 дружественна для коммерческого использования

Серия Qwen3.6 включает две открытые версии (2.7B и 27B) и закрытую версию Max Preview с 1T параметров. 27B плотная модель преуспевает в кодировании и использовании инструментов, занимая 8-е место в Vals Index и 2-е место в оценке честности BridgeBench. Лицензия Apache 2.0 крайне дружественна для коммерческого использования.

#Qwen3.6 #Alibaba #открытые модели
ИИ-новости

Alibaba HappyHorse 1.0 возглавляет Artificial Analysis — новый эталон генерации видео

Alibaba выпускает мультимодальную модель генерации видео HappyHorse 1.0, занявшую первое место в Artificial Analysis Video Arena с нативным разрешением 1080P, длительностью 15 секунд и поддержкой синхронизации губ на 7 языках.

#генерация видео #Alibaba #мультимодальность
ИИ-новости

Расширение экосистемы Gemini: от автомобильного AI до AI Impact Summit, стратегия Google

Google расширяет возможности моделей Gemini на автомобили, устройства Mac и корпоративные сервисы. General Motors объявила об интеграции Gemini в 4 миллиона автомобилей, Gemini App появился на Mac, AI Impact Summit 2026 продемонстрировал партнёрства Google в области AI.

#Google #Gemini #Автомобильный AI
ИИ-новости

Anthropic объявляет Claude for Creative Work, расширяя AI в визуальный дизайн

Anthropic объявила Claude for Creative Work 28 апреля 2026 года, расширяя возможности Claude в область визуального дизайна и креативных рабочих процессов. Это следует за Claude Design от Anthropic Labs,标志着AI正式进入视觉创意领域。

#Anthropic #Claude #Креативный дизайн
ИИ-новости

Исследование реальной стоимости AI-моделей: низкая цена не означает дешевизну

Исследование Стэнфорда показало, что Gemini 3 Flash при заявленной цене в 1.7 раза дешевле Claude Haiku, на самом деле обходится в 28 раз дороже на MMLUPro. Выбор модели нельзя делать только по заявленным ценам.

#Стоимость моделей #AI Pricing #Stanford Research
ИИ-новости

Апрельская панорама ИИ-индустрии: полномасштабное противостояние технологических гигантов США и Китая и волна открытого исходного кода

Обзор крупных событий в сфере ИИ за апрель 2026 года: выпуск GPT-5.5, открытый исходный код DeepSeek V4, остановка Китаем сделки по приобретению Meta платформы Manus, и выпуск китайскими командами 3 передовых моделей за одну неделю.

#Тенденции индустрии #Технологии США и Китая #Открытый код