Pixbite.ru
P

AI-апокалипсис вместо каникул: OpenAI, Google и Meta выкатили вообще всё

Казалось бы, начало января — время доедать салаты и комитить в main только самые безобидные фиксы. Но AI-индустрия в 2026 году живет по другому календарю. На этой неделе OpenAI, Google, Meta и даже Alibaba решили, что сон для слабаков, и вывалили пачку обновлений, которых хватило бы на квартал. Разберемся, что из этого реально меняет правила игры, а что — просто маркетинг.

Битва пикселей: Flux 2 Max против GPT-Image-1.5

Главная драма развернулась в генерации изображений. OpenAI выкатила GPT-Image-1.5 (доступен и в чате, и через API), явно пытаясь сместить с трона текущего лидера — Nano Banana Pro. Но куда интереснее выглядит ответ от Black Forest Labs с их Flux 2 Max.

Заявка была мощная: итеративное редактирование (когда модель помнит контекст предыдущих правок) и «заземленная» генерация. На бумаге звучит как мечта дизайнера. На деле — есть нюансы.

В тестах Flux 2 Max ведет себя капризно. Попросили убрать человека справа? Модель может скрестить вас с этим человеком, создав жутковатый гибрид. Тест на «девять прямоугольников с разными объектами» тоже провален — сетка плывет, объекты вылезают за рамки.

Пока что OpenAI выигрывает в точности следования инструкциям, а Flux остается инструментом для тех, кто готов крутить промпты до посинения ради специфической эстетики.

Аудио и Видео: Липсинк, в который веришь

Если с картинками всё сложно, то в видеогенерации случился прорыв. Китайская Kling обновила модель до версии 2.6, и их новый липсинк (синхронизация губ с речью) — это лучшее, что есть на рынке. Без шуток, персонажи больше не выглядят как куклы чревовещателя. Это уже уровень, при котором дипфейки становятся реальной угрозой безопасности, а не просто забавой.

А вот Luma AI с их Ray 3 Modify разочаровала. Идея красивая: берем видео, задаем первый и последний кадр, и нейронка перерисовывает всё в новом стиле. Реальность: 10 минут ожидания, ошибка генерации, еще 10 минут — и на выходе артефакты. Меч левитирует, анимация ломается. Платить за бета-тест их багов — удовольствие сомнительное.

Meta «фотошопит» звук

Цукерберг тихо выкатил SAM Audio (Segment Anything Model). Суть проста: это «волшебная палочка» из Photoshop, но для звуковых дорожек. Загружаете трек, пишете «выдели гитару» или «удали голос» — и получаете стемы. Тесты на Suno-генерированной музыке показывают чистую работу: вокал вырезается хирургически точно. Для подкастеров и саунд-дизайнеров — мастхэв.

Google демпингует, OpenAI кодит

Google продолжает давить ценой и скоростью. Анонсирована Gemini 3 Flash. Главные фичи:

  • В 4 раза дешевле Pro-версии.
  • Работает молниеносно.
  • По бенчмаркам дышит в спину старшему брату, хотя галлюцинирует чуть чаще.

Также Google Search теперь по дефолту будет использовать именно эту модель. Параллельно подвезли Gemini 2.5 Text-to-Speech — звучит настолько живо, что отличить от подкастов NotebookLM становится невозможно.

OpenAI ответила узкоспециализированным ударом: GPT-5.2 Codex. Это агентная модель, заточенная под энтерпрайз-разработку и кибербезопасность. В бенчмарках (Software Engineering Bench) она обходит ванильную 5.2. Похоже, «вайб-кодинг» (создание приложений с телефона через промпты) становится мейнстримом, и OpenAI хочет продавать лопаты для этой золотой лихорадки.

Кстати, про «взрослый контент»: OpenAI официально подтвердила, что в Q1 2026 появится Adult Mode. Видимо, лавры Grok не дают покоя Сэму Альтману.

Дата-центры на орбите: Экология или безумие?

Самая футуристичная новость недели: компания StarCloud начала тренировать AI-модели в космосе. Это не сюжет Sci-Fi фильма, а попытка решить проблему перегрева.

Логика железная: на Земле заканчивается вода и энергия для охлаждения гигантских кластеров Nvidia. В космосе холодно и (пока что) бесплатно. План — запустить рой из 80 спутников-серверов, связанных лазерами. Звучит как начало восстания машин, но если это снизит стоимость инференса, рынок скажет спасибо.

Итого

Январь 2026-го задал бешеный темп. Мы видим четкое разделение: Google уходит в масс-маркет и дешевую инфраструктуру, китайские модели (Kling, Alibaba Wan) доминируют в видео, а OpenAI пытается удержать лидерство в кодинге и сложных мультимодальных задачах. Год будет тяжелым, но интересным.

0
AI новости января 2026: Flux 2, Gemini 3 Flash и дата-центры | Pixbite.ru - Агрегатор SaaS сервисов