AI-инфраструктура: пайплайны, рантаймы и production-практики
AI-инфраструктура начинается после первого удачного demo. Нужны очереди, retries, sandbox, traces, eval gates, лимиты стоимости, деплой и расследуемые ошибки. Без этого агент умеет красиво отвечать, но команда не понимает, почему он сломался в пятницу вечером.
Spec Kit от GitHub: меньше вайб-кодинга, больше результата
GitHub выложили open-source Spec Kit — набор инструментов для Spec-Driven Development, где спецификация становится центром разработки, а не забытым файлом. Там есть CLI и интеграции со многими AI-код-агентами через команды вроде /speckit.*.
ACE-Step UI: локальная генерация музыки вместо подписок
Появился ACE-Step UI — открытый интерфейс для генерации музыки на базе open-source модели ACE-Step 1.5, с упором на локальный запуск на GPU. Автор делает акцент на “альтернативе Suno/Udio” без подписок и очередей, с библиотекой треков и удобным плеером. Заявлены функции вроде генерации песен с вокалом, референс-аудио и перегенерации частей.
LLM Wiki Compiler: личная база знаний, которую мы реально владеем
Появился open-source CLI, который компилирует заметки в связанный «вики-граф» и оставляет всё в чистом markdown. Там двухфазный пайплайн: извлечение понятий, потом генерация страниц и ссылок, плюс инкрементальные обновления. Это не SaaS и не «чатик», а артефакт, который остаётся у нас.
Codex CLI научился работать «до победы» через /goal
В Codex CLI 0.128.0 появился режим /goal: задаём цель, и агент крутит цикл действий, пока сам не решит, что цель достигнута, или пока не упрётся в токен-бюджет. Это похоже на «петлю исполнителя»: планируй → делай → проверяй → повторяй.
GPT-5.5 стал доступен в API, и OpenAI выпустила набор практических советов по миграции и работе с новой моделью. Ключевая мысль: относитесь к GPT-5.5 как к новой «семье», а не как к замене старых версий, и не тащите старые промпты как есть.
LiteParse в браузере: вытащить текст из PDF без облака
Появилась браузерная версия LiteParse — извлечение текста из PDF прямо на вашей машине, с OCR по желанию. Это не “AI магия”, а аккуратный разбор PDF-раскладок плюс Tesseract для картинок.
OpenVoice V1/V2 — open-source система клонирования голоса и управления стилем речи, с поддержкой нескольких языков и акцентов. Проект выпущен под лицензией MIT, то есть заявлено бесплатное коммерческое использование.
Fooocus: генерация картинок офлайн, без «танцев с параметрами»
Fooocus — бесплатный open-source генератор изображений на базе Stable Diffusion XL, который работает автономно и старается быть “как онлайн-генераторы”, только у вас на машине. Создатели отдельно предупреждают: в поиске появилось много фейковых сайтов, официальный источник — только GitHub-репозиторий.
TrendRadar: свой радар новостей и трендов с локальным хранением
TrendRadar — open-source монитор трендов и «публичного мнения» с агрегацией из разных источников, RSS и умными алертами. Обещают быстрый деплой через Docker и пуши в Telegram/почту/мессенджеры, данные можно держать у себя.