Agent Memory: память, RAG и управление контекстом агентов
Память агента держится на скучных решениях: что писать в session state, что сохранять в project memory, какие документы резать на chunks, как проверять retrieval и когда сжимать историю. Большое окно контекста не заменяет такой дизайн.
VibeVoice: опенсорсный Whisper-стайл с распознаванием спикеров
Microsoft выложили VibeVoice под MIT-лицензией: модель для речи-в-текст с диаризацией, то есть она сразу различает, кто что сказал. В реальном тесте час подкаста распознался примерно за 8 минут 45 секунд на MacBook Pro, но с прожорливостью по памяти. Работает с mp3 и wav, результат отдаёт структурированным JSON.
Context Mode: минус 98% контекста, плюс память у агента
Вышел open-source MCP-сервер context-mode, который выносит тяжёлые «сырые» данные из окна контекста и держит историю работы агента в SQLite. Заявляют, что 315 КБ превращаются в 5,4 КБ (минус 98%), а сессия не “обнуляется” после сжатия — агент помнит, какие файлы трогал и что уже пробовал.
Claude How To: обучение Claude Code без боли и блуждания
Вышло визуальное руководство claude-howto с дорожной картой на 11–13 часов и копипаст-шаблонами: хуки, саб-агенты, навыки, MCP, готовые конфиги. Идея простая: не просто «что это», а «как собрать рабочий пайплайн».
Context Mode: экономим контекст и не теряем нить в агентских сессиях
Вышел MCP-сервер, который выносит «сырые» данные из окна контекста и хранит события сессии в SQLite. Авторы показывают сжатие 315 КБ до 5,4 КБ, то есть минус 98% контекста, и меньше забываний после компакта.
Awesome LLM Apps: 100+ шаблонов, которые реально запускаются
Репозиторий awesome-llm-apps — это набор готовых приложений с агентами, RAG, голосом и MCP, которые можно клонировать и запускать. Автор обещает «3 команды и работает», плюс Apache-2.0: можно форкать, переделывать, продавать.
Omi: открытый «второй мозг», который помнит экран и разговоры
Omi — open-source система, которая захватывает экран и аудио, транскрибирует в реальном времени, делает саммари и action items, а потом даёт чат по твоей «памяти». У проекта есть десктоп, мобилка, SDK и даже железо/прошивки для носимых устройств.
Everything Claude Code (ECC) — OSS-набор для прокачки AI-агентов (🔧 Инструменты)
На GitHub выложили большой open-source “performance optimization system” для Claude Code / Codex / Cursor / OpenCode и других. Это не одна настройка, а целая система: агенты, навыки, память, хуки, правила, MCP-конфиги.
Ralph: агентный цикл, который доводит PRD до готовых задач
Ralph — автономный цикл агента, который повторно запускает Claude Code или Amp, пока пункты PRD не будут выполнены. Память между итерациями держится на git-истории и простых файлах прогресса.
Sortie: оркестратор для код-агентов без локов на вендора
Вышел Sortie — один Go-бинарник, который сам следит за тикетами, поднимает сессии код-агента, гоняет CI и возвращает ошибки обратно в цикл. Всё сохраняется в SQLite, а провайдеров можно менять: GitHub/Jira и Claude/Copilot и т.д.