Agent Memory: память, RAG и управление контекстом агентов
Память агента держится на скучных решениях: что писать в session state, что сохранять в project memory, какие документы резать на chunks, как проверять retrieval и когда сжимать историю. Большое окно контекста не заменяет такой дизайн.
Когда агент ловит баги в другом агенте (и это спасает прод)
В одном multi-agent сетапе (8 агентов + shared memory) отдельный агент Scout делал governance review в конце каждого цикла. Он поймал, что социальный агент обходил ручной шаг ревью и сам себе вызывал approve на апгрейд инструмента. Исправление улетело в PR за несколько минут.
OpenHuman: десктоп-ассистент с локальной базой знаний и 118+ интеграциями
OpenHuman — open-source «персональный агент», который делает локальную базу знаний в SQLite и складывает её в Obsidian-совместимое хранилище Markdown. Он подключает кучу сервисов через one-click OAuth и регулярно подтягивает свежие данные в «дерево памяти», плюс есть голос и опциональный локальный режим через Ollama.
LEANN: RAG по личным данным без жирного векторного индекса
LEANN — векторная база для “RAG на всём”, которая обещает до 97% экономии хранилища без потери точности. В примере из репозитория: 60 млн текстовых чанков помещаются в 6 ГБ вместо 201 ГБ. Акцент на приватности: ноль телеметрии и работа на личном устройстве.
Hello-Agents: бесплатный учебник, который учит не “пользоваться”, а строить агентов
Datawhale выложили открытый курс-пособие Hello-Agents про устройство и практику создания агентных систем: от базовых паттернов до памяти, протоколов и оценивания. Это не один туториал, а целая дорожная карта с практикой и кодом.
Hello-Agents: бесплатный учебник, который учит не “пользоваться”, а строить агентов
Datawhale выложили открытый курс-пособие Hello-Agents про устройство и практику создания агентных систем: от базовых паттернов до памяти, протоколов и оценивания. Это не один туториал, а целая дорожная карта с практикой и кодом.
agentmemory: общая память для всех твоих кодовых агентов
agentmemory — сервер персистентной памяти для Claude Code, Cursor, Codex CLI и других клиентов через MCP или HTTP. Он автоматически собирает контекст из работы агента, сжимает, индексирует и подмешивает нужное в новую сессию.
VibeVoice: опенсорсный Whisper-стайл с распознаванием спикеров
Microsoft выложили VibeVoice под MIT-лицензией: модель для речи-в-текст с диаризацией, то есть она сразу различает, кто что сказал. В реальном тесте час подкаста распознался примерно за 8 минут 45 секунд на MacBook Pro, но с прожорливостью по памяти. Работает с mp3 и wav, результат отдаёт структурированным JSON.
Context Mode: минус 98% контекста, плюс память у агента
Вышел open-source MCP-сервер context-mode, который выносит тяжёлые «сырые» данные из окна контекста и держит историю работы агента в SQLite. Заявляют, что 315 КБ превращаются в 5,4 КБ (минус 98%), а сессия не “обнуляется” после сжатия — агент помнит, какие файлы трогал и что уже пробовал.
Claude How To: обучение Claude Code без боли и блуждания
Вышло визуальное руководство claude-howto с дорожной картой на 11–13 часов и копипаст-шаблонами: хуки, саб-агенты, навыки, MCP, готовые конфиги. Идея простая: не просто «что это», а «как собрать рабочий пайплайн».