Офлайн ИИ ЛИС: тест Qwen 3.6 без цензуры на RTX 4090 без облачных API
#181 суббота, 20 июня 2026 г. суббота, 20 июня 2026 г. 4 минут(ы) 287 слов
📺 VK видео
В этом видео продолжаю разработку и тестирование проекта ЛИС — Локальные Интеллектуальные Системы 🦊. Это локальная мультиагентная ИИ-система, которая работает полностью офлайн без облачных API. Всё крутится на RTX 4090, а в роли основной модели выступает Qwen 3.6 без цензуры. Проверяю, как система ведет себя без цензурных фильтров, как агенты взаимодействуют друг с другом и как справляются с визуальными задачами в реальном времени.
🦊 ЛИС — Локальные Интеллектуальные Системы
Локальная мультиагентная ИИ-система, которая работает полностью офлайн без облачных API.
⏱ Таймкоды:
- 0:00 — Вступление: проект ЛИС и модель Qwen 3.6
- 0:52 — RTX 4090, режим MTP и работа без облаков
- 3:52 — Вопрос: США — страна-изгой?
- 16:45 — СССР vs США: причины геополитического поведения
- 21:13 — Илон Маск: жесты или инфошум?
- 24:37 — Китай: авторитаризм или прагматизм?
- 28:23 — Визуальный квиз: агенты угадывают персонажей
- 37:19 — Тест на выживание: кто останется в чате?
- 53:50 — Итоги, баги с токенами и планы развития
⚙️ Технические детали:
- Основная модель: Qwen 3.6 35B A3B (uncensored)
- Системная модель: Gemma 4 E4B (распознавание команд, роутинг, сжатие контекста)
- Режим генерации: MTP (Multi-Token Prediction)
- Инфраструктура: LM Studio, OpenAI-compatible API, полностью локальный запуск
- Железо: NVIDIA RTX 4090 (24 GB)
💬 Обсудим в комментариях:
→ Как вам ответы агентов на острые геополитические темы — уловили ли они контекст или ушли в шаблоны?
→ Заметили ли вы разницу в скорости и стабильности генерации с режимом MTP?
→ Какой лимит Max Tokens вы считаете оптимальным для мультиагентных чатов: 2k, 4k или больше?
🔔 Подписывайтесь на канал D00M4ACE — здесь я делюсь размышлениями о гейминге, ретро-консолях, разработке игр и использовании ИИ в творчестве. Вместе соберём тусовку единомышленников!
https://www.youtube.com/c/d00m4ace