Офлайн ИИ ЛИС: тест Qwen 3.6 без цензуры на RTX 4090 без облачных API

#181 суббота, 20 июня 2026 г. суббота, 20 июня 2026 г. 4 минут(ы) 287 слов

В этом видео продолжаю разработку и тестирование проекта ЛИС — Локальные Интеллектуальные Системы 🦊. Это локальная мультиагентная ИИ-система, которая работает полностью офлайн без облачных API. Всё крутится на RTX 4090, а в роли основной модели выступает Qwen 3.6 без цензуры. Проверяю, как система ведет себя без цензурных фильтров, как агенты взаимодействуют друг с другом и как справляются с визуальными задачами в реальном времени.

🦊 ЛИС — Локальные Интеллектуальные Системы
Локальная мультиагентная ИИ-система, которая работает полностью офлайн без облачных API.

⏱ Таймкоды:

0:00 — Вступление: проект ЛИС и модель Qwen 3.6
0:52 — RTX 4090, режим MTP и работа без облаков
3:52 — Вопрос: США — страна-изгой?
16:45 — СССР vs США: причины геополитического поведения
21:13 — Илон Маск: жесты или инфошум?
24:37 — Китай: авторитаризм или прагматизм?
28:23 — Визуальный квиз: агенты угадывают персонажей
37:19 — Тест на выживание: кто останется в чате?
53:50 — Итоги, баги с токенами и планы развития

⚙️ Технические детали:

Основная модель: Qwen 3.6 35B A3B (uncensored)
Системная модель: Gemma 4 E4B (распознавание команд, роутинг, сжатие контекста)
Режим генерации: MTP (Multi-Token Prediction)
Инфраструктура: LM Studio, OpenAI-compatible API, полностью локальный запуск
Железо: NVIDIA RTX 4090 (24 GB)

💬 Обсудим в комментариях:
→ Как вам ответы агентов на острые геополитические темы — уловили ли они контекст или ушли в шаблоны?
→ Заметили ли вы разницу в скорости и стабильности генерации с режимом MTP?
→ Какой лимит Max Tokens вы считаете оптимальным для мультиагентных чатов: 2k, 4k или больше?

🔔 Подписывайтесь на канал D00M4ACE — здесь я делюсь размышлениями о гейминге, ретро-консолях, разработке игр и использовании ИИ в творчестве. Вместе соберём тусовку единомышленников!

https://www.youtube.com/c/d00m4ace