Оценка идёт не по баллам, а по пяти осям. По каждой ставим уровень от L0 до L3, итоговый — по преобладанию. Нажми на ось, чтобы раскрыть шкалу.
Если человек знает термины (потолок выше), но в работе не применяет (поведение ниже) — берём нижнее. Знание без практики не считается за уровень.
Самоотчёт в анкете слабее всего, реальная работа — весомее. Порядок доверия: анкета → чаты → запись экрана. Где расходятся — верим тому, что ближе к реальной работе.
Ксения — пользователь уровня L2 по скиллам, с реальным поведением на L1. По способностям она тянет на системный уровень: мастерски строит текстовые ТЗ, проверяет расчёты моделей и ловит ошибки, самостоятельно находит внешние AI-инструменты (TurboScribe) под задачу.
Но из-за отсутствия навыков архитектурного проектирования она решает задачи объёмом ручной работы — тратит много времени на ручной перенос данных, ручную загрузку файлов и ведёт длинные неструктурированные чаты (до 94 страниц в одной ветке).
Её сила — в прикладной смекалке пользователя (как использовать модели), а не в технической архитектуре (как они устроены под капотом). Поэтому ей нужно не обучение промптингу — этим она уже владеет, — а смена режима работы на системный: экосистемные инструменты (Claude Projects, кастомные ассистенты, автоматизация).
| Вопрос анкеты | Ответ сотрудника | Комментарий аудитора | Реальный уровень |
|---|---|---|---|
| Количество запросов вчера | 4–10 запросов | Ситуативное, а не системное использование инструмента в течение рабочего дня. | L1 |
| Лимиты сообщений | Заканчиваются регулярно | Перегрузка контекста из-за неумения изолировать сессии (отсутствие изоляции сессий). | L1 |
| Настройка ассистентов | Создала проект в Claude Projects под задачу | На практике (по видео) Projects используется просто как папка для файлов в веб-интерфейсе, без сборки системных инструкций. | L1 → L2 |
| Как выглядит запрос | Роль + задача + контекст + требования к формату | Теория идеальная, полностью подтверждается её аналитическими чатами. | L2 |
| Что делаете при плохом ответе | «Ругаюсь и матерю его», добавляю контекст, даю пример, разбиваю на шаги | Сильный маркер итеративности и понимания механики работы LLM-моделей. | L2 |
| Связки инструментов | В ChatGPT решает основу, просит расписать промпты для Claude, чтобы экономить лимиты | Грамотный прикладной приём (Meta-prompting), показывающий высокую осознанность. | L2 |
| Продвинутые термины (RAG, MCP, Ollama) | Слышал, но не использовал / Не знаю | Жёсткая фиксация знаниевого потолка. Сотрудник не понимает техническую инфраструктуру AI. | Потолок: L1 |
| Чат / контекст | Паттерны поведения | Ловушки AI и фактчекинг | Уровень чата |
|---|---|---|---|
| «Промпты для Nano Banana»Открыть чат ChatGPT → | Отсутствие изоляции сессий: 94 страницы контента в одной ветке. Команды на ходу («сделай реалистичнее»). Использование AI как линейного исполнителя. | Провал фактчекинга: попалась в ловушку визуальных галлюцинаций DALL-E, пытаясь выжать идентичный крой шорт, и не заметила подмены деталей на финальных фото. | L1 |
| «Аудит файлов для сборки таблицы»Открыть чат Claude → | Жёсткое ТЗ: текстовая структура с markdown. Пошаговое ведение модели командами «СТОП», «Пока не собирай». | Сильный фактчекинг (детектор Q7): сама поймала Claude на математической ошибке (сумма долей 98.35% вместо 100%) и выдала верную формулу нормализации. | L1 → L2 скиллы L2, архитектура L1 |
| «Аналитический разбор плана продаж 2026»Открыть чат Claude → | Глубокая декомпозиция: бизнес-логика уровня консалтинга (31 SKU, 3 сценария воронки). Заставила модель трижды пересобрать отчёт для руководителя. | Успешный фактчекинг: поймала AI на копировании одинакового CTR для разных бюджетов и развернула воронку продаж назад. | L1 → L2 скиллы L2, архитектура L1 |
| «Рекомендации по ботулинотерапии» (личный)Открыть чат ChatGPT → | Внешняя память: использование чата как долгосрочного блокнота, откуда AI без ошибок вытащил ранее сохранённый график. | Ловушек со стороны AI не зафиксировано, модель отработала консервативно по контексту. | L1 |
| Поведенческий маркер | Проявление на видео и в логе | Заключение аудитора | Уровень |
|---|---|---|---|
| 1. Постановка задачи | Задаёт жёсткие markdown-рамки и сильные роли управленческого консультанта и независимого финансового аудитора. | Идеальное понимание целей и ограничений разработки. | L2 |
| 2. Работа с экосистемой | Вышла за рамки базового чата и осознанно привлекла внешний AI-сервис TurboScribe для перевода аудиозаписей кастдевов в текст. | Понимает технические ограничения LLM (не слушают длинные аудио напрямую) и строит цепочки инструментов. | L2 |
| 3. Перенос данных и архитектура | На видео зафиксирован ручной перенос данных между вкладками. Изначально загрузила файлы пачкой без объяснения ТЗ. | Отсутствие автоматизации. Решает задачу объёмом ручной работы, тратя время на механические действия. | L1 |
| 4. Кросс-проверка моделей | Реализовала паттерн перекрёстной проверки: заставила ChatGPT рецензировать отчёт Claude, и наоборот. | Уровень продвинутого пользователя. За счёт AI вытащила скрытые расхождения в EBITDA сценария C. | L2+ |
| 5. Критичность и ловушки | Заставила Claude выгрузить таблицу рисков галлюцинаций и запретила руководству брать цифры, которые AI выдумал (сделку на 240к и смету пилота в 210к). | Но пропустила микро-ловушку: Claude обновил выводы по кастдевам, но забыл удалить строчку «дозапросить кастдевы» из итоговой таблицы, и Ксения упустила этот артефакт. | L1 → L2 |