раздел 04

Что НЕ брать первым

Есть задачи, которые выглядят заманчиво, но как первый кейс гарантированно разочаруют. Не потому, что AI с ними не справится в принципе, а потому, что на старте у вас нет ни навыка проверки, ни настроенных страховок.

Пробегитесь по списку ниже. Если ваш кандидат попадает хотя бы в одну категорию - отложите его и вернитесь к матрице за другим.

Юридически значимое без проверки
Договоры, согласия, официальные ответы, которые уйдут как есть. Цена ошибки - реальные обязательства. Не первый кейс.
Точные расчёты и финансы
Свести баланс, посчитать налог, выверить цифры до копейки. Модель уверенно подставит правдоподобное число - и ошибётся.
Редкие задачи
То, что делаете раз в квартал. Возни на настройку много, отдачи мало. Частота - половина смысла первого кейса.
Нужна уникальная экспертиза
Задача держится на вашем редком опыте и контексте, которого нет в тексте. Модель не телепат и не заменит экспертизу.
Высокая цена ошибки
Где промах бьёт по деньгам, безопасности или репутации. На старте вы ещё не умеете ловить ошибки модели - слишком рискованно.
Нет данных
Нужное лежит в чужой системе, в головах коллег или вообще не оцифровано. Сначала сбор данных, и проект встал ещё до старта.

Почему это плохие первые кейсы

Главная причина у всех одна: модель умеет звучать уверенно, даже когда ошибается. Она достраивает правдоподобный ответ, а не сверяется с истиной. Это и есть галлюцинации.

Там, где результат легко проверить и ошибка не страшна, галлюцинация безобидна - вы её заметите и поправите. Но юридический текст, финансовый расчёт или официальный ответ - это ровно те места, где ошибку либо не видно сразу, либо её цена велика. Брать такое первым - значит проверять AI на самом неудобном для него поле и в самый неподходящий момент.

AI - не калькулятор и не юрист. На старте давайте ему то, где вы за секунду отличите хороший ответ от плохого.

Когда к ним можно вернуться

Эти задачи не запрещены навсегда. К юридическим текстам, расчётам и важным ответам стоит вернуться позже - когда вы уже умеете писать промпты, проверять вывод и встраивать человека в цикл (human-in-the-loop), а для фактов подключать поиск по своей базе. Но это уже не первый кейс, а третий-четвёртый.