раздел 05

Системный промпт и контекст

До сих пор мы говорили про обычный промпт - то, что вы пишете в чате. Но есть ещё «уровень выше» и пара настроек, которые сильно влияют на поведение модели.

System против user

В большинстве интерфейсов есть два типа сообщений:

System (системный промпт)

Правила и роль, которые действуют весь разговор: кто модель, как себя ведёт, что нельзя. Задаётся один раз сверху.

User (пользовательский)

Конкретные запросы по ходу диалога. Меняются от сообщения к сообщению.

Системный промпт - это «конституция» разговора. В ChatGPT это «Custom instructions» и настройки Project, в Claude - Project instructions, в API - отдельное поле system. Туда выносят то, что должно соблюдаться всегда.

системный промпт

Ты - ассистент службы поддержки SaaS-продукта. Отвечай кратко, по-деловому, на «вы». Не выдумывай функции продукта: если не уверен - предложи связаться с поддержкой. Никогда не обещай сроки и скидки.

Управление контекстом

Контекст - всё, что модель «видит» сейчас: системный промпт, история диалога, приложенные файлы, ваш текущий вопрос. Качество ответа во многом определяется тем, что туда попало.

Кладите в контекст релевантное. Нужные документы, примеры, факты - прямо в запрос.
Убирайте лишнее. Длинный замусоренный диалог мешает: модель «теряется». Иногда лучше начать новый чат с чистым, собранным контекстом.
Помните про «середину». В очень длинном контексте модель хуже всего держит то, что в середине. Важное - в начало и конец.

Память между сессиями

По умолчанию новый чат не помнит предыдущий. «Память» в ChatGPT и Claude - это надстройка: система сохраняет заметки о вас и подкладывает их в контекст. Полезно, но это не магия - и иногда туда попадает лишнее, что стоит чистить.

Полезные настройки

В чат-интерфейсах их обычно не видно, но в API и продвинутых инструментах они есть:

Temperature

«Творческость». 0 - предсказуемо и повторяемо (факты, код, извлечение). Выше - разнообразнее (идеи, тексты).

Длина ответа (max tokens)

Ограничивает объём вывода. Если ответ обрывается - лимит мал.

Для фактологических и форматных задач держите температуру низкой - меньше выдумок и больше стабильности. Для брейншторма - выше.