раздел 00
Что такое токен и зачем про это знать
Вы задали модели короткий вопрос, а с баланса списали больше, чем казалось логичным. Или диалог шёл хорошо, но в какой-то момент модель «забыла», о чём вы договаривались в начале. Оба случая - про одно и то же. Про токены.
Токен - это единица, в которой языковая модель видит текст, думает и считает деньги. Не слово, не буква, не предложение, а кусок где-то посередине. Всё, что вы отправляете модели и всё, что она отвечает, сначала превращается в токены. От их количества зависит и цена запроса, и то, сколько модель вообще способна удержать в голове за раз.
Зачем это понимать
Можно пользоваться чат-ботом и ни разу не услышать слово «токен». Но как только вы:
- платите за API по счётчику, а не по подписке,
- собираете своё приложение поверх LLM,
- грузите в модель большие документы,
- или просто хотите понять, почему ответ оборвался на полуслове,
вам придётся думать в токенах. Это базовая единица, через которую устроено всё остальное: лимиты, цена, скорость, память модели.
Что будет в курсе
Идём от простого к сложному, каждый раздел опирается на предыдущий:
- 00 - что такое токен и зачем это понимать. Вы здесь.
- 01 - как текст превращается в токены. Токенизация на примерах, почему русский «дороже» английского.
- 02 - виды токенов: входные и выходные, разные языки, мультимодальные (картинки и звук тоже считаются в токенах).
- 03 - контекстное окно: сколько модель держит в голове и что происходит при переполнении.
- 04 - стоимость: как считается цена, почему вывод дороже, кэширование и как экономить.
- 05 - шпаргалка: словарь терминов и практические правила.
Каждая страница построена одинаково: что это, зачем нужно, как работает, пример с числами и где люди обычно ошибаются.