раздел 04
Шпаргалка
Всё главное на одной странице.
Типовые сценарии
| Задача | Что взять | Результат | | --- | --- | --- | | Собрать данные с сайта | Актор обхода сайтов (например, Website Content Crawler) | Текст и поля страниц в Dataset | | Лиды из карт | Актор Google Maps | Организации: название, адрес, сайт, телефон | | Соцсети | Актор под платформу (Instagram, и т.п.) | Посты, профили, комментарии из открытых аккаунтов | | Поисковая выдача | Актор-скрейпер поиска | Список результатов по запросу | | Мониторинг цен | Актор маркетплейса + планировщик | Цены по расписанию, выгрузка раз за разом |
Базовый поток
- Без кода: Store, найти Actor, задать вход, Run, забрать Dataset.
- По API: токен в
.env, запустить актор черезapify-client, прочитать датасет. - Регулярно: сохранить настройки запуска и поставить планировщик.
Глоссарий
| Термин | Что это |
| --- | --- |
| Actor (актор) | Готовая программа-скрейпер в облаке: запускаете, не пишете. |
| Run | Один запуск актора с конкретными входными настройками. |
| Apify Store | Каталог тысяч готовых акторов под разные сайты и задачи. |
| Dataset | Хранилище результата запуска: выгрузка в JSON, CSV или Excel. |
| API-токен | Персональный секрет для доступа по API. Держать в .env. |
| apify-client | Официальный клиент (Python и JS) для запуска акторов из кода. |
| Прокси | Адреса, через которые идут запросы, чтобы обходить блокировки. Встроены в Apify. |
| Планировщик | Запуск актора по расписанию без участия человека. |
Чек-лист быстрого старта
- [ ] Завёл бесплатный аккаунт на apify.com.
- [ ] Нашёл подходящий Actor в Store под свою задачу.
- [ ] Запустил с маленьким лимитом, проверил поля результата.
- [ ] Скачал Dataset в нужном формате (JSON / CSV / Excel).
- [ ] Для кода: выпустил API-токен и положил в
.env. - [ ] Прогнал запуск через
apify-clientна Python или JS.
Куда дальше
- Курс API и интеграции - как вообще работают токены, REST и подключение сервисов.
- Курс SerpAPI - если нужна именно поисковая выдача через готовый API.