раздел 04

Шпаргалка

Всё главное на одной странице.

Типовые сценарии

| Задача | Что взять | Результат | | --- | --- | --- | | Собрать данные с сайта | Актор обхода сайтов (например, Website Content Crawler) | Текст и поля страниц в Dataset | | Лиды из карт | Актор Google Maps | Организации: название, адрес, сайт, телефон | | Соцсети | Актор под платформу (Instagram, и т.п.) | Посты, профили, комментарии из открытых аккаунтов | | Поисковая выдача | Актор-скрейпер поиска | Список результатов по запросу | | Мониторинг цен | Актор маркетплейса + планировщик | Цены по расписанию, выгрузка раз за разом |

Базовый поток

  • Без кода: Store, найти Actor, задать вход, Run, забрать Dataset.
  • По API: токен в .env, запустить актор через apify-client, прочитать датасет.
  • Регулярно: сохранить настройки запуска и поставить планировщик.

Глоссарий

| Термин | Что это | | --- | --- | | Actor (актор) | Готовая программа-скрейпер в облаке: запускаете, не пишете. | | Run | Один запуск актора с конкретными входными настройками. | | Apify Store | Каталог тысяч готовых акторов под разные сайты и задачи. | | Dataset | Хранилище результата запуска: выгрузка в JSON, CSV или Excel. | | API-токен | Персональный секрет для доступа по API. Держать в .env. | | apify-client | Официальный клиент (Python и JS) для запуска акторов из кода. | | Прокси | Адреса, через которые идут запросы, чтобы обходить блокировки. Встроены в Apify. | | Планировщик | Запуск актора по расписанию без участия человека. |

Чек-лист быстрого старта

  • [ ] Завёл бесплатный аккаунт на apify.com.
  • [ ] Нашёл подходящий Actor в Store под свою задачу.
  • [ ] Запустил с маленьким лимитом, проверил поля результата.
  • [ ] Скачал Dataset в нужном формате (JSON / CSV / Excel).
  • [ ] Для кода: выпустил API-токен и положил в .env.
  • [ ] Прогнал запуск через apify-client на Python или JS.

Куда дальше

  • Курс API и интеграции - как вообще работают токены, REST и подключение сервисов.
  • Курс SerpAPI - если нужна именно поисковая выдача через готовый API.