раздел 01

Акторы и Store

Вся работа в Apify крутится вокруг трёх понятий: Actor, Store и Dataset. Разберём каждое.

Actor (актор)

Actor - это готовая программа в облаке, которая выполняет одну задачу: например, собирает организации с Google Maps или посты из Instagram. Вы её не пишете - вы её запускаете. У актора есть вход (что собирать) и выход (результат).

Запуск актора называется Run. Один Run - это один запуск с конкретными настройками: вы задали входные данные, нажали старт, актор отработал в облаке и вернул результат.

Apify Store

Apify Store - это каталог готовых акторов. Там тысячи решений под конкретные сайты и задачи. Вместо того чтобы разбираться, как устроена страница, вы ищете в Store подходящий скрейпер и пользуетесь им.

Google Maps Scraper
Организации по запросу и региону: название, адрес, рейтинг, сайт, телефон.
Instagram Scraper
Посты, профили, хэштеги и комментарии из открытых аккаунтов.
Amazon / маркетплейсы
Карточки товаров, цены, отзывы и рейтинги по поиску или ссылкам.
Website Content Crawler
Универсальный обход произвольного сайта: текст страниц для ресёрча или базы знаний.

Dataset (датасет)

Dataset - это место, куда актор складывает результат. После того как Run завершился, собранные данные лежат в датасете, и их можно скачать в удобном формате: JSON для кода, CSV или Excel для таблиц.

То есть цепочка простая: берёте Actor из Store, задаёте вход, запускаете Run, забираете результат из Dataset. Всё остальное - детали.

Чем это отличается от своего парсера

Если писать парсер самому, на вас ложатся прокси, обход блокировок, повторные попытки при ошибках, хранение результата и поддержка при смене вёрстки сайта. В Apify это уже внутри актора и платформы. Вы платите вниманием только к тому, что собрать и куда деть результат.