раздел 01
Акторы и Store
Вся работа в Apify крутится вокруг трёх понятий: Actor, Store и Dataset. Разберём каждое.
Actor (актор)
Actor - это готовая программа в облаке, которая выполняет одну задачу: например, собирает организации с Google Maps или посты из Instagram. Вы её не пишете - вы её запускаете. У актора есть вход (что собирать) и выход (результат).
Запуск актора называется Run. Один Run - это один запуск с конкретными настройками: вы задали входные данные, нажали старт, актор отработал в облаке и вернул результат.
Apify Store
Apify Store - это каталог готовых акторов. Там тысячи решений под конкретные сайты и задачи. Вместо того чтобы разбираться, как устроена страница, вы ищете в Store подходящий скрейпер и пользуетесь им.
Dataset (датасет)
Dataset - это место, куда актор складывает результат. После того как Run завершился, собранные данные лежат в датасете, и их можно скачать в удобном формате: JSON для кода, CSV или Excel для таблиц.
То есть цепочка простая: берёте Actor из Store, задаёте вход, запускаете Run, забираете результат из Dataset. Всё остальное - детали.
Чем это отличается от своего парсера
Если писать парсер самому, на вас ложатся прокси, обход блокировок, повторные попытки при ошибках, хранение результата и поддержка при смене вёрстки сайта. В Apify это уже внутри актора и платформы. Вы платите вниманием только к тому, что собрать и куда деть результат.