курс 101 для чайников

Скрейпинг:
серые зоны и ограничения

Скрейпинг - автоматический сбор данных с сайтов. Часть данных открыта и собирается без проблем, часть закрыта правилами площадок или законом, а между ними - серая зона, где формально не запрещено, но ответственность остаётся на вас. Этот курс объясняет, где проходят границы: правила площадок, robots.txt, персональные данные, технические ограничения и как снижать риски. Нейтрально и без рецептов обхода защит.

Маршрут один и тот же: что можно → технические ограничения → серые зоны → как снижать риски. От «где грань» до «как делать аккуратно».

о чём этот курс

Можно ли вообще это собирать
Данные на виду, но непонятно, законно ли их забирать. Разберём ToS, robots.txt и публичное против приватного.
Где начинается серая зона
Формально не запрещено, но риск есть. Покажем, где грань и почему ответственность на вас.
Как делать аккуратно
Есть легальные пути: официальные API, разумные лимиты, не трогать персональное. Соберём их в чек-лист.

программа курса

00

Введение

Что такое скрейпинг и зачем он нужен. Где проходит грань между «просто собрать открытые данные» и нарушением правил.

01

Что можно и что нельзя

1 урок

Правила площадок (ToS), robots.txt, разница между публичными и приватными данными, персональные данные и закон (152-ФЗ, GDPR в общих чертах).

· Персональные данные
02

Технические ограничения

Rate limits, капчи, бан аккаунтов и IP, антибот-системы. Что площадки делают, чтобы автоматический сбор стал дороже и сложнее.

03

Серые зоны

Данные публичные, но ToS запрещает их сбор. Частота запросов. Где формально не запрещено, но ответственность остаётся на вас.

04

Как снижать риски

1 урок

Официальные API вместо скрейпинга, разумные лимиты, не трогать приватное и персональное, юридическая аккуратность. Легальный путь почти всегда есть.

· Официальные API вместо скрейпинга
05

Шпаргалка

1 урок

Всё на одной странице: чек-лист «можно или нельзя», светофор рисков и словарь терминов.

· Словарь терминов