Тред про то как я парсил данные в пет проекты.
неожиданно иногда нет смысла парсить в чистом виде - это касается книг. Есть смысл погуглить минут 15 адекватную .pdf/fb2/любой xml tree format версию и потом разобрать ее регулярками/чем угодно.
⬇️
парсить то что срут(ну типа чем замирают сети) пользователи стало не легальнос с 1 марта. ДАННАЯ ИНФОРМАЦИЯ ДЛЯ ОЗНАКОМЛЕНИЯ И НАУЧНО ИССЛЕДОВАТЕДЬСКОЙ ДЕЯТЕЛЬНОСТИ.
Парсить дейтинг сервисы легко. Они не имеют почти никакой защиты и все довольно оперативно отдают
⬇️
В оригинальном плане тут могла бы быть ссылка на мою статью на хабре, но статья набрала -12 кармы(или хз чего) и я ее удалил чтобы совсем не убить профиль.
Кстати там была классная шутка что для хабра акутльнее лайкать мужчин, а не женщин, но кажется шутка не зашла.
⬇️
Тикток, Инстаграм и все все все.
Для них существуют pipy проекты по первой ссылке в Гугле. Их вполне хватит на то чтобы выкачать какую то дичь для курсовой/диплома. А вот дальше начинается боль - придёт думать о мульти прокси, клик симуляции и тд. Но в целом все решаемо
⬇️
Каких то супер инсайдов не будет, но кажется их и быть особо не может. А, единственное что у tinder api открытое и весит на фронте максимально открыто. Всё.