🔥

Тред #2


Тред про то как я парсил данные в пет проекты. неожиданно иногда нет смысла парсить в чистом виде - это касается книг. Есть смысл погуглить минут 15 адекватную .pdf/fb2/любой xml tree format версию и потом разобрать ее регулярками/чем угодно. ⬇️

парсить то что срут(ну типа чем замирают сети) пользователи стало не легальнос с 1 марта. ДАННАЯ ИНФОРМАЦИЯ ДЛЯ ОЗНАКОМЛЕНИЯ И НАУЧНО ИССЛЕДОВАТЕДЬСКОЙ ДЕЯТЕЛЬНОСТИ. Парсить дейтинг сервисы легко. Они не имеют почти никакой защиты и все довольно оперативно отдают ⬇️

В оригинальном плане тут могла бы быть ссылка на мою статью на хабре, но статья набрала -12 кармы(или хз чего) и я ее удалил чтобы совсем не убить профиль. Кстати там была классная шутка что для хабра акутльнее лайкать мужчин, а не женщин, но кажется шутка не зашла. ⬇️

Тикток, Инстаграм и все все все. Для них существуют pipy проекты по первой ссылке в Гугле. Их вполне хватит на то чтобы выкачать какую то дичь для курсовой/диплома. А вот дальше начинается боль - придёт думать о мульти прокси, клик симуляции и тд. Но в целом все решаемо ⬇️

Каких то супер инсайдов не будет, но кажется их и быть особо не может. А, единственное что у tinder api открытое и весит на фронте максимально открыто. Всё.