Лёня Данильченко

Лёня Данильченко

Неделя
May 31, 2021 → Jun 7, 2021
Темы
Кулстори
Product Management
Релокация

Архив недели @li_danilchenko

Понедельник


Привет из солнечного Амстердама! В эту смену твиттером командую я – Лёня Данильченко. Занимался аналитикой в Яндексе, переехал в Нидерланды. За время от предложения поучаствовать в коллективном твиттере до сейчас перекатился из DS в Product Management

План на неделю (1/2) День 1: Расскажу про себя и свой бэкграунд День 2: Про аналитику и почему это круто День 3: Про работу в Яндексе, и ценности которые помогают по жизни

План на неделю (2/2) День 4: Про переезд в Нидерланды День 5: Про переход из DS в PM День 5: О работе в стартапе День 6: Про work-life harmony

чувствую себя как на собеседовании. буду вам рассказывать о своем жизненном пути 😀

все началось с того, что я очень люблю информацию. с самого раннего детства я мог днями напролет заниматься поиском информации. ребята в универе называли меня человек-гугл за эту способность.

для иллюстрации: есть такой сборник задач по мат.анализу - Демидович, у него есть решебник написанный заботливыми китайскими студентами на китайском языке. и дабы узнать что такое вообще существует и его можно было найти пришлось разобраться в китайском поисковике baidu

количество бомбления от фразы "очевидно что.." снизилось в разы после появления китайского анти-демидовича

но вернемся к long story. я не особо уделял время учебе в школе и универе, но меня сильно привлекали различные нестандартные задачи. так пороявилась моя любовь к олимпиадам. учился я на 3и, но затаскивание олимпиад разного уровня, позволяло мне проходил дальше по учебной лестнице

возвращаясь к своему бэкграунду так я попал на экономический факультет РАНХиГС. Это не совсем стандартный экономфак. вместо бухучета и финансов нас учили матану, терверу, линалу и еще с десяток других математических дисциплин, вершиной которой была эконометрика

эконометрика - одновременная попытка экономистов дать ответ на вопрос "Почему?" что-то происходило и "Что будет дальше?" т.е. попытка прогнозирования в будущее. Вся сложность упирается в то, что данных особо то и нету.

Это сейчас мы привыкли к big data и терабайтам (без-)полезной информации на каждый datapoint. А в задачах экономистов, например прогнозирования ВВП, может существовать пару качественных измерений, и выжимай из них максимум информации как хочешь 😵‍💫

и все это на заре ренессанса DS-хайпа как такового

notion image

рабочие дела закончились, самое время вернуться в твиттер 😅

нашел свое старое выступление на 3 или 4 data fest'е youtube.com/watch?v=YQ8ci1… Давайте устроим небольшую перекличку, как много тут людей с экономическим и похожим образованием
🤔 26.3% Экономика, финансы и тд
🤔 42.1% STEM
🤔 31.6% что-то другое

🔥Тред #1

Вторник


Новый день - новый тред. Сегодня поговорим об аналитике, о том какими скилами должен обладать аналитик и почему его роль в любой команде является краеугольной

все начинается с того, что аналитики пытаются отвечать на вопросы, поступающие со всех сторон. Почему произошло .. Что будет если .. Как мы можем увеличить/уменьшить .. Что делать .. Почему все горит и мы в огне

notion image

и так повелось, что чтобы ответить на большую часть вопросов нужно прибегнуть к каким-то данным. так появляется необходимость уметь пропускать через себя большое кол-во информации и буквально по крупицам воссоздавать понимание мира

Так мы попадаем на область так называемых hard skills. для аналитика основным является скил обработки данных и верчения табличек в разном направлении

часто можно увидеть, что основным инструментарием аналитиков является python + sql + DataViz библиотека. и для среднего аналитика этого будет более чем достаточно

но если вы хотите стать крутым аналитком, то придется разобраться и с классическими алгоритмами и структурами данных, и с сервингом web api, и с тем как работать с html/css и тд. аналитик - это full stack разработчик, у которого приоритеты смещены в сторону работы с данными

приведу это на примере одной из задач, которую мы делали в яндексе в рамках vc.ru/marketing/2788…

Так вот, мы решали задачу определения посещения пользователя какого-либо объекта. читать под Страх и ненависть в Лас-Вегасе у нас было два датацентра, распределенная система MapReduce, ~ 1.5 PB геоданных ежедневно, тысячи точек и полигонов, по которым надо построить эвристику

и вот если в лоб решать эту задачу, подсчет для каждого сигнала входит ли он в определенный полигон, например подсчетом расстояния, даже за один день логов не досчиталась бы до сих пор

на помощь нам пришла незамысловатая структура данных en.wikipedia.org/wiki/R-tree, которая решает эту задачу за O(n) в худжем варианте

и чисто аналитическая задача превратилась в алгоритмическо-инженерную: реализовать в парадигме MapReduce эту структуру данных и поиск по нему.

🔥Тред #2

Понедельник


Неделя подошла к концу. К сожалению, рабочий ритм перекроил мои планы на неделю. Спасибо всем, кто читал, комментировал, лайкал и репостил. Мне было очень интересно провести эту неделю с вами😅

Ссылки