Архив недели @li_danilchenko
Понедельник
Привет из солнечного Амстердама! В эту смену твиттером командую я – Лёня Данильченко. Занимался аналитикой в Яндексе, переехал в Нидерланды. За время от предложения поучаствовать в коллективном твиттере до сейчас перекатился из DS в Product Management
План на неделю (1/2)
День 1: Расскажу про себя и свой бэкграунд
День 2: Про аналитику и почему это круто
День 3: Про работу в Яндексе, и ценности которые помогают по жизни
План на неделю (2/2)
День 4: Про переезд в Нидерланды
День 5: Про переход из DS в PM
День 5: О работе в стартапе
День 6: Про work-life harmony
чувствую себя как на собеседовании. буду вам рассказывать о своем жизненном пути 😀
все началось с того, что я очень люблю информацию. с самого раннего детства я мог днями напролет заниматься поиском информации. ребята в универе называли меня человек-гугл за эту способность.
для иллюстрации:
есть такой сборник задач по мат.анализу - Демидович, у него есть решебник написанный заботливыми китайскими студентами на китайском языке. и дабы узнать что такое вообще существует и его можно было найти пришлось разобраться в китайском поисковике baidu
количество бомбления от фразы "очевидно что.." снизилось в разы после появления китайского анти-демидовича
но вернемся к long story.
я не особо уделял время учебе в школе и универе, но меня сильно привлекали различные нестандартные задачи. так пороявилась моя любовь к олимпиадам. учился я на 3и, но затаскивание олимпиад разного уровня, позволяло мне проходил дальше по учебной лестнице
возвращаясь к своему бэкграунду так я попал на экономический факультет РАНХиГС. Это не совсем стандартный экономфак. вместо бухучета и финансов нас учили матану, терверу, линалу и еще с десяток других математических дисциплин, вершиной которой была эконометрика
эконометрика - одновременная попытка экономистов дать ответ на вопрос "Почему?" что-то происходило и "Что будет дальше?" т.е. попытка прогнозирования в будущее.
Вся сложность упирается в то, что данных особо то и нету.
Это сейчас мы привыкли к big data и терабайтам (без-)полезной информации на каждый datapoint.
А в задачах экономистов, например прогнозирования ВВП, может существовать пару качественных измерений, и выжимай из них максимум информации как хочешь 😵💫
и все это на заре ренессанса DS-хайпа как такового
рабочие дела закончились, самое время вернуться в твиттер 😅
нашел свое старое выступление на 3 или 4 data fest'е
youtube.com/watch?v=YQ8ci1…
Давайте устроим небольшую перекличку, как много тут людей с экономическим и похожим образованием
🤔
26.3%
Экономика, финансы и тд🤔
42.1%
STEM🤔
31.6%
что-то другоеТред #1
Вторник
Новый день - новый тред.
Сегодня поговорим об аналитике, о том какими скилами должен обладать аналитик и почему его роль в любой команде является краеугольной
все начинается с того, что аналитики пытаются отвечать на вопросы, поступающие со всех сторон.
Почему произошло ..
Что будет если ..
Как мы можем увеличить/уменьшить ..
Что делать ..
Почему все горит и мы в огне
и так повелось, что чтобы ответить на большую часть вопросов нужно прибегнуть к каким-то данным.
так появляется необходимость уметь пропускать через себя большое кол-во информации и буквально по крупицам воссоздавать понимание мира
Так мы попадаем на область так называемых hard skills.
для аналитика основным является скил обработки данных и верчения табличек в разном направлении
часто можно увидеть, что основным инструментарием аналитиков является python + sql + DataViz библиотека.
и для среднего аналитика этого будет более чем достаточно
но если вы хотите стать крутым аналитком, то придется разобраться и с классическими алгоритмами и структурами данных, и с сервингом web api, и с тем как работать с html/css и тд.
аналитик - это full stack разработчик, у которого приоритеты смещены в сторону работы с данными
приведу это на примере одной из задач, которую мы делали в яндексе в рамках vc.ru/marketing/2788…
Так вот, мы решали задачу определения посещения пользователя какого-либо объекта.
читать под Страх и ненависть в Лас-Вегасе
у нас было два датацентра, распределенная система MapReduce, ~ 1.5 PB геоданных ежедневно, тысячи точек и полигонов, по которым надо построить эвристику
и вот если в лоб решать эту задачу, подсчет для каждого сигнала входит ли он в определенный полигон, например подсчетом расстояния, даже за один день логов не досчиталась бы до сих пор
на помощь нам пришла незамысловатая структура данных en.wikipedia.org/wiki/R-tree, которая решает эту задачу за O(n) в худжем варианте
и чисто аналитическая задача превратилась в алгоритмическо-инженерную: реализовать в парадигме MapReduce эту структуру данных и поиск по нему.
Тред #2
Понедельник
Неделя подошла к концу. К сожалению, рабочий ритм перекроил мои планы на неделю. Спасибо всем, кто читал, комментировал, лайкал и репостил. Мне было очень интересно провести эту неделю с вами😅