Итак, время поворчать.
Одна из проблем отрасли - роли пока довольно размыты. Похожие роли (data scientist, data engineer, ML engineer, MLOps, research engineer, you name it) могут быть про одно и то же, а могут сильно отличаться.
Вся эта неоднозначность ролей больше всего мешает в найме (и поиске работы с другой стороны). Вот написано у человека, что он MLE или DS, а все равно половина скрининга уходит на то, чтобы понять, кто он по жизни и будет ли плакать, когда ему понадобится ковыряться в CI.
Где-то data scientist пилит модельку и перекидывает свое поделие в jupyter ноутбуке коллегам, которые умеют в software engineering, со словами "я сделяль, занесите в прод".
В другой компании data scientist будет делать уже нормальный микросервис, с тестами, в докере, готовый к нагрузке и кривым запросам.
Аналогично и MLE: где-то они пилят все от моделек до прода, где-то только убирают говно за jupyter-ребятками. У нас в компании MLE занимается практически всем, от разбирательств, таки что нужно кастомерам, до on-call дежурств, если что-то развалилось в проде.
Вообще в Instrumental сильна идея, свойственная многим западным стартапам: сказать "it's not my job" - это фатальный зашквар. Потому по умолчанию предполагается, что MLE должен при необходимости делать все, чуть ли кнопочки на фронтенде двигать (на мой взгляд, это уже перебор).
Соответственно, чтобы затащить фичу в прод, надо 1) понять задачу, 2) сделать ее ML ядро, 3) обернуть в python сервис, 4) обновить API у сервисов-консьюмеров (а это обычно разные стеки), 5) потестить, задеплоить, еще раз потестить, 6) что-то еще, о чем я забыл.
В среднем получается, что MLE нужны скиллы и в ML, и в software engineering, в разных местах - в разных пропорциях. По моему скромному опыту, software engineering навыки в среднем оказываются полезнее.
Проще научить инженера читать статьи и утаскивать sota с гитхаба, чем машинлернера - делать production-ready системы, которые не будут разваливаться от каждого чиха.
Капитан Очевидность лишний раз напоминает, что software engineering и computer science - это разные вещи.
Дорогие читатели, как вы считаете, насколько широким должен быть спектр задач у машинлернеров?
🤔
18.5%
MLE должны пилить ML🤔
47.2%
MLE - это такие фуллстеки🤔
20.4%
Что-то посередине🤔
13.9%
Да мне наплеватьАрсений Кравченко