🔥

Тред (Арсений Кравченко)


Итак, время поворчать. Одна из проблем отрасли - роли пока довольно размыты. Похожие роли (data scientist, data engineer, ML engineer, MLOps, research engineer, you name it) могут быть про одно и то же, а могут сильно отличаться.

Вся эта неоднозначность ролей больше всего мешает в найме (и поиске работы с другой стороны). Вот написано у человека, что он MLE или DS, а все равно половина скрининга уходит на то, чтобы понять, кто он по жизни и будет ли плакать, когда ему понадобится ковыряться в CI.

Где-то data scientist пилит модельку и перекидывает свое поделие в jupyter ноутбуке коллегам, которые умеют в software engineering, со словами "я сделяль, занесите в прод".

В другой компании data scientist будет делать уже нормальный микросервис, с тестами, в докере, готовый к нагрузке и кривым запросам.

Аналогично и MLE: где-то они пилят все от моделек до прода, где-то только убирают говно за jupyter-ребятками. У нас в компании MLE занимается практически всем, от разбирательств, таки что нужно кастомерам, до on-call дежурств, если что-то развалилось в проде.

Вообще в Instrumental сильна идея, свойственная многим западным стартапам: сказать "it's not my job" - это фатальный зашквар. Потому по умолчанию предполагается, что MLE должен при необходимости делать все, чуть ли кнопочки на фронтенде двигать (на мой взгляд, это уже перебор).

Соответственно, чтобы затащить фичу в прод, надо 1) понять задачу, 2) сделать ее ML ядро, 3) обернуть в python сервис, 4) обновить API у сервисов-консьюмеров (а это обычно разные стеки), 5) потестить, задеплоить, еще раз потестить, 6) что-то еще, о чем я забыл.

В среднем получается, что MLE нужны скиллы и в ML, и в software engineering, в разных местах - в разных пропорциях. По моему скромному опыту, software engineering навыки в среднем оказываются полезнее.

Проще научить инженера читать статьи и утаскивать sota с гитхаба, чем машинлернера - делать production-ready системы, которые не будут разваливаться от каждого чиха.

Капитан Очевидность лишний раз напоминает, что software engineering и computer science - это разные вещи.

Дорогие читатели, как вы считаете, насколько широким должен быть спектр задач у машинлернеров?
🤔 18.5% MLE должны пилить ML
🤔 47.2% MLE - это такие фуллстеки
🤔 20.4% Что-то посередине
🤔 13.9% Да мне наплевать

Арсений КравченкоАрсений Кравченко