🔥

Тред (Дима Борисевич)


R, python, или просто bash? Если вы работаете в биоинформатике, то 90%, что вы пишете скрипты на баше, питоне, или R. Много тулов также написано на Java и меньше на C, но они как правило написаны хорошо один раз и запускаются из консоли, поэтому знать эти языки не нужно. 1/
notion image

Еще лет 5-10 назад был популярен perl, но его, слава богу, вытеснил python, и мы можем о нем забыть. Последние 2-3 года люди тут и там говорят о языке Julia, который позволять импортировать пакеты прямо из python и R, но пока он стал популярен (и, лично надеюсь, не станет) 2/

Страшный "секрет" состоит в том, что на самом деле, у вас нет выбора, на чем писать. Язык определяется той областью биологии, в которой вы будете работать. Упомянутые выше -омики? R ваш выбор. Собираете пайплайн из вчерашнего треда? bash. Анализ изображений? python. 3/

Общие тренды такие: - автоматизация анализа - bash, python, snakemake, airflow - пре-процессинг сырых данных - либо есть тул для bash, либо это код на R - визуализация - часто shiny R, Jupiter, и др. способы сделать html-отчёт - анализ результатов - R и python - ML - python 4/

В целом, ценность узко-специальных пакетов вкупе с невозможностью (пока) легко портировать код между языками определяет, какой язык будет доминировать в той или иной области биоинформатики 5/5

Дима БорисевичДима Борисевич