🔥

Тред (Дима Борисевич)


"DSL" в биоинформатике Исторически, биоинформатики используют много языков. Как правило это происходит так: кто-то написал важную для масс спектрометристов / генетиков / пр. библиотеку, которая не запускается как отдельный тул из консоли. 1/n

Все в этой области вынужденно начинают использовать этот язык и писать следующие библиотеки на этом же языке. И через 5 лет целая область имеет свой собственный почти DSL, состоящий из какого-то язык программирования (не всегда популярный) + 200 библиотек. 2/n

Я говорю "DSL", потому что использующий эти библиотеки код будет как правило на 80% состоять из вызовов очень узко-специальных библиотек. Такой код будет непонятно выглядеть для DS-универсала, но будет абсолютно понятен биоинформатику 3/n

Именно это произошло с языком R. Много математиков, которые заинтересовались геномикой, транскриптомикой, и другими т.н. -омиками, начали писать пакет за пакетом на R, и в итоге сейчас эти области должны использовать R и bioconductor - репозиторий с >2K специализированных пакетов

Слышал, что в физике такая же история с упомянутых вчера матлабом 5/n

Как правило эти пакеты реализуют какой-то хитрый собственный алгоритм, который нельзя за 5 минут переписать на sklearn, поэтому варианта перехода на другой язык не остается. 6/6

Дима БорисевичДима Борисевич