🔥

Тред (Дима Борисевич)


Напоследок, выскажусь про генетические тесты, основанные на генетических/полигенных скорах. В комментариях ругают компании, которые продают генетические тесты, мол это шарлатанство и фуфло. Я считаю, что это гениальный продукт и абсолютно научная технология.

Я попробую поспорить с тремя аргументами, которые увидел: скоры нельзя интерпретировать, поэтому от них нет пользы; если и есть, то они ничего не предсказывают с уверенностью; если и предсказывают, то очень слабо, а компании приукрашивают и делают слишком смелые заявления.

С аргументами 1 и 2 я поспорю, а с 3 - внезапно, соглашусь. Набрасывайте, если я что-то пропустил.

Дисклеймер: я работал и в академии в этой области, и в частной компании, которая такие тесты делает и продаёт.

Я поспорю на одной статье, недавней нашумевшей pubmed.ncbi.nlm.nih.gov/31002795/, где сделали полигенный скор ИМТ (индекса массы тела) из 2.1 миллиона вариантов (фичей). Просто потому, что, как мне кажется, она позволяет опровергнуть / продемонстрировать все три аргумента.

Это публикация в Cell - топовом журнале, крутая статья, учёные из Гарварда и Бостона. Будут потом включать её в своё CV и получать миллионы бюджетных $ на исследования. Эту статью peer reviewed другие, более опытные чем я, академики, и решили, что это крутая и корректная статья.

"Скоры не интерпретируемы, значит бесполезны" Авторы не интепретируют 2.1млн фичей. Они просто используют скор, потому что он работает. Вообще, вся статья просто показывает, что скор предсказывает ИМТ, и даже в молодом возрасте (что не обязательно), и от него есть польза.

Это философское решение, кмк: должны мы знать уметь интерпретировать находки; или достаточно рабочего скора. Я сторонник второго взгляда - если при полезный пропадает обоняние, значит это хороший скор ковида, даже если мы не можем это объяснить.

И если по 2.1 млн генетических фичей можно предсказать ИМТ с некоторой точностью, то для меня это полезный скор ИМТ. Поэтому с п. 1 я не согласен - скор, который просто работает, даже если объяснить мы его пока не можем, приносит пользу.

"Скоры примерные, ничего точно не предсказывают" Та же статья, цитата из Summary: "Среди взрослых мы обнаружили 25-кратное увеличение риска тяжелого ожирения, среди разных децилей полигенного скора." Чёткое, проверяемое утверждение. Довольно сильное, на мой взгляд.

Как мы видим, академики делают сильные утверждения о перформансе скора. Поэтому с п.2 я тоже не согласен - скоры предсказывают сильные эффекты, пусть и не идеально.

"Компании делают слишком громкие заявление, а учёные аккуратны" Вот тут я внезапно соглашусь, что компании делают громкие утверждения. Ровно так же, как и академия. И если мы считаем, что это нормально для академии, то, как мне кажется и компании могут делать то же самое.

Пример из п.2 - статья публикует скор, который предсказывает увеличение риска в 25 раз! Мне кажется, раз это опубликовано, то и компания может заявить, что предсказывает такой риск в своих PR материалах.

Ещё пример - заголовок в результатах: "Скор идентифицирует [выделение моё] 1.6% людей в популяции, с увеличением ИМТ схожим [по силе] с моногенным ожирением". "Идентифицирует" - это очень сильное слово.

Оно говорит, что мы можем со 100% точностью выявить людей с повышенным ИМТ - не с риском, а с повышенным ИМТ(!) - и это смелое заявление. И если авторы так пишут, то компания может ~1.6% клиентов написать, что у них высокий риск ожирения. Это будет даже более слабое утверждение

Но когда академик забирается на табуретку морального превосходства и говорит, что бизнес - шарлатаны, а он нет, то людям, далёким от науки, сложно поспорить, потому что они не читают научные статьи. А я читаю. И поэтому я вижу, что академики точно так же делают громкие заявления.

И с п.3 я согласен - но я считаю, что это нормально. Всегда кто-то скажет, что какое-то конкретное заявление слишком громкое, а кто-то - что давно очевидное. Кмк, рано или поздно кто-то должен сделать "смелое" заявление, потому что так работает data-driven принятие решений.

И это я говорю только про полигенные скоры, мой любимый топик. Я не затрагиваю другие генетические тесты - генеалогия, происхождение гаплогрупп, родство, моногенная диагностика. Они ещё более точные, и позволяют делать ещё более громкие заявления.

Моё резюме - генетические тесты - нормальная технология. Рабочая и научная. К тому же это гениальный продукт с точки зрения продакта, потому что он стабилен, DS для него хорошо масштабируется, и качество анализов выигрывает с ростом компании.

P.S. Любая статья в генетике - такая же. Это просто пример, который я недавно читал. P.P.S. Я отстаиваю идею в целом, что ген.тесты, как продукт - это научно. Это не означает, что какая-то конкретная компания - не мошенники. Как и что все академики - святые люди.

"если при ковиде", твиттер сделай редактирование твитов!

Дима БорисевичДима Борисевич