Може ли помощната карта на AI да намалее в мозъчната функция?

Може ли помощната карта на AI да намалее в мозъчната функция?
Може ли помощната карта на AI да намалее в мозъчната функция?
Anonim

Добре дошли в Impact Factor, вашата седмична доза коментари за ново медицинско проучване. Аз съм д-р Ф. Пери Уилсън.

Тази седмица един нов компютърен алгоритъм се опитва да превърне изследванията на напречното сечение в надлъжни, за да ни даде нова представа за невродегенеративни заболявания като болестта на Алцхаймер. Ръкописът, появяващ се в списание Brain, може да е раждане на нова техника за машинно обучение, която може да трансформира полето.

Но не съм напълно убеден.

Нека да преминем през него.

Един от основните проблеми в изследванията на невродегенеративните заболявания е липсата на големи надлъжни набори от данни. Ако ресурсите бяха неограничени, бихме могли да следваме профили на експресия на кръвни гени за десетки хиляди хора в продължение на десетилетия, да видим кой развива невродегенеративни заболявания и да придобием дълбоко разбиране на надлъжните промени в генната експресия, които могат да доведат до болестта. Тази информация може не само да ни даде нов прогностичен инструмент, но и да идентифицира терапевтичните цели.

Разбира се, ние нямаме неограничени ресурси. Повечето набори от данни за невродегенеративни заболявания са с напречно сечение или почти така - събиране на данни в един момент, понякога допълвани от изследвания на аутопсията след смъртта.

Изследователи, ръководени от Ясер Итуррия-Медина от университета Макгил, взеха различен подход. Какво ще стане, ако силата на машинното обучение може да се използва за трансформиране на данни от напречното сечение в надлъжни данни?

Това е сложна идея, но по принцип те взеха профили на генна експресия от кръвта и - в случаи на аутопсия - мозъци на хора с невродегенеративно заболяване и здрави, възрастни контроли. Подавайки всички данни в компютърен алгоритъм, те помолиха машината да намери кои генни преписи са склонни да се групират заедно.

Сега ето къде трябва да въведем някакъв жаргон за машинно обучение. Документът описва този подход като "неподдържан." Виждаш ли? Точно там е в ключовите думи.

Image
Image

Това означава, че генните данни бяха представени на алгоритъма без допълнителна информация - например колко тежка беше деменцията. Алгоритъмът трябваше просто да разбере кои гени висят заедно, без да знаят как се отнасят към болестта. Това е наистина важно, защото ако използвате неподдържан метод за клъстериране на генна експресия и впоследствие покажете, че тези клъстери предсказват тежестта на заболяването, имате наистина силен аргумент, че сте открили нещо фундаментално в процеса на заболяване.

Авторите се опитаха да покажат това тук. След обучението на алгоритъма всеки пациент може да бъде картографиран в това, което представлява едномерно пространство - доколко са близки до модела, наблюдаван при здрави контроли, в сравнение с това колко са близки до моделите, наблюдавани при невродегенеративно заболяване.

Image
Image

При предположението, че невродегенеративната болест прогресира бавно от здраве до напреднала болест, тази карта отразява времето - или както изследователите го наричат - псевдотим.

С други думи, гледайки профила на генна експресия на всеки индивид, те биха могли да преценят колко далеч по пътя на болестта е изминал този човек. Подреждането на индивиди по псевдотима ви позволява да създадете псевдолонглитудно кохортно изследване и може би да научите нещо фундаментално за болестта.

И сякаш работи.

Тези псевдотимни оценки са силно свързани с тежестта на заболяването по отношение на откритията при ПЕТ сканиране и мозъчна патология след смъртта. Те също бяха свързани с представянето на различни когнитивни тестове, макар и не толкова силно.

Всичко това е супер готино, но все още не съм много готова да пия супер Kool-Aid.

На първо място, демонстрираната техника изглежда е специфична за кохортата. С други думи, те не идентифицираха универсален профил на генна експресия, който може да бъде приложен към всеки индивид, за да види къде се намира по пътя към деменцията. Например, в една група, тази техника идентифицира 845 силно влиятелни гена. В друго са идентифицирани 416 влиятелни гена. Това означава, че няма вероятност скоро да видите лабораторен тест, който използва тази техника.

Другият проблем е по-фин. Фактът, че новата конструкция „псевдотим“корелира със състоянието на болестта и прогресията, е истинската констатация за пробив тук. Но това е толкова убедително поради твърдението на авторите, че моделът на машинно обучение е „без надзор“.

Но това не беше напълно вярно. Тези контролни пациенти, които са толкова решаващи за премахване на шума от нормалното стареене, бяха етикетирани като такива според кореспонденцията, която имах с д-р Итуррия-Медина. Алгоритъмът знаеше отначало кой е контролен и кой е пациент. Попитах д-р Итуррия-Медина дали тогава е справедливо да го нарека модел без надзор. Той пише: „Вероятно, в зависимост от перспективата, „ полунадзор “може да бъде по-правилна категоризация“.

Но авторите не споменават това в статията. Всъщност те излизат от пътя си, за да изтъкнат, че неподдържаният характер на модела е особена сила, тъй като „гарантира липса на… прекомерност на данните“.

И това може да е вярно, ако моделът наистина не се контролира. Но тъй като е донякъде контролирана, сега имаме възможността силните връзки, наблюдавани между псевдотима и различните резултати от заболяването, да не са обусловени от биологията, а от препълването на данните от обучението.

Всичко това би било лесно да се определи чрез прилагане на модела към задържан тестов набор, но това не беше направено.

Искам да бъда ясен: Това не обезсилва резултатите, но това означава, че трябва да видим някаква репликация в други групи с строго проведени тестови набори, преди да можем да сме наистина уверени, че алгоритъмът научава нещо за болестта и не само на базата данни, в която е разработен.

Ние сме в един невероятен нов свят, където науката за данни обещава да даде нова представа за болестта, но тя е много сложна и фините вариации в дизайна на изследването могат да имат големи последици за интерпретацията. Много от нас, включително и аз, все още се учат как да тълкуват проучванията по този начин. Алгоритмите за машинно обучение може да не са толкова сложни, колкото човешкият мозък, но те са достатъчно сложни, че разбирането на тези изследвания е далеч от интуитивно.

Ф. Пери Уилсън, доктор на медицинските науки, MSCE, е доцент по медицина и директор на Програмата за приложни транслационни изследвания на Йейл. Неговата научно-комуникационна работа може да бъде намерена в Huffington Post, в NPR и тук в Medscape. Той туитва @methodsmanmd и е домакин на хранилище на своята комуникационна работа на www.methodsman.com.

Следвайте Medscape във Facebook, Twitter, Instagram и YouTube

Препоръчано:

Избор На Редактора

КОРАЛ: Стентовете нямат полза при бъбречно-артериална стеноза

Най-сетне VISTA-16: Разследващите твърдят, че е извършено неправилно поведение от спонсор

Ремонт и хирургия се справят еднакво добре в исхемичната МР

Мозково-компютърен интерфейс може да помогне за възстановяване на инсулт

Интензивен подход Ups Приемане на хапчета, но не и BP, Липиден контрол

КАТИС: Няма полза от намаляване на BP в остра фаза на инсулт

Postarrest Hypothermia Trials Disappoint и Tantalize

Нитритите не лекуват за реперфузионни наранявания от стениране на MI

Трябва ли статините да се използват за първична профилактика при жените?

Недиагностицирана ССЗ Основна причина за смъртните случаи, свързани с бременността

AHA 2013: Какво ще стане горещо? (Дългоочаквани насоки!)

Генотипна лекарствена терапия в кардиологията

Какво можем да научим от отрицателен опит?

COAG: Помага ли генетичното тестване при дозиране на варфарин?

Поддържане на положително отношение към отрицателните изпитания