Андрей Крылов — Анализ медицинских изображений

21.11.2017

Разговор с математиком о проблемах диагностики с помощью машинного обучения

В рамках проекта «Банк знаний», созданного вместе с Корпоративным университетом Сбербанка и посвященного современным технологиям, математик Андрей Крылов рассказывает о специфике обработки и анализа медицинских изображений — с помощью нейросетей и не только.

Андрей Крылов — Анализ медицинских изображений [1]

Анализ биомедицинских изображений — актуальная тема, связанная в первую очередь с компьютерной диагностикой. Мы надеемся, что математические методы и машинное обучение в будущем помогут значительно упростить и ускорить диагностику заболеваний, особенно на ранних стадиях. Диагнозы будут точнее, они будут устанавливаться в короткие сроки, а значит, шансов сохранить здоровье и жизнь будет больше. Произошедший в районе 2010 года прорыв в распознавании изображений мог бы означать, что и в анализе медицинских снимков многое изменится, однако не все так просто.

История вопроса и проблемы анализа медицинских снимков

Как только появились первые компьютеры, которые могли как-то работать с изображениями, то есть в 80-е годы XX века, появилась и мысль о том, что с их помощью можно автоматически анализировать медицинские снимки. Работой с медицинскими изображениями занимались представители разных областей науки. Но так как первые компьютеры работали очень медленно и маленькую картинку могли открывать минуту, а то и дольше, то полноценно использоваться в этой области они пока не могли. Компьютерам не хватало производительности, на них нельзя было обрабатывать большие массивы данных, они работали очень медленно.

Другое направление в обработке медицинских изображений связано с производством специальной медицинской техники. Создатели этих устройств используют в своих приборах довольно мощные программы для обработки данных. И проблема анализа медицинских изображений связана с тем, что получить сырые данные практически невозможно. Медицинский аппарат уже обработал их, и то, что мы в итоге видим на экране, — это результат какой-то фильтрации, улучшений и так далее. В результате пережатия картинки через тот же jpeg может потеряться много информации. Поэтому для полноценного компьютерного анализа нужны сырые, необработанные другими программами данные.

Области применения компьютерного анализа медицинских снимков

Компьютерный анализ медицинских изображений применим буквально во всех областях — от офтальмологии до МРТ. Особенно популярно сейчас изучение снимков глазного дна, так как это единственное место, где можно увидеть сосуды неинвазивно. Кроме того, первый признак диабета — диабетическую ретинопатию — можно обнаружить как раз на глазном дне. В эти исследования сейчас очень активно вкладываются на Западе, так как проблема диабета становится все насущнее.

Очень широкий круг задач в анализе медицинских изображений связан с дерматологией. Вообще, исследуются все области, где есть изображения. Каждая болезнь — отдельная область исследований. Поэтому из обилия болезней и различных медицинских аппаратов складывается огромное разнообразие в этих исследованиях. Для некоторых анализов, особенно для ультразвука и ряда других технологий (МРТ, компьютерной томографии), очень важно, на каком приборе это делается — алгоритмы пишутся для каждой конкретной модели и ее режимов.

С помощью анализа биомедицинских изображений можно исследовать что угодно — от перелома шейки бедра (чем мы занимались с сингапурскими коллегами) до 3D-моделирования зубов. Со стоматологией особенно интересно: при помощи моделирования пациент может увидеть, какие у него будут зубы, как они будут меняться от недели к неделе, если поставить брекеты, — эти процессы можно смоделировать.

Есть равные возможности для исследования всех областей медицины, и нет какой-то одной, в которой работы велись бы наиболее активно. Но наиболее приоритетным направлением все-таки является лучевая диагностика мозга. В России этим занимаются не очень активно, особенно для нейродегенеративных заболеваний, разве что диагностикой болезни Паркинсона, тогда как на Западе очень большое внимание уделяется болезни Альцгеймера.

Особенности анализа медицинских изображений

Специфика обработки и анализа медицинских изображений в первую очередь связана с необходимостью работать с медиками. Но медиков-исследователей в России практически нет, есть только редкие исключения, например РНЦХ имени Петровского. Все наши учреждения в первую очередь ориентированы на лечение больных, а не на исследования. Поэтому врачи очень загружены. Они готовы встретиться со специалистами по анализу данных, дать какие-то данные. Но если необходимо провести исследования на дорогой и сложной аппаратуре, то это вступает в противоречие с практикой, необходимостью оплаты таких исследований и использования этих аппаратов и так далее. В некоторых областях, например в офтальмологии, с этим иногда проще.

Ведутся исследования с использованием ультразвука, цветной допплерографии — изучением потоков крови. Задач очень много, и все они интересные. Каждое отдельное исследование позволяет проводить исследования, публиковаться в приличных журналах. В отдельных темах анализа данных, например в методах компрессии данных, сейчас огромная конкуренция, уже сложно придумать что-то новое. А в медицине много узких областей, которые можно исследовать при содействии врачей и делать хорошие совместные работы.

Поэтому сложно ответить на вопрос, какая область медицины наиболее компьютеризирована. Но самые дорогие — это вещи, связанные с МРТ и КТ. Отдельная область — хирургия, то есть аппараты, которые проводят операции.

Нейронные сети и медицинские снимки

В последнее десятилетие произошел прорыв в распознавании изображений, и с тех пор в моду прочно вошли нейронные сети. Но в анализе биомедицинских изображений их роль неоднозначна. Связано это с несколькими причинами.

Во-первых, на мой взгляд, стремительно развивающиеся технологии искусственного интеллекта, частью которых являются искусственные нейронные сети, все же могут представлять угрозу для людей. Мы не до конца понимаем, что происходит в этом черном ящике, соответственно, нам сложно это контролировать и предсказывать поведение этих программ. Технологии позволяют имитировать голос, мимику, движение губ — это было продемонстрировано, например, на конференции SIGGRAPH 2017, где один из докладчиков взял видеовыступление Барака Обамы, с помощью обученной нейронной сети заменил ему текст и подстроил под новый текст мимику лица. Эти технологии дают большие возможности, но не всегда могут быть использованы на благо. Вам дали для исследований или работы нейронную сеть, но вы даже не знаете, на чем ее обучали, есть ли там так называемые закладки — недокументированные возможности. Или, может, она обучена так, что в определенных случаях, если она работает с банковскими данными, сеть будет переводить деньги на какой-то другой счет или передаст важные данные на сторону.

В науке сейчас происходит резкий слом — смена парадигмы. И если раньше такие изменения проходили так, что ученые так или иначе могли проверить, что происходит, то сейчас мы видим, что те же сверточные нейронные сети дают хорошие практические результаты, но они все еще остаются для нас черным ящиком. И, возвращаясь к медицине, мы имеем очень интересную ситуацию. Медицинские данные во многих случаях нельзя использовать и публиковать, даже если не указана фамилия пациента. В некоторых странах, например в Тайване, есть специальные комиссии по этике, которые выдают специальные разрешения на использование даже анонимных чужих медицинских данных. В некоторых областях — офтальмологии, ретинопатии — есть стандартные базы данных, на которых можно что-то проверить и понять. В большинстве других случаев исследователи откуда-то берут какие-то свои данные, что-то с ними делают при помощи нейронной сети и потом объявляют, что у них точность результатов, например, 90%, и это выше, чем у профессиональных врачей. И закономерно возникает вопрос: как это проверить? Ответ: никак. Раньше при написании статьи автор указывал, какие методы он использовал, и можно было понять, за счет чего ему удалось улучшить результаты. А при описании результатов, полученных при помощи нейронных сетей, данные предоставляются крайне редко, и поэтому их происхождение и причины получения того или иного результата вызывают вопросы. Соответственно, самостоятельно проверить это исследование тоже нельзя, как и понять, за счет чего получился хороший результат. На каких данных тренировали сеть? На каких проверяли ее? Достоверность чаще всего проверить невозможно.

Нейронные сети в научном сообществе

Конечно, мы пользуемся нейронными сетями в анализе биомедицинских изображений. Но задача контроля анализа данных, полученных с помощью нейронных сетей, остается сложной и важной. В медицине это особенно важно, так как отсутствие прозрачности в анализе данных в итоге может привести к фатальной ошибке. В научном сообществе такая осторожность может привести к странным результатам. Допустим, написал статью про обработку медицинских изображений классическими методами, отправляешь в журнал или на конференцию, а рецензенты спрашивают: почему результаты не сравнивались с нейронными сетями? Начиная с 2012 года почти в любой области науки можно найти статьи авторов (чаще всего китайских), которые пишут о том, как им удалось добиться 99% результата при помощи нейронных сетей. И, что ни делай, самому такого результата добиться не получается, и с китайскими учеными очень тяжело конкурировать. Хотя на каких данных они обучали и как этого добились — остается непонятным. 99% точности — это высокий результат, существенно больше того, который удается получить даже профессионалам-врачам.

Преимущество нейросетей в том, что это, безусловно, очень хороший аппарат для технологических решений. Это действительно прорыв в науке, с помощью которого можно решать очень продвинутые задачи, в том числе и в диагностике. Когда обучаешь сеть сам, все предельно ясно. То же и в медицинских изображениях: знаешь, на каких данных обучена сеть и чего от нее ожидать. А все, что мы получаем от других авторов, проверить очень тяжело. Крайне редко что-то делается на общей базе данных.

На сегодняшний день нейронные сети используются вместе с другими методами и в будущем в принципе едва ли их вытеснят. Это полезная вещь, но она никогда не заменит исследований, связанных с математическими методами. Собственно развитием самой технологии нейронных сетей занимается относительно малое число специалистов именно в этой области, а остальные — лишь пользователи, которые берут чужие сети и дообучают их. И поскольку данных в медицине мало, обычно берется какая-то общая нейронная сеть и дообучается на конкретных данных. Мы применяем нейронные сети в области офтальмологии и диагностики болезни Альцгеймера.

С нейронными сетями, помимо прочего, связана еще вот какая опасность: допустим, у нас есть картинки, сеть на них хорошо работает, но если на них добавить небольшой шум, особенно если он специально сгенерирован, незаметный для человеческого глаза, но чувствительный для нейросети, то сеть будет давать неправильные результаты.

Другие методы анализа

Чисто математических методов, которые используются в анализе изображений, в том числе биомедицинских, очень много. Они как раз и развивались с 80-х годов прошлого века. В них обработка и анализ изображений базируются на теории обработки сигналов, которая развивалась с середины XX века.

Что касается численных методов, то тут есть специфика, связанная именно с медицинским оборудованием. В медицине есть огромное количество аппаратов, каждый из которых имеет свою физику, свои особенности настройки, разные параметры и частотные области. Некоторые вещи мы не можем измерить. Например, в МРТ картинку с данных мы получаем при помощи обратного преобразования Фурье, и она может обладать массой различных дефектов, связанных именно с физикой — с потерей частотной информации. Поэтому методы используются очень разные. И очень сложно выделить область математики, которой тут не нашлось бы применения. Используется буквально все — от кватернионов и топологии до теории графов и статистических методов. И конечно, очень много методов, связанных именно с физикой аппаратов. Разумеется, используются методы искусственного интеллекта, машинное обучение, сверточные нейронные сети и так далее.

Эффективность анализа биомедицинских изображений

В разных областях медицины эффективность компьютерного анализа оценивается по-разному. Есть общие базы данных, например, по глазам и ретинопатии, где ситуация очень хорошая, процент точности там очень большой — выше 95%. В других областях понять результативность сложнее. Очень много зависит от того, какие настройки поставил доктор, поскольку, например, в УЗИ шум неаддитивный. Это означает, что результаты, полученные в разных режимах, сложно свести к одному показателю, как-то нормализовать и получить возможность сравнивать их.

В целом точность компьютерной диагностики чуть-чуть хуже, чем получается у самых профессиональных докторов, но лучше, чем у средних врачей. Но проблема в том, что часто одно заболевание влечет за собой еще несколько других, и это значительно усложняет диагностику.

В обработке и анализе медицинских изображений идеальная ситуация следующая: есть конкретное заболевание, есть аппаратура для диагностики определенной медицинской модальности (например, УЗИ). Мы изучаем наборы видеоданных из имеющейся базы данных пациентов и находим с помощью машинного обучения какие-то значимые параметры, соответствующие именно этому заболеванию. Кроме того, у нас есть база данных не только снимков одной медицинской модальности, но и комплексные истории болезни, данные анализа крови и так далее, — одним словом, полная картина. Для нового пациента по его медицинским видеоданным мы рассчитываем параметры, которые мы определили как значимые для рассматриваемого заболевания, и врачу программа дает не диагноз, а несколько, например пять, наиболее похожих по значимым признакам изображений пациентов. В этом случае врач смотрит полные истории болезни этих пяти пациентов и видит различные возможные варианты диагноза. При этом врачам, даже не самым высокопрофессиональным, будет гораздо легче работать с этой информацией, а вероятность ошибок сократится. В случае же выдачи программой диагноза (что эквивалентно выдачи истории болезни только одного пациента с похожими видеоданными используемой медицинской модальности) врачи недостаточно высокой квалификации просто с ней согласятся, иногда и не подозревая о возможных альтернативных диагнозах.

В перспективе создание программ диагностики должно быть рассчитано именно на комплексную диагностику. Сейчас эффективность анализа и диагностики зависит не от изображения, а от той болезни, которую мы пытаемся выявить. Допустим, диабетическую ретинопатию диагностировать получается хорошо, а вот с глаукомой все не так очевидно.

Перспективы

Я не думаю, что в ближайшие десять лет удастся как-то глобально продвинуться в комплексной компьютерной диагностике — по крайней мере, настолько, чтобы эти программы могли заменить даже медицинский персонал среднего уровня. Как уже говорилось, не бывает только одного заболевания: одна болезнь всегда влечет за собой и другие осложнения. Крайне редко бывает, что заболел только один орган. Поэтому пока что в обозримом будущем едва ли у нас будут какие-то условные коробочки, которые можно подключить к человеку, и они тут же ему выдадут полную диагностику и рецепт. Но прогресс, конечно, будет каждый год: будет улучшаться диагностика в отдаленных регионах — именно за счет компьютерных технологий. В целом это большая сложность — мультимодальная обработка медицинских изображений: представьте, что с одного и того же пациента нужно снять МРТ, КТ, рентген и ультразвук и дать комплексный диагноз с использованием этих четырех снимков. Но потихоньку прогресс идет, и результаты становятся все лучше.

Андрей Крылов — Анализ медицинских изображений [2]