Искусственный интеллект в медицине: классификация и подсчет колоний микроорганизмов
КЕЙСЫ
Искусственный интеллект в медицине: классификация и подсчет колоний микроорганизмов
Хотим поделиться с вами интересным примером применения нейронных сетей и искусственного интеллекта для одного из крупнейших российских лабораторно-производственных комплексов международного уровня Genetico.
Требовалось решить достаточно амбициозную задачу — добиться корректного распознавания типов микроорганизмов по изображению чашек Петри.
Основная сложность состояла в большом количестве схожих параметров классов. Нейронная сеть должна была научиться видеть нюансы и наряду с типом указывать количество колоний. Задача оказалось настолько сложной, насколько и интересной. Обо всем по порядку.
Переход с ручной обработки на машинную
В медицине скорость и точность обработки данных — одни из опорных параметров для успешной реализации каждой задачи. Особенно в силу различных ограничений это имеет значение при лабораторных исследованиях. В Genetico возникла потребность в автоматизации конкретного этапа — идентификации и подсчета микроорганизмов. Кроме прочего, заказчик акцентировал внимание на том, что есть необходимость формировать черно-белое изображение с удалением краев чашки Петри и архивировать его по завершении расчетов.
Как был реализован процесс у заказчика
Лаборант вручную переводит изображения в нужный формат, сохраняет в базу данных. Затем изучает и определяет типы колоний и их количество. В среднем на это уходило 30 минут.
ИИ — лаборант нового поколения
Нейронные сети — гибкий инструмент для выполнения рутинных задач. ИИ способен мгновенно и безошибочно распознавать колонии микроорганизмов. Более того, заносить и каталогизировать данные для дальнейшего использования. Полная автоматизация процесса повышает скорость выполнения связанных задач без потери качества.
Истина на дне чашек Петри: в причудливых «узорах» родилась идея
Специалисты Data Acquisition предложили создание модуля машинного обучения для моментального, точного определения типов колоний и подсчета их количества.
Процесс разделила на два этапа: первый — поиск оптимальной модели, второй — обучение и запуск.
Важно было добиться интеллектуального распознавания, чтобы различные типы колоний точно идентифицировались и заносились в отчет. После тщательного анализа пришли к выводу, что готовых решений под подобные задачи на рынке нет. Модель необходимо разрабатывать с нуля.
Погружение на 110% и работа бок о бок с экспертом
Когда работаешь над сложным проектом, вовлечение доходит до предела. В процессе разработки модели мы сами практически стали экспертами или, как минимум, научились вместе с нейросетью видеть «знакомые лица» среди скоплений пикселей на изображениях.
“
Медицинскую экспертизу обеспечивает участие в проекте представителя заказчика. В случае с компанией Genetico, до реализации нашего проекта, сотни анализов были осуществлены вручную. Нам передали большое количество изображений, которые были размечены с участием эксперта Genetico. Мы добавили эти данные в датасет и обучили сеть распознавать объекты с 95% точностью. Наши технологии внедрения подразумевают тесный контакт с заказчиком и обеспечение экспертного уровня реализации проекта
— комментирует генеральный директор Data Acquisition Илья Горбунов
Для построения модели машинного обучения был сформирован датасет — что-то вроде базы данных реальных изображений чашек Петри с колониями в требуемом масштабе. На момент разработки подобного архива не существовало.
Пример построения интерфейса 1
По нашей просьбе предоставили опытного специалиста со стороны заказчика для корректной разметки данных на изображениях, которые впоследствии использовали для формирования датасета.
Шаг за шагом: от ручного распознавания до запуска нейросети
Для наглядного представления пройдемся по основным этапам.
1. Разбивка изображения на два градиента для выделения областей (скоплений) колоний. 2. Загрузка изображения. Оператор выбирает области колоний, разделяя их на основные типы (рассеянные; плотные колонии; смешанные колонии). 3. Обучение нейросети. Для корректного распознавания по каждому типу колоний должны быть помечены не менее 300 объектов. Это необходимый минимум. 4. Тестирование. Выявление ошибок и дообучение ИИ для повышения качества распознавания. 5. Разработка веб-интерфейса для комфортной работы.
Пример построения интерфейса 2
“
Датасет формировался с учетом разнообразия реальных результатов, полученных ранее на чашках Петри. Задача заключалась в том, чтобы нейросети были предоставлены изображения всего спектра архивных данных. Должны были быть загружены фото чашек и с очень низким регенераторным потенциалом, и со средним, и с самым высоким
— говорит Марина Малышева, Genetico
«Экзамен» для нейросети
Обучение состояло из «теории»: нейросети показывали как обрабатывать изображения, распознавать и классифицировать типы колоний. Теперь требовалось проверить корректность работы ИИ. Для этого проводится тестирование на части датасета, которая не использовалась в обучении. Нейросеть должна корректно распознать типы колоний по изображению.
“
Мы смотрели насколько корректно работает модель. На более поздних этапах проекта мы сами уже видели ошибки в разметке, сделанные человеком, и исправляли. Если заказчик говорил, что есть неточности в распознавании колоний, требовалось переобучение модели, а для этого были нужны новые данные. Всего таких итераций в проекте было три
— комментирует Максим Антоненко коммерческий директор Data Acquisition
В результате получаем точность модели: отношение правильно идентифицированных объектов на изображении ко всем объектам класса.
Макровселенные колоний глазами нейросети
Нейросеть научилась по изображению определять плотность каждой колонии и занимаемую площадь.
Результаты классификации колонии 1
Результат выводится в удобном формате для дальнейшего использования в расчете целевых показателей.
Если долго смотришь в чашки Петри, то колонии начинают с тобой говорить
От старта до запуска модели прошло около 6 месяцев. Сэкономить время удалось за счет привлечения квалифицированного специалиста со стороны заказчика. Его задача стояла в качественном наполнении датасета с помощью специального софта.
Результаты классификации колонии 2
После формирования архива выполнялись обучение и доработка ИИ. Каждое переобучение модели занимало 5 - 6 часов машинного времени. На загрузку данных уходило 20 минут.
“
Работа с датасетом «съедала» большую часть времени. Это один из самых ресурсоемких этапов проекта как по затраченным силам, так и по объему оперируемой информации
— Илья Горбунов
Удобство применения модели
Добиться высокого качества отработки алгоритма — основная задача, но не менее важно создать удобный интерфейс. Выбрали реализацию с доступами через веб-браузеры. От пользователя требовалось авторизоваться и нажать кнопку «Начать новое исследование». В открывшейся форме заполнить личную информацию пациента и загрузить изображение чашки Петри для обработки. Пара секунд и система выводит данные на вкладку «Отчеты». Результаты можно просматривать сразу или сохранять в файле excel на любое устройство.
Нейрореволюция, или уникальное решение на рынке
В обучении нейронных сетей наша команда взяла очередной рубеж. Внедрение искусственного интеллекта положительно отразилось на качестве технологических и бизнес-процессов — сократили время выполнения задачи, исключили влияние человеческого фактора. Машина выдает стабильный результат, а значит, повышается точность каждого проводимого анализа и исследования.
“
Мы решили интересную и показательную задачу и, насколько я знаю, аналогов этому на рынке нет. Несмотря на многочисленные попытки, до этого момента процесс подсчета колоний автоматизировать не получалось. Этот проект весьма наглядно демонстрирует возможности ИИ, нейросетей и машинного обучения в медицине. Это экономия ресурсов и средств внутри медицинской компании, а также точность, скорость подсчетов, автоматизация ручного труда, возможность быть на острие внедрения новых технологий в ежедневную работу. Ее упрощение, оптимизация, трансформация и как следствие, вывод на качественно новый уровень