В настоящем исследовании использовались U-Net и другие алгоритмы глубокого обучения для сегментации изображения языка и сравнения результатов сегментации для изучения объективации диагностики языка.
Диагностика языка является важным методом диагностики традиционной китайской медицины (ТКМ), и потребность в объективации изображений языка с помощью технологии обработки изображений растет. В настоящем исследовании представлен обзор прогресса, достигнутого в области объективации языка за последнее десятилетие, и сравниваются модели сегментации. Различные модели глубокого обучения построены для проверки и сравнения алгоритмов с использованием реальных наборов изображений языка. Проанализированы сильные и слабые стороны каждой модели. Полученные данные показывают, что алгоритм U-Net превосходит другие модели в отношении точности точности (PA), отзыва и среднего пересечения по сравнению с метриками объединения (MIoU). Однако, несмотря на значительный прогресс в получении и обработке изображений языка, единый стандарт для объективной диагностики языка еще не установлен. Чтобы облегчить широкое применение изображений языка, снятых с помощью мобильных устройств, для объективации диагностики языка, дальнейшие исследования могли бы решить проблемы, связанные с изображениями языка, снятыми в сложных условиях.
Наблюдение за языком является широко используемым методом в традиционной китайской этнической медицине (ТКМ). Цвет и форма языка могут отражать физическое состояние и различные свойства, тяжесть и прогнозы заболевания. Например, в традиционной медицине хмонгов цвет языка используется для определения температуры тела, например, красный или фиолетовый язык указывает на патологические факторы, связанные с теплом. В тибетской медицине о состоянии судят, наблюдая за языком пациента, обращая внимание на цвет, форму и влажность слизи. Например, языки пациентов с болезнью Хейи становятся красными и шероховатыми или черными и сухими1; пациенты с болезнью Сиери2 имеют желтые и сухие языки; между тем, пациенты с болезнью Бадакан3 имеют белый, влажный и мягкий язык4. Эти наблюдения показывают тесную связь между особенностями языка и физиологией и патологией. В целом, состояние языка играет жизненно важную роль в диагностике, выявлении заболеваний и оценке эффекта лечения.
В то же время, из-за различных условий жизни и практики питания среди различных этнических групп, различия в изображениях языка очевидны. Лабораторная модель, созданная на основе международного стандарта определения цвета, была сформулирована Международной комиссией по эклерированию (CIE) в 1931 году. В 1976 году цветовой узор был изменен и назван. Цветовая модель Lab состоит из трех элементов: L соответствует яркости, а a и b — двум цветовым каналам. a включает цвета от темно-зеленого (значение низкой яркости) до серого (среднее значение яркости) и ярко-розового (значение высокой яркости); b переходит от ярко-синего (низкое значение яркости) к серому (среднее значение яркости) и желтому (высокое значение яркости). Сравнивая значения L x a x b цвета языка пяти этнических групп, Yang et al.5 обнаружили, что характеристики языковых изображений групп хмонгов, хуэй, чжуанов, хань и монголов значительно отличались друг от друга. Например, у монголов темные языки с желтым языковым покрытием, в то время как у хмонгов светлые языки с белым языковым покрытием, что позволяет предположить, что особенности языка можно использовать в качестве диагностического индикатора для оценки состояния здоровья населения. Кроме того, изображения языка могут функционировать в качестве оценочного показателя доказательной медицины в клинических исследованиях этнической медицины. Он и др.6 использовали изображения языка в качестве основы для диагностики ТКМ и систематически оценивали безопасность и эффективность гранул Чжоу-Лин-Дань (гранулы CLD, используемые для лечения воспалительных и лихорадочных заболеваний, включая сезонный грипп в ТКМ) в сочетании с китайской и западной медициной. Результаты установили научную достоверность изображений языка в качестве оценочного показателя для клинических исследований. Тем не менее, традиционные врачи, как правило, полагаются на субъективность для наблюдения за характеристиками языка и оценки физиологических и патологических состояний пациентов, требующих более точных показателей.
Появление Интернета и технологий искусственного интеллекта проложило путь к оцифровке и объективизации диагностики языка. Этот процесс включает в себя использование математических моделей для обеспечения качественного и объективного описания изображений языка7, отражающего содержание изображения языка. Процесс включает в себя несколько этапов: получение изображения, оптическая компенсация, цветокоррекция и геометрическое преобразование. Предварительно обработанные изображения затем вводятся в алгоритмическую модель для позиционирования и сегментации изображений, извлечения признаков, распознавания образов и т. д. Результатом этого процесса является высокоэффективная и точная диагностика данных изображения языка, что позволяет достичь цели объективации, количественной оценки и информатизации диагностики языка8. Таким образом, достигается цель высокой эффективности и высокой точности обработки данных диагностики языка. Основываясь на знаниях о диагностике языка и технологии глубокого обучения, это исследование автоматически отделило тело языка и покрытие языка от изображений языка с помощью компьютерного алгоритма, чтобы извлечь количественные характеристики языков для врачей, повысить надежность и последовательность диагноза и предоставить методы для последующих исследований объективации диагностикиязыка 9.
Исходя из результатов сравнения, представленных выше, видно, что характеристики четырех рассматриваемых алгоритмов разнообразны, а их явные преимущества и недостатки описаны ниже. Структура U-Net, основанная на модификации и расширении полной сверточной сети, может получать контекстну?…
The authors have nothing to disclose.
Эта работа была поддержана Национальным фондом природы Китая (грант No 82004504), Национальной программой ключевых исследований и разработок Министерства науки и технологий Китая (грант No 2018YFC1707606), Управлением китайской медицины провинции Сычуань (грант No 2021MS199) и Национальным фондом природы Китая (грант No 82174236).
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |