La présente étude a utilisé U-Net et d’autres algorithmes d’apprentissage profond pour segmenter une image de langue et a comparé les résultats de la segmentation pour étudier l’objectivation du diagnostic de la langue.
Le diagnostic de la langue est une technique essentielle du diagnostic de la médecine traditionnelle chinoise (MTC), et le besoin d’objectiver les images de la langue grâce à la technologie de traitement d’image augmente. La présente étude donne un aperçu des progrès réalisés dans l’objectivation de la langue au cours de la dernière décennie et compare les modèles de segmentation. Différents modèles d’apprentissage profond sont construits pour vérifier et comparer les algorithmes à l’aide d’ensembles d’images de langue réelles. Les forces et les faiblesses de chaque modèle sont analysées. Les résultats indiquent que l’algorithme U-Net surpasse les autres modèles en ce qui concerne la précision de précision (PA), le rappel et l’intersection moyenne sur les mesures d’union (MIoU). Cependant, malgré les progrès significatifs dans l’acquisition et le traitement de l’image de la langue, une norme uniforme pour objectiver le diagnostic de la langue n’a pas encore été établie. Pour faciliter l’application généralisée des images de langue capturées à l’aide d’appareils mobiles dans l’objectivation du diagnostic de la langue, d’autres recherches pourraient résoudre les défis posés par les images de langue capturées dans des environnements complexes.
L’observation de la langue est une technique largement utilisée dans la médecine ethnique traditionnelle chinoise (MTC). La couleur et la forme de la langue peuvent refléter la condition physique et diverses propriétés, sévérités et pronostics de la maladie. Par exemple, dans la médecine traditionnelle Hmong, la couleur de la langue est utilisée pour identifier la température corporelle, par exemple, une langue rouge ou violette indique des facteurs pathologiques liés à la chaleur. Dans la médecine tibétaine, une condition est jugée en observant la langue d’un patient, en prêtant attention à la couleur, la forme et l’humidité du mucus. Par exemple, les langues des patients atteints de la maladie de Heyi deviennent rouges et rugueuses ou noires et sèches1; les patients atteints de la maladie de Xieri2 ont la langue jaune et sèche; pendant ce temps, les patients atteints de la maladie de Badakan3 ont une langue blanche, humide et douce4. Ces observations révèlent la relation étroite entre les caractéristiques de la langue et la physiologie et la pathologie. Dans l’ensemble, l’état de la langue joue un rôle essentiel dans le diagnostic, l’identification de la maladie et l’évaluation de l’effet du traitement.
Simultanément, en raison de la diversité des conditions de vie et des pratiques alimentaires entre les différents groupes ethniques, les variations dans les images de la langue sont évidentes. Le modèle Lab, établi sur la base d’une norme internationale pour la détermination de la couleur, a été formulé par la Commission Internationale d’Éclairage (CIE) en 1931. En 1976, un motif de couleur a été modifié et nommé. Le modèle colorimétrique Lab est composé de trois éléments : L correspond à la luminosité, tandis que a et b sont deux canaux de couleur. a Comprend des couleurs allant du vert foncé (valeur de luminosité faible) au gris (valeur de luminosité moyenne) en passant par le rose vif (valeur de luminosité élevée); b va du bleu vif (valeur de luminosité faible) au gris (valeur de luminosité moyenne) puis au jaune (valeur de luminosité élevée). En comparant les valeurs L x a x b de la couleur de la langue de cinq groupes ethniques, Yang et al.5 ont constaté que les caractéristiques des images de langue des groupes Hmong, Hui, Zhuang, Han et mongol étaient significativement distinctes les unes des autres. Par exemple, les Mongols ont une langue foncée avec un revêtement de langue jaune, tandis que les Hmong ont des langues claires avec un revêtement de langue blanche, ce qui suggère que les caractéristiques de la langue peuvent être utilisées comme indicateur diagnostique pour évaluer l’état de santé d’une population. De plus, les images de langue peuvent fonctionner comme un indice d’évaluation pour la médecine fondée sur des preuves dans la recherche clinique de la médecine ethnique. Lui et coll.6 ont utilisé des images de langue comme base pour le diagnostic de la MTC et ont systématiquement évalué l’innocuité et l’efficacité des pastilles de Chou-Ling-Dan (granules de DCC utilisés pour traiter les maladies inflammatoires et fébriles, y compris la grippe saisonnière dans la MTC) combinés à la médecine chinoise et occidentale. Les résultats ont établi la validité scientifique des images de langue comme indice d’évaluation pour les études cliniques. Néanmoins, les tradipraticiens s’appuient généralement sur la subjectivité pour observer les caractéristiques de la langue et évaluer les conditions physiologiques et pathologiques des patients, nécessitant des indicateurs plus précis.
L’émergence d’Internet et de la technologie de l’intelligence artificielle a ouvert la voie à la numérisation et à l’objectivation du diagnostic de la langue. Ce processus implique l’utilisation de modèles mathématiques pour fournir une description qualitative et objective des images de la langue7, reflétant le contenu de l’image de la langue. Le processus comprend plusieurs étapes : acquisition d’image, compensation optique, correction des couleurs et transformation géométrique. Les images prétraitées sont ensuite introduites dans un modèle algorithmique pour le positionnement et la segmentation des images, l’extraction de caractéristiques, la reconnaissance de formes, etc. Le résultat de ce processus est un diagnostic très efficace et précis des données d’image de la langue, atteignant ainsi l’objectif d’objectivation, de quantification et d’informatisation du diagnostic de la langue8. Ainsi, l’objectif d’un traitement de haute efficacité et de haute précision des données de diagnostic de la langue est atteint. Basée sur les connaissances en matière de diagnostic de la langue et la technologie d’apprentissage profond, cette étude a automatiquement séparé le corps de la langue et le revêtement de la langue des images de la langue à l’aide d’un algorithme informatique, afin d’extraire les caractéristiques quantitatives des langues pour les médecins, d’améliorer la fiabilité et la cohérence du diagnostic et de fournir des méthodes pour la recherche ultérieure sur l’objectivation du diagnostic de la langue9.
Sur la base des résultats de comparaison présentés ci-dessus, il est évident que les caractéristiques des quatre algorithmes considérés sont variées et que leurs avantages et inconvénients distincts sont décrits ci-dessous. La structure U-Net, basée sur la modification et l’expansion d’un réseau de convolution complet, peut obtenir des informations contextuelles et un positionnement précis grâce à un chemin de contraction et un chemin d’expansion symétrique. En classant chaque point de pixel, cet al…
The authors have nothing to disclose.
Ce travail a été soutenu par la Fondation nationale de la nature de Chine (subvention n ° 82004504), le Programme national de recherche et de développement clé du ministère de la Science et de la Technologie de Chine (subvention n ° 2018YFC1707606), l’Administration de la médecine chinoise de la province du Sichuan (subvention n ° 2021MS199) et la Fondation nationale de la nature de Chine (subvention n ° 82174236).
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |