Cancer Research

Algorithmes d’apprentissage automatique pour la détection précoce des métastases osseuses dans un modèle de rat expérimental

Published: August 16, 2020 doi: 10.3791/61235

Stephan Ellmann¹, Lisa Seyler¹, Clarissa Gillmann², Vanessa Popp¹, Christoph Treutlein¹, Aline Bozec³, Michael Uder¹, Tobias Bäuerle¹

¹Department of Radiology, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg, ²Department of Medical Physics in Radiation Oncology, German Cancer Research Center, ³Department of Internal Medicine 3, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg

Summary

Ce protocole a été conçu pour former un algorithme d’apprentissage automatique à utiliser une combinaison de paramètres d’imagerie dérivés de l’imagerie par résonance magnétique (IRM) et de la tomographie par émission de positrons/tomographie calculée (PET/CT) dans un modèle de rat de métastases osseuses du cancer du sein pour détecter la maladie métastatique précoce et prédire la progression ultérieure des macrométastases.

Abstract

Les algorithmes d’apprentissage automatique (ML) permettent l’intégration de différentes fonctionnalités dans un modèle pour effectuer des tâches de classification ou de régression avec une précision supérieure à ses constituants. Ce protocole décrit le développement d’un algorithme de ML pour prédire la croissance des macrométastases d’os de cancer du sein dans un modèle de rat avant que toutes les anomalies soient observables avec des méthodes standard d’imagerie. Un tel algorithme peut faciliter la détection de la maladie métastatique précoce (c.-à-d. la micrométastase) qui est régulièrement manquée lors des examens de mise en scène.

Le modèle de métastase appliqué est spécifique au site, ce qui signifie que les rats développent des métastases exclusivement dans leur patte arrière droite. Le taux de prise de tumeur du modèle est de 60%–80%, avec des macrométastases devenant visibles dans l’imagerie par résonance magnétique (IRM) et la tomographie par émission de positrons /tomographie calculée (PET/CT) dans un sous-ensemble d’animaux 30 jours après l’induction, alors qu’un deuxième sous-ensemble d’animaux ne présentent aucune croissance tumorale.

À partir des examens d’image acquis à un moment plus précoce, ce protocole décrit l’extraction des dispositifs qui indiquent la vascularisation tissulaire détectée par MRI, le métabolisme de glucose par PET/CT, et la détermination suivante des dispositifs les plus pertinents pour la prévision de la maladie macrométastatique. Ces caractéristiques sont ensuite introduites dans un réseau neuronal moyen -- avNNet) pour classer les animaux en l’un des deux groupes : l’un qui développera des métastases et l’autre qui ne développera aucune tumeur. Le protocole décrit également le calcul de paramètres diagnostiques standard, tels que l’exactitude globale, la sensibilité, la spécificité, les valeurs prédictives négatives/positives, les ratios de probabilité et le développement d’une caractéristique de fonctionnement du récepteur. Un avantage du protocole proposé est sa flexibilité, car il peut être facilement adapté pour former une pléthore de différents algorithmes ML avec des combinaisons réglables d’un nombre illimité de fonctionnalités. En outre, il peut être utilisé pour analyser différents problèmes en oncologie, infection et inflammation.

Introduction

Le but de ce protocole est d’intégrer plusieurs paramètres d’imagerie fonctionnelle de l’IRM et du PET/CT dans un algorithme ML de réseau neuronal moyenné par le modèle (avNNet). Cet algorithme prédit la croissance des macrométastases dans un modèle de rat des métastases osseuses de cancer du sein à un moment précoce, quand les changements macroscopiques dans l’os ne sont pas encore visibles.

Avant la croissance des macrométastases, une invasion de moelle osseuse des cellules tumorales disséminées se produit, communément appelé maladie micrométastatique¹^,². Cette invasion initiale peut être considérée comme une première étape dans la maladie métastatique, mais est généralement manquée lors des examens de mise en scène classiques³^,⁴. Bien que les modalités d’imagerie actuellement disponibles ne puissent pas détecter la microinvasion de moelle osseuse lorsqu’elles sont utilisées seules, il a été démontré qu’une combinaison de paramètres d’imagerie donnant des informations sur la vascularisation et l’activité métabolique a été montrée pour mieux fonctionner⁵. Cet avantage complémentaire est réalisé en combinant différents paramètres d’imagerie dans un avNNet, qui est un algorithme ML. Un tel avNNet permet la prédiction fiable de la formation de macrométastases osseuses avant la présence de métastases visibles. Par conséquent, l’intégration de biomarqueurs d’imagerie dans un avNNet pourrait servir de paramètre de substitution pour la microinvasion de moelle osseuse et la maladie métastatique précoce.

Pour développer le protocole, un modèle précédemment décrit des métastases osseuses de cancer du sein dans les rats nus a été employé⁶^,⁷^,⁸. L’avantage de ce modèle est sa spécificité de site, ce qui signifie que les animaux développent des métastases osseuses exclusivement dans leur patte arrière droite. Cependant, le taux de prise de tumeur de cette approche est de 60%–80%, ainsi un nombre considérable des animaux ne développent aucune métastase pendant l’étude. En utilisant des modalités d’imagerie telles que l’IRM et le PET/CT, la présence de métastases est détectable dès le jour 30 post-injection (PI). À des moments plus précoces (p. ex., 10 PI), l’imagerie ne fait pas de distinction entre les animaux qui développeront une maladie métastatique et ceux qui ne le feront pas (figure 1).

Un avNNet formé sur les paramètres d’imagerie fonctionnelle acquis le jour 10 PI, tel que décrit dans le protocole suivant, prédit ou exclut de manière fiable la croissance des macrométastases dans les ~3 semaines suivantes. Les réseaux neuronaux combinent des nœuds artificiels au sein de différentes couches. Dans le protocole d’étude, les paramètres fonctionnels d’imagerie pour l’approvisionnement en sang de moelle osseuse et l’activité métabolique représentent la couche inférieure, tandis que la prédiction de la malignité représente la couche supérieure. Une couche intermédiaire supplémentaire contient des nœuds masqués qui sont connectés à la couche supérieure et à la couche inférieure. La force des connexions entre les différents nœuds est mise à jour lors de la formation du réseau pour effectuer la tâche de classification respective avec une grande précision⁹. La précision d’un tel réseau neuronal peut être encore augmentée en faisant la moyenne des sorties de plusieurs modèles, résultant en un avNNet¹⁰.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Tous les soins et procédures expérimentales ont été effectués conformément à la législation nationale et régionale en matière de protection des animaux, et toutes les procédures animales ont été approuvées par le Gouvernement d’État de Franconie, en Allemagne (numéro de référence 55.2 DMS-2532-2-228).

1. Induction des métastases osseuses de cancer du sein dans la jambe arrière droite des rats nus

NOTE: Une description détaillée de l’induction des métastases osseuses du cancer du sein chez les rats nus a été publié ailleurs⁶^,⁸. Les étapes les plus pertinentes sont présentées ci-dessous.

Culture MDA-MB-231 cellules cancéreuses du sein humaines dans RPMI-1640, complétées par 10% sérum foetal veau (FCS). Gardez les cellules dans des conditions standard (37 °C, 5 % de CO₂₎et passez les cellules 2 à 3 fois par semaine.
Lavez les cellules MDA-MB-231 proches de confluentes avec 2 mM EDTA dans la solution saline tamponnée par le phosphate (PBS), puis détachez les cellules avec une trypsine de 0,25 %. Déterminer la concentration cellulaire à l’aide d’une chambre de Neubauer et les résuspender dans 200 μL de RPMI-1640 à une concentration de 1,5 x 10⁵ cellules/200 μL.
Utilisez des rats nus de 6 à 8 semaines et gardez-les dans des conditions contrôlées et sans pathogène (21 °C ± 2 °C de température ambiante, 60 % d’humidité et 12 h de rythme clair-foncé). Offrez des aliments autoclavés et des ad libitum d’eau.
Avant d’effectuer la chirurgie, injectez un médicament analgésique (p. ex., carprofène 4 mg/kg) sous-cutanéement. Anesthétez les rats avec un isoflurane (1–1,5 vol. %)/mélange d’oxygène à un débit de 2 L/min. Vérifiez la profondeur anesthésique par pincement des orteils.
Pour la chirurgie, utilisez un microscope d’opération avec un grossissement 16x.
Effectuer une coupe de 2 à 3 cm dans la région inguinale droite du rat. Disséquer toutes les artères de la région inguinale droite, y compris l’artère fémorale (FA), l’artère épigastrique superficielle (EES), l’artère géniculaire descendante (DGA), l’artère popliteal (PA) et l’artère saphéneuse (SA). Placez deux clips amovibles sur la FA : l’un proximal au début de l’EES, et l’autre directement proximal au début de la DGA.
Lier la partie distale de l’EES. Effectuer une coupe de la paroi de la SEA et insérer une aiguille de 0,3 mm de diamètre dans la SEA. Connectez une seringue contenant la suspension cellulaire de l’étape 1.2 à l’aiguille. Retirez le clip distal de la FA et clip le SA à la place.
Injecter lentement la suspension cellulaire MDA-MB-231 à partir de l’étape 1.2 (1.5 x 10⁵ cellules/200 μL) dans la SEA. Retirez l’aiguille, l’IRE et retirez les pinces de l’artère. Fermez la plaie à l’aide de clips chirurgicaux et terminez l’anesthésie. Surveiller les animaux quotidiennement pour évaluer la taille de la tumeur et toute preuve de douleur.

2. Imagerie par résonance magnétique (IRM)

REMARQUE : Pour une description détaillée des procédures d’IRM, veuillez consulter Bäuerle et coll.¹¹.

Effectuez l’IRM 10 jours à l’aide d’un scanner expérimental dédié (voir tableau des matériaux)ou d’un système MR humain avec une bobine animale appropriée.
Anesthésiez le rat avec un isoflurane (1–1,5 vol. %)/mélange d’oxygène tel que décrit ci-dessus. Placez un cathéter dans la veine de la queue du rat et collez-le à la queue. Connecter une seringue contenant l’agent de contraste (0,1 mmol/kg Gd-DTPA dans environ 0,5 mL).
Placez le rat anesthésié dans le système MR. Localiser le fémur distal et le tibia proximal de la jambe arrière droite dans une séquence anatomique (p. ex., séquence d’écho turbo spin pondérée t2; TR = 8 654 ms; TE = 37 ms; matrice 320 x 272; FOV = 65 mm x 55 mm; épaisseur de tranche = 1 mm; temps de numérisation 11:24 min).
Déterminer les tranches couvrant le fémur distal et le tibia proximal de la jambe arrière droite et démarrer la séquence DCE-IRM (p. ex., séquence rapide de tir à angle bas; TR = 3,9 ms; TE = 0,88 ms; matrice = 256 x 216; FOV = 65 x 54 mm²; épaisseur de tranche = 1 mm; 8 tranches; 100 points de temps; temps de balayage = 8:25 min). Après 30 s, commencer à injecter l’agent de contraste sur une période de temps de 10 s.
REMARQUE : Le temps total pour effectuer un examen IRM est d’environ 20 min par animal.

3. Tomographie par émission de positrons/tomographie calculée (TEP/CT)

NOTE: Pour une description détaillée des procédures pet, s’il vous plaît voir Cheng à al.¹².

Effectuez l’imagerie PET/CT 10 jours PI à l’aide d’un scanner expérimental dédié (voir tableau des matériaux).
Gardez les animaux à jeun avant l’imagerie. Anesthésier le rat tel que décrit à l’étape 2.2 et insérer un cathéter dans la veine de la queue comme décrit ci-dessus.
Injecter 6 MBq de ¹⁸F-Fluorodeoxyglucose⁽¹⁸F-FDG) dans la veine de la queue et attendre ~30 min pour permettre au traceur de se distribuer correctement.
Effectuer une acquisition de CT (tension du tube = 80 kV, courant de tube = 500 μA, résolution isotrope = 48,9 μm, durée = 10 min).
Effectuer une acquisition statique de PET (niveau discriminatoire inférieur/supérieur = 350/650 keV; fenêtre de synchronisation = 3.438 ns; durée = 15 min).

4. Stratégies d’imagerie alternatives

Pour une évaluation précoce des cellules MDA-MB-231 de la jambe postérieure, inoculer 1,5 x 10⁵ cellules étiquetées /200 μL pour la bioluminescence (c.-à-d. les cellules exprimant la luciferine, MDA-MB-231-LUC¹³) ou l’imagerie par fluorescence (c.-à-d. les cellules exprimant la protéine fluorescente verte ou rouge, MDA-MB-231-GFP/DP¹³). Utilisez le système d’imagerie optique préclinique pour détecter les cellules intraosseuses MDA-MB-231 après l’inoculation des cellules tumorales¹⁴.
Effectuer des ultrasons expérimentaux à l’aide d’un scanner dédié après injection intraveineuse de microbulles pour dériver des paramètres morphologiques et fonctionnels de la vascularisation comparable à l’IRM⁷.

5. Analyse IRM

Utilisez une visionneuse DICOM¹⁵ avec un plugin DCE¹⁶ et chargez la séquence DCE en mode 4D en cliquant sur le bouton «Importer» dans le menu supérieur, en sélectionnant le dossier DICOM contenant les images MR de l’étape 2.4 et en cliquant sur «4D Viewer» dans le menu supérieur.
Placez une région circulaire d’intérêt en deux dimensions (ROI), d’une taille cible de 1,5 mm², dans la moelle osseuse de l’arbre tibial proximal de la jambe arrière droite, de préférence en utilisant les numéros d’image 4 ou 5 de la séquence composée de 8 images, car ces images centrales fournissent des résultats plus stables.
Démarrez le plugin DCE à partir du menu supérieur, sélectionnez «Relative Enhancement» dans le champ «Plot Type» et définissez la plage de base des points de temps 1 à 5 en tapant ces nombres dans les champs respectifs. Exportez l’analyse en tant que fichier .txt avec le bouton respectif et choisissez « DDeraw.txt » comme nom de fichier.
Ouvrez RStudio¹⁷ et chargez le fichier DCE-Script.R fourni via le menu "Fichier" en sélectionnant "Ouvrir le fichier« . Exécutez l’ensemble du script en sélectionnant "Code« , puis "Run Region" puis " RunAll" à partir du menu. Copiez la sortie dans le fichier de modèle fourni nommé « ImagingFeatures.xlsx » (Figure 2).
Dans la visionneuse DICOM, placez un deuxième retour sur investissement dans le muscle arrière de l’animal et répétez les étapes 5.2–5.4 pour obtenir les mesures de DCE musculaires à des fins de normalisation. Dans la feuille de calcul « magitageFeatures.xls », les mesures osseuses respectives sont automatiquement divisées par les mesures musculaires respectives à des fins de normalisation.
Répétez les étapes 5.1–5.5 pour tous les animaux et remplissez la feuille de calcul.

6. Analyse PET/CT

Ouvrez le logiciel d’analyse PET/CT et importez les données obtenues à l’étape 3 en cliquant sur "Fichier« , suivi de "Importation manuelle« . Marquez les fichiers ct.img.hd et pet.img.hdr. Cliquez sur "Ouvrir" et sélectionnez "Importer tous« .
Ouvrez les jeux de données en sélectionnant "Analyse générale« , suivi de "OK« .
Sélectionnez «ROI Quantification», suivi de «Créer», puis « Créer un retour sur investissement àpartir d’un modèle». Placez un roi en 2 dimensions d’environ 4 mm x 6 mm dans la moelle osseuse de l’arbre tibial proximal de la jambe arrière droite.
Sélectionnez «ROI (superposition cible 1)» et notez les valeurs moyennes, minimales et maximales dans Bq/mL.
Calculer la valeur d’absorption normalisée maximale (VUS_max): Diviser la valeur maximale (Bq/mL) par l’activité injectée et multiplier le résultat par le poids de l’animal en grammes. Entrez le résultat dans la feuille de calcul (Figure 2).

7. Détermination du taux de prise de tumeur

Pour diagnostiquer la croissance de tumeur dans la jambe arrière droite, répétez l’imagerie de MR et de PET/CT le jour 30 PI, comme décrit ci-dessus.
NOTE : Les tumeurs seront clairement visibles le jour 30 PI et comportent des lésions de T2w-hyperintense et l’amélioration claire de contraste dans MRI, avec un_max de SUV clairement élevé dans PET/CT. Selon des expériences antérieures, 60 à 80 % des animaux développeront des métastases dans leur patte arrière droite.
Complétez la feuille de calcul en ajoutant une colonne « Tumeur » supplémentaire et entrez « 1 » pour chaque animal qui présente des métastases, et « 0 » pour chaque animal sans charge tumorale visible (figure 2). Enregistrez la feuille de calcul sous le nom d’ImagingFeatures.xlsx dans le dossier Téléchargements.

8. Sélection des fonctionnalités

Pour déterminer les caractéristiques les plus pertinentes pour la prévision de la croissance tumorale future, importez la feuille de calcul dans une visualisation de données open-source, l’apprentissage automatique et la boîte à outils d’exploration de données¹⁸.
Dessinez la sous-routine du fichier à partir du menu Données dans l’espace de travail à droite et double-cliquez dessus. Chargez la feuille de calcul en cliquant sur l’icône «Dossier» et en sélectionnant le fichier « ImagingFeatures.xlsx ». Sélectionnez la feuille de calcul «Exporter» et attribuez l’attribut cible à la variable «Tumeur». Attribuez la fonction «Skip» au numéro d’animal (figure 3).
Dessinez la sous-routine «Rank» du menu Données dans l’espace de travail et connectez les sous-routines «File» et «Rank» en traçant une ligne entre eux.
Ouvrez la sous-routine «Rank» en cliquant deux fois sur son icône et sélectionnez l’algorithme «Gain d’information^{» 19}.
À partir des cinq paramètres acquis, utilisez les trois premiers pour d’autres analyses (SUV_max,PE et AUC).
Note : Ces paramètres reflètent l’activité métabolique (SUV_max)et la vascularisation des tissus (PE et AUC).

9. Analyse ML

Ouvrez RStudio 3.4.1¹⁷ et chargez le TrainModel.R-Script fourni via le menu "Fichier« .
Installez les bibliothèques requises (cela ne doit être fait qu’une seule fois) en tapant : install.packages(c(« caret », « readxl », « pROC », « RcmdrPlugin.EZR », « ggplot2 »))
Pour charger les bibliothèques requises et définir le dossier Téléchargements comme répertoire de travail, sélectionnez les lignes 3–5 dans le script TrainModel.R.
Exécutez le code sélectionné en cliquant sur «Code» dans le menu, puis «Exécuter les lignes sélectionnées».

10. Formation d’un algorithme avNNet ML

Pour former un algorithme avNNet, sélectionnez les lignes 8–39 du TrainModel.R-Script (voir étape 9.1).
Exécutez le code sélectionné en cliquant sur «Code» dans le menu, puis «Exécuter les lignes sélectionnées».

11. Analyse des résultats de l’algorithme ML

Pour évaluer les paramètres standards de l’exactitude diagnostique (sensibilité, spécificité, valeurs prédictives positives et négatives et ratios de probabilité), sélectionnez les lignes 41 à 50 du Script TrainModel.R.
Exécutez le code sélectionné en cliquant sur «Code» dans le menu, puis «Exécuter les lignes sélectionnées».

12. Comparaison de la courbe de la caractéristique d’exploitation du récepteur (ROC) du modèle final avec les courbes ROC de ses paramètres constitutifs

Pour effectuer les tests de DeLong afin de comparer la courbe ROC du modèle avec les courbes ROC de ses paramètres constitutifs, sélectionnez les lignes 52–62 du TrainModel.R-Script (voir étape 9.1).
Exécutez le code sélectionné en cliquant sur «Code» dans le menu, puis «Exécuter les lignes sélectionnées».

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Les rats se sont rapidement rétablis de la chirurgie et de l’injection des cellules cancéreuses du sein MDA-MB-231 et ont ensuite été soumis à l’imagerie MR- et PET/CT les jours 10 et 30 PI (figure 1). Une analyse représentative du tibia proximal droit d’un rat est présentée à la figure 2A. Les mesures brutes DCE ont été enregistrées en sélectionnant le bouton «Exporter» et en choisissant « DCEraw.txt » comme nom de fichier.

Des calculs ultérieurs des paramètres dynamiques, de l’AUC, du PE et du lavage ont été effectués en RStudio avec le script respectif. La sortie des mesures DCE devait être enregistrée sous le nom de « DCeraw.txt » dans le dossier « Téléchargements », de sorte que le script puisse être exécuté directement sans configurations supplémentaires pour fournir une table de données, comme indiqué dans la figure 2B. Ces données ont été copiées dans la feuille de calcul fournie (Figure 2C). De même, les paramètres DCE pour les tissus musculaires ont été déterminés et transférés dans la feuille de calcul (Figure 2D,E). Ces valeurs ont été normalisées en divisant les mesures osseuses par les mesures musculaires; cela a été effectué automatiquement dans la feuille de calcul. À partir du PET/CT, les valeurs_maximales calculées du VUS ont ensuite été transférées dans le tableau (figure 2F).

Le jour 30 PI, tous les animaux ont été évalués pour déterminer s’ils ont développé ou non des métastases, et le tableau a été complété par le codage de la charge tumorale positive comme « 1 » et les animaux en bonne santé comme « 0 » dans la colonne la plus à droite de la feuille de calcul (Figure 2C).

La feuille de calcul a été importée dans la visualisation de données open-source, l’apprentissage automatique, et la boîte à outils d’exploration de données, et le classement des fonctionnalités a révélé le SUV_max, PE, et AUC comme les trois principales caractéristiques pour la prédiction de la maladie métastatique (Figure 3). Ces paramètres reflètent l’activité métabolique (SUV_max)et la vascularisation des tissus (PE et AUC).

L’exécution du script TrainModel.R a automatiquement importé la feuille de calcul et calculé un avNNet. La combinaison optimale d’hyperparamètre a été déterminée (figure 4A) et le modèle final a ensuite été calculé à l’aide de la combinaison optimale d’hyperparamètre (figure 4B). Par la suite, un ensemble de paramètres diagnostiques standard a été calculé (figure 4C) et une courbe ROC du modèle a été tracée (figure 4D).

Le résultat positif est indiqué dans la figure 4B–D. Une comparaison de la courbe ROC du modèle avec la courbe ROC de ses trois constituants (c.-à-d. AUC, PE, et SUV_max) a révélé que le modèle a obtenu des performances nettement meilleures que tous ses trois constituants (p = 0,01 pour AUC, p = 0,003 pour PE, et p = 0,007 pour SUV_max). La combinaison des trois paramètres sélectionnés à un avNNet était plus sensible, permettant ainsi la prédiction de la maladie macroscopique avec une précision globale de 85,7% (intervalle de confiance de 95% = 67,3%–96,0%). Ces résultats ont été obtenus à partir d’une analyse de 28 échantillons. Les intervalles de confiance peuvent être réduits en augmentant le nombre d’animaux.

Les résultats négatifs pourraient être obtenus comme décrit ici. Les mesures de précision étaient très sensibles à des types spécifiques d’algorithmes d’apprentissage automatique et aux étapes du prétraitement des données. Les réseaux neuronaux, en particulier, avaient tendance à être plus performants lorsque les données d’entrée étaient normalisées. Cela a été réalisé par la fonction « oîtCo » dans la section 10 du protocole (lignes 22 et 36 dans le TrainModel.R-Script fourni). S’abstenir de normaliser et utiliser un algorithme différent (p. ex., un réseau neuronal non constitué en moyenne), en changeant la méthode en « nnet » (lignes 21 et 35 dans le TrainModel.R-Script fourni), a donné lieu à une zone de 0,594 sous la courbe du ROC (figure supplémentaire 1). Un tel modèle n’a pas réussi à surpasser ses trois constituants de manière significative (tous les p > 0,15).

Étant donné que le script a été optimisé pour RStudio 3.4.1 et le paquet caret version 6.0-84, l’utilisation de différentes versions logicielles peut donner des résultats différents. L’exécution des scripts fournis avec les versions logicielles utilisées dans ce manuscrit donnera des résultats similaires. Toutefois, si les lecteurs cherchent à modifier le script, à ajouter des variables supplémentaires, à modifier les dossiers de documents ou les noms de fichiers, ou à modifier plus en détail les algorithmes d’apprentissage automatique, des ajustements respectifs du code seront nécessaires. Pour ces cas, le manuel du caret-package offre des explications approfondies²⁰.

Figure 1 : Images représentatives mr et PET/CT. Images MR et PET/CT de la patte arrière droite d’un animal qui n’a pas développé de métastases au cours de l’étude (deux colonnes les plus à gauche, avec des images du jour 10 et du jour 30 PI), et un animal qui a développé des métastases entre le jour 10 et le jour 30 PI (deux colonnes les plus à droite, métastases marquées de flèches). Notez l’intensité élevée du signal des métastases dans les images T2w (rangée supérieure), l’amélioration du contraste représentée par l’augmentation de la zone sous la courbe (AUC; deuxième rangée) et l’augmentation de la valeur maximale d’absorption normalisée dans le PET/CT (SUV_max; troisième rangée). Notez qu’il n’y a pas de différences visibles dans les images acquises le jour 10 PI (première et troisième colonne) entre l’animal avec des métastases le jour 30 PI et l’animal qui n’a développé aucune métastase osseuse. Ce chiffre a été modifié à partir d’Ellmann et coll.⁵. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 2 : Évaluation des caractéristiques d’imagerie et compilation dans une feuille de calcul. (A) L’amélioration dynamique du contraste de la moelle osseuse du tibia proximal a été analysée avec une visionneuse DICOM freeware¹⁵ à l’aide d’un plugin DCE¹⁶. Les mesures respectives ont été enregistrées, et (B) ont été analysées plus en détail avec le fichier DCE-Script.R fourni dans RStudio¹⁷. (C) La sortie a été copiée dans une feuille de calcul (voir le matériel supplémentaire pour un modèle). (D) De même, la mesure DCE a été effectuée pour les tissus musculaires adjacents, analysée à l’aide de RStudio (E), puis copiée dans la feuille de calcul. Les données ont été normalisées en divisant les résultats des mesures osseuses par les résultats des mesures musculaires (C; cellules ombragées de saumon). (F) Les mesures PET/CT ont été effectuées avec le logiciel du fournisseur. La valeur d’absorption normalisée maximale a été calculée en divisant la mesure respective par l’activité injectée et en la multipliant par le poids corporel de l’animal. Le résultat a ensuite été copié dans la feuille de calcul. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 3 : Classement des fonctionnalités. Le classement des fonctions d’imagerie acquises a été effectué dans une boîte à outils de visualisation de données open-source, d’apprentissage automatique et d’exploration de données¹⁸ en important la feuille de calcul via la sous-routine « File » et en l’analysant via la sous-routine « Rank ». Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 4 : Sortie RStudio représentative. L’algorithme d’apprentissage automatique a été développé à l’aide de RStudio¹⁷ avec le fichier TrainModel.R-Script fourni. (A) Une recherche de grille entre différentes combinaisons d’hyperparamètres pour le réseau neuronal moyen-modèle a indiqué une taille de trois neurones et une décomposition de 0.0005 comme un optimum. (B) À l’aide de cette combinaison d’hyperparamètres, un réseau complet a été formé et validé, atteignant une précision globale de 85,7 %. (C) Les paramètres standard de l’exactitude diagnostique, y compris la sensibilité, la spécificité, les valeurs prédictives positives et négatives et les ratios de probabilité, ont été calculés à partir d’une matrice de confusion. (D) Une parcelle roc représentative du modèle trans validé a révélé une zone sous la courbe (AUC) de 0,917. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure supplémentaire 1 : Résultat négatif. Le passage de l’algorithme ML à un réseau neuronal sans moyenne et s’abstenir de normaliser les paramètres d’entrée a conduit à une baisse de la zone sous la courbe de la courbe ROC de 0,917 (figure 4D) à 0,594. Veuillez cliquer ici pour télécharger ce fichier.

Figure supplémentaire 2 : Classement des fonctionnalités alternatives. Contrairement à la méthode standard décrite à la figure 3, une variable aléatoire a également été introduite (« uant » ; mis en évidence en bleu), avec son importance incluse dans le classement. Cette approche a confirmé la sélection appliquée des variables SUV_max,PE et AUC. Veuillez cliquer ici pour télécharger ce fichier.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Les algorithmes ML sont des outils puissants utilisés pour intégrer plusieurs fonctionnalités prédictives dans un modèle combiné et obtenir une précision supérieure à celle de ses constituants distincts lorsqu’ils sont utilisés seuls. Néanmoins, le résultat réel dépend de plusieurs étapes critiques. Tout d’abord, l’algorithme ML utilisé est un facteur crucial, car différents algorithmes ML donnent des résultats différents. L’algorithme utilisé dans ce protocole est un avNNet, mais d’autres algorithmes prometteurs incluent Extreme Gradient Boosting²¹ ou Random Forests. Le paquet caret²⁰ pour RStudio fournit une pléthore d’algorithmes différents (actuellement >175), et le protocole proposé est très flexible en termes de commutation d’un algorithme à l’autre en changeant simplement des lignes de code uniques (par exemple, en changeant la méthode = « avNNet » à la méthode ="rf ») et en adaptant les paramètres TunedGrid à l’algorithme ML respectif. Pour plus de détails, voir le référentiel github caret²². Une excellente vue d’ensemble des différents algorithmes et de leurs performances en ce qui concerne les différents problèmes de classification a été publiée par Fernández-Delgado et al.²³ et pourrait servir de point de départ pour d’autres expériences.

Un autre facteur crucial est le choix des fonctionnalités pertinentes à inclure dans un algorithme ML. Ce protocole propose l’utilisation de la méthode de filtre, « ert d’informatio »¹⁹, pour classer les fonctionnalités disponibles dans l’ordre décroissant et utiliser les plus pertinentes pour former l’avNNet. Les méthodes de filtrage ne sont basées que sur des hypothèses générales, telles que la corrélation avec la variable à prévoir, de sorte que les chercheurs devraient présélectionner les entités indépendamment du classificateur utilisé²⁴^,²⁵. Ces méthodes sont particulièrement efficaces dans le temps de calcul et robustes à surajuster. Toutefois, la limite qui sépare les fonctionnalités pertinentes des fonctionnalités non pertinentes est définie par l’utilisateur, ce qui la rend quelque peu arbitraire. Pour le protocole proposé, les caractéristiques avec le gain d’information supérieur de 75% ont été utilisés, correspondant à SUV_max, PE, et AUC. Cette sélection peut toutefois être systématiquement renforcée en incluant une variable aléatoire qui n’a aucun rapport avec la cible, en calculant son gain d’information, puis en la comparant au gain d’information des caractéristiques réelles ( Figuresupplémentaire 2). Cette approche un peu plus sophistiquée a en outre confirmé le choix des trois caractéristiques susmentionnées comme étant les plus pertinentes. Néanmoins, plusieurs méthodes de filtrage différentes existent, ainsi que d’autres approches qui sélectionnent des fonctionnalités en ce qui concerne un algorithme classificateur particulier, telles que l’extraction des fonctionnalités et les méthodes d’emballage. Différentes approches de sélection de fonctionnalités peuvent donner des résultats différents.

Afin d’assurer la généralisation de l’algorithme ML et d’éviter davantage le suréfiance, le protocole proposé applique la validation croisée (LOOCV). La meilleure approche, cependant, serait de supprimer au hasard un sous-ensemble de l’ensemble de données, et le traiter comme un ensemble de tests. L’algorithme ML est ensuite formé sur le reste des données (c.-à-d. l’ensemble de formation) pour prédire ultérieurement le résultat de l’ensemble de tests. Toutefois, cette approche nécessite un ensemble de données suffisamment volumineux. Pour les tailles d’échantillon plus petites, l’application de LOOCV est commune parce qu’elle fournit une estimation presque impartiale de la véritable capacité de généralisation d’un modèle²⁶. Dans LOOCV, le premier point de données est supprimé de l’ensemble de données, et l’avNNet est formé avec les données conservées. Ensuite, le résultat du point de données précédemment retenu est prédit et enregistré. Ce processus est répété pour tous les points de données, de sorte que finalement chaque résultat est prédit avec des données qui n’ont pas été utilisées pour la formation de l’algorithme. D’autres approches de validation incluent des validations croisées x-fold (le plus souvent 10 fois) et peuvent être facilement appliquées en changeant le paramètre trainControl respectif dans le code à method="CV ».

D’un point de vue quantitatif, les images médicales sont généralement évaluées de manière très élémentaire, en s’appuyant en grande partie sur des mesures de la taille et de la forme de lésions potentiellement suspectes ou des zones²⁷^,²⁸. Cependant, l’avantage de la norme de l’imagerie numérique et des communications en médecine (DICOM) est qu’elle permet l’extraction de nombreuses fonctionnalités, appelées radiomiques. Le terme « radiomique » a été initialement défini comme l’extraction à haut débit de grandes quantités de caractéristiques d’image²⁹, mais a ensuite été étendu pour inclure la conversion des images en données dimensionnelles plus élevées³⁰. Cependant, les données dimensionnelles supérieures sont principalement utilisées pour identifier les corrélations plutôt que les causes³⁰. Les caractéristiques décrites dans ce protocole se situent entre les caractéristiques radiologiques classiques, telles que la taille et la forme, et les radiomiques, car elles ressemblent à des paramètres généralement acceptés de vascularisation et d’activité métabolique. Ceci offre une relation causale potentielle à la microinvasion des cellules tumorales disséminées. Si l’utilisateur le souhaite, une extraction de fonctionnalités radiomiques peut être effectuée avec différents logiciels³¹.

Le protocole fourni n’est pas limité à un nombre limité de fonctionnalités. Ainsi, il peut être utilisé avec de grands ensembles de données radiomics. Toutefois, la question susmentionnée de la sélection des fonctionnalités devient de plus en plus importante avec la croissance des ensembles de données. Le protocole présenté peut également être transféré dans différents contextes d’étude, par exemple, à partir des domaines de l’oncologie, de l’infection ou de l’inflammation³².

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs ne déclarent aucun conflit d’intérêts. Les bailleurs de fonds n’ont joué aucun rôle dans la conception de l’étude; dans la collecte, l’analyse ou l’interprétation des données; dans l’écriture du manuscrit, ou dans la décision de publier les résultats.

Acknowledgments

Ce travail a été soutenu par la Fondation allemande de recherche (DFG, Collaborative Research Centre CRC 1181, sous-projet Z02; Programme prioritaire μBone, projets BA 4027/10-1 et BO 3811), y compris un soutien supplémentaire pour les dispositifs de numérisation (INST 410/77-1 FUGG et INST 410/93-1 FUGG), et par l’Initiative des champs émergents (EFI) « Big Thera » de la Friedrich-Alexander-University Erlanen-Nürnberg.

Materials

Name	Company	Catalog Number	Comments
Binocular Operating Microscope	Leica	NA
ClinScan MR System	Bruker	NA
DICOM Viewer	Horos	NA	www.horosproject.org
Excel: Spreadsheet	Microsoft	NA
FCS	Sigma	F2442-500ML
Gadovist	Bayer-Schering	NA
Inveon PET/CT	Siemens	NA
Inveon Research Workplace Software	Siemens Healthcare GmbH	NA
IVIS Spectrum	PerkinElmer	NA
MDA-MB-231 human breast cancer cells	American Type Culture Collection	N/A
Open-source data visualization, machine learning and data mining toolkit.	Orange3, University of Ljubljana	NA	https://orange.biolab.si/
RPMI-1640	Invitrogen/ThermoFisher	11875093
Trypsin	Sigma	9002-07-7
Vevo 3100	VisualSonics	NA

DOWNLOAD MATERIALS LIST

References

D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).

Cancer Research

Algorithmes d’apprentissage automatique pour la détection précoce des métastases osseuses dans un modèle de rat expérimental

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.