Cancer Research

Machine Learning-algoritmen voor vroegtijdige opsporing van botmetastasen in een experimenteel ratmodel

Published: August 16, 2020 doi: 10.3791/61235

Stephan Ellmann¹, Lisa Seyler¹, Clarissa Gillmann², Vanessa Popp¹, Christoph Treutlein¹, Aline Bozec³, Michael Uder¹, Tobias Bäuerle¹

¹Department of Radiology, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg, ²Department of Medical Physics in Radiation Oncology, German Cancer Research Center, ³Department of Internal Medicine 3, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg

Summary

Dit protocol is ontworpen om een machine learning-algoritme te trainen om een combinatie van beeldvormingsparameters te gebruiken die zijn afgeleid van magnetic resonance imaging (MRI) en positron emissietomografie/computertomografie (PET/CT) in een ratmodel van botmetastasen van borstkanker om vroege gemetastaseerde ziekte op te sporen en latere progressie naar macrometastasen te voorspellen.

Abstract

Machine learning (ML)-algoritmen maken het mogelijk om verschillende functies in een model te integreren om classificatie- of regressietaken uit te voeren met een nauwkeurigheid die de bestanddelen overschrijdt. Dit protocol beschrijft de ontwikkeling van een ML-algoritme om de groei van borstkankerbotmacrometastasen in een ratmodel te voorspellen voordat afwijkingen waarneembaar zijn met standaard beeldvormingsmethoden. Een dergelijk algoritme kan de detectie vergemakkelijken van vroege gemetastaseerde ziekte (d.w.z. micrometastase) die regelmatig wordt gemist tijdens ensceneringsonderzoeken.

Het toegepaste metastasemodel is sitespecifiek, wat betekent dat de ratten uitsluitend uitzaaiingen ontwikkelen in hun rechterachterbeen. De tumor-take rate van het model is 60%-80%, waarbij macrometastasen zichtbaar worden in magnetic resonance imaging (MRI) en positron emissietomografie/computertomografie (PET/CT) in een subset van dieren 30 dagen na inductie, terwijl een tweede deel van de dieren geen tumorgroei vertoont.

Uitgaande van beeldonderzoeken die op een eerder tijdstip zijn verworven, beschrijft dit protocol de extractie van kenmerken die wijzen op weefselvasculaireisatie gedetecteerd door MRI, glucosemetabolisme door PET/CT, en de daaropvolgende bepaling van de meest relevante functies voor de voorspelling van macrometastatische ziekte. Deze functies worden vervolgens ingevoerd in een modelgemiddelde neurale netwerk (avNNet) om de dieren te classificeren in een van de twee groepen: een die uitzaaiingen zal ontwikkelen en de andere die geen tumoren zal ontwikkelen. Het protocol beschrijft ook de berekening van standaard diagnostische parameters, zoals algehele nauwkeurigheid, gevoeligheid, specificiteit, negatieve / positieve voorspellende waarden, waarschijnlijkheidsverhoudingen en de ontwikkeling van een ontvanger bedrijfskenmerk. Een voordeel van het voorgestelde protocol is de flexibiliteit, omdat het gemakkelijk kan worden aangepast om een overvloed aan verschillende ML-algoritmen te trainen met aanpasbare combinaties van een onbeperkt aantal functies. Bovendien kan het worden gebruikt om verschillende problemen in oncologie, infectie en ontsteking te analyseren.

Introduction

Het doel van dit protocol is om verschillende functionele beeldvormingsparameters van MRI en PET/CT te integreren in een modelgemiddeld neuraal netwerk (avNNet) ML-algoritme. Dit algoritme voorspelt de groei van macrometastasen in een ratmodel van botmetastasen van borstkanker op een vroeg moment, wanneer macroscopische veranderingen in het bot nog niet zichtbaar zijn.

Voorafgaand aan de groei van macrometastasen treedt een beenmerginvasie van verspreide tumorcellen op, meestal aangeduid als micrometastatische ziekte¹^,². Deze eerste invasie kan worden beschouwd als een vroege stap in uitgezaaide ziekte, maar wordt meestal gemist tijdens conventionele enscenering onderzoeken³^,⁴. Hoewel de thans beschikbare beeldvormingsmodaliteiten geen beenmergmicro-invasie kunnen detecteren wanneer ze alleen worden gebruikt, is aangetoond dat een combinatie van beeldvormingsparameters die informatie opleveren over vascularisatie en metabole activiteit beter^{presteren 5}. Dit complementaire voordeel wordt bereikt door het combineren van verschillende beeldvormingsparameters in een avNNet, dat is een ML-algoritme. Een dergelijke avNNet zorgt voor de betrouwbare voorspelling van bot macrometastasen vorming voordat er zichtbare metastasen aanwezig zijn. Daarom kan de integratie van beeldvormingsbiomarkers in een avNNet dienen als surrogaatparameter voor beenmergmicro-invasie en vroege gemetastasure ziekte.

Voor de ontwikkeling van het protocol werd een eerder beschreven model van botmetastasen met borstkanker bij naakte ratten gebruikt⁶^,⁷^,⁸. Het voordeel van dit model is de site-specificiteit, wat betekent dat de dieren benige metastasen uitsluitend ontwikkelen in hun rechterachterbeen. Echter, de tumor-take rate van deze aanpak is 60%-80%, dus een aanzienlijk aantal van de dieren ontwikkelen geen uitzaaiingen tijdens de studie. Met behulp van beeldvormingsmodaliteiten zoals MRI en PET/CT is de aanwezigheid van metastasen vanaf dag 30 nainjectie (PI) aantoonbaar. Op eerdere punten (bijvoorbeeld 10 PI) maakt beeldvorming geen onderscheid tussen dieren die uitgezaaide ziekten zullen ontwikkelen en die niet (figuur 1).

Een avNNet getraind op functionele imaging parameters verworven op dag 10 PI, zoals beschreven in het volgende protocol, betrouwbaar voorspelt of sluit de groei van macrometastasen binnen de volgende ~ 3 weken. Neurale netwerken combineren kunstmatige knooppunten binnen verschillende lagen. In het studieprotocol vertegenwoordigen de functionele beeldvormingsparameters voor beenmergbloedtoevoer en metabole activiteit de onderste laag, terwijl de voorspelling van maligniteit de bovenste laag vertegenwoordigt. Een extra tussenlaag bevat verborgen knooppunten die zijn verbonden met zowel de boven- als de onderste laag. De sterkte van de verbindingen tussen de verschillende knooppunten wordt bijgewerkt tijdens de training van het netwerk om de respectieve classificatietaak met hoge nauwkeurigheid uit te voeren⁹. De nauwkeurigheid van een dergelijk neuraal netwerk kan verder worden verhoogd door middeling van de uitgangen van verschillende modellen, wat resulteert in een avNNet¹⁰.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Alle zorg- en experimentele procedures werden uitgevoerd in overeenstemming met de nationale en regionale wetgeving inzake dierenbescherming en alle dierprocedures werden goedgekeurd door de duitse staatsregering (referentienummer 55.2 DMS-2532-2-228).

1. Inductie van botmetastasen van borstkanker in het rechterachterbeen van naakte ratten

OPMERKING: Elders is een gedetailleerde beschrijving gepubliceerd van de inductie van botmetastasen bij naakte ratten⁶^,⁸. De meest relevante stappen worden hieronder gepresenteerd.

Cultuur MDA-MB-231 menselijke borstkankercellen in RPMI-1640, aangevuld met 10% foetale kalfsserum (FCS). Houd de cellen onder standaard omstandigheden (37 °C, 5% CO₂₎en doorsnee de cellen 2-3 keer per week.
Was bijna-confluent MDA-MB-231 cellen met 2 mM EDTA in fosfaat-gebufferde zoutoplossing (PBS), en maak de cellen vervolgens los met 0,25% trypsine. Bepaal de celconcentratie met de kamer van een Neubauer en zet deze opnieuw op in 200 μL RPMI-1640 bij een concentratie van 1,5 x 10⁵ cellen/200 μL.
Gebruik 6-8 weken oude naaktratten en bewaar ze onder pathogene, gecontroleerde omstandigheden (21 °C ± 2 °C kamertemperatuur, 60% vochtigheid en 12 h lichtdonker ritme). Bied autoclaved feed en water ad libitum.
Voor het uitvoeren van de operatie, injecteer een pijnstillend medicijn (bijvoorbeeld Carprofen 4 mg/kg) onderhuids. Verdoes ratten met een isoflurane (1-1,5 vol%) /zuurstofmengsel met een stroomsnelheid van 2 L/min. Controleer de verdovingsdiepte door teen knijpen.
Voor de operatie, gebruik maken van een operatiemicroscoop met een 16x vergroting.
Voer een snede van 2-3 cm uit in het rechter inguinale gebied van de rat. Ontleed alle slagaders in het rechter inguinale gebied, inclusief de dijbeenslagader (FA), de oppervlakkige epigastrische slagader (SEA), de dalende geniculaire slagader (DGA), de popliteale slagader (PA) en de saphenous slagader (SA). Plaats twee verwijderbare clips op de FA: een proximale aan het begin van de ZEE, en een andere direct proximaal aan het begin van de DGA.
Ligate het distale gedeelte van de SEA. Voer een snede uit van de sea-wand en steek een naald met een diameter van 0,3 mm in de SEA. Sluit een spuit met de celsuspensie van stap 1.2 op de naald. Verwijder de distale clip van de FA en knip de SA in plaats daarvan.
Injecteer langzaam de MDA-MB-231 celsuspensie van stap 1.2 (1,5 x 10⁵ cellen/200 μL) in de SEA. Verwijder de naald, ligate de SEA en verwijder de slagaderclips. Sluit de wond met chirurgische clips en beëindig anesthesie. Controleer de dieren dagelijks om de tumorgrootte en enig bewijs van pijn te beoordelen.

2. Beeldvorming van magnetische resonantie (MRI)

OPMERKING: Voor een gedetailleerde beschrijving van MRI-procedures, zie Bäuerle et al.¹¹.

Voer MRI 10 dagen PI uit met behulp van een speciale experimentele scanner (zie Tabel van Materialen)of een menselijk MR-systeem met een geschikte dierenspoel.
Verdoven de rat met een isoflurane (1-1,5 vol. %)/zuurstofmengsel zoals hierboven beschreven. Plaats een katheter in de staart van de rat ader en tape het aan de staart. Sluit een spuit aan met het contrastmiddel (0,1 mmol/kg Gd-DTPA in ongeveer 0,5 mL).
Plaats de verdoofde rat in het MR-systeem. Zoek het distale dijbeen en het proximale scheenbeen van het rechterachterbeen in een anatomische sequentie (bijvoorbeeld T2-gewogen turbo spin echo sequentie; TR = 8.654 ms; TE = 37 ms; matrix 320 x 272; FOV = 65 mm x 55 mm; plakdikte = 1 mm; scantijd 11:24 min).
Bepaal de plakjes die het distale dijbeen en het proximale scheenbeen van het rechterachterbeen bedekken en start de DCE-MRI-sequentie (bijvoorbeeld snelle lage hoek schotvolgorde; TR = 3,9 ms; TE = 0,88 ms; matrix = 256 x 216; FOV = 65 x 54 mm²; plakdikte = 1 mm; 8 plakjes; 100 tijdstippen; scantijd = 8:25 min). Na 30 s, beginnen met het injecteren van de contrast agent over een periode van 10 s.
LET OP: De totale tijd om een MRI-onderzoek uit te voeren is ongeveer 20 min per dier.

3. Positron emissietomografie/computertomografie (PET/CT)

OPMERKING: Voor een gedetailleerde beschrijving van de PET-procedures, zie Cheng op al.¹².

Voer PET/CT-beeldvorming uit 10 dagen PI met behulp van een speciale experimentele scanner (zie Tabel van materialen).
Houd de dieren vast voorafgaand aan de beeldvorming. Verdoven de rat zoals beschreven in stap 2.2 en steek een katheter in de staartader zoals hierboven beschreven.
Injecteer 6 MBq van ¹⁸F-Fluorodeoxyglucose⁽¹⁸F-FDG) in de staartader en wacht ~30 min om de tracer goed te kunnen verdelen.
Voer een CT-acquisitie uit (buisspanning = 80 kV, buisstroom = 500 μA, isotropische resolutie = 48,9 μm, duur = 10 min).
Voer een statische PET-acquisitie uit (lager/hoger discriminerend niveau = 350/650 keV; tijdvenster = 3.438 ns; duur = 15 min).

4. Alternatieve beeldvormingsstrategieën

Voor een vroege beoordeling van MDA-MB-231 cellen in het achterbeen, inentingscellen 1,5 x 10⁵ gelabelde cellen /200 μL voor bioluminescentie (d.w.z. cellen die luciferine, MDA-MB-231-LUC¹³) of fluorescentiebeeldvorming uitdrukken (d.w.z. cellen die groen of rood fluorescerend eiwit uitdrukken, MDA-MB-231-GFP/RFP¹³). Gebruik het systeem voor preklinische optische beeldvorming om intraosseous MDA-MB-231 cellen te detecteren na tumorcelinenting¹⁴.
Voer experimentele echografie uit met behulp van een speciale scanner na intraveneuze injectie van microbellen om morfologische en functionele parameters van vascularisatie af te leiden die vergelijkbaar zijn met MRI^7.

5. MRI-analyse

Gebruik een DICOM viewer¹⁵ met een DCE Plugin¹⁶ en laad de DCE-reeks in 4D-modus door te klikken op de knopImporterenin het bovenste menu, de DICOM-map met de MR-afbeeldingen van stap 2.4 te selecteren en in het bovenste menu op "4D-viewer" te klikken.
Plaats een cirkelvormig 2-dimensionaal interessegebied (ROI), met een doelgrootte van 1,5 mm², in het beenmerg van de proximale scheenschacht van het rechterachterbeen, bij voorkeur met behulp van afbeeldingsnummers 4 of 5 uit de reeks bestaande uit 8 beelden, omdat deze middenbeelden stabielere resultaten opleveren.
Start de DCE-plug-in in het bovenste menu, selecteer "Relatieve verbetering" in het veld "Plottype" en definieer het basislijnbereik van tijdspunten 1 tot 5 door deze getallen in de respectievelijke velden te typen. Exporteer de analyse als een .txt-bestand met de desbetreffende knop en kies "DCEraw.txt" als bestandsnaam.
Open RStudio¹⁷ en laad het meegeleverde DCE-Script.R-bestand via het menu "Bestand" door "Bestand openen" te selecteren. Voer het hele script uit door "Code" te selecteren, vervolgens 'Regio uitvoerenen vervolgensAlles uitvoeren'in het menu. Kopieer de uitvoer naar het meegeleverde sjabloonbestand met de naam "ImagingFeatures.xlsx" (figuur 2).
In de DICOM viewer, plaats een tweede ROI in de rugspier van het dier en herhaal stappen 5.2–5.4 om de spier DCE metingen voor normalisatie doeleinden te verkrijgen. Binnen de spreadsheet "ImagingFeatures.xlsx" worden de respectievelijke botmetingen automatisch gedeeld door de respectievelijke spiermetingen voor normalisatiedoeleinden.
Herhaal stap 5.1–5.5 voor alle dieren en vul de spreadsheet in.

6. PET/CT-analyse

Open de PET/CT-analysesoftware en importeer de verkregen gegevens in stap 3 door op "Bestand" te klikken, gevolgd door "Handmatig importeren". Markeer de ct.img.hd en de pet.img.hdr-bestanden. Klik op' Openen'en selecteer Allesimporteren.
Open de datasets door "Algemene analyse" te selecteren, gevolgd door "OK".
Selecteer "ROI Quantification", gevolgd door "Create", en vervolgens "Maak een ROI op basis van een sjabloon". Plaats een 2-dimensionale ROI van ongeveer 4 mm x 6 mm in het beenmerg van de proximale scheenschacht van het rechterachterbeen.
Selecteer "ROI's (Target 1 overlay)en schrijf gemiddelde, minimum- en maximumwaarden in Bq/mL op.
Bereken de maximale gestandaardiseerde opnamewaarde (SUV_max):Verdeel de maximale waarde (Bq/mL) door de geïnjecteerde activiteit en vermenigvuldig het resultaat met het gewicht van het dier in grammen. Voer het resultaat in de spreadsheet in (figuur 2).

7. Het bepalen van de tumor-take rate

Om tumorgroei in het rechter achterbeen te diagnosticeren, herhaalT UT en PET/CT-beeldvorming op dag 30 PI, zoals hierboven beschreven.
OPMERKING: Tumoren zullen duidelijk zichtbaar zijn op dag 30 PI en zijn voorzien van T2w-hyperintense laesies en duidelijke contrastverbetering in MRI, samen met een duidelijk verhoogde SUV_max in PET / CT. Volgens eerdere experimenten zal 60%-80% van de dieren uitzaaiingen ontwikkelen in hun rechterachterbeen.
Vul de spreadsheet door het toevoegen van een extra "Tumor" kolom en voer "1" voor elk dier dat metastasen presenteert, en "0" voor elk dier zonder zichtbare tumor last (Figuur 2). Sla de spreadsheet op als 'ImagingFeatures.xlsx' in de map Downloads.

8. Selectie van functies

Als u de meest relevante functies wilt bepalen voor het voorspellen van toekomstige tumorgroei, importeert u de spreadsheet in een open-source gegevensvisualisatie, machine learning en toolkit¹⁸voor gegevensmining.
Teken de bestandsubroutine uit het menu Gegevens naar de werkruimte aan de rechterkant en dubbelklik erop. Laad de spreadsheet door op het pictogramMapte klikken en het bestand 'ImagingFeatures.xlsx' te selecteren. Selecteer het werkblad' Exporteren' en wijs het doelattribuut toe aan de variabele "Tumor". Wijs de functieOverslaantoe aan het dierennummer (figuur 3).
Teken de subroutine "Rang" uit het menu Gegevens naar de werkruimte en verbind de subroutines" Bestand" en "Rang" door een lijn tussen hen te tekenen.
Open de subroutine" Rang" door dubbel op het pictogram te klikken en selecteer het "Information Gain" algoritme¹⁹.
Gebruik van de vijf verworven parameters de top drie voor verdere analyses (SUV_max,PE en AUC).
Opmerking: Deze parameters weerspiegelen metabole activiteit (SUV_max)en weefsel vascularisatie (PE en AUC).

9. ML-analyse

Open RStudio 3.4.1¹⁷ en laad het meegeleverde TrainModel.R-Script via het menu "Bestand".
Installeer de vereiste bibliotheken (dit hoeft maar één keer te worden gedaan) door te typen: install.packages(c("caret", "readxl", "pROC", "RcmdrPlugin.EZR", "ggplot2"))
Als u de vereiste bibliotheken wilt laden en de map Downloads wilt instellen als de werkmap, selecteert u de regels 3–5 in het TrainModel.R-script.
Voer de geselecteerde code uit door in het menu op' Code' te klikken en vervolgens 'Geselecteerde regel(en) uitvoeren'.

10. Training van een avNNet ML algoritme

Als u een avNNet-algoritme wilt trainen, selecteert u de lijnen 8–39 in het TrainModel.R-Script (zie stap 9.1).
Voer de geselecteerde code uit door in het menu op' Code' te klikken en vervolgens 'Geselecteerde regel(en) uitvoeren'.

11. De resultaten van het ML-algoritme analyseren

Als u standaardparameters van diagnostische nauwkeurigheid (gevoeligheid, specificiteit, positieve en negatieve voorspellende waarden en waarschijnlijkheidsverhoudingen) wilt beoordelen, selecteert u de lijnen 41–50 uit het TrainModel.R-Script.
Voer de geselecteerde code uit door in het menu op' Code' te klikken en vervolgens 'Geselecteerde regel(en) uitvoeren'.

12. Het vergelijken van de receiver operating characteristic (ROC) curve van het definitieve model met de ROC-krommen van de samenstellende parameters

Als u de tests van DeLong wilt uitvoeren om de ROC-curve van het model te vergelijken met de ROC-curven van de samenstellende parameters, selecteert u de lijnen 52-62 uit het TrainModel.R-Script (zie stap 9.1).
Voer de geselecteerde code uit door in het menu op' Code' te klikken en vervolgens 'Geselecteerde regel(en) uitvoeren'.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

De ratten herstelden snel van de operatie en injectie van de MDA-MB-231 borstkankercellen en werden vervolgens onderworpen aan MR- en PET/CT-beeldvorming op dag 10 en 30 PI(figuur 1). Een representatieve DCE-analyse van het rechter proximale tibia van een rat wordt gepresenteerd in figuur 2A. De DCE raw metingen werden opgeslagen door de knopExporterente selecteren en "DCEraw.txt" als bestandsnaam te kiezen.

Latere berekeningen van de dynamische parameters, AUC, PE en washout werden uitgevoerd in RStudio met het desbetreffende script. De uitvoer van de DCE-metingen moest worden opgeslagen als "DCEraw.txt" in de map "Downloads", zodat het script direct kon worden uitgevoerd zonder extra configuraties om een gegevenstabel te bieden, zoals afgebeeld in figuur 2B. Deze gegevens zijn gekopieerd naar de meegeleverde spreadsheet(figuur 2C). Ook werden de DCE-parameters voor spierweefsel bepaald en overgebracht naar de spreadsheet(figuur 2D,E). Deze waarden werden genormaliseerd door de botmetingen te delen door de spiermetingen; dit werd automatisch uitgevoerd in de spreadsheet. Van de PET/CT werden de berekende SUV_max-waarden vervolgens in de tabel(figuur 2F)overgeheveld.

Op dag 30 PI werden alle dieren geëvalueerd om te bepalen of ze al dan niet metastasen ontwikkelden, en de tabel werd voltooid door het coderen van positieve tumorlast als "1" en gezonde dieren als "0" binnen de meest rechtse kolom van de spreadsheet(figuur 2C).

De spreadsheet werd geïmporteerd in de open-source data visualisatie, machine learning, en data mining toolkit, en functie ranking bleek de SUV_max,PE, en AUC als de top drie functies voor de voorspelling van uitgezaaide ziekte (Figuur 3). Deze parameters weerspiegelen metabole activiteit (SUV_max)en weefsel vascularisatie (PE en AUC).

Het uitvoeren van het TrainModel.R Script importeerde de spreadsheet automatisch en berekende een avNNet. De optimale hyperparametercombinatie werd bepaald (figuur 4A) en het uiteindelijke model werd vervolgens berekend met behulp van de optimale hyperparametercombinatie (figuur 4B). Vervolgens werd een reeks standaarddiagnostische parameters berekend (figuur 4C) en werd een ROC-curve van het model uitgezet (figuur 4D).

Het positieve resultaat wordt weergegeven in figuur 4B–D. Een vergelijking van roc-curve van het model met de ROC-curve van zijn drie bestanddelen (d.w.z. AUC, PE en SUV_max)toonde aan dat het model aanzienlijk beter presteerde dan alle drie onderdelen (p = 0,01 voor AUC, p = 0,003 voor PE, en p = 0,007 voor SUV_max). De combinatie van de drie geselecteerde parameters met een avNNet was gevoeliger, waardoor de voorspelling van macroscopische ziekte met een algehele nauwkeurigheid van 85,7% (95% betrouwbaarheidsinterval = 67,3%-96,0%). Deze resultaten zijn verkregen uit een analyse van 28 monsters. De betrouwbaarheidsintervallen kunnen verder worden verkleind door het aantal dieren te verhogen.

De negatieve resultaten kunnen worden verkregen zoals hier beschreven. De nauwkeurigheidsmaatregelen waren zeer gevoelig voor specifieke soorten machine learning-algoritmen en voor stappen van gegevensvoorverwerking. Neural Networks, in het bijzonder, de neiging om beter te presteren wanneer de invoergegevens werden genormaliseerd. Dit werd bereikt door de functie "BoxCox" in sectie 10 van het protocol (lijnen 22 en 36 binnen het meegeleverde TrainModel.R-Script). Afzien van normalisatie en het gebruik van een ander algoritme (bijvoorbeeld een neuraal netwerk niet gemiddeld), door de methode te veranderen naar "nnet" (lijnen 21 en 35 binnen het meegeleverde TrainModel.R-Script), resulteerde in een gebied van 0,594 onder de ROC-curve (Aanvullende figuur 1). Een dergelijk model heeft niet significant beter gepresteerd dan de drie bestanddelen (alle p > 0,15).

Omdat het script is geoptimaliseerd voor RStudio 3.4.1 en het caret-pakket versie 6.0-84, kan het gebruik van verschillende softwareversies verschillende resultaten opleveren. Het uitvoeren van de meegeleverde scripts met de softwareversies die in dit manuscript worden gebruikt, zal vergelijkbare resultaten opleveren. Als lezers echter het script willen wijzigen, extra variabelen willen toevoegen, documentmappen of bestandsnamen willen wijzigen of de machine learning-algoritmen gedetailleerder willen wijzigen, zijn respectievelijke aanpassingen van de code noodzakelijk. Voor deze gevallen biedt de handleiding van het caret-pakket diepgaande uitleg²⁰.

Figuur 1: Representatieve MR- en PET/CT-beelden. MR- en PET/CT-beelden van het rechterachterbeen van een dier dat in de loop van de studie geen uitzaaiingen heeft ontwikkeld (twee meest linkse kolommen, met afbeeldingen van dag 10 en dag 30 PI), en een dier dat uitzaaiingen ontwikkelde tussen dag 10 en dag 30 PI (twee meest rechtse kolommen, uitzaaiingen gemarkeerd met pijlen). Let op de hoge signaalintensiteit van uitzaaiingen in de T2w-beelden (bovenste rij), de contrastverbetering die wordt afgebeeld door het verhoogde gebied onder de curve (AUC; tweede rij), en de verhoogde maximale gestandaardiseerde opnamewaarde in de PET/CT (SUV_max; derde rij). Merk op dat er geen zichtbare verschillen zijn in de beelden die op dag 10 PI (eerste en derde kolom) zijn verkregen tussen het dier met uitzaaiingen op dag 30 PI en het dier dat geen botmetastasen heeft ontwikkeld. Dit cijfer werd gewijzigd van Ellmann et al.⁵. Klik hier om een grotere versie van dit cijfer te bekijken.

Figuur 2: Beoordeling van de beeldvormingsfuncties en compilatie in een spreadsheet. (A) De dynamische contrastverbetering van het beenmerg van het proximale scheenbeen werd geanalyseerd met een freeware DICOM viewer¹⁵ met behulp van een DCE plugin¹⁶. De respectievelijke metingen werden opgeslagen en (B) verder geanalyseerd met het meegeleverde DCE-Script.R-bestand in RStudio¹⁷. (C) De uitvoer is gekopieerd naar een spreadsheet (zie aanvullend materiaal voor een sjabloon). (D) Ook werd de DCE-meting uitgevoerd voor aangrenzend spierweefsel, geanalyseerd met behulp van RStudio (E), en vervolgens gekopieerd naar de spreadsheet. De gegevens werden genormaliseerd door de resultaten van de botmetingen te delen door de resultaten van de spiermetingen (C; met zalmschaduwde cellen). (F) De PET/CT-metingen werden uitgevoerd met de software van de leverancier. De maximale gestandaardiseerde opnamewaarde werd berekend door de respectieve meting te delen door de geïnjecteerde activiteit en deze te vermenigvuldigen met het lichaamsgewicht van het dier. Het resultaat werd vervolgens gekopieerd naar de spreadsheet. Klik hier om een grotere versie van dit cijfer te bekijken.

Figuur 3: Functieranking. Ranking van de verworven imaging functies werd uitgevoerd binnen een open-source data visualisatie, machine learning, en data mining toolkit¹⁸ door het importeren van de spreadsheet via de "File"-subroutine, en analyseren via de "Rank"-subroutine. Klik hier om een grotere versie van dit cijfer te bekijken.

Figuur 4: Representatieve RStudio-uitvoer. Het machine learning-algoritme is ontwikkeld met behulp van RStudio¹⁷ met het meegeleverde TrainModel.R-Script-bestand. (A) Een raster zoeken tussen verschillende hyperparameter combinaties voor het model-averaged neurale netwerk bleek een grootte van drie neuronen en een verval van 0,0005 als een optimaal. (B) Met behulp van deze hyperparameter combinatie werd een volledig netwerk getraind en cross-gevalideerd, met een totale nauwkeurigheid van 85,7%. (C)Standaardparameters van diagnostische nauwkeurigheid, met inbegrip van gevoeligheid, specificiteit, positieve en negatieve voorspellende waarden en waarschijnlijkheidsratio's, werden berekend op basis van een verwarringsmatrix. (D) Een representatief ROC-perceel van het cross-gevalideerde model onthulde een gebied onder de curve (AUC) van 0,917. Klik hier om een grotere versie van dit cijfer te bekijken.

Aanvullend cijfer 1: Negatief resultaat. Het veranderen van het ML-algoritme naar een neuraal netwerk zonder middeling en afzien van normalisatie van de input parameters leidde tot een daling van het gebied onder de curve van de ROC curve van 0,917 (Figuur 4D) tot 0,594. Klik hier om dit bestand te downloaden.

Aanvullende figuur 2: Alternatieve functierangschikking. In tegenstelling tot de standaardmethode die in figuur 3wordt afgebeeld, werd ook een willekeurige variabele geïntroduceerd ("Willekeurig"; blauw gemarkeerd), met het belang ervan in de rangschikking. Deze aanpak bevestigde de toegepaste selectie van de variabelen SUV_max,PE en AUC. Klik hier om dit bestand te downloaden.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ML-algoritmen zijn krachtige tools die worden gebruikt om verschillende voorspellende functies in een gecombineerd model te integreren en een nauwkeurigheid te verkrijgen die groter is dan die van de afzonderlijke bestanddelen wanneer ze alleen worden gebruikt. Toch is het werkelijke resultaat afhankelijk van een aantal kritieke stappen. Ten eerste is het gebruikte ML-algoritme een cruciale factor, omdat verschillende ML-algoritmen verschillende resultaten opleveren. Het algoritme dat in dit protocol wordt gebruikt is een avNNet, maar andere veelbelovende algoritmen zijn Extreme Gradient Boosting²¹ of Random Forests. Het caret-pakket²⁰ voor RStudio biedt een overvloed aan verschillende algoritmen (momenteel >175), en het voorgestelde protocol is zeer flexibel in termen van overschakelen van het ene algoritme naar het andere door simpelweg enkele regels code te veranderen (bijvoorbeeld, het veranderen van methode = "avNNet" naar methode ="rf") en het aanpassen van de TunedGrid-instellingen naar het desbetreffende ML-algoritme. Zie voor meer informatie de caret github repository²². Fernández-Delgado et al.²³ publiceerde een uitstekend overzicht van verschillende algoritmen en hun prestaties met betrekking tot verschillende classificatieproblemen en kon als uitgangspunt dienen voor andere experimenten.

Een andere cruciale factor is de keuze van relevante functies op te nemen in een ML-algoritme. Dit protocol stelt het gebruik van de filtermethode , "Informatie gain"¹⁹, om de beschikbare functies in aflopende volgorde te rangschikken en de meest relevante te gebruiken om het avNNet te trainen. Filtermethoden zijn alleen gebaseerd op algemene veronderstellingen, zoals correlatie met de te voorspellen variabele, dus onderzoekers moeten functies vooraf selecteren onafhankelijk van de gebruikte classificatie²⁴^,²⁵. Dergelijke methoden zijn bijzonder effectief in rekentijd en robuust tot overfitting. Echter, de cutoff die relevant scheidt van irrelevante functies wordt gedefinieerd door de gebruiker, waardoor het enigszins willekeurig. Voor het voorgestelde protocol, de functies met de top 75% informatie winst werden gebruikt, wat overeenkomt met SUV_max,PE, en AUC. Deze selectie kan echter systematisch worden versterkt door een willekeurige variabele op te nemen die geen verband heeft met het doel, de informatiewinst ervan te berekenen en deze vervolgens te vergelijken met de informatiewinst van de werkelijke kenmerken (aanvullende figuur 2). Deze iets meer geavanceerde aanpak bevestigde bovendien de keuze van de drie bovengenoemde functies als de meest relevante. Niettemin bestaan er verschillende filtermethoden, samen met andere benaderingen die functies selecteren met betrekking tot een bepaald classificatiealgoritme, zoals functieextractie- en wrappermethoden. Verschillende benaderingen voor functieselectie kunnen verschillende resultaten opleveren.

Om de generaliseerbaarheid van het ML-algoritme te waarborgen en overfitting verder te voorkomen, past het voorgestelde protocol leave-one-out cross-validation (LOOCV) toe. De beste aanpak zou echter zijn om willekeurig een subset uit de volledige gegevensset te verwijderen en deze te behandelen als een testset. Het ML-algoritme wordt vervolgens getraind op de rest van de gegevens (d.w.z. de trainingsset) om vervolgens de uitkomst van de testset te voorspellen. Deze aanpak vergt echter een voldoende grote gegevensset. Voor kleinere steekproefgroottes is toepassing van LOOCV gebruikelijk omdat het een bijna onbevooroordeelde schatting biedt van de werkelijke generalisatiecapaciteit van een model²⁶. In LOOCV wordt het eerste gegevenspunt uit de gegevensset verwijderd en wordt het avNNet getraind met de bewaarde gegevens. Vervolgens wordt de uitkomst van het eerder achtergehouden gegevenspunt voorspeld en opgeslagen. Dit proces wordt herhaald voor alle gegevenspunten, zodat uiteindelijk elke uitkomst wordt voorspeld met gegevens die niet zijn gebruikt voor het trainen van het algoritme. Andere validatiebenaderingen omvatten x-fold cross-validaties (meestal 10-voudig) en kunnen gemakkelijk worden toegepast door de respectievelijke trainControl-parameter binnen de code te wijzigen in method="CV".

Vanuit kwantitatief oogpunt worden medische beelden meestal op een zeer fundamentele manier geëvalueerd, grotendeels afhankelijk van metingen van grootte en vorm van potentieel verdachte laesies of gebieden²⁷^,²⁸. Het voordeel van de Digital Imaging and Communications in Medicine (DICOM) standaard is echter dat het de extractie van vele functies mogelijk maakt, aangeduid als radiomiek. De term "radiomiek" werd aanvankelijk gedefinieerd als de hoge doorvoerextractie van grote hoeveelheden beeldkenmerken²⁹, maar werd vervolgens uitgebreid met de omzetting van beelden naar hoger dimensionale gegevens³⁰. De hogerdimensionale gegevens worden echter voornamelijk gebruikt om correlaties te identificeren in plaats van oorzaken³⁰. De functies beschreven in dit protocol vallen tussen klassieke radiologische kenmerken, zoals grootte en vorm, en radiomiek, omdat ze lijken op algemeen aanvaarde parameters van vascularisatie en metabole activiteit. Dit biedt een mogelijke causale relatie met de micro-invasie van verspreide tumorcellen. Indien gewenst door de gebruiker, kan een extractie van radiomische functies worden uitgevoerd met verschillende softwarepakketten³¹.

Het protocol is niet beperkt tot een eindig aantal functies. Zo kan het worden gebruikt met grote radiomics datasets. Echter, de bovengenoemde kwestie van functie selectie wordt steeds belangrijker met groeiende datasets. Het gepresenteerde protocol kan ook worden overgebracht naar verschillende studie-instellingen, bijvoorbeeld van de gebieden oncologie, infectie of ontsteking^32.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs verklaren geen belangenconflict. De financiers hadden geen rol in het ontwerp van de studie; bij het verzamelen, analyseren of interpreteren van gegevens; in het schrijven van het manuscript, of in het besluit om de resultaten te publiceren.

Acknowledgments

Dit werk werd ondersteund door de German Research Foundation (DFG, Collaborative Research Centre CRC 1181, subproject Z02; Prioriteitsprogramma μBone, projecten BA 4027/10-1 en BO 3811), inclusief extra ondersteuning voor de scanapparaten (INST 410/77-1 FUGG en INST 410/93-1GG FU), en door het Emerging Fields Initiative (EFI) "Big Thera" van de Friedrich-Alexander-University Erlangen-Nürnberg.

Materials

Name	Company	Catalog Number	Comments
Binocular Operating Microscope	Leica	NA
ClinScan MR System	Bruker	NA
DICOM Viewer	Horos	NA	www.horosproject.org
Excel: Spreadsheet	Microsoft	NA
FCS	Sigma	F2442-500ML
Gadovist	Bayer-Schering	NA
Inveon PET/CT	Siemens	NA
Inveon Research Workplace Software	Siemens Healthcare GmbH	NA
IVIS Spectrum	PerkinElmer	NA
MDA-MB-231 human breast cancer cells	American Type Culture Collection	N/A
Open-source data visualization, machine learning and data mining toolkit.	Orange3, University of Ljubljana	NA	https://orange.biolab.si/
RPMI-1640	Invitrogen/ThermoFisher	11875093
Trypsin	Sigma	9002-07-7
Vevo 3100	VisualSonics	NA

DOWNLOAD MATERIALS LIST

References

D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).

Cancer Research

Machine Learning-algoritmen voor vroegtijdige opsporing van botmetastasen in een experimenteel ratmodel

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.