Cancer Research

Algoritmos de aprendizaje automático para la detección temprana de metástasis óseas en un modelo experimental de rata

Published: August 16, 2020 doi: 10.3791/61235

Stephan Ellmann¹, Lisa Seyler¹, Clarissa Gillmann², Vanessa Popp¹, Christoph Treutlein¹, Aline Bozec³, Michael Uder¹, Tobias Bäuerle¹

¹Department of Radiology, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg, ²Department of Medical Physics in Radiation Oncology, German Cancer Research Center, ³Department of Internal Medicine 3, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg

Summary

Este protocolo fue diseñado para entrenar un algoritmo de aprendizaje automático para utilizar una combinación de parámetros de imagen derivados de la resonancia magnética (RM) y la tomografía por emisión de positrones/tomografía computarizada (PET/CT) en un modelo de rata de metástasis óseas de cáncer de mama para detectar enfermedades metastásicas tempranas y predecir la progresión posterior a macrometastasas.

Abstract

Los algoritmos de aprendizaje automático (ML) permiten la integración de diferentes características en un modelo para realizar tareas de clasificación o regresión con una precisión superior a sus componentes. Este protocolo describe el desarrollo de un algoritmo de ML para predecir el crecimiento de macrometastas óseas de cáncer de mama en un modelo de rata antes de que cualquier anomalía sea observable con métodos de diagnóstico por imágenes estándar. Este algoritmo puede facilitar la detección de la enfermedad metastásica temprana (es decir, micrometastasis) que se olvida regularmente durante los exámenes de ensayo.

El modelo de metástasis aplicado es específico del sitio, lo que significa que las ratas desarrollan metástasis exclusivamente en su pata trasera derecha. La tasa de toma de tumores del modelo es del 60%-80%, con macrometastasas cada vez más visibles en la resonancia magnética (RM) y la tomografía por emisión de positrones / tomografía computarizada (PET/CT) en un subconjunto de animales 30 días después de la inducción, mientras que un segundo subconjunto de animales no presentan crecimiento tumoral.

A partir de los exámenes de imagen adquiridos en un punto de tiempo anterior, este protocolo describe la extracción de características que indican la vascularización tisular detectada por la RMN, el metabolismo de la glucosa por PET/CT y la posterior determinación de las características más relevantes para la predicción de la enfermedad macrometastática. Estas características se introducen en una red neuronal promediada por modelos (avNNet) para clasificar a los animales en uno de dos grupos: uno que desarrollará metástasis y el otro que no desarrollará ningún tumor. El protocolo también describe el cálculo de parámetros de diagnóstico estándar, como la precisión general, la sensibilidad, la especificidad, los valores predictivos negativos/positivos, las relaciones de probabilidad y el desarrollo de una característica de funcionamiento del receptor. Una ventaja del protocolo propuesto es su flexibilidad, ya que se puede adaptar fácilmente para entrenar una gran cantidad de diferentes algoritmos de ML con combinaciones ajustables de un número ilimitado de características. Por otra parte, se puede utilizar para analizar diferentes problemas en oncología, infección, y la inflamación.

Introduction

El propósito de este protocolo es integrar varios parámetros de imagen funcionales de RMN y PET/CT en un algoritmo de ML de red neuronal promediada por modelos (avNNet). Este algoritmo predice el crecimiento de macrometastasas en un modelo de rata de metástasis óseas de cáncer de mama en un punto de tiempo temprano, cuando los cambios macroscópicos dentro del hueso aún no son visibles.

Antes del crecimiento de las macrometastasas, se produce una invasión de la médula ósea de células tumorales diseminadas, comúnmente conocida como enfermedad micrometastática¹^,². Esta invasión inicial se puede considerar un paso temprano en la enfermedad metastásica, pero por lo general se pierde durante los exámenes de estadificación convencionales^3,^,⁴. Aunque las modalidades de diagnóstico por imágenes actualmente disponibles no pueden detectar la microinvasión de la médula ósea cuando se utilizan solas, se ha demostrado que una combinación de parámetros de imagen que arroja información sobre la vascularización y la actividad metabólica funciona mejor^5. Este beneficio complementario se logra combinando diferentes parámetros de imagen en un avNNet, que es un algoritmo de ML. Tal avNNet permite la predicción confiable de la formación de macrometastas óseas antes de que haya metástasis visibles. Por lo tanto, la integración de biomarcadores de imagen en un avNNet podría servir como parámetro sustituta para la microinvasión de médula ósea y la enfermedad metastásica temprana.

Para desarrollar el protocolo, se utilizó un modelo previamente descrito de metástasis óseas de cáncer de mama en ratas desnudas⁶^,⁷^,⁸. La ventaja de este modelo es su especificidad del sitio, lo que significa que los animales desarrollan metástasis óseas exclusivamente en su pata trasera derecha. Sin embargo, la tasa de toma de tumores de este enfoque es del 60%-80%, por lo que un número considerable de los animales no desarrollan metástasis durante el estudio. Utilizando modalidades de diagnóstico por imágenes como la RMN y el PET/CT, la presencia de metástasis es detectable a partir del día 30 postinyección (PI). En momentos anteriores (por ejemplo, 10 PI) las imágenes no distinguen entre los animales que desarrollarán la enfermedad metastásica y los que no (Figura 1).

Un avNNet capacitado en parámetros de imagen funcional adquiridos en el día 10 PI, como se describe en el siguiente protocolo, predice o excluye de forma fiable el crecimiento de macrometastasas en las siguientes 3 semanas. Las redes neuronales combinan nodos artificiales dentro de diferentes capas. En el protocolo de estudio, los parámetros de imagen funcional para el suministro de sangre de la médula ósea y la actividad metabólica representan la capa inferior, mientras que la predicción de la neoplasia maligna representa la capa superior. Una capa intermedia adicional contiene nodos ocultos que están conectados a la capa superior e inferior. La fuerza de las conexiones entre los diferentes nodos se actualiza durante el entrenamiento de la red para realizar la tarea de clasificación respectiva con alta precisión⁹. La precisión de una red neuronal de este tipo se puede aumentar aún más promediando las salidas de varios modelos, lo que resulta en un avNNet¹⁰.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Todos los procedimientos de cuidado y experimentalidad se realizaron de conformidad con la legislación nacional y regional en materia de protección animal, y todos los procedimientos animales fueron aprobados por el Gobierno del Estado de Franconia, Alemania (número de referencia 55.2 DMS-2532-2-228).

1. Inducción de metástasis óseas de cáncer de mama en la pata trasera derecha de ratas desnudas

NOTA: Una descripción detallada de la inducción de metástasis óseas de cáncer de mama en ratas desnudas se ha publicado en otros^{lugares 6}^,⁸. Los pasos más relevantes se presentan a continuación.

Cultivo MDA-MB-231 células de cáncer de mama humano en RPMI-1640, complementado con 10% de suero de ternera fetal (FCS). Mantener las células en condiciones estándar (37 oC, 5% CO₂) y pasar las celdas 2-3 veces a la semana.
Lave las células MDA-MB-231 casi confluentes con 2 mM de EDTA en solución salina tamponada con fosfato (PBS), y luego desasocie las células con 0,25% de trippsina. Determinar la concentración celular con una cámara de Neubauer y resuspenderlas en 200 l de RPMI-1640 a una concentración de 1,5 x 10⁵ células/200 l.
Use ratas desnudas de 6 a 8 semanas de edad y manténgalas bajo condiciones controladas y libres de patógenos (21 oC ± temperatura ambiente de 2 oC, 60% de humedad y 12 h de ritmo oscuro claro). Ofrezca pienso autoclavado y agua ad libitum.
Antes de realizar la cirugía, inyecte un analgésico (p. ej., Carprofeno 4 mg/kg) por vía subcutánea. Anestfetizar ratas con un isoflurano (1–1,5 vol. %)/mezcla de oxígeno a un caudal de 2 L/min. Compruebe la profundidad anestésica por pellizcar los dedos de los dedos.
Para la cirugía, utilice un microscopio operativo con un aumento de 16x.
Realice un corte de 2-3 cm en la región inguinal derecha de la rata. Diseccionar todas las arterias de la región inguinal derecha, incluyendo la arteria femoral (FA), la arteria epigástrica superficial (SEA), la arteriagenicular descendente (DGA), la arteria popliteal (PA) y la arteria safenosa (SA). Coloque dos clips extraíbles en la FA: uno proximal al principio del SEA, y otro directamente proximal al principio de la DGA.
Ligar la parte distal del SEA. Realice un corte de la pared del SEA e inserte una aguja de 0,3 mm de diámetro en el SEA. Conecte una jeringa que contenga la suspensión celular del paso 1.2 a la aguja. Retire el clip distal de la FA y recorte el SA en su lugar.
Inyecte lentamente la suspensión de células MDA-MB-231 del paso 1.2 (1.5 x 10⁵ células/200 l) en el SEA. Retire la aguja, liga el SEA y retire los clips de la arteria. Cierre la herida con clips quirúrgicos y termine con la anestesia. Supervise a los animales diariamente para evaluar el tamaño del tumor y cualquier evidencia de dolor.

2. Resonancia magnética (RM)

NOTA: Para obtener una descripción detallada de los procedimientos de RMN, véase el archivo B-uerle et al.¹¹.

Realizar RMN 10 días DE PI utilizando un escáner experimental dedicado (ver Tabla de Materiales) o un sistema de RM humana con una bobina animal apropiada.
Anestfetizar a la rata con un isoflurano (1–1,5 vol. %)/mezcla de oxígeno como se describió anteriormente. Coloque un catéter en la vena de la cola de la rata y fíquelo en la cola. Conecte una jeringa que contenga el agente de contraste (0,1 mmol/kg Gd-DTPA en aproximadamente 0,5 ml).
Coloque la rata anestesiada en el sistema de RMN. Localice el fémur distal y la tibia proximal de la pata trasera derecha en una secuencia anatómica (por ejemplo, secuencia de eco turbo spin ponderada en T2; TR a 8.654 ms; TE 37 ms; matriz 320 x 272; FOV a 65 mm x 55 mm; espesor de la rebanada 1 mm; tiempo de exploración 11:24 min).
Determinar las rebanadas que cubren el fémur distal y la tibia proximal de la pata trasera derecha e iniciar la secuencia DCE-MRI (por ejemplo, secuencia de disparo de ángulo bajo rápido; TR a 3,9 ms; TE a 0,88 ms; matriz 256 x 216; FOV 65 x 54 mm²; espesor de la rebanada 1 mm; 8 rodajas; 100 puntos de tiempo; tiempo de escaneo a 8:25 min). Después de 30 s, comience a inyectar el agente de contraste durante un período de tiempo de 10 s.
NOTA: El tiempo total para realizar un examen por RMN es de aproximadamente 20 minutos por animal.

3. Tomografía por emisión de positrones/tomografía computarizada (PET/CT)

NOTA: Para obtener una descripción detallada de los procedimientos de PET, consulte Cheng en al.¹².

Realizar imágenes PET/CT 10 días DE PI utilizando un escáner experimental dedicado (ver Tabla de materiales).
Mantenga a los animales ayunados antes de tomar imágenes. Anestesar la rata como se describe en el paso 2.2 e insertar un catéter en la vena de la cola como se describió anteriormente.
Inyecte 6 MBq de ¹⁸F-Fluorodeoxiglucosa (¹⁸F-FDG) en la vena de la cola y espere 30 min para permitir que el trazador se distribuya correctamente.
Realizar una adquisición de TC (voltaje de tubo a 80 kV, corriente de tubo a 500 oA, resolución isotrópica a 48,9 m, duración a 10 min).
Realice una adquisición estática de PET (nivel discriminatorio inferior/superior: 350/650 keV; ventana de temporización a 3.438 ns; duración a 15 min).

4. Estrategias de imagen alternativas

Para una evaluación temprana de las células MDA-MB-231 en la pata trasera, inocular 1,5 x 10⁵ células etiquetadas /200 l para bioluminiscencia (es decir, células que expresan luciferina, MDA-MB-231-LUC¹³) o imágenes de fluorescencia (es decir, células que expresan proteína fluorescente verde o roja, MDA-MB-231-G/RFP¹³). Utilice el sistema para imágenes ópticas preclínicas para detectar células MDA-MB-231 intraósesis después de la inoculación de células tumorales¹⁴.
Realizar ultrasonido experimental utilizando un escáner dedicado después de la inyección intravenosa de microburbujas para derivar parámetros morfológicos y funcionales de la vascularización comparables a la RMN⁷.

5. Análisis de RMN

Utilice un visor DICOM¹⁵ con un DCE Plugin¹⁶ y cargue la secuencia DCE en modo 4D haciendo clic en el botón"Importar"en el menú superior, seleccionando la carpeta DICOM que contiene las imágenes MR del paso 2.4, y haciendo clic en "4D Viewer" en el menú superior.
Colocar una región circular de 2 dimensiones de interés (ROI), con un tamaño objetivo de 1,5 mm^2,en la médula ósea del eje tibial proximal de la pata trasera derecha, preferiblemente utilizando los números de imagen 4 o 5 de la secuencia que consta de 8 imágenes, ya que estas imágenes centrales proporcionan resultados más estables.
Inicie el plugin DCE desde el menú superior, seleccione"Mejora relativa"en el campo "Tipo de trazado" y defina el rango de línea base de los puntos de tiempo 1 a 5 escribiendo estos números en los campos respectivos. Exporte el análisis como un archivo .txt con el botón correspondiente y elija "DCEraw.txt" como nombre de archivo.
Abra RStudio¹⁷ y cargue el archivo DCE-Script.R proporcionado a través del menú "Archivo"seleccionando "Abrir archivo". Ejecute todo el script seleccionando "Código", luego "Ejecutar región"y luego "Ejecutar todo" en el menú. Copie la salida en el archivo de plantilla proporcionado denominado "ImagingFeatures.xlsx" (Figura 2).
En el visor DICOM, coloque un segundo ROI dentro del músculo posterior del animal y repita los pasos 5.2–5.4 para obtener las mediciones musculares de DCE con fines de normalización. Dentro de la hoja de cálculo "ImagingFeatures.xlsx", las respectivas mediciones óseas se dividen automáticamente por las respectivas mediciones musculares para fines de normalización.
Repita los pasos 5.1 a 5.5 para todos los animales y complete la hoja de cálculo.

6. Análisis PET/CT

Abra el software de análisis PET/CT e importe los datos obtenidos en el paso 3 haciendo clic en "Archivo", seguido de "Importación manual". Marque los archivos ct.img.hd y pet.img.hdr. Haga clic en "Abrir" y seleccione "Importar todo".
Abra los conjuntos de datos seleccionando "Análisis general", seguido de "OK".
Seleccione "ROI Quantification", seguido de "Create", and then "Create a ROI from a template". Coloque un ROI tridimensional de aproximadamente 4 mm x 6 mm en la médula ósea del eje tibial proximal de la pata trasera derecha.
Seleccione "ROI (superposición de destino 1)" y anote los valores medios, mínimos y máximos en Bq/mL.
Calcular el valor máximo de captación estandarizado (SUV_max):Divida el valor máximo (Bq/mL) por la actividad inyectada y multiplique el resultado por el peso del animal en gramos. Introduzca el resultado en la hoja de cálculo(Figura 2).

7. Determinar la tasa de toma de tumores

Para diagnosticar el crecimiento tumoral en la pierna trasera derecha, repita la RMN y las imágenes pet/CT en el día 30 PI, como se describió anteriormente.
NOTA: Los tumores serán claramente visibles en el día 30 PI y contarán con lesiones T2w-hyperintense y una mejora de contraste claro en la RMN, junto con un SUV_max claramente elevado en PET/CT. Según experimentos anteriores, entre el 60% y el 80% de los animales desarrollarán metástasis en la pata trasera derecha.
Complete la hoja de cálculo agregando una columna adicional "Tumor" e ingrese "1" para cada animal que presenta metástasis, y "0" para cada animal sin carga tumoral visible (Figura 2). Guarde la hoja de cálculo como "ImagingFeatures.xlsx" en la carpeta Descargas.

8. Selección de características

Para determinar las características más relevantes para la predicción del crecimiento futuro del tumor, importe la hoja de cálculo en un kit de herramientas de visualización de datos de código abierto, aprendizaje automático y minería de datos¹⁸.
Dibuje la subrutina Archivo desde el menú Datos en el espacio de trabajo de la derecha y haga doble clic en ella. Cargue la hoja de cálculo haciendo clic en el icono "Carpeta" y seleccionando el archivo "ImagingFeatures.xlsx". Seleccione la hoja de trabajo "Exportar" y asigne el atributo de destino a la variable "Tumor". Asigne la función"Omitir"al número de animal (Figura 3).
Dibuje la subrutina "Clasificar" desde el menú Datos en el espacio de trabajo y conecte las subrutinas "Archivo"y "Clasificar" dibujando una línea entre ellas.
Abra la subrutina "Rango" haciendo doble clic en su icono, y seleccione el algoritmo "Ganancia de información"¹⁹.
De los cinco parámetros adquiridos, utilice los tres primeros para análisis posteriores (SUV_max,PE y AUC).
Nota: Estos parámetros reflejan la actividad metabólica (SUV_max)y la vascularización tisular (PE y AUC).

9. Análisis de ML

Abra RStudio 3.4.1¹⁷ y cargue el TrainModel.R-Script proporcionado a través del menú "Archivo".
Instale las bibliotecas necesarias (esto sólo tiene que hacerse una vez) escribiendo: install.packages(c("caret", "readxl", "pROC", "RcmdrPlugin.EZR", "ggplot2"))
Para cargar las bibliotecas necesarias y establecer la carpeta Descargas como directorio de trabajo, seleccione las líneas 3–5 dentro del script TrainModel.R.
Ejecute el código seleccionado haciendo clic en "Código" en el menú y, a continuación, en "Ejecutar líneas seleccionadas".

10. Capacitación de un algoritmo avNNet ML

Para entrenar un algoritmo avNNet, seleccione las líneas 8–39 de TrainModel.R-Script (consulte el paso 9.1).
Ejecute el código seleccionado haciendo clic en "Código" en el menú y, a continuación, en "Ejecutar líneas seleccionadas".

11. Análisis de los resultados del algoritmo de ML

Para evaluar los parámetros estándar de precisión de diagnóstico (sensibilidad, especificidad, valores predictivos positivos y negativos y relaciones de probabilidad), seleccione las líneas 41–50 de TrainModel.R-Script.
Ejecute el código seleccionado haciendo clic en "Código" en el menú y, a continuación, en "Ejecutar líneas seleccionadas".

12. Comparación de la curva de característica operativa receptora (ROC) del modelo final con las curvas ROC de sus parámetros constituyentes

Para realizar las pruebas de DeLong para comparar la curva ROC del modelo con las curvas ROC de sus parámetros constituyentes, seleccione las líneas 52–62 de TrainModel.R-Script (consulte el paso 9.1).
Ejecute el código seleccionado haciendo clic en "Código" en el menú y, a continuación, en "Ejecutar líneas seleccionadas".

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Las ratas se recuperaron rápidamente de la cirugía y la inyección de las células de cáncer de mama MDA-MB-231 y luego fueron sometidas a imágenes de RM- y PET/CT en los días 10 y 30 PI (Figura 1). En la Figura 2Ase presenta un análisis representativo de DCE de la tibia proximal derecha de una rata. Las mediciones sin procesar DCE se guardaron seleccionando el botón"Exportar"y eligiendo "DCEraw.txt" como nombre de archivo.

Los cálculos posteriores de los parámetros dinámicos, AUC, PE y el lavado se realizaron en RStudio con el script respectivo. La salida de las mediciones DCE tenía que guardarse como "DCEraw.txt" dentro de la carpeta "Descargas", de modo que el script se pudiera ejecutar directamente sin configuraciones adicionales para proporcionar una tabla de datos, como se muestra en la Figura 2B. Estos datos se copiaron en la hoja de cálculo proporcionada (Figura 2C). Del mismo modo, los parámetros DCE para el tejido muscular se determinaron y transfirieron a la hoja de cálculo (Figura 2D,E). Estos valores se normalizaron dividiendo las mediciones óseas por las mediciones musculares; esto se realizó automáticamente dentro de la hoja de cálculo. Desde el PET/CT, los valores_máximos suV calculados se transfirieron posteriormente a la tabla(Figura 2F).

En el día 30 PI, todos los animales fueron evaluados para determinar si desarrollaron metástasis o no, y la tabla se completó codificando la carga tumoral positiva como "1" y animales sanos como "0" dentro de la columna más a la derecha de la hoja de cálculo (Figura 2C).

La hoja de cálculo se importó en el kit de herramientas de visualización de datos de código abierto, aprendizaje automático y minería de datos, y la clasificación de características reveló el SUV_max,PE y AUC como las tres principales características para la predicción de la enfermedad metastásica (Figura 3). Estos parámetros reflejan la actividad metabólica (SUV_max)y la vascularización tisular (PE y AUC).

Al ejecutar el script TrainModel.R, se importa automáticamente la hoja de cálculo y se calculó un avNNet. Se determinó la combinación óptima de hiperparámetros (Figura 4A) y el modelo final se calculó utilizando la combinación óptima de hiperparámetros (Figura 4B). Posteriormente, se calculó un conjunto de parámetros de diagnóstico estándar (Figura 4C) y se trazara una curva ROC del modelo (Figura 4D).

El resultado positivo se muestra en la Figura 4B–D. Una comparación de la curva ROC del modelo con la curva ROC de sus tres componentes (es decir, AUC, PE y SUV_max)reveló que el modelo tuvo un desempeño significativamente mejor que todos sus tres componentes (p a 0,01 para AUC, p a 0,003 para PE y p a 0,007 para SUV_max). La combinación de los tres parámetros seleccionados a un avNNet era más sensible, lo que permitía la predicción de la enfermedad macroscópica con una precisión general del 85,7% (intervalo de confianza del 95% a 67,3%-96,0%). Estos resultados se obtuvieron a partir de un análisis de 28 muestras. Los intervalos de confianza se pueden reducir aún más aumentando el número de animales.

Los resultados negativos podrían obtenerse como se describe aquí. Las medidas de precisión eran muy sensibles a tipos específicos de algoritmos de aprendizaje automático y a los pasos del preprocesamiento de datos. Las redes neuronales, en particular, tendían a funcionar mejor cuando se normalizaban los datos de entrada. Esto se logró mediante la función "BoxCox" en la sección 10 del protocolo (líneas 22 y 36 dentro del TrainModel.R-Script proporcionado). Abstenerse de la normalización y utilizar un algoritmo diferente (por ejemplo, una red neuronal no promediada), cambiando el método a "nnet" (líneas 21 y 35 dentro del TrainModel.R-Script proporcionado), dio lugar a un área de 0.594 bajo la curva ROC (Figura complementaria 1). Tal modelo no superó significativamente a sus tres componentes (todos p > 0.15).

Dado que el script se ha optimizado para RStudio 3.4.1 y la versión 6.0-84 del paquete de intercalación, el uso de diferentes versiones de software podría producir resultados diferentes. La ejecución de los scripts proporcionados con las versiones de software utilizadas en este manuscrito dará resultados similares. Sin embargo, si los lectores tienen como objetivo modificar el script, agregar variables adicionales, cambiar carpetas de documentos o nombres de archivo, o modificar los algoritmos de aprendizaje automático con mayor detalle, serán necesarios los ajustes respectivos del código. Para estos casos, el manual del paquete de intercalación ofrece explicaciones detalladas²⁰.

Figura 1: Imágenes representativas de RM y PET/CT. Imágenes de RMn y PET/CT de la pata trasera derecha de un animal que no desarrolló metástasis en el transcurso del estudio (dos columnas más a la izquierda, con imágenes del día 10 y día 30 PI), y un animal que desarrolló metástasis entre el día 10 y el día 30 PI (dos columnas más a la derecha, metástasis marcadas con flechas). Observe la alta intensidad de la señal de metástasis en las imágenes T2w (fila superior), la mejora del contraste representada por el área aumentada bajo la curva (AUC; segunda fila) y el aumento del valor máximo de absorción estandarizada en el PET/CT (SUV_max; tercera fila). Tenga en cuenta que no hay diferencias visibles en las imágenes adquiridas en el día 10 PI (primera y tercera columna) entre el animal con metástasis en el día 30 PI y el animal que no desarrolló metástasis óseas. Esta cifra fue modificada de Ellmann et al.⁵. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Evaluación de las características de creación de imágenes y compilación en una hoja de cálculo. (A) La mejora del contraste dinámico de la médula ósea de la tibia proximal se analizó con un visor DICOM gratuito¹⁵ utilizando un plugin DCE¹⁶. Las mediciones respectivas se guardaron y (B) se analizaron más a fondo con el archivo DCE-Script.R proporcionado en RStudio¹⁷. (C) La salida se copió en una hoja de cálculo (consulte material suplementario para una plantilla). (D) Del mismo modo, la medición DCE se realizó para el tejido muscular adyacente, se analizó utilizando RStudio (E) y luego se copió en la hoja de cálculo. Los datos se normalizaron dividiendo los resultados de las mediciones óseas por los resultados de las mediciones musculares(C;células sombreadas por el salmón). (F) Las mediciones PET/CT se realizaron con el software del proveedor. El valor máximo de absorción estandarizado se calculó dividiendo la medida respectiva por la actividad inyectada y multiplicándola por el peso corporal del animal. El resultado se copió posteriormente en la hoja de cálculo. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Clasificación de características. La clasificación de las características de imagen adquiridas se realizó dentro de un kit de herramientas de visualización de datos de código abierto, aprendizaje automático y minería de datos¹⁸ mediante la importación de la hoja de cálculo a través de la subrutina "Archivo", y analizarla a través de la subrutina "Rank". Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Salida de RStudio representativa. El algoritmo de aprendizaje automático se desarrolló utilizando RStudio¹⁷ con el archivo TrainModel.R-Script proporcionado. (A) Una búsqueda de cuadrícula entre diferentes combinaciones de hiperparámetros para la red neuronal promediada por el modelo reveló un tamaño de tres neuronas y una decaimiento de 0.0005 como un óptimo. (B) Utilizando esta combinación de hiperparámetros, se entrenó y validó una red completa, alcanzando una precisión general del 85,7%. (C) Los parámetros estándar de precisión de diagnóstico, incluida la sensibilidad, la especificidad, los valores predictivos positivos y negativos y las relaciones de probabilidad, se calcularon a partir de una matriz de confusión. (D) Una gráfica ROC representativa del modelo validado cruzó reveló un área bajo la curva (AUC) de 0.917. Haga clic aquí para ver una versión más grande de esta figura.

Figura complementaria 1: Resultado negativo. Cambiar el algoritmo ml a una red neuronal sin promediar y abstenerse de la normalización de los parámetros de entrada llevó a una caída del área bajo la curva de la curva ROC de 0.917 (Figura 4D) a 0.594. Haga clic aquí para descargar este archivo.

Figura complementaria 2: Clasificación de características alternativas. A diferencia del método estándar descrito en la Figura 3,también se introdujo una variable aleatoria ("Al azar"; resaltada en azul), con su importancia incluida en la clasificación. Este enfoque confirmó la selección aplicada de las variables SUV_max,PE y AUC. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Los algoritmos de ML son potentes herramientas utilizadas para integrar varias características predictivas en un modelo combinado y obtener una precisión que supera la de sus componentes independientes cuando se usan solos. Sin embargo, el resultado real depende de varios pasos críticos. En primer lugar, el algoritmo de ML utilizado es un factor crucial, porque diferentes algoritmos de ML producen resultados diferentes. El algoritmo utilizado en este protocolo es un avNNet, pero otros algoritmos prometedores incluyen Extreme Gradient Boosting²¹ o Random Forests. El paquete de intercalación²⁰ para RStudio proporciona una gran cantidad de algoritmos diferentes (actualmente >175), y el protocolo propuesto es muy flexible en términos de cambiar de un algoritmo a otro simplemente cambiando líneas de código únicas (por ejemplo, cambiando el método "avNNet" al método "rf") y adaptando los ajustes de TunedGrid al algoritmo de ML respectivo. Para obtener más información, consulte el repositorio de github de caret²². Fernández-Delgado et al.²³ publicó una excelente visión general de los diferentes algoritmos y su rendimiento con respecto a los diferentes problemas de clasificación, que podría servir como punto de partida para otros experimentos.

Otro factor crucial es la elección de características relevantes para incluir en un algoritmo de ML. Este protocolo propone el uso del método de filtro, "Ganancia de información"¹⁹, para clasificar las características disponibles en orden descendente y utilizar las más relevantes para entrenar la avNNet. Los métodos de filtro se basan únicamente en supuestos generales, como la correlación con la variable para predecir, por lo que los investigadores deben preseleccionar entidades independientemente del clasificador utilizado²⁴^,²⁵. Estos métodos son particularmente eficaces en el tiempo de cálculo y robustos para el sobreajuste. Sin embargo, el usuario define el límite que separa las características relevantes de las irrelevantes, por lo que es algo arbitrario. Para el protocolo propuesto, se utilizaron las características con la ganancia de información superior del 75%, correspondientes a SUV_max,PE y AUC. Esta selección, sin embargo, se puede fortalecer sistemáticamente mediante la inclusión de una variable aleatoria que no tiene ninguna relación con el objetivo, calculando su ganancia de información y luego comparándola con la ganancia de información de las características reales ( Figuracomplementaria 2). Este enfoque ligeramente más sofisticado confirmó además la elección de las tres características antes mencionadas como las más relevantes. No obstante, existen varios métodos de filtro diferentes, junto con otros enfoques que seleccionan entidades con respecto a un algoritmo clasificador determinado, como la extracción de entidades y los métodos de contenedor. Diferentes enfoques de selección de características pueden producir resultados diferentes.

Para garantizar la generalización del algoritmo de ML y evitar aún más el sobreajuste, el protocolo propuesto aplica la validación cruzada de la salida (LOOCV). El mejor enfoque, sin embargo, sería quitar aleatoriamente un subconjunto de todo el conjunto de datos y tratarlo como un conjunto de pruebas. A continuación, el algoritmo de ML se entrena en el resto de los datos (es decir, el conjunto de entrenamiento) para predecir posteriormente el resultado del conjunto de pruebas. Sin embargo, este enfoque necesita un conjunto de datos suficientemente grande. Para tamaños de muestra más pequeños, la aplicación de LOOCV es común porque proporciona una estimación casi imparcial de la verdadera capacidad de generalización de un modelo²⁶. En LOOCV, el primer punto de datos se quita del conjunto de datos y avNNet se entrena con los datos retenidos. A continuación, se predice y guarda el resultado del punto de datos retenido anteriormente. Este proceso se repite para todos los puntos de datos, de modo que, finalmente, cada resultado se predice con datos que no se utilizaron para entrenar el algoritmo. Otros enfoques de validación incluyen validaciones cruzadas de x-fold (más comúnmente 10 veces) y se pueden aplicar fácilmente cambiando el parámetro trainControl respectivo dentro del código a method "CV".

Desde un punto de vista cuantitativo, las imágenes médicas se evalúan típicamente de una manera muy básica, confiando en gran medida en mediciones de tamaño y forma de lesiones potencialmente sospechosas o áreas^27,^,²⁸. Sin embargo, la ventaja del estándar Digital Imaging and Communications in Medicine (DICOM) es que permite la extracción de muchas características, conocidas como radiomómicas. El término "radiomics" se definió inicialmente como la extracción de alto rendimiento de grandes cantidades de características de imagen²⁹, pero posteriormente se amplió para incluir la conversión de imágenes a datos de mayor dimensión³⁰. Sin embargo, los datos dimensionales más altos se utilizan principalmente para identificar correlaciones en lugar de causas^30. Las características descritas en este protocolo se encuentran entre las características radiológicas clásicas, como el tamaño y la forma, y la radiomética, ya que se asemejan a parámetros generalmente aceptados de vascularización y actividad metabólica. Esto ofrece una posible relación causal con la microinvasión de las células tumorales diseminadas. Si el usuario lo desea, se puede realizar una extracción de las características radioémicas con diferentes paquetes de software³¹.

El protocolo proporcionado no se limita a un número finito de características. Por lo tanto, se puede utilizar con grandes conjuntos de datos radiomics. Sin embargo, el tema antes mencionado de la selección de características se vuelve cada vez más importante con el aumento de los conjuntos de datos. El protocolo presentado también se puede transferir a diferentes entornos de estudio, por ejemplo, desde los campos de oncología, infección o inflamación³².

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no declaran ningún conflicto de intereses. Los financiadores no tuvieron ningún papel en el diseño del estudio; en la recopilación, análisis o interpretación de datos; en la escritura del manuscrito, o en la decisión de publicar los resultados.

Acknowledgments

Este trabajo fue apoyado por la Fundación Alemana de Investigación (DFG, Centro de Investigación Colaborativa CRC 1181, subproyecto Z02; Programa prioritario, proyectos BA 4027/10-1 y BO 3811), incluyendo soporte adicional para los dispositivos de escaneo (INST 410/77-1 FUGG e INST 410/93-1 FUGG), y por la Iniciativa de Campos Emergentes (EFI) "Big Thera" de la Friedrich-Alexander-University Erlangen-N-rnberg.

Materials

Name	Company	Catalog Number	Comments
Binocular Operating Microscope	Leica	NA
ClinScan MR System	Bruker	NA
DICOM Viewer	Horos	NA	www.horosproject.org
Excel: Spreadsheet	Microsoft	NA
FCS	Sigma	F2442-500ML
Gadovist	Bayer-Schering	NA
Inveon PET/CT	Siemens	NA
Inveon Research Workplace Software	Siemens Healthcare GmbH	NA
IVIS Spectrum	PerkinElmer	NA
MDA-MB-231 human breast cancer cells	American Type Culture Collection	N/A
Open-source data visualization, machine learning and data mining toolkit.	Orange3, University of Ljubljana	NA	https://orange.biolab.si/
RPMI-1640	Invitrogen/ThermoFisher	11875093
Trypsin	Sigma	9002-07-7
Vevo 3100	VisualSonics	NA

DOWNLOAD MATERIALS LIST

References

D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).

Cancer Research

Algoritmos de aprendizaje automático para la detección temprana de metástasis óseas en un modelo experimental de rata

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.