Cancer Research

Algoritmos de aprendizagem de máquina para detecção precoce de metástases ósseas em um modelo experimental de ratos

Published: August 16, 2020 doi: 10.3791/61235

Stephan Ellmann¹, Lisa Seyler¹, Clarissa Gillmann², Vanessa Popp¹, Christoph Treutlein¹, Aline Bozec³, Michael Uder¹, Tobias Bäuerle¹

¹Department of Radiology, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg, ²Department of Medical Physics in Radiation Oncology, German Cancer Research Center, ³Department of Internal Medicine 3, University Hospital Erlangen, Friedrich-Alexander Universität Erlangen-Nürnberg

Summary

Este protocolo foi projetado para treinar um algoritmo de aprendizagem de máquina para usar uma combinação de parâmetros de imagem derivados de ressonância magnética (MrI) e tomografia/tomografia computadorizada de emissão de pósitrons (PET/CT) em um modelo de rato de metástases ósseas de câncer de mama para detectar doenças metastáticas precoces e prever a progressão subsequente para macrometastases.

Abstract

Algoritmos de aprendizagem de máquina (ML) permitem a integração de diferentes características em um modelo para realizar tarefas de classificação ou regressão com uma precisão superior aos seus constituintes. Este protocolo descreve o desenvolvimento de um algoritmo ML para prever o crescimento das macrometastases ósseas do câncer de mama em um modelo de rato antes que quaisquer anormalidades sejam observáveis com métodos de imagem padrão. Tal algoritmo pode facilitar a detecção de doenças metastáticas precoces (ou seja, micrometastase) que é regularmente perdida durante os exames de estadiamento.

O modelo de metástase aplicada é específico do local, o que significa que os ratos desenvolvem metástases exclusivamente em sua perna traseira direita. A taxa de captação de tumores do modelo é de 60%-80%, com macrometastases se tornando visíveis em ressonância magnética (RM) e tomografia/tomografia computadorizada de emissão de pósitrons (PET/TC) em um subconjunto de animais 30 dias após a indução, enquanto um segundo subconjunto de animais não apresenta crescimento tumoral.

A partir de exames de imagem adquiridos em um momento anterior, este protocolo descreve a extração de características que indicam vascularização tecidual detectada pela Ressonância Magnética, metabolismo de glicose por PET/CT, e a subsequente determinação das características mais relevantes para a previsão da doença macrometastática. Essas características são então alimentadas em uma rede neural mediana de modelos (avNNet) para classificar os animais em um dos dois grupos: um que desenvolverá metástases e outro que não desenvolverá tumores. O protocolo também descreve o cálculo dos parâmetros de diagnóstico padrão, como precisão geral, sensibilidade, especificidade, valores preditivos negativos/positivos, razões de probabilidade e o desenvolvimento de uma característica operacional receptora. Uma vantagem do protocolo proposto é sua flexibilidade, pois ele pode ser facilmente adaptado para treinar uma infinidade de diferentes algoritmos ML com combinações ajustáveis de um número ilimitado de recursos. Além disso, pode ser usado para analisar diferentes problemas em oncologia, infecção e inflamação.

Introduction

O objetivo deste protocolo é integrar vários parâmetros de imagem funcional da Ressonância Magnética e PET/CT em um algoritmo ML de rede neural mediana de modelo (avNNet). Este algoritmo prevê o crescimento de macrometastases em um modelo de rato de metástases ósseas de câncer de mama em um ponto de tempo inicial, quando as alterações macroscópicas dentro do osso ainda não são visíveis.

Antes do crescimento das macrometastases, ocorre uma invasão de medula óssea de células tumorais disseminadas, comumente referida como doença micrometastática¹^,². Esta invasão inicial pode ser considerada um passo inicial na doença metastática, mas é tipicamente perdida durante os exames convencionais³^,⁴. Embora as modalidades de imagem disponíveis atualmente não possam detectar a microinvasão da medula óssea quando utilizadas sozinhas, uma combinação de parâmetros de imagem que produzem informações sobre vascularização e atividade metabólica tem sido demonstrada para ter melhor desempenho⁵. Esse benefício complementar é obtido combinando diferentes parâmetros de imagem em um avNNet, que é um algoritmo ML. Tal avNNet permite a previsão confiável da formação de macrometastases ósseas antes que quaisquer metástases visíveis estejam presentes. Portanto, a integração de biomarcadores de imagem em um avNNet poderia servir como parâmetro substituto para microinvasão de medula óssea e doença metastática precoce.

Para desenvolver o protocolo, foi utilizado um modelo previamente descrito de metástases ósseas de câncer de mama em ratos nus^6,^,⁷^,⁸. A vantagem deste modelo é sua especificidade do local, o que significa que os animais desenvolvem metástases ósseas exclusivamente em sua perna traseira direita. No entanto, a taxa de tomada de tumores dessa abordagem é de 60%-80%, de modo que um número considerável de animais não desenvolve metástases durante o estudo. Utilizando modalidades de imagem como ressonância magnética e PET/CT, a presença de metástases é detectável a partir do dia 30 de pós-injeção (PI). Em momentos anteriores (por exemplo, 10 PI) a imagem não distingue entre animais que desenvolverão doença metastática e aqueles que não irão(Figura 1).

Um avNNet treinado em parâmetros funcionais de imagem adquiridos no dia 10 PI, conforme descrito no protocolo a seguir, prevê ou exclui de forma confiável o crescimento das macrometastases nas próximas ~3 semanas. Redes Neurais combinam nódulos artificiais em diferentes camadas. No protocolo do estudo, os parâmetros de imagem funcional para o fornecimento de sangue de medula óssea e a atividade metabólica representam a camada inferior, enquanto a previsão de malignidade representa a camada superior. Uma camada intermediária adicional contém nós ocultos que estão conectados tanto à camada superior quanto à inferior. A força das conexões entre os diferentes nós é atualizada durante o treinamento da rede para realizar a respectiva tarefa de classificação com alta precisão⁹. A precisão de tal rede neural pode ser aumentada ainda mais pela média das saídas de vários modelos, resultando em um avNNet¹⁰.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Todos os cuidados e procedimentos experimentais foram realizados de acordo com a legislação nacional e regional sobre proteção animal, e todos os procedimentos animais foram aprovados pelo Governo do Estado da Francônia, Alemanha (número de referência 55.2 DMS-2532-2-228).

1. Indução de metástases ósseas de câncer de mama na perna traseira direita de ratos nus

NOTA: Uma descrição detalhada da indução de metástases ósseas de câncer de mama em ratos nus foi publicada em outros lugares⁶^,⁸. As etapas mais relevantes são apresentadas abaixo.

Cultura MDA-MB-231 células cancerígenas de mama humanas em RPMI-1640, suplementadas com soro de bezerro fetal de 10%. Mantenha as células em condições padrão (37 °C, 5% CO₂) e passagem as células 2-3 vezes por semana.
Lave células MDA-MB-231 quase confluentes com 2 mM EDTA em soro fisiológico tamponado com fosfato (PBS) e, em seguida, desprende as células com 0,25% de trippsina. Determine a concentração celular com a câmara de neubauer e resuspensá-las em 200 μL de RPMI-1640 a uma concentração de 1,5 x 10⁵ células/200 μL.
Use ratos nus de 6 a 8 semanas e mantenha-os sob condições controladas e livres de patógenos (21 °C ± temperatura ambiente de 2 °C, 60% umidade e 12 h de ritmo claro-escuro). Ofereça alimentação autoclavada e ad libitum de água.
Antes de realizar a cirurgia, injete uma droga analgésica (por exemplo, Carprofen 4 mg/kg) subcutânea. Anestesize ratos com isoflurane (1-1,5 vol. %) /mistura de oxigênio a uma vazão de 2 L/min. Verifique a profundidade anestésico por beliscar o dedo do dedo do dedo.
Para cirurgia, use um microscópio operacional com uma ampliação de 16x.
Realize um corte de 2 a 3 cm na região inguinal direita do rato. Dissecar todas as artérias da região inguinal direita, incluindo a artéria femoral (FA), a artéria epigástrica superficial (SEA), a artéria gênica descendente (DGA), a artéria popliteal (PA) e a artéria safena (SA). Coloque dois clipes removíveis na FA: um proximal para o início do MAR, e outro diretamente proximal para o início da DGA.
Ligate a porção distal do MAR. Realize um corte da parede do MAR e insira uma agulha de 0,3 mm de diâmetro no MAR. Conecte uma seringa contendo a suspensão da célula da etapa 1.2 à agulha. Remova o clipe distal da FA e corte o SA em vez disso.
Injete lentamente a suspensão da célula MDA-MB-231 a partir da etapa 1.2 (1,5 x 10⁵ células/200 μL) no MAR. Retire a agulha, liga o MAR e remova os clipes da artéria. Feche a ferida usando clipes cirúrgicos e termine anestesia. Monitore os animais diariamente para avaliar o tamanho do tumor e qualquer evidência de dor.

2. Ressonância magnética (RM)

NOTA: Para obter uma descrição detalhada dos procedimentos de ressonância magnética, consulte Bäuerle et al.¹¹.

Realize a ressonância magnética 10 dias pi usando um scanner experimental dedicado (ver Tabela de Materiais) ou um sistema de Ressonância Magnética humano com uma bobina animal apropriada.
Anestesiar o rato com isoflurane (1-1,5 vol. %) /mistura de oxigênio como descrito acima. Coloque um cateter na veia da cauda do rato e coloque-o na cauda. Conecte uma seringa contendo o agente de contraste (0,1 mmol/kg Gd-DTPA em aproximadamente 0,5 mL).
Coloque o rato anestesiado no sistema MR. Localize o fêmur distal e a tíbia proximal da perna traseira direita em uma sequência anatômica (por exemplo, sequência de eco de giro turbo ponderada t2; TR = 8.654 ms; TE = 37 ms; matriz 320 x 272; FOV = 65 mm x 55 mm; espessura da fatia = 1 mm; hora do exame 11:24 min).
Determine as fatias que cobrem o fêmur distal e a tíbia proximal da perna traseira direita e inicie a sequência DCE-MRI (por exemplo, sequência rápida de tiro de ângulo baixo; TR = 3,9 ms; TE = 0,88 ms; matriz = 256 x 216; FOV = 65 x 54 mm²; espessura da fatia = 1 mm; 8 fatias; 100 pontos de tempo; tempo de varredura = 8:25 min). Depois dos 30, comece a injetar o agente de contraste durante um período de 10 s.
NOTA: O tempo total para realizar um exame de ressonância magnética é de aproximadamente 20 minutos por animal.

3. Tomografia de emissão de pósitrons/tomografia computadorizada (PET/CT)

NOTA: Para obter uma descrição detalhada dos procedimentos PET, consulte Cheng em al.¹².

Realize imagens PET/CT 10 dias PI utilizando um scanner experimental dedicado (ver Tabela de Materiais).
Mantenha os animais em jejum antes da imagem. Anestesiar o rato conforme descrito na etapa 2.2 e inserir um cateter na veia da cauda como descrito acima.
Injete 6 MBq de ¹⁸F-Fluorodeoxyglucose⁽¹⁸F-FDG) na veia traseira e espere ~30 min para permitir que o rastreador distribua corretamente.
Realizar uma aquisição de tomografia computadorizada (tensão do tubo = 80 kV, corrente do tubo = 500 μA, resolução isotrópica = 48,9 μm, duração = 10 min).
Realizar uma aquisição estática de PET (nível discriminatório inferior/superior = 350/650 keV; janela de tempo = 3.438 ns; duração = 15 min).

4. Estratégias alternativas de imagem

Para uma avaliação precoce das células MDA-MB-231 na perna traseira, inoculação 1,5 x 10⁵ células rotuladas /200 μL para bioluminescência (ou seja, células expressando luciferina, MDA-MB-231-LUC¹³) ou imagem de fluorescência (ou seja, células expressando proteína fluorescente verde ou vermelha, MDA-MB-231-GFP/RFP¹³). Use o sistema para imagens ópticas pré-clínicas para detectar células intraósseas MDA-MB-231 após a inoculação de células tumorais¹⁴.
Realize ultrassom experimental utilizando um scanner dedicado após injeção intravenosa de microbolhas para derivar parâmetros morfológicos e funcionais de vascularização comparáveis à ressonância magnética⁷.

5. Análise de ressonância magnética

Use um visualizador DICOM¹⁵ com um Plugin^{DCE 16} e carregue a sequência DCE no modo 4D clicando no botão "Importação" no menu superior, selecionando a pasta DICOM contendo as imagens MR da etapa 2.4 e clicando em "4D Viewer" no menu superior.
Coloque uma região circular bidimensional de interesse (ROI), com um tamanho alvo de 1,5 mm², na medula óssea do eixo tibial proximal da perna traseira direita, de preferência usando números de imagem 4 ou 5 da sequência composta por 8 imagens, pois essas imagens centrais fornecem resultados mais estáveis.
Inicie o plugin DCE do menu superior, selecione "Relative Enhancement" no campo "Plot Type" e defina a faixa de linha de base dos pontos de tempo 1 a 5 digitando esses números nos respectivos campos. Exporte a análise como um arquivo .txt com o respectivo botão e escolha "DCEraw.txt" como o nome do arquivo.
Abra o RStudio¹⁷ e carregue o arquivo DCE-Script.R fornecido através do menu "Arquivo" selecionando "Arquivo Aberto". Execute todo o script selecionando "Code", depois "Run Region" e, em seguida, "Run All" do menu. Copie a saída para o arquivo de modelo fornecido chamado "ImagingFeatures.xlsx"(Figura 2).
No visualizador DICOM, coloque um segundo ROI dentro do músculo traseiro do animal e repita as etapas 5.2-5.4 para obter as medidas de DCE muscular para fins de normalização. Dentro da planilha "ImagingFeatures.xlsx", as respectivas medidas ósseas são automaticamente divididas pelas respectivas medidas musculares para fins de normalização.
Repita as etapas 5.1-5.5 para todos os animais e complete a planilha.

6. Análise PET/CT

Abra o software de análise PET/CT e importe os dados obtidos na etapa 3 clicando em "Arquivo", seguido de "importação manual". Marque os arquivos ct.img.hd e pet.img.hdr. Clique em "Abrir" e selecione "Importar tudo".
Abra os conjuntos de dados selecionando "Análise geral", seguido de "OK".
Selecione "Quantificação de ROI", seguido de "Criar", e, em seguida, "Criar um ROI a partir de um modelo". Coloque um ROI bidimensional de aproximadamente 4 mm x 6 mm na medula óssea do eixo tibial proximal da perna traseira direita.
Selecione "ROIs (Sobreposição do Alvo 1)" e anote valores médios, mínimos e máximos em Bq/mL.
Calcule o valor máximo padronizado de absorção (SUV_max):Divida o valor máximo (Bq/mL) pela atividade injetada e multiplique o resultado pelo peso do animal em gramas. Digite o resultado na planilha(Figura 2).

7. Determinando a taxa de tomar tumores

Para diagnosticar o crescimento do tumor na perna traseira direita, repita a ressonância magnética e a imagem pet/ct no dia 30 PI, conforme descrito acima.
NOTA: Os tumores serão claramente visíveis no dia 30 PI e apresentam lesões T2w-hiperintense e aprimoramento claro do contraste na ressonância magnética, juntamente com um SUV_max claramente elevado em PET/CT. De acordo com experimentos anteriores, 60% a 80% dos animais desenvolverão metástases na perna traseira direita.
Complete a planilha adicionando uma coluna adicional "Tumor" e digite "1" para cada animal que apresente metástases, e "0" para cada animal sem carga tumoral visível(Figura 2). Salve a planilha como "ImagingFeatures.xlsx" na pasta Downloads.

8. Seleção de recursos

Para determinar os recursos mais relevantes para a previsão do crescimento futuro do tumor, importe a planilha em um kit de visualização de dados de código aberto, machine learning e data mining kit¹⁸.
Desenhe a subrotina de arquivo do menu Data para o espaço de trabalho à direita e clique duas vezes nela. Carregue a planilha clicando no ícone "Pasta" e selecionando o arquivo "ImagingFeatures.xlsx". Selecione a planilha "Exportar" e atribua o atributo-alvo à variável "Tumor". Atribua a função "Skip" ao número do animal(Figura 3).
Desenhe a subrotina "Rank" do menu Data para o espaço de trabalho e conecte as subrotinas "File" e "Rank" desenhando uma linha entre eles.
Abra a subrotina "Rank" clicando duas vezes em seu ícone e selecione o algoritmo "Information Gain"¹⁹.
Dos cinco parâmetros adquiridos, utilize os três primeiros para análises adicionais (SUV_max, PE e AUC).
Nota: Esses parâmetros refletem a atividade metabólica (SUV_max)e a vascularização tecidual (PE e AUC).

9. Análise ml

Abra o RStudio 3.4.1¹⁷ e carregue o TrainModel.R-Script fornecido através do menu "Arquivo".
Instale as bibliotecas necessárias (isso só tem que ser feito uma vez) digitando: install.packages(c("caret", "readxl", "pROC", "RcmdrPlugin.EZR", "ggplot2"))
Para carregar as bibliotecas necessárias e definir a pasta Downloads como o diretório de trabalho, selecione as linhas 3-5 dentro do Script TrainModel.R.
Execute o código selecionado clicando em "Código" dentro do menu e, em seguida, "Executar linhas selecionadas".

10. Treinamento de um algoritmo avNNet ML

Para treinar um algoritmo avNNet, selecione as linhas 8-39 do TrainModel.R-Script (ver passo 9.1).
Execute o código selecionado clicando em "Código" dentro do menu e, em seguida, "Executar linhas selecionadas".

11. Analisando os resultados do algoritmo ML

Para avaliar os parâmetros padrão de precisão diagnóstica (sensibilidade, especificidade, valores preditivos positivos e negativos e razões de probabilidade), selecione as linhas 41-50 do TrainModel.R-Script.
Execute o código selecionado clicando em "Código" dentro do menu e, em seguida, "Executar linhas selecionadas".

12. Comparando a curva característica operacional receptora (ROC) do modelo final com as curvas ROC de seus parâmetros constituintes

Para realizar os testes de DeLong para comparar a curva ROC do modelo com as curvas ROC de seus parâmetros constituintes, selecione as linhas 52-62 do TrainModel.R-Script (ver passo 9.1).
Execute o código selecionado clicando em "Código" dentro do menu e, em seguida, "Executar linhas selecionadas".

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Os ratos se recuperaram rapidamente da cirurgia e injeção das células cancerígenas de mama MDA-MB-231 e foram então submetidos a imagens mr-e PET/CT nos dias 10 e 30 PI(Figura 1). Uma análise representativa do DCE da tíbia proximal direita de um rato é apresentada na Figura 2A. As medidas brutas DCE foram salvas selecionando o botão "Exportar" e escolhendo "DCEraw.txt" como o nome do arquivo.

Os cálculos subsequentes dos parâmetros dinâmicos, AUC, PE e washout foram realizados no RStudio com o respectivo script. A saída das medições de DCE teve que ser salva como "DCEraw.txt" dentro da pasta "Downloads", para que o script pudesse ser executado diretamente sem configurações adicionais para fornecer uma tabela de dados, como descrito na Figura 2B. Esses dados foram copiados para a planilha fornecida (Figura 2C). Da mesma forma, os parâmetros de DCE para tecido muscular foram determinados e transferidos para a planilha (Figura 2D,E). Esses valores foram normalizados dividindo as medidas ósseas pelas medidas musculares; isso foi realizado automaticamente dentro da planilha. A partir do PET/CT, os valores_máximos calculados do SUV foram posteriormente transferidos para a tabela (Figura 2F).

No dia 30 PI, todos os animais foram avaliados para determinar se desenvolveram ou não metástases, e a tabela foi completada codificando a carga tumoral positiva como "1" e animais saudáveis como "0" dentro da coluna mais correta da planilha (Figura 2C).

A planilha foi importada para a visualização de dados de código aberto, aprendizado de máquina e kit de ferramentas de mineração de dados, e o ranking de recursos revelou o SUV_max,PE e AUC como os três principais recursos para a previsão de doença metastática(Figura 3). Esses parâmetros refletem a atividade metabólica (SUV_max)e a vascularização tecidual (PE e AUC).

Executando o Script TrainModel.R importou automaticamente a planilha e calculou um avNNet. A combinação ideal de hiperparômetro foi determinada(Figura 4A) e o modelo final foi então calculado utilizando-se a combinação ideal de hiperparômetro(Figura 4B). Posteriormente, calculou-se um conjunto de parâmetros de diagnóstico padrão(Figura 4C) e uma curva ROC do modelo(Figura 4D).

O resultado positivo é mostrado na Figura 4B–D. Uma comparação da curva ROC do modelo com a curva ROC de seus três constituintes (ou seja, AUC, PE e SUV_max) revelou que o modelo teve um desempenho significativamente melhor que todos os seus três constituintes (p = 0,01 para AUC, p = 0,003 para PE e p = 0,007 para SUV_max). A combinação dos três parâmetros selecionados com um avNNet foi mais sensível, permitindo assim a previsão de doença macroscópica com uma precisão global de 85,7% (intervalo de confiança de 95% = 67,3%-96,0%). Esses resultados foram obtidos a partir de uma análise de 28 amostras. Os intervalos de confiança podem ser ainda mais reduzidos aumentando o número de animais.

Os resultados negativos podem ser obtidos conforme descrito aqui. As medidas de precisão foram altamente sensíveis a tipos específicos de algoritmos de aprendizagem de máquina e a etapas de pré-processamento de dados. As Redes Neurais, em particular, tendiam a ter melhor desempenho quando os dados de entrada eram normalizados. Isso foi conseguido pela função "BoxCox" na seção 10 do protocolo (linhas 22 e 36 dentro do TrainModel.R-Script fornecido). Abster-se da normalização e do uso de um algoritmo diferente (por exemplo, uma rede neural não mediada), alterando o método para "nnet" (linhas 21 e 35 dentro do TrainModel.R-Script fornecido), resultou em uma área de 0,594 sob a curva ROC(Figura Suplementar 1). Tal modelo não conseguiu superar significativamente seus três constituintes (todos p > 0,15).

Como o script foi otimizado para o RStudio 3.4.1 e a versão 6.0-84 do pacote caret, usando diferentes versões de software pode produzir resultados diferentes. Executar os scripts fornecidos com as versões de software usadas neste manuscrito dará resultados semelhantes. No entanto, se os leitores pretendem modificar o script, adicionar variáveis adicionais, alterar pastas de documentos ou nomes de arquivos ou modificar os algoritmos de aprendizado de máquina com mais detalhes, serão necessários os respectivos ajustes do código. Para esses casos, o manual do pacote caret oferece explicações aprofundadas²⁰.

Figura 1: Representante mr e pet/ct imagens. Imagens de MR e PET/CT da perna traseira direita de um animal que não desenvolveu metástases ao longo do estudo (duas colunas mais à esquerda, com imagens do dia 10 e dia 30 PI), e um animal que desenvolveu metástases entre o dia 10 e o dia 30 PI (duas colunas mais à direita, metástases marcadas com flechas). Observe a alta intensidade do sinal das metástases nas imagens T2w (linha superior), o aprimoramento do contraste representado pela área aumentada sob a curva (AUC; segunda linha) e o aumento do valor máximo de absorção padronizado no PET/CT (SUV_max; terceira linha). Note-se que não há diferenças visíveis nas imagens adquiridas no dia 10 PI (primeira e terceira coluna) entre o animal com metástases no dia 30 PI e o animal que não desenvolveu metástases ósseas. Este valor foi modificado a partir de Ellmann et al.⁵. Clique aqui para ver uma versão maior desta figura.

Figura 2: Avaliação dos recursos de imagem e compilação em uma planilha. (A) O aprimoramento dinâmico do contraste da medula óssea da tíbia proximal foi analisado com um visualizador DICOM^{freeware 15} utilizando um plugin DCE¹⁶. As respectivas medidas foram salvas e (B)posteriormente analisadas com o arquivo DCE-Script.R fornecido no RStudio¹⁷. (C) A saída foi copiada em uma planilha (ver material suplementar para um modelo). (D) Da mesma forma, a medição do DCE foi realizada para tecido muscular adjacente, analisada por meio de RStudio(E),e depois copiada para a planilha. Os dados foram normalizados dividindo os resultados das medidas ósseas pelos resultados das medidas musculares (C; células sombreadas de salmão). (F) As medições PET/CT foram realizadas com o software do fornecedor. O valor máximo de absorção padronizado foi calculado dividindo a respectiva medição pela atividade injetada e multiplicando-a pelo peso corporal do animal. O resultado foi posteriormente copiado na planilha. Clique aqui para ver uma versão maior desta figura.

Figura 3: Ranking de características. O ranking dos recursos de imagem adquiridos foi realizado dentro de um kit de ferramentas de visualização de dados de código aberto, machine learning e data^{miningkit 18,} importando a planilha através da subrotina "File" e analisando-a através da subrotina "Rank". Clique aqui para ver uma versão maior desta figura.

Figura 4: Saída RStudio representativa. O algoritmo de aprendizado de máquina foi desenvolvido usando o RStudio¹⁷ com o arquivo TrainModel.R-Script fornecido. (A) Uma pesquisa de grade entre diferentes combinações de hiperparâmetros para a rede neural mediana do modelo revelou um tamanho de três neurônios e uma decadência de 0,0005 como um ótimo. (B) Utilizando esta combinação de hiperparômetro, uma rede completa foi treinada e validada cruzadamente, atingindo uma precisão global de 85,7%. (C) Os parâmetros padrão de precisão diagnóstica, incluindo sensibilidade, especificidade, valores preditivos positivos e negativos e razões de probabilidade, foram calculados a partir de uma matriz de confusão. (D) Um gráfico roc representativo do modelo cruzado revelou uma área sob a curva (AUC) de 0,917. Clique aqui para ver uma versão maior desta figura.

Figura suplementar 1: Resultado negativo. A alteração do algoritmo ML para uma Rede Neural sem a média e abstenção da normalização dos parâmetros de entrada levou a uma queda da área sob a curva roc de 0,917 (Figura 4D) para 0,594. Clique aqui para baixar este arquivo.

Figura suplementar 2: Classificação de recursos alternativos. Em contraste com o método padrão retratado na Figura 3,também foi introduzida uma variável aleatória ("Aleatória"; destacada em azul), com sua importância incluída no ranking. Esta abordagem confirmou a seleção aplicada das variáveis SUV_max,PE e AUC. Clique aqui para baixar este arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Algoritmos ML são ferramentas poderosas usadas para integrar vários recursos preditivos em um modelo combinado e obter uma precisão que excede a de seus constituintes separados quando usados sozinhos. No entanto, o resultado real depende de várias etapas críticas. Primeiro, o algoritmo ML usado é um fator crucial, porque diferentes algoritmos ML produzem resultados diferentes. O algoritmo usado neste protocolo é um avNNet, mas outros algoritmos promissores incluem Extreme Gradient Boosting²¹ ou Random Forests. O pacote caret²⁰ para RStudio fornece uma infinidade de algoritmos diferentes (atualmente >175), e o protocolo proposto é altamente flexível em termos de mudança de um algoritmo para outro, simplesmente mudando linhas únicas de código (por exemplo, mudando o método = "avNNet" para método ="rf") e adaptando as configurações do Grid para o respectivo algoritmo ML. Para obter detalhes, consulte o repositório caret github²². Uma excelente visão geral de diferentes algoritmos e seu desempenho em relação a diferentes problemas de classificação foi publicada por Fernández-Delgado et al.²³ e poderia servir de ponto de partida para outros experimentos.

Outro fator crucial é a escolha de recursos relevantes para incluir em um algoritmo ML. Este protocolo propõe o uso do método de filtro, "Information Gain"¹⁹, para classificar os recursos disponíveis em ordem decrescente e usar os mais relevantes para treinar o avNNet. Os métodos de filtro baseiam-se apenas em premissas gerais, como correlação com a variável a prever, de modo que os pesquisadores devem pré-selecionar características independentemente do classificador utilizado²⁴^,²⁵. Tais métodos são particularmente eficazes no tempo de computação e robustos para a superequiptação. No entanto, o corte que separa relevante de recursos irrelevantes é definido pelo usuário, tornando-o um pouco arbitrário. Para o protocolo proposto, foram utilizados os recursos com o maior ganho de informação de 75%, correspondente ao SUV_max,PE e AUC. Essa seleção, no entanto, pode ser sistematicamente fortalecida por incluir uma variável aleatória que não tem relação com o alvo, calcular seu ganho de informação e, em seguida, compará-la com o ganho de informações das características reais ( FiguraSuplementar 2). Esta abordagem um pouco mais sofisticada confirmou também a escolha das três características acima mencionadas como sendo a mais relevante. No entanto, existem vários métodos diferentes de filtro, juntamente com outras abordagens que selecionam recursos em relação a um algoritmo de classificação específico, como métodos de extração de recursos e invólucro. Diferentes abordagens de seleção de recursos podem produzir resultados diferentes.

Para garantir a generalização do algoritmo ML e evitar ainda mais o excesso de adequação, o protocolo proposto aplica a validação cruzada (LOOCV). A melhor abordagem, no entanto, seria remover aleatoriamente um subconjunto de todo o conjunto de dados e tratá-lo como um conjunto de testes. O algoritmo ML é então treinado no restante dos dados (ou seja, o conjunto de treinamento) para prever posteriormente o resultado do conjunto de testes. No entanto, essa abordagem precisa de um conjunto de dados suficientemente grande. Para tamanhos amostrais menores, a aplicação de LOOCV é comum porque fornece uma estimativa quase imparcial da verdadeira capacidade de generalização de um modelo²⁶. No LOOCV, o primeiro ponto de dados é removido do conjunto de dados e o avNNet é treinado com os dados retidos. Em seguida, o resultado do ponto de dados anteriormente retido é previsto e salvo. Esse processo é repetido para todos os pontos de dados, de modo que finalmente cada resultado é previsto com dados que não foram usados para o treinamento do algoritmo. Outras abordagens de validação incluem validações cruzadas x-fold (mais comumente 10 vezes) e podem ser facilmente aplicadas alterando o respectivo parâmetro trainControl dentro do código para method="CV".

Do ponto de vista quantitativo, as imagens médicas são tipicamente avaliadas de forma muito básica, em grande parte contando com medidas de tamanho e forma de lesões ou áreas potencialmente suspeitas^27,^,²⁸. No entanto, a vantagem do padrão De Imagem Digital e Comunicações em Medicina (DICOM) é que permite a extração de muitos recursos, chamados de radiomics. O termo "radiomics" foi inicialmente definido como a extração de alto rendimento de grandes quantidades de características de imagem²⁹, mas foi posteriormente estendido para incluir a conversão de imagens para dados dimensionais mais elevados³⁰. No entanto, os dados dimensionais mais elevados são usados principalmente para identificar correlações em vez de causas³⁰. As características descritas neste protocolo estão entre características radiológicas clássicas, como tamanho e forma, e radiomics, pois se assemelham a parâmetros geralmente aceitos de vascularização e atividade metabólica. Isso oferece uma potencial relação causal com a microinvasão das células tumorais disseminadas. Se desejar pelo usuário, uma extração de recursos radiomímicos pode ser realizada com diferentes pacotes de software³¹.

O protocolo fornecido não se restringe a um número finito de recursos. Assim, ele pode ser usado com grandes conjuntos de dados de radiomics. No entanto, a questão acima mencionada da seleção de recursos torna-se cada vez mais importante com os conjuntos de dados crescentes. O protocolo apresentado também pode ser transferido para diferentes configurações de estudo, por exemplo, dos campos da oncologia, infecção ou inflamação³².

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não declaram conflito de interesses. Os financiadores não tiveram papel na concepção do estudo; na coleta, análises ou interpretação dos dados; na redação do manuscrito, ou na decisão de publicar os resultados.

Acknowledgments

Este trabalho foi apoiado pela Fundação Alemã de Pesquisa (DFG, Centro de Pesquisa Colaborativa CRC 1181, subprojeto Z02; Programa Prioritário μBone, projetos BA 4027/10-1 e BO 3811), incluindo suporte adicional para os dispositivos de digitalização (INST 410/77-1 FUGG e INST 410/93-1 FUGG), e pela Iniciativa campos emergentes (EFI) "Big Thera" da Friedrich-Alexander-University Erlangen-Nürnberg.

Materials

Name	Company	Catalog Number	Comments
Binocular Operating Microscope	Leica	NA
ClinScan MR System	Bruker	NA
DICOM Viewer	Horos	NA	www.horosproject.org
Excel: Spreadsheet	Microsoft	NA
FCS	Sigma	F2442-500ML
Gadovist	Bayer-Schering	NA
Inveon PET/CT	Siemens	NA
Inveon Research Workplace Software	Siemens Healthcare GmbH	NA
IVIS Spectrum	PerkinElmer	NA
MDA-MB-231 human breast cancer cells	American Type Culture Collection	N/A
Open-source data visualization, machine learning and data mining toolkit.	Orange3, University of Ljubljana	NA	https://orange.biolab.si/
RPMI-1640	Invitrogen/ThermoFisher	11875093
Trypsin	Sigma	9002-07-7
Vevo 3100	VisualSonics	NA

DOWNLOAD MATERIALS LIST

References

D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).

Cancer Research

Algoritmos de aprendizagem de máquina para detecção precoce de metástases ósseas em um modelo experimental de ratos

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.