Summary
ここでは、一般にアクセス可能なさまざまなデータベースに由来するプールされた臨床データセットの包括的な分析に基づいて、乳がんのバイオマーカーと生存率予測を探索するためのプロトコルを紹介し、表現の戦略、相関関係、および生存時間分析ステップバイステップ
Abstract
近年、新興データベースは、複雑ながんゲノムデータセットへの接近の障壁を低減するように設計されており、これにより、異なる種類の癌にまたがる遺伝子、サンプル、および臨床データの分析と解釈を研究者に促すことができました。本明細書において、実用的な操作手順について説明し、ID1 (DNA 結合タンパク質1の阻害剤) を例にとって、由来するプールされた臨床データセットに基づく乳癌のバイオマーカーおよび生存予測因子の発現パターンを特徴づけるオンラインアクセス可能なデータベースには、ONCOMINE、bcGenExMiner v 4.0 (乳癌遺伝子発現マイナー v 4.0)、ゴボ (オンライン乳癌に対する遺伝子発現ベースの転帰)、HPA (ヒトタンパク質アトラス)、およびカプラン・マイヤープロッタが含まれる。分析は、がんのサンプルと通常のサンプルとの関係遺伝子 (例えば、ID1) の発現パターンを問い合わせることから始まりました。そして、乳がんにおける ID1 と clinicopathological 特性との相関分析を行った。次に、ID1 の発現プロファイルを、異なるサブグループに従って層状化した。最後に、ID1 発現と生存結果との関連を分析した。この操作手順は、異なるデータベースからの遺伝子レベルで多次元データ型を統合し、乳癌における遺伝子改変事象の再発およびゲノムコンテキストに関する仮説を検定するという概念を簡素化します。この方法は、結論の信頼性および代表性を向上させ、それによって、目的の遺伝子に関する有益な視点を提示することができる。
Introduction
乳癌は異なる分子亜型における多様な予後と治療戦略を有する異種疾患であり、病因と発達は恐らく異種の分子メカニズムに関連していると考えられる1,2,しかし、治療ターゲットを特定するには、通常、基礎研究での最初の発見から臨床利用4まで、何年も、数十年もかかります。癌ゲノムのためのハイスループットシーケンス技術のゲノム広い応用は、貴重なバイオマーカーまたは治療目標5を探索するプロセスを大いに進歩させる。
ICGC (国際がんゲノムコンソーシアム) や TCGA (がんゲノムアトラス) などの大規模ながんゲノミクスプラットフォームから生成されるがんゲノムデータの圧倒的な量は、研究者がデータを実行する上で大きな課題となっています。調査、統合、分析、特に情報学と計算6、7、8、9、10の集中的な訓練を欠いているユーザーのために。近年では、新興のデータベース (例えば、ONCOMINE、bcGenExMiner 4.0、およびカプラン・マイヤープロッタなど) は、複雑な癌ゲノムデータセットに接近するためのバーを低くするように設計および開発され、これにより、調査者が分析し、さまざまなタイプの癌11の遺伝子、サンプルおよび臨床データを解釈しなさい。このプロトコールの目的は、多数の研究者によって広く認識されている一連のオープンアクセスデータベースから複数レベルの遺伝子情報と統合する研究戦略を記述し、潜在的なバイオマーカーを同定し、乳癌の予後因子
ONCOMINE データベースは癌のマイクロアレイ情報が付いているウェブベースのデータマイニングのプラットホームで、新しいバイオマーカーおよび治療上のターゲット11の発見を促進するように設計されている。現在、このデータベース11,12には65遺伝子発現データセットから4800万以上の遺伝子発現測定値がある。BcGenExMiner (非営利組織のための無料ツール) は、乳癌遺伝子発現マイナーとも呼ばれ、3414回収乳がん患者および1209の DNA マイクロアレイの結果を含むユーザーフレンドリーなウェブベースのアプリケーションである軽蔑的なイベント13.R 統計ソフトウェアおよびパッケージによる遺伝子予後解析性能を向上させることを目的としています。
ゴボは 51-サンプル乳癌の細胞ラインセットおよび1881サンプル乳房の腫瘍データセットからのマイクロアレイ情報 (例えば、Affymetrix U133A) が付いている多機能ユーザーフレンドリーのオンライン用具であり、それは分析14の広い配列を可能にする。ゴボデータベースには様々なアプリケーションがあり、乳房腫瘍と細胞株の異なる分子サブタイプにおける遺伝子発現プロファイルの迅速な解析、潜在的 metagenes の生成のための共発現遺伝子のスクリーニング、および1つの遺伝子の結果と遺伝子発現レベルとの相関分析、遺伝子の集合、または乳癌データセット15における遺伝子のシグネチャー。
人間のタンパク質アトラスは、人間の生物学と病気の分野で多数の出版物に既に貢献している人間のプロテオームを、探索する科学者のために設計されたオープンアクセスプログラムです。人間のタンパク質アトラスは、ライフサイエンスコミュニティ16、17のためのヨーロッパのコアリソースとして認識されています。
カプランマイヤープロッタは、遺伝子発現と臨床データを同時に統合したオンラインツールで、1065胃、2437肺、1816卵巣および5143を含む10461がんサンプルに基づく54675遺伝子の予後予測効果の評価を可能にします。乳がん患者は33/49/40/69 ヶ月18の平均フォローアップを有する。遺伝子発現、無再発生存 (RFS) および全生存 (OS) の情報は、このデータベース19,20からダウンロード可能である。
ここでは、複数の公的にアクセス可能な複数のデータベースを用いて、多数のがん研究における対象遺伝子の発現の変化パターンを比較、分析、視覚化するための実用的操作手順について説明します。乳がんにおける発現プロファイル、予後値および潜在的な生物学的機能例えば、最近の研究は、腫瘍における ID タンパク質の発癌特性を示し、細胞形質転換、不死化、増殖および転移21 を含む悪性の特徴と関連していた、22、23。しかし、ID ファミリーの各メンバーは、固形腫瘍の異なるタイプで明確な役割を果たしており、乳癌におけるそれらの役割は24不明のままである。以前の研究では、この方法によって、ID1 が乳癌25において有意な予後指標であったことがわかった。したがって、プロトコルは、データマイニングメソッドを導入するための例として ID1 を取ります。
分析は、ONCOMINE の癌性サンプルと通常のサンプルの目的遺伝子の発現パターンのクエリから開始します。次いで、乳癌における目的の遺伝子の発現相関を、bc − GenExMiner、ゴボ、および ONCOMINE を用いて実施した。次に、ID1 の発現プロファイルを、上記3つのデータベースを用いて異なるサブグループに従って層状化した。最後に、ID1 発現と生存率との関連を、bc-GenExMiner 4.0、ヒトタンパク質アトラス、およびカプラン・マイヤープロッタを用いて分析した。操作手順は、図 1のフローチャートとして示されています。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 発現パターン解析
- ONCOMINE web インターフェイス26に移動します。
- 検索ボックスにID1を入力することにより、様々なタイプの悪性腫瘍における遺伝子ID1の相対的発現レベルを得ることができます。
- [一次フィルタ] メニューから [解析タイプ] を選択します。次に、がん対正常分析、乳癌対正常分析を選択します。
- [他のビュー ] メニューから [ジーンサマリービュー ] を選択します。P値のしきい値を0.01 に設定します。図をダウンロードします。
注: フォールドチェンジの閾値は、前の研究27で説明したように2です。
2. 発現相関解析
- GenExMiner v 4.0 web インターフェイス28に移動します。
- [解析] メニューから [相関関係] を選択し、[完全] ボタンを押します。検索ボックスに「 ID1 」と入力します。[送信] ボタンと [解析の開始] ボタンを押します。
注: デフォルト設定は、すべての患者の発現相関分析を示し、これは、分子サブタイプフィルターを押すことによって乳癌の異なるサブタイプでより正確であり得る。
3. サブグループ分析
- Bc-GenExMiner 4.0 におけるサブグループ分析
- GenExMiner v 4.0 web インターフェイス28に移動します。
- [解析] メニューから [式] を選択し、[完全] ボタンを押します。検索ボックスに「 ID1 」と入力し、[送信] ボタンと [解析の開始] ボタンを押します。
- 節点ステータス (LN)とScarff ブルーム & リチャードソングレードステータス (SBR)サムネイルをクリックして、完全な画像を表示します。SBR 画像では、数字のP値を視覚化するために下のボタンを押してください。図をダウンロードします。
- 乳癌の遺伝子発現に基づく結果におけるサブグループ分析オンライン (ゴボ)
- ゴボ web インターフェイス14に移動します。
- 関心のある遺伝子シンボルの型は、遺伝子セットをアップロードして画面にID1 。
- 遺伝子/プローブ識別子を定義する検索範囲をジーンシンボルに設定します。すべて腫瘍選択で設定します。多変量パラメータで [ノードステータス] と [階層化] を選択します。他の項目はデフォルトのままです。問い合わせを送信し、図をダウンロードしてください。
4. 生存分析
- Bc での生存分析-GenExMiner v 4.0
- GenExMiner v 4.0 web インターフェイス28に移動します。
- [解析] メニューから [予後] を選択し、[完全] ボタンを押します。検索ボックスに「 ID1 」と入力し、[送信] ボタンと [解析の開始] ボタンを押します。
- 徹底的な予後分析では、母集団と事象の基準でNm、ERm、MRを選択し、[送信] ボタンを押して詳細情報を取得します。カプラン・マイヤー曲線を押して、完全なグラフを書き出します。
注: N (+、-、m): 節点ステータス (+: 正、-: 負、m: 混合)。ER (+,-, m): エストロゲン受容体の状態 (+: 陽性,-: 陰性, m: 混合);MR: 転移性再発
- ヒトタンパク質アトラス (HPA) における生存分析
- 人間の蛋白質アトラス web インターフェイス29に移動します。
- 検索ボックスにID1と入力し、検索ボタンをクリックします。[病理サブアトラス] を選択します。
注:17 種類のがんにわたる mRNA 発現レベルは、RNA 発現概要セクションに示されています。箱ひげ図のすべての癌組織ラベルは、生存時間分析データと RNA 発現レベルを提供する詳細ページにアクセスするためにクリック可能です。 - 乳がんのラベルをクリックし、詳細ページでインタラクティブなサバイバル散布図と生存時間分析を表示します。図をダウンロードします。
- カプラン・マイヤープロッタサバイバルにおける生存分析
- カプラン・マイヤープロッタウェブインターフェース30に移動します。MRNA 遺伝子チップゾーンで乳癌のための KM プロッタを開始] をクリックします。
- 検索バーにID1と入力し、候補メニューで緑色の項目を選択します。
- 生存タイプとしてRFSを選択し、その他のアイテムはデフォルトのままにします。「カプラン・マイヤー・プロットを描く」をクリックして、数字をダウンロードしてください。
注: 生存タイプ、カットオフタイプ、およびフォローアップしきい値、およびプローブセットオプションの設定は、必要に応じて変更することができます。ER、PR、彼女-2、リンパ節、等級、Tp53 状態、および分子サブタイプを含むサブグループ予後分析は、ボックス1に制限分析で設定を変更することによって得ることができる。同様に、治療のフィルタの制限は、選択されたコホートのボックスに [分析を制限] で設定することができます。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
乳癌バイオマーカーのデータマイニングおよび統合的分析の代表的な結果を、ID1 を用いて実施し、これは前の研究25で報告されている DNA 結合ファミリーメンバーの阻害剤の1つであった。
図 2に示されているように、複数のタイプの癌における腫瘍と正常組織との間の ID1 mRNA 発現の相違は、合計445のユニークな分析を含んでいた ONCOMINE データベースを用いて分析した。ID1 の mRNA 発現量が乳癌組織よりも正常組織において有意に高かったことを明らかにした5つの研究があった。これらのデータは乳がんにおける ID1 の調節不全を示した。図 3は、Bc-GenExMiner v 4.0 で実施された分析から ID1 の最良の正および負の相関遺伝子を示した。ID1 の mRNA 発現と BC 患者の clinicopathological パラメータとの相関関係を同定するために、bc − GenExMiner v 4.0 データベースを用いて分析を行いました。図 4に示すように、リンパ節転移を有さない乳癌患者において ID1 の mRNA レベルが有意に増加したことが明らかとなった (P= 0.0005)。さらに、ゴボにおける分析は、ID1 の mRNA レベルの上昇がより低い腫瘍グレードに相関したことを実証した (図 5、 P< 0.00001)。これらの結果は、ID1 の発現の増加が、BC の転移性電位の低下および病理学的グレードの低下に結びついていることを示唆している。GenExMiner v2.0 のデータベースからの分析では、ID1 の高い mRNA レベルが乳がん患者における遠隔転移フリー生存 (DMFS) に相関していることが示された (図 6、HR = 0.82、95% CI: 0.73-0.92、 P= 0.001)。一貫して、ヒトタンパク質アトラスからの分析は、ID1 の高いタンパク質レベルが乳癌患者においてより良好な生存転帰と関連していることを示唆した (図 7、 P= 0.0389)。カプラン・マイヤープロッタからの生存分析はまた、ID1 発現のより高い mRNA レベルが乳癌患者においてより良好な無再発生存率 (RFS) を予測したことを示した (図 8、HR = 0.81、 P= 0.00023)。
図 1.個別乳癌バイオマーカーとオンラインデータベース選択の発現パターンと予後値の探索の概要個々の乳癌バイオマーカーの系統的分析を、様々なデータベースにおいて段階的に実施した。まず、癌性試料に対する目的の遺伝子の発現パターンと通常の試料とを比較する。そして、乳癌における目的の遺伝子の発現相関を行った。次に、ID1 の発現プロファイルを、異なるものに従って層状化した。最後に、ID1 発現と生存率との関連を分析した。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 2.ID1 の mRNA 発現パターンは、異なる種類のヒト癌における。ID1 の mRNA 発現を ONCOMINE データベースで解析した。この図は、標的遺伝子の統計的に有意な mRNA 過剰発現 (赤色) または downregulated 発現 (青色) を有するデータセットの数を示した。各セルの数字は、これらの分析とがんの種類の中でしきい値を満たす分析の数を表します。遺伝子ランクは、各研究で測定した全遺伝子の最上部にある標的遺伝子の百分位数により分析した。細胞色は、細胞内での分析のための最良の遺伝子ランク百分位数によって決定された。P 値は0.01 で設定し、赤枠に示すように倍変化を2として定義した。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 3.Bc-GenExMiner ID1 の遺伝子相関解析ID1 の mRNA 発現相関は 5, 696 の乳癌患者において36研究において bcGenExMiner v 4.0 で分析した。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 4.ID1 発現とリンパ節転移状態との関係ID1 の mRNA 発現量は、bcGenExMiner で分析したリンパ節 (LN) の状態が異なる 2, 307 の乳癌患者である。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 5.ID1 の遺伝子発現量と腫瘍悪性度との関係異なる病理学的等級を有する乳癌患者に ID1 の mRNA 発現レベルをゴボで分析した。P値を生成するためにグループ間のグローバルな有意差が評価され、 p< 0.05 が統計的に有意な差を示していると考えられていました。x 軸の 1, 2, 3 は、異なる病理学グレード1、グレード2、グレード3の患者のサブグループのために立っています。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 6.ID1 の予後値は、乳癌患者における遠隔転移フリー生存のためのものである。ID1 mRNA レベルと遠隔転移自由生存推定との関連を bcGenExMiner で分析した。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 7.乳がん患者における ID1 の生存確率 乳がん患者の生存に対する ID1 タンパク質レベルの影響をヒトタンパク質アトラス (HPA) で分析した。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
図 8.無再発生存率 (RFS) による乳癌に ID1 の予後予測値カプラン-マイヤープロッタで分析されたすべての 3, 951 乳癌患者における異なる ID1 mRNA レベル。この図は、前の研究25から修正されている。この図の大規模なバージョンを表示するには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
公共のデータベースの包括的な分析は、対象となる遺伝子の基礎となる機能を示し、特定の癌27,31におけるこの遺伝子と clinicopathological パラメータとの間の潜在的なリンクを明らかにすることができる。1つのデータベースに基づく探索と分析では、データ収集や分析アルゴリズムなどのさまざまなデータ品質によって、潜在的な選択バイアス (ある程度) が原因で、限定的または孤立したパースペクティブが提供されることがあります。データベース19の。このプロトコルの最も重要なステップは、適切な代表性を持つより多くの科学者によって広く認識されるべきであるデータベースを選択することです。調査担当者は、仮説をテストするために複数のデータベースを使用し、単一のデータベースを使用するのではなく、異なるデータベースから得られた結果を確証する必要があります。
ここで説明したプロトコルは、調査官にとってわかりやすい操作手順です。この方法の利点は、乳癌における遺伝子の潜在的な役割の迅速な視覚化および解釈を可能にすることである。さらに、この手順で得られたすべての結果は、対応する web サイトを照会するだけで、すぐにテストして繰り返すことができます。この方法の限界は、データベースの包括的な分析から来る結論は、臨床現場での実際の機能や関係を正確に反映していない可能性があるということです。これは、データベースの体系的バイアスから生じる可能性があり、場合によっては、サンプルサイズ32、33が不十分である可能性があります。複数のデータベースを使用して同じ調査の質問を照会すると、相互に結果を確認し、結論34の信頼性を高めることができます。結果を検証するために、研究者の機関からのサンプルを使用して、結果を確認したり、可能であれば、関連する基本的な実験を実行することを強くお勧めします。
ますます多くのオンライン癌ゲノミクスまたはプロテオミクスデータベースが利用可能となり、研究者35、36のためにアクセス可能になります。このプロトコルは、研究者がオンラインデータベースの詳細な分析およびゲノミクス、トランスクリプトミクス、およびエピゲノミクスを使用して、潜在的な標的遺伝子および関連するシグナリング経路を同定するための効率的で経済的な方法を提供する可能性がある。アプローチ。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者は何も開示することはありません
Acknowledgments
この研究は、部分的に広東省、中国 (2018A030313562) の自然科学財団によってサポートされていた、広東臨床教育拠点の教育改革プロジェクト (NO. 2016JDB092)、中国の国立自然科学財団 (81600358)、及び青少年革新的なタレントプロジェクト中国広東省 (2017KQNCX073) の大学の
Materials
Name | Company | Catalog Number | Comments |
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |
References
- van 't Veer, L. J., et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 415 (6871), 530-536 (2002).
- Loi, S., et al. Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade. Journal of Clinical Oncology. 25 (10), 1239-1246 (2007).
- Cancer Genome Atlas, N. Comprehensive molecular portraits of human breast tumours. Nature. 490 (7418), 61-70 (2012).
- Emerson, J. W., Dolled-Filhart, M., Harris, L., Rimm, D. L., Tuck, D. P. Quantitative assessment of tissue biomarkers and construction of a model to predict outcome in breast cancer using multiple imputation. Cancer Informatics. 7, 29-40 (2009).
- Yu, H., et al. Integrative genomic and transcriptomic analysis for pinpointing recurrent alterations of plant homeodomain genes and their clinical significance in breast cancer. Oncotarget. 8 (8), 13099-13115 (2017).
- He, W., et al. TCGA datasetbased construction and integrated analysis of aberrantly expressed long noncoding RNA mediated competing endogenous RNA network in gastric cancer. Oncology Reports. , (2018).
- Liu, J., et al. An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics. Cell. 173 (2), e411 400-416 (2018).
- Esgueva, R., et al. Next-generation prostate cancer biobanking: toward a processing protocol amenable for the International Cancer Genome Consortium. Diagnostic Molecular Pathology. 21 (2), 61-68 (2012).
- Joly, Y., Dove, E. S., Knoppers, B. M., Bobrow, M., Chalmers, D. Data sharing in the post-genomic world: the experience of the International Cancer Genome Consortium (ICGC) Data Access Compliance Office (DACO). PLoS Computational Biology. 8 (7), e1002549 (2012).
- Zhang, J., et al. International Cancer Genome Consortium Data Portal--a one-stop shop for cancer genomics data. Database (Oxford). 2011, bar026 (2011).
- Rhodes, D. R., et al. ONCOMINE: a cancer microarray database and integrated data-mining platform. Neoplasia. 6 (1), 1-6 (2004).
- Rhodes, D. R., et al. Oncomine 3.0: genes, pathways, and networks in a collection of 18,000 cancer gene expression profiles. Neoplasia. 9 (2), 166-180 (2007).
- Jezequel, P., et al. bc-GenExMiner: an easy-to-use online platform for gene prognostic analyses in breast cancer. Breast Cancer Research and Treatment. 131 (3), 765-775 (2012).
- , Available from: http://co.bmc.lu.se/gobo/gsa.plb (2018).
- Ringner, M., Fredlund, E., Hakkinen, J., Borg, A., Staaf, J. GOBO: gene expression-based outcome for breast cancer online. PLoS One. 6 (3), e17911 (2011).
- Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
- Ponten, F., Schwenk, J. M., Asplund, A., Edqvist, P. H. The Human Protein Atlas as a proteomic resource for biomarker discovery. Journal of Internal Medicine. 270 (5), 428-446 (2011).
- Gyorffy, B., et al. An online survival analysis tool to rapidly assess the effect of 22,277 genes on breast cancer prognosis using microarray data of 1,809 patients. Breast Cancer Research and Treatment. 123 (3), 725-731 (2010).
- Stevinson, C., Lawlor, D. A. Searching multiple databases for systematic reviews: added value or diminishing returns? Complementary Therapies in Medicine. 12 (4), 228-232 (2004).
- Yin, J., et al. Integrating multiple genome annotation databases improves the interpretation of microarray gene expression data. BMC Genomics. 11, 50 (2010).
- Patel, D., Morton, D. J., Carey, J., Havrda, M. C., Chaudhary, J. Inhibitor of differentiation 4 (ID4): From development to cancer. Biochimica et Biophysica Acta. 1855 (1), 92-103 (2015).
- Kamalian, L., et al. Increased expression of Id family proteins in small cell lung cancer and its prognostic significance. Clinical Cancer Research. 14 (8), 2318-2325 (2008).
- Cruz-Rodriguez, N., et al. High expression of ID family and IGJ genes signature as predictor of low induction treatment response and worst survival in adult Hispanic patients with B-acute lymphoblastic leukemia. Journal of Experimental and Clinical Cancer Research. 35, 64 (2016).
- Yang, H. Y., et al. Expression and prognostic value of Id protein family in human breast carcinoma. Oncology Reports. 23 (2), 321-328 (2010).
- Zhou, X. L., et al. Prognostic values of the inhibitor of DNAbinding family members in breast cancer. Oncology Reports. 40 (4), 1897-1906 (2018).
- , Available from: https://www.oncomine.org (2018).
- Lin, H. Y., Zeng, L., iang, Y. K., Wei, X. L., Chen, C. F. GATA3 and TRPS1 are distinct biomarkers and prognostic factors in breast cancer: database mining for GATA family members in malignancies. Oncotarget. 8 (21), 34750-34761 (2017).
- , Available from: http://bcgenex.centregauducheau.fr/BCGEM/GEM-requete.php (2018).
- , Available from: https://www.proteinatlas.org (2018).
- , Available from: http://kmplot.com/analysis (2018).
- Zhu, Y. F., Dong, M. Expression of TUSC3 and its prognostic significance in colorectal cancer. Pathology-Research and Practice. 214 (9), 1497-1503 (2018).
- Nelson, J. C., et al. Validation sampling can reduce bias in health care database studies: an illustration using influenza vaccination effectiveness. Journal of Clinical Epidemiology. 66 (8 Suppl), S110-S121 (2013).
- Haibe-Kains, B., Desmedt, C., Sotiriou, C., Bontempi, G. A comparative study of survival models for breast cancer prognostication based on microarray data: does a single gene beat them all? Bioinformatics. 24 (19), 2200-2208 (2008).
- Yang, C., et al. Understanding genetic toxicity through data mining: the process of building knowledge by integrating multiple genetic toxicity databases. Toxicology Mechanisms and Methods. 18 (2-3), 277-295 (2008).
- Cannata, N., Merelli, E., Altman, R. B. Time to organize the bioinformatics resourceome. PLoS Computational Biology. 1 (7), e76 (2005).
- Wren, J. D., Bateman, A. Databases, data tombs and dust in the wind. Bioinformatics. 24 (19), 2127-2128 (2008).