このプロトコルの目的は、RNAシーケンシングデータを用いて候補遺伝子の進化と発現を調べるものです。
全ゲノムやトランスクリプトームデータなどの大規模なデータセットを蒸留して報告することは、しばしば困難な作業です。結果を分解する1つの方法は、生物にとって重要な1つ以上の遺伝子ファミリーに焦点を当て、研究することです。このプロトコルでは、系統を生成し、目的の遺伝子の発現を定量化するためのバイオインフォマティクスステップの概要を説明する。系統樹は、遺伝子が種の内外でどのように進化しているかについての洞察を与えるだけでなく、鳥類学を明らかにすることができます。これらの結果は、RNA-seqデータを用いて、異なる個体または組織におけるこれらの遺伝子の発現を比較するために増強することができる。分子進化と発現の研究は、種間の遺伝子機能の進化と保存のモードを明らかにすることができます。遺伝子ファミリーの特徴付けは、将来の研究のスプリングボードとして機能し、新しいゲノムまたはトランスクリプトーム論文で重要な遺伝子ファミリーを強調することができます。
シーケンシング技術の進歩は、非モデル生物のゲノムおよびトランスクリプトムのシーケンシングを促進してきた。多くの生物からのDNAとRNAのシーケンシングの実現可能性の増加に加えて、関心のある遺伝子を研究するために豊富なデータが一般に公開されています。このプロトコルの目的は、目的の生物に重要な役割を果たす可能性のある遺伝子の分子進化と発現を調査するためのバイオインフォマティクスのステップを提供することです。
遺伝子や遺伝子ファミリーの進化を調査することで、生物学的システムの進化に関する洞察を得ることができます。遺伝子ファミリーのメンバーは、通常、保存されたモチーフまたは相同遺伝子配列を同定することによって決定される。遺伝子ファミリーの進化は、以前は遠縁モデル生物1のゲノムを用いて調べられた。このアプローチの制限は、これらの遺伝子ファミリーが密接に関連する種でどのように進化し、異なる環境選択的圧力の役割が明確でないということです。このプロトコルでは、密接に関連する種のホモログの探索を含む。系統レベルで系統を生成することで、保存された遺伝子や系統特異的な重複などの遺伝子ファミリーの進化の傾向に注意することができます。このレベルでは、遺伝子がオルソログかパラログかを調べることもできます。多くのホモログは互いに同様に機能する可能性が高いが、必ずしも2の場合ではない。これらの研究に系統樹を組み込むことは、これらの相同遺伝子がオルソログであるかどうかを解決するために重要である。真核生物において、多くのオルソログは、哺乳類タンパク質が酵母オルソログ3の機能を回復する能力によって証明されるように、細胞内で同様の機能を保持している。しかし、非オーソリンス遺伝子が特徴付き機能4を行う場合があります。
系統樹は遺伝子と種の関係を引き起じ始めますが、遺伝的関係だけに基づいて機能を割り当てることはできません。遺伝子発現解析と機能性アノテーションと濃縮分析を組み合わせることで、遺伝子機能を強力にサポートします。遺伝子発現を定量化し、個人や組織の種類を比較できるケースは、潜在的な機能をより伝えることができます。以下のプロトコルは、Hydra下流7のオプシン遺伝子の調査に用いられる方法に従うが、それらはあらゆる種およびあらゆる遺伝子ファミリーに適用することができる。このような研究の結果は、非モデル生物における遺伝子機能および遺伝子ネットワークのさらなる調査のための基礎を提供する。一例として、光伝達カスケードを開始するタンパク質であるオプシンの系統の調査は、眼および光検出8、9、10、11の進化にコンテキストを与える。この場合、非モデル生物、特にクニダリアンやクテノフォアなどの基底動物種は、クレード12、13、14にわたる光変調カスケードおよび視力の保全または変化を解明することができる。同様に、他の遺伝子ファミリーの系統、発現、ネットワークを決定することは、適応の根底にある分子メカニズムについて私たちに知らせるでしょう。
このプロトコルの目的は、RNA-seqデータを用いて遺伝子ファミリーを特徴付けるためのステップの概要を提供することにある。これらの方法は、さまざまな種やデータセット4、34、35に対して機能することが証明されています。ここで確立されたパイプラインは簡素化されており、バイオインフォマティクスの初心者が続く…
The authors have nothing to disclose.
アドリアナ・ブリスコ、ギル・スミス、ラビ・ムラド、アリーン・G・レンゲルに、これらのステップのいくつかをワークフローに組み込む際のアドバイスとガイダンスに感謝します。また、キャサリン・ウィリアムズ、エリザベート・レボア、ナターシャ・ピッチャーニの原稿に対するコメントに感謝しています。この研究の一部は、ジョージ・E・ヒューイット医学研究フェローシップによって支援されました.M.M。
Bioanalyzer-DNA kit | Agilent | 5067-4626 | wet lab materials |
Bioanalyzer-RNA kit | Agilent | 5067-1513 | wet lab materials |
BLAST+ v. 2.8.1 | On computer cluster* https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ |
||
Blast2GO (on your PC) | On local computer https://www.blast2go.com/b2g-register-basic |
||
boost v. 1.57.0 | On computer cluster | ||
Bowtie v. 1.0.0 | On computer cluster https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/ |
||
Computing cluster (highly recommended) | NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large. | ||
Cufflinks v. 2.2.1 | On computer cluster | ||
edgeR v. 3.26.8 (in R) | In Rstudio https://bioconductor.org/packages/release/bioc/html/edgeR.html |
||
gcc v. 6.4.0 | On computer cluster | ||
Java v. 11.0.2 | On computer cluster | ||
MEGA7 (on your PC) | On local computer https://www.megasoftware.net |
||
MEGAX v. 0.1 | On local computer https://www.megasoftware.net |
||
NucleoSpin RNA II kit | Macherey-Nagel | 740955.5 | wet lab materials |
perl 5.30.3 | On computer cluster | ||
python | On computer cluster | ||
Qubit 2.0 Fluorometer | ThermoFisher | Q32866 | wet lab materials |
R v.4.0.0 | On computer cluster https://cran.r-project.org/src/base/R-4/ |
||
RNAlater | ThermoFisher | AM7021 | wet lab materials |
RNeasy kit | Qiagen | 74104 | wet lab materials |
RSEM v. 1.3.0 | Computer software https://deweylab.github.io/RSEM/ |
||
RStudio v. 1.2.1335 | On local computer https://rstudio.com/products/rstudio/download/#download |
||
Samtools v. 1.3 | Computer software | ||
SRA Toolkit v. 2.8.1 | On computer cluster https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit |
||
STAR v. 2.6.0c | On computer cluster https://github.com/alexdobin/STAR |
||
StringTie v. 1.3.4d | On computer cluster https://ccb.jhu.edu/software/stringtie/ |
||
Transdecoder v. 5.5.0 | On computer cluster https://github.com/TransDecoder/TransDecoder/releases |
||
Trimmomatic v. 0.35 | On computer cluster http://www.usadellab.org/cms/?page=trimmomatic |
||
Trinity v.2.8.5 | On computer cluster https://github.com/trinityrnaseq/trinityrnaseq/releases |
||
TRIzol | ThermoFisher | 15596018 | wet lab materials |
TruSeq RNA Library Prep Kit v2 | Illumina | RS-122-2001 | wet lab materials |
TURBO DNA-free Kit | ThermoFisher | AM1907 | wet lab materials |
*Downloads and installation on the computer cluster may require root access. Contact your network administrator. |