Визуализатор Inherent Dynamics — это интерактивный пакет визуализации, который подключается к инструменту вывода регуляторной сети генов для расширенной, оптимизированной генерации функциональных сетевых моделей. Визуализатор может использоваться для принятия более обоснованных решений по параметризации инструмента вывода, тем самым повышая уверенность в полученных моделях.
Разработка моделей генных регуляторных сетей является серьезной проблемой в системной биологии. Для решения этой проблемы было разработано несколько вычислительных инструментов и конвейеров, в том числе недавно разработанный конвейер Inherent Dynamics. Конвейер внутренней динамики состоит из нескольких ранее опубликованных инструментов, которые работают синергетически и связаны линейным образом, где выходные данные одного инструмента затем используются в качестве входных данных для следующего инструмента. Как и в случае с большинством вычислительных методов, каждый шаг конвейера Inherent Dynamics требует, чтобы пользователь делал выбор параметров, которые не имеют точного биологического определения. Этот выбор может существенно повлиять на модели генных регуляторных сетей, полученные в результате анализа. По этой причине способность визуализировать и исследовать последствия выбора различных параметров на каждом этапе может помочь повысить уверенность в выборе и результатах. Визуализатор Inherent Dynamics — это комплексный пакет визуализации, который упрощает процесс оценки выбора параметров с помощью интерактивного интерфейса в веб-браузере. Пользователь может отдельно изучить выходные данные каждого шага конвейера, внести интуитивно понятные изменения на основе визуальной информации и воспользоваться автоматическим созданием необходимых входных файлов для конвейера Inherent Dynamics. Визуализатор Inherent Dynamics обеспечивает беспрецедентный уровень доступа к очень сложному инструменту для обнаружения генных регуляторных сетей из транскриптомных данных временных рядов.
Многие важные биологические процессы, такие как дифференцировка клеток и реакция окружающей среды, управляются наборами генов, которые взаимодействуют друг с другом в генной регуляторной сети (GRN). Эти GRN производят транскрипционную динамику, необходимую для активации и поддержания фенотипа, который они контролируют, поэтому идентификация компонентов и топологической структуры GRN является ключом к пониманию многих биологических процессов и функций. GRN может быть смоделирован как набор взаимодействующих генов и/или генных продуктов, описанных сетью, узлами которой являются гены, а края которой описывают направление и форму взаимодействия (например, активация/подавление транскрипции, посттрансляционная модификация и т.д.). 1. Затем взаимодействия могут быть выражены в виде параметризованных математических моделей, описывающих влияние регулирующего гена на выработку его цели (целей) 2,3,4. Вывод модели GRN требует как вывода структуры сети взаимодействия, так и оценки базовых параметров взаимодействия. Были разработаны различные методы вычислительного вывода, которые принимают данные экспрессии генов временных рядов и выводят модели GRN5. Недавно был разработан новый метод вывода GRN, называемый Inherent Dynamics Pipeline (IDP), который использует данные экспрессии генов временных рядов для получения моделей GRN с мечеными регуляторно-целевыми взаимодействиями, которые способны производить динамику, соответствующую наблюдаемой динамике в данных экспрессии генов6. IDP представляет собой набор инструментов, линейно связанных в конвейер и может быть разбит на три этапа: шаг Node Finding, который ранжирует гены на основе характеристик экспрессии генов, известных или подозреваемых в связи с функцией GRN7,8, шаг Edge Finding, который ранжирует попарные регуляторные отношения8, 9, и этап обнаружения сети, на котором получены модели GRN, способные производить наблюдаемую динамику10,11,12,13,14,15.
Как и большинство вычислительных методов, IDP требует набора заданных пользователем аргументов, которые определяют, как анализируются входные данные, и разные наборы аргументов могут давать разные результаты для одних и тех же данных. Например, несколько методов, включая IDP, содержат аргументы, которые применяют некоторое пороговое значение к данным, и увеличение/уменьшение этого порога между последовательными прогонами конкретного метода может привести к неодинаковым результатам между прогонами (см. Примечание 10: Методы сетевого вывода 5). Понимание того, как каждый аргумент может повлиять на анализ и последующие результаты, важно для достижения высокой уверенности в результатах. В отличие от большинства методов вывода GRN, IDP состоит из нескольких вычислительных инструментов, каждый из которых имеет свой собственный набор аргументов, которые пользователь должен указать, и каждый из которых имеет свои собственные результаты. В то время как IDP предоставляет обширную документацию о том, как параметризовать каждый инструмент, взаимозависимость каждого инструмента от результатов предыдущего шага затрудняет параметризацию всего конвейера без промежуточного анализа. Например, аргументы в шагах Edge и Network Finding, вероятно, будут основаны на предыдущих биологических знаниях, и поэтому будут зависеть от набора данных и / или организма. Для опрашивания промежуточных результатов потребуется базовое понимание программирования, а также глубокое понимание всех файлов результатов и их содержимого от ВПЛ.
Визуализатор внутренней динамики (IDV) — это интерактивный пакет визуализации, который запускается в окне браузера пользователя и предоставляет пользователям IDP возможность оценить влияние их выбора аргументов на результаты любого шага в IDP. IDV перемещается по сложной структуре каталогов, созданной IDP, и собирает необходимые данные для каждого шага и представляет данные в виде интуитивно понятных и интерактивных рисунков и таблиц для изучения пользователем. После изучения этих интерактивных дисплеев пользователь может создавать новые данные из шага IDP, которые могут быть основаны на более обоснованных решениях. Затем эти новые данные могут быть немедленно использованы на следующем соответствующем этапе ВПЛ. Кроме того, изучение данных может помочь определить, следует ли повторно запускать шаг IDP с скорректированными параметрами. IDV может улучшить использование IDP, а также сделать использование IDP более интуитивно понятным и доступным, что было продемонстрировано исследованием основного осциллятора GRN дрожжевого клеточного цикла. Следующий протокол включает результаты IDP от полностью параметризованного запуска IDP по сравнению с подходом, который включает IDV после выполнения каждого шага IDP, т. е. Node, Edge и Network Finding.
Вывод GRN является важной проблемой в системной биологии. IDP генерирует модельные GRN из данных экспрессии генов с использованием последовательности инструментов, которые используют данные все более сложными способами. Каждый шаг требует принятия решений о том, как обрабатывать данные и…
The authors have nothing to disclose.
Эта работа финансировалась грантом NIH R01 GM126555-01 и грантом NSF DMS-1839299.
Docker | https://docs.docker.com/get-docker/ | ||
Git | https://git-scm.com/ | ||
Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
Pip | https://pip.pypa.io/en/stable/ |