Immunology and Infection

噬菌体型组学：生理途径来表征新型病毒蛋白

Published: June 11, 2015 doi: 10.3791/52854

Abstract

目前的调查到噬菌体 - 宿主相互作用依赖于从（甲基）基因组推断的知识。有趣的是，60 - 噬菌体全部序列的95％的市场份额没有同源性为当前注释蛋白质。其结果是，噬菌体的基因有很大一部分被注释为假设。这一现实严重影响了结构性和辅助代谢基因的注解。在这里，我们提出旨在捕捉所选主机的这些未知的噬菌体基因中的表达过程中的生理反应（S）phenomic方法。多表型分析板（MAP中）用于监控主机底物利用和随后的生物质形成的多样性，而代谢通过监测代谢物的丰度和多样性提供双向产物分析。这两种工具同时使用，以提供一个单一的推定噬菌体开放阅读框（ORF）的表达相关的表型信息。对于这两种方法的代表性结果进行比较，highl照明的宿主携带或者推定的结构或代谢噬菌体基因的表型信息的差异。此外，可视化技术和高吞吐量计算管道，便利实验分析给出。

Introduction

即感染细菌（又名噬菌体或噬菌体）的病毒，估计存在于全局超过10 ³¹病毒样颗粒（VLP）和多于所有其他生物体中的环境^1,2-。第一个宏基因组研究，调查海洋环境相关的病毒社区集中于量化病毒部分³中看到的多样性。此外，布赖特巴特和他的同事发现，病毒序列社区65％以上没有共同的同源性在公共数据库的任何序列。随后的宏基因组的研究发现了类似的证据：从圣地亚哥海洋沉积物宏基因组，加州含有75％的未知病毒序列^4;从索尔顿湖的高盐度湖泊宏基因组含有98％的未知病毒序列^5;和珊瑚相关的宏基因组含有95 - 98％的未知病毒序列^6。未注释的信息这种累积导致噬菌体的遗传物质是^7“生物宇宙的暗物质”。

噬菌体的基因组的表征依赖于通过对现有的核酸和蛋白质数据库的比较确定序列相似性。因为噬菌体编码的遗传信息主要是未知的，同源性为基础的方法是无效的。在其基因组中，噬菌体通常编码三个主要基因类型：转录和复制的基因，代谢基因和结构基因。转录和复制的基因（类I / II基因^8）包括聚合酶，primases，内/外-核酸酶，和激酶。这些基因是高度保守的，由于其在噬菌体感染的重要性，转录和复制的噬菌体遗传物质。噬菌体聚合酶容易地用传统的序列同源性的方法，由于其全球保护⁹确定并已显示出作为有效的系统发育标记物^10。相比之下，噬菌体代谢和结构基因（II / III级基因^8）越来越发散，往往标注为假想的基因。

噬菌体代谢基因影响宿主的代谢能力，并且不一定需要病毒复制。这些基因中，常常被称为辅助代谢的基因^{11（AMGs），}出现以调节宿主代谢，并允许感染和病毒粒子的成熟的成功的最佳发展。 AMGs已用限制性营养或能量生产途径的利用和吸收有关。一些实例包括在各个噬^12-16的基因组中发现的光系统的基因，基因连接并通过磷代谢^17,18，和利用戊糖磷酸途径噬菌体的dNTP生物合成^18,19的调节。相比之下，结构基因是中期到感染过程中产生的晚期基因之间以及在不同的噬菌体浩变化ST制度。结构蛋白的生产依赖于病毒的dNTP的可用性，以及它们的转录，翻译和组件⁸能池。衣壳和尾部纤维结构蛋白被认为是最发散的所有病毒蛋白编码基因和所需的成功的病毒粒子的生产。他们的分歧通常归因于它们在塑造病毒与宿主协同进化²⁰起到积极的作用。发散的蛋白质，无论基因类的，很容易用传统的同源性和序列比对技术时忽视。为了纠正见过严格序列比较的局限性导致了能够使用的序列特征来判断的关联，如人工神经网络²¹的生物信息学工具。人工神经网络（人工神经网络）允许的结构和代谢基因的预测，但是，需要下游实验验证直接表征基因的功能。

本手稿的目的是提供一种能的新型噬菌体基因的表达过程中监测宿主细菌的两个分解代谢和合成代谢的代谢phenomic协议，功能通过人工神经网络的预测。组学的领域中，与细胞的表型相关的生物，是公认的在系统生物学中的蛋白质与未知或多效性功能的调查中提供帮助。 Phenomic工具用于表型信息链接到基因型信息。我们推测对它们的功能（多个）可以通过噬菌体基因表达过程中观察宿主的生理效应来确定推定的噬菌体基因。为了调查这一假设，两轮量化方法进行选择。多表型分析板（MAP中）被用来监测宿主底物利用和随后的生物质形成，而代谢测定宿主代谢物的多样性和相对丰度的增长在特定ENVIRON期间精神状态。推定的结构和代谢蛋白过表达在大肠杆菌中，并从两个实验的代表性结果进行了比较。众多的视觉技术和高通量处理管道呈现，以方便实验复制。最后，对所提出的方法的再现性和精度的预期生理效应一个被注解衣壳蛋白和噬菌体代谢蛋白，硫氧还蛋白，加上两个推定AMGs的上下文中讨论。

Protocol

1.准备多表型分析板（MAP）基材，基本培养基，预增媒体和缓冲区

请加入50ml 1.0 - 1.25％基板股票。
1. 溶解1.0 - 1.25％（重量/体积）在无菌水中固体基材（热如有必要）。过滤消毒用在RT0.22μm的过滤器单元和存储股的解决方案。在表2中提供了这些实验中使用的基底的实例。
使250毫升3×基础培养基的所有基片类（碳，氮，硫和磷）。的MOPS（3-吗啉代-1-磺酸盐）基的基础培养基²²包含以下内容：1×MOPS（40mM的MOPS + 10mM的曲辛），0.4％甘油*，9.5毫_氯化铵 *，0.25毫鼻₄ *，1.0毫_硫酸镁 *，1.32毫K ₂ HPO ₄ *，10毫米氯化钾，0.5微米的CaCl _2，5毫摩尔NaCl，6微米的FeCl ₃和0.1％（重量/体积）L-阿拉伯糖**（ 表1和2） 。
注：*根据基础培养基这些化合物不包括在内。例如，0.4％的甘油未在碳基础培养基，并在硫基础培养基1.0mM的MgSO ₄干燥被替换为1.0mM的MgCl ₂的使用。 ** L-阿拉伯糖是针对特定的pBAD诱导启动子载体，pEMB11，这是转化成ARA的^- E.大肠杆菌 K-12菌株（BW ^{27784）23。}
1. 该基础培养基的各成分添加到无菌烧瓶中，并把溶液体积。拌匀。用0.22微米的过滤器单元，过滤器灭菌每个基础培养基到无菌瓶中。
制成500毫升的MOPS预生长培养基。基于MOPS预生长培养基²²包含以下内容：1×MOPS（40mM的MOPS + 10mM的曲辛），0.4％甘油，9.5 mM的_氯化铵，0.25毫鼻_4，1.0mM的MgSO ₄干燥，1.32毫K ₂ HPO _4， 10mM的氯化钾，0.5微米的CaCl _2，5mM的NaCl和6微米的FeCl _3。
1. 每添加预生长培养基到无菌烧瓶组分和定容。过滤消毒用0.22微米的过滤器单元，然后在100微克/ ml的终浓度添加氨苄青霉素。在4°C储存解决方案。
请500毫升0.5X卢里亚BERTANI（LB）琼脂平板。到无菌烧瓶中，添加的LB组件，使一个0.5×浓度（1.25克酵母提取物，2.5克氯化钠2.5克胰蛋白胨，7.5克琼脂）。拌匀，高压灭菌消毒。
1. 凉爽的琼脂，然后加入抗生素氨苄青霉素100微克/毫升并混合。直到需要倒〜25毫升琼脂入培养皿，允许设置，并储存在4℃。
使250毫升的10毫摩尔Tris（pH7.4）中加10毫_硫酸镁缓冲溶液。过滤消毒用0.22微米的过滤器单元，并在室温下存储的解决方案。

2.制备细菌细胞悬液

准备新鲜的殖民地。从12.5％甘油冷冻股票，板块新鲜E.大肠杆菌酷龙西文到含有100微克/毫升氨苄青霉素的0.5倍的LB琼脂上。在37℃下放置24小时。
准备液体培养：
1. 吸管含有100μg/ ml氨苄青霉素到培养管3毫升预生长培养基。对于每个克隆，利用生物一式三份。
2. 从接种2.1节独立的殖民地进入准备培养管。在37℃振荡22小时。
颗粒和洗细菌细胞：
1. 转让O / N培养成1.7毫升离心管。通过离心以最大速度（16900×g离心），用于在一个微量离心2分钟沉淀细胞。滗上清，通过重新悬浮于500微升10毫摩尔Tris / 10mM的_硫酸镁缓冲洗细胞。重复。
2. 重新沉淀细胞，澄清上清液，以1毫升的10mM Tris / 10mM的_硫酸镁缓冲重新悬浮细胞。
测量细胞密度并浓缩细胞（如有必要）：
1. 从稀释2.3.3节细胞的10倍在10毫摩尔Tris / 10mM的_硫酸镁缓冲液和该稀释转移到一个试管中。测量光密度这种稀释和记录（OD _600纳米）。
2. 浓缩细胞达到0.07（OD _600纳米）中的MAP的最终浓度（细胞将稀释15倍时，他们被加入到的MAP，因此细胞必须在OD _600nm处 = 1.05的初始浓度）。转浓细胞悬液到水库和保存（室温），直到地图准备步骤3.5。

3.制备多表型检测板（MAPS）

标签地图。标签无菌96孔微量滴定板与大肠杆菌大肠杆菌克隆识别号码和地图概略类型。
分装无菌水成地图。无菌转移无菌水成液体贮存。吸管60微升成使用多通道移液器将微滴定板的每个孔中。
分装基础培养基INTØ地图。无菌转移3×基础培养基变成液体贮存。吸管将50μl成使用多通道移液器将微滴定板的每个孔中。重复步骤3.2和3.3中所述MAP概略使用的每个基本培养基。
分装到基板的地图。转移30微升每个基片的成MAP的相应孔。
加入菌悬液的地图。转移10微升的细菌细胞从节2.4.2成使用多通道移液器在MAP的每个孔中。重新引入吸前更改提示回到文化的股票。
覆盖地图与粘合膜。覆盖每个板单粘性板片。用力按下该膜之上的板的孔中，并沿着边缘以创建一个偶数和密封。从微滴定板的用无菌刀片的边缘除去多余的薄膜。
测量MAP的光密度：
1. 放置制备的MAPs中的多板分光的“输入”套筒光度计板读者。开闭板阅读器软件，并创建一个协议，其测量吸光度（OD _{600 nm）的}每30分钟，共32个小时，用60秒的读出之间振荡的。
2. 设定温度的装置，以37℃。启动协议，一旦地图都平衡到设定温度。
3. 后32小时，从板块读者的“输出”袖删除地图。每个标签数据文本文件，包括：E.大肠杆菌克隆的识别号码，日期在MAP跑，并且MAP概略类型。

4.多表型检测板（MAPS）加工参数

评估使用自动化QA流程， 例如，PMAnalyzer ²⁴的生长曲线。
1. 验证增长曲线有OD _600纳米 <前2小时0.20。在初始时间点（叔_0）在过滤器中不使用吸光度由于冷凝的工件，通常解决在T _1（30分钟）。
2. 删除违反质量保证过滤器的增长曲线。保存曲线信息（样品名称，以及数量和OD _600nm的值），以备日后参考一个单独的输出文件。继续分析，如果生长曲线通过QA过滤器。
计算平均生长曲线。采用复制数据，每口井，通过取中位数光密度（OD _{600 nm）的}值在每个时间点计算平均增长曲线。记录造成供将来使用一个单独的输出文件中位数的生长曲线。
计算使用提出Zwietering ²⁵的方程的自适应每个生长曲线的最佳拟合逻辑模型。逻辑方程包括三个参数描述细菌生长：滞后时间，λ（小时），增长的最大速率，μ _最大（OD _600nm处 100 ^-1），和最后的生物量产率，α（OD _600纳米）。用数据在时间= 30分钟（Y _1）为由于凝结的文物初始值。
[1]
1. 计算使用的是直接搜索的最大生长速率。记录变化的最大速度在数据中的90分钟间隔。
  [2]
2. 通过搜索最大移动平均值超过90分钟窗口上部渐近值估计的最终生物质产量。具体地讲，定义为生长曲线的渐近线。
  [3]
3. 使用_μmax和来自4.3.1和4.3.2的值，发现通过尝试所有λ值的λ值：
  [4]
  1. 使用每个λ值来计算误差平方（SSE）的总和。用最低的SSE是SSE（λS）：
    /files/ftp_upload/52854/52854eq5.jpg“/> [5]

MAP的表型5.分析

计算增长水平（GL）的每个生长曲线来评估每个克隆每个基板的整体增长。 GL定义为转向物流，拟合值的调和平均值：
[6]
分配一个表型的基础上的GL值的每个的生长曲线。这里，使用的四种表型是：预期的增长，没有增加，功能的获得，和功能丧失。
1. 由一个特定的基片上在标准偏差距离平均而言比较在所有克隆生长确定表型。使用该统计信息和最小生长阈指定由生长曲线（ 图1A，B）。图1C提供了表型的分配的例子呈现的表型。
2. 定义成长为GL≥0.4（FIGURË1A，B）。定义函数的增益（ 图1C，绿色）作为具有GL>高于平均值，平均>成长门槛两个标准差。功能（ 图1C，红色）的损失被定义为具有一个GL <低于平均值的两个标准差，以及平均>生长的阈值。
创建基于表型和生长曲线的数据集的可视化表示。
1. 查看增长动力描绘OD _600nm的值作为颜色快速比较多的克隆（ 图2）之间的生长曲线。
2. 查看表型分布的基础上生长条件（ 图3）所有克隆之一。

6.建设连续培养装置

反应堆港口建设（ 图4A，B）。钻3 1/4英寸的孔，在隔开3/4英寸隔开，在连续培养反应器的盖。
1. FOR气口α：螺纹阴路厄螺纹式的面板安装到1/16英寸的倒钩与倒钩朝上，出了帽盖的底部。安全倒钩用1/4英寸面板安装锁紧螺母。
2. 对于端口β：螺纹阴路厄螺纹式的面板安装到1/16英寸的倒钩与倒钩朝上，出了帽。安全倒钩用1/4英寸面板安装锁紧螺母。
3. 对于端口γ：螺丝阴路厄螺纹式的面板安装到1/16英寸的倒钩从盖的底部，所以倒钩朝上，出了帽。安全倒钩与1/4。面板安装锁紧螺母。螺杆阳路厄具有整体锁环到1/8。大口径软管倒钩在盖的内侧嵌合。
4. 对于流出端口：在钻一个孔5/16在75毫升标记的连续培养反应器。削减3/4。关中1/4的坚果结束。带刺的舱壁配件。拧在1/4。倒钩的隔板接头（垫圈是在瓶的外面和螺母是在里面，女igure 4B）。
奶瓶港口建设（ 图4C）。钻两个1/4英寸的孔间隔开1英寸相距在奶瓶的盖子。
1. 对于港口δ：一个螺丝母鲁尔螺纹式的面板安装到1/8的倒钩与倒钩朝上，出了帽。安全倒钩用1/4英寸面板安装锁紧螺母。
2. 对于港口ε：螺丝阴路厄螺纹式的面板安装到1/16英寸的倒钩与倒钩朝上，出了帽。安全倒钩用1/4英寸面板安装锁紧螺母。
  1. 螺杆阳路厄具有整体锁环到1/8。大口径软管倒钩接头，在盖的内侧。
喂食管和管扩展：
1. 切两1英寸件管（1/8英寸外径（OD）×1/16英寸的内径（ID））。飞度件到港口α和连续培养反应器的γ在5.2节进行。
2. 砍单1英寸一件的T（1/4英寸外径x 1/8英寸ID）ubing。飞度片上连续培养反应器的端口Β。
3. 切，管件的单个3.5（1/8英寸外径x 1/16英寸ID）。适合这块到端口γ的内部，在阳路厄带整体锁环到1/8。大口径软管。端口γ是连续培养反应器取样口。
4. 砍单1英寸管件（1/4英寸外径x 1/8英寸ID）。适合这块奶瓶的δ端口。
5. （1/16英寸。外径x 1/8英寸ID）的切割。管件单11。适合这块到奶瓶的端口ε的内部，在阳路厄带整体锁环到1/8。大口径软管。
6. 切两18英寸的管件（1/8英寸外径x 1/16英寸ID）。适合单件端口ε奶瓶。保存另一片为第7。

7.运行连续培养的代谢组学

消毒材料：
1. Autocla已经进行30分钟的干物料。请务必将奶瓶在铝箔第5条提出的上限。保持连接管直。
  1. 包装，瓶盖连续培养反应器，在第5条提出的铝箔。保持连接管直。在带18。管切段6.3.5和铝箔最小的蠕动泵管适配器。保持管道直。高压釜30分钟。
2. 使2升0.5倍LB肉汤。在奶瓶，使0.5×LB培养基。盖上铝箔奶瓶。高压釜1小时。
3. 请加入70ml 0.5X LB肉汤。倾肉汤到连续培养反应器中。放置在连续培养反应器搅拌棒。覆盖反应器箔和高压釜30分钟。
连续培养设置：
1. 菌体悬浮液。
  1. 从12.5％甘油冷冻股票，板块新鲜E.大肠杆菌克隆在含有100μg/ ml的氨苄青霉素的0.5倍的LB琼脂上。孵化在37℃下24小时。
  2. 接种单个菌落到含有100微克/毫升氨苄青霉素3毫升的0.5×LB肉汤。对于每个克隆使用生物一式三份。在37℃振荡22小时。
2. 连接部分组合在一起。
  1. 将所有材料蒸压成生物安全柜，打开紫外线灯上，而媒体的冷却。一旦媒体冷却，加入0.1％L-阿拉伯糖和100μg/ ml氨苄青霉素的所有0.5×LB肉汤。
  2. 解开连续培养反应器盖和螺钉上的反应器中。避免接触采样管。解开馈送瓶盖拧到奶瓶。避免接触采样管。
  3. 保持18 in油管连接到端口ε无菌。取消包裹18 in油管和蠕动泵管适配器。
  4. 适合在18的自由端。管到蠕动泵管适配器的一端。适合蠕动泵管适配器的另一端18 in油管连接至端口ε馈送瓶盖。
  5. 螺杆0.22微米的过滤单元到港口β和连续培养反应器δ。螺杆0.22μm的过滤器单元端口α的适配器上。到0.22微米的过滤装置，适合18的油管的自由端。
3. 开始连续培养。
  1. 在生物安全罩，接种连续培养反应器100微升O / N培养的第7.2.1.1节进行。
  2. 连续培养进入一个37℃的孵化器前，请关闭系统。在孵化器有磁力搅拌板和迷你蠕动泵设置。
  3. 适合蠕动泵管适配器插入蠕动泵。从奶瓶管开始在“以”侧和管道，导致反应器中开始于“停止”侧。
  4. 设置蠕动泵：“快速”。通过切换到R开始蠕动泵20; FORWARD“。检查媒体开始流过管路。
  5. 将反应器上的磁力搅拌板，并开始搅拌。连续培养反应器必须平衡取样前24小时。
4. 采样的连续培养。拧5ml的鲁尔乐注射器端口上γ和拉起文化4.5毫升
  1. 用文化的500微升测量密度（OD _600纳米）。稀释的细胞，使4×1毫升培养在OD _600纳米 = 0.35。
  2. 稀释分装成文化1.7毫升离心管。重复采样，每12小时4天。
5. 准备样品GC-TOFMS：
  1. 通过离心沉淀细胞以最大速度（16900×g离心）2分钟。倒出上清液。用500μl磷酸盐缓冲盐水（PBS）洗涤细胞。重复此步骤。
  2. 滗析上清液，最后一次，然后淹没离心管与沉淀的细胞在液氮中直到鼓泡停止。 S撕毁-80样品℃的冰柜。

8.运行串行通道分批培养的代谢组学

准备细菌细胞悬液。从12.5％甘油冷冻股票，板块新鲜E.大肠杆菌含有100微克/毫升克隆到0.5倍的LB琼脂氨苄青霉素。在37℃下放置24小时。
1. 接种单个菌落分为3毫升含100微克/毫升0.5×LB肉汤氨苄青霉素。利用生物一式三份的每个克隆。
串行通道分批培养。
1. 通过500倍稀释到含有50μg/ ml氨苄青霉素和0.1％L-阿拉伯糖3毫升LB肉汤中传代培养O / N从8.1.1。亚文化应该有一个外径_600纳米 <0.005。在37℃振荡。
2. 检查光密度（OD _{600 nm）的}在2和2.5小时。细胞生长达到OD _600纳米 = 0.35。
  1. 通过500倍二亚文化lution入含有50μg/ ml氨苄青霉素和0.1％L-阿拉伯糖3毫升LB肉汤中。亚文化应该有一个外径_600纳米 <0.005。
3. 检查光密度（OD _{600 nm）的}在2和2.5小时。细胞生长达到OD _600纳米 = 0.35。
抽检连续传代分批培养。
1. 使用无菌镊子，将一个0.22微米的膜过滤器上的过滤器歧管的顶部。分装1毫升磷酸盐缓冲液（PBS）的到滤纸上，然后接通真空泵。
2. 重复加入1ml PBS中。转移1毫升亚文化从8.2.3节到滤纸上。从这里出发，迅速采取行动，立即得到样品进入液氮。在1分钟内完成这一点。
3. 等分试样1ml的PBS中在滤纸上洗样品。迅速冲洗没有蔓延样品超过滤纸两侧。重复。
4. 使用无菌镊子代替过滤器进入1.7 ml离心管小心地折叠网络过滤器。淹没在液氮离心管至起泡停止。在-80℃冷冻存储样本。

9.代谢物分析与处理

每船克隆3的样品上干冰到代谢组学核心设施来样加工，分析和GC-TOFMS正常化。
对于每个样品确定的平均数，中位数，标准跨代谢变化的偏差和系数，采用复制数据。
进行统计分析，使用条件语句和重复执行²⁶去除代谢产物不遵守规定的条件手工编码一个QA管道。
1. 对于条件1，除去代谢物，其中2个以上的样本具有零丰度。从代谢的配置文件删除内部标准。
2. 对于条件2，除去那些没有在感兴趣的细胞中发现的代谢物。在这里，删除以下代谢产物：吲哚乙酸3，dihydroabiet集成电路，十九烷酸，水杨酸，水杨醛，胆甾醇，酚，1-单硬脂酸甘油酯，十八烷醇，1-甘油一棕榈酸酯，十二烷，十二烷醇，1-十六烷醇，5-甲氧基色胺，苯甲酸，十五烷酸，磷酸，壬酸，棕榈酸，癸酸，羟胺，硬脂酸，肉豆蔻酸，马来酰亚胺，左旋葡聚糖，和4-羟基丁酸。
3. 对于条件3，删除这些代谢产物的变异系数大于1。
通过观察代谢物的相对丰度捕捉全球代谢的影响。
1. 创建每个克隆的平均代谢物丰度为每个代谢物（ 图6）的可视化表示。
通过观察克隆代谢产物对频率识别异常值。
1. 计算的Z分数为每个代谢物在克隆的每个中间值。计算使用下面的等式z值：
  /52854/52854eq7.jpg“/> [7]
  注意：字词X _MC表示特定代谢物的特定克隆的丰度水平。术语_μC表示所有克隆的特定代谢物的平均值。长期_σC是相关的标准偏差。
2. 创建在其中离群突出显示的数据的可视化表示（未提供数据）。

Representative Results

用于确定在本研究选择的开放阅读框（ORFs）的所有样品从星巴克岛，站点7（STAR7）和Caroline环礁南部线群岛站点9（CAR9）收集。据估计，100升从这些站点海水采集珊瑚边界层使用舱底泵下面，如前面描述的^5。泵的内容受分数化通过大细孔过滤器，以去除小的真核生物，随后浓缩使用100kDa的切向流过滤器，只留下微生物和病毒样颗粒（VLP）。为了分离病毒样颗粒，剩下的海水被穿过导致virome 0.45微米的过滤器。氯仿引入此病毒级分以阻止任何剩余的细胞的生长，并储存在4℃。

的VLPs用氯化铯方法，其中，密度梯度分离，通过离心分离，并允许的vir回收纯化离子在〜1.35克/毫升至1.5微克/毫升^3。使用的CTAB /苯酚病毒DNA的提取：氯仿协议，并通过使用Phi29试剂多重置换扩增扩增。在virome的测序完成与市售的焦磷酸测序技术。

在加工和选择的病毒ORF的用于该研究的生物信息学，如下。三个预加工步骤中使用的CAR9和STAR7病毒宏基因组。首先，公共软件被用来除去在测序之前²⁷从病毒DNA的扩增，导致标签序列。第二，共同测序等文物序列重复和低拷贝数通过附加的生物信息学计划²⁸滤出的数据集。最后，进行对于那些有≥90％的覆盖率和在以下数据库序列≥94％同一性的序列去除外来序列污染^29：的RefSeq v病毒属的基因组;人类 - 参考GRCh37;人类 - 塞莱拉基因组学;人类 - 克雷格·文特尔（HuRef）;人 - 晟金金（韩国）;人 - 染色体7版本2（TCAG）;与人类-詹姆斯·沃森，炎黄（YH;亚洲），约鲁巴语（NA18507;非洲）的参考序列^21。下面的这些过程，从CAR9样本序列总计为591600和STAR7序列总计为939311。这些序列上传到MGRAST，并通过使用默认设置汇编软件组装。重叠群被翻译成使用脚本进行鉴定6阅读框和推定的开放阅读框（pORFs），如前所述^21。

识别未知的ORF进行了若干基于相似性搜索以除去已知功能的ORF。简要地说，下面的搜索进行与其相应的搜索标准^21：

在≥≥95％的同一性的显著相似40个碱基对（bp）由MGRAST BLAT在M5NR数据库。
显著的相似性（E值≤0.001），通过对TBLASTN在我的宏基因组数据库资源的所有公共宏基因组。
显著的相似性（E值≤0.001），通过BLASTP和TBLASTN对NR的数据库。
显著的相似性（E值≤0.001），通过对保守结构域数据库RPS-BLAST。
从每个数据集的选定部分蛋白质的翻译相比较解决的蛋白质结构中的蛋白质数据库。
计算使用二核苷酸签名包二核苷酸的频率。

所得pORFs被设计为在大肠杆菌中表达使用大肠杆菌公开可用的基因设计软件。采用通用密码子使用表设计，以适应表达E.回译的氨基酸序列大肠杆菌中的2％的最小使用量阈值。限制性内切酶识别序列S表示BamHI和HindIII被排除在序列以有利于克隆。外部公司合成的工程基因序列³⁰和然后的ORF克隆到一个中等拷贝数的pBAD启动子载体，pEMB11，通过标准限制酶克隆。所有克隆转化E.大肠杆菌 K-12菌株BW 27784 ^23。

多表型检测板（MAPS）

高吞吐量和强大的软件管道被利用的地图，PMAnalyzer ²⁴的分析。该管道被开发在Linux服务器环境并执行各种步骤，包括：光密度文件解析，格式化数据转换成可读的文本文件，预处理的质量保证的生长曲线（QA），以及执行数学建模技术来分析生长曲线。主要的建模脚本是用Python开发的版本2.7.5尽量使用PyLab模块。

图2A）进行了评估。生的生长曲线进行比较，以物流生长曲线，以确定是否该方案PMAnalyzer在实验期间准确参数和模型克隆生长（数据未示出）。有关MAP和PMAnalyzer的准确性和有效性的进一步信息请参阅奎瓦斯等人 ²⁴

下面该方法的有效性，地图数据用的是多个参数，诸如最大生长速率_（μmax）和增长水平（GL）中，由处理管线提供了分析。的生长曲线比较的可视化通常用于生长数据解释;然而，可以在一个时间被可视化的比较曲线的数量有限制。同时分析大量的生长曲线，热图派生样地恳求比较几十生长在一个单一的substrat克隆Ë针对该状况的平均响应（ 图2B）。通过放置一个新的噬菌体蛋白的过表达的影响是通过改变曲线参数观察，具体是：迟滞期，指数期和最大生物质产量（渐近线）。作为一个例子，在陡峭的上升从滞后期到建模为衣壳蛋白（ 图2A）的生长曲线指数期通过从黑色的颜色强度的快速变化在图2B的动态情节重放以白色为同一克隆。

以获得跨越基板克隆分布的全球画面，从总帐衍生的表型的分类中使用（ 图3）。这里，四个表型是分开成四个图表，其中每个条的高度表示克隆显示该表型的特定基片的数量。在数据异常值被确认为克隆陷入“收益的福nction“或”功能“一类的损失。离群然后可以单独找出并研究更紧密地实验。此外，全球分析识别衬底偏压在测定。基材如苯丙氨酸，苹果酸，以及甘氨酸导致“无生长”的分类。基材，始终陷入零增长的分类，在所有克隆，不重加权下游功能特性。

代谢组学

被确定使用从代谢组学表达克隆的噬菌体未知基因的分解代谢产物。简单地说，克隆下分批培养环境或者连续培养或串行通道被发送出去GC-TOFMS分析在代谢组学核心设施之前增长。对样品进行处理，分析，和归一化的细节为通过所选择的核心设施实施的GC-TOFMS看到Fiehn 等人 ³¹收益指数EFLY，将1ml冷提取溶剂加入到每个样品，在这之后的样品涡旋并超声处理在冷浴中5分钟。样品最终离心和一半的样本被倾析并干燥下来用于分析。提取物是纯化的和被装载到气相色谱仪，随后转移到质谱仪之前掺入内部保留指数标记。从每个样品的数据进行分析，使得对于在色谱所有探测到的信号的信号强度的报告。为归一化，峰的丰度为每个样本相加，总峰丰度在该组的所有样本之间的平均值。每个样品的代谢产物的丰度是通过将样品的峰丰度除以然后由平均峰值丰度的样本集的相乘。所得数据用于代谢组学中所讨论的研究的分析。

代谢组学的重复性验证被要求确定每个培养方法的适宜样本量。为了检测样品中看到了精度和看到整个样品的变化为两个n = 3和n = 6的数据集进行了综述（ 图5B）大小的平均值（S _M）的标准误差。不管连续培养（CC）的样本量，数据的不到1％有S _M≤1.5。平均S _米每秒是221和300，和值从0到7.55×10 ⁵和3.74×10 ^5，对于n = 3和n = 6分别之间。 S _{m S后}也计算为每组样本的复制在串行培养（SC）的方法。再次，数据的不到1％有S _{M≤1.5，137}中值S _M，并且一个范围从0到3.51×10 ^5。为了比较各样品组之间的S _M分布（CC n = 3的VS 。CC N = 6，CC N = 3 与 SC N = 3，和CC N = 6 与 SC N = 3）进行置换测试。该DISTRIB的是连续培养S _M值数据集ution没有显著不同从串行培养S _M的值（p值= 0.0）的分布。然而，S _M值的连续培养n = 3的数据的分布是显著不同于S _M值的连续培养每组6的数据（p值= 1.908804×10 ^-49）。最后，每代谢变异系数进行比较之前和执行质量保证（QA）步骤之后（ 图5C）。总共210代谢物实施QA管道（数据的40％）的后除去。除去的数据的不到1％过零代谢物的丰度，〜2％为内标数据，〜5％，从代谢物数据以前从未在大肠杆菌中观察到的大肠杆菌 ，其余的代谢产物（> 30％）的变化大于1的系数。

与地图分析，全球观测中NS提供的信息代谢提供了深度的初步认识。以获得全球画面，克隆被分层群集基于它们的相对代谢物的丰度提供关于克隆代谢物轮廓，具有相关功能的潜在的克隆，并克隆代谢异常值（ 图6）的信息。以突出显示蛋白质的功能，代谢物被分离并基于共同代谢途径进行分组。使用该分析用的初步结果，很明显，代谢是能够分离的基因从不同种类的（ 图6，突出的克隆）。此外，异常识别与代谢数据，通过计算标准分数（Z分数）为每个克隆代谢产物对确定。以确保统计意义，离群值被定义为一个克隆的代谢物对为2 Z评分值，占数据的5％（数据未显示）。

ether.within页=“总是”>
图1.定义表型分类的。（A）的增长水平（GL）和最大生长速率的关系。红色圆圈数据点表示生长曲线显示几乎没有基板利用率。 （B）的箱线图表示限定生长阈基于的生长曲线以最小生长速率（<0.15的OD /小时）的分布。 （C）的 GL的方差和标准偏差被计算为基板D-半乳糖。短虚线代表两个标准差离平均值。请点击此处查看该图的放大版本。

highres.jpg“/>
图2的MAP经由精度和分化的验证。（A）用于注解的结构（衣壳）和代谢克隆的生长曲线（硫氧还蛋白），两个新的代谢克隆（EDT2440，EDT2441）和克隆的平均响应上生长蔗糖，D-半乳糖和D-甘露糖的地图。蓝线表示看到复制数据的标准误差（N = 3）。 （B）中的47个不同克隆的生长曲线表示为蔗糖，D-半乳糖和D-甘露糖的热图。附加说明的结构（绿圈）和代谢克隆（橙色圆圈），两个新的代谢克隆（深色和浅色蓝色圆圈），平均响应（红圈）突出显示。请点击此处查看该图的放大版本。

PLOAD / 52854 / 52854fig3highres.jpg“WIDTH =”700“/>
图3.对于跨越多个基材每个表型的克隆的分布。表型克隆计数跨72个碳特异性生长条件47克隆。表提供每个表型直接计数。请点击此处查看该图的放大版本。

图4.图详述了连续培养装置的结构：（A）用于构建α-γ的连续培养反应器的端口的步骤，（B）的步骤用于构建连续培养反应器的出流端口，以及（C ）的步骤来建立港口δ和连续培养奶瓶ε。 =“https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg”目标=“_空白”>点击此处查看该图的放大版本。

图5.比较颁发的phenomic方法。（A）工作流的多型检测板（MAPS），连续培养和连续培养的准备。 （B）的平均值的标准误差（S _M）的百分比计算为两个n = 3和n = 6的样本大小为连续培养（CC）和串行培养（SC）的制备方法的代谢。 y轴是对数尺度。 （C）每变化代谢物（CV）的系数的分布，实施前和实施质量保证管线的连续培养（CC）方法之后。g5highres.jpg“目标=”_空白“>点击此处查看该图的放大版本。

在连续培养中生长的克隆。图6.代谢组配置文件。平均代谢物的丰度的一组代谢物的标绘于连续培养物中生长84个克隆。对于注解结构（衣壳）和代谢克隆（硫氧还蛋白），两个新的代谢克隆（EDT2440，EDT2441），平均代谢反应代谢产物的配置文件以红色突出显示。请点击此处查看该图的放大版本。

复合	碳	氮	硫	磷
甘油	-	0.40％	0.40％	0.40％
氯化铵	9.5毫米	-	9.5毫米	9.5毫米
硫酸钠	0.250毫米	0.250毫米	-	0.250毫米
硫酸镁	1.0毫米	1.0毫米	-	1.0毫米
磷酸钾	1.32毫米	1.32毫米	1.32毫米	-
氯化镁	-	-	*	-
氯化钾	10毫	10毫	10毫	10毫
氯化钙	0.5μM	0.5μM	0.5μM
氯化钠	5毫米	5毫米	5毫米	5毫米
氯化铁	6μM	6μM	6μM	6μM
L-阿拉伯糖	0.10％	0.10％	0.10％	0.10％
MOPS pH值7.4	1X	1X	1X	1X

表1中的化合物，并在MAP中所使用的不同基本培养基的浓度。 * 1.0毫氯化镁被取代。 1X MOPS = 40毫米MOPS，4毫米曲辛。

L-赖氨酸

碳底	氮基	含硫基	Phosphorus基板
2脱氧-D-核糖	2-脱氧-D-核糖	1-丁烷磺酸	腺苷-5-单磷酸
4羟基 - 苯基乙酸	乙酰胺	乙酰半胱氨酸	的β-磷酸甘油
醋酸	腺嘌呤	D-半胱氨酸	creatinephosphate
腺苷-5-单磷酸酯	腺苷	D-甲硫氨酸	D-葡萄糖-6-磷酸
核糖	尿囊素	二乙基二硫代磷酸酯	二乙基二硫代磷酸酯
的α-D-葡萄糖	的β-苯乙胺	DL-乙硫氨酸	DL-α-甘油磷酸
的α-D-乳糖	缩二脲	谷胱甘肽	磷酸钾
的α-D- melebiose	胞苷	羟乙磺酸	焦磷酸钠
柠檬酸	胞嘧啶	L-磺基酸	硫代硫酸钠
D-丙氨酸	D-丙氨酸	L-半胱氨酸
D-阿拉伯糖	D-天冬酰胺	L-djenkolic酸
D-阿拉伯糖醇	-D-天冬氨酸	L-甲硫氨酸
D-天冬酰胺	D-半胱氨酸	硫酸镁
-D-天冬氨酸	D-葡糖胺	甲烷磺酸
D-纤维二糖	D-谷氨酸	N-乙酰基-DL-蛋氨酸
D-半胱氨酸	DL-α-氨基-N-丁酸	N-乙酰基-L-半胱氨酸
D-果糖	D-甲硫氨酸	钾四叔thionate		D-半乳糖	D-丝氨酸	硫代硫酸钠
D-葡糖胺	D-缬氨酸	sulfanic酸
D-葡萄糖	伽马氨基-N-丁酸	牛磺酸
D-葡萄糖-6-磷酸	甘氨酸	牛磺胆酸
D-谷氨酸	胍	硫脲
D-甘露糖	组胺
D-棉子糖	肌苷
D-核糖	L-丙氨酸
D-杨素	L-精氨酸
D-丝氨酸	L-天冬酰胺
D-海藻糖	L-瓜氨酸
D-木糖	L-半胱氨酸
半乳糖醇	L-谷氨酸
甘油	L-谷氨酰胺
甘氨酸	L-谷胱甘肽
我赤藓糖醇	L-组氨酸
肌苷	L-异亮氨酸
L-丙氨酸	L-亮氨酸
L-阿拉伯糖	L-赖氨酸
L-糖醇	L-甲硫氨酸
L-天冬酰胺	L-鸟氨酸
L-天冬氨酸	L-苯丙氨酸
L-磺基酸	L-脯氨酸
L-半胱氨酸	的L-焦谷氨酸
L-岩藻糖	L-丝氨酸; L-苏氨酸
L-谷氨酸	L-色氨酸
L-谷氨酰胺	L-缬氨酸
L-异亮氨酸	N-乙酰基-D-葡糖胺
L-亮氨酸	腐胺
硫脲
L-甲硫氨酸	胸苷
L-苯丙氨酸	胸腺嘧啶
的L-焦谷氨酸	酪胺
L-鼠李糖	酪氨酸
L-丝氨酸	尿苷
L-山梨糖
L-苏氨酸
L-色氨酸
L-缬氨酸
L-木糖
乳酸
乳果糖
苹果
肌醇
草酸
山梨酸钾
丙酸
腐胺
奎尼酸
丙酮酸钠
琥珀酸钠
蔗糖
胸苷
木糖醇

表2列出了MAP实验中使用的基板。

Discussion

在这里，我们提出phenomic的方法推定噬菌体基因的功能特性。技术包括一种能够监控主机同化代谢开发的试验中，多表型分析板（MAPS），除了已建立的代谢的方法，能够测量作用于分解代谢的。我们提供了更多的工具来管理这些技术所产生的大数据集，允许高吞吐量处理和分析^24。最后，通过注释的噬菌体衣壳蛋白，硫氧还蛋白噬菌体，两个推定代谢噬菌体的基因，平均响应实验的比较，我们提出各种策略来解释两个数据集和基因类，重点是识别表型的发展趋势和识别异常值的。

如前所述，这两种方法定量测量只有一半宿主代谢。为了解释任何的相对功能根据调查的新的蛋白质，从两种方法的数据是必需的，以提供的功能的证据。虽然这不是我们目前的手稿的一个重点，从每个phenomic方法，数据输出是通过组合的分析，重点集群技术，如随机森林和主成分分析投入。此外，从组合分析所得的假设必须随后通过传统的遗传方法验证。

最后，该方法提出了被很大程度上受到细菌生理学的影响，因此，按照同样的标准。当进行这两种方法，考虑需要进行，以确保独立，克隆群体试行;污染预防;一个单可变正在测试;和适当的控制正在同时运行。如果不考虑这些问题会导致不明确的结果，类似于任何生理检测。

多表型检测板（MAPS）

MAP的发展提供了高通量和适应性强的测定相比现有技术（ 图5A和表1,2）。该测定法使用的用品，设备，和基本技术，可以在所有微生物学实验室。一个计算管道的掺入，PMAnalyzer ^24，用于随后的数据处理和分析，确保快速的数据解析。另外，该方法的两个实验和分析方面可容易地调节或调谐定制的目的。例如，如果数据的相当大的比例没有通过在部分4中概述的过滤，可以通过手动的生长曲线筛选，以确定问题。如果问题的产生是由于严格的滤波器参数，调整该脚本可。或者，如果问题都与实验过程相关（即凝结时间延长;不当细菌转移的CELLS等），那么附加的重复，可以容易地重复。

作为奎瓦斯等 ²⁴所描述的，PMAnalyzer是写成一个执行的解析和分析脚本作为一个有凝聚力的，自动化的流水线包装脚本一个bash程序。所有脚本都从一个Git仓库通过取中值跨数据一式三份每个时间点可以自由进出^，25，随后参数化物流曲线获得的滞后时间，最大的增长速度，渐近线，以及一个新的名词，增长水平。的中间值被选择了的平均值在我们的研究中，以减少大型离群的效果，然而，该脚本可以容易地适于计算复制数据的平均值。由于减少了变化（SE）看到对面复制数据（ 图2A），我们维持使用中的PMAnalyzer中位数为拟合逻辑曲线。此外，在该研究的切断成长（GL≥0.4）为DETE通过比较数据跨增长水平和最大生长速率如何分离rmined（ 图1A，B）。根据所用这个词可能会有所不同的仪器和模型系统，要求重新界定这一对临界值。

我们的测定法的主要优点是能够比较使用单一参数表征整体微生物的生长，我们定义为生长水平（GL）的表型的能力。 GL是调和平均，并因此减轻了大的异常值的数据的影响。使用调和平均移与物流配值以提供经济增长的总结乃通过试验和错误。其他方法试图区分生长包括：花费的时间达到特定的曲线参数（半μ _{最大值，μmax}和承载能力），确定（R ^2）的系数，以及R ²乘以特定曲线参数的组合。使用调和平均值与移为总帐物流入值提供的最大范围在评价生长，从而它成为所选择的方法。一个考虑需要注意的是动态增长曲线图案具有使用一个参数或拟合模型时，丢失的可能性。例如，该逻辑曲线和GL的各个曲线的参数是不能代表双相生长。在一个单一的碳的环境中，对生长这种效应意味着病毒蛋白的调解对底物利用衬底或转移的任一转换。在不考虑多个生长参数可能丢失的附加效果包括：延长滞后时间，建议病毒机器或产品的负担增加;迅速加快指数阶段，建议连接到主机的能源生产途径的病毒蛋白;或更高水平的生物质的形成，这意味着在主机养分吸收，同化病毒载体（数据未显示）。因此，新生绘制生长曲线（

当考虑贡献的在MAP的结构和代谢的基因的不同反应，可以观察到有问题的不同的衬底类提供了蛋白质功能的最大证据。例如，代谢的蛋白质通常与采集限制性营养物质，这些都是非特异性主机中心代谢^16,32相关联。初步的MAP实验表明，克隆窝藏推定代谢噬菌体基因都具有增加的滞后期上中心代谢的碳源（ 图2A）上生长时。相反，克隆携带假定结构基因，这需要主机和能源的dNTP池的大比例，导致对增长百分之假阳性反应拉尔和氨基酸代谢的碳底物。这可能是由于导致宿主丝状和/或包涵体不溶性蛋白质的积累，通过显微镜（ 图2A和数据未显示）所观察到的。同时进一步分析，以验证这些初步结果，该地图是能够检索的关联到具体的假设基因噬菌体类的功能表型反应。

除了未知病毒蛋白的澄清，地图是一种新颖的资源调查个体细菌的功能和代谢多样性或细菌的群落。地图部件的设计，便于改造支持一系列细菌的生长;包括海洋，营养缺陷型和厌氧微生物。为了便于这些努力已定义的基底和预生长培养基需要额外的或调节的化学物质之前，不同的细菌属可以在MAP中得到支持。在此使用的MAP的一个音符是维持确定的培养基，禁止使用的成分，如蛋白胨，酵母提取物和蛋白胨。

代谢组学

代谢组学的领域是依赖于代谢物数据库，其中包括通过质谱法鉴定分离的代谢物。这里所选择的核心设施具有最大代谢数据库之一。有趣的是，有一半以上来自我们experimentations产生的代谢物是不可识别的（〜65％），而其他人以前从未被记录在我们的宿主大肠杆菌 （例子包括：吲哚3乙酸^33，水杨酸^34，和二氢松香酸^35）。这一事实可能归因于对植物的代谢物，或所研究的特定蛋白质数据库的任一强烈的偏见。无论如何，结果是已知的可用于数据表示和分析代谢物的数量有限。在福TURE，使用各种数据库的多个代谢组学方法将允许更大范围的代谢物。

目前，已知的和比较和对比了新颖的病毒蛋白时未知的代谢物被使用。使用这种方法，我们假设克隆窝藏功能相似的蛋白质将分享他们的完整代谢轮廓增加相似性。初步代谢分析显示，而结构和代谢基因不明确地互相分离，这些基因表现出在主机上类似的效果，当过量表达不相关（ 图6）。例如，注释的衣壳基因簇紧密地与推定代谢基因在这项研究中，EDT2440和EDT2441突出显示。使用公众可用的跨膜拓扑结构和信号肽预测程序调查显示的证据表明，这两个推定代谢基因窝藏一个跨膜结构域。有趣的是5日出来的Ë9个克隆的第一个群集组（最左边的树状图的部分）的预测使用相同的拓扑结构方案跨膜结构域。需要进一步的研究，但是，它很可能是这些克隆的过度表达期间存在的代谢物与细胞应激反应从膜或结构性负担所得相关联。这方面的证据支持，虽然代谢数据具有噪声的增加量，该方法能够突出，区分基因的一般效果，无论是在和跨基因类信号。为了确定所述方法是否能够提取出的基因功能的特定信息的，代谢物被分为特定的代谢途径。该假说的存在，如果一个克隆影响特定于单个通路的代谢产物，然后过表达的基因是激活该途径。在此之前，我们建立了代谢组学的质量保证管线，初步数据显示，有超过一ð代表性不足的代谢产物是典型的“未知”，对与其相关的通路提供的信息很少（数据未显示）。预处理代谢数据，但是，发现，大多数人的代谢物轮廓相似，只有未知和已知代谢物的丰度的选定数量跨越克隆有所不同，例如腐胺和尿嘧啶（ 图6）。以提供蛋白质的功能的努力的更大的分辨率正在作出通过实验与已知的噬菌体的基因，其可以用于填充在代谢物的基础功能表征的“洞”比较新颖的噬菌体基因。使用这种技术，已知的病毒基因所分配的功能提供的未知基因的功能的基准。尽管如此，代谢组学分析的限制因素是数据库的大小和相关性。为了纠正这些限制，听上去很像这项研究代谢数据库需要开发;这样作为代谢产物的特定对大肠杆菌的ASKA收集数据库及其丰度大肠杆菌克隆在其中的单个的ORF过表达^36。在2013年提供了这样的数据库需要证据时，研究人员在Lawerence伯克利国家实验室编制具体型号细菌³⁷的整个突变体文库代谢产物的第一个全面的数据库。这项研究提供了新的洞察需要利用特定的代谢物基因，揭示表型和基因型之间的明确联系。

当考虑代谢作为一种工具，重要的是要确定的处理机制，随后在核心设施。大多数实验步骤的工件与使用的仪器有关的一天到一天的差异。迄今所有的GC-MS分析实现利用了包含在每个分析跑内部标准;然而，除了项目具体的内部样品的</ em>的运行试验中的每一天额外的去除变异。这些因素必须尽早解决，以避免正常化的问题和偏见。另一种解决方案是处理所有样品在同一机器上的核心设施，作为一个单一的批次，在任何核心设施可用的选项。

各种工具都推出并重新探讨这个手稿提供新的手段，筛选和鉴定未知功能的基因的噬菌体。的实验技术与流线形使用计算管道的简单性和适应性，保证这些方法可应用于广泛的研究工作和领域。我们的目标是，这里介绍的方法phenomic将有助于在新的除蛋白噬菌体进一步调查，他们也都同样在功能上不确定的系统。

Materials

Name	Company	Catalog Number	Comments
0.22 µm Sterivex Filter	Fisher Scientific	SVGP01050	Millipore
0.22 µm Millex Filters	Fisher Scientific	SLGV033RS	Millipore
0.22 µm SteriCap Filter	Fisher Scientific	SCGPS02RE	Millipore
0.22 µm Omnipore membrane filters	Millipore	JHWP02500	Millipore
96-well micro-titer plates	VWR	82050-764	Standard F-Bottom 96 well Microplates
2 ml 96-well plate	Fisher Scientific
Adhesive seal plate film	Sigma-Aldrich	Z369667
2 L Nalgene square bottles	Cole Parmer	T-06040-70
125 ml Nalgene square bottles	Cole Parmer	T-06040-50
1/4 in. Panel mount lock nut, black nylon	Cole Parmer	EW-45509-04
Female Luer thread style panel mount to 200 Series Barb, 1/16 in.	Cole Parmer	EW-45500-30
Female Luer thread style panel mount to 200 series barb, 1/8 in.	Cole Parmer	EW-45500-34
Male Luer integral lock ring to 500 series barb, 1/16 in. ID tubing	Cole Parmer	EW-45505-31
Male Luer with lock ring x female Luer coupler	Cole Parmer	T-45508-80
Barbed bulkhead fittings, 1/4 in. OD	Fisher Scientific	6149-0002
Sanipure tubing, 1/16 in. ID x 1/8 in. OD	SaniPure	AR400002
Sanipure tubing, 1/4 in. OD x 1/8 in. ID	SaniPure	AR400007
Variable flow mini pump (peristaltic pump)	Fisher Scientific	13-876-1
Magnetic stirrer	Velp Scientifica	F203A0160
Forceps	Fisher Scientific	14-512-141	Millipore* Filter Forceps
Multi-plate spectrophotometer plate reader	Molecular Devices Analyst GT
Filter manifold	Fisher Scientific	XX10 025 02
Software:
Python version 2.7.5			http://www.python.org/
PyLab module			http://wiki.scipy.org/PyLab
R version 3.0.1			http://www.r-project.org/
reshape2 library			http://had.co.nz/reshape
ggplot2 library			http://ggplot2.org/
Gene Composer	PSI Tech Portal		http://www.genecomposer.net
Services:
West Coast Metabolomics Center	UC Davis		http://metabolomics.ucdavis.edu
DNA 2.0			https://www.dna20.com