Bioengineering

通过工程、条形码和筛选腺相关病毒（AAV）衣壳变体分离下一代基因治疗载体

Published: October 18, 2022 doi: 10.3791/64389

Kleopatra Rapti^1,2, Olena Maiakovska^1,2, Jonas Becker^1,2, Joanna Szumska^1,2, Margarita Zayas^1,2, Felix Bubeck^1,2, Jixin Liu^1,2, Emma Gerstmann^1,2, Chiara Krämer^1,2, Ellen Wiedtke^1,2, Dirk Grimm^1,2,3,4,5

¹Department of Infectious Diseases/Virology, Section Viral Vector Technologies, Medical Faculty, University of Heidelberg, ²BioQuant Center, BQ0030, University of Heidelberg, ³Cluster of Excellence CellNetworks, ⁴German Center for Infection Research (DZIF), ⁵German Center for Cardiovascular Research (DZHK)

Summary

AAV肽显示文库生成，随后通过条形码对具有新颖特性的候选物进行验证，以创建下一代AAV。

Abstract

源自腺相关病毒（AAV）的基因递送载体是治疗遗传疾病的最有前途的工具之一，令人鼓舞的临床数据和几种AAV基因疗法的批准证明了这一点。AAV载体成功的两个主要原因是（i）先前分离出具有不同特性的各种天然存在的病毒血清型，以及（ii）随后建立了强大的分子工程技术，并在高通量中再利用。最近实施的策略进一步提高了这些技术的潜力，用于在DNA和RNA水平上对选定的AAV衣壳进行条形码编码，允许它们在单个动物的所有主要器官和细胞类型中进行全面和平行的体内分层。在这里，我们提出了一个包含这组互补途径的基本管道，使用 AAV 肽显示来代表可用衣壳工程技术的各种库。因此，我们首先描述了生成AAV肽显示库的关键步骤，用于体内选择具有所需特性的候选药物，然后演示如何对最有趣的衣壳变体进行条形码编码以进行二次体内筛选。接下来，我们举例说明了创建用于下一代测序（NGS）文库的方法，包括条形码扩增和衔接连接，最后概述了NGS数据分析中最关键的步骤。由于这里报告的协议是通用和适应性强的，研究人员可以很容易地利用它们来丰富他们最喜欢的疾病模型中的最佳AAV衣壳变体和基因治疗应用。

Introduction

基因转移疗法是在细胞中引入遗传物质以修复、替换或改变细胞遗传物质，以预防、治疗、治愈或改善疾病。体内和离体基因转移依赖于不同的递送系统，非病毒和病毒。病毒已经自然进化，可以有效地转导其靶细胞，并可用作递送载体。在基因治疗中使用的不同类型的病毒载体中，腺相关病毒已被越来越多地使用，因为它们缺乏致病性、安全性、低免疫原性，最重要的是它们能够维持长期、非^{整合的表达}1，²^，³。AAV基因治疗在过去十年中取得了相当大的成就;三种疗法已被欧洲药品管理局和美国食品和药物管理局批准用于人类³^，⁴。一些临床试验也正在进行中，以治疗各种疾病，如血友病、肌肉、心脏和神经系统疾病，详见^{其他专题3}。尽管取得了数十年的进步，但基因治疗领域近年来经历了一系列挫折⁴，最重要的是临床试验中的死亡⁵由于剂量限制性毒性而被搁置，特别是对于巨大的组织，如肌肉，或难以触及的组织，如大脑⁶。

目前用于临床试验的AAV载体属于天然血清型，但少数例外¹。AAV工程为开发具有卓越器官或细胞特异性和效率的载体提供了机会。在过去的二十年中，已经成功应用了几种方法，例如肽显示，环交换，衣壳DNA洗牌，容易出错的PCR和靶向设计，以生成具有不同性质的单个AAV变体或其文库⁷。然后对它们进行多轮定向进化，以选择其中具有所需特性的变体，如其他地方1^，³所述。在所有衣壳进化策略中，肽显示AAV文库使用最广泛，这是由于一些独特的性质：它们相对容易生成，并且可以实现高多样性和高通量测序，从而允许跟踪它们的进化。

第一个成功的肽插入AAV文库是在大约20年前描述的。在第一个中，Perabo等^人8构建了一个修饰的AAV2衣壳文库，其中随机生成的寡核苷酸池入质粒中，位置对应于VP1衣壳蛋白的氨基酸587，在从衣壳突出的三倍轴上。使用腺病毒混合感染，AAV文库通过多轮选择进化，最终的重新靶向变体被证明能够转导亲本AAV2⁸难治的细胞系。此后不久，Müller等^{人9引入了} 用于文库生产的两步系统，这是对该协议的重大改进。最初，质粒文库与腺病毒辅助质粒一起用于产生含有嵌合衣壳的AAV文库。该AAV穿梭文库用于感染低感染多重性（MOI）的细胞，目的是为每个细胞引入一个病毒基因组。与腺病毒的混合感染可确保产生具有匹配基因组和衣壳⁹的AAV。大约十年后，Dalkara¹⁰ 使用体内定向进化创造了7m8变体。该变体具有10个氨基酸插入（LALGETTRPA），其中三个充当接头，并在玻璃体内注射后有效地靶向视网膜外层¹⁰。这种工程衣壳是一个非凡的成功故事，因为它是迄今为止为数不多的进入临床的工程衣壳之一¹¹。

随着二代测序（NGS）技术的引入，该领域经历了第二次推动。Adachi et al.12 在 2014 年和 Marsic et ^al.13 在 2015 年的两篇出版物展示了 NGS 以高精度跟踪条形码 AAV 衣壳文库分布的能力。几年后，条形码区域的NGS适应肽插入区域以跟随衣壳的演变。Körbelin等人¹⁴进行了NGS引导的筛选，以确定基于肺靶向AAV2的衣壳。NGS分析有助于计算三个评分：选择轮之间的富集评分，确定组织特异性的一般特异性评分，最后是^{综合评分14}。Gradinaru实验室¹⁵在同一年发表了基于Cre重组的AAV靶向进化（CREATE）系统，该系统有助于细胞类型特异性选择。在这个系统中，衣壳文库携带一个Cre可逆开关，因为polyA信号两侧有两个loxP位点。然后将AAV文库注射到Cre小鼠中，其中polyA信号仅在Cre+细胞中倒置，为反向PCR引物与衣壳基因内的正向引物结合提供模板。这种高度特异性的PCR救援能够鉴定AAV-PHP。可以穿过血脑屏障的B变体¹⁵。该系统进一步发展为M-CREATE（Multiplexed-CREATE），其中NGS和合成文库生成被集成到管道¹⁶中。

来自Maguire实验室¹⁷的基于RNA的改进版本iTransduce允许在DNA水平上选择功能转导细胞并表达其基因组的衣壳。肽显示文库的病毒基因组包括由普遍存在的启动子控制的Cre基因和在p41启动子控制下的衣壳基因。将该文库注射到tdTomato上游具有loxP-STOP-loxP盒的小鼠中。用AAV变体转导的细胞，这些变异体表达病毒基因组，因此Cre表达tdTomato，并与细胞标记结合，可以进行分类和选择¹⁷。类似地，Nonnenmacher等人¹⁸ 和Tabebordbar等人¹⁹ 将衣壳基因库置于组织特异性启动子的控制之下。注射不同动物模型后，使用病毒RNA分离衣壳变体。

另一种方法是使用条形码来标记衣壳库。Björklund实验室²⁰ 使用这种方法对肽插入衣壳文库进行条形码编码，并开发了条形码理性AAV载体进化（BRAVE）。在一个质粒中，将Rep2Cap盒克隆在倒置末端重复序列（ITR）侧向表达黄色荧光蛋白（YFP）的条形码标记转基因旁边。使用帽末端和条形码开头之间的loxP位点，体外 Cre重组产生足够小的NGS片段，从而允许肽插入与唯一条形码（查找表，LUT）相关联。使用质粒文库进行AAV生产，并在体内应用后再次使用NGS²⁰筛选mRNA中表达的条形码。当衣壳文库包含整个衣壳基因的变体（即洗牌文库）时，需要使用长读长测序。一些小组使用条形码来标记这些不同的库，这使得NGS具有更高的读取深度。Kay 实验室²¹ 用帽 polyA 信号下游的条形码标记了高度多样化的衣壳洗牌文库。第一步，生成条形码质粒文库，并将洗牌衣壳基因文库克隆到其中。然后，MiSeq（短读长，高读深）和PacBio（长读长，低读深）NGS以及Sanger测序的组合用于生成他们的LUT²¹。2019年，Ogden和来自Church^{Lab 22} 的同事使用在每个位置都有单点突变、插入和缺失的文库描绘了AAV2衣壳对多种功能的适应性，最终实现了机器引导设计。为了生成文库，合成衣壳基因的较小片段，用条形码标记，进行下一代测序，然后克隆到完整的衣壳基因中。NGS数据用于生成LUT。然后仅使用条形码和短读取序列对库进行筛选，这反过来又允许更高的读取深度²²。

条形码文库主要用于筛选已知、天然和工程变体的池，经过几轮衣壳文库的选择或独立于衣壳进化研究。这种文库的优点是有机会筛选多个衣壳，同时减少动物数量并最大限度地减少动物之间的变异。将这项技术引入AAV领域的第一批研究是在大约十年前发表的。Nakai实验室12用一对¹² 核苷酸条形码标记了191个双丙氨酸突变体，覆盖AAV9的VP1上的氨基酸356至736。使用NGS，在 体内筛选 文库的半乳糖结合和其他性质¹²。Marsic及其同事在1年后使用双条带分析描绘了AAV变体的生物分布¹³。最近一项针对非人灵长类动物的研究比较了使用不同递送途径的29个衣壳在中枢神经系统中的生物分布²³。我们的实验室最近发布了183种变体的条形码AAV库屏幕，其中包括天然和工程AAV。DNA和RNA水平上的这些筛选导致在小鼠中鉴定出高度肌致性AAV变体²⁴以及在小鼠大脑中显示出高细胞类型特异性的其他变体²⁵。

在这里，我们描述了这项工作中使用的方法，并对其进行了扩展，以包括AAV肽显示文库的筛选。这包括生成AAV2肽显示文库，用于定量的数字液滴PCR（dd-PCR）方法，最后是用于分析AAV变体的NGS管道，部分基于Weinmann及其同事^的工作24。最后，提供了条形码AAV文库的生成和同一出版物中使用的NGS管道的描述。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. AAV2随机7-mer肽显示文库制备

注意：为了制备AAV2随机肽显示文库，将简并寡核苷酸合成为单链DNA，将其转换为双链DNA，酶解，连接受体质粒并电穿孔。

简并寡核苷酸的设计
1. 对简并寡核苷酸进行排序，避免密码子偏差。在寡核苷酸5'CAGTCGGCCAG AG W GGC （X01）⁷ GCCCAGGCGGCTGACGAG 3'中，X01对应于20个密码子，每个密码子编码20个氨基酸中的一个。W可以是A或T，产生密码子AGA或AGT，其编码氨基酸精氨酸（R）或丝氨酸（S）。
2. 订购扩增引物：5' CTCGTCAGCCGCCTGG 3'（详见图1 ）。这会产生以下蛋白质插入片段：R/S G_{X 7}。理论多样性计算如下：1 x 2 x 20⁷ = 2.56 x 10⁹ 个唯一变体。
  注意：应该注意的是，这种多样性可能会受到转换效率的限制。
第二链合成
1. 用TE缓冲液将两个寡核苷酸（简并寡核苷酸和扩增引物）重悬至100μM终浓度。
  1. 对于PCR反应，用1 μL每个引物、10 μL缓冲液、1.5 μLDMSO、0.5 μLdNTP （10 mM）、0.5 μL高保真热启动聚合酶II和35.5 μL无核酸酶水进行50 μL反应。
  2. 将反应转移到热循环仪中，并在98°C下运行预孵育步骤10秒，然后在98°C下运行10秒，在59°C下运行30秒，在72°C下运行10秒的三个循环，然后在72°C下运行5分钟和最后的冷却步骤。
2. 使用核苷酸去除试剂盒纯化反应，并在 100 μL 无核酸酶水中洗脱。
3. 通过在生物分析仪上分析来确认第二链合成的效率（见图2）。根据制造商的说明，从DNA 1000试剂盒中将1 μL反应加载到微流控芯片中，从而分析双链插入片段的大小和纯度。该试剂盒经过优化，可测量 25-1，000 bps 的双链 DNA 片段的大小和浓度。
插入片段和质粒载体的消化
1. 在最终的 100 μL 反应体积中，用 10 μL 10x 缓冲液和 5 μL BglI 酶消解 85 μL 纯化的插入片段（详见 图 1 ）。在37°C孵育过夜。使用核苷酸去除试剂盒纯化，在 50 μL 无核酸酶水中洗脱，并使用分光光度计中的“寡核苷酸 DNA”类型进行定量。
2. 在最终的 200 μL 反应体积中，用 20 μL 10x 缓冲液和 10 μL SfiI 酶消化 10 μg 具有复制能力的 AAV 质粒（pRep2Cap2_PIS）²⁶ （ITR 侧翼病毒基因组）（详见 图 1 ）。在50°C孵育过夜。使用凝胶提取试剂盒在1%琼脂糖凝胶上纯化载体，然后使用DNA纯化试剂盒进行额外的纯化步骤。量化分光光度计中的浓度。
插入片段与载体的连接
1. 在 20 μL 连接反应中，将 955 ng 质粒载体与 45 ng 插入片段与 2 μL 缓冲液和 2 μL 连接酶连接。在16°C孵育过夜，然后在70°C下孵育10分钟以热灭活连接酶。
转化、复杂性计算和质粒文库制备
1. 按照制造商的说明使用DNA纯化试剂盒纯化反应。在约80%的无核酸酶起始体积水中洗脱反应，并储存在冰上以进行后续转化。
2. 转化电感受态细胞：在冰上解冻一瓶电感受态细胞10分钟。然后将 1-2 μL 纯化的连接反应加入 30 μL（一瓶）电感受态细胞中，并通过轻轻敲击进行混合。接下来，小心地将细胞/DNA混合物移液到预冷的1 mm间隙电穿孔比色皿中，不要引入气泡。
3. 使用以下设置电穿孔：1800 V、600 Ω 和 10 μF。在电穿孔脉冲的 10 秒内，将 970 μL 预热的恢复培养基（随电感受态细胞一起提供）加入比色皿中，并通过移液混合。最后，将细胞转移到微量离心管中，并在37°C以250rpm孵育1小时。为了达到所需的多样性，进行10-100次反应，孵育后，将所有反应集中在一个管中。
4. 通过在 PBS 中稀释 10 μL 混合转化 10、100 或 1，000 倍并铺展 100 μL 在含有适当抗生素（75 mg/mL 氨苄西林）的营养琼脂平板上来计算多样性。将琼脂平板在37°C孵育过夜，然后计数琼脂平板上的菌落。
5. 理论多样性计算如下：
  理论最大多样性 = 10 x 稀释因子 x 菌落数 x 电穿孔反应数。
  注意：要确认文库质量，请通过Sanger测序对至少20个菌落进行测序。大多数克隆都应包含插入片段，并且所有克隆都应该是唯一的。
6. 将含有适当抗生素的LB培养基接种400-1，000mL与其余的混合转化物，并在37°C，180rpm下孵育过夜。
质粒文库的制备
1. 从过夜培养中，制备甘油储备液（在无核酸酶水中混合等体积的细菌培养物和50%甘油溶液，并在-80°C下冷冻），并使用质粒最大试剂盒纯化质粒文库。
AAV病毒文库的制作
1. 如前所述制备病毒文库²⁷。使用转染试剂（如聚乙烯亚胺（PEI））将质粒文库（pRep2Cap2_PI，肽插入片段）与辅助性腺质粒转染到HEK293T细胞中。
2. 3天后收集细胞，并对其进行三个冻融循环。使用氯化铯梯度超速离心纯化病毒裂解物，然后缓冲液交换至PBS，最后浓缩病毒颗粒。
使用 dd-PCR 进行 AAV 载体滴定
1. 在 198 μL 无核酸酶水中连续稀释 2 μL AAV 载体原液，得到 1：10⁶ 的最终稀释度。每次使用 200 μL 移液器充分混合。添加一个无模板对照（NTC）作为阴性对照。
  注意：可以测定其他较低或较高的稀释度（1：10^5-1：10⁷）。
2. 准备 20x 引物-探针混合物。向 1.5 mL 离心管中加入 3.6 μL 的 100 μM 引物（正向和反向、Rep2 和 ITR）、100 μM dd-PCR 探针（Rep2 和 ITR）各 1 μL 和 3.6 μL 无核酸酶的水。
  注意：AAV文库是使用FAM标记探针检测的转基因靶向引物探针组（Rep2）和用HEX标记探针检测的ITR靶向引物探针组测量的。
3. 通过加入 5.5 μL 样品、1.1 μL 20x 引物-探针混合物、11 μL 用于探针的 dd-PCR 超级混合物（无 dUTP）和 4.4 μL 无核酸酶水，制备 22 μL PCR 反应。这分别产生引物和探针的浓度为900 nM和250 nM。
4. 使用液滴发生器产生液滴，将反应转移到96孔板中，将板放入热循环仪中，并在94°C下运行变性步骤10分钟，然后在94°C下运行40个30秒的循环，在58°C下运行1分钟。接下来，在98°C下热灭活聚合酶10分钟，并加入最后的冷却步骤。在液滴读取器中读取反应并继续分析²⁸.
5. 使用分析软件打开保存的dd-PCR板文件。使用一维振幅选项卡中的阈值工具（荧光振幅与事件编号）以NTC为指导，分离每个通道的负液滴和正液滴，并将数据导出到csv文件。
6. 要计算载体浓度，首先使用以下公式计算校正因子CF：
  
  CF确定转基因阳性液滴[阳性]与转基因和ITR [Ch1+ Ch2⁺]阳性的比例，以确保检测功能性载体颗粒。最终矢量浓度c现在可以使用以下公式计算：
  
  DF是稀释因子（1：10^5-1：10⁷ 如前所述）。每 20 μL/孔反应的拷贝数对应于 5 μL 稀释样品。因子 1，000 将比例校正为 VG/mL（病毒基因组/mL）。示例性滴定结果如表1 和图3所示。
NGS对AAV病毒库的分析
1. 通过使用校对聚合酶试剂盒（2x;见图4）建立20 μL PCR反应，扩增96核苷酸肽插入片段。向反应中加入 1 μL 含有 1 x 10⁸ vg、100 μM 引物（NGS_forward 和 NGS_reverse 各 0.5 μL 和 10 μL 酶混合物的 AAV 储备液。用无核酸酶水将最终体积调节至 20 μL。
2. 将反应转移到热循环仪中，并在98°C下运行变性步骤3分钟，然后在98°C下运行30-35个循环，每次10秒，在59°C下运行10秒，在72°C下运行20秒，然后在72°C下运行5分钟和最后的冷却步骤。
3. 使用PCR纯化试剂盒纯化样品。在分光光度计中定量浓度，并运行3%琼脂糖凝胶以验证纯度和片段大小。
4. 根据制造商关于制备NGS文库的说明，使用低复杂度样品试剂盒的文库系统处理PCR片段。用30ng的PCR片段进行末端修复反应，然后进行衔接连接和PCR扩增10个循环。使用PCR纯化试剂盒纯化反应。
5. 根据制造商的说明，使用DNA试剂盒在生物分析仪上处理最终产品以验证大小和纯度。
6. 使用荧光计定量扩增子并汇集它们。在荧光计上再次量化最终的合并NGS文库（根据制造商的说明），并在生物分析仪上验证质量。
7. 使用 75 周期高输出套件，以单端（SE）模式对 NGS 文库进行测序，读取长度为 84，索引 1 为 8。
  注意：本文中示例的测序是在海德堡EMBL的GeneCore设施（http://www.genecore.embl.de/）进行的。
8. 使用 Python 3 和 biopython 分析 NGS 测序数据。这些文件可以在 https://github.com/grimmlabs/AAV_GrimmLab_JoVE2022（或者 https://doi.org/10.5281/zenodo.7032215）找到。NGS分析由两个步骤组成。
  1. 在第一步中，在序列文件中搜索满足某些条件的序列（插入位点两侧存在识别序列）（参见图4，步骤1.9.8.5）。这是使用脚本（Script#1）和提供所需信息的配置文件完成的。一旦确定了正确的序列，程序就会提取序列并将其存储在输出文件中，输出文件是与排序文件同名的 txt 文件。
  2. 第二步是分析输出文件。文库中的序列从九个氨基酸插入片段中的六个核苷酸（AGWggc，W = A / T）中的任何一个开始。基于该起始序列，肽被翻译。这将生成包含肽变体（PV）的输出文件。
  3. 准备两个文件夹：脚本和数据。到“数据”文件夹，复制排序生成的 gzip 压缩文件。到脚本文件夹，复制以下文件，Python 文件：脚本#1_DetectionExtraction_JoVE_Py3.py;Python 文件：脚本#2_PV_extraction_and_ranking_Py3.py;配置文件：Barcode_Script_JoVE.conf;和查找表（LUT）文件：Zuordnung.txt。
  4. 在运行脚本之前，请在脚本文件夹中编辑以下文件。打开“Zuordnung.txt”文件，并添加两个制表符分隔的列，即 gzip 文件的名称（第 1 列）和所需的最终名称（第 2 列;制表符分隔的值）。
    注意：示例 txt 文件位于 GitHub 文件夹“PV_analysis_script”中。GitHub 文件夹中提供的文件是为分析上述库中的三个示例数据而准备的：xaa.txt.gz、xab.txt.gz 和 xac.txt.gz。还提供了输出文件。
  5. 更改配置文件“Barcode_Script_JoVE.conf”中的以下变量：
    my_dir = “~/数据/”
    filename_sample_file = “~/Script/Zuordnung.txt”
    特定于序列的变量：BCV_size = 27，BCV_左侧 = TCCAGGGCCAG，_{BCV 右侧} = GCCCAGG，BCV_loc = 30，BCV_保证金 = 8，BCV_{left_revcomp} = GCCGCCTGGGC，BCV_{right_revcomp} = CTGGCCC，BCV_{loc_revcomp} = 41（有关详细信息，请参见 图 4 ）。
  6. 使用以下命令调用变体序列检测和提取：
    >python3 ~/Script#1_DetectionExtraction_JoVE_Py3.py ~/Barcode_Script_JoVE.conf
    注意：输出是带有提取的DNA序列及其读取次数的txt文件。此文件的标头包含统计数据（即读取总数和提取的读取）。这些数据将传输到下一个文件。这些 txt 数据是 Script#2 的输入文件，其中对 DNA 序列进行翻译、排序和分析。
  7. 使用以下命令执行 PV 提取和分析：
    >python3 ~/Script#2_PV_extraction_and_ranking_Py3.py ~/Barcode_Script_JoVE.conf
  8. 分析脚本#2的文本输出文件。Script#2 的输出文件使用“Zuordnung.txt”中 LUT 的第二列命名，扩展名基于分析类型。
    注意：确保三个输出文件在第一行包含统计数据（“# 有效 PV 读取”、“# 无效 PV 读取”和“# 唯一 PV 读取”）、第一列包含输入 txt 文件中每个 DNA 序列的索引（脚本 #1 的输出）和以下列：（1） “...analyzed_all.csv“：”样品：“（DNA序列），”#“（读取次数），”Frw或Rev“（正向或反向读取）和”PV“（翻译的肽序列）。无效序列在最后两列中有“NA”和“无效”。(2) "...analyzed_validSeq.csv“：与上一个文件相同，筛选出有效序列。(3) "...analyzed_PV.csv“：”PV“（翻译肽序列）、”#“（读取次数）和”计数“（先前文件中的 FRW 和 rev 计数合并，计数给定 1 或 2）。
  9. 根据用户的需求，使用可用的软件可视化输出文件。

2. AAV2随机7聚体肽显示文库选择

在定量和质量控制（第1节）之后使用AAV库在选择的模型中进行定向进化，以迭代选择具有所需特性的候选物（见图5）¹⁶，¹⁸^，²¹。
注意：然后，这些候选库用于生成条形码库，如下文第 3 节所述。

3. 条形码AAV衣壳文库制备与分析

注意：在肽显示屏中鉴定一组潜在特异性和有效的AAV衣壳后，验证鉴定的肽序列的功能，并将其与一组常用或描述良好的参考AAV衣壳变体进行比较。为此，将衣壳序列插入到没有 ITR 的 Rep/Cap 帮助程序结构中。

制作条形码AAV库
1. 使用三质粒系统对每个衣壳变体进行重组AAV生产，如前所述²⁴。
  注意：为了区分不同的衣壳变体，ITR侧翼报告转基因质粒含有长度为15个核苷酸的独特条形码。条形码位于增强黄色荧光蛋白（EYFP）和polyA信号之间的3' UTR（非翻译区域）（见 图6A）。EYFP表达由强大的泛在巨细胞病毒（CMV）启动子驱动，可提供足够水平的RNA转录本。
2. 设计长度为15个核苷酸的条形码，均聚物小于3个核苷酸，GC含量为<65%²⁹，汉明距离大于4个核苷酸²⁴。
3. 与带有独特条形码的转基因质粒分别生产每个衣壳。这样，每个衣壳变体都标有不同的条形码，以实现其特定的跟踪（见 图 6B）。
使用 dd-PCR 进行 AAV 载体滴定
1. 按照前面1.8节所述，用YFP引物对替换Rep2引物对，进行AAV滴定。
2. 量化单个AAV产品，并汇集每个产品的等量，以生成最终的条形码库。
3. 再次定量最终文库以检查最终浓度和质量（见图7）。
条形码AAV文库 在体内 应用
1. 将条形码的AAV库系统地应用于所选的模型系统（例如在小鼠²⁴中系统地应用）。
2. 根据实验收集ON和OFF目标组织（即肝，肺，心脏，横膈膜，平滑肌，十二指肠，胰腺，结肠，二头肌，卵巢，胃，内耳，肾脏，腹主动脉，胸主动脉，脑，棕色和白色脂肪以及脾脏）或细胞类型。将它们在-80°C下冷冻，提取DNA / RNA，并应用NGS定量分析，如下一节所述。
脱氧核糖核酸/核糖核酸提取
1. 使用 DNA/RNA 迷你试剂盒从感兴趣的组织中提取 DNA 和 RNA。
2. 将一小块感兴趣的组织（1mm³，约5mg）放入2mL反应管中。
3. 向组织中加入 350 μL 与β-巯基乙醇（1%）和 5 mm 钢珠混合的裂解缓冲液（在通风橱下处理含有 β-巯基乙醇的样品）。
4. 在组织裂解器中以40 Hz均匀化组织45秒。
5. 加入 10 μL 蛋白酶 K （10 mg/mL），并在 55 °C 下孵育 15 分钟，同时以 400 rpm 振荡。
6. 在室温下以20，000× g 离心3分钟，收集上清液，然后继续使用DNA / RNA试剂盒的制造商方案。
7. 将洗涤步骤分成两步，每步加入 350 μL 洗涤缓冲液。在这些洗涤步骤之间，用不含RNase的DNase I消化色谱柱上的残留DNA.将根据制造商的说明制备的80μLDNase I溶液加入色谱柱上，并在室温下孵育15分钟。
8. 用无核酸酶水从色谱柱中洗脱RNA/DNA。将分离的RNA储存在-80°C，将gDNA储存在-20°C。
cDNA合成
1. 在逆转录反应之前，将RNA样品进行另一轮15-30分钟的DNase I处理（用于从RNA样品中完全去除污染DNA）。将 1 μL DNase I 溶液、4 μL 缓冲液（随试剂盒提供）和无核酸酶水加入到 40 μL 至 212 ng RNA 的最终体积中。在室温下孵育30分钟，并在70°C下加热灭活10分钟。
2. 根据制造商的说明使用试剂盒使用 150 ng RNA 合成 cDNA。包括不含逆转录酶的对照，以确保样品中没有污染病毒DNA。cDNA储存在-20°C。
  注意：用于最佳逆转录的起始RNA量可能因组织类型和相应组织中的预期转导效率而异。
AAV病毒库（in-vivo）由 NGS
1. 为了以低成本实现高测序深度，如前所述，通过Illumina测序进行 NGS（第1.9节）。扩增条形码序列，然后将测序接头连接到扩增子。
2. 由于扩增子两侧的测序接头的读取长度较短，因此在设计时，请检查扩增子是否足够小，以确保NGS读取中存在条形码序列。对于病毒基因组和病毒转录本中的条形码测序，PCR扩增子设计为113 bp长（见图8）。
3. 用引物BC-seq向前和BC-seq反向扩增条形码区域。准备以下 PCR 反应：0.5 μL 高保真 DNA 聚合酶、10 μL 5x 缓冲液、每 100 μM 引物 0.25 μL （BC-seq fw/BC-seq rv）和 1 μl 10 mM dNTP。使用 25 ng 的 cDNA 或 DNA/反应作为模板，并用无核酸酶水将最终体积调节至 50 μL。
4. 在干净的PCR罩下制备PCR预混液以避免污染。使用以下循环条件：在98°C下30秒，然后在98°C下循环40次10秒，在72°C下循环20秒，最后在72°C下5分钟步长。
5. 包括PCR对照，以确认PCR预混液中不存在污染DNA。对于cDNA样品，包括没有逆转录酶的对照。最后，包括一个带有 AAV 输入库的示例。此信息将用于生成分析中使用的Normalization_Variant.txt文件。
6. 在PCR纯化之前，通过凝胶电泳验证每个样品的PCR片段的大小。后者通过使用市售磁珠或基于柱的DNA纯化系统来实现（参见 材料表）。
7. 根据制造商的说明，使用文库系统制备低复杂度样品的NGS文库，如前面的第1.9节所述。
8. 通过dsDNA HS试剂盒测定 DNA浓度，并如前所述分析文库的质量（第1.9.6节），然后进行合并。在荧光计上量化合并文库，并在生物分析仪上评估质量。
9. 按照第 1.9.7 节中的讨论执行 NGS 测序。
10. 通过qPCR量化转基因（病毒基因组）和管家基因的拷贝数，以评估DNA上组织或器官之间混合文库的分布。
11. 按如下方式设置 30 μL qPCR 反应，以确定 EYFP（转基因）和 GAPDH（甘油醛 3-磷酸脱氢酶，管家基因）的拷贝数：
  1. 准备 EYFP 的 60 倍引物/探针混合物（1.5 μM YFP_fw、1.5 μM YFP_rv和 0.6 μM YFP_probe;参见材料表）。使用GAPDH引物/探针混合物（见 材料表）确定管家基因的拷贝数。在冰上设置反应。
  2. 准备PCR预混液（15 μL，参见 材料表），为所有样品和标准品添加60倍引物/探针混合物（0.5 μL）（要计算标准品的拷贝数，请使用以下链接：http://cels.uri.edu/gsc/cndna.html）。在冰上设置反应。
  3. 将 15.5 μL 预混液转移到 96 孔板中，并向相应的孔中加入 14.5 μL 样品（总 DNA 浓度为 75 ng）或标准品。用箔密封96孔板，涡旋并短暂旋转。
  4. 将 10 μL 的每个样品一式两份转移到 384 孔板中。用箔密封板，并在4°C下以800× g 旋转5分钟。
  5. 使用50°C的初始温度在热循环仪中孵育反应混合物2分钟，然后在95°C下进行10分钟的初始活化步骤。在95°C下进行40个变性循环15秒，在60°C下退火/延伸1分钟²⁴。
  6. 要获得二倍体基因组（dg）的数量，请使用GAPDH拷贝数并除以2。然后，取EYFP拷贝数的值除以dg的数量，得到每个二倍体基因组（vg/dg）的载体基因组。使用此值生成用于生物信息学分析的Normalization_Organ.txt文件。
12. 像Weinmann等人一样对NGS测序数据进行分析。²⁴，使用 Python3 （https://github.com/grimmlabs/AAV_GrimmLab_JoVE2022）中的自定义代码。该工作流程包括检测由侧翼序列引导的条形码序列、它们的长度和位置（Script#1_BarcodeDetection.py），以及分析一组组织的条形码富集和分布（Script#2_BarcodeAnalysis.py）。
  1. 检测条形码并将其分配给 AAV 变体。将测序数据作为存档的 fastq 文件放在一个目录中（例如，“Data_to_analyze”）。输入文库的测序数据文件包含在此目录中，仅用于计算输入库中的衣壳比例。
  2. 在执行脚本之前，请创建两个制表符分隔的文本文件：衣壳变体文件（参见示例文件“变体.txt”），其中包含分配给 AAV 衣壳变体名称的条形码序列，以及带有可能污染的条形码序列的污染文件（参见“污染.txt”），这些文件来自可能的污染（实验室中提供的其他条形码，导致污染）。
  3. 最后，编辑配置文件“Barcode_Script.conf”以包含以下信息：包含排序数据的文件夹路径（例如，“Data_to_analyze”），条形码侧翼区域的序列，它们的位置以及条形码检测的窗口大小（类似于1.9.8.5，见图8）。
  4. 使用以下命令调用条形码检测，并提供 Script#1_BarcodeDetection.py 和配置文件的路径：
    >python3 ~/Script#1_BarcodeDetection.py ~/Barcode_Script.conf
    注意：Script#1_BarcodeDetection.py 执行的输出是文本文件，其中包含每个衣壳变体的读取计数以及从原始数据中恢复的读取总数。
  5. 通过执行 Script#2_BarcodeAnalysis.py 和以下 txt 文件来评估条形码 AAV 衣壳在组织或器官中的分布：
    1. 在“Zuordnung.txt”文件中，将从条形码检测运行中获得的每个 txt 文件的名称分配给组织/器官名称：第一列中的 txt 文件名称和制表符分隔分配中的相应组织/器官名称。
      注意：有关示例，请检查“示例”文件夹（https://github.com/grimmlabs/AAV_GrimmLab_JoVE2022）。值得注意的是，组织/器官名称可以包括定义cDNA或gDNA测量和生物重复数（M1，M2等）的字符。
    2. 创建一个“器官.txt”文本文件，其中包含ON和OFF目标器官的名称列表，这些名称对应于作业“Zuordnung.txt”文件中给出的名称（请参阅“示例”文件夹：https://github.com/grimmlabs/AAV_GrimmLab_JoVE2022）。
    3. 创建“Normalization_Organ.txt”和“Normalization_Variant.txt”制表符分隔的文本文件，其中包含所有衣壳变体和所有器官/组织的标准化值。在“Normalization_Organ.txt”文件的第一列中，写下为每个器官给出的名称（如在分配文件“Zuordnung.txt中），在第二列中写下相应组织的归一化值，在第3.6.11节中生成。
    4. 用衣壳名称列表填充“Normalization_Variant.txt”文件的第一列，用池库中每个衣壳的读取计数的规范化值填充第二列（可以根据第一个脚本生成的输入库的 txt 输出文件计算归一化）。
    5. 通过指定上述所有其他文件的完整路径来编辑配置文件。执行脚本 #2_BarcodeAnalysis.py 作为：
      >python3 /Script#2_BarcodeAnalysis.py ~/Barcode_Script.conf
      注意：条形码分析脚本输出多个文件：基于前面描述的多个归一化步骤，具有不同组织内衣壳分布的相对浓度（RC）值的文本文件，以及将文本文件数据合并为合并矩阵数据的电子表格文件。后者可用于聚类分析和可视化。
    6. 可视化数据并对基质数据进行聚类分析，以区分衣壳特性并根据跨组织的 RC 谱评估它们的相似性。使用其他脚本PCA_heatmap_plot。放置在存储库中的 R：
      >rscript --香草 ~/PCA.R ~/相对浓度.xls
      注意：该脚本将相对浓度.xls文件作为输入，并生成分层聚类热图和主成分分析（PCA）两个图。
    7. 若要修改绘图（热图轴、PCA 主成分）或 png 参数（颜色、大小、标记），请打开 R 脚本并按照注释部分中提供的说明进行操作。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

生成 AAV2 肽显示库。 作为选择工程AAV的第一步，描述了质粒文库的生成。肽插入片段是使用简并引物产生的。将密码子的组合从64个减少到20个具有消除终止密码子和促进NGS分析的优点，方法是减少DNA上的文库多样性，而不是蛋白质水平上的文库多样性。寡核苷酸插入片段以单链DNA形式购买（图1），通过PCR反应将其转化为双链DNA。该反应的质量在生物分析仪中控制。 如图2所示，与10或30个周期相比，三个周期产生更强的条带。然后用BglI消化插入片段以产生三核苷酸突出。双链插入片段突出序列旁边的核苷酸可以是A或T（W是A或T的模糊代码），它们位于编码精氨酸（R）或丝氨酸（S）的密码子的第三个位置。载体（pRep2Cap2_PIS）在肽插入位点具有移码突变，由于插入位点后不久产生终止密码子，因此在没有插入片段的情况下阻止衣壳的产生。该质粒的SfiI消化产生三核苷酸突出部分，与编码肽的寡核苷酸插入片段中产生的突出部分相匹配。连接需要在最佳条件下进行，以最大限度地提高质粒文库的复杂性。为此，为了进行转化，使用市售细菌高效进行电穿孔。

质粒文库的多样性是根据菌落计数计算的，对于这种类型的文库，菌落计数通常约为1 x 10⁸ 。菌落总数对应于NGS分析中文库的最大潜在多样性，稍后将讨论。然后使用质粒文库生成AAV文库，此处未详细描述，但在其他地方²⁷。

使用该文库的定量使用dd-PCR进行。通常，对两个区域进行定量，即病毒基因组内的AAV2代表基因和ITR（见图3和表1）。如表1所示，从病毒基因组阳性的液滴来看，99.2%的液滴也呈ITR（Ch1+ Ch2⁺）阳性，这是AAV文库的质量控制，表明AAV衣壳含有完整的病毒基因组。为了获得以vg/mL为单位的浓度，计算双阳性液滴与阳性液滴的比例，并在通过稀释因子扩增之前用于获得正确的拷贝数。

然后通过NGS分析评估AAV文库的质量，从使用适当引物的PCR开始。接下来，使用市售试剂盒处理PCR产物，该试剂盒将含有索引的适配器添加到PCR产物中。NGS产品被测序，文件使用Python进行分析。提供了来自AAV2肽显示库的三个样品数据。对 Script#1 输入文件（样品中扩增 DNA 片段的所有 PCR 拷贝的序列列表）中的每个序列进行生物信息学搜索，以查找 BCV_左序列和 BCV_右序列，或 BCV_{left_comp}和 BCV_{right_comp}序列。如果识别出任一组合，则提取包含的序列并将其添加到输出文件中（参见图 4）。两个脚本的输出都提供了有关 NGS 文库准备的统计数据。在所有三组中，基于特定于库的签名序列提取的读段约占总读段的94%，这表明质量良好。Script#2的输出提供了进一步的统计数据，提取的DNA序列的翻译产生了额外的质量控制数据。“无效PV读段的#”（即缺少用于启动计算机翻译和编码残基RG或SG的六个核苷酸的序列）不到回收读段的1%，这证实了良好的测序质量。第二个脚本的输出（即提取的DNA序列的翻译和排序）提供了额外的信息，例如每个肽变体的读取次数或产生每个肽变体的DNA序列数量。在这些文件中，以“analyzed_PVs”结尾的文件仅包含有效的DNA读取，并且在肽序列水平上进行分析。在有效读物中，99%以上是唯一的，这表明库是平衡的，内部多样性很高。

选择 AAV2 肽显示库。 然后，该文库可用于体内或体外选择。此协议中不包含此协议，但 图 5 提供了概述。简而言之，对于体内选择，在全身注射1 x^{10 12} vg /小鼠后1周收集组织并分离DNA。对帽基因的较大片段进行挽救PCR，并使用不同的限制性位点将产物克隆到质粒载体中，但方案与此处描述的方案相似，并制备第1轮AAV文库。对于NGS分析，PCR对分离的DNA或AAV文库进行。选择后，库中唯一PV的百分比通常会根据选择压力而降低。根据项目的不同，一旦NGS确定了足够的主导PV，就可以完成选择。

条形码库选择和分析。 来自包含82个衣壳的条形码AAV库的数据已在前面^描述过24。AAV颗粒的dd-PCR定量（见图7 和表1）显示，94%的转基因阳性衣壳也含有ITR，表明完整的基因组。这低于上述野生型文库，但考虑到重组AAV通常包装效率较低，它们仍然表明其质量良好。在动物中注射混合文库后，收集组织，分离DNA和RNA。然后按照上述和先前²⁴所述进行NGS的PCR以及NGS文库制备和测序。为了计算vg/dg，执行qPCR，在提供的样品数据中，值范围为0.1-4。与全身性AAV递送的典型情况一样，肝脏的维生素/总值超过10 vg/dg。

作为分析管道的一部分，规范化步骤在不同级别执行。在输入合并文库中，衣壳变体通常不相等。因此，输入文库的NGS分析用于生成归一化文件，该文件根据输入文库中该衣壳变体的丰度来校正最终组织/器官中每个衣壳变体的丰度。NGS在DNA和RNA水平上对汇集的文库成员进行生物分布。输入文库的这种归一化产生组织/器官内比例的商（P*_αβ）与输入文库（L a）的比例（L_a）。这些计算可以在“variant_comparison.txt”文件中找到。然后将该商乘以“Normalization_organ.txt”文件中的 vg/dg 值以产生值 Β αβ，并计算单个组织或所有组织的 Β_αβ 值的比例。一个组织内每个变体的Β αβ值的比例（V_αβ）反映了该变体在该组织中的传播（“organ_comparison.txt”）。相反，所有组织中每个变体的Β αβ值的比例（T_αβ）表明该变体在全身内的传播（“相对承认.xls”）。这两个比例反映了每个变体的组织内和组织间的生物分布。所有这些文件都可用于衣壳效率和特异性的不同可视化²⁴。例如，使用最终表（在“相对承认.xls中找到），主成分分析和分层聚类如图9所示。

来自NGS测序的混合文库的归一化表明，每个衣壳的平均比例为0.012，这也与82个衣壳中每个衣壳的理论比例相匹配，并表明一个平衡良好的混合文库为0.012（1/82）。由生物信息学管道生成的文件“相对浓度.xls反映了组织间衣壳的生物分布，如图 9所示。热图以log2刻度显示根据组织生物分布分层聚类的合并文库每个衣壳的相对浓度值。主成分分析可以区分具有相似生物分布特性的AAV衣壳变体簇，还可以突出显示具有独特组织间生物分布模式的外围衣壳。热图层次结构的两个主要分支反映了衣壳变体的转导效率差异。具有大多数衣壳变体的左分支包括所有衣壳，这些衣壳在大多数组织中显示出较高的相对浓度值。除了惊人的高肝脏特异性外，其他三种衣壳（Var60、Var13和Var63）在横膈膜（Di）、骨骼肌（SM）、二头肌（BlC）和大脑（B）中表现出特异性。分层聚类的右分支包括整体转导效率较低的衣壳变体，这在十二指肠（Du）和胰腺（P）中很明显。原始亚群的 PCA 形成具有高肝脏特异性的衣壳变体簇（Var 64、78、65、55、56），并概述了具有出色肌肉倾向性的 Var60 衣壳。

图 1：AAV2 随机 7-mer 肽显示文库的克隆策略概述。
具有随机7-mer肽插入序列的寡核苷酸两侧是包含BglI消化位点和扩增反应结合位点的序列。载体pRep2Cap2_PIS包含 SfiI 位点。BglI和SflI消化产生的悬垂是互补的。请点击此处查看此图的大图。

图2：寡核苷酸第二链合成的生物分析仪质量控制。
简并寡核苷酸的第二链合成通过生物分析仪的分析得到证实。比较了具有三个、10 个和 30 个扩增循环的 PCR 反应，表明最有效的是三个扩增循环。（A）以凝胶图像表示的生物分析仪数据。（乙-四）绘制的片段长度（以bp，x轴为单位）与荧光单位（FU，y轴）相比，与标准峰相比，在15和1500 bp处可见。红色箭头表示双链寡核苷酸。请注意，在三个扩增周期后观察到双链寡核苷酸的最高FU值，代表最高的DNA浓度（红色箭头）。请点击此处查看此图的大图。

图 3：使用 dd-PCR 滴定 AAV2 肽显示库。
（A）检测通道 1（FAM、通道 1）中的 rep2 阳性液滴，用于非模板水对照和 1：10⁶ 稀释病毒样品。（B）检测通道 2（HEX，通道 2）中的 ITR 阳性液滴。（C）检测rep2和ITR均呈阳性的液滴（以橙色突出显示）。紫色线表示检测阳性与阴性液滴的阈值。请点击此处查看此图的大图。

图4：用于NGS的DNA片段概述和蟒蛇分析的设置。
NGS PCR扩增96核苷酸区域。PCR片段用于生成NGS文库。对于生物信息学分析，需要为两条链提供插入位点左右的识别序列，以及与DNA片段开头的距离。请点击此处查看此图的大图。

图 5：体内 AAV 文库的迭代选择。
小鼠注射AAV文库。1周后收集目标ON和OFF组织并进行NGS和分析。ON靶组织用于拯救衣壳基因，衣壳基因被克隆到亲本载体中。生成选定的AAV库并用于重复上述选择周期。这个数字是用 BioRender.com 创建的。请点击此处查看此图的大图。

图 6：条形码 AAV 库生成概述。
（A）带有CMV启动子驱动的 eyfp转基因的自互补AAV基因组的图形表示，两侧是ITR。3' UTR 包含一个 15 个核苷酸长的条形码（BC），位于 eyfp 和牛生长激素（BGH）聚腺苷酸化信号之间的 3' UTR 处。BC能够在DNA和mRNA水平上进行衣壳追踪。（B）在AAV生产过程中，独特的条形码基因组被帽基因的唯一变体包装，便于衣壳识别。请点击此处查看此图的大图。

图 7：使用 dd-PCR 滴定条形码 AAV 文库。
（A）检测通道 1（FAM，通道 1）中的 YFP 阳性液滴，用于非模板水对照和 1：10⁶ 稀释载体样品。（B）检测通道 2（HEX，通道 2）中的 ITR 阳性液滴。（C）检测rep2和ITR均呈阳性的液滴（以橙色突出显示）。紫色线表示检测阳性与阴性液滴的阈值。请点击此处查看此图的大图。

图8：用于NGS的DNA片段概述和Python分析的设置。
NGS PCR扩增113核苷酸区域。对于生物信息学分析，需要为两条链提供条形码左右的识别序列，以及与DNA片段开头的距离。请点击此处查看此图的大图。

图 9：主成分分析（PCA）和分层聚类分析。
（A）所有组织中82个衣壳的相对浓度值的PCA允许定义具有相似特性的衣壳变体簇和具有独特转导模式的变体。（B）为了更好地分离人口稠密的集群，从矩阵中排除了外围独特变体的记录，并重复了PCA分析。（C）分层聚类分析允许以热图的形式直观地评估跨组织的变异转导谱（Li = 肝脏，Lu = 肺，FatB = 棕色脂肪，H = 心脏，Di = 横膈膜，SM = 平滑肌，Du = 十二指肠，P = 胰腺，C = 结肠，BIC = 二头肌，O = 卵巢，St = 胃，I = 内耳，K = 肾脏，Aa = 腹主动脉，在 = 胸主动脉，B = 大脑， FatW = 白色脂肪，S = 脾脏）。请点击此处查看此图的大图。

样本	目标	拷贝/20 μL 孔	阳性	通道1+ 通道2+	CF	副本已更正	东风	维克/毫升
H₂O	代表2	28	2	0	0	0	1.00E+06	5.60E+09
AAV2lib	代表2	90600	16396	16266	0.99	89882	1.00E+06	1.80E+13
H₂O	YFP	4	3	2	0.67	3	1.00E+06	8.00E+08
BCAAVlib	YFP	34680	13229	12452	0.94	32643	1.00E+06	6.53E+12

表 1： AAV2 肽显示库（“AAV2lib”）和条形码 EYFP 载体库（“BCAAVlib”）的滴定结果。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

在该协议中，概述了肽显示AAV衣壳工程和条形码AAV文库筛选以及文库组成和衣壳性能的生物信息学分析所需的步骤。该协议侧重于促进这些类型文库的生物信息学分析的步骤，因为大多数病毒学实验室在编程技能方面落后，以匹配他们在分子生物学技术方面的熟练程度。正如引言中所述，这两种类型的库在文献中都有广泛的描述，并且可以相对容易地复制。

作为第一步，概述了在AAV2可变区域VIII中位置588处的肽显示库的设计。根据最近出版物²⁶中提供的信息，这种设计（AAV2_Peptide（ii））和所描述的克隆方法可以很容易地适应其他血清型。克隆管道中的一个关键步骤是连接/转化效率（使用~1 x 10⁸菌落截止值）。建议仅添加一次载体连接反应。这有助于识别带有插入物的细菌菌落的百分比，该百分比应高于80%。低于预期的效率，即细菌菌落数量（用插入片段计算百分比）低于寡核苷酸插入片段的理论多样性，将对低丰度变体产生负面影响。一些改进包括更长的消化时间和使用商业试剂盒的载体或连接反应的纯化步骤。

下一步是使用包含寡核苷酸插入位点的PCR片段的NGS对变体文库进行质量控制。NGS是使用Illumina测序系统进行的。有几种替代方案，其中PCR产物可以直接提交，而无需事先制备NGS文库。这更适合小规模实验或不需要高读取深度的情况。此处报告的协议包括NGS文库制备，包括使用市售试剂盒将具有Illumina索引的接头添加到PCR产物中。NGS的一个常见限制是这些PCR片段的多样性较低，因为高多样性插入位点两侧的序列在所有变体中都是相同的，这反过来又降低了测序效率。为了解决这个问题，该试剂盒在PCR片段和衔接子之间添加任意数量的2到8个随机核苷酸。或者，需要用 PhiX 加标样品。描述了详细的 Python 管道来分析 AAV2 肽显示库。作为模板，提供了从AAV2肽显示库的原始NGS文件中提取的样品文件。这可以通过给出的说明适应其他血清型。该分析的输出文件可用于下游分析，例如质粒和AAV文库的比较30，每个位置的氨基酸组成³⁰，选择轮14后文库间富集分数的计算，或序列徽标或图形的生成¹⁹。就输入库而言，需要存在高百分比的唯一变体。但是，某些变体的产量不如其他变体，这可能导致生产后的分布偏斜。低变异多样性，或者换句话说，显性变异的存在，可归因于低寡核苷酸插入片段质量或高次数的第二链合成循环（步骤1.2）。此外，氨基酸组成可能会受到生产的影响。每个氨基酸的频率应为5.00%。如果分布与该值差异很大，建议对质粒库执行相同的分析，以识别潜在的偏差³⁰。

由于AAV文库生成方案以及不同动物和体外模型中的后续选择轮次已在多个出版物和协议^27，30，³¹，³²中进行了广泛描述^，因此此处仅描述所选工程变体和基准的条形码库分析。值得注意的是，每轮选择后的文库克隆可以通过帽基因的PCR分离来进行，如实验方案和结果部分所述。广泛的选择和PCR扩增可导致突变或终止密码子的积累，这可以由NGS观察到。或者，可以从NGS数据中选择富集的变体，并且寡核苷酸按照已经描述的方式排序和克隆，以生成肽显示文库¹⁶^，¹⁸。最后，该方案包含全身注射后1周DNA水平上文库选择的简要描述。基于RNA的选择更加严格，因为它们也选择通过感染性进入途径运输的变体，尽管技术上更具挑战性。应该注意的是，基于RNA或转基因的选择（即Cre）需要更长的体内持续时间，约为3-4周¹⁵，16，¹⁷，¹⁸，¹⁹^，³³。特别是对于基于DNA的选择，使用条形码AAV文库在DNA和RNA水平上根据已知的天然和工程血清型验证所选变体至关重要。

该协议的第二部分描述了使用先前开发的管道²⁴生成和筛选条形码AAV文库。池中的每个AAV衣壳都包含相同的转基因（在CMV启动子的控制下具有eyfp），在eyfp和polyA信号之间具有不同的条形码。该库中使用的条形码可以在先前的出版物²⁴中找到。该设计基于汉明距离的基本原理（即条形码序列需要足够不同），以便排序错误不会导致错误的条形码分配。如Lyons等人²⁶所述，在25-100个核苷酸之间的读取中发生两次错误的几率非常低。汉明距离为 4 意味着需要两个排序错误才能将读取指定为错误的条形码。在分析过程中，将忽略具有一个错误的读取，在这种情况下，将其归类为“具有未知变体的读取”。在相关出版物中，提供了指南和 Python 脚本来生成可在管道中使用的条形码²⁹。为了识别有用的条形码，可以使用另一种流行的纠错代码，如Buschmann和Bystrykh³⁴的出版物中所述，即Levenshtein距离。该组还提供用于R编程语言³⁵的软件包。

AAV生产后，汇集的条形码AAV库可用于不同模型的生物分布研究。本研究使用先前出版物²⁴ 中的 82 变体库概述了管道，并为实践提供了样本数据。该协议也可以根据每个用户的需求进行调整。生物分布分析基于收集不同的ON和OFF靶组织或细胞，从中提取DNA和RNA，用于NGS测序的条形码区域的PCR扩增，以及在DNA水平上测量vg / dg。对于RNA，最好计算与参考基因的mRNA拷贝数的比率。选择的参考基因应在不同的组织中相似表达³⁶，例如 RPP30 （核糖核酸酶P / MRP亚基P30）³⁷ 或 Hprt （次黄嘌呤磷酸核糖转移酶1）³⁶。然而，这很困难，因此可能需要同时使用多个参考基因来规范RNA数据。出于这个原因，可以在DNA水平上完成对dg的标准化，这与细胞数量大致相关。这也指出了qPCR用于此计算的使用，如前所述²⁴，尽管dd-PCR更精确，因此是未来使用的首选，特别是考虑到该领域的进展³⁷。最后但并非最不重要的一点是，基本的分子生物学优化对于本文描述的方法极其关键。需要优化PCR反应，以避免对文库分布造成偏差。dd-PCR探针需要设计为包括DNA的内含子区和RNA的外显子间区。良好的实验室规范，例如步骤的物理区隔，特别是文库制备的DNA和AAV生产，以及适当的消毒对于避免错误扩增和文库污染至关重要。

值得注意的是，使用肽显示文库和载体DNA/RNA条形码来选择具有新型嗜性或其他临床相关特性的工程衣壳仅代表定向AAV衣壳进化技术的两个例子。它们都有一个共同点，即它们都有局限性，需要进一步优化才能充分发挥其潜力。例如，仅仅插入肽会使大部分（~99%）的潜在衣壳序列保持不变，其性质包括与中和抗AAV抗体的相互作用可能需要在人类应用之前进一步修改³⁸。此外，肽展示或其他文库的实际多样性通常低于理论多样性，例如由于克隆或细菌转化过程中的技术限制³¹。一般来说，关于动物或体外模型中定向进化的翻译相关性也存在积极的争论，通过越来越多的证据表明合成AAV衣壳的可能物种甚至菌株特异性性能³⁸。尽管如此，人们仍然希望克服许多或所有这些限制，并且当前的技术库将扩展到更多种类的疾病模型，并使大多数研究小组更容易获得。在这方面，最近一个特别令人鼓舞的发展是使用条形码AAV文库，例如这里报道的那些文库，不仅在器官上，而且现在也在细胞水平上验证选定的衣壳，这可以通过单细胞（sc）RNA测序³⁹等新技术来实现。这里提出的协议将促进AAV进化技术的广泛建立，从而加速针对众多研究小组和人类患者需求的新型衣壳的开发。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

D.G.是AaviGen GmbH.的联合创始人，D.G.和K.R.是与产生免疫逃避AAV衣壳变体相关的未决专利申请的发明人。其余作者没有什么可透露的。

Acknowledgments

D.G.非常感谢德国研究基金会（DFG）通过DFG合作研究中心SFB1129（Projektnummer 240245660）和TRR179（Projektnummer 272983813）以及德国感染研究中心（DZIF，BMBF;TTU-艾滋病毒 04.819）。

Materials

Name	Company	Catalog Number	Comments
Amplification primer	ELLA Biotech (Munich, Germany)	-	Second-strand synthesis of oligonucleotide insert
Agilent DNA 1000 Reagents	Agilent Technologies (Santa Clara, CA, USA)	5067-1504	DNA fragment validation
Agilent 2100 Bioanalyzer System	Agilent Technologies (Santa Clara, CA, USA)	G2938C	DNA fragment validation
AllPrep DNA/RNA Mini Kit	Qiagen (Venlo, Netherlands)	80204	DNA/RNA extraction
Agilent DNA 1000 Reagents	Agilent Technologies (Santa Clara, CA, USA)	5067-1504	NGS Library preparation
Agilent 2100 Bioanalyzer System	Agilent Technologies (Santa Clara, CA, USA)	G2938C	NGS Library preparation
BC-seq fw:	IDT (San Joce, CA, CA, USA)	ATCACTCTCGGCATGGACGAGC	NGS Library preparation
BC-seq rv:	IDT (San Joce, CA, CA, USA)	GGCTGGCAACTAGAAGGCACA	NGS Library preparation
β-Mercaptoethanol	Millipore Sigma (Burlington, MA, USA)	44-420-3250ML	DNA/RNA extraction
BglI	New England Biolabs (Ipswich, MA, USA)	R0143	Digestion of double-stranded insert
C1000 Touch Thermal Cycler	Bio-Rad (Hercules, CA, USA)	1851196	dd-PCR cycler
dNTPS	New England Biolabs (Ipswich, MA, USA)	N0447S	NGS Library preparation
ddPCR Supermix for probes (no dUTP)	Bio-Rad (Hercules, CA, USA)	1863024	dd-PCR supermix
Droplet Generation Oil for Probes	Bio-Rad (Hercules, CA, USA)	1863005	dd-PCR droplet generation oil
DG8 Cartridges for QX100 / QX200 Droplet Generator	Bio-Rad (Hercules, CA, USA)	1864008	dd-PCR droplet generation cartridge
DG8 Cartridge Holder	Bio-Rad (Hercules, CA, USA)	1863051	dd-PCR cartridge holder
Droplet Generator DG8 Gasket	Bio-Rad (Hercules, CA, USA)	1863009	dd-PCR cover for cartridge
ddPCR Plates 96-Well, Semi-Skirted	Bio-Rad (Hercules, CA, USA)	12001925	dd-PCR 96-well plate
E.cloni 10G SUPREME Electrocompetent Cells	Lucigen (Middleton, WI, USA)	60081-1	Electrocompetent cells
Electroporation cuvettes, 1mm	Biozym Scientific (Oldendorf, Germany)	748050	Electroporation
GAPDH primer/probe mix	Thermo Fischer Scientific (Waltham, MA, USA)	Mm00186825_cn	Taqman qPCR primer
Genepulser Xcell	Bio-Rad (Hercules, CA, USA)	1652660	Electroporation
High-Capacity cDNA Reverse Transcription Kit	Applied Biosystems (Waltham, MA, USA)	4368814	cDNA reverse transcription
ITR_fw	IDT (San Joce, CA, USA)	GGAACCCCTAGTGATGGAGTT (https://signagen.com/blog/2019/10/25/qpcr-primer-and-probe-sequences-for-raav-titration/)	dd-PCR primer
ITR_rv	IDT (San Joce, CA, USA)	CGGCCTCAGTGAGCGA (https://signagen.com/blog/2019/10/25/qpcr-primer-and-probe-sequences-for-raav-titration/)	dd-PCR primer
ITR_probe	IDT (San Joce, CA, USA)	HEX-CACTCCCTCTCTGCGCGCTCG-BHQ1 (https://signagen.com/blog/2019/10/25/qpcr-primer-and-probe-sequences-for-raav-titration/)	dd-PCR probe
Illumina NextSeq 500 system	Illumina Inc (San Diego, CA, USA)	SY-415-1001	NGS Library sequencing
KAPA HiFi HotStart ReadyMix (2X)*	Roche AG (Basel, Switzerland)	KK2600 07958919001	NGS sample prepration
MagnaBot 96 Magnetic Separation Device	Promega GmbH (Madison, WI, USA)	V8151	Sample prepration for NGS library
NanoDrop 2000 spectrophotometer	Thermo Fischer Scientific (Waltham, MA, USA)	ND-2000	Digestion of double-stranded insert
NGS_frw	Sigma-Aldrich (Burlinght, MA, USA)	GTT CTG TAT CTA CCA ACC TC	NGS primer
NGS_rev	Sigma-Aldrich (Burlinght, MA, USA)	CGC CTT GTG TGT TGA CAT C	NGS primer
NextSeq 500/550 High Output Kit (75 cycles)	Illumina Inc (San Diego, CA, USA)	FC-404-2005	NGS Library sequencing
Ovation Library System for Low Complexity Samples Kit	NuGEN Technologies, Inc. (San Carlos, CA, USA)	9092-256	NGS Library preparation
PX1 Plate Sealer	Bio-Rad (Hercules, CA, USA)	1814000	dd-PCR plate sealer
Pierceable Foil Heat Seal	Bio-Rad (Hercules, CA, USA)	1814040	dd-PCR sealing foil
Phusion High-Fidelity DNA-Polymerase	Thermo Fischer Scientific (Waltham, MA, USA)	F530S	Second-strand synthesis of oligonucleotide insert
PEI MAX - Transfection Grade Linear Polyethylenimine Hydrochloride (MW 40,000)	Polysciences, Inc. (Warrington, PA, USA)	24765-1G	AAV library preparation
ProNex Size-Selective Purification System	Promega GmbH (Madison, WI, USA)	NG2002	Sample prepration for NGS library
Phusion Hot Start II Polymerase	Thermo Fischer Scientific (Waltham, MA, USA)	F549L	NGS Library preparation
Proteinase K	Roche AG (Basel, Switzerland)	5963117103	DNA/RNA extraction
pRep2Cap2_PIS			ITR-Rep2Cap2-ITR vector. Peptide insertion site within the Cap2 ORF, manufactured/prepared in the lab
QX200 Droplet Generator	Bio-Rad (Hercules, CA, USA)	1864002	dd-PCR droplet generator
QX200 Droplet Reader	Bio-Rad (Hercules, CA, USA)	1864003	dd-PCR droplet analysis
QIAquick Nucleotide Removal Kit	Qiagen (Venlo, Netherlands)	28306	Second-strand synthesis of oligonucleotide insert purification
QIAquick Gel Extraction Kit	Qiagen (Venlo, Netherlands)	28704	Plasmid vector purification
QIAGEN Plasmid Maxi Kit	Qiagen (Venlo, Netherlands)	12162	Plasmid library DNA preparation
Qiaquick PCR Purification kit	Qiagen (Venlo, Netherlands)	28104	Sample prepration for NGS library
Qubit fluorometer	Invitrogen (Waltham, MA, USA)	Q32857	NGS Library preparation
Qubit dsDNA HS	Thermo Fischer Scientific (Waltham, MA, USA)	Q32851	NGS Library preparation
QuantiFast PCR Master Mix	Qiagen (Venlo, Netherlands)	1044234	Taqman qPCR
rep_fw	IDT (San Joce, CA, USA)	AAGTCCTCGGCCCAGATAGAC	dd-PCR primer
rep_rv	IDT (San Joce, CA, USA)	CAATCACGGCGCACATGT	dd-PCR primer
rep_probe	IDT (San Joce, CA, USA)	FAM-TGATCGTCACCTCCAACA-BHQ1	dd-PCR probe
RNase-free DNase	Qiagen (Venlo, Netherlands)	79254	DNA/RNA extraction
SfiI	New England Biolabs (Ipswich, MA, USA)	R0123	Digestion of vector
5 mm, steel Beads	Qiagen (Venlo, Netherlands)	69989	DNA/RNA extraction
TRIMER-oligonucleotides	ELLA Biotech (Munich, Germany)	-	Degenerate oligonucleotide
T4 Ligase	New England Biolabs (Ipswich, MA, USA)	M0202L	Plasmid library ligation
TissueLyserLT	Qiagen (Venlo, Netherlands)	85600	DNA/RNA extraction
YFP_fw	IDT (San Joce, CA, USA)	GAGCGCACCATCTTCTTCAAG	dd-PCR primer
YFP_rv	IDT (San Joce, CA, USA)	TGTCGCCCTCGAACTTCAC	dd-PCR primer
YFP_probe	IDT (San Joce, CA, USA)	FAM-ACGACGGCAACTACA-BHQ1	dd-PCR probe
Zymo DNA Clean & Concentrator-5 (Capped)	Zymo research (Irvine, CA, USA)	D4013	Vector and Ligation purification