基因检测测序：全基因组(WGS)、全外显子组 (WES)、新一代测序 (NGS）、mRNA 测序 (RNA-Seq)

2024-01-08

信使RNA寡核苷酸临床申请

IND2024论坛报名倒计时10天，扫码领取限量免费参会名额：基因测试是一种医学测试，可识别基因、染色体或蛋白质的变化。基因测试的结果可以确认或排除可疑的遗传状况，或帮助确定一个人患上或遗传遗传性疾病的机会。DNA来源 —— 为临床NGS提供模板的起始材料是双链核DNA，可以从多种细胞中获得。某些情况下，可以在实验室进一步改良这些DNA从全血白细胞中提取的DNA是一种无菌DNA来源，用于大多数临床检测。DNA来自非无菌部分（例如，口腔拭子、唾液样本）时，来自菌群的DNA序列可能与采集然而，获取非单一来源的DNA不需要抽血，且大规模基因组研究也需要采用昂贵性较小的方法来采集DNA。需要时也可从固定组织中提取DNA，如福尔马林固定和石蜡包埋的病理样本。对于接受过造血干细胞移植的患者，血液样本中的白细胞中很可能含有供者受者的基因序列。在这种情况下，可以使用口腔拭子、唾液或毛囊的DNA毛囊可能是最可靠的DNA来源，因为有报道称口腔和唾液样本的DNA可能出现供者和受者序列的嵌合现象。开始NGS前对起始材料DNA进行扩增，从而开始必然反应。增量是指使用基于PCR的方法使患者DNA在体外呈指数级复制。虽然DNA聚合酶很少出错（例如，替换错误的）注），但后续步骤可能会引入患者原始DNA中不存在的错误序列。NGS方法用于对RNA和线粒体DNA进行测序，但大多数已知的人类疾病基因都位于细胞核DNA，因此这些来源的样本通常仅用于研究或诊断少数疾病。如果是进行研究，用同一个体的正常组织和病变组织（如肿瘤）来比较基因组序列可能提供有用的信息。这种比较有助于确定癌症发展期间获得突变的时间，从而削弱对发生癌症的相对突变作用。一、基因测试涉及寻找以下方面的变化：基因：基因测试研究 DNA 序列，以识别可能导致或增加遗传性疾病风险的基因变异（突变）。基因测试的范围可小可大，分析单个 DNA 构建块（核苷酸）、一个或多个基因或一个人的全部 DNA（称为基因组）。染色体：染色体遗传测试分析整个染色体或长长度的 DNA，以查看是否存在导致遗传状况的较大遗传变化，例如染色体的额外副本。蛋白质：生化基因测试研究蛋白质或酶的数量或活性水平；任何一个的异常都可能表明 DNA 发生变化，从而导致遗传性疾病。基因测试有哪些不同类型？许多类型的基因测试可用于分析基因、染色体或蛋白质的变化。医疗保健提供者在选择适当的测试时会考虑几个因素，包括怀疑的病症以及通常与这些病症相关的遗传变异。如果诊断不清楚，可以使用检查许多基因或染色体的测试。但是，如果怀疑存在某种特定情况，则可以进行更有针对性的测试。分子测试寻找一个或多个基因的变化。这些类型的测试确定个体遗传密码中DNA构建模块（核苷酸）的顺序，这一过程称为 DNA 测序。这些测试的范围可能有所不同：有针对性的单变体：单变体测试寻找一个基因中的特定变体。已知所选变体会导致疾病（例如，HBB基因中导致镰状细胞病的特定变体）。此类测试通常用于测试已知患有特定变异的人的家庭成员，以确定他们是否患有家族性疾病。此外，直接面向消费者的基因检测公司在提供健康或疾病风险信息时通常会分析特定基因中的许多特定变异（而不是查找这些基因中的所有变异）。单基因：单基因测试寻找一个基因的任何遗传变化。这些测试通常用于确认（或排除）特定诊断，特别是当基因中存在许多可能导致可疑病症的变异时。基因组：组测试寻找多个基因的变异。当一个人出现可能适合多种病症的症状时，或者当疑似病症可能是由许多基因变异引起时，这种类型的测试通常用于精确诊断。（例如，癫痫有数百种遗传原因。）全外显子组测序/全基因组测序：这些测试分析个体的大部分 DNA 以发现遗传变异。全外显子组或全基因组测序通常用于单基因或组合测试无法提供诊断，或者当可疑病症或遗传原因尚不清楚时。全外显子组或全基因组测序通常比进行多个单基因或组合测试更具成本效益和时间效益。染色体测试：分析整个染色体或长长度的 DNA，以识别大规模的变化。可以发现的变化包括染色体的额外或缺失副本（分别为三体性或单体性）、添加（重复）或缺失（删除）的大片染色体，或染色体片段的重新排列（易位）。某些遗传状况与特定的染色体变化有关，当怀疑其中一种状况时，可以使用染色体测试。（例如，威廉姆斯综合症是由7 号染色体的一段缺失引起的。）基因表达测试：观察哪些基因在不同类型的细胞中打开或关闭（表达）。当一个基因被打开（活跃）时，细胞根据基因中的指令产生一种称为mRNA的分子，而mRNA分子被用作制造蛋白质的蓝图。基因表达测试研究细胞中的 mRNA，以确定哪些基因处于活跃状态。某些基因的活性过高（过度表达）或活性过低（表达不足）可能提示特定的遗传性疾病，例如许多类型的癌症。生化测试：并不直接分析 DNA，而是研究基因产生的蛋白质或酶的数量或活性水平。这些物质的异常可能表明存在遗传性疾病的 DNA 发生变化。（例如，生物素酶活性水平低表明生物素酶缺乏，这是由BTD基因变异引起的。）二、基因测序的类型新一代测序 (NGS)、全基因组测序 (WGS)、全外显子组测序 (WES)新一代测序 (NGS) 彻底改变了基因组学，扩展了我们对基因组结构、功能和动力学的了解。这项突破性的技术促进了广泛的研究，并使科学家能够以前所未有的方式探索遗传信息的复杂性。凭借其高通量能力和成本效益，NGS 已成为从基础生物学到临床诊断等不同学科的研究人员的基本工具。NGS不仅实现了全面的基因组测序，还促进了转录组学、表观基因组学、宏基因组学和其他组学研究。先进的 NGS 平台（例如 Illumina、Pacific Biosciences 和 Oxford Nanopore）的出现，允许对数百万至数十亿个 DNA 片段进行并行测序，从而改变了基因组学领域。这种能力为理解遗传变异、基因表达、表观遗传修饰和微生物多样性带来了新的机会。NGS 在识别致病变异、发现新药物靶点以及揭示复杂的生物现象（包括肿瘤和发育过程的异质性）方面发挥了重要作用。1、几代测序技术1.1第一代测序技术DNA 和 RNA 测序的首次尝试涉及分子的化学降解或酶裂解，以生成可以单独分析的片段。Robert Holley 于 1964 年首次使用来自酿酒酵母的核糖核酸酶对核酸分子丙氨酸 tRNA 进行了测序。同样，Walter Gilbert 和 Allan Maxam 开发了一种化学降解技术，可以对完整噬菌体 PhiX174 进行测序。然而，真正的突破来自科学家桑格 Fredrick Sanger引入的基于链终止的测序方法。该技术使用双脱氧核苷酸，它在复制过程中终止 DNA 链的链伸长，并允许产生长度高达数百个核苷酸的序列读数。桑格的方法被广泛采用，并通过实现 DNA 和 RNA 的快速测序而彻底改变了分子生物学领域。1987年，第一台商业自动化测序仪Applied Biosystems ABI 370在美国推出。该机器利用荧光标记的双脱氧核苷酸和毛细管电泳实现桑格测序方法的自动化，显着提高了DNA测序的速度和准确性。ABI 370 迅速成为行业标准，随后技术的改进导致了能够产生更长读取的更高通量测序仪的开发。虽然第一代技术已基本上被更新的、更高通量的测序技术所取代，但它仍然是测序技术发展的重要历史里程碑。DNA 和 RNA 测序的能力彻底改变了生物学和医学的许多领域，并在遗传学和分子生物学的理解方面带来了众多发现和进步。2.2. 第二代测序技术第二代测序方法能够同时对数千至数百万个 DNA 片段进行测序，从而彻底改变了 DNA 测序技术。这些方法与传统桑格测序的不同之处在于它们执行并行测序的能力。已经出现了几种广泛使用的第二代测序平台，其中之一是罗氏的454测序方法，该方法依赖于焦磷酸测序，通过检测将核苷酸添加到DNA模板时焦磷酸盐的释放来确定序列。另一个平台是 Ion Torrent 测序，它通过检测 DNA 合成过程中氢离子的释放来确定序列。广泛使用的 Illumina 测序平台采用基于可逆染料终止子的合成测序方法。另一项即将推出的技术 SOLiD 测序（寡核苷酸连接和检测测序）采用基于连接的方法，使用可逆终止子来确定 DNA 序列。这些第二代测序技术显着提高了DNA测序的通量和速度，使其在基因组学研究和临床诊断中得到广泛应用。这些平台实现了全基因组测序、转录组分析和靶向测序，从而在遗传变异、疾病研究和个性化医疗方面取得了突破。多年来，第二代测序方法取得了许多进展。2.3 第三代测序第三代测序技术代表了 DNA 测序的最新进展，提供了克服前几代测序局限性的新方法。这些技术提供长读长测序功能，与早期方法相比，能够对更大的 DNA 片段进行测序。例如 PacBio 测序，它使用带有荧光标记核苷酸的单分子实时 (SMRT) 方法，能够对长度长达数十千碱基的 DNA 片段进行长读长测序。另一种技术是牛津纳米孔测序，基于纳米孔技术，单链DNA分子穿过纳米孔，通过测量电流的变化来确定DNA序列。Oxford Nanopore 测序提供长读长、便携性和实时分析。2、下一代基于测序的组学了解复杂的人类疾病需要整合多种组学技术的数据，例如基因组学、转录组学、表观基因组学和蛋白质组学。下一代测序 (NGS) 用于各种应用，例如检查 DNA 序列（全基因组测序 (WGS)、全外显子组测序 (WES)）、研究 DNA 和组蛋白修饰（ChIP-Seq、Mmethyl-Seq、ATAC -Seq）和RNA测序，目前商业测序技术由Illumina主导。WGS 可以对基因组进行几乎完全覆盖的测序，通常可以识别约 300 万个单核苷酸变异 (SNV)。WES 仅关注 DNA 的蛋白质编码区，该区域约占基因组的 2%，并将 SNV 的平均数量减少至 23,000 个 2.1. 基因组学使用 NGS 的基因组学研究使用全基因组测序、全外显子组测序和靶向测序等各种方法深入分析 DNA。2.1.1. 全基因组测序全基因组测序 (WGS) 是一种强大且全面的基因组分析技术，涉及确定个体基因组的完整 DNA 序列。它提供了个体基因构成的详细蓝图，包括其基因组中存在的所有基因、调控区域和非编码元件。它主要应用于发现科学，例如植物和动物研究、癌症研究、罕见遗传疾病、复杂疾病症状的患者、群体遗传学以及真核生物和原核生物的新基因组组装。通过对生物体基因组中的所有 DNA 进行测序，WGS 能够识别遗传变异，范围从单核苷酸多态性 (SNP) 到插入、缺失和重排等更大的结构变化。通过全基因组测序获得的大量信息在各个领域提供了多种应用。全基因组比更小范围的基因测序成本高，因为全基因组相当于大约3.3x10 9个碱基，即3.3个碱基(gigabase, Gb)。随着成本降低以及获得更多关于编码非DNA在人类疾病中作用的信息，全基因组测序可能比外显子测序更可获取。另外，全基因组测序可用于检测通常只能通过阵列基因比较组杂交(array Comparison基因组杂交，aCGH)检测的缺失并且重复，因此可以减少对其他补充检测的需求。2.1.2. 全外显子组测序外显子组包含编码蛋白质的基因，仅占基因组的1.5%-2.0%，即大约30兆碱基(megabase, Mb)。剩余的非外显子区域包括内含子，以及控制基因功能其他方面（如剪接和基因表达水平）的调控序列。85%以上的已知突变是在外显子中发现的，因此某些临床情况中可以采用外显子组测序。与全基因组测序相比，该方法可大幅降低成本和数据存储要求。显着子组简化了临床报告，因为大多数情况下显着子变异的意义更容易解读。外显子组缺失对全基因组缺失的主要预测是，外显子组缺失可能遗漏基因组非编码区的危险性变异。因此，如果最终外显子组缺失无法诊断，某些情况下可考虑全基因组测序。全外显子组测序 (WES) 是一种测序方法，专注于捕获和测序基因组的蛋白质编码区域（称为外显子组）。通过对外显子组进行测序，WES 能够识别蛋白质编码基因内的遗传变异，包括单核苷酸变异 (SNV)、插入、缺失和拷贝数变异 (CNV) 。对于具有一系列症状的罕见临床疾病，以及识别群体和癌症遗传学变异，WES 是 WGS 的一种经济高效的替代方案。WES 涉及使用混合捕获或目标特异性扩增技术富集外显子区域，然后进行高通量测序。NimbleGen、Agilent、Illumina、Twist 和 IDT 提供与 Illumina NGS 平台兼容的各种外显子组捕获检测方法。WES 数据分析所用的生物信息学方法与 WGS 相同，因为 WES 是 WGS 的一部分。由于据报道绝大多数疾病变异位于编码区，WES 目前是孟德尔疾病基因诊断的一线方法。诊断率的提高促进了医疗成本的降低以及患者质量和结果的改善。然而，尽管生物信息学方法有所改进，但诊断率仍然很低且不稳定，仅为 25-50%，使得很大一部分人等待基因诊断。WES 的局限性包括解释未知意义变异 (VUS) 的不断出现的挑战，包括尚未与任何疾病相关的基因变异，以及 WES 识别结构重排、拷贝数变异和串联重复扩增的功效有限。以及基因组中富含 GC 和 AT 的区域。此外，尽管之前由于研究偏差和通过使用严格的过滤技术而被排除，同义、内含子和非编码变异也可能是致病的。有证据表明，9-30% 的致病变异位于非编码区域，并且存在与 50 多种不同疾病相关的同义变异。这表明审查这些被忽视的变异类别变得越来越重要。随着NGS变得越来越便宜，诊断实验室也越来越容易使用，更全面的WGS技术将变得更加突出，因为它可以对非编码区域进行测序。然而，庞大的数据量带来了巨大的生物信息学挑战，即解释每个样本 300 万个 SNV，然后进行额外的功能验证。导致当前方法生物信息学困难的一种特殊类型的变体是剪接变体。据报道，这些变异占致病变异的 10%，这一数字据推测被低估了。这些突变的后果可能导致外显子产生、跳跃、截断、延伸和内含子保留。这些在调查 WES 和 WGS 数据时带来了分析挑战。尽管可以使用这些技术来识别规范剪接突变，但神秘位点和增强子位点仍然带来解释挑战。此外，绝大多数内含子变异根本无法被 WES 识别，而它们的数量太多，无法从 WGS 数据中进行优先排序，并且大多数情况下仍保留为 VUS。因此，当今临床医生和科学家面临的挑战发生了巨大的转变，不再能够对基因组进行全面测序，而是更多地转向解释它们生成的大型数据集并将这些信息转化为可操作的结果。此外，发现的大量 VUS 凸显了随着新疾病基因的出现重新过滤 NGS 数据的重要性。最近，基于 RNA 测序的转录组学开始成为遗传诊断的主要参与者，以帮助注释和解释这些类型的变异。2.1.3. 靶向测序顾名思义，靶向测序的探索能力不如 WGS 或 WES，因为它针对基因的特定区域，并且能够拾取各种类型的遗传变异，从 SNV 到小基因删除、重复、插入或相关的基因重排。具有疾病表型。然而，其优势包括成本效益和临床医生可管理的数据，通过更具体的疾病相关信息使临床决策变得更容易。对于遗传疾病中的罕见等位基因，以及由于肿瘤异质性或癌症疾病进化而产生的低丰度进化突变克隆，它可以提供高达 5000× 的更深覆盖率。候选基因方法或商业化的靶向panel是在人群规模上开展的WGS/WES项目的结果。种系以及体细胞变异可以使用靶向 NGS 组合进行测试，靶向面板采用简单的富集方法，通过使用区域特异性寡核苷酸引物池进行扩增。然后对产生的特定大小的文库进行测序并进行生物信息分析。2.2 转录组学全外显子组测序（WES）和全基因组测序（WGS）是罕见疾病基因诊断的前沿方法。然而，WES/WGS 在高达 75% 的情况下会失败。RNA 测序转录组学 (RNA-Seq) 是一种新方法，旨在提高罕见疾病的诊断率。新一代测序 (NGS) 对转录组学产生了变革性影响，彻底改变了我们研究转录组（有机体或特定细胞群中完整的 RNA 分子集）的能力。NGS 技术提供了高通量且经济有效的方法来分析和分析 RNA 分子，使研究人员能够深入了解基因表达、选择性剪接、非编码 RNA 调控以及各种生物过程和疾病。mRNA 测序 (RNA-Seq)：RNA-seq 是转录组学中广泛使用的 NGS 应用。它涉及 mRNA 分子的测序和定量，提供生物样本中表达基因的全面快照。通过生成数百万个短测序读数，NGS 使研究人员能够准确识别和量化基因表达水平。可以分析 RNA-seq 数据以检测不同条件之间的差异基因表达，发现新的转录本，评估可变剪接事件，并研究随时间变化或跨不同组织或细胞类型的基因表达动态。选择性剪接分析：选择性剪接是单个基因可以生成多种 mRNA 亚型的过程，它显着增加了转录组的复杂性。NGS 提供了全面研究选择性剪接模式的能力。通过将 RNA-seq 读数与参考基因组进行比对，研究人员可以识别剪接点并检测替代剪接事件。这些信息可以对转录亚型进行量化和表征，从而深入了解亚型多样性、组织特异性表达以及选择性剪接的功能影响。长非编码 RNA (lncRNA) 和小 RNA 分析：NGS 促进了非编码 RNA 的研究，非编码 RNA 在基因调控中发挥着关键作用。小RNA测序和长非编码RNA测序等技术能够鉴定和表征各类非编码RNA。小 RNA 测序可以对小调控 RNA（包括 microRNA、piRNA 和 snoRNA）进行分析，从而深入了解它们在转录后基因调控中的作用。长非编码RNA测序能够识别和分析长非编码RNA转录本，这些转录本与多种生物过程和疾病有关。长 RNA-seq 读数可以了解多个外显子之间的连接性并揭示转录区域中的序列变异 (SNP) 。小 RNA 测序是一种非靶向方法，可以检测新型 miRNA 和其他小 RNA 。癌症生物学中 ChIP-seq 转录组研究有助于了解 ncRNA（例如 sncRNA 和 lncRNA）在癌发生/癌症进展过程中基因调控机制中的新兴作用。转录组组装和注释：NGS 数据可用于重建和注释生物体的转录组。通过将 RNA-seq 读数与参考基因组进行比对或使用从头组装方法，研究人员可以识别新的转录本、剪接变体、非翻译区域和其他转录本特征。这些信息增强了我们对转录组复杂性的理解，并改进了参考基因组的注释，从而能够发现以前未知的基因和调控元件。单细胞转录组学：NGS 促进了单细胞转录组学的出现，使得在单个细胞水平上研究基因表达谱成为可能。单细胞 RNA 序列 (scRNA-Seq) 技术可以对单个细胞的转录组进行分析，从而深入了解细胞异质性、细胞类型识别、细胞谱系分析以及复杂组织或发育过程中的基因表达动态。整合转录组学：转录组学的 NGS 数据可以与其他组学数据（例如基因组学、表观基因组学和蛋白质组学）整合，以获得对基因调控和生物过程的全面了解。综合方法提供了分子相互作用的系统级视图，并能够识别细胞过程和疾病背后的关键调节机制。2.3 表观基因组学表观基因组学是指对表观遗传修饰的研究，表观遗传修饰是基因表达模式的可遗传变化，不涉及 DNA 序列的改变。研究的最常见的表观遗传修饰类型是 DNA 甲基化、组蛋白修饰和 RNA 甲基化（表观转录组）。这些化学标签反过来会改变 DNA 可及性、染色质重塑和核小体定位。这些修饰受到营养物、污染物、毒物和炎症等环境因素的影响。通过人类、植物和动物的全基因组测序产生的知识和数据，帮助科学家更好地了解这些表观遗传改变，特别是DNA甲基化和羟甲基化。表观遗传改变引起了研究人员和临床医生对行为障碍、记忆、癌症、自身免疫性疾病、成瘾、神经退行性疾病和心理障碍等复杂疾病的兴趣。开发了各种平台和测定方法来研究表观遗传修饰，这些平台和测定方法在其他地方已经得到了很好的描述。NGS 已用于研究表观基因组学，如下所述：DNA 甲基化分析：DNA 甲基化是一种重要的表观遗传修饰，在基因调控和细胞过程中发挥着关键作用。NGS 能够以单核苷酸分辨率对全基因组 DNA 甲基化模式进行分析。全基因组亚硫酸氢盐测序 (WGBS) 和简化代表性亚硫酸氢盐测序 (RRBS) 等多种策略利用 NGS 来识别甲基化胞嘧啶。然而，RRBS 基于使用限制性酶消化富集甲基化基因组区域。这些方法使研究人员能够研究 DNA 甲基化动态，发现与疾病相关的差异甲基化区域 (DMR)，并了解甲基化对基因表达的影响。染色质可及性图谱：基于 NGS 的技术，例如使用测序 (ATAC-seq) 和 DNase-seq 检测转座酶可及染色质，可以对染色质可及性进行全基因组分析。这些方法可识别 DNA 结合蛋白和转录因子可接近的基因组区域，从而深入了解基因调控元件、增强子和启动子。通过将染色质可及性数据与其他表观遗传修饰、基因表达数据和转录因子结合数据相结合，研究人员可以解开基因组内的功能元件。组蛋白修饰分析：组蛋白修饰，包括乙酰化、甲基化、磷酸化等，是调节染色质结构和基因表达的关键表观遗传标记。染色质免疫沉淀测序 (ChIP-seq) 通过基于抗体的蛋白质下拉，然后富集与蛋白质结合的 DNA 并进行测序，可以对组蛋白修饰进行全基因组分析。该技术可应用于许多不同的研究领域，例如转录因子 (TF) 结合位点识别、DNA 组蛋白修饰分析和 DNA 甲基化。为了研究组蛋白修饰，使用针对组蛋白修饰的抗体来拉取 DNA 并使用 NGS 技术进行测序。所得读数与参考基因组进行比对，从而能够识别特定基因组区域的组蛋白修饰模式。ChIP-Seq 可以深入了解基因表达的表观遗传调控、染色质状态以及增强子和其他调控元件的识别。染色质构象分析：基于 NGS 的技术（例如 Hi-C 和 4C-seq）可以研究 3D 染色质组织和相互作用。这些方法捕获长程染色质相互作用并能够构建染色质相互作用图谱。通过将 3D 染色质构象数据与表观遗传修饰、基因表达数据和功能注释相结合，研究人员可以深入了解基因组的空间组织并了解它如何影响基因调控。除了这些独立的方法之外，表观基因组学的 NGS 数据还可以与转录组学数据相结合，以揭示表观遗传修饰和基因表达之间的关系。DNA 甲基化谱与 RNA-seq 数据的整合可以识别与基因表达变化相关的差异甲基化区域 (DMR)。将组蛋白修饰和染色质可及性数据与 RNA-seq 相结合，可以识别与特定基因表达模式相关的调控元件，并探索表观遗传调控机制。RNA测序局限性：尽管RNA成功地将诊断率提高了 7.5-36%，但 RNA-Seq 的局限性仍然存在。最突出的挑战是找到基因表达的组织特异性与组织采集的可及性和侵入性之间的适当平衡。人一生中基因表达的变异性是 RNA-Seq 的另一个考虑因素。尽管已有大量资源，但仍然需要涵盖各个年龄段的更全面的基因表达数据集。2.4 宏基因组学宏基因组学通过靶向方法或接头连接 PCR 方法以不依赖培养物的方式对样品中包含的原核基因组（包括细菌、真菌和病毒）进行直接遗传分析。靶向方法使用细菌和真菌的 16S 或 18S 核糖体 RNA 基因中的高变区。保守区和高变区的混合有助于识别样品中的每种细菌种类。同样，对于真菌物种鉴定，选择跨越真菌基因组 5.8S rRNA 基因的 ITS1 和 ITS2 区域进行扩增。对于病毒基因组测序，NGS（鸟枪法）生成的读数再次成为研究环境中病毒多样性、丰度和功能潜力的独立于培养的方法。所有过滤的读数都与人类参考序列进行映射，其余未映射的读数则根据 NCBI RefSeq 病毒基因组数据库进行映射。还提供靶向病毒和细菌基因组panel，例如用于HR HPV和微生物感染检测的ChapterDx、HIV耐药panel、AMR panel、胃肠道疾病panel等。根据核苷酸序列相似性，预处理的序列以 97% 的相似性聚类为操作分类单元 (OTU)。将 OTU 与数据库进行比较以识别微生物。多个分析流程用于分析 16S 扩增子读数。对于鸟枪法宏基因组样本，可以通过不同的方法获得分类和功能概况，微生物组测序可以识别样品中存在的全部微生物物种。结果是高度定量的，可以研究特定条件下的细菌群落。NGS 平台还可以生成样本中低丰度物种的读数。3、NGS 数据分析的生物信息学方法NGS 生成大量 DNA 或 RNA 序列，需要计算方法来处理、分析和解释这些数据。NGS 仪器产生的原始测序数据需要进行处理、分析和解释，以获得生物学见解。这就是生物信息学方法发挥作用的地方。这些方法涵盖了广泛的计算方法、算法和工具，用于处理预处理、比对、变体调用、基因表达量化、差异表达分析和其他专业分析。一旦处理完毕，就会采用各种计算技术，例如从头组装、基于参考的映射和转录组分析来提取有意义的生物信息。此外，先进的生物信息学工具有助于识别遗传变异，包括单核苷酸多态性（SNP）、拷贝数变异（CNV）和结构变异。综合分析，将 NGS 数据与其他基因组和功能数据源相结合，可以探索基因表达和调控网络。4、NGS在遗传代谢疾病诊断中的作用在快速发展的基因组学领域，人们已经发现了多因素疾病（如糖尿病、高胆固醇血症、不孕症等）中多个基因的关联。例如，理解参与不育、配子发生、激素周期、受精和胚胎发育的基因的经典方法是困难且耗时的。靶向 NGS 组合随着 WGS 的发展而发展，WES 能够同时评估多个基因及其变异，解释了各种疾病的复杂性，包括不孕症、遗传性遗传病和生殖基因组检测，包括 NIPT（非侵入性产前检测）检测）、PGS/PGD（植入前遗传病检测）以及发育迟缓障碍、代谢综合征等儿科疾病。这使得通过个性化基因组测试来治疗疾病成为可能，从而改善人类健康、预防性测试和疾病管理。四、结论1、尽管 NGS 技术呈指数级增长和发展，但通过 WES 或 WGS 进行基因诊断调查的个体中至少有 50% 仍未得到诊断，从而在许多层面上阻碍了疾病管理。原因包括 WES 的测序偏差、计算机预测工具和过滤能力较差，以及 WGS 中产生的大量 VUS。2、基因筛查需要临床指标才能加大确诊率当疑似遗传代谢障碍疾病的患者表现出癫痫、智力障碍、精神异常等脑病，其中这些异常的临床病症（癫痫、智力障碍、精神异常），属于临床特异性病症表现，作为疾病筛查的线索，临床医生还要做体表检测，以及检测患者眼睛、心脏、肌肉、肾脏等临床线索是否有异常（参见：遗传代谢病临床诊断的蛛丝马迹线索合集与遗传代谢诊断检测：血尿串联质谱、血气、乳酸、血氨、肝肾功能等），其中一些血液、尿液的筛查线索如果出现非特异性检测，例如患者临床表现仅仅为自闭症、智力发育迟缓等，而患者的非特异检测发现线索，患者血液血氨升高且血氨基酸：瓜氨酸、丙氨酸升高；尿有机酸里的乳清酸与嘧啶升高，这个时候就要怀疑患者有尿素循环障碍方面的疾病，有了这些临床检测特异性与非特异性指标，可以把患者疾病诊断方向缩小到一个范围，再针对这个范围进行基因筛查，可以大大提供检测几率，避免大海捞针式筛查出现阴性结果。3、单一的基因筛查结果阳性，并不能确诊是否是该疾病，还需结果临床线索指标验证，也要排除是否患者是晚发型的。基因筛查结果需要结合患者临床指标进行验证（上述特异性与非特异性指标），有的时候会检测到一些致病基因与患者临床表型不一致，这个时候需要收集患者临床线索去验证，当临床指标无法验证的时候，除了表明这个基因突变是一个疑似诊断，同时需要怀疑患者是否是晚发型的，可以将这个基因的突变当做一个医疗提示，从而进行医疗管理的临床预警。酶学检测确诊证据级别有时候大于基因测序的结果。4、临床有提示遗传代谢障碍类病症表现的患者，基因筛查结果阴性的不能排除患者没有遗传代谢障碍方面的疾病，有可能临床线索不足，大海捞针的基因筛查出现了遗漏，也有可能是基因突变的点位是全外显子基因测序探测不到的区域。5、对于基因筛查阴性的患者，可以联系基因公司拿到原始数据，可以提供给其他医生，在有医疗免费基因筛查的时候，进行多个渠道重新筛查。患者也可以根据后期临床检测出的其他证据，要求基因公司二次分析。因为基因库每年都在更新，所以患者可以要求基因公司每年进行重新筛查，患者在基因筛查之前问询基因公司，每年可以提供几次免费重新筛查，如果重新筛查需要收费，收费价格与方式是如何，这些都需要患者在基因筛查前与基因筛查机构协商好。6、做基因筛查尽量选择大公司，或者疑似某类型疾病的患者可以针对选择这类疾病领域里更专业的基因公司7、基因报告需要联系专业医生进行解读与分析，同时患者也可将确诊的基因突变点位与家族直系血缘亲属进行点位验证，可以筛查其他亲人是否是患者，也能对再次生殖进行预警指导。原文参考:DOI https://doi-org.libproxy1.nus.edu.sg/10.1007/s40142-021-00199-xUPTODATEENDIND2024论坛报名倒计时10天，1100人开年盛会。免费入场券领取中：王晨 180 1628 8769.戳“阅读原文”领取IND2024限量免费参会名额吧!