banner

Notícias

Nov 15, 2023

Requisitos mínimos para validação e acreditação ISO15189 de três procedimentos de sequenciamento de próxima geração para SARS

Scientific Reports volume 13, Artigo número: 6934 (2023) Citar este artigo

774 Acessos

1 Altmétrico

Detalhes das métricas

Os avanços rápidos e recorrentes de novas estirpes (variantes) do SARS-CoV-2 levaram as autoridades de saúde pública em todo o mundo a criar redes de vigilância para monitorizar a circulação de variantes preocupantes. O uso de tecnologias de sequenciamento de última geração aumentou a necessidade de avaliação do controle de qualidade, conforme exigido em laboratórios clínicos. O presente estudo é o primeiro a propor um guia de validação para tipagem de SARS-CoV-2 usando três métodos NGS diferentes que atendem aos padrões ISO15189. Estes incluem a avaliação do risco, especificidade, precisão, reprodutibilidade e repetibilidade dos métodos. Entre os três métodos utilizados, dois são baseados em amplicon envolvendo reação em cadeia da polimerase com transcrição reversa (Artic v3 e Midnight v1) na Oxford Nanopore Technologies, enquanto o terceiro é baseado em amplicon usando reação em cadeia da polimerase com complemento reverso (Nimagen) na tecnologia Illumina. Descobrimos que todos os métodos atenderam aos requisitos de qualidade (por exemplo, resultados de digitação 100% concordantes em termos de precisão, reprodutibilidade e repetibilidade) para tipagem de SARS-CoV-2 em ambiente clínico. Além disso, os resultados de digitação emergentes de cada um dos três métodos de sequenciamento foram comparados usando três nomenclaturas amplamente conhecidas (OMS, Pangolineage e Nextclade). Eles também foram comparados em relação às variações de um único nucleotídeo. Os resultados mostraram que o Artic v3 e o Nimagen devem ser privilegiados para a investigação de surtos, pois fornecem resultados de maior qualidade para amostras que não cumprem os critérios de inclusão para análise num ambiente clínico. Este estudo é um primeiro passo para a validação de testes NGS desenvolvidos em laboratório no contexto da nova regulamentação europeia para dispositivos médicos e diagnóstico in vitro.

Os coronavírus são vírus de RNA de fita simples envelopados, amplamente distribuídos entre mamíferos e aves, que causam uma ampla gama de doenças, incluindo infecções respiratórias. Esses vírus apresentam grande diversidade genética e alta capacidade de realizar recombinações genéticas e mutações1,2. No final de 2019, um novo membro da subfamília dos coronavírus, denominado SARS-CoV-2, foi detectado pela primeira vez na China (Wuhan) e tornou-se responsável pela pandemia global sem precedentes que se seguiu. Apesar da sua baixa frequência de mutação em comparação com outros vírus RNA3, a alta taxa de transmissão do SARS-CoV-2 em humanos aumenta as chances de aquisição de mutações e consequente evolução. Portanto, muitas variantes do SARS-CoV-2 surgiram ao longo do tempo, incluindo variantes de interesse e variantes preocupantes (VOCs). Esta última apresenta maior transmissibilidade e/ou capacidade de evasão da imunidade do que cepas anteriormente circulantes3,4,5,6.

A maioria dos países tem tentado controlar novas vagas de infecção através da implementação de medidas de saúde pública com o objectivo de evitar a inundação de instalações de saúde, garantindo assim o acesso aos cuidados de saúde às pessoas que necessitam de tratamento essencial. Neste contexto, foi essencial desenvolver uma rede de vigilância eficiente que permitisse a detecção precoce de novas variantes circulantes e a sua transmissão na população7,8. A sequenciação completa do genoma não só ajuda os cientistas a estudar o vírus e a desenvolver vacinas, mas também é a ferramenta fundamental para estabelecer redes de vigilância fortes.

Todo o genoma do SARS-CoV-2 foi sequenciado pela primeira vez no início de 2020, utilizando células infectadas por vírus e combinando várias tecnologias de sequenciação de próxima geração (NGS) (ou seja, Illumina e Oxford Nanopore Technologies)9. Ambas as tecnologias ainda são amplamente utilizadas em todo o mundo para obtenção de sequências de cepas circulantes5,6,7,10,11. Em setembro de 2020, a rede nacional de sequenciamento do Reino Unido, chamada Coronavirus Disease 2019 (COVID-19) Genomics UK Consortium, identificou o primeiro VOC conhecido hoje como variante alfa (B.1.1.7). Esta variante do SARS-CoV-2 é caracterizada pela deleção HV69-70 e pela mutação do aminoácido N501Y. Foi capaz de se espalhar muito rapidamente e exibiu um total de 14 substituições de aminoácidos específicos da linhagem em comparação com a primeira cepa identificada em Wuhan, incluindo três mutações conhecidas por conferir benefícios epidemiológicos (ou seja, N501Y, deleção 69-70, P681H)7,12 . Desde então, quatro variantes principais preocupantes foram identificadas globalmente: a beta (K417N, E484K), a gama (K417T, V1176F), a delta (L19R, L452R, exclusão 157-158, L452R, T478K, D950N) e a mais recente omicron (R346K, L452X, F486V). Cada uma destas variantes acumulou mutações que lhes conferem vantagens evolutivas até às variantes omicron atualmente mais prevalentes que adquiriram mais de 60 mutações em comparação com o genoma de referência de Wuhan6,13,14.

25. 40 \(\upmu\)L of each pool diluted with 60 \(\upmu\)L of RC-PCR Low-TE buffer (Nimagen B.V.; Nijmegen, Netherlands) was purified using 85 \(\upmu\)L of Solid Phase Reversible Immobilization (SPRI) AmplicleanTM magnetic beads (Nimagen B.V.; Nijmegen, Netherlands) by mixing DNA and beads (beads:DNA ratio = 0.85), followed by incubation of the mix at room temperature (RT) for 5 min, then beads were washed twice with 75% ethanol. Beads covered with DNA fragments of interest were mixed with 110 \(\upmu\)L of RC-PCR Low TE Buffer (Nimagen B.V.; Netherlands) and incubated at RT for 2 min. The purification procedure was repeated a second time. Eluted DNA from each pool was quantified using the 1xdsDNA HS kit (Thermo Fisher Scientific; MA, USA) with the Qubit 4.0 (Thermo Fisher Scientific; MA, USA) and amplicons size and integrity were checked using the QIAxcel fragment analyzer (Qiagen; Hilden, Germany) with the DNA Screening Kit (Qiagen; Hilden, Germany)./p>9) and their length (Artic: minimum length= 400 bp - maximum length= 700 bp, Midnight: minimum length= 600 bp - maximum length= 1,200 bp) to avoid chimeric reads. The passed reads were mapped to the reference genome of SARS-CoV-2 MN908947.3 using minimap2 (version 2.18-r1015) and SNVs were called for positions with depth of reads \(\ge\) 20, and consensus sequence obtained using medaka (version 1.4.3, model r941_prom_variant_g360) a software using trained neural network-based models to appropriately call sequence variations29./p> 0.81 for SNV identification./p> 0.81 for SNV identification./p> 100x, run 2: mean coverage= 0x, 0% > 100x, run 3: mean coverage= 5x, 1.5% > 100x)./p> 0.8) for all samples with a qPCR Ct value < 25 (Artic v3: mean \(\kappa\) = 0.9918 ± 0.01060, Midnight v1: mean \(\kappa\) = 1 ± 0, Nimagen: mean \(\kappa\) = 0.9433 ± 0.1468). For the sample with the highest qPCR Ct value (Ct = 29.01), coefficients are lower (Artic v3: \(\kappa\) = 0.6896 ± 0.02007, Midnight v1: \(\kappa\) = 0 ± 0.00005, Nimagen: \(\kappa\) = 0.7659 ± 0.05119) indicating a greater discrepancy, especially for the Midnight v1 SOP. Both short-amplicon methods (Artic v3 and Nimagen) have a coefficient indicating a high correlation (Fig. 1 left panel). Although the reproducibility of the three methods is similar for samples with a qPCR Ct value <25, the reproducibility of the Midnight v1 SOP is significantly different from that of both other methods for samples with a qPCR Ct value >25 (Supplementary table 3)./p> 100x, repeat 2: mean coverage= 0x, 0% > 100x, repeat 3: mean coverage= 1x, 0% > 100x) (Supplementary table 4)./p> 25 (Artic v3: \(\kappa\) = 0.7279 ± 0.08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0.8837 ± 0.03753) still showing a high repeatability for Nimagen and Artic while Midnight v1 is not repeatable./p>25 (Artic v3: \(\kappa\) = 0.7581 ± 0.01951, Nimagen: \(\kappa\) = 0.8287 ± 0.01903), especially for the Midnight v1 SOP which had a \(\kappa\) coefficient = 0 ± 0.00003, indicating that it was not repeatable for samples with a qPCR Ct value > 25 (Fig. 1 right panel). This was due to the low read depth (<20) at most nucleotide positions for two repeats performed with the Midnight v1 SOP. As this depth was the minimum threshold set in the bio-informatics pipeline for nucleotide calling in the consensus sequence, and as the third repeat had a sufficient read depth at these positions, the analysis resulted in a complete mismatch. Although the repeatability is not significantly different between the three methods for samples with qPCR Ct value <25, the repeatability of the Midnight v1 SOP is significantly different when compared with both other methods for qPCR Ct value >25 (Supplementary table 3)./p> 25 in clinical setting, sequencing results and strain typing can be obtained in non-clinical setting but should be interpreted with caution. Therefore, we compared the three methods using fifty-five samples without considering the Ct value exclusion criteria./p>30 for the N-gene (Table 2)./p>25 (Table 2), which led us to study the evolution of genome coverage as a function of viral load. We observed that for the three SOPs, the coverage was high for all samples with a N-gene qPCR Ct values <25 (96% and 90% of samples had a mean coverage above 380x for Artic v3 and Midnight v1 methods, respectively, and 90% of samples have a mean coverage above 600\(\times\) for Nimagen method) but the sequencing coverage dropped drastically with the three SOPs for samples with a qPCR Ct value >25 (Fig. 2)./p>25./p>25, the kappa coefficient decreased progressively with the increase of Ct value. This decrease was similar when comparing any method to one another (Fig. 3). However, all the mismatches observed can be explained by a too low read depth at the position of the mismatch for the method that did not identify the mutation (<20 reads for the Nanopore methods or <5 reads for the Illumina method). When, at that genomic position, the depth of reads was greater than 0 but below the previously mentioned cut-offs, we observed that the mutation was present in more than 70% of the reads, indicating that the discrepancies were not due to sequencing errors inherent to the methods but rather to the detection thresholds set in the bio-informatics pipelines./p>25 usually showed insufficient read depth which provided low reliability on some key mutations, which could lead to wrong or approximate lineage designation, highlighting the importance of sample selection criteria in the context of national surveillance programs using clinical samples8,38. Our data confirmed that the three methods validated here provided similar quality results and were adequate for epidemiological monitoring of SARS-CoV-2 using samples with N-gene qPCR CT value <25 in clinical setting./p>25), a method using smaller amplicons (Artic v3 and Nimagen) should be preferred as they exhibit better reproducibility and repeatability, and a higher mean coverage of the genome. This variability in coverage for samples with a low viral load had already been reported by Freed et al. Nevertheless, they have shown that it was possible to reach good quality results by generating more sequencing data than for samples with high or medium viral loads. This was not achieved in our study as we sequenced all samples under the same conditions. It has also been shown that in order to effectively detect SNVs and by extension reach a minimum coverage of 400x with an amplicon-based NGS technique, the material used for reverse transcription should contain at least 1,000 copies of viral RNA39,40./p>

COMPARTILHAR