Genética

Análise de microbioma a partir de sequências de 16Sr RNA: ASV ou OTU?

Com o avanço das técnicas de Sequenciamento de Nova Geração (NGS), pesquisas com metagenômica e microbioma ganharam cada vez mais espaço. A relação do microbioma humano com a manutenção da saúde, já vem sendo estudada e comprovada por diversos grupos de pesquisa. Duas abordagens são utilizadas nestas análises: ASV, sequências únicas e OTU, sequências agrupadas. Mas, qual a diferença?

Primeiramente, a metodologia mais utilizada para as análises de microbioma é o sequenciamento direcionado, também chamado de “16S rRNA amplicon sequencing. Isso ocorre porque o gene ribossomal 16S, presente em bactérias e arqueias, apresenta regiões extremamente conservadas e regiões variáveis, que diferem em todos níveis taxonômicos, estas regiões variáveis são importantes marcadores filogenéticos para estudos de microbiomas. Por apresentar esse conjunto de regiões conservadas e variáveis, conseguimos desenhar e sintetizar primers que se ligam nas regiões conservadas, possibilitando o sequenciamento das regiões variáveis. A partir do sequenciamento direcionado, o pesquisador pode optar em seguir com a abordagem por OTU ou ASV.

O sequenciamento direcionado, pode, às vezes, atribuir variações incorretas durante a etapa de amplificação no PCR, levando à detecção de organismos semelhantes, porém, incorretos ou até mesmo de falsas descobertas de um novo organismo. Felizmente, duas estratégias de análises foram desenvolvidas para minimizar este efeito: agrupar sequencias próximas (OTU) ou encontrar sequências biológicas únicas (ASV), cada uma com suas particularidades, vantagens e desvantagens.

Neste artigo, revisaremos os algoritmos por trás destas técnicas e quais são os pontos positivos e negativos de cada uma delas.  Mas vale ressaltar que, independente da estratégia utilizada, a análise de microbioma por sequenciamento direcionado nos permite explorar de uma maneira confiável, as bactérias e arqueias presentes num determinado ambiente, qual a abundância de cada táxon, bem como a diversidade alfa e beta das diferentes comunidades microbianas. 

Análises com OTUs

Para que os erros oriundos do sequenciamento não influenciem nas análises de Amplicon 16S, a estratégia mais antiga empregada, foi a utilização de OTUs, do inglês Operational Taxonomic Unit, este termo foi introduzido em 1963 por Robert R. Sokal e Peter HA Sneath e vem sendo utilizado até hoje para análises de microbioma por NGS.

Esta abordagem é baseada na ideia de que os microrganismos possuem uma similaridade de acordo com seu grau de parentesco, assim, cepas de uma mesma espécie, por exemplo, terão menos variações entre si, do que quando comparada com outras espécies [1]. Esta técnica está inserida no contexto da taxonomia numérica, onde uma OTU é simplesmente um grupo de organismos com similaridade de X% definida pelo pesquisador. Esse agrupamento pode ser feito de duas maneiras, “OTUs com referência fechada” e “OTU de novo”, a diferença entre os dois é que no primeiro caso, o agrupamento é feito baseado em um banco de dados pré-estabelecido na literatura e no segundo, o agrupamento é feito independente de uma referência externa.

A definição da porcentagem de similaridade mais utilizada na literatura é 97% para organismos da mesma espécie, na prática, podemos dizer que todas as sequências com 97% de similaridade formam um cluster, ou seja, uma Unidade Taxonômica Operacional (OTU) e são de organismos pertencentes a uma mesma espécie. Outros limiares descritos na literatura [2] são: gênero (94,5%), família (86.5%), ordem (82.0%), classe (78.5%) e filo (75.0%).

Essa abordagem, traz consigo o risco de que diferentes espécies, porém semelhantes, se agrupem numa mesma OTU, assim, perdemos a sensibilidade nas análises. Posteriormente, alguns pesquisadores tentaram refinar estas análises e aumentaram a porcentagem de identidade, para, em teoria, ganhar sensibilidade e minimizar o risco de perda de riqueza do ambiente estudado. Porém, isso criou um risco significativo de falsos positivos, classificando erros de sequenciamento como novas espécies, proporcionando uma falsa diversidade. Fez-se necessária a criação de uma nova abordagem para análises de microbioma 16S. 

Análises com ASVs

Diferente do agrupamento por similaridade, utilizado na formação de OTUs, a abordagem por ASVs, do inglês Amplicon Sequence Variant, vai para direção contrária, esta técnica busca encontrar sequências únicas e exatas de um determinado organismo. Assim, sendo uma sequência exata, uma determinada sequência deve sempre gerar o mesmo ASV, isso permite a comparação entre estudos diferentes que utilizam a mesma região alvo.

O algoritmo por trás desta abordagem extrai as sequências únicas encontradas nas amostras e conta quantas vezes esta mesma sequência apareceu. Esses dados são combinados com um modelo de erro apropriado para a tecnologia de sequenciamento, assim, conseguimos comparar estas sequências e determinar a probabilidade de uma dada sequência com uma dada frequência ser uma sequência biológica ou apresentar algum erro de sequenciamento. Isso cria um p-valor associado a cada sequência única, onde a hipótese nula é que a sequência seja uma consequência de um erro de sequenciamento. Após esse cálculo, as sequências são filtradas de acordo com um limite de confiança determinada pelo pesquisador, ficando somente com um conjunto de sequências únicas com valor estatístico confiável [3]. 

Agora, qual a melhor abordagem a ser utilizada: ASV ou OTU? 

Embora a abordagem por OTU ainda seja utilizada pela comunidade e provavelmente será utilizada no futuro em ocasiões específicas, diversos grupos de pesquisas já estão atualizando seus pipelines e adotando a abordagem por ASV, a tendência é que todas as análises de microbioma migrem em direção a análises com ASVs [4]. A abordagem com OTU, ainda apresenta uma maior vantagem em relação ao poder computacional, mas como já relatado, as abordagens com ASV fornecem vantagens significativas, aumentando a sensibilidade nas análises e a precisão para identificação de organismos raros, isso tudo fornece um panorama mais detalhado da composição e da diversidade do ambiente amostrado. 

Adicionalmente, a abordagem por ASV apresenta maior reprodutibilidade e facilidade na comparação entre os estudos, por não apresentar agrupamentos de sequências e sim sequências únicas, estas, quando comparadas numa mesma região, serão idênticas, independente do estudo.  A reprodutibilidade dos dados já é importante por si só, e ganha mais destaque quando falamos do uso de comunidades microbianas como biomarcadores preditivos. 

Diferentes abundâncias relativas de determinados grupos de organismos podem ser usadas para prever condições da saúde de um indivíduo [5], isso pode ser calculado tanto por OTU, quanto por ASV, porém, biomarcadores preditivos só são úteis se puderem ser aplicados em diversos estudos. 

Preditores que utilizam OTUs de novo existem apenas no conjunto de dados em que o preditor foi treinado e avaliado, portanto, biomarcadores preditivos com base em OTUs de novo não serão preditivos em novos dados. Biomarcadores baseados em recursos rotulados de forma consistente, como ASVs e OTUs com referência fechada, podem ser aplicados a novos dados, embora, mesmo assim, quando utilizamos a abordagem de OTUs com referência fechada, limitamos o poder preditivo, omitindo os recursos preditivos ausentes do banco de dados de referência [4].

Mas, é importante ressaltar, que o refinamento das análises com ASVs, não invalidam os resultados obtidos com OTU, como dito, a abordagem por clusterização vem sendo utilizada pela comunidade por muitos anos e trouxe contribuições excepcionais no meio acadêmico, científico e até mesmo no ramo comercial.

Referências

[1] Nguyen, NP., Warnow, T., Pop, M. et al. A perspective on 16S rRNA operational taxonomic unit clustering using sequence similarity. npj Biofilms Microbiomes2, 16004 (2016). https://doi.org/10.1038/npjbiofilms.2016.4

[2] Yarza, P., Yilmaz, P., Pruesse, E. et al. Uniting the classification of cultured and uncultured bacteria and archaea using 16S rRNA gene sequences. Nat Rev Microbiol12, 635–645 (2014). https://doi.org/10.1038/nrmicro3330

[3] Benjamin J Callahan, Joan Wong, Cheryl Heiner, Steve Oh, Casey M Theriot, Ajay S Gulati, Sarah K McGill, Michael K Dougherty, High-throughput amplicon sequencing of the full-length 16S rRNA gene with single-nucleotide resolution, Nucleic Acids Research, Volume 47, Issue 18, 10 October 2019, Page e103, https://doi.org/10.1093/nar/gkz569

[4] Callahan, B., McMurdie, P. & Holmes, S. Exact sequence variants should replace operational taxonomic units in marker-gene data analysis. ISME J11, 2639–2643 (2017). https://doi.org/10.1038/ismej.2017.119

[5] Rahul Bodkhe, Sudarshan A. Shetty, Dhiraj P. Dhotre, Anil K. Verma, Khushbo Bhatia, Asha Mishra, Gurvinder Kaur, Pranav Pande, Dhinoth K. Bangarusamy, Beena P. Santosh, Rajadurai C. Perumal, Vineet Ahuja, Yogesh S. Shouche, Govind K. MakhariaFront Microbiol. 2019; 10: 164. Published online 2019 Feb 8. doi: 10.3389/fmicb.2019.00164

Faça Seu Comentário