Artigos

Como subir e configurar arquivos

Upload de arquivos

1. Formato dos arquivos

É possível subir arquivos de entrada NGS do tipo FASTQ, BAM ou VCF, independentemente da origem do sequenciamento. Arquivos compactados do tipo .gz também são aceitos.

2. Origem dos arquivos

  • Fazer upload de arquivos do seu computador

Basta selecionar arquivos do seu computador e arrastá-los para a região tracejada.

  • Importar arquivos via BaseSpace Sequence Hub® 

São três passos simples: autenticar a sua conta do BaseSpace Sequence Hub®, da Illumina, autorizar o compartilhamento de dados para a sua conta no Varstation e selecionar as biosamples de interesse. Ao selecionar uma biosample, todas as lanes e arquivos FASTQ e paired-end referentes a essa biosample já são selecionados automaticamente.

A integração com o BaseSpace® dispensa o tempo de carregamento dos arquivos bem como a necessidade de uma rede de alta capacidade, além de facilitar o fluxo entre os sequenciadores e o software para análise secundária e terciária Varstation. Com apenas um clique, é possível fazer o upload único de todos os arquivos da biosample com segurança e agilidade.

3. Combinação de arquivos

Caso os arquivos sejam selecionados a partir do seu computador, o sistema irá tentar combinar os FASTQ com os seus respectivos paired-end para criar cada amostra. A lógica de combinação é baseada na nomenclatura da Illumina, que traz como prefixo “file_R1” para o FASTQ e “file_R2” para o seu respectivo paired-end. Ou seja, o sistema irá buscar arquivos com o mesmo prefixo e irá interpretar que o par “file_R1.fastq” + “file_R2.fastq” pertencem à mesma amostra.

Para cada FASTQ, o sistema aceita um único paired-end R2. É também possível inserir arquivos FASTQ de leitura única, sem o paired-end.

Após selecionar os arquivos do seu computador ou através do módulo de integração com o BaseSpace® e clicar em “Continuar”, você irá acessar o módulo de configuração da rotina.

Caso seja necessário editar a combinação de amostras, basta acessar o botão “Reorganizar amostras” para verificar como elas foram combinadas. Você poderá fazer qualquer correção que seja eventualmente necessária (separar ou unir arquivos para cada amostra/paciente).

Configuração da Rotina

1. Parâmetros de configuração

Após selecionar os arquivos e clicar em “Continuar”, o próximo passo é configurar os parâmetros de processamento. Os arquivos transferidos para o sistema e a configuração de processamento definem uma rotina na plataforma Varstation.

A configuração é simplificada, sendo necessário inserir 5 informações:

1. Genoma de referência: hg19*;

*atualmente o único disponível, em breve disponibilizaremos o hg38.

2. Plataforma de sequenciamento: Illumina ou Ion torrent;

3. Tipo da biblioteca: Amplicon ou Captura;

4. Tipo de análise: Germinativa/hereditária ou Tumor/somática;

5. Região-alvo da análise: Via arquivo .bed (formato de arquivo de texto que geralmente contém cromossomo, start e end das regiões-alvo) ou via seleção de genes específicos (digitar ou colar uma lista de genes separados por vírgula) ou não inserir região-alvo.

Após a seleção dos 5 parâmetros, à direita ficarão disponíveis para consulta os workflows de processamento correspondentes. Trata-se de workflows validados pela nossa equipe de bioinformática e que carregam automaticamente de acordo com a seleção de plataforma, biblioteca e tipo de análise.

Se você precisar repetir essa configuração em rotinas futuras, também oferecemos a possibilidade de nomear e salvar o pipeline (configuração). Na rotina seguinte, essa configuração estará disponível para você selecioná-la, sem precisar configurar novamente.

2. Oferecimento de pipelines

Oferecemos pipelines validados, que correspondem a alguns kits disponíveis no mercado:

  • Exome Agilent SureSelect Human All Exon V5
  • Exome Agilent SureSelect Human All Exon V6
  • Exome Agilent SureSelect Human All Exon V7
  • Exome Agilent SureSelect Clinical Research Exome V2
  • Exome Illumina TruSight One Expanded

Caso seja necessário criar um pipeline customizado para uma necessidade específica, basta entrar em contato com a nossa equipe para fazer uma cotação. (support@varstation.com)

3. Gabarito da amostra

Reference genome: hg19 (padrão)

Sequence platform: Illumina

Library preparation: Capture

Analysis type: Germline/Hereditary

Genes of interest: BRCA1, BRCA2, CDH1, PALB2, PTEN, STK11, TP53

Faça Seu Comentário