Use este identificador para citar ou linkar para este item:
https://repositorio.ufms.br/handle/123456789/3807
Tipo: | Dissertação |
Título: | Alinhamento Global de Várias Sequências Biológicas utilizando Cluster de GPUs |
Autor(es): | RODRIGO ALBUQUERQUE DE OLIVEIRA SIQUEIRA |
Primeiro orientador: | Marco Aurelio Stefanes |
Resumo: | O alinhamento de múltiplas sequências é uma ferramenta importante para o estudo e a representação de similaridades entre conjuntos de sequências biológicas – como DNAs, RNAs e proteínas. Este estudo permite a obtenção de informações relevantes destas sequências, como suas relações funcionais, evolucionárias e estruturas internas. Devido a sua importância, vários métodos foram propostos como solução a este problema. Entretanto, a complexidade inerente do problema, que é apresentado como computacionalmente NP-Difícil, conduz a tempos de execução proibitivos em cenários com muitas sequências longas. Neste trabalho, apresentamos uma implementação completa para o método heurístico de Alinhamento Progressivo utilizando paralelismo híbrido para ambientes com múltiplas GPUs. Esta abordagem permite a construção de alinhamentos globais entre bases com muitas sequências de comprimentos longos em tempo razoável. Nossa implementação atinge resultados expressivos, apresentando speedups de até 380 quando comparado ao alinhador paralelo ClustalW-MPI para sequências reais obtidas do banco de dados do NCBI. |
Abstract: | A multiple sequence alignment is an important tool for studying and representing similarities between a set of biological sequences – such as DNAs, RNAs and proteins. This study allows relevant information to be obtained from these sequences, i.e. their functional and evolutionary relations as well as their internal structures. Due to its importance, several methods have been proposed as a solution to this problem. Nonetheless, the problem’s inherent complexity, which is described as computationally NP-Hard, leads to prohibitive execution times in scenarios with large numbers of lengthy sequences. In this work, we present a complete implementation of the Progressive Alignment heuristic method, using hybrid parallelism for environments with multiple GPU devices. This approach allows the construction of global alignments between datasets of numerous lengthy sequences in reasonable time. Our implementation achieves expressive results, showing speedups of up to 380 when compared to the parallel ClustalW-MPI aligner for datasets obtained from NCBI’s sequence databases. |
Palavras-chave: | Alinhamento de Várias Sequências , Algoritmos Paralelos Híbridos, Algoritmos Multi-GPU, Alinhamento de Sequências Grandes. |
País: | Brasil |
Editor: | Fundação Universidade Federal de Mato Grosso do Sul |
Sigla da Instituição: | UFMS |
Tipo de acesso: | Acesso Aberto |
URI: | https://repositorio.ufms.br/handle/123456789/3807 |
Data do documento: | 2021 |
Aparece nas coleções: | Programa de Pós-graduação em Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tese_Final_Mestrado___Rodrigo_Siqueira.pdf | 1,45 MB | Adobe PDF | ![]() Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.