Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão

Alexandre Soares da Silva

Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/5610

Tipo:	Tese
Título:	Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão
Autor(es):	Alexandre Soares da Silva
Primeiro orientador:	Paulo Aristarco Pagliosa
Resumo:	Na área de processamento geométrico, diversas técnicas propostas na literatura requerem que sejam estabelecidos pares de pontos de correspondência entre duas ou mais superfícies, isto é, dado um ponto sobre uma superfície fonte, é preciso associar qual é o ponto sobre uma superfície alvo que corresponde ao ponto dado. As aplicações incluem reconstrução de superfícies, parametrização cruzada, transferência de pose, transferência de texturas ou animações, reconhecimento e busca de formas, entre outras. A definição de uma função de mapeamento entre duas formas, mesmo para um número discreto de pontos característicos, nem sempre envolve somente relações geométricas ou estruturais, mas também relações semânticas. Uma vez que tal mapeamento em geral não pode ser diretamente expresso por abordagens puramente axiomáticas, em vários métodos de processamento geométrico a indicação de um conjunto inicial de pontos de correspondência é efetuada manualmente, através de processos que podem ser laboriosos e sujeitos a erros. De fato, descobrir relações semânticas entre formas quaisquer sem qualquer interação do usuário tratava-se de um problema ainda em aberto. Modelos de aprendizagem de máquina, em especial aprendizagem profunda, têm evoluído por sua capacidade de utilizar grandes conjuntos de dados para estimar a solução de problemas em diversas áreas do conhecimento, inclusive processamento geométrico. Este trabalho apresenta um método que utiliza aprendizagem multivisão profunda como parte do processamento responsável por encontrar automaticamente, isto é, sem a intervenção direta do usuário, pontos de correspondência entre superfícies de formas 3D, representadas por malhas de triângulos. O método é dividido em dois componentes: treinamento e correspondência. O primeiro trata-se de um treinamento multivisão que aprende, com o auxílio de uma CNN, a detectar pontos de interesse em imagens 2D oriundas de malhas de triângulos dos conjuntos de treinamento. O último, utiliza o resultado do treinamento para inferir correspondências semânticas com pontos de interesse (vértices) em formas 3D. A descoberta desses pontos não requer novo treinamento e nem interação humana durante o pipeline de correspondência.
Abstract:	In the field of geometric processing, several techniques proposed in the literature require the establishment of correspondence points between two or more surfaces, that is, given a point on a source surface, it is necessary to associate which point on a target surface corresponds to the given point. Applications include surface reconstruction, cross-parameterization, pose transfer, texture or animation transfer, shape recognition, and search, among others. Defining a mapping function between two shapes, even for a discrete number of characteristic points, does not always involve only geometric or structural relationships, but also semantic relationships. Since such a mapping cannot generally be directly expressed by purely axiomatic approaches, in various geometric processing methods, the indication of an initial set of correspondence points is manually performed, through processes that can be laborious and error-prone. In fact, discovering semantic relationships between any shapes without any user interaction is still considered an open problem. Machine learning models, especially deep learning, have evolved due to their ability to use large datasets to estimate the solution to problems in various areas of knowledge, including geometric processing. This work presents a method that uses deep multiview learning as part of the processing responsible for finding automatically, that is, without direct user intervention, correspondence points between 3D shape surfaces represented by triangle meshes. The method is divided into two components: training and correspondence. The former is a multiview training that learns, with the aid of a CNN, to detect feature points in 2D images derived from triangle meshes of the training set. The latter uses the results of the training to infer semantic correspondences with feature points (vertices) in 3D shapes. The discovery of these points does not require new training or human interaction during the correspondence pipeline.
Palavras-chave:	Processamento geométrico Correspondência de pontos Formas 3D Aprendizagem profunda multivisão
País:	Brasil
Editor:	Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição:	UFMS
Tipo de acesso:	Acesso Aberto
URI:	https://repositorio.ufms.br/handle/123456789/5610
Data do documento:	2022
Aparece nas coleções:	Programa de Pós-graduação em Ciência da Computação

Arquivos associados a este item:

Não existem arquivos associados a este item.

Mostrar registro completo do item Visualizar estatísticas