Aprendizado de máquina em representações tridimensionais

Costa, Anderson Bessa da

Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/1749

Tipo:	Dissertação
Título:	Aprendizado de máquina em representações tridimensionais
Autor(es):	Costa, Anderson Bessa da
Primeiro orientador:	Matsubara, Edson Takashi
Abstract:	Aprendizado consiste em adquirir novos, ou modificar os existentes, conhecimentos, comportamentos, habilidades, valores ou preferências e pode envolver a síntese de diferentes tipos de informação. O aprendizado está fortemente relacionado à representação do conhecimento. Uma representação de conhecimento está ligada a capacidade de se inferir, ou seja, aprender. Uma representação de dados bastante presente nos últimos tempos se refere à representação tridimensional, associada fortemente a imagens 3D. Neste trabalho apresenta-se um estudo sobre aprendizado 3D com base em dois estudos de caso, imagens 3D adquiridas a partir do Kinect e movimentos adquirido a partir dos dados do wiimote. A visão humana sempre despertou um grande fascínio por ser considerada um dos sensores humanos mais ricos em informação. Sempre existiu um grande interesse em simular a capacidade de visão do ser humano. Com o surgimento e popularização de sistemas RGB-D (RedGreenBlue - Depth), é possível obter informação de profundidade de cada pixel de maneira rápida e confiável. Isto permitiu a aproximação da tecnologia atual com a visão humana, que com dois olhos são capazes de estimar a profundidade aproximada de um objeto. Uma imagem capturada de um sistema RGB-D é muito mais rica em informação do que uma imagem capturada de uma câmera comum. Estudar como este ganho de informação pode ser utilizado para melhorar a capacidade de representação e reconhecimento de objetos em Inteligência Artificial é um dos objetivos deste projeto. Por meio de uma proposta de um pipeline de aprendizado 3D, desde captura dos dados até algoritmos de reconhecimento, será provido um estudo sobre aprendizado em sistemas RGB-D. Assim como o Kinect, o nintendo Wii também revolucionou a indústria de games graças ao seu controle capaz de reconhecer os movimentos do jogador. Neste trabalho apresenta-se um estudo sobre reconhecimento de padrões em estruturas tridimensionais com o objetivo de explicitar que com a utilização da técnica de aprendizado de máquina juntamente com a representação adequada do problema é possível atingir altas taxas de acerto com um baixo tempo de processamento, o que foi realizado com sucesso. ABSTRACT - Learning is acquiring new or modifying existing knowledge, behaviors, skills, values, or preferences and may involve synthesizing different types of information. Learning is strongly related to knowledge representation. A knowledge representation is linked to the ability to infer, or learn. A data representation very seen nowdays is tridimensional representation, which is strongly associated with 3D images. This work presents a study on 3D learning based on two case studies, 3D images acquired from the Kinect and motion data acquired from the wiimote. Human vision has always aroused a great fascination for being considered one of the richest human sensors. There has always been a great interest in the ability to simulate human vision. With the emergence and popularization of systems RGB-D (RedGreenBlue - Depth), it is possible to obtain depth information of each pixel quickly and reliably. This allowed the approach of current technology with human vision, with two eyes that are able to estimate the approximate depth of an object. A captured image of a system RGB-D is much richer in information than a captured image of an ordinary camera. Study how this information gain can be used to improve the ability of representation and recognition of objects in Artificial Intelligence is one of the goals of this project. Through a proposal of a 3D pipeline learning, from data capture to recognition algorithms, will be provided a study on learning systems RGB-D. Just as the Kinect, the Nintendo Wii also revolutionized the gaming industry thanks to its control able to recognize the player’s movements. This paper presents a study on recognition of patterns in three-dimensional structures with the purpose of clarifying that the use of the technique of machine learning along with adequate representation of the problem is possible to achieve high hit rates with a low processing time, which was successful.
Palavras-chave:	Realidade Virtual Algoritmos para Imagens Imagem Digital Visão Computacional Terceira Dimensão (Modelos) Digital Image Algorithms for Images Virtual Reality Computer Vision Third Dimension (Models)
Tipo de acesso:	Acesso Aberto
URI:	https://repositorio.ufms.br/handle/123456789/1749
Data do documento:	2013
Aparece nas coleções:	Programa de Pós-graduação em Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Anderson.pdf		6,24 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas