Use este identificador para citar ou linkar para este item:
https://repositorio.ufms.br/handle/123456789/9470
Tipo: | Tese |
Título: | Unsupervised Domain Adaptation applied to Agriculture and Urban Forests using Transformers, GANs and Diffusion Models |
Autor(es): | Alessandro dos Santos Ferreira |
Primeiro orientador: | Wesley Nunes Goncalves |
Resumo: | Arquiteturas de aprendizado profundo, como Redes Neurais Convolucionais, representaram um enorme avanço na área de aprendizado de máquina e vèm continuamente quebrando recordes em inúmeras áreas da inteligência artificial como o reconhecimento de imagens. Todavia, o sucesso dessas arquiteturas é dependente de uma grande quantidade de dados rotulados. Essa anotação dos dados de treinamento consiste em um processo dispendioso e frequentemente realizado de forma manual. Nos problemas relacionados à agricultura e florestas urbanas,devido a diferenças nas condições de aquisição das imagens, por fatores como altura de captura, diferentes sensores, condição do solo, estágios da cultura e iluminação, é comum que os modelos precisem ser novamente treinados a medida que são realizadas novas capturas. Nesse contexto, a adaptação de domínio se apresenta como uma alternativa promissora para lidar com esse problema. A adaptação de domínio consiste em adaptar o conhecimento aprendido em um domínio de origem para aplicá-lo a um domínio destino diferente mas relacionado ao original. O objetivo desse trabalho é utilizar a abordagem de adaptação de domínio para encontrar soluções que lidem com problemas que necessitam de grandes quantidades de dados anotados. Nosso foco consiste em problemas relacionados à agricultura e florestas urbanas, utilizando recentes arquiteturas usadas na adaptação de domínio não supervisionada como as Redes Adversárias Generativas e Vision Transformers e Diffusion Models. Neste trabalho, propomos uma abordagem para resolver o problema de detecção de faixas de plantação e falhas em lavouras, usando dilatação para gerar mapas de segmentação aproximados a partir de linhas anotadas com um pixel de largura. Utilizamos DAFormer, um modelo baseado em transformers, para avaliar a capacidade de transferir o conhecimento aprendido em conjuntos de dados de origem para conjuntos de dados de destino. Além disso, propomos um método para segmentação de árvores que integra adaptação de domínio com modelos de tradução de imagem para imagem e redes de super-resolução para melhorar a qualidade de imagens aéreas de baixa resolução. Nosso método também visa enfrentar o desafio da limitação de dados rotulados, empregando aumento de dados para gerar amostras adicionais de treinamento em alta resolução a partir dos dados rotulados existentes, melhorando assim o desempenho do modelo e reduzindo a necessidade de processos custosos de rotulagem. |
Abstract: | Deep learning architectures, such as ConvNets, represented an impressive advance in the field of machine learning and are continually breaking records in numerous areas of artificial inteligence, such as image recognition. Nevertheless, the success of these architectures depends on a large amount of labeled data. The annotation of training data is a costly process often performed manually. In agricultural and urban forest problems, differences in image acquisition conditions, such as the height of capture, different sensors, soil conditions, crop stages, and lighting, often necessitate retraining models as new acquisitions are made. In this context, domain adaptation presents itself as a promising alternative to deal with this situation. Domain adaptation consists of adapting the knowledge learned from a source domain to apply it in a target domain, different but related to the original. The aim of this work is to use the domain adaptation approach to find solutions that address problems requiring large amounts of annotated data. Our focus consist of problems related to agriculture and urban forests, using recent architectures used in the unsupervised domain adaptation, such as Generative Adversarial Networks, Vision Transformers, and Diffusion Models. In this work, we propose an approach to address the problem of detecting crop rows and gaps using dilation to generate approximate segmentation maps from annotated one-pixel-wide lines. This method speeds up the pixel labeling process and reduces the line detection problem to semantic segmentation. We use the transformer-based model DAFormer to evaluate the ability to transfer the knowledge learned from source datasets to target datasets. Additionally, we propose a method for segmenting trees that integrates domain adaptation with image-to-image translation models and super-resolution networks to enhance the quality of low-resolution aerial images. Our method also aims to address the challenge of limited labeled data by employing data augmentation to generate additional high-resolution training samples from the existing labeled data, thereby improving model performance and reducing the need for costly labeling processes. |
Palavras-chave: | Deep learning, Agriculture, Semantic Segmentation |
País: | Brasil |
Editor: | Fundação Universidade Federal de Mato Grosso do Sul |
Sigla da Instituição: | UFMS |
Tipo de acesso: | Acesso Aberto |
URI: | https://repositorio.ufms.br/handle/123456789/9470 |
Data do documento: | 2024 |
Aparece nas coleções: | Programa de Pós-graduação em Ciência da Computação |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
tese.pdf | 52,97 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.