Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/5639
Tipo: Dissertação
Título: Deep Learning Approaches to Segment Eucalyptus Tree Images
Autor(es): MÁRIO DE ARAÚJO CARVALHO
Primeiro orientador: Wesley Nunes Goncalves
Resumo: O agronegócio é uma das principais fontes de riqueza e emprego do Brasil, representando uma parcela significativa do Produto Interno Bruto (PIB) nacional. Em 2021, o setor do agronegócio atingiu 27,4% do PIB brasileiro, a maior participação desde 2004, quando atingiu 27,53%. A indústria de base florestal é um importante segmento do agronegócio, pois fornece insumos vitais para diversos setores industriais, como produtos de madeira, móveis e papel. As florestas plantadas desempenham um papel essencial na captura de carbono e outros serviços ecossistêmicos, sendo o eucalipto a árvore mais utilizada, com 7,3 milhões de hectares de florestas de eucalipto em 2021. O mapeamento de árvores é vital para a economia e o meio ambiente, e as soluções baseadas em inteligência artificial são valiosas ferramentas de apoio à decisão em agricultura e mapeamento de árvores. Consequentemente, há um forte incentivo para buscar soluções mais abrangentes que utilizem tecnologias avançadas de aprendizado profundo para essa área. Assim, este trabalho tem como objetivo avaliar redes neurais convolucionais de aprendizado profundo eficientes para segmentação de imagens de troncos de eucalipto e apresentar uma proposta de segmentação específica para troncos de eucalipto que pode beneficiar aplicações agrícolas ou ferramentas de apoio à decisão para mapeamento de árvores. Este trabalho foi dividido em duas etapas principais para avaliar as redes de segmentação e criar uma técnica de pós-processamento. A primeira etapa deste estudo avaliou a eficiência de redes de aprendizado profundo na segmentação semântica de troncos de eucalipto em imagens panorâmicas em cores RGB capturadas no nível do solo. As redes de aprendizado profundo FCN, GCNet, ANN e PointRend foram avaliadas nesta etapa para segmentação de imagens de troncos de eucalipto. O treinamento e a avaliação das redes foram realizados usando uma abordagem de validação cruzada de cinco etapas, usando um conjunto de dados composto por imagens anotadas manualmente de uma floresta de eucalipto. O conjunto de dados inicial foi criado usando um campo de visão esférico da câmera. Ele incluiu uma variedade de eucaliptos com características distintas, como variações nas distâncias entre os troncos e mudanças na curvatura, tamanhos e diâmetros dos troncos, que representam desafios significativos para métodos de aprendizado profundo em tarefas de segmentação semântica. Para a primeira etapa deste estudo, o modelo FCN apresentou o melhor desempenho, com precisão de pixel de 78,87% e mIoU de 70,06%, além de obter um bom tempo de inferência. As redes GCNet e ANN também tiveram desempenho semelhante ao FCN, mas com impactos negativos em sua capacidade de generalizar tarefas em contextos específicos. O estudo conclui que o FCN foi o mais robusto, dentre os métodos avaliados, para segmentação semântica de imagens de árvores em imagens panorâmicas. Essa avaliação das redes de segmentação pode ser um passo crucial para o desenvolvimento de outras ferramentas relevantes no manejo florestal, como a estimativa de altura e diâmetro do tronco. A segunda etapa deste trabalho foi criar e avaliar uma técnica de pós-processamento de imagens RGB-D para melhorar os resultados das redes semânticas atuais para segmentação em imagens de eucalipto. Criamos uma nova imagem de conjunto de dados a partir de imagens obtidas de uma câmera estéreo, que capturou não apenas as informações de cor (RGB), mas também as informações de profundidade, o que permitiu uma visão ainda mais completa da floresta de eucalipto. Após a construção do novo banco de imagens, sua anotação foi realizada por especialistas. A próxima etapa deste estudo foi a avaliação de seis redes de segmentação semântica de imagens e a comparação com os resultados antes e depois da aplicação da técnica de pós-processamento. Treinamos, avaliamos e testamos as redes FCN, ANN, GCNet, SETR, SegFormer e DPT nas imagens anotadas. A técnica de pós-processamento melhorou significativamente os resultados das redes de segmentação de imagens testadas, com um ganho significativo de 24,13% em IoU e 13,11% em F1-score para redes baseadas em convolução e 12,49% para IoU e 6,56% em F1-score para redes baseadas em transformadores. A rede SegFormer obteve os melhores resultados em todos os testes antes e após a aplicação da técnica. A técnica também corrigiu com eficácia falhas de segmentação, erosão e erros de dilatação, resultando em bordas mais precisas e troncos mais bem delimitados. O custo computacional médio da técnica foi de 0,019 segundos, indicando que ela pode ser aplicada em redes de segmentação sem comprometer o desempenho. Os resultados obtidos pela aplicação da técnica de pós-processamento propõem uma abordagem inovadora com baixo custo computacional e melhorias significativas para as redes de segmentação existentes.
Abstract: Agribusiness is one of Brazil's primary sources of wealth and employment, representing a significant portion of the national Gross Domestic Product (GDP). In 2021, the agribusiness sector reached 27.4% of the Brazilian GDP, the highest share since 2004, when it reached 27.53%. The forest-based industry is an important segment of agribusiness, as it provides vital inputs for various industrial sectors, such as wood products, furniture, and paper. Planted forests play an essential role in carbon capture and other ecosystem services, with eucalyptus being the most used tree, with 7.3 million hectares of eucalyptus forests in 2021. Tree mapping is vital for the economy and environment, and artificial intelligence-based solutions are valuable decision support tools in agriculture and tree mapping. Consequently, there is a strong incentive to look for more comprehensive solutions that use advanced deep learning technologies for this area. Thus, this work aims to evaluate efficient deep learning convolutional neural networks for image segmentation of eucalyptus trunks and present a specific segmentation proposal for eucalyptus trunks that can benefit agricultural applications or decision support tools for tree mapping. This work was divided into two main steps to evaluate the segmentation networks and create a post-processing technique. The first stage of this study evaluated the efficiency of deep learning networks in the semantic segmentation of eucalyptus trunks in panoramic images in RGB colors captured at ground level. The deep learning networks FCN, GCNet, ANN, and PointRend were evaluated in this step for image segmentation of eucalyptus trunks. Training and evaluation of the networks were performed using a five-step cross-validation approach, using a dataset composed of manually annotated images of a eucalyptus forest. The initial dataset was created using a spherical field of view camera. It included a variety of eucalyptus trees with distinct characteristics, such as variations in distances between trunks and changes in curvature, sizes, and diameters of trunks, which pose significant challenges for deep learning methods in semantic segmentation tasks. For the first stage of this study, the FCN model presented the best performance, with pixel precision of 78.87% and mIoU of 70.06%, in addition to obtaining a good inference time. The GCNet and ANN networks also performed similarly to the FCN but with negative impacts on their ability to generalize tasks in specific contexts. The study concludes that the FCN was the most robust, among the evaluated methods, for semantic segmentation of images of trees in panoramic images. This assessment of segmentation networks can be a crucial step toward developing other relevant tools in forest management, such as estimating trunk height and diameter. The second step of this work was to create and evaluate a post-processing technique for RGB-D images to improve the results of current semantic networks for segmentation in eucalyptus images. We created a new dataset image using images obtained from a stereo camera, which captured not only the color information (RGB) but also the depth information, which allowed an even more complete view of the eucalyptus forest. After the construction of the new image bank, its annotation was carried out by specialists. The next stage of this study was the evaluation of six image semantic segmentation networks and the comparison with results before and after applying the post-processing technique. We trained, evaluated, and tested the FCN, ANN, GCNet, SETR, SegFormer, and DPT networks on the annotated images. The post-processing technique significantly improved the results of the tested image segmentation networks, with a significant gain of 24.13% in IoU and 13.11% in F1-score for convolution-based networks and 12.49% for IoU and 6.56% in F1-score for transformer-based networks. The SegFormer network obtained the best results in all tests before and after applying the technique. The technique also effectively corrected segmentation flaws, erosion, and dilation errors, resulting in more accurate edges and better-delimited trunks. The average computational cost of the technique was 0.019 seconds, indicating that it can be applied in segmentation networks without compromising performance. The results obtained by applying the post-processing technique propose an innovative approach with low computational cost and significant improvements to existing segmentation networks.
Palavras-chave: Image Segmentation
Convolutional Neural Networks
Eucalyptus Tree.
País: Brasil
Editor: Fundação Universidade Federal de Mato Grosso do Sul
Sigla da Instituição: UFMS
Tipo de acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/5639
Data do documento: 2023
Aparece nas coleções:Programa de Pós-graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo TamanhoFormato 
revised_dissertation_segmentation_trees_mario_carvalho_ppgcc_facom_ufms_2023_02_17.pdf20,41 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.