Use este identificador para citar ou linkar para este item: https://repositorio.ufms.br/handle/123456789/2967
Tipo: Dissertação
Título: Classificação de séries temporais baseada em análise de recorrência e extração de características
Autor(es): Maggioni e Silva, Angelo
Abstract: A identificação de padrões em fluxos de dados contínuos tem despertado o interesse científico, seja na detecção de falhas em sistemas, identificação de operações fraudulentas em transações bancárias, propagação de doenças ou ainda na preservação do meio ambiente. A categorização destes dados, concomitante com a ampliação do sensoriamento e monitoramento de diversos outros domínios, motiva a busca por soluções práticas e eficientes que auxiliem na busca por padrões recorrentes. A extração de conhecimento dos dados, quando dependentes do tempo, exige um tratamento especial e a mineração dos dados apresenta-se como uma atividade valiosa. Neste trabalho, é proposta uma abordagem chamada DSP-Class para classificação de séries temporais utilizando Descritores de Textura aplicados em Gráficos de Recorrência (RP). São utilizados 14 conjuntos de dados reais relacionados a vocalizações de aves, identificação de insetos, categorização de reações químicas, dentre outros. O objetivo desta pesquisa é verificar a utilização das características texturais de RPs em algoritmos de aprendizagem, tais como Support Vector Machine (SVM) e C5:0, aplicando a Decomposição de Modo Empírico (EMD) na classificação de séries temporais. Também é analisada a influência estocástica-determinística presentes nos fluxos. Verifica-se desempenho ruim do algoritmo 1NN, considerado estado-da-arte, em séries predominantemente estocásticas ou determinísticas e desempenho 67:66% superior da abordagem DSP-Class, uma vez que as características texturais distinguem classes de séries temporais mais satisfatoriamente que a busca por similaridade utilizada no algoritmo 1NN nos dados analisados. Verifica-se inclusive, resultados 18;67% superiores àqueles obtidos por pesquisas semelhantes que utilizam outras características presentes em séries temporais.
ABSTRACT - Identify patterns in continuous data streams has attracted scientific interest for detecting system failures, identify fraudulent transactions in banks, the spread of diseases and also in the preservation of the environment. The increased volume of data produced in the last decade, concomitant with the number of sensors motivates the search for practical and efficient solutions that help data categorization. The extraction of knowledge about them, when time-dependent, requires special treatment and mining data becomes a valuable activity. In this paper, we propose an approach called DSP-Class for time series classification using texture descriptors applied Recurrence Charts (RP). We adopt 14 real datasets related to sound recognition, signals processing, chemical reactions and another produced by Big Data which demand high processing capacity. The purpose of this research is to verify the use of textural features in machine learning algorithms, such as SVM and C 5:0, applying Decomposition Empirical Mode (EMD) in time series classification. It is also analysed the stochastic-deterministic influence present in data streams. It presented poor results of 1-Nearest Neighbour algorithm when the data stream is mostly deterministic or stochastic. Our approach outperforms a traditional preprocessing approach applied on an audio stream using coefficients as features in around 18;67% of average accuracy and in around 67;66% the state-of-art algorithm that uses distance as measure.
Palavras-chave: Análise de Séries Temporais
Algorítmos Computacionais
Computação
Computer Science
Time-Series Analysis
Computer Algorithms
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufms.br/handle/123456789/2967
Data do documento: 2016
Aparece nas coleções:Programa de Pós-graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Angelo Maggioni e Silva.pdf2,93 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.