Aplicando redes neurais para reduzir espaço utilizado no armazenamento de conjuntos de dados

Revista Terra & Cultura

Endereço:
Rua Alagoas, 2050 - Centro
Londrina / PR
86020430
Site: http://periodicos.unifil.br/index.php/Revistateste/index
Telefone: (43) 3375-7448
ISSN: 0104-8112
Editor Chefe: Leandro Henrique Magalhães
Início Publicação: 01/09/1981
Periodicidade: Semestral
Área de Estudo: Multidisciplinar

Aplicando redes neurais para reduzir espaço utilizado no armazenamento de conjuntos de dados

Ano: 2024 | Volume: 40 | Número: Especial
Autores: Rafael Martins Trindade, Ricardo Petri Silva
Autor Correspondente: Rafael Martins Trindade | periodicos@unifil.br

Palavras-chave: aprendizagem de máquina, rede neural, redução de dimensionalidade, conjunto de dados, armazenamento de dados.

Resumos Cadastrados

Resumo Português:

Ao trabalhar com Aprendizagem de Máquina, existem casos em que manipular o conjunto de dados pode se tornar trabalhoso ou demorado devido à grande quantidade de informação. Apesar de existirem técnicas de redução de dimensionalidade como a análise de componentes principais ou a análise discriminante linear que podem ser utilizadas para reduzir a quantidade de atributos, elas não são capazes de reduzir o conjunto de dados sem perda de informação. Esse trabalho busca investigar a possibilidade de empregar técnicas que transformam dados de formas que seriam extremamente difíceis de reverter ao combiná-las com o uso de redes neurais para essa restauração dos dados, sem que haja perda de informação. Para isso, foi criada uma prova de conceito utilizando a base de dados clássica de flores Iris. Apesar de não terem sido capazes de restaurar o conjunto de dados original, os modelos testados foram capazes de obter valores muito próximos dos originais. Por se tratar de um estudo inicial, houveram diversas limitações nos testes realizados. Ainda que o objetivo proposto não tenha sido atingido, ficou evidente que ainda existe potencial inexplorado para este conceito.



Resumo Inglês:

Working  with  Machine  Learning,  there  are  cases  when  manipulating  datasets  can become  cumbersome  or  slow  due  to  the  great  amount  of  data.  Despite  there  being  dimensionality  reduction  techniques  such  as  principal  component  analysis  or  linear  discriminant  analysis  that  can  be  used  to  reduce  the  amount  of  attributes,  these  techniques are not able to reduce the dataset without information loss. This article aims  to investigate the possibility of employing techniques which transform data in ways that  would be extremely hard to revert by combining them with the use of neural networks  for the data restoration, with no information loss. For this purpose, a proof of concept  was  made  using  the  iris  dataset.  Although  they  weren't  able  to  restore  the  original  datasets, the tested models were able to produce values very close to the originals. Being an initial study, there were many limitations on the tests done. So even though.