Ordenamento multidimensional sensível ao contexto: uma técnica alternativa para dados complexos

Weber Martins, Lauro Eugênio Guimarães Nalini, Fernando Pirkel Tsukahara

Resumo


A Muitas aplicações, como a comparação entre produtos representados por um grande número de atributos, requerem a ordenação de dados representados por vetores de alta dimensionalidade. A despeito da razoável quantidade de artigos nas áreas de classificação e agrupamento, trabalhos em ranking multidimensional são raros. Este artigo expande um procedimento neurogenético genérico de ordenação baseado em mapas auto-organizáveis (SOMs) unidimensionais. A métrica típica de similaridade, distância euclidiana, é modificada para uma distância euclidiana ponderada, sendo automaticamente ajustada através de busca com uso de algoritmos genéticos, uma técnica heurística de busca (optimização). O objetivo da busca é encontrar a ponderação cujo ranking melhor se ajusta aos critérios solicitados por especialistas, conduzindo a métricas sensíveis ao contexto. Para facilitar o acordo entre especialistas, a técnica sustenta-se no consenso sobre o melhor e o pior dado somente. Além da tarefa de ordenação, a métrica derivada é ainda útil na redução do número de dimensões (itens de questionários em algumas situações) e na modelagem da fonte de dados. Em termos práticos, uma técnica para converter julgamentos subjetivos em notas objetivas é apresentada, criando-se um modelo específico e operacional que é capaz de lidar com novas situações. Essa técnica é exemplificada brevemente por dois casos: ranking de dados oriundos de inspeções em bancos de sangue e segmentação de clientes em agronegócios. Sob ponto de vista teórico, o sistema proposto apresentou um modo de estabilizar resultados obtidos a partir do trainamento de SOMs pela imposição de restrições de especialistas humanos, conduzindo a ranking multidimensionais sensíveis a contexto. Embora SOMs constituam uma classe de redes neurais artificiais, eles são radicalmente diferentes do modelo neural usualmente empregado em estudos econômicos e de negócios, o perceptron multicamadas com algoritmo de treinamento de retropropagação de erros (backpropagation). O principal objetivo deste artigo é, portanto, a apresentação de uma interessante combinação de técnicas originadas na Inteligência Artificial – um campo multidisciplinar mais ligado à Engenharia que à Matemática, onde Estatística tem suas origens e base dedutiva.

Palavras-chave


Ranking. Mapa auto-organizável. Algoritmo genético. Multidimensionalidade. Redução de dados. Ranking. Self-organizing map. Genetic algorithm. Multidimensionality. Data reduction.

Texto completo:

PDF


Rev. Psi: Org e Trab R. Eletr. Psico., ISSN 1984-6657, Brasília, Brasil.