• Correspondence Analysis: a theoretical basis for categorical data interpretation in Health Sciences Questões Metodológicas

    Infantosi, Antonio Fernando Catelli; Costa, João Carlos da Gama Dias; Almeida, Renan Moritz Varnier Rodrigues de

    Abstract in Portuguese:

    Na área biomédica, a ocorrência de dados categóricos é comum, e métodos de análise específicos para este tipo de dado são usados para revelar padrões existentes. A Análise de Correspondência é uma dessas técnicas, utilizada na análise de tabelas de contingência de grande porte. A maioria dos trabalhos publicados em periódicos brasileiros foca apenas na sua interpretação gráfica, não abordando outras potencialidades da técnica. O objetivo do trabalho é mostrar a técnica não limitada à análise gráfica, mas também utilizar estatísticas que permitem sua análise quantitativa. Exemplo mostra que a análise gráfica é enriquecida com a utilização dessas estatísticas, e que a inclusão de uma categoria com baixa ocorrência pode ser considerada como categoria suplementar devido à sua baixa contribuição à inércia. Assim, diminui-se a subjetividade na análise, sendo possível revelar a relação entre as categorias com a análise de resíduos, aspecto este não facilmente observado graficamente. Comparação com a Análise de Componentes Principais mostrou a vantagem da técnica.

    Abstract in Spanish:

    En el campo biomédico, los datos categóricos son frecuentemente utilizados y los métodos de análisis específicos son empleados para revelar patrones intrínsecamente existentes en los mismos. El Análisis de Correspondencias es una de estas técnicas, siendo útil en el análisis de tablas de contingencia con un gran número de clases. A pesar de que muchos artículos han explorado esta técnica, la mayoría de trabajos en revistas brasileñas se centra sólo en su interpretación gráfica. El objetivo de este trabajo es incluir estadísticas que permitan la interpretación cuantitativa de la técnica. Como ejemplo, tenemos el análisis de un mapa simétrico enriquecido con el uso de estadísticas, en el cual la inclusión de una clase de baja ocurrencia puede ser considerada como una categoría suplementaria, debido a su baja contribución a la inercia de datos. Por lo tanto, disminuye la subjetividad en el análisis, siendo posible ahora revelar la relación entre las categorías con el análisis residual, lo que no es fácil observar en los gráficos. La comparación con el análisis de componentes principales mostró sus ventajas.

    Abstract in English:

    Categorical variables are common in the biomedical field, and many descriptive methods have been proposed for revealing intrinsic patterns in data. Correspondence Analysis is an especially useful method for categorical data analysis of large contingency tables. Although numerous studies have been published on this method, most Portuguese-language articles have failed to explore its full potential, focusing only on graphical interpretation. The current paper reviews the method, showing that graphical analysis can be enriched by the right statistics. The article presents the mathematical basis for correspondence analysis and its most frequently used statistics. The procedure has shown that such statistics enrich symmetric map evaluation, that a low relative frequency category can be represented by supplementary category points, and that inertia contributions are highly related to residual analysis of contingency tables, not easily visualized by symmetric maps. Correspondence Analysis has proven advantageous when compared to principal components analysis.
Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz Rio de Janeiro - RJ - Brazil
E-mail: cadernos@ensp.fiocruz.br