A importância da pergunta de pesquisa na análise de dados epidemiológicos

Cláudia Medina Coeli Marilia Sá Carvalho Luciana Dias de Lima Sobre os autores

A modelagem estatística é frequentemente usada para a análise de dados epidemiológicos. Modelos estatísticos são ferramentas e podem ser empregados de forma diferente, dependendo do objetivo da pesquisa ser descrição, explicação causal ou previsão 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.. Shmueli 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310. faz uma discussão abrangente sobre esse tema, ressaltando a importância de se adequar a estratégia analítica à pergunta de pesquisa.

A modelagem descritiva é usada para representar de forma parcimoniosa a estrutura dos dados 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.. Em Epidemiologia, essa modelagem é utilizada quando o interesse é explorar a associação entre vários fatores de risco e um desfecho. São construídos modelos estatísticos com seleção de variáveis baseada em significância estatística e avaliação de ajuste do modelo 22. Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd Ed. Hoboken: Wiley; 2013.. Esse tipo de estratégia ainda é frequentemente adotada em artigos submetidos à CSP. É usada mesmo em tópicos para os quais já existem muitos artigos empregando a mesma abordagem 33. Carvalho MS, Travassos C, Coeli CM. Mais do mesmo? Cad Saúde Pública 2013; 29:2141.. Outra limitação encontrada é a interpretação causal das associações observadas, inadequada para esse tipo de estudo.

Em Epidemiologia, a modelagem explicativa é usada para testar hipóteses causais entre um fator de risco e um desfecho. Na análise, também são empregados modelos estatísticos, entretanto a especificação do modelo é baseada no conhecimento a priori44. Hernán MA, Hernández-Díaz S, Werler MM, Mitchell AA. Causal knowledge as a prerequisite for confounding evaluation: an application to birth defects epidemiology. Am J Epidemiol 2002; 155:176-84.. Um modelo teórico-operacional deve ser proposto identificando, além da exposição e do desfecho, as variáveis de confusão e mediadoras. O modelo estatístico é, então, aplicado aos dados para testar a hipótese causal, tendo como referência o modelo teórico-operacional 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.. Alguns manuscritos submetidos à CSP que testam uma hipótese causal não orientam a análise segundo um modelo teórico-operacional. Entre outros problemas, isso pode levar à inclusão indevida de covariáveis no modelo estatístico, introduzindo viés de seleção 55. Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias. Epidemiology 2004; 15:615-25.. Em outros casos, são apresentados e discutidos resultados de medida de efeito tanto para a variável de exposição como para todas as covariáveis incluídas no modelo estatístico. Essa estratégia é inadequada, uma vez que pode levar à interpretação incorreta do efeito das covariáveis (efeito total vs. direto) 66. Westreich D, Greenland S. The table 2 fallacy: presenting and interpreting confounder and modifier coefficients. Am J Epidemiol 2013; 177:292-8..

Manuscritos empregando a modelagem preditiva são mais raros em CSP. Como ocorre nas Ciências Sociais 77. Hofman JM, Sharma A, Watts DJ. Prediction and explanation in social systems. Science 2017; 355:486-8. e na Psicologia 88. Yarkoni T, Westfall J. Choosing prediction over explanation in psychology: lessons from machine learning. Perspect Psychol Sci 2017; 12:1100-22., na Epidemiologia há maior ênfase na explicação causal do que na predição. A modelagem preditiva objetiva predizer observações novas ou futuras, sendo empregados tanto algoritmos de mineração de dados quanto modelos estatísticos 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.. Mesmo quando se opta pelos últimos, a estratégia analítica é diferente da que seria empregada quando o objetivo é a explicação. Uma questão central na modelagem preditiva é a validação cruzada, que permite avaliar a acurácia do modelo em um conjunto de dados diferente daquele em que foi treinado 88. Yarkoni T, Westfall J. Choosing prediction over explanation in psychology: lessons from machine learning. Perspect Psychol Sci 2017; 12:1100-22.. Na modelagem preditiva, não é necessário um modelo teórico-operacional muito elaborado. Por um lado, um modelo preditivo, mesmo que não represente adequadamente a realidade, pode apresentar um bom poder de predição. Por outro, um modelo explicativo com pequeno viés pode não apresentar um bom poder preditivo 11. Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.. Um problema encontrado nos manuscritos submetidos à CSP é o emprego da modelagem descritiva ou explicativa com o objetivo de predição. Outro problema observado é a utilização de toda a amostra tanto para treinar o modelo como para avaliar acurácia das predições.

A escolha da pergunta de pesquisa é etapa essencial na elaboração de um manuscrito. Ela deve ser relevante, precisa e objetiva, orientando a estratégia analítica, assim como a interpretação dos resultados alcançados. Nesse sentido, em artigos que se apoiam em modelos estatísticos para análise de dados epidemiológicos é fundamental ter clareza quanto aos objetivos de descrever, explicar ou predizer os fenômenos estudados.

  • 1
    Shmueli G. To explain or to predict? Stat Sci 2010; 25:289-310.
  • 2
    Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd Ed. Hoboken: Wiley; 2013.
  • 3
    Carvalho MS, Travassos C, Coeli CM. Mais do mesmo? Cad Saúde Pública 2013; 29:2141.
  • 4
    Hernán MA, Hernández-Díaz S, Werler MM, Mitchell AA. Causal knowledge as a prerequisite for confounding evaluation: an application to birth defects epidemiology. Am J Epidemiol 2002; 155:176-84.
  • 5
    Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias. Epidemiology 2004; 15:615-25.
  • 6
    Westreich D, Greenland S. The table 2 fallacy: presenting and interpreting confounder and modifier coefficients. Am J Epidemiol 2013; 177:292-8.
  • 7
    Hofman JM, Sharma A, Watts DJ. Prediction and explanation in social systems. Science 2017; 355:486-8.
  • 8
    Yarkoni T, Westfall J. Choosing prediction over explanation in psychology: lessons from machine learning. Perspect Psychol Sci 2017; 12:1100-22.

Datas de Publicação

  • Publicação nesta coleção
    17 Maio 2021
  • Data do Fascículo
    2021
Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz Rio de Janeiro - RJ - Brazil
E-mail: cadernos@ensp.fiocruz.br