RESUMO
OBJETIVO:
descrever os resultados da aplicação de um procedimento de baixo custo, baseado em software livre, para o georreferenciamento de dados do Sistema de Informações sobre Mortalidade (SIM) no município do Rio de Janeiro, Brasil.
MÉTODOS:
estudo descritivo, com uso da base de endereços do Google Maps para georreferenciamento de dados de óbitos registrados no SIM, ocorridos no município entre 2010 e 2012; o trabalho foi realizado em três etapas, (i) padronização dos endereços, (ii) georreferenciamento pelo Google e (iii) intervenção manual.
RESULTADOS:
do total de 26.081 endereços submetidos ao procedimento, 18.646 (71,5%) foram automaticamente georreferenciados; os 7.435 remanescentes foram submetidos a intervenção manual, encontrando-se 5.250; 70,6% dos endereços não foram localizados inicialmente; afinal, 91,6% dos endereços foram georreferenciados.
CONCLUSÃO:
o procedimento apresentou alta proporção de acertos automáticos e, apesar de demandar maior tempo, a intervenção manual reduziu consideravelmente as perdas.
Palavras-chave:
Mapeamento Geográfico; Sistemas de Informação Geográfica; Análise Espacial; Epidemiologia Descritiva
ABSTRACT
OBJECTIVE:
to describe the results of the application of a low cost procedure, using free software, for geocoding data from the Mortality Information System (SIM), in the municipality of Rio de Janeiro.
METHODS:
descriptive study using Google Maps database for geocoding deaths data recorded at SIM, occurred from 2010 to 2012, in Rio de Janeiro; the study was carried out in three stages, (i) standardization of addresses, (ii) geocoding by Google Maps, and (iii) manual intervention.
RESULTS:
from the total of 26,081 addresses submitted to the procedure, 18,646 (71.5%) had exact matches; the remaining 7,435 were submitted to manual intervention, which found 5,250; 70.6% of the addresses were not initially found; a total of 91.6% of the addresses were geocoded.
CONCLUSION:
the procedure presented high proportion of automatic matches and, although it demanded much time, manual intervention allowed a considerable reduction of losses.
Keywords:
Geographic Mapping; Geographic Information Systems; Spatial Analysis; Epidemiology, Descriptive
RESUMEN
OBJETIVO:
describir los resultados de la aplicación de un procedimiento de bajo costo basado en software libre para la georreferenciación de datos del Sistema de Informaciones sobre Mortalidad (SIM), en el municipio de Río de Janeiro.
MÉTODOS:
estudio descriptivo utilizando la base de direcciones de Google Maps para la georreferenciación de datos de óbitos registrados en el SIM, ocurridos del 2010 al 2012, en el municipio de Río de Janeiro; el trabajo se llevó a cabo en tres etapas, (i) estandarización de las direcciones, (ii) georreferenciación por Google e (iii) intervención manual.
RESULTADOS:
de 26.081 direcciones sometidas al procedimiento, 18.646 (71,5%) fueron automáticamente georreferenciadas; el restante, 7.435, se enviaron a intervención manual, donde fueron encontrados 5.250; al final, se georreferencio 91,6%.
CONCLUSIÓN:
el procedimiento presentó una alta proporción de aciertos automáticos y, a pesar de demandar más tiempo, la intervención manual permitió una considerable reducción de las pérdidas.
Palabras-clave:
Mapeo Geográfico; Sistemas de Información Geográfica; Análisis Espacial; Epidemiología Descriptiva
Introdução
No Brasil, existem Sistemas de Informações em Saúde (SIS) consolidados, a exemplo do Sistema de Informações sobre Mortalidade (SIM) e do Sistema de Informação de Agravos de Notificação (Sinan),11. Ministério da Saúde (BR). Biblioteca Virtual em Saúde. Vigilância em Saúde. Sistemas de Informação: informações estratégicas [Internet]. 2008 [citado 2016 jun 15]. Disponível em: Disponível em: http://bvsms.saude.gov.br/bvs/svs/inf_sist_informacao.php .
http://bvsms.saude.gov.br/bvs/svs/inf_si... que disponibilizam dados para análises de situação de saúde. Contudo, o georreferenciamento desses dados em cidades brasileiras ainda é um desafio. Entre os problemas mais comuns destacam-se a qualidade dos dados, a falta de sistemas de informações geográficas (SIG) municipais estruturados, a falta de bases cartográficas digitais e cadastros oficiais de endereços, além da complexidade da infraestrutura urbana, principalmente em áreas carentes como ocupações irregulares e favelas, onde é comum a não padronização dos endereços.22. Barcellos C, Ramalho WM, Gracie R, Magalhães MAFM, Fontes MP, Skaba DA. Georreferenciamento de dados de saúde na escala submunicipal: algumas experiências no Brasil. Epidemiol Serv Saúde. 2008 mar;17(1):59-70.
Os SIG são usados para descrever, analisar e prever padrões espaciais, dispondo de diversas aplicações em epidemiologia, como o mapeamento de doenças, a investigação de surtos e análises espaciais.33. Kirby RS, Delmelle E, Eberth JM. Advances in spatial epidemiology and geographic information systems. Ann Epidemiol [Internet]. 2017 Jan[cited 2017 Jan 10];27(1):1-9. Available from: Available from: http://www.annalsofepidemiology.org/article/S1047-2797(16)30495-1/fulltext
http://www.annalsofepidemiology.org/arti... Seu uso depende, sobretudo, da disponibilidade de dados georreferenciados. O georreferenciamento, por sua vez, é o processo pelo qual informações textuais descritivas de uma localidade, como o endereço relacionado a um evento de saúde, são convertidas em representações geográficas válidas. Ele pode ser realizado por meio da associação a um par de coordenadas geográficas ou a unidades espaciais, como setores censitários, bairros, municípios, entre outras.44. Goldberg DW. A geocoding best practices guide [Internet]. Springfield: North American Association of Central Cancer Registries; 2008 [cited 2017 Ago 28]. 287 p. Available from: Available from: https://20tqtx36s1la18rvn82wcmpn-wpengine.netdna-ssl.com/wp-content/uploads/2016/11/Geocoding_Best_Practices.pdf
https://20tqtx36s1la18rvn82wcmpn-wpengin... ,55. Goldberg DW, Wilson JP, Knoblock CA. From text to geographic coordinates: the current state of geocoding. J Urban Reg Inf Syst Assoc. 2007 Jan;19(1):33-46.
As ferramentas de georreferenciamento, concomitantemente aos avanços da informática, têm apresentado melhorias em termos de qualidade, acessibilidade e redução de custos. A escolha do método depende da disponibilidade de informações e bases cartográficas, da precisão desejada, do volume de dados e dos recursos disponíveis.55. Goldberg DW, Wilson JP, Knoblock CA. From text to geographic coordinates: the current state of geocoding. J Urban Reg Inf Syst Assoc. 2007 Jan;19(1):33-46.,66. Rushton G, Armstrong MP, Gittler J, Greene BR, Pavlik CE, West MM, et al. Geocoding in cancer research: a review. Am J Prev Med. 2006 Fev;30(2 Suppl):16-24.
O objetivo deste trabalho foi descrever os resultados da aplicação de um procedimento de baixo custo, baseado em software livre, para o georreferenciamento de dados do Sistema de Informações sobre Mortalidade - SIM - no município do Rio de Janeiro, Brasil
Métodos
Estudo descritivo de um método de georreferenciamento de dados sobre óbitos registrados no SIM, ocorridos no município do Rio de Janeiro entre 2010 e 2012.
Em 2010, a população do município era de 6.320.446 habitantes, dos quais 2,62% vivendo em extrema pobreza. No mesmo ano, o índice de desenvolvimento humano municipal era de 0,799. O produto interno bruto per capita era de 46.461,82 reais em 2014.77. Instituto Brasileiro de Geografia e Estatística. Cidades@ [Internet]. 2014 [citado 2017 mar 20]. Disponível em: Disponível em: http://cidades.ibge.gov.br/xtras/home.php?lang=
http://cidades.ibge.gov.br/xtras/home.ph... A cobertura da Atenção Básica no município era de 52% em fevereiro de 2017.88. Ministério da Saúde (BR). Departamento de Atenção Básica. Nota técnica: sistema de nota técnica do DAB [Internet]. 2017 [citado 2017 mar 20]. Disponível em: Disponível em: http://dab2.saude.gov.br/sistemas/notatecnica/frmListaMunic.php .
http://dab2.saude.gov.br/sistemas/notate...
Os dados de óbitos ocorridos no período, por doenças isquêmicas do coração (DIC) e cerebrovasculares (DCBV), correspondentes aos códigos I20 a I25 e I60 a I69 da Décima Revisão da Classificação Internacional de Doenças (CID-10), foram obtidos do SIM da Secretaria Municipal de Saúde do Rio de Janeiro.
O trabalho foi realizado em três etapas: (I) padronização dos endereços, (II) georreferenciamento por meio do Google Maps e (III) intervenção manual (Figura 1).
- Diagrama representando as três fases do procedimento de georreferenciamento de dados do Sistema de Informações sobre Mortalidade no município do Rio de Janeiro, 2010-2012
A padronização dos endereços, programada em R,99. R Core Team. R: a language and environment for statistical computing [Internet]. Viena: R Foundation for Statistical Computing; 2017 [cited 2017 Mar 20]. Available from: Available from: https://www.r-project.org/
https://www.r-project.org/... buscou corrigir erros frequentes, remover caracteres estranhos e padronizar componentes relacionados aos tipos (avenida, praça, rua) e aos títulos (Presidente, Professora, Princesa) dos logradouros. As substituições realizadas constam em material suplementar. Embora essa etapa não tenha eliminado todos os erros, ela foi útil para aumentar a quantidade de endereços georreferenciados automaticamente.
O georreferenciamento foi realizado por meio da Interface de Programação de Aplicativos (API) do Google, acessada com um script programado em R. A API de georreferenciamento compara os endereços informados com a base do Google Maps, para a captura das coordenadas geográficas. A utilização gratuita permite a requisição diária de até 2.500 pares de coordenadas.1010. Google. Google maps geocoding API [Internet]. 2016 [citado 2017 mar 24]. Disponível em: https://developers.google.com/maps/documentation/geocoding/
https://developers.google.com/maps/docum... A API também retorna o endereço localizado e sua precisão, como residência, edificação específica (condomínio, parque, aeroporto), logradouro, bairro, cidade etc.
Para verificar a qualidade do georreferenciamento, os endereços encontrados pelo Google receberam o mesmo tratamento dos informados, sendo comparados entre si. Quando não correspondentes, foram transferidos para intervenção manual, juntamente com os demais endereços não localizados. Ademais, uma amostra de 100 endereços georreferenciados automaticamente foi analisada manualmente, para verificar se a coordenada correspondia ao endereço informado.
Na etapa manual, erros ortográficos remanescentes foram corrigidos e novamente submetidos ao georreferenciamento automático. Casos mais complexos exigiram pesquisas manuais, por meio do Google Street View, que permite a visualização do logradouro, e da base de logradouros do município, obtida do Instituto Pereira Passos. Endereços sem número foram georreferenciados nos pontos médios dos logradouros, quando contidos em um setor censitário, devido ao uso desses dados em um estudo epidemiológico. Quando não contido, o endereço foi considerado perda. A verificação baseou-se na sobreposição das bases de logradouros e de setores censitários, obtida da Fundação Instituto Brasileiro de Geografia e Estatística (IBGE).
As perdas foram analisadas pelo mapa de distribuição do percentual por bairro, dado pelo quociente entre o número de perdas e de óbitos (Figura 2). Foram utilizados os softwares R 3.3.2 e QGIS 2.14.
- Distribuição do percentual de perdas segundo bairros, no georreferenciamento de dados do Sistema de Informações sobre Mortalidade no município do Rio de Janeiro, 2010-2012
O estudo foi aprovado pelos Comitês de Ética em Pesquisa do Instituto de Medicina Social da Universidade do Estado do Rio de Janeiro (UERJ) e da Secretaria Municipal de Saúde do Rio de Janeiro (Parecer no 531.635, em maio de 2014).
Resultados
Dos 26.081 endereços submetidos ao procedimento, 18.646 (71,5%) foram georreferenciados automaticamente. A correspondência entre os endereços informados e os encontrados, na amostra analisada manualmente, foi de 100%. Os restantes, 7.435, foram encaminhados para intervenção manual, pela qual foram recuperados 5.250, 70,6% dos endereços não localizados inicialmente. Ao final, 91,6% foram georreferenciados. A etapa manual dispendeu o maior tempo, devido à análise individual de cada endereço. A Tabela 1 apresenta os principais resultados.
A Figura 2 mostra a distribuição espacial do percentual de perdas por bairro. A maior proporção correspondeu à Rocinha, maior favela do país. Os bairros que tiveram perdas acima de 15% foram: Barra de Guaratiba; Paquetá; Jacarezinho; Vidigal; Alto da Boa Vista; Pitangueiras; Itanhangá; Complexo do Alemão; Galeão; Parada de Lucas; Gamboa; Manguinhos; Mangueira; Maré; Jacaré; Tauá; Caju; Jacarepaguá; Acari; Inhaúma; Vargem Pequena; Saúde; Santa Cruz; Barros Filho; Curicica; Sepetiba; e Costa Barros.
Discussão
O georreferenciamento de dados do SIM no Rio de Janeiro, utilizando a API do Google, teve alta proporção de acertos, apesar das dificuldades relacionadas à qualidade dos dados e às condições da infraestrutura urbana, marcada por inúmeras ocupações irregulares. A etapa manual foi importante por aproveitar 70% dos dados não georreferenciados automaticamente, reduzindo as perdas a 8,4%. As perdas foram maiores em bairros menos urbanizados, com assentamentos recentes e/ou ocupações irregulares, e de menor nível socioeconômico.
Foram identificados erros de inúmeras naturezas, possivelmente devidos ao informante, ao responsável pelo registro ou digitação do banco, e à base do Google. Houve erros ortográficos, no tipo e/ou título do logradouro, grafias diferentes, nomes diferentes com alguma semelhança fonética, ou mesmo o fato de e logradouro ser reconhecido por um nome diferente do cadastro oficial. A confusão entre bairros foi frequente, especialmente quando vizinhos. Outro problema recorrente foi a falta de preenchimento dos campos de endereço, principalmente do número. Endereços pouco informativos (Rua Um, Rua Projetada etc.), frequentemente, eram perdidos por haver mais de um logradouro com o mesmo nome no bairro. Em alguns desses casos, o CEP, quando presente, facilitava a localização.
Programas de SIG e serviços comerciais, geralmente, são capazes de georreferenciar de 70 a 80% de endereços.1111. Sonderman JS, Mumma MT, Cohen SS, Cope EL, Blot WJ, Signorello LB. A multi-stage approach to maximizing geocoding success in a large population-based cohort study through automated and interactive processes. Geospat Health. 2012 May;6(2):273-84. Em 2003, experiências em munícipios brasileiros como Belo Horizonte e Goiânia, onde há SIG estruturados para georreferenciar endereços dos SIS, apresentaram desempenho acima de 90%; em Porto Alegre e no Rio de Janeiro, utilizando-se de técnicas de interpolação em logradouros, esse desempenho variou entre 60 e 90%.22. Barcellos C, Ramalho WM, Gracie R, Magalhães MAFM, Fontes MP, Skaba DA. Georreferenciamento de dados de saúde na escala submunicipal: algumas experiências no Brasil. Epidemiol Serv Saúde. 2008 mar;17(1):59-70. Em um trabalho de georreferenciamento por interpolação em logradouros, sobre agravos notificados pelo Sinan em Campinas, Macapá e Rio de Janeiro, datado de 2004, os acertos automáticos foram, respectivamente, de 49, 72 e 48%, e a busca manual acrescentou 34, 20 e 17% dos totais de endereços.1212. Skaba DA, Carvalho MS, Barcellos C, Martins PC, Terron SL. Geoprocessamento dos dados da saúde: o tratamento dos endereços. Cad Saúde Pública. 2004 nov-dez; 20(6):1753-6. Outro trabalho, realizado no Rio de Janeiro em 2014, envolvendo dados de tuberculose do Sinan, comparou técnicas baseadas na API do Google e na interpolação com programa comercial: a primeira apresentou melhor desempenho, atingindo 69% - contra 64% de acertos do programa comercial.1313. Magalhães MAFM, Matos VP, Medronho RA. Avaliação do dado sobre endereço no Sistema de Informação de Agravos de Notificação utilizando georreferenciamento em nível local de casos de tuberculose por dois métodos no município do Rio de Janeiro. Cad Saúde Coletiva. 2014 abr-jun;22(2):192-9.
Conforme ressaltado por Magalhães et al.,1313. Magalhães MAFM, Matos VP, Medronho RA. Avaliação do dado sobre endereço no Sistema de Informação de Agravos de Notificação utilizando georreferenciamento em nível local de casos de tuberculose por dois métodos no município do Rio de Janeiro. Cad Saúde Coletiva. 2014 abr-jun;22(2):192-9. diante da realidade cartográfica do país, em algumas localidades a utilização da API do Google pode ser a única opção para o georreferenciamento. Além disso, a base do Google Maps pode estar mais atualizada que muitas bases cartográficas oficiais de municípios, embora não atenda a todos com igual precisão.
O georreferenciamento pode conter erros, em função do mapeamento ou da acurácia do Google. Erros no mapeamento tendem a ser pouco frequentes entre os dados georreferenciados automaticamente, visto que são locais com melhor endereçamento. A acurácia, por sua vez, diz respeito à proximidade da coordenada obtida - por meio do Google - do valor real. Esses erros têm sido cada vez menores, devido aos esforços do Google no mapeamento de cidades e à crescente utilização das API para inúmeras finalidades de geolocalização.
A ferramenta é útil em atividades de vigilância epidemiológica e gestão de serviços com base no território e na pesquisa epidemiológica sobre determinantes ambientais, entre outras aplicações. Seu desempenho depende da qualidade dos dados e do endereçamento municipal: quanto maior o detalhamento do endereço, menores serão as perdas. Apesar de o georreferenciamento de dados ser acessível e de baixo custo, sua incorporação em serviços de saúde demanda pessoal com habilidades em informática e disponibilidade para a busca manual.
Referências
- 1Ministério da Saúde (BR). Biblioteca Virtual em Saúde. Vigilância em Saúde. Sistemas de Informação: informações estratégicas [Internet]. 2008 [citado 2016 jun 15]. Disponível em: Disponível em: http://bvsms.saude.gov.br/bvs/svs/inf_sist_informacao.php
» http://bvsms.saude.gov.br/bvs/svs/inf_sist_informacao.php - 2Barcellos C, Ramalho WM, Gracie R, Magalhães MAFM, Fontes MP, Skaba DA. Georreferenciamento de dados de saúde na escala submunicipal: algumas experiências no Brasil. Epidemiol Serv Saúde. 2008 mar;17(1):59-70.
- 3Kirby RS, Delmelle E, Eberth JM. Advances in spatial epidemiology and geographic information systems. Ann Epidemiol [Internet]. 2017 Jan[cited 2017 Jan 10];27(1):1-9. Available from: Available from: http://www.annalsofepidemiology.org/article/S1047-2797(16)30495-1/fulltext
» http://www.annalsofepidemiology.org/article/S1047-2797(16)30495-1/fulltext - 4Goldberg DW. A geocoding best practices guide [Internet]. Springfield: North American Association of Central Cancer Registries; 2008 [cited 2017 Ago 28]. 287 p. Available from: Available from: https://20tqtx36s1la18rvn82wcmpn-wpengine.netdna-ssl.com/wp-content/uploads/2016/11/Geocoding_Best_Practices.pdf
» https://20tqtx36s1la18rvn82wcmpn-wpengine.netdna-ssl.com/wp-content/uploads/2016/11/Geocoding_Best_Practices.pdf - 5Goldberg DW, Wilson JP, Knoblock CA. From text to geographic coordinates: the current state of geocoding. J Urban Reg Inf Syst Assoc. 2007 Jan;19(1):33-46.
- 6Rushton G, Armstrong MP, Gittler J, Greene BR, Pavlik CE, West MM, et al. Geocoding in cancer research: a review. Am J Prev Med. 2006 Fev;30(2 Suppl):16-24.
- 7Instituto Brasileiro de Geografia e Estatística. Cidades@ [Internet]. 2014 [citado 2017 mar 20]. Disponível em: Disponível em: http://cidades.ibge.gov.br/xtras/home.php?lang=
» http://cidades.ibge.gov.br/xtras/home.php?lang= - 8Ministério da Saúde (BR). Departamento de Atenção Básica. Nota técnica: sistema de nota técnica do DAB [Internet]. 2017 [citado 2017 mar 20]. Disponível em: Disponível em: http://dab2.saude.gov.br/sistemas/notatecnica/frmListaMunic.php
» http://dab2.saude.gov.br/sistemas/notatecnica/frmListaMunic.php - 9R Core Team. R: a language and environment for statistical computing [Internet]. Viena: R Foundation for Statistical Computing; 2017 [cited 2017 Mar 20]. Available from: Available from: https://www.r-project.org/
» https://www.r-project.org/ - 10Google. Google maps geocoding API [Internet]. 2016 [citado 2017 mar 24]. Disponível em: https://developers.google.com/maps/documentation/geocoding/
» https://developers.google.com/maps/documentation/geocoding/ - 11Sonderman JS, Mumma MT, Cohen SS, Cope EL, Blot WJ, Signorello LB. A multi-stage approach to maximizing geocoding success in a large population-based cohort study through automated and interactive processes. Geospat Health. 2012 May;6(2):273-84.
- 12Skaba DA, Carvalho MS, Barcellos C, Martins PC, Terron SL. Geoprocessamento dos dados da saúde: o tratamento dos endereços. Cad Saúde Pública. 2004 nov-dez; 20(6):1753-6.
- 13Magalhães MAFM, Matos VP, Medronho RA. Avaliação do dado sobre endereço no Sistema de Informação de Agravos de Notificação utilizando georreferenciamento em nível local de casos de tuberculose por dois métodos no município do Rio de Janeiro. Cad Saúde Coletiva. 2014 abr-jun;22(2):192-9.
- *Manuscrito originado da dissertação de Mestrado de Ismael Henrique da Silveira, intitulada ‘Espaços verdes e mortalidade por doenças cardiovasculares no município do Rio de Janeiro’, defendida junto ao programa de Pós-Graduação do Departamento de Epidemiologia do Instituto de Medicina Social da Universidade do Estado do Rio de Janeiro em 2015.
Datas de Publicação
- Publicação nesta coleção
Oct-Dec 2017
Histórico
- Recebido
14 Mar 2017 - Aceito
25 Jul 2017