Uma aplicação do sensoriamento remoto para a investigação de endemias urbanas

Correia, Virginia Ragoni de Moraes; Monteiro, Antônio Miguel Vieira; Carvalho, Marilia Sá; Werneck, Guilherme Loureiro

ARTIGO ARTICLE

Uma aplicação do sensoriamento remoto para a investigação de endemias urbanas

A remote sensing application to investigate urban endemics

Virginia Ragoni de Moraes Correia^{I, II}; Antônio Miguel Vieira Monteiro^I; Marilia Sá Carvalho^II; Guilherme Loureiro Werneck^{III, IV}

^IDivisão de Processamento de Imagens, Instituto Nacional de Pesquisas Espaciais, São José dos Campos, Brasil
^IIEscola Nacional de Saúde Pública, Fundação Oswaldo Cruz, Rio de Janeiro, Brasil
^IIIInstituto de Medicina Social, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, Brasil
^IVNúcleo de Estudos de Saúde Coletiva, Universidade Federal do Rio de Janeiro, Rio de Janeiro, Brasil

Correspondência

RESUMO

Este artigo apresenta um estudo de caso aspectos ambientais relacionados à ocorrência da leishmaniose visceral em Teresina, Piauí, Brasil, no período de 1993 a 1996 visando a discutir o uso de um conjunto de métodos aplicados a imagens de sensoriamento remoto em média resolução no estudo de endemias transmitidas por vetores em áreas urbanas. Foram apresentadas as técnicas essenciais a esse tipo de procedimentos: registro, correção geométrica, restauração, fusão, segmentação e classificação. Quatro classificadores, Maxver, Bhattacharya, K-médias e Isoseg, foram comparados utilizando o índice de correlação intraclasse aplicado à proporção de área segundo cada classe nos setores censitários. Os métodos de avaliação utilizados não tiveram o propósito de definir o melhor classificador, mas desenhar cenários de classificação, de forma a reconhecer as classes melhor identificáveis em área urbana. Mesmo dispondo-se de recursos limi-tados, imagens de baixo custo, ampla disponibilidade e média resolução, sistemas livres para processamento e integração das informações, é possível identificar as características de ocupação do solo de interesse potencial na análise de riscos ambientais para a ocorrência de endemias urbanas transmitidas por vetores.

Sensores Remotos; Leishmaniose Visceral; Doenças Endêmicas

ABSTRACT

This paper presents a case study on environmental aspects related to the occurrence of visceral leishmaniasis in Teresina, Piauí, Brazil, from 1993 to 1996, in order to discuss the use of some appropriate geo-processing methods for median-resolution remote sensing images potentially useful for studying vector-borne transmissible diseases in urban areas. We present the main techniques: registration, geometric correction, restoration, fusion, segmentation, and classification. Using intra-class correlation indices applied to the proportion of area by class in the census tract, we compare four classifiers: Maxver, Bhattacharya, K-means, and Isoseg. This comparison was not devised to choose the best classifier, but to depict different classification scenarios aimed at recognizing the best identifiable image classes in urban settings. We conclude that even with limited resources, using low-cost and easily available median resolution images and free software to process and integrate information, it is possible to identify land use characteristics, potentially appropriate for analyzing urban areas exposed to environmental risk for vector-borne diseases.

Remote Sensors; Visceral Leishmaniasis; Endemic Diseases

Introdução

A ocorrência de doenças endêmicas transmitidas por vetores caracteriza-se por padrões espaço-temporais distintos. Aspectos do meio físico-biótico, que chamamos aqui de ambientais regime de chuvas, temperatura, vegetação, coleções hídricas, relevo e geomorfologia, por exemplo estão associados à proliferação das populações de reservatórios, vetores e agentes infecciosos ¹. Em estudos ecológicos é importante revelar os relacionamentos dos padrões de ocorrência de doenças com estas variáveis de caracterização ambiental. A presença ou ausência de cobertura vegetal vem sendo a característica mais freqüentemente utilizada nos estudos que buscam relacionar ambiente e doenças endêmicas, por seu papel na manutenção do ciclo biológico de vetores e agentes infecciosos, uma vez que esta variável é de resposta relativamente rápida, quando da alteração de outras variáveis ambientais como a precipitação, temperatura e umidade ². A relação entre características descritoras da paisagem ambiental e ocorrências de doenças endêmicas é mediada pela estrutura demográfica da população e pelo perfil sócio-econômico local, atuando sobre a suscetibilidade e as possibilidades de contato com vetores e reservatórios ^3,4. O uso de sensoriamento remoto por imageadores orbitais se apresenta como uma possibilidade metodológica, que permite a caracterização das variáveis ambientais de interesse em estudos de endemias.

As técnicas de classificação automática e semi-automática de imagens de sensoriamento remoto permitem ampliar e acelerar o processo de aquisição de informações ambientais relevantes no contexto dos estudos enfocando a interação ambiente-doença. Com o uso dos recursos de Sistemas de Informações Geográficas (SIG), como ambiente computacional para integração dessas variáveis com outras relativas à ocorrência da doença, como os dados de caracterização do perfil sócio-econômico-demográfico, é possível montar um painel sócio-territorial ampliado, que potencializa e amplia o olhar do epidemiologista sobre potenciais focos e áreas de risco.

O interesse recente da saúde pública nas possibilidades de uso do sensoriamento remoto para o estudo de endemias tem se concentrado nas áreas rurais ¹. Entretanto, devido ao processo de urbanização de diversas endemias, como a leishmaniose cutânea e visceral, é oportuno explorar o uso potencial dessas imagens em áreas urbanas e peri-urbanas. A questão urbana é mais complexa e requer o uso de resoluções mais finas e algoritmos de classificação mais especializados. Entretanto, mesmo em médias resoluções, usando recursos de processamento de imagens, é possível detectar cenários de risco pela textura observada como, por exemplo, áreas de ocupação urbana mais ou menos organizada, regiões muito densas ou com maior cobertura de vegetação, aglomerados populacionais próximos a coleções de água ou a terras recém-desmatadas. Essas características formam mosaicos que podem traduzir a dinâmica da interação entre hospedeiros, vetores e agentes infecciosos ¹.

A seguir apresentamos uma breve revisão dos métodos de pré-processamento das imagens de sensoriamento remoto de média resolução, necessários para os procedimentos de classificação aqui utilizados, e para sua integração, em SIG, com outras fontes de informação em áreas urbanas. Os principais procedimentos adotados são apresentados, de forma simplificada, de modo a permitir ao especialista na área de saúde uma visão geral de como utilizar o dado de sensoriamento remoto em seus estudos. Esse item inclui um fluxograma descrevendo os dados de entrada e as operações necessárias para extração da informação relevante no contexto do estudo. Um método para analisar a concordância dos mapas temáticos gerados a partir dos classificadores de imagem por região (Bhattacharya e Isoseg) e por pixel (Maxver e K-médias) é apresentado, e seus resultados analisados e discutidos observando o contexto do estudo de caso em Teresina, Piauí. Esperamos, a partir de uma aplicação relevante, discutir a aplicabilidade de um conjunto de técnicas ligadas ao sensoriamento remoto em média resolução no estudo de endemias transmitidas por vetores em áreas urbanas.

A aplicação do sensoriamento remoto em áreas urbanas

O resultado dos procedimentos de classificação é um mapa temático, onde cada classe é definida pelo usuário no contexto de sua aplicação; neste estudo visando a indicar situações que potencializem a transmissão de leishmaniose visceral. A indicação parte do conhecimento prévio, de especialistas, que identifica as classes conforme a probabilidade de contato entre população humana, vetores e reservatórios.

Em área urbana, o uso de imagens de sensoriamento remoto de média resolução e de classificadores é um desafio. As dificuldades são proporcionais ao nível de detalhe que se deseja observar, ou seja, as classes temáticas desejadas para o estudo, e às limitações impostas pelas resoluções espaciais e espectrais dos sensores. Existe um grande empenho no desenvolvimento de algoritmos que possam ser mais adequados à complexidade existente ⁵. Encontra-se na literatura o uso de metodologias híbridas, em que dois ou mais classificadores são utilizados; classificadores por regra de decisão, em que padrões diferentes podem ser separáveis com base em uma ou mais características ⁶; os que incorporam características adicionais como textura ⁷; os que utilizam algoritmos fuzzy ⁸. No entanto, para os objetivos deste artigo nos concentraremos em métodos de classificação semi-automática de imagens de sensoriamento remoto, consolidados e há muito utilizados em estudos nas áreas ligadas às Ciências Ambientais e às Ciências da Terra em geral.

Classificadores de imagens de sensoriamento remoto podem ser vistos a partir de dois enfoques ⁸. O primeiro observa cada pixel isoladamente, realizando uma classificação por pixel, ou, alternativamente, utilizando o conceito de região, conjuntos de pixels definidos por uma propriedade de similaridade. O segundo enfoque refere-se ao fato de os classificadores serem supervisionados, exigindo uma fase de treinamento anterior à classificação, ou não-supervisionados, baseado unicamente nos dados (os pixels que formam a imagem). Os classificadores supervisionados passam por um processo de treinamento em que o usuário faz uso de informações que permitem a identificação de suas classes de interesse. Os não-supervisionados utilizam algoritmos de agrupamentos. Embora automáticos, com pouca participação do investigador, nesta fase, os métodos não-supervisionados precisam passar pelo processo conhecido como rotulação. É na rotulação que o especialista então decide que a cada pixel ou região classificada, uma determinada classe temática, do domínio do problema, será atribuída.

Na área da saúde, a dimensão em estudo casos de doença é estimada por meio de contagens de casos por área, freqüentemente o setor censitário, considerada uma unidade de análise de tamanho adequado ⁹, abrangendo população em torno de 800 pessoas ¹⁰. Na imagem de sensoriamento remoto não vemos setores censitários, o que vemos é a cidade como um contínuo com os elementos que a constitui: casas, ruas, praças, parques etc. Uma etapa importante é sobrepor, em um mesmo ambiente computacional, os dados relativos aos setores e a imagem. Isso é feito em um SIG. Para fazê-lo, alguns procedimentos são necessários, uma vez que em médias resoluções alguns detalhes podem não estar visíveis, o que dificulta a sobreposição. Para fazer um bom ajuste dos setores na imagem, os procedimentos de restauração e fusão, que serão comentados adiante, são utilizados, fazendo com que a imagem de 30m possa ser observada com 10m e com 5m, com alguma degradação, mas realçando características importantes como traçado de ruas, permitindo um melhor ajuste dos setores sobre a imagem. Após esse ajuste, utilizando os setores sobrepostos à imagem, observa-se uma heterogeneidade na composição dos setores. Alguns são grandes e pouco urbanizados, outros pequenos e muito densos; outros setores apresentam uma ocupação claramente desorganizada, outros possuem uma ocupação planejada, e outros ainda apresentam composição dessas formas de ocupação, acrescidas de pouca cobertura vegetal e poucos parques; e por fim, vemos setores com uma ocupação organizada e arborização. Esses padrões de ocupação podem estar associados à ocorrência de endemias. Para testar essas hipóteses e quais dessas variáveis de fato participam do processo de estabelecimento e manutenção da endemia, é necessário aferir essas variáveis. Este artigo mostra como essas variáveis podem ser obtidas, extraindo da imagem, por meio do processo de classificação, a variedade de classes temáticas representativas de padrões de uso e cobertura do solo urbano, e distribuindo essas classes em cada um dos setores censitários.

As classificações semi-automáticas com base nas imagens de sensoriamento remoto estão sujeitas a erros. Estes são devido à interpretação feita pelo especialista; às características de resposta espectral semelhante para diferentes elementos da paisagem urbana; à resolução espacial do sensor; à falta de dados coletados em campo para uma verificação mais apurada dos resultados gerados pelos classificadores, entre outros. É desejável que esses erros de classificação sejam quantificados. Para isso é necessário comparar cada classificação com uma de referência, muitas vezes baseada em inspeção local, o que nem sempre é possível. Neste trabalho, não fazemos uma avaliação do resultado da classificação com referência a dados de inspeção local. É feita uma comparação entre os mapas temáticos gerados pelos classificadores, a partir de uma medida de correlação intraclasse, e da avaliação dos cenários gerados com o uso de um conjunto de fotos aéreas da região (analógicas).

Etapas envolvidas no processamento das imagens

O registro de imagem refere-se ao ajuste dos sistemas de coordenadas de duas imagens de uma mesma área, utilizando-se um dos sistemas como referência. Para integrar imagens de diferentes períodos ou diferentes sensores essa operação é necessária. Define-se correção geométrica como a transformação de uma imagem de sensoriamento remoto à escala e projeção de um mapa de referência ¹¹. Para que as imagens possam ser integradas aos SIG essas operações são necessárias ⁶.

Os registros podem ser manuais ou automáticos. Para o registro manual é necessário identificar pontos de controle no terreno usando sistemas de posicionamento global (global positioning system GPS) ⁶. O registro automático utiliza algoritmos para detecção de pontos de controle baseados na correlação entre as duas imagens com mínima interferência do usuário ¹².

As técnicas de restauração visam a modelar o processo de degradação radiométrica a fim de obter imagens com menos ruído e maior nível de detalhes. Para essa operação são utilizados filtros lineares cujos pesos são obtidos a partir das características do sensor e banda espectral ¹³.

A operação de fusão tem por objetivo principal integrar informação de diferentes sensores, a fim de se obter uma imagem com melhor resolução espacial e espectral. A fusão é muito utilizada quando o sensor é rico em características espectrais, e possui uma banda pancromática com resolução melhor, como os sensores do Landsat ETM-7, o SPOT e o Ikonos. Dentre algumas técnicas de fusão, a mais comum é a que utiliza uma transformação no espaço de cores conhecida por IHS ^6,14.

A segmentação é uma operação que divide a imagem em regiões compostas por conjuntos de pixels que apresentam propriedades semelhantes como: valor de sua resposta espectral próximo, textura etc. ¹⁵.

A classificação supervisionada é aquela que necessita de um treinamento no qual o usuário determina, por meio de amostras, características do objeto que se quer mapear. Esses objetos ou classes devem ser definidos a priori e sua identificação é limitada pelas características espaciais, espectrais do sensor utilizado. Pode-se usar como área de treinamento uma região delimitada pelo usuário ou algumas regiões da imagem segmentada, já que estas anteriormente determinaram regiões homogêneas, segundo o critério de semelhança utilizado. Dessas amostras de treinamento calculam-se parâmetros para cada classe.

O classificador supervisionado por máxima verossimilhança, Maxver, é o mais utilizado em sensoriamento remoto ⁶. É uma classificação pontual, baseada no valor radiométrico do pixel e nos parâmetros da distribuição Gaussiana de cada uma das classes de treinamento. O mapa obtido por esse classificador, em geral, tem uma aparência ruidosa, visto que o contexto espacial não é considerado.

A classificação Bhattacharya, por outro lado, utiliza amostras de alguns segmentos para treinar o classificador, calculando a média e matriz de covariância de cada classe. Em seguida, cada segmento é alocado a uma dessas classes segundo a menor distância de Bhattacharya ¹⁶.

Na classificação não-supervisionada as classes não são definidas a priori e, portanto, uma operação de rotulação pós-classificação se faz necessária. O classificador não-supervisionado denominado Isoseg ¹⁵, baseia-se no agrupamento de regiões similares caracterizadas pela média e pela matriz de covariância. O número de classes é dependente do limiar de aceitação determinado pelo usuário. Esse limiar define uma distância máxima de Mahalanobis. Regiões cujas médias estiverem dentro do hiperelipsóide, definido pelo limiar de aceitação, pertencem a uma certa classe. O K-médias é um classificador não supervisionado que utiliza uma abordagem de agrupamento. O espaço de atributos da imagem é partido em K grupos. A partir dessa situação inicial, cada pixel da imagem é alocado ao centro mais próximo segundo a distância euclidiana ⁶.

Uma matriz de erro é uma forma de representar a precisão de um mapa temático. As colunas da matriz representam o dado de referência e as linhas o resultado da classificação. Os valores na diagonal dessa matriz, geralmente contendo número de pixels, representam a concordância entre o classificador e a referência. A precisão individual de cada categoria pode ser analisada via erros de inclusão, ou seja, incluir uma área numa categoria que ela não pertence, e através de erros exclusão, qual seja, excluir uma área de uma categoria a qual ela pertença. Além desses erros é possível calcular também medidas como acurácia total, acurácia do produtor e acurácia do usuário ¹⁷.

Uma medida de concordância comumente utilizada é a estatística kappa ¹⁸. Essa medida, utilizada para dados categóricos, é definida como a proporção de concordância observada não decorrente do acaso, em relação à máxima concordância não devida ao acaso ¹⁹. Valores possíveis para kappa variam de -1 a +1. Espera-se uma correlação positiva entre o dado de referência e o da classificação e um valor maior que a concordância ao acaso, representada pelo valor 0.

Para dados contínuos, uma medida de concordância é o ICC (coeficiente de correlação intraclasse). O ICC estima a proporção da variabilidade total devida à variação entre os classificadores e também varia de -1 a +1. Landis & Koch ²⁰ propõem a seguinte classificação para interpretação dos resultados de análises baseadas nas estatísticas kappa e/ou ICC: quase perfeita (> 80%), substancial (entre 60% e 80%), moderada (entre 40% e 60%), fraca (entre 20% e 40%), quase nenhuma (< 20%) ²¹.

Material e método

Área de estudo

Teresina, capital do Estado do Piauí, localiza-se na confluência dos rios Parnaíba e Poti, centralizada a 5°5' de Latitude Sul e na Longitude Oeste de 42°48'. A região de estudo abrange a área urbana da cidade e a correspondente malha de setores censitários do ano de 1991. A cidade tem um clima tropical com temperatura média anual de 27°C e precipitação pluviométrica média anual de 1.300mm. A vegetação predominante consiste de árvores esparsas e arbustos, existindo nas periferias da cidade regiões de pastagem e floresta tropical. O uso do solo na região é predominantemente urbano residencial, comercial e industrial. Na cidade de Teresina, uma das capitais mais pobres do Brasil, a leishmaniose visceral é um problema de saúde pública. Em 1980 houve a primeira epidemia urbana, com número de casos crescente até 1985, declinando nos anos seguintes até início de uma nova epidemia na década de 90, quando registrou-se um número de casos, novos, maior que 1.200.

Imagens de sensoriamento remoto utilizadas

Para o estudo utilizou-se uma imagem Landsat-TM5, passagem em 17 de agosto de 1990, e uma Landsat-ETM7 de 6 de julho de 2001, órbita 219, ponto 64, projeção UTM. A imagem de 1990 foi escolhida por ter uma data próxima a do censo demográfico. A de 2001, por conter uma banda pancromática com 15m de resolução, foi utilizada para possibilitar o registro dos setores censitários à imagem em ambiente SIG.

Foram utilizadas as bandas 3 (vermelho), 4 (infravermelho próximo) e 5 (infravermelho médio), em acordo com a literatura para estudos urbanos, por serem as bandas, no Landsat, que permitem acomodar melhor as respostas espectrais em alvos urbanos, nesta resolução ²². O período escolhido foi o de seca, pela facilidade de se obter imagens sem cobertura de nuvens.

Utilizou-se o programa SPRING versão 4.1 (Sistema de Processamento de Informações Georeferenciadas; http://www.dpi.inpe.br/spring) ²³.

Processamento e análise

A Figura 1 ilustra as principais etapas da metodologia utilizada. A imagem foi segmentada para aplicações dos classificadores Bhattacharya e Isoseg. Para o treinamento da classificação supervisionada e a rotulação da classificação não-supervisionada, utilizou-se um conjunto de amostras com fotos aéreas e informações de especialista que desenvolve trabalho de campo na região.

A imagem de 1990 foi utilizada para a classificação visando a posterior análise de casos da doença entre 1993 e 1996. A de 2001, única ETM-7, com a banda pancromática de 15m, passou pela operação de restauração e fusão com a finalidade de se obter uma imagem colorida com 5m de resolução, para o registro do setor censitário à imagem. Sendo a imagem de 2001 e os setores de 1991, cruzamentos de ruas foram utilizados como referência para os ajustes. A sobreposição dos setores censitários de 1991 à imagem, permitiu o cálculo da proporção de cada classe temática definida em cada setor.

Diversas segmentações, com variação dos parâmetros de similaridade e de área, foram apresentadas ao especialista para seleção dos padrões de interesse, que escolheu a combinação similaridade = 12 e área = 50 para as classificações Isoseg e Bhattacharya. Na Figura 2, para ilustrar os diferentes resultados que podem ser obtidos nessa operação, é apresentado o resultado das segmentações com duas combinações de similaridade e área.

No treinamento dos classificadores supervisionados e rotulação dos não-supervisionados foram utilizadas as amostras ilustradas na Figura 3, e descritas na Tabela 1. As classes foram escolhidas de forma a priorizar certos padrões espaciais importantes para a ocorrência da endemia, definidas pelo especialista, independente de conhecimento prévio dos algoritmos.

Para o treinamento do classificador Bhattacharya as amostras foram superpostas aos segmentos. Na etapa de rotulação, referente aos classificadores K-médias e Isoseg, utilizou-se o conjunto de amostras. Para o método Maxver, algumas amostras foram utilizadas para adquirir os parâmetros estatísticos para cada classe, e outras separadas para serem usadas como amostras-teste, possibilitando uma avaliação prévia da classificação por meio do índice kappa.

Um programa utilizando a linguagem LEGAL ²⁴ foi desenvolvido para calcular a proporção de cada classe nos setores censitários, para cada um dos classificadores. Os classificadores foram comparados pelo coeficiente de correlação intraclasse.

Resultados

O classificador Maxver foi avaliado utilizando-se as amostras teste, obtendo-se acurácia total de 71,68% (Tabela 2). Para as classes água, solo exposto e vegetação densa, a acurácia em relação ao padrão de referência (amostras de treinamento) é alta e para as diversas classes residenciais a acurácia foi apenas moderada. Os resultados obtidos para as classes residenciais com muita vegetação, com vegetação moderada e esparsa muito verde foram ligeiramente superiores a 40%. Houve confusão na classificação das amostras das duas primeiras classes mencionadas, e entre a residencial esparsa muito verde com a vegetação densa e a agricultura. Esse desempenho, no caso do classificador Maxver, pode ser explicado pelas dificuldades em estabelecer essas classes temáticas nessa resolução espacial, considerando a limitação para discriminar alvos com uma mistura de vários elementos em diferentes proporções, que causam impacto na resposta espectral e, portanto, na caracterização desses temas. Além disso, o classificador Maxver supõe uma distribuição Gaussiana para as classes e, algumas amostras obtidas apontavam para uma distribuição bimodal. O valor de kappa foi de 67,62%, ou seja, uma concordância moderada. O resultado visual do classificador Maxver é apresentado na Figura 4a.

O classificador Bhattacharya se aplica sobre o resultado do processo de segmentação ¹⁶, ou seja, classifica-se um conjunto de pixels, gerando áreas mais contínuas, de no mínimo 50 pixels (Figura 4b).

O classificador Isoseg apresentou resultado semelhante ao Bhattacharya, gerando 19 classes. Para o processo de rotulação buscou-se interseções entre as classes encontradas e as amostras. Esse processo é lento e demanda uma boa experiência e familiaridade com a interpretação de imagens de sensoriamento remoto. As áreas brancas no mapa (Figura 4c) mostram as áreas onde a rotulação não foi possível.

Para o algoritmo K-médias, também não-supervisionado, só foi possível rotular seis classes (Figura 4d). Foram geradas 11 classes a partir das definições do especialista, embora, dado o tamanho da área, o número esperado de classes seja menor ²⁵. No processo de rotulação as dificuldades foram semelhantes às do Isoseg.

A Tabela 3 mostra o ICC entre classificadores por classe e o ICC médio para cada combinação de classificadores. O K-médias não foi considerado nessa avaliação dada a diferença no número de classes. No cálculo do ICC médio não foram incluídas as classes "residencial com vegetação moderada" e "residencial esparsa muito verde" por não terem sido detectadas pelo classificador Isoseg. O ICC médio foi moderado para praticamente todas as combinações de classificadores. As classes "água" e "vegetação densa" apresentaram um valor de ICC quase perfeito para algumas combinações, confirmando que são bem detectadas por todos os classificadores. As classes "área descoberta", "industrial ou comercial" e "residencial de alta densidade" tiveram um ICC acima de 60%. As áreas descobertas eram poucas, mas foram detectadas similarmente pelos classificadores. As classes "industrial ou comercial" e "residencial de alta densidade" ocuparam uma área razoável, a primeira mais concentrada na parte central do mapa e a segunda espalhada, mas com três agrupamentos com uma concordância muito boa. "Solo exposto" apresentou ICC muito baixo em geral, e somente em dois grandes setores ao norte foram detectadas. A classe "banco de areia" quase não ocorre na imagem e o valor do ICC foi substancial apenas para a combinação Maxver e Bhattacharya, classificadores supervisionados. O classificador Isoseg detectou presença de "banco de areia" em setores para os quais essa classe estava ausente nos outros classificadores. O ICC das áreas "residencial com vegetação moderada", "residencial com muita vegetação" e "residencial esparsa muito verde" reflete a dificuldade dos classificadores em separar essas classes. Entre os classificadores Isoseg e Bhattacharya o ICC foi substancial na classe "residencial com muita vegetação". Os valores baixos para as outras combinações podem ser atribuídos ao baixo desempenho do Maxver na detecção dessa classe. As classes "residencial esparsa muito verde" e a "residencial com vegetação moderada" apresentaram um ICC moderado para a combinação Maxver e Bhattacharya. Como o Isoseg não detectou essas duas classes, o ICC é nulo. Quanto à área de agricultura, o resultado da classificação para o Isoseg e o Maxver foi muito semelhante nos setores censitários ao sul, refletindo um valor de ICC quase perfeito. O resultado do Bhattacharya não foi tão bom: classificou como área "residencial esparsa muito verde" uma área classificada como "agricultura" pelos outros classificadores.

Dentre os classificadores avaliados, os mais apropriados seriam os supervisionados: Bhattacharya, com uma segmentação utilizando os limiares 12-50 e o Maxver, que demonstrou um bom desempenho para este caso, mesmo sendo um classificar pontual. O K-médias apresentou o pior desempenho neste contexto e o Isoseg teria tido um bom desempenho sem as restrições da rotulação.

Discussão

Comparar métodos de processamento de imagem visando ao estudo de endemias urbanas é de grande interesse, pois embora teoricamente discutidos ¹, poucos são os trabalhos empíricos sobre o assunto. A utilização do ICC para verificar a concordância por tema, usando o setor censitário como unidade de análise, é uma contribuição importante deste trabalho para avaliação de métodos de classificação. Neste estudo foi utilizada, também, uma nova técnica de registro automático de imagens, mais rápida e tão ou mais eficiente que a manual, com a vantagem de minimizar o viés introduzido pelo operador. Para sobrepor a malha do setor censitário à imagem, dispusemos, além do registro vetorial, de ferramentas de restauração e fusão de imagens, sendo possível localizar ruas e cruzamentos, facilitando a aquisição de pontos de controle para o registro ¹².

O resultado global do desempenho dos classificadores mostra grande potencial, mesmo sem a etapa de trabalho de campo. Apesar disso, confirmou-se também as restrições quanto ao uso de classificadores baseados nas informações espectrais de sensores de média resolução em áreas urbanas, mostrando a dificuldade em discriminar padrões importantes para a leihsmaniose, tais como os diversos tipos de solo: urbano, não urbano, com pouca vegetação, áreas agrícolas de áreas rurais com muita vegetação e habitações esparsas ²⁶.

Os métodos de avaliação utilizados não tiveram o propósito de escolher o melhor classificador. Na realidade eles representam meios para observar cenários de classificação produzidos sem muita informação de coleta e inspeção de campo. As análises permitem emitir um parecer sobre as classes quesão mais confiáveis, com valor alto de ICC, assim como as não confiáveis, indicando a necessidade de trabalho e verificação em campo e de melhor amostragem, por exemplo. Essa análise pode sugerir pesos diferentes para as diversas classes temáticas com base na confiança estabelecida a partir das análises do ICC.

Uma forma de melhorar o desempenho dos classificadores é aumentar o número de amostras de qualidade das classes em que a resolução espacial limita a capacidade de discriminar adequadamente. Entretanto, aplicações de sensoriamento remoto em saúde, em países em desenvolvimento, dependem da disponibilidade de tecnologias abertas, amplamente disponíveis, de baixo impacto para inserção nos serviços e, com mínimo trabalho de campo para aquisição das variáveis. A precisão, no sentido da exatidão cartográfica do mapeamento, não é o aspecto mais importante, mas sim a preservação das relações entre as localizações obtidas com os outros dados espacializados que fazem parte da análise. Além disso, deve-se ressaltar o acompanhamento do especialista na definição das classes temáticas de interesse, quer seja no caso dos métodos supervisionados, durante o treinamento, quer seja nos métodos não-supervisionados, na fase de rotulação.

É importante frisar que neste estudo nos concentramos no uso potencial de dados de média resolução espacial, imagens entre 20 e 30 metros de resolução, que têm ampla disponibilidade a baixos custos, e têm sido pouco exploradas em estudos de endemias na escala urbana. Não faz parte do escopo deste trabalho a verificação do uso de satélites imageadores mais recentes, com alta e altíssima resolução. Além disso, diversas outras técnicas poderiam ser testadas, tais como novos classificadores, classificações contínuas, análise de mistura, ou mesmo a combinação de outras bandas espectrais além das bandas 3, 4 e 5. Entretanto, a abordagem dessas técnicas não seria possível em apenas um artigo, e fugiria ao objetivo introdutório sobre o tema, ainda pouco explorado na saúde pública.

Neste estudo verificamos que a consideração de um parâmetro global para a partição de toda a área pode trazer prejuízos ao processo classificatório. Uma sugestão seria fazer modificações nos algoritmos de segmentação para que possam reagir adaptativamente, com base nas estatísticas locais da imagem, e assim acomodar os valores encontrados em cada pixel aos pressupostos estatísticos dos métodos utilizados, alterando dinamicamente os valores dos limiares. Por exemplo, na área urbana, entre os rios, onde a variância é maior, pode-se pensar em aplicar limiares diferentes de áreas e de similaridade.

Transformações ambientais associadas a movimentos migratórios e ao processo de urbanização podem explicar, em parte, porque a leishmaniose visceral, originalmente uma doença restrita às áreas rurais, passou a ocorrer de forma endêmica e epidêmica em grandes cidades brasileiras ^27,28. Este processo desordenado de ocupação urbana resultou em condições precárias de vida e destruição ambiental, fatores que também podem ter influenciado a emergência da doença no meio urbano. Acreditamos que o uso do sensoriamento remoto possa contribuir para elucidar o papel desempenhado por esse processo socioambiental complexo que vem sendo associado à emergência da leishmaniose visceral no meio urbano, e conseqüentemente, aperfeiçoar a capacidade de predição e prevenção em saúde pública. Para que esta meta seja alcançada, entretanto, muito trabalho ainda se faz necessário, particularmente a estimação do efeito de cada classe e do próprio processo classificatório na incidência da doença e sua distribuição espaço-temporal.

Os resultados obtidos aqui demonstram que mesmo dispondo-se de recursos limitados, imagens de baixo custo, ampla disponibilidade e média resolução, sistemas abertos e livres para processamento e integração das informações, é possível a obtenção de parâmetros para compor estudos prospectivos de fatores de risco ambientais para a ocorrência de endemias urbanas.

Colaboradores

Todos os autores participaram da elaboração do texto e discussão dos resultados. V. R. M. Correia participou da construção do banco de dados e processamentos.

Referências

1. Correia VRM, Carvalho MS, Sabroza PC, Vasconcelos CH. Remote sensing as a tool to survey endemic diseases in Brazil. Cad Saúde Pública 2004; 20:891-904.

2. Hay SI, Tucker CJ, Rogers DJ, Packer MJ. Remotely sensed surrogates of meteorological data for the study of the distribution and abundance of arthropod vectors of disease. Ann Trop Med Parasitol 1996; 90:1-19.

3. Werneck GL. Spatial approaches to study the epidemiology of visceral leishmaniasis in Teresina, Brazil [PhD Thesis]. Cambridge: Harvard University; 2000.

4. Werneck GL, Rodrigues LJ, Araújo LB, Santos MV, Moura LS, Lima SS, et al. The burden of Leishmania chagasi infection during an urban outbreak of visceral leishmaniasis in Brazil. Acta Trop 2002; 83:13-8.

5. Phinn S, Stanford M, Scarth P, Murray AT, Shyy PT. Monitoring the composition of urban environments based on the vegetation-impervious surface-soil (VIS) model by subpixel analysis techniques. Int J Remote Sens 2002; 23:4131-53.

6. Mather PM. Computer processing of remotely sensed images; an introduction. 2^nd Ed. New York: John Wiley & Sons; 1999.

7. Haralick RM, Shanmuga K, Dinstein I. Textural features for image classification. IEEE Trans Syst Man Cybern 1973; 6:610-21.

8. Tso B, Mather PM. Classification methods for remotely sensed data. London: Taylor & Francis; 2001.

9. Rede Integrada de Informações para a Saúde. Comitê temático interdisciplinar: dados espaciais em saúde - relatório. Brasília: Organização Pan-Americana da Saúde/Ministério da Saúde; 1999.

10. Instituto Brasileiro de Geografia e Estatística. Censo demográfico 2000: características da população e dos domicílios (resultado do universo). Rio de Janeiro: Instituto Brasileiro de Geografia e Estatística; 2001.

11. Carvalho M, Pina M, Santos S. Conceitos básicos de sistemas de informações geográficas e cartografia aplicados à saúde. Brasília: Organização Pan-Americana da Saúde/Ministério da Saúde; 2000.

12. Federov D, Fonseca LMG, Kenney C, Manjunath BS. Automatic registration and mosaicking system for remotely sensed imagery. In: Anais do XI Simpósio Brasileiro de Sensoriamento Remoto. Belo Horizonte: Instituto Nacional de Pesquisas Espaciais; 2003. p. 317-24.

13. Boggione GA, Fonseca LMG. Restoration of Landsat-7 images. http://www.dpi.inpe.br/~leila/publications/Restoration_of_Landsat-7_Images.pdf (acessado em 02/Ago/2006).

14. Carper WJ, Lillesand TM, Kiefer RW. The use of intensity-hue-saturation transformation for merging spot phanchromatic and multiespectral image data. Photogrammetric Engineering and Remote Sensing 1990; 56:459-67.

15. Bins L, Erthal G, Fonseca LMG. Um método de classificação não supervisionado por regiões. In: Anais do VI Simpósio Brasileiro de Computação Gráfica e Processamento de Imagens. Comunicações. Recife: Sociedade Brasileira de Computação/Universidade Federal de Pernambuco; 1993. p. 65-8.

16. Bins LS, Fonseca LMG, Erthal GJ, Ii FAM. Satellite imagery segmentation: a region growing approach. In: Anais do VIII Simpósio Brasileiro de Sensoriamento Remoto [CD-ROM]. São José dos Campos: Instituto Nacional de Pesquisas Espaciais; 2003.

17. Congalton RG, Green K. Assessing the accuracy of remotely sensed data: principles and practices. New York: Lewis Publishers; 1999.

18. Cohen J. Coefficient of agreement for nominal scale. Educ Psychol Meas 1960; 20:37-46.

19. Fleiss JL. Statistical methods for rates and proportions. New York: John Wiley & Sons; 1981.

20. Landis J, Koch GG. The measurements of observer agreement for categorical data. Biometrics 1977; 33:159-79.

21. Szklo M, Nieto EJ. Epidemiology beyond the basics. Gaithersburg: Aspen Publication; 2000.

22. Zha Y, Gao J, Ni S. Use of normalized difference build-up index in automatically mapping urban areas from TM imagery. Int J Remote Sens 2003; 24:583-94.

23. Câmara G, Souza RCM, Freitas UM, Garrido J. SPRING: integrating remote sensing and GIS by object-oriented data modelling. Comput Graph 1996; 20:395-403.

24. Cordeiro JP, Amaral S, Freitas UM, Câmara G. Álgebra de geo-campos e suas aplicações. In: Anais do VIII Simpósio Brasileiro de Sensoriamento Remoto [CD-ROM]. São José dos Campos: Instituto Nacional de Pesquisas Espaciais; 2003.

25. Andrianasolo H, Nakhapakorn K, Fages D, Gonzales J, Barbazan P. A methodology in detailed environment mapping for viral disease survey. http://www.gisdevelopment.net/aars/acrs/1999/ts13/ts13037.asp (acessado em 02/Ago/2006).

26. Guindon B, Zhang Y, Dillabaug C. Landsat urban mapping based on a combined spectral-spatial methodology. Remote Sensing of Environment 2004; 92:218-32.

27. Ministério da Saúde. Manual de vigilância e controle da leishmaniose visceral. http://portal.saude.gov.br/portal/arquivos/pdf/manual_leish_visceral2006.pdf (acessado em 02/Ago/2006).

28. Costa CHN, Pereira HF, Araújo MV. Epidemia de leishmaniose visceral no Estado do Piauí, Brasil, 1980-1986. Rev Saúde Pública 1990; 24:361-72.

Correspondência:
V. R. M. Correia
Divisão de Processamento de Imagens
Instituto Nacional de Pesquisas Espaciais.
Av. dos Astronautas 1758,
C. P. 515, São José dos Campos, SP
12201-027, Brasil.
virginia@dpi.inpe.br

Recebido em 03/Out/2005
Versão final reapresentada em 06/Mar/2006
Aprovado em 06/Fev/2007