ARTIGO ORIGINAL

 

Distribuição das medidas de induração e eritema na prova tuberculínica: aplicação de um método gráfico de decomposição de uma distribuição de freqüências em componentes normais1

 

The erythema and induration measurements in the tuberculin test: decomposition of the frequency distribution into normal components by a graphic method

 

 

Odécio Sanches

Do Departamento de Bioestatística e Estatística Vital da Escola de Enfermagem de Ribeirão Preto, USP – Campus de Ribeirão Preto, SP – Brasil

 

 


RESUMO

O teste tuberculínico, segundo a técnica de Mantoux, pretende classificar as pessoas de acordo com o tamanho da reação provocada por uma única e especificada dose de tuberculina. Dados empíricos mostram que as medidas de tais reações, obtidas em populações genéricas, representam a mistura de distintos grupos componentes. Com a finalidade de separar tais grupos, objetivando a solução posterior do problema de classificação, foi utilizado um método gráfico de decomposição de uma distribuição de freqüências em componentes normais para decompor distribuições de freqüências de medidas de induração e eritema. A decomposição obtida permite verificar que o número de componentes que descreve a distribuição da variável induração não é o mesmo que para a variável eritema, para os dados considerados.

Unitermos: Teste tuberculínico. Técnica de Mantoux. Induração. Eritema. Mistura de distribuições normais. Distribuição normal truncada.


SUMMARY

The tuberculin test by the Mantoux technique is used in order to classify people according to the size of the reaction caused by a single standard shot of tuberculin. Empirical data seem to demonstrate that such reactions obtained in general populations really represent a mixture of at least two separate groups. Aiming at the separation of these groups, in order to solve the classification problem later on, the Bhattacharya method was used. A decomposition of the frequency distribution of the erythema and induration measurements into normal components was thus obtained. The results of this decomposition showed that the number of components belonging to the distribution of the erythema variable was not the same as that for the induration one.

Uniterms: Tuberculin test by Mantoux technique. Induration. Erythema. Mixture of normal distributions. Truncated normal distribution.


 

 

1. INTRODUÇÃO

Ruffino Netto 4 (1970) afirma existir evidências de que alguns aspectos mensuráveis na prova tuberculínica devem ser melhor elucidados. Neste sentido, tenta quantificar a relação induração-eritema pressupondo que este par tenha uma distribuição Normal bi-dimensional, o que implica uma distribuição Normal unidimensional para cada uma das marginais.

Os resultados do teste tuberculínico, segundo a técnica de Mantoux, como afirma Guld 3 (1953), tem por finalidade classificar pessoas em distintos grupos conforme o tamanho da reação provocada por uma única e especificada dose de tuberculina. Assim sendo, os resultados do referido teste, obtidos em uma população genérica, devem representar uma mistura de distintos grupos sendo de se esperar que uma única distribuição de probabilidades dificilmente descreva, de maneira satisfatória, o conjunto de dados observados.

Logo, estudar as distribuições das medidas de induração ou de eritema, obtidas em uma população genérica, significa tentar buscar as distribuições de probabilidades que descrevem os grupos componentes e determinar as proporções em que ocorre tal mistura para posteriormente, se de interesse, estudar o problema de classificação.

O objetivo deste trabalho é, usando um método gráfico aproximado e os dados obtidos por Ruffino Netto4 (1970), verificar se a distribuição de freqüências para um conjunto de medidas de induração pode ser decomposta em três grupos distintos como evidencia o trabalho de Edwards et al.2 (1959) e, ao mesmo tempo, verificar se a distribuição de freqüências da variável eritema se comporta de forma análoga já que, conforme citação em Ruffino Netto4 (1970), vários autores concordam que a variável eritema é tão boa quanto a variável induração para classificar indivíduos submetidos ao teste tuberculínico.

 

2. MÉTODO GRÁFICO PARA DECOMPOSIÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS EM COMPONENTES NORMAIS COM OU SEM TRUNCAMENTO

Distribuições truncadas ocorrem comumente na prática, sendo o truncamento uma conseqüência da impossibilidade de se observar determinados valores o que é devido, em geral, à imprecisão do aparelho de medida ou à pequena sensibilidade do método de mensuração empregado.

Sanches 5 (1973) estuda o método gráfico proposto por Bhattacharya1 (1967), para decomposição de uma distribuição de freqüências em componentes Normais, a partir da pressuposição que as distribuições componentes sejam truncadas, com duplo truncamento em pontos conhecidos. Esta hipótese adicional leva ao mesmo resultado obtido por Bhattacharya no que diz respeito à decomposição em si, havendo, no entanto, necessidade da correção para o truncamento para a obtenção das estimativas das proporções da mistura. Os casos de truncamento simples à direita ou à esquerda, e os de não truncamento, são obtidos facilmente como casos particulares.

O método proposto, ao mesmo tempo em que permite obter a separação das distribuições componentes, permite também obter estimativas dos parâmetros das mesmas, desde que algumas hipóteses, as quais serão indicadas a seguir, estejam satisfeitas, pelo menos aproximadamente.

Seja :

 

 

a função densidade de probabilidade de uma mistura de k distribuições Normais duplamente truncadas, onde:

a) os pi são números reais, tais que

 

 

b) fit (x) é a função densidade de probabilidade de uma Normal duplamente truncada nos pontos x1i e x2i, x1i< < x2i, ambos conhecidos, e de parâmetros mi e ; i = 1, 2,.....,k.

Admitindo como hipóteses que:

a) as distribuições componentes são suficientemente separadas de tal modo a existir uma região, suficientemente ampla, para cada componente, onde os efeitos das demais componentes sejam desprezíveis;

b) a variável esteja agrupada em intervalos de classe de ampltiude suficientemente pequena;

consideremos:

N j :a freqüência total da jma. componente ;

h : amplitude constante de cada intervalo de classe;

y (x) : freqüência do intervalo tendo x como ponto médio.

Nestas condições, Sanches 5 (1973), vale o seguinte resultado:

 

 

onde

 

 

Este resultado mostra que o gráfico de Dlog y(x) é, na região onde a jma. componente está convenientemente separada das demais, uma reta com inclinação negativa, para h suficientemente pequeno.

Estimativas e para mj e são obtidas diretamente do gráfico e são dadas por:

 

a)

 

onde qj* é a medida do ângulo agudo feito pela reta, correspondente à jma. componente, com o eixo dos x e medido diretamente no gráfico; f1 e f2 são dois fatores de escala, respectivamente, para os eixos x e Dlog y, já que estas variáveis, em geral, estão em escalas distintas.

Se, na prática, forem utilizados logaritmos na base 10 então o valor de f2 deve ser corrigido multiplicando-o por log10 e

 

 

onde é, no gráfico de Dlog y(x), o ponto onde a reta correspondente à jma. componente corta o eixo dos x.

Obtidas as estimativas e as proporções da mistura podem ser estimadas, por exemplo, por:

 

 

onde

 

 

sendo as somas do numerador e denominador, nesta última expressão, restritas à região em consideração.

Dependendo da existência ou não de truncamento os (x) são dados por:

 

 

onde:

 

 

F(.): função distribuição acumulada da N(0;1)

 

 

Convém ressaltar que em alguns casos especiais onde a hipótese de conveniente separabilidade entre as componentes não está satisfeita para uma ou algumas das componentes da mistura e, nos casos mais gerais, quando não se sabe se as condições básicas do método estão satisfeitas, a validade do mesmo pode ser estabelecida numa primeira etapa, a partir da construção do gráfico de Dlog y(x) para os dados que se tem em mãos. Nestes casos, inicialmente, determinam-se aquelas componentes que são evidenciadas pelo gráfico. As freqüências esperadas para estas componentes são então subtraídas das freqüências observadas obtendo-se o que denominamos freqüências residuais. Se tais freqüências residuais não são desprezíveis o processo é então repetido e novas componentes possivelmente determinadas. Caso ocorra a existência de freqüências residuais não desprezíveis e a inexistência de mais componentes, isto significa que o método não se aplica ao conjunto de dados observados.

 

3. ESTUDO DAS DISTRIBUIÇÕES DAS VARIÁVEIS INDURAÇÃO E ERITEMA

3.1. Induração

Os dados por nós utilizados, Tabela 1, são uma adaptação daqueles obtidos por Ruffino Netto4 (1970) nos anos de 1967 e 1968 no Complexo Hidroelétrico de Urubupungá. Dos dados originais excluímos as medidas 0 (zero) por significarem, obviamente, ausência de reação. Além disto, por razões de sensibilidade do método de mensuração empregado, truncamos as observações, à esquerda, no ponto correspondente à medida de 2 mm. A tuberculina assim como a dose aplicada e as técnicas de mensuração empregadas encontram-se descritas em Ruffino Netto4 (1970).

 

 

A Tabela 1 apresenta, além das freqüências consideradas, uma coluna correspondente às diferenças dos logaritmos, calculados na base 10, das freqüências dos intervalos de classe adjacentes.

A Fig. 1 mostra o gráfico de Dlog10y(xi), onde xi é o ponto médio do imo intervalo; i = 1, 2,.....,8.

 

 

Um exame deste gráfico mostra 3 pontos razoavelmente bem alinhados: os pontos correspondentes a x = 11 mm, x = 13 mm e x = 15 mm, o que indica, de acordo com o método exposto, a existência de uma componente Normal. Além disto, observamos a possibilidade de outras duas componentes correspondentes à retas passando por apenas 2 pontos, o que, possivelmente, está vinculado a uma acentuada intersecção entre os grupos componentes. Por este motivo a aplicação do método de decomposição ao presente conjunto de dados, com a finalidade de obtenção das estimativas dos parâmetros das diferentes componentes, deve ser feito por etapas.

Inicialmente, utilizando-nos do gráfico da Fig. 1 obtemos as estimativas dos parâmetros correspondentes à reta por 3 pontos a qual, como evidencia a Figura, deve ser a terceira componente.

Da Fig. 1 obtemos:

 

 

e desde que h = 2 mm, obtemos:

 

 

Considerando apenas as freqüências dos intervalos de classe na região que contém os pontos que determinam a reta, obtemos:

Com tais resultados foram calculadas as freqüências esperadas (aproximadas para o inteiro mais próximo) para esta terceira componente. Subtraindo-se tais freqüências das freqüências observadas (Tabela 1) obtivemos as freqüências residuais que denominados yr1.

No mesmo gráfico da Fig. 1 são também representados os pontos correspondentes a Dlog10yr1(x1), conforme legenda.

Observe-se que este procedimento de agir por etapas permite corrigir as posições dos pontos no gráfico, eliminando a influência da intersecção, pelo menos, com uma das componentes.

Em virtude de tal fato calculamos as estimativas dos parâmetros apenas para a segunda componente usando a região da componente correspondente à reta que passa pelos pontos x = 7 mm e x = 9 mm os quais já estão livres, da influência da terceira componente. É claro que se aí existir uma influência da primeira componente ela será bem menor que na região correspondente aos pontos que estão à esquerda de x = 7 mm.

A partir da Fig. 1, considerando a reta corrigida para a segunda componente, obtemos:

 

 

Os quais permitem obter:

 

 

e finalmente:

 

 

A partir destes dados foram calculadas as freqüências esperadas para esta segunda componente as quais foram subtraídas de yr1 obtendo-se novas freqüências residuais, que denominamos yr2. Como tais freqüências não foram desprezíveis repetiu-se o método para as mesmas e representou-se no gráfico da Fig. 1, conforme legenda lá indicada, as diferenças logarítimas Dlog10yr2 obtendo-se a reta corrigida correspondente à primeira componente, a qual, por pressuposição inicial, foi tomada como truncada, à esquerda, no ponto x11 = 2 mm.

Para esta reta obtivemos:

 

 

o que nos permite obter:

 

 

Finalmente foram estimadas as proporções da mistura:

 

 

A Tabela 2 é um quadro comparativo onde apresentamos as freqüências esperadas para as três componentes determinadas e as freqüências observadas.

A Fig. 2 mostra as três distribuições Normais esperadas em confronto com o histograma observado.

 

 

3.2. Eritema

Os dados da Tabela 3 referem-se a medidas de diâmetros de eritema na prova tuberculínica, segundo a técnica de Mantoux, e são também uma adaptação de dados de Ruffino Netto 4 (1970). A distribuição desta variável é estudada impondo-se um truncamento, à esquerda, no ponto correspondente à medida 1 mm.

 

 

A fig. 3 mostra o gráfico de Dlog10 y(xi) o qual evidencia a existência de, pelo menos, 4 componentes. A mesma técnica utilizada para a variável induração é aqui repetida no que diz respeito à obtenção das estimativas dos parâmetros das componentes.

 

 

A Tabela 4 mostra um quadro comparativo entre as freqüências esperadas, para as quatro componentes determinadas, e as freqüências observadas, enquanto que a Tabela 5 mostra as estimativas obtidas para os parâmetros das componentes da mistura.

Finalmente, a Fig. 4 estabelece um confronto entre o histograma observado e as quatro componentes esperadas.

 

 

4. COMENTÁRIOS E CONCLUSÕES

Embora as medidas de diâmetros de induração e eritema, por nós utilizadas, proviessem de um mesmo grupo de pessoas, a maneira como as utilizamos levou a amostras de tamanhos distintos o que, para os objetivos que tínhamos fixado, não apresenta inconveniente algum.

O método proposto, embora aproximado, mostrou-se útil e permitiu, para os dados que tínhamos em mãos, obter a separação das distribuições de freqüências observadas em componentes Normais, apesar da relativa intersecção entre os grupos componentes.

Dos resultados obtidos, parece existir evidência de que as variáveis induração e eritema, sob o ponto de vista em que foram estudadas, não se comportam de maneira análoga.

Finalmente, obtida a separação da distribuição de freqüências observada em distintos grupos componentes, descritos por uma bem especificada distribuição de probabilidades, é possível, agora, estabelecer regiões de classificação dos elementos aos distintos grupos, assim como estimar as probabilidades de classificação errada. Para os dados aqui estudados isto será apresentado em outro artigo, no que se refere à classificação segundo as medidas de induração.

 

REFERÊNCIAS BIBLIOGRÁFICAS

1. BHATTACHARYA, C.G. – A simple method of resolution of a distribution into Gaussian components. Biometrics, 23:115-29, 1967.        

2. EDWARDS, L.B. et al. – Sources of tuberculin sensivity in human populations: A summing up of recent epidemiologic research. Acta tuberc. scand., 47(Suppl.) :77-97, 1959.        

3. GULD, J. – Quantitative aspects of the intradermal tuberculin tests in humans. Acta tuberc. scand., 28:222-34, 1953.        

4. RUFFINO NETTO, A. – Epidemiologia da Tuberculose: estudo de alguns aspectos mensuráveis na prova tuberculínica. Ribeirão Preto, 1970. [Tese de Doutoramento – Faculdade de Medicina de Ribeirão Preto da USP]        

5. SANCHES, O. – Extensão do método de Bhattacharya para decomposição de uma distribuição de freqüências em componentes normais: aplicação a um problema biológico. Ribeirão Preto, 1973. [Tese de Doutoramento – Faculdade de Filosofia Ciências e Letras]        

 

 

Recebido para publicação em 26-11-74
Aprovado para publicação em 13-01-75

 

 

Extraído da tese: "Extenção do Método de Bhattacharya para decomposição de uma distribuição de freqüências em componentes normais. Aplicação a um problema biológico", apresentada à Faculdade de Filosofia Ciências e Letras de Ribeirão Preto, em 28-12-73, para obtenção do título de doutor em Ciências

Faculdade de Saúde Pública da Universidade de São Paulo São Paulo - SP - Brazil
E-mail: revsp@org.usp.br