ARTIGO ARTICLE
Adaptação transcultural e análise das propriedades psicométricas da versão brasileira do Perfil de Atividade Humana
Cross-cultural adaptation and analysis of the psychometric properties in the Brazilian version of the Human Activity Profile
Aline Cristina SouzaI; Lívia de Castro MagalhãesII; Luci Fuscaldi Teixeira-SalmelaI
IDepartamento de Fisioterapia, Universidade Federal de Minas Gerais, Belo Horizonte, Brasil
IIDepartamento de Terapia Ocupacional, Universidade Federal de Minas Gerais, Belo Horizonte, Brasil
RESUMO
O objetivo deste estudo foi avaliar as propriedades psicométricas da versão brasileira do Perfil de Atividade Humana (PAH), um instrumento de avaliação funcional e do nível de atividade física. O PAH foi traduzido para o português segundo metodologia recomendada e aplicado em 230 idosos (66,32 ± 8,5 anos) da comunidade da cidade de Belo Horizonte, Minas Gerais, Brasil. Os dados foram submetidos à análise Rasch, que detectou itens muito fáceis e muito difíceis, possibilitando sua utilização em pessoas mais debilitadas ou mais capazes. O índice de separação de 3,1 indica que os itens dividiram os indivíduos em três níveis de habilidade funcional. Dos 94 itens, seis (6,38%) foram considerados erráticos. Esse resultado compromete a validade de constructo do teste, pois significa que nem todos os itens se "encaixaram" em um contínuo, sendo recomendada cautela ao interpretar o escore do PAH em idosos com características semelhantes às da amostra. Caso em novos estudos o número de itens erráticos continue acima de 5%, sugere-se modificação, substituição ou exclusão desses itens, para garantir que o PAH meça um constructo unidimensional.
Idoso; Atividade Motora; Atividades Humanas; Avaliação
ABSTRACT
The aim of the present study was to evaluate the psychometric properties in the Brazilian version of the Human Activity Profile (HAP), an instrument for the assessment of daily functions and level of physical activity. The HAP was translated into Portuguese following the recommended methodology and applied to 230 community-dwelling elderly (66.32 ± 8.5 years) from the city of Belo Horizonte, Minas Gerais State, Brazil. The data were submitted to Rasch analysis, which detected very easy and difficult items, making it possible to employ the instrument with both frail and highly functional individuals. The separation index of 3.1 indicated that the items divided the individuals into three levels of functional ability. Of the 94 HAP items, six (6.38%) did not fit the statistical model, which jeopardized its construct validity, since the items did not fit into a continuum. Therefore, caution should be taken when employing the HAP to individuals having similar characteristics. If HAP is applied to different samples and the proportion of erratic items is still more than 5%, modification, substitution, or exclusion of those items is suggested to guarantee that HAP measures a unidimensional construct.
Aged; Motor Activity; Human Activities; Evaluation
Introdução
Nos últimos anos, profissionais da saúde têm procurado avaliar sistematicamente os vários aspectos da saúde de seus clientes como forma de definirem metas de tratamento específicas e implementarem intervenções mais efetivas 1,2. Essa sistematização, fundamentada nos conceitos de função e disfunção humana introduzidos pela Organização Mundial da Saúde (OMS) 3, requer a implementação de medidas e testes objetivos, padronizados e psicometricamente rigorosos. Para isso, tem sido introduzido na prática clínica o conceito de escalas de medida, com o conseqüente abandono de avaliações subjetivas, sujeitas a parâmetros individuais de julgamento 4.
Vários métodos de avaliação funcional têm sido utilizados em serviços de saúde na admissão, acompanhamento e alta de pacientes 5. No Brasil, a grande maioria dos instrumentos utilizados na prática clínica são versões informalmente traduzidas de questionários europeus ou norte-americanos 6. A utilização de instrumentos importados, além de econômico, permite a comparação de populações de países ou culturas diferentes 7,8. Nesse contexto, criou-se uma demanda por critérios e procedimentos para a tradução e adaptação cultural de instrumentos 9.
Muitas avaliações funcionais utilizadas na prática clínica ou pesquisas, vêm sendo criticadas por não aderirem a critérios psicométricos básicos de medida 10,11,12. A maioria é pouco sensível a pequenas perdas funcionais e não foi elaborada para avaliar indivíduos hígidos ou com leve declínio fisiológico 13. Freqüentemente, são avaliações fáceis e não dispõem de itens difíceis o suficiente para captarem níveis de capacidade ou desempenho funcional altos, característica conhecida como efeito teto.
Na tentativa de superar os problemas associados à utilização de escalas fáceis, Daughton et al. 14 desenvolveram a primeira versão do Perfil de Atividade Humana (PAH), denominado Human Activity Profile, originalmente destinado a avaliar indivíduos com doença pulmonar obstrutiva crônica. Em 1988, Fix & Daughton 15 propuseram algumas modificações estruturais no instrumento, que passou a ser utilizado na avaliação do nível funcional e de atividade física, tanto para indivíduos saudáveis, em qualquer faixa etária, quanto para aqueles com algum grau de disfunção 16,17,18.
Para evitar dificuldades no preenchimento e garantir a presença de vários níveis de dificuldade, os autores procuraram selecionar atividades rotineiras, que variassem de um nível funcional baixo (levantar e sentar em cadeira ou cama sem ajuda) a um nível funcional alto (correr 4,8 quilômetros em menos de 30 minutos) 15. Os 94 itens do instrumento, quando categorizados de acordo com a classificação internacional de funcionalidade 3, abordam os domínios atividade e participação.
A disposição dos itens é baseada no custo energético: os de menor numeração demandam menor gasto energético, os de numeração mais alta, maior gasto energético. Para cada um deles existem três possíveis respostas: "ainda faço", "parei de fazer" ou "nunca fiz". Uma vantagem desse instrumento é que a resposta "nunca fiz" não é computada em qualquer escore ou classificação do PAH, o que minimiza o risco de viés cultural de alguns itens como, "cortar grama com cortadeira elétrica", ou "pintar o interior e o exterior de uma casa", que não são atividades rotineiras no Brasil, e de diferenças relacionadas ao gênero, como "lavar ou secar vasilhas" e "usar ou cavar com a pá".
Com base em cada resposta, calculam-se os escores primários: o escore máximo de atividade (EMA), o escore ajustado de atividade (EAA) e a idade de atividade. O EMA corresponde à numeração da atividade com a mais alta demanda de oxigênio que o indivíduo "ainda faz", não sendo necessário cálculo matemático. O EAA é calculado subtraindo-se do EMA o número de itens que o indivíduo "parou de fazer", anteriores ao último que ele "ainda faz". Os coeficientes de confiabilidade obtidos por meio do teste-reteste para o EMA e o EAA foram 0,84 e 0,79, respectivamente 15.
Por exemplo, se o EMA de um indivíduo for 90, mas existem sete respostas "parei de fazer" distribuídas entre as atividades anteriores ao item 90 (o último que ele "ainda faz"), então o EAA é 83. O EAA fornece uma estimativa mais estável das atividades diárias, pois representa os níveis médios de equivalentes metabólicos gastos em um dia típico. Essa forma simples de pontuação fornece uma medida rápida e significativa da alteração dos níveis de energia e possibilita comparações entre os níveis de atividade de populações saudáveis e com alguma disfunção.
O índice idade de atividade fornece uma estimativa da idade equivalente ao EMA alcançado pelo indivíduo e corresponde à idade na qual 50% dos adultos saudáveis de uma dada idade e sexo superam aquele EMA 15. O objetivo dessa conversão não é inferir sobre diagnósticos ou tomada de decisões, ao contrário, é um escore muito mais significativo para o indivíduo porque faz uma comparação entre o seu nível de atividade e o da população em geral.
Além desses, estão disponíveis também escores secundários como a classificação de aptidão física, classificação de atividade, análise da energia potencial esperada e do consumo de energia relacionado ao estilo de vida. A Tabela 1 apresenta uma síntese das pontuações e classificações do PAH.
Apesar do seu grande potencial de aplicabilidade em pesquisas e na prática clínica, o PAH não pode ser utilizado no Brasil sem um procedimento padronizado de adaptação trascultural. Sendo assim, o presente estudo teve como objetivo avaliar as propriedades psicométricas da versão adaptada do instrumento para uma amostra da população brasileira. A validade dos padrões de pontuação dos itens e das respostas foi também analisada para identificar as limitações do instrumento e propor a revisão ou a exclusão de itens.
Metodologia
Participantes
Participaram deste trabalho 230 idosos funcionalmente independentes, sem restrição quanto ao gênero, freqüentadores de centros de convivência e de projetos de caráter preventivo destinados à terceira idade, na cidade de Belo Horizonte, Minas Gerais, Brasil. O estudo obteve a aprovação do Comitê de Ética em Pesquisa da Universidade Federal de Minas Gerais e todos os participantes assinaram um Termo de Consentimento Livre e Esclarecido, concordando com a divulgação dos dados.
O instrumento
O instrumento foi traduzido para a língua portuguesa, retrotraduzido e submetido a um comitê de juízes especialistas, constituído por profissionais da área com domínio do tema e fluentes nos dois idiomas, seguindo metodologia recomendada por Guillemin et al. 9. O comitê discutiu a equivalência entre a versão traduzida e a original e sugeriu alterações no sistema de medidas (por exemplo, metros e quilômetros em vez de jardas e milhas), bem como o acréscimo do tempo equivalente aproximado para a realização da referida atividade ou a mesma distância equivalente em quarteirões. Além disso, foi recomendado que o instrumento fosse aplicado por pesquisadores devidamente treinados e não auto-administrado, como na versão original. A versão final do PAH está apresentada na Tabela 2.
Procedimento
O PAH foi aplicado em forma de entrevista, por dois examinadores treinados, que seguiram instruções padronizadas propostas pelo manual 15. Concomitantemente à aplicação do questionário foram coletados os dados demográficos para caracterização da amostra.
Análise Rasch
O modelo Rasch foi utilizado para investigar as propriedades psicométricas do instrumento, por transformar escores ordinais em medidas intervalares, que são mais apropriadas à análise estatística 11,19. Ele permite a análise detalhada dos itens, com parâmetros específicos para detecção de respostas inesperadas ou erráticas, que contribuem para instabilidade nas medidas. Por meio dessa análise, é possível calibrar a dificuldade dos itens e a habilidade dos indivíduos em um mesmo contínuo linear dividido em intervalos iguais pelos itens, ao longo do qual os indivíduos são distribuídos 12,20. Isso permite comparar o nível de habilidade dos participantes e a dificuldade dos itens, o que é essencial para verificar se o instrumento de medida é útil para uma dada amostra. Devido a essas vantagens e à facilidade de visualização dos resultados, o modelo Rasch tem sido um dos procedimentos mais usados na avaliação de instrumentos de medida na área da reabilitação 21,22,23,24,25,26.
O modelo Rasch baseia-se na conversão logarítmica (log-odds) da probabilidade de se obter sucesso em determinado item do teste 27. Considerando uma escala funcional como o PAH, quanto mais capaz uma pessoa, maior sua probabilidade de receber escores altos em todos os itens, fáceis ou difíceis. Quanto mais fácil o item, maior a probabilidade de qualquer pessoa receber escore alto. Quando todos os itens de um teste atendem a essas expectativas, significa que o teste se enquadra no modelo e a probabilidade é de que indivíduos com mais competência tenham escores mais altos que aqueles com menos competência 19. Esses princípios, no entanto, só se aplicam se o conjunto de itens medir uma habilidade única ou constructo 27. A unidimensionalidade é, portanto, um dos pressupostos essenciais do modelo Rasch, sendo criados marcadores para identificar itens que não se enquadram nesse princípio.
Programas computadorizados específicos para análise Rasch, como o Winsteps (http://winsteps.com), calculam tanto a calibração dos itens e as medidas das pessoas como valores de MnSq (goodness-of-fit) e de t associado a essa estimativa. Esses valores indicam se os padrões de resposta atendem aos pressupostos do modelo. Existem variações, mas MnSq = 1 + 0,3, com t = +2 são valores considerados razoáveis para sinalizar a adequação dos itens 28,29. MnSq > 1,3 indica que os escores nesse item foram imprevisíveis ou erráticos. Em outras palavras, inesperadamente pessoas menos capazes receberam escores altos nos itens difíceis ou vice-versa. Isso indica que ou o item não combina com os outros para definir um contínuo de habilidade ou existem problemas na sua definição, sendo necessário revisão para que ocorra enquadramento 29. Em contrapartida, MnSq < 0,7 indica pouca variabilidade de escores naquele item, ou seja, o padrão de resposta foi previsível ou determinista 29. O primeiro resultado representa grande ameaça para a validade do teste, já o segundo sinaliza que o item não discrimina pessoas com diferentes níveis funcionais, contribuindo pouco para a definição do constructo.
De acordo com a literatura, embora valores baixos de MnSq sinalizem itens que não discriminam pessoas com níveis de funcionalidade diferentes, contribuindo pouco para a definição do constructo, isso não representa ameaça para a validade do teste e, portanto, tais itens não são considerados como problemáticos, podendo ser mantidos 28. Já o escore errático (MnSq alto) indica problemas sérios na definição ou redação dos itens, que precisam ser modificados. Sendo assim, foram assinalados, para revisão, os itens com valores de MnSq > 1,3 em seus dois formatos, infit e outfit, que sinalizam, respectivamente, flutuações nas pontuações e presença de escores extremos. Considera-se que quando mais de 5% do número total de itens não se enquadram no modelo Rasch, os itens do teste não combinam para medir um conceito unidimensional, o que compromete a validade de constructo do instrumento 29.
A análise Rasch calcula também o índice de separação, que indica em quantos níveis de habilidade os itens separam a amostra. Espera-se que um teste divida os participantes em pelo menos três níveis de habilidade (baixo, médio e alto) 12 e esse também foi um critério usado no estudo. Visto que no sistema de pontuação do PAH a resposta "nunca fiz" não interfere no escore final, foram incluídas na análise apenas as respostas "ainda faço" e "parei de fazer", o que corresponde ao padrão do tipo "passa-falha". Como recomenda a literatura, uma vez que foram analisadas apenas duas opções de resposta, foi aplicado o modelo Rasch de dois parâmetros para análise de dicotomias 29.
Resultados
Participaram do estudo 230 idosos funcionalmente independentes, com média de idade de 66,32 + 8,50 anos, dos quais 86% eram mulheres. A renda média dos participantes foi de um salário mínimo, sendo todos aposentados. Desses, 50% não completaram o primeiro grau e apenas 9% possuíam curso superior. Mais de 70% relataram alguma doença, das quais hipertensão arterial, doenças degenerativas e alterações visuais foram as mais freqüentes. O tempo gasto na aplicação do instrumento, lembrando que os entrevistadores foram bem treinados para administrá-lo, foi de aproximadamente vinte minutos.
O resultado da análise para os itens do instrumento está apresentado na Tabela 3, na qual estão discriminados os valores da calibração ou de dificuldade dos itens, MnSq e t (infit e outfit). Dos 94 itens do PAH, 6 (6,38%) não se encaixaram nas expectativas do modelo: item 4 (escrever cartas ou bilhetes); 5 (trabalhar numa mesa ou escrivaninha); 12 (jogar baralho ou qualquer jogo de mesa); 6 (dançar socialmente); 77 (nadar 25 metros); por fim, 78 (nadar 25 metros, sem parar). Observou-se que os itens mais fáceis, ou seja, com maior probabilidade de resposta "ainda faço" foram os de número 8 (vestir e tirar a roupa sem ajuda); 26 (tomar banho de chuveiro); 27 (subir seis degraus); 31 (caminhar metade de um quarteirão no plano); 43 (caminhar um quarteirão no plano). O item mais difícil ou com maior probabilidade de resposta "parei de fazer" foi o 94 (correr 4,8 quilômetros em 30 minutos ou menos).
Além dos itens que não se enquadraram no modelo, foram identificados outros cujos valores de MnSq excederam o valor permitido, mas apresentaram valores de t < 2. Essa combinação de valores significa que tais itens, apesar de não fugirem ao enquadramento estatístico na amostra em questão, podem ser confusos e apresentar problemas em outros estudos, devendo ser melhor examinados. Dentre esses, estão: 13 (tomar banho de banheira) e 86 (jogar uma partida de basquete ou de futebol), que apresentaram MnSq superior a 1,3 no formato infit. Já no formato outfit, mostraram MnSq superior a 1,3 os itens 2 (ouvir rádio); 3 (ler livros, revistas ou jornais); 11 (jantar num restaurante); 18 (vestir e tirar a roupa sem parar para descansar); 24 (passar ou dobrar roupas); 40 (caminhar metade de um quarteirão numa ladeira, sem parar); 41 (fazer compras sozinho); e 65 (correr 100 metros ou jogar peteca, vôlei, beisebol).
Os itens 54 (pintar o interior e o exterior de uma casa); 68 (cortar grama com cortadeira elétrica); 77 (nadar 25 metros); 78 (nadar 25 metros, sem parar); 79 (pedalar 1,6 quilômetro); 80 (pedalar 3,2 quilômetros); 81 (pedalar 1,6 quilômetro, sem parar); e 82 (pedalar 3,2 quilômetros, sem parar) foram os que receberam, em aproximadamente 63% das vezes, a resposta "nunca fiz".
O índice de separação dos indivíduos foi de 3,1, indicando que os itens dividiram os idosos em três níveis de habilidade. A estimativa de consistência interna ou estabilidade de calibração dos itens e das medidas de habilidade dos idosos foi 0,91 e 0,98, respectivamente.
A Figura 1 apresenta o mapa que demonstra o nível de dificuldade dos itens em relação à habilidade dos participantes da amostra. À esquerda, o contínuo de habilidades da amostra e, à direita, o contínuo de dificuldade dos itens. No topo, pode-se observar a presença de algumas pessoas alinhadas com a questão mais difícil. Na parte inferior, observa-se itens muito fáceis, não havendo na amostra indivíduos com desempenho funcional tão baixo que fossem incapazes de realizá-los. Pode-se também observar que a maioria deles está alinhada com itens de dificuldade moderada a alta, o que confirma que a amostra foi constituída, em sua grande parte, por pessoas moderadamente ou altamente capazes funcionalmente.
Discussão
Os dados coletados foram submetidos à análise Rasch, que apontou os itens: 4 (escrever cartas ou bilhetes); 5 (trabalhar numa mesa ou escrivaninha); 12 (jogar baralho ou qualquer jogo de mesa); 66 (dançar socialmente); 77 (nadar 25 metros); e 78 (nadar 25 metros, sem parar) como erráticos. Isso significa que as respectivas respostas foram inesperadas ou controversas.
A variabilidade nas respostas ao item 4 (escrever cartas ou bilhetes) pode ter ocorrido devido à sua estreita ligação com a escolaridade, o que faz com que ele seja mais dependente do nível de alfabetização do que de dispêndio de energia. Nessa amostra, em que menos da metade completou o primeiro grau, indivíduos com grande habilidade funcional podem não escrever cartas ou bilhetes pelo fato de não saberem escrever. Em países como o Brasil, em que os índices de analfabetismo são elevados 30, esse item pode influenciar os escores do instrumento. Outra observação pertinente é que as pessoas estão sendo estimuladas a escrever cada vez menos cartas ou bilhetes e a utilizar cada vez mais mensagens eletrônicas. No presente estudo, considerando-se as características sócio-econômicas da amostra, é pouco provável que essa tendência tenha influenciado os resultados, pois é de se esperar que os indivíduos avaliados não tivessem acesso a computadores e/ou não soubessem utilizá-los. Entretanto, em amostras constituídas por indivíduos de níveis sócio-culturais mais altos, o item pode se tornar pouco relevante ou informativo e, nesse caso, pode ser interessante sua exclusão ou modificação. Considerando esse fato, uma sugestão seria modificar a redação para "escrever cartas, bilhetes ou 'e-mail'".
No item 5 (trabalhar em mesa ou escrivaninha), o problema pode estar na referência a situações de trabalho. A pergunta, da forma como está redigida, pode ter induzido os idosos constituintes dessa amostra, em sua totalidade aposentados, a responderem "parei de fazer". Para garantir uma resposta confiável, o reforço da instrução inicial é importante. O entrevistado deve responder se é capaz de cumprir o item, se for necessário, e não simplesmente se costuma ou não realizar tal atividade no seu dia-a-dia. A substituição do termo trabalho por outro menos específico, como, por exemplo, realizar atividades em mesa ou escrivaninha, poderia evitar erros de interpretação. Para evitar interferência da escolaridade (sugerida pela palavra escrivaninha), é importante reforçar que quaisquer atividades que possam ser realizadas em uma mesa estão incluídas nesse item.
Uma característica específica da amostra pode ter contribuído para a variabilidade dos itens 12 (jogar baralho ou outros jogos de mesa) e 66 (dançar socialmente): um número expressivo de idosos recrutados era evangélico e essas atividades não são incentivadas entre eles. Segundo Gauvin & Russell 31, fatores como a prática religiosa devem ser considerados em processos de adaptação de instrumentos, pois interferem no que é considerado comportamento apropriado ou não apropriado. Quanto ao item jogar baralho, seria interessante esclarecer que o jogo, aqui, tem caráter de lazer e não se refere a jogos de azar, visto que o conceito de lazer é amplamente aceito, enquanto jogo de azar é condenado por várias culturas. O ato de dançar socialmente, além das questões religiosas, depende dos hábitos das pessoas. Portanto, o não dançar, nesse caso, principalmente em se tratando de uma amostra de idosos, pode não estar refletindo a inabilidade de dançar, mas a falta de costume ou de interesse pela atividade.
A variabilidade nos itens 77 e 78 (nadar 25 metros; e nadar 25 metros, sem parar) ocorreu porque pessoas pouco hábeis responderam que conseguiam executar uma tarefa difícil. Sobre esse aspecto, não apenas nestes, mas em todos os outros itens de maior dificuldade, é necessário estar atento para que o entrevistado não superestime suas habilidades no momento de responder. O padrão de respostas a esses itens foi muito influenciado pela idosa de número 127, 69 anos, que respondeu "ainda faço" para as atividades mencionadas, apesar de ter deixado de fazer tarefas com custo energético mais baixo, como, por exemplo, andar distâncias médias ou subir alguns lances de escadas. Segundo relato dessa idosa, a natação era praticada como recomendação médica, com o objetivo de manter-se fisicamente ativa, sem sobrecarga para as articulações, pois apresentava alterações degenerativas nos joelhos e queixa de dores nas pernas.
Os seis itens erráticos detectados representam 6,4% do número, valor que supera os 5% recomendados pelo modelo. Isso significa que esses itens não se encaixam no contínuo de habilidade e não contribuem para medir um constructo unidimensional, comprometendo a validade de constructo do teste. Em estudos subseqüentes, o comportamento desses itens deve ser novamente investigado para verificar se os problemas persistem. Caso isso ocorra, deve-se propor sua revisão, substituição ou exclusão.
Em alguns outros itens, o valor do MnSq excedeu o valor máximo de 1,3 recomendado pela análise no formato infit ou outfit, apesar de o valor de t associado ter sido inferior a 2. Isso significa que tais itens podem vir a representar problemas para o instrumento. Estão incluídos nesse grupo: tomar banho de banheira sem ajuda; jogar uma partida de basquete ou de futebol; ouvir rádio; ler livros, revistas ou jornais; jantar num restaurante; vestir e tirar a roupa sem parar para descansar; passar ou dobrar roupas; caminhar metade de um quarteirão numa ladeira sem parar; fazer compras sozinho; e correr 100 metros ou jogar peteca, vôlei, beisebol.
Algumas características culturais e/ou sócio-econômicas podem ter sido responsáveis pela variabilidade em itens como tomar banho de banheira, passar ou dobrar roupas e jantar num restaurante. Não é costume no país, atualmente, as residências possuírem banheira, e esse pode ter sido o motivo pelo qual os indivíduos responderam que deixaram de fazer a atividade. Por outro lado, passar ou dobrar roupas é uma tarefa desempenhada principalmente por mulheres e o fato de os homens não passarem roupas não significa que eles não tenham capacidade de fazê-lo, mas, sim, que não é uma tarefa de sua responsabilidade. Jantar em restaurante depende da disponibilidade financeira e é provável que esses idosos tenham relatado que não jantam em restaurantes por falta de recursos e não porque não consigam. É importante lembrar que, no Brasil, muitas famílias são dependentes dos recursos provenientes dos idosos.
A interferência da alfabetização, da supervalorização do desempenho e da confusão entre não ser capaz e não ter o hábito de fazer determinada atividade também pode ser observada nesse grupo de itens. Por exemplo, no item 3, os indivíduos podem não conseguir ler livros, revistas ou jornais simplesmente por não saberem ler. No item 5, os idosos podem não ouvir rádio porque não têm costume e preferem ver televisão. Além disso, quando o indivíduo responde que é capaz de jogar uma partida de futebol ou basquete ele pode estar supervalorizando sua capacidade e isso pode influenciar o escore final, sem que o entrevistador possa evitar ou intervir.
A freqüência de doenças degenerativas e inflamatórias e de alterações visuais também pode ter influenciado alguns itens. Caminhar meio quarteirão numa ladeira, por exemplo, por incluir um aclive, mesmo que a distância seja pequena, torna-se uma atividade desgastante para pessoas com problemas articulares 32. Fazer compras sozinho, além da capacidade física de caminhar até o supermercado, alcançar frascos e carregar sacolas exige independência para ler rótulos e contar dinheiro, habilidades prejudicadas por apresentarem alterações visuais importantes.
A presença de itens pouco freqüentes, com grande probabilidade de resposta "nunca fiz", já era esperada, como, por exemplo, pintar o interior e o exterior de uma casa, cortar grama com cortadeira elétrica. É pouco comum, no Brasil, as pessoas pintarem suas próprias casas ou cortarem grama com cortadeira elétrica, o que torna esses itens, na versão em português, pouco informativos sobre habilidade ou independência funcional.
O mesmo ocorre com nadar ou pedalar. Culturalmente, nossos idosos estão engajados em atividades mais simples, que exigem menos recursos, como caminhada. Conforme discutido por Gauvin & Russell 32, a participação ou não em determinados esportes pode refletir diferenças entre grupos culturais e deve ser considerada durante o procedimento de adaptação.
Uma vantagem do instrumento, entretanto, é que as respostas "nunca fiz" não são computadas no escore final do PAH. Apesar de informarem pouco sobre habilidade funcional nessa amostra, deve-se lembrar que a presença desses itens permite a aplicação do PAH em populações com características diferentes.
Os itens 8, 26, 27, 31 e 43, que se referem à independência no vestuário, banho de chuveiro, subir seis degraus e caminhar meio e um quarteirão, respectivamente, foram os mais fáceis do questionário e todos os entrevistados continuavam fazendo tais atividades. O item 94 (correr 4,8 quilômetros em 30 minutos ou menos) foi o mais difícil e, dos 230 idosos investigados, apenas um ainda o conseguia. Esse indivíduo participava de um programa de condicionamento físico desenvolvido pela Universidade Federal de Minas Gerais e, com base nas informações do seu prontuário, seria pouco provável que conseguisse realizar tarefas tão difíceis como correr aproximadamente 5 quilômetros em menos de 30 minutos. Esse pode ser um exemplo de supervalorização, já discutido anteriormente, e confirma uma limitação das avaliações em forma de questionário: as respostas podem não ser fidedignas 33.
Na parte superior da Figura 1, podem ser observados dois outros itens difíceis, que ninguém da amostra "ainda faz". Apesar disso, o mapa mostra algumas pessoas no topo do contínuo, o que dá a falsa impressão de efeito teto. Como foram considerados na análise estatística apenas o "ainda faço" e o "parei de fazer", os indivíduos que não tiveram nenhuma resposta "parei de fazer" receberam pontuação máxima pelo programa, sendo então representados no limite superior do mapa de habilidade. Para ilustrar, considere-se um exemplo hipotético: um entrevistado responde "ainda faço" até o item 75 (EMA = 75), sem ter respondido "parei de fazer" nenhuma vez. Do item 75 em diante, ele responde "nunca fiz" para todos os itens. Como a análise não considera as respostas "nunca fiz" e, nesse caso, não há resposta "parei de fazer", para o programa estatístico, ele obteve a pontuação máxima, possuindo, assim, o maior nível de habilidade discriminado pelo questionário.
A presença de itens muito fáceis e muito difíceis possibilita a aplicação do PAH em amostras com características diferentes das deste estudo. Lembrando que a amostra utilizada foi constituída de pessoas funcionalmente independentes, a presença de itens fáceis garante que ele possa ser administrado em indivíduos mais debilitados ou institucionalizados. Por outro lado, a presença de itens difíceis permite sua utilização em pessoas funcionalmente mais capazes, inclusive adultos jovens ou adolescentes, como preconizado pelos autores do instrumento.
Como resultado da análise estatística dos dados coletados a partir da aplicação da versão adaptada do PAH em idosos, obteve-se um coeficiente global de consistência interna de 0,91, indicando estabilidade da calibração dos itens. Para os indivíduos, esse coeficiente foi de 0,98, que significa que as respostas também foram estáveis e, portanto, as medidas podem ser reproduzidas em aplicações subseqüentes do teste. O valor encontrado para o índice de separação foi de 3,1 e informa que a amostra foi dividida em três níveis de habilidade: baixo, médio e alto. O esperado na análise de testes como o PAH é que haja um pequeno número de pessoas nas partes superior e inferior do contínuo, ou seja, poucas muito hábeis e poucas muito debilitadas. A maioria deve estar concentrada no terço médio do contínuo, caracterizando uma habilidade funcional moderada. Esse comportamento, conforme observado na Figura 1, foi reproduzido.
Vale lembrar que esses resultados refletem o desempenho de uma amostra de idosos de nível sócio-econômico baixo. É importante que o PAH seja aplicado em outras amostras para que a validade do instrumento seja mais amplamente investigada. Se, em outros tipos de amostras persistir um número superior a 5% de itens erráticos, tornam-se necessárias modificações do instrumento, que podem incluir adaptações ou exclusão de itens, seguidas de estudos subseqüentes para verificação das qualidades psicométricas do instrumento modificado.
Quanto à aplicação clínica do instrumento, sugere-se que o entrevistador reforce as instruções iniciais para aqueles itens que apresentaram tendência à variabilidade nas respostas, de forma a garantir que o indivíduo não se esqueça do objetivo original das perguntas. É preciso, também, que o avaliador esteja atento à interpretação dos resultados e analise as respostas dos itens problemáticos ou com problemas em potencial, para assegurar que o escore final represente o nível de habilidade funcional verdadeiro.
Conclusão
A versão brasileira do PAH, devido às características dos itens que o constituem, pode ser aplicada em indivíduos com níveis funcionais diferentes, desde muito baixos até muito altos, sem risco de "efeito teto". Além disso, demonstrou estabilidade nas respostas e permitiu a discriminação entre diferentes níveis de habilidade funcional. Entretanto, sua validade de constructo mostrou-se comprometida pela presença de alguns itens problemáticos, com alta variabilidade nas respostas. Deve-se ressaltar que esses resultados refletem o padrão de desempenho de uma amostra de idosos de nível sócio-econômico baixo, e é possível que itens com desempenho errático neste estudo apresentem comportamento diferente se aplicados em outra amostra. No entanto, quando administrado a idosos de baixo poder econômico, além de ser importante que o avaliador reforce, em alguns momentos, as instruções iniciais para garantir uma resposta adequada, é preciso ter cautela na interpretação dos resultados do teste e observar as respostas aos itens considerados problemáticos ou com problemas em potencial. Dessa forma, é possível assegurar que o escore final obtido pela aplicação do instrumento reflita os níveis reais de habilidade funcional.
Colaboradores
A. C. Souza colaborou na revisão literária, coleta e elaboração do artigo. L. C. Magalhães colaborou com análise estatística, editoração e revisão. L. F. Teixeira-Salmela participou da coordenação, editoração, análise estatística e revisão geral.
AGRADECIMENTOS
Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico e à Fundação de Amparo à Pesquisa do Estado de Minas Gerais.
Referências
1. Guccione AA. Physical therapy diagnosis and the relationship between impairments and function. Phys Ther 1991; 71:499-504.
2. Haley SM, Coster WJ, Blinda-Sundberg K. Measuring physical disablement: the contextual challenge. Phys Ther 1994; 74:443-51.
3. Organização Mundial da Saúde. Classificação internacional de funcionalidade, incapacidade e saúde. São Paulo: Edusp; 2003.
4. Sampaio RF, Mancini MC, Fonseca ST. Produção científica e atuação profissional: aspectos que limitam essa integração na fisioterapia e na terapia ocupacional. Rev Bras Fisioter 2002; 6:113-8.
5. Harvey RF, Jellinek HM. Functional performance assessment: a program approach. Arch Phys Med Rehabil 1981; 62:456-60.
6. Paixão Jr. CM, Reichenheim ME. Uma revisão sobre instrumentos de avaliação do estado funcional do idoso. Cad Saúde Pública 2005; 21:7-19.
7. Ciconelli RM. Tradução para o português e validação do questionário genérico de avaliação da qualidade de vida "Medical Outcomes Study 36-Item Short-Form Health Survey (SF-36)" [Tese de Doutorado]. São Paulo: Universidade Federal de São Paulo; 1997.
8. Gilmer JS, Tripp-Reimer T, Buckwalter KC, Andrews PH, Morris WW, Rios H, et al. Translation and validation issue for a multidimensional self-assessment instrument. West J Nurs Res 1995; 17:220-6.
9. Guillemin F, Bombardier C, Beaton D. Cross-cultural adaptation of health related quality of life measures: literature review and proposed guidelines. J Clin Epidemiol 1993; 46:1417-32.
10. Magalhães LC, Fisher AG, Bernspang B. Cross-cultural assessment of functional ability. Occupational Therapy Journal of Research 1996; 16:45-63.
11. Merbitz C, Morris J, Crip JC. Ordinal scales and foundations of misinference. Arch Phys Med Rehabil 1989; 70:308-12.
12. Velozo CA, Magalhães LC, Pan AW, Leiter P. Functional scale discrimination at admission and discharge: Rasch analysis of the level of rehabilitation scale-III. Arch Phys Med Rehabil 1995; 76: 705-12.
13. Brummel-Smith K. Assessment in rehabilitation. In: Osterweil D, Brummel-Smith K, Beck JC, editors. Comprehensive geriatric assessment. New York: McGraw-Hill; 2000. p. 139-72.
14. Daughton DM, Fix AJ, Kass I, Bell CN, Patil KD. Maximum oxygen consumption and the ADAPT quality-of-life scale. Arch Phys Med Rehabil 1982; 63:620-2.
15. Fix AJ, Daughton DM. Human activity profile _ professional manual. Nebraska: Psychological Assessment Resources; 1988.
16. Hamdorf PA, Withers RT, Penhall RK, Haslam MV. Physical training effects on the fitness and habitual activity patterns of elderly women. Arch Phys Med Rehabil 1993; 73:603-8.
17. Packer TL, Sauriol A, Brouwer B. Fatigue secondary to chronic illness: post polio syndrome, chronic fatigue syndrome, and multiple sclerosis. Arch Phys Med Rehabil 1994; 75:1122-6.
18. Teixeira-Salmela LF, Olney JO, Nadeau S, Brouwer B. Muscle strengthening and physical conditioning to reduce impairment and disability in chronic stroke survivors. Arch Phys Med Rehabil 1999; 80:1211-8.
19. Wright BD, Linacre JM. Observations are always ordinal; measurements, however, must be interval. Arch Phys Med Rehabil 1989; 70:857-60.
20. McArthur DL, Cohen MJ, Schandler SL. Rasch analysis of functional assessment scales: an example using pain behaviors. Arch Phys Med Rehabil 1991; 70:296-304.
21. Lai JS, Fisher AG, Magalhães LC, Bundy AC. Construct validity of the sensory integration and praxis tests. Occupational Therapy Journal of Research 1996; 16:75-97.
22. Fisher AG, Liu Y, Velozo CA, Pan AW. Cross-cultural assessment of process skills. Am J Occup Ther 1992; 46:876-4.
23. Heinemann AW, Linacre JM, Wright BD, Hamilton BB, Granger C. Relationships between impairment and physical disability as measured by the functional independence measure. Arch Phys Med Rehabil 1993; 74:566-73.
24. Mancini MC, Fiúza PM, Rebelo JM, Magalhães LC, Coelho ZAC, Paixão ML, et al. Comparação do desempenho de atividades funcionais em crianças com desenvolvimento normal e crianças com paralisia cerebral. Arq Neuro-Psiquiatr 2002; 60:446-52.
25. Silverstein B, Fisher WP, Kilgore KM, Harley JP, Harvey RF. Applying psychometric criteria to functional assessment in medical rehabilitation: II _ defining interval measures. Arch Phys Med Rehabil 1992; 73:507-18.
26. Chern JS, Kielhofner G, de las Heras CG, Magalhães LC. The volitional questionnaire: psychometric development and practical use. Am J Occup Ther 1996; 50:516-25.
27. Wright DD, Stone MH. Best test design. Chicago: MESA Press; 1979.
28. Linacre MJ. What do infit and outfit, mean-square and standardized mean? Rasch Measurement Transactions 2002; 16:878.
29. Bond TG, Fox CM. Applying the Rasch model: fundamental measurement in the human sciences. Mahwah: Lawrence Erlbaum Associates; 2001.
30. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. O mapa do analfabetismo no Brasil. http://www.inep.gov.br/estatísticas/analfabetismo/ (acessado em 05/Jun/2004).
31. Gauvin L, Russell SJ. Sport-specific and culturally adapted measures in sport and exercise psychology research: issues and strategies. In: Singer RN, Murphey M, Tennant LK, editors. Handbook of research on sport psychology. New York: MacMillan Publishing Company; 1993. p. 891-900.
32. Patla A. A framework for understanding mobility problems in de elderly. In: Craik RL, Oats CA, editors. Gait analysis, theory and application. Boston: Mosby; 1995. p. 436-49.
33. Devaraj R. Validation of the Human Activity Profile [Masters' Thesis]. Kingston: School of Rehabilitation Therapy, Queen's University; 2000.
Correspondência
L. F. Teixeira-Salmela
Departamento de Fisioterapia
Universidade Federal de Minas Gerais
Av. Antônio Carlos 6627, Campus Pampulha
Belo Horizonte, MG 31270-010, Brasil
lfts@ufmg.br
Recebido em 24/Jun/2005
Versão final reapresentada em 29/Mar/2006
Aprovado em 11/Abr/2006