|
José Carlos Santos - Departamento de Matemática da FCUP Dia 21 de cada mês
|
Esta coluna lida com matemática elementar e dificilmente poderá haver matemática mais elementar do que a da Estatística, pelo menos ao nível do Ensino Básico e do Ensino Secundário. Os cálculos envolvidos são matematicamente muito simples e, embora seja frequente que o resultado de um estudo estatístico seja surpreendente, a matemática por trás de um tal estudo não pode levar a surpresas, certo? Errado! Há vários paradoxos estatísticos e um deles vai ser descrito aqui, o paradoxo de Simpson.
Em 1934, dois filósofos norte-americanos, Morris Cohen e Ernst Nagel, examinaram um estudo estatístico relativo às mortes causadas pela tuberculose em duas cidades (Richmond e Nova Iorque) em 1910. Constataram o seguinte:
• A proporção de vítimas mortais negras de tuberculose em Richmond (relativamente à população negra total) era inferior à de vítimas mortais negras de tuberculose em Nova Iorque.
• A proporção de vítimas mortais brancas de tuberculose em Richmond era inferior à de vítimas mortais brancas de tuberculose em Nova Iorque.
• No entanto, se se juntassem as vítimas mortais de tuberculose negras e brancas, então a proporção de vítimas mortais em Richmond era superior à de Nova Iorque!
Custa a acreditar que isto possa acontecer. Comecemos por ver matematicamente de que é que se está a falar. Considerem-se os seguintes números:
• a = vítimas mortais negras de tuberculose em Richmond
• b = vítimas mortais negras de tuberculose em Nova Iorque
• c = população negra de Richmond
• d = população negra de Nova Iorque
• e = vítimas mortais brancas de tuberculose em Richmond
• f = vítimas mortais brancas de tuberculose em Nova Iorque
• g = população branca de Richmond
• h = população branca de Nova Iorque
Então afirmar que a proporção de vítimas mortais negras de tuberculose em Richmond é inferior à de vítimas mortais negras de tuberculose em Nova Iorque é afirmar que a/c < b/d e afirmar que a proporção de vítimas mortais brancas de tuberculose em Richmond é inferior à de vítimas mortais brancas de tuberculose em Nova Iorque é afirmar que e/g < f/h. Por outro lado, afirmar que se se juntarem as vítimas mortais de tuberculose negras e brancas, então a proporção de vítimas mortais em Richmond é superior à de Nova Iorque é afirmar que (a+ e)/(c + g) > (b + f)/(d + h). Será que esta inversão da desigualdade pode de facto ocorrer? A resposta é, por estranho que pareça, afirmativa. Basta ver que, por exemplo, 1/5 < 2/8, que 6/8 < 4/5 mas que, no entanto, (1 + 6)/(5 + 8) > (2 + 4)/(8 + 5).
Em 1951, o estatístico britânico Edward H. Simpson chamou a atenção para este paradoxo e foi quem observou a sua relação com a inversão da desigualdade acima mencionada. A existência do paradoxo de Simpson faz com que a interpretação de certos estudos estatísticos seja difícil de fazer. Por exemplo, num estudo que foi feito a dois tratamentos a pedras renais, concluiu-se que um deles era melhor que o outro quer as pedras fossem pequenas quer fossem grandes. No entanto, se se ignorasse a distinção entre pedras pequenas e grandes, então a situação invertia-se! Qual é nesse caso o melhor tratamento?