O paradoxo de Simpson
O paradoxo de Simpson é um paradoxo das estatísticas. Tem o nome de Edward H. Simpson, um estatístico britânico que o descreveu pela primeira vez em 1951. O estatístico Karl Pearson descreveu um efeito muito semelhante em 1899. - A descrição de Udny Yule data de 1903. Algumas vezes, é chamado de efeito Yule-Simpson. Ao observar as pontuações estatísticas dos grupos, estas pontuações podem mudar, dependendo se os grupos são observados um a um, ou se são combinados em um grupo maior. Este caso ocorre freqüentemente em ciências sociais e estatísticas médicas. Pode confundir as pessoas, se os dados de freqüência forem usados para explicar uma relação causal. Outros nomes para o paradoxo incluem paradoxo de reversão e paradoxo de amálgama.
Exemplo: Tratamento de pedra nos rins
Este é um exemplo da vida real de um estudo médico comparando as taxas de sucesso de dois tratamentos para pedras nos rins.
A tabela mostra as taxas de sucesso e o número de tratamentos que envolvem tanto pedras nos rins pequenos quanto grandes, onde o Tratamento A inclui todos os procedimentos abertos e o Tratamento B é a nefrolitotomia percutânea:
Tratamento A | Tratamento B | |||
sucesso | falha | sucesso | falha | |
Pedras Pequenas | Grupo 1 | Grupo 2 | ||
número de pacientes | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Pedras Grandes | Grupo 3 | Grupo 4 | ||
número de pacientes | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Ambos | Grupo 1+3 | Grupo 2+4 | ||
número de pacientes | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
A conclusão paradoxal é que o tratamento A é mais eficaz quando usado em pedras pequenas, e também quando usado em pedras grandes, mas o tratamento B é mais eficaz quando se consideram os dois tamanhos ao mesmo tempo. Neste exemplo, não se sabia que o tamanho da pedra do rim influenciou o resultado. Isto é chamado de variável oculta (ou variável de espreita) nas estatísticas.
Qual tratamento é considerado melhor é determinado por uma desigualdade entre duas proporções (sucessos/total). A inversão da desigualdade entre as proporções, que cria o paradoxo de Simpson, acontece porque dois efeitos ocorrem juntos:
- Os tamanhos dos grupos, que são combinados quando a variável de espreita é ignorada, são muito diferentes. Os médicos tendem a dar aos casos graves (pedras grandes) o melhor tratamento (A), e aos casos mais leves (pedras pequenas) o tratamento inferior (B). Portanto, os totais são dominados pelos grupos três e dois, e não pelos dois grupos muito menores um e quatro.
- A variável à espreita tem um grande efeito sobre as proporções, ou seja, a taxa de sucesso é mais fortemente influenciada pela gravidade do caso do que pela escolha do tratamento. Portanto, o grupo de pacientes com pedras grandes usando o tratamento A (grupo três) faz pior do que o grupo com pedras pequenas, mesmo que este último tenha usado o tratamento inferior B (grupo dois).