Erro padrão
O erro padrão é o desvio padrão da distribuição da amostragem de uma estatística. O termo também pode ser usado para uma estimativa (bom palpite) desse desvio padrão retirado de uma amostra de todo o grupo.
A média de alguma parte de um grupo (chamada amostra) é a forma usual de estimar a média para o grupo inteiro. Muitas vezes é muito difícil ou custa muito dinheiro para medir o grupo inteiro. Mas se uma amostra diferente for medida, ela terá uma média que é um pouco diferente da primeira amostra. O erro padrão da média é uma maneira de saber quão próxima a média da amostra está da média de todo o grupo. É uma maneira de saber o quão certo você pode estar sobre a média da amostra.
Em medições reais, o valor real do desvio padrão da média para todo o grupo geralmente não é conhecido. Portanto, o termo erro padrão é freqüentemente usado para significar um palpite próximo ao número verdadeiro para todo o grupo. Quanto mais medições houver em uma amostra, mais próximo o palpite estará do número verdadeiro para o grupo inteiro.
Para um valor que é amostrado com um erro distribuído normalmente imparcial, o acima retrata a proporção de amostras que cairia entre 0, 1, 2, e 3 desvios padrão acima e abaixo do valor real.
Como encontrar o erro padrão da média
Uma maneira de encontrar o erro padrão da média é ter muitas amostras. Primeiro, é encontrada a média para cada amostra. Em seguida, é encontrada a média e o desvio padrão dessas médias de amostra. O desvio padrão para todas as médias das amostras é o erro padrão da média. Isto pode ser muito trabalho. Às vezes é muito difícil ou custa muito dinheiro ter muitas amostras.
Outra maneira de encontrar o erro padrão da média é usar uma equação que necessita apenas de uma amostra. O erro padrão da média é normalmente estimado pelo desvio padrão de uma amostra de todo o grupo (desvio padrão da amostra) dividido pela raiz quadrada do tamanho da amostra.
S S E x ¯ = s n {\i1}s n {\i1}splaystyle SE_{\i}{\i} ={\i}{\i}{\i1}sqrt {\i}{n}}}}
onde
s é o desvio padrão da amostra (ou seja, a estimativa baseada na amostra do desvio padrão da população), e
n é o número de medidas na amostra.
Qual é o tamanho da amostra para que a estimativa do erro padrão da média esteja próxima do erro padrão real da média para todo o grupo? Deve haver pelo menos seis medições em uma amostra. Então o erro padrão da média para a amostra estará dentro de 5% do erro padrão da média se todo o grupo tiver sido medido.
Correções para alguns casos
Há outra equação a ser usada se o número de medidas for de 5% ou mais de todo o grupo:
Há equações especiais a serem usadas se uma amostra tiver menos de 20 medidas.
Às vezes uma amostra vem de um lugar mesmo que o grupo inteiro possa estar espalhado. Além disso, às vezes uma amostra pode ser feita em um curto período de tempo quando todo o grupo cobre um tempo maior. Neste caso, os números na amostra não são independentes. Então, são usadas equações especiais para tentar corrigir isso.
Utilidade
Um resultado prático: Pode-se ter mais certeza de um valor médio ao ter mais medições em uma amostra. Então o erro padrão da média será menor porque o desvio padrão é dividido por um número maior. Entretanto, para que a incerteza (erro padrão da média) em um valor médio seja metade do tamanho, o tamanho da amostra (n) precisa ser quatro vezes maior. Isto ocorre porque o desvio padrão é dividido pela raiz quadrada do tamanho da amostra. Para que a incerteza seja um décimo do tamanho, o tamanho da amostra (n) precisa ser cem vezes maior!
Os erros padrão são fáceis de calcular e são muito utilizados porque:
- Se o erro padrão de várias quantidades individuais for conhecido, então o erro padrão de alguma função das quantidades pode ser facilmente calculado em muitos casos;
- Quando a distribuição de probabilidade do valor é conhecida, ela pode ser usada para calcular uma boa aproximação a um intervalo exato de confiança; e
- Quando a distribuição de probabilidade não é conhecida, outras equações podem ser usadas para estimar um intervalo de confiança
- Como o tamanho da amostra fica muito grande, o princípio do teorema do limite central mostra que os números da amostra são muito parecidos com os números do grupo inteiro (eles têm uma distribuição normal).
Erro padrão relativo
O erro padrão relativo (RSE) é o erro padrão dividido pela média. Este número é menor do que um. Multiplicando-o por 100%, ele é dado como uma porcentagem da média. Isto ajuda a mostrar se a incerteza é importante ou não. Por exemplo, considere duas pesquisas da renda familiar que ambas resultam em uma média amostral de 50.000 dólares. Se uma pesquisa tem um erro padrão de $10.000 e a outra tem um erro padrão de $5.000, então os erros padrão relativos são de 20% e 10% respectivamente. A pesquisa com o menor erro padrão relativo é melhor porque tem uma medida mais precisa (a incerteza é menor).
De fato, as pessoas que precisam conhecer os valores médios muitas vezes decidem quão pequena deve ser a incerteza antes de decidir utilizar as informações. Por exemplo, o Centro Nacional de Estatísticas de Saúde dos EUA não informa uma média se o erro padrão relativo exceder 30%. O NCHS também exige pelo menos 30 observações para que uma estimativa seja relatada. []
Exemplo
Por exemplo, há muitos cantarilhos na água do Golfo do México. Para saber quanto pesa em média um cantarilho de 42 cm de comprimento, não é possível medir todos os cantarilhos que têm 42 cm de comprimento. Ao invés disso, é possível medir alguns deles. Os peixes que são realmente medidos são chamados de amostra. A tabela mostra os pesos de duas amostras de cantarilho, todos com 42 cm de comprimento. O peso médio (médio) da primeira amostra é de 0,741 kg. O peso médio (médio) da segunda amostra é de 0,735 kg, um pouco diferente do da primeira amostra. Cada uma destas médias é um pouco diferente da média que viria da medição a cada 42 cm de comprimento dos cantarilhos (o que não é possível de qualquer forma).
A incerteza na média pode ser usada para saber quão próxima a média das amostras está da média que viria da medição de todo o grupo. A incerteza na média é estimada como o desvio padrão para a amostra, dividido pela raiz quadrada do número de amostras menos uma. A tabela mostra que as incertezas na média para as duas amostras estão muito próximas uma da outra. Além disso, a incerteza relativa é a incerteza na média dividida pela média, vezes 100%. A incerteza relativa neste exemplo é de 2,38% e 2,50% para as duas amostras.
Conhecendo a incerteza na média, pode-se saber quão próxima a média da amostra está da média que viria da medição de todo o grupo. A média para todo o grupo está entre a) a média para a amostra mais a incerteza na média, e b) a média para a amostra menos a incerteza na média. Neste exemplo, o peso médio para todos os cantarilhos de 42 cm de comprimento no Golfo do México deve ser de 0,723-0,759 kg com base na primeira amostra, e 0,717-0,753 com base na segunda amostra.
Exemplo de um cantarilho (também conhecido como tambor vermelho, Sciaenops ocellatus) utilizado no exemplo.
Perguntas e Respostas
P: O que é o erro padrão?
R: O erro padrão é o desvio padrão da distribuição de amostragem de uma estatística.
P: O termo erro padrão pode ser usado para uma estimativa do desvio padrão?
R: Sim, o termo erro padrão pode ser usado para uma estimativa (bom palpite) desse desvio padrão obtido de uma amostra de todo o grupo.
P: Como é possível estimar a média de um grupo inteiro?
R: A média de alguma parte de um grupo (chamada de amostra) é a maneira usual de estimar a média de todo o grupo.
P: Por que é difícil medir o grupo inteiro?
R: Geralmente é muito difícil ou muito caro medir o grupo inteiro.
P: O que é o erro padrão da média e o que ele determina?
R: O erro padrão da média é uma forma de saber o quão próxima a média da amostra está da média do grupo inteiro. É uma forma de saber o quanto o senhor pode ter certeza sobre a média da amostra.
P: O valor real do desvio padrão da média é normalmente conhecido em medições reais?
R: Não, o valor real do desvio padrão da média para todo o grupo geralmente não é conhecido em medições reais.
P: Como o número de medições em uma amostra afeta a precisão da estimativa?
R: Quanto mais medições houver em uma amostra, mais próximo o palpite estará do número verdadeiro para todo o grupo.