Coeficiente de correlação de posição do Spearman
Em matemática e estatística, o coeficiente de correlação de classificação de Spearman é uma medida de correlação, com o nome do seu criador, Charles Spearman. . É um número que mostra quão estreitamente dois conjuntos de dados estão ligados. Só pode ser utilizado para dados que possam ser postos em ordem, tais como o mais alto para o mais baixo.
A fórmula geral para r s {\\i1}} é ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i} {\i1}displaystyle {\i}rho =1-{\i1}cfrac ^{\i}{n(n^{\i}-1}}}} .
Por exemplo, se tiver dados sobre o quão caros são os diferentes computadores, e dados sobre a velocidade dos computadores, poderá ver se estão ligados, e a que distância estão ligados, usando r s {\i1}}displaystyle r_{s}} .
A sua solução
Primeiro passo
Para trabalhar r s {\i1}displaystyle r_{s}} é preciso primeiro classificar cada pedaço de dados. Vamos utilizar o exemplo da introdução dos computadores e a sua velocidade.
Assim, o computador com o preço mais baixo seria de nível 1. O superior a esse seria 2. Depois, sobe até ficar todo classificado. Tem de se fazer isto a ambos os conjuntos de dados.
Preço ($) | R a n k 1 {\an8} Rank_{1}displaystyle Rank_{1} | Velocidade (GHz) | R a n k 2 {\i1}a Rank_{\i1}displaystyle Rank_{\i} | |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Segundo passo
A seguir, temos de encontrar a diferença entre as duas fileiras. Depois, multiplica-se a diferença por si mesma, o que se chama quadratura. A diferença chama-se d {\i1}displaystyle d} , e o número que se obtém quando se quadratura d {\i1}displaystyle d} chama-se d 2 {\i1}displaystyle d^{\i} .
R a n k 1 {\an8} Rank_{1}displaystyle Rank_{1} | R a n k 2 {\i1}a Rank_{\i1}displaystyle Rank_{\i} | d {\i1}displaystyle d | d 2 d^{\i1}displaystyle d^{\i}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Terceiro passo
Contar a quantidade de dados que temos. Estes dados têm classificações de 1 a 5, por isso temos 5 dados. Este número é chamado de n {\displaystyle n} .
Quarto passo
Finalmente, utilize tudo o que temos trabalhado até agora nesta fórmula: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\i1}{\i1}{\i1}displaystyle r_{\i}=1-{\i1}cfrac ^{\i}{n(n^{\i}-1}}}}{n(n^{\i}-1}}} .
∑ d 2 ^sum d^{2}} significa que tomamos o total de todos os números que estavam na coluna d 2 ^2 ^sum d^{2}} . Isto deve-se ao facto de que ∑ {\i1}displaystyle {\i} significa total.
Assim, ∑ d 2 {\displaystyle d^{2}} é 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1} que é 4. A fórmula diz multiplicá-lo por 6, que é 24.
n ( n 2 - 1 ) {\\i1}estilo de exibição n(n^{2}-1)} é 5 × ( 25 - 1 ) {\i1}estilo de exibição 5\i1 (25-1)} que é 120.
Assim, para descobrir r s {\i1}estilo r_s fazemos simplesmente 1 - 24 120 = 0,8 {\\i1}{\i120}=0,8} .
Por conseguinte, o coeficiente de correlação de classificação do Spearman é de 0,8 para este conjunto de dados.
O que significam os números
r s {\i}} dá sempre uma resposta entre -1 e 1. Os números entre eles são como uma escala, onde -1 é um elo muito forte, 0 não é um elo, e 1 é também um elo muito forte. A diferença entre 1 e -1 é que 1 é uma correlação positiva, e -1 é uma correlação negativa. Um gráfico de dados com um valor r s {\displaystyle r_{s}} de -1 pareceria o gráfico mostrado, excepto a linha e os pontos iriam de cima esquerda para baixo direita.
Por exemplo, para os dados que fizemos acima, r s {\i1} foi 0,8. Isto significa, portanto, que existe uma correlação positiva. Por ser próxima de 1, significa que a ligação é forte entre os dois conjuntos de dados. Portanto, podemos dizer que esses dois conjuntos de dados estão ligados, e sobem juntos. Se fosse -0,8, poderíamos dizer que estava ligado e, à medida que um sobe, o outro desce.
Se dois números forem os mesmos
Por vezes, ao classificar os dados, há dois ou mais números que são os mesmos. Quando isto acontece em r s {\i}}displaystyle r_{s}} , tomamos a média ou a média das fileiras que são as mesmas. Estas são chamadas fileiras empatadas. Para tal, classificamos os números empatados como se não estivessem empatados. Depois, somamos todas as fileiras que eles teriam, e dividimo-las por quantos são. Por exemplo, digamos que estamos a classificar o quão bem diferentes pessoas se saíram num teste ortográfico.
Pontuação do teste | Posição | Posição (com empatado) |
4 | 1 | 1 |
6 | 2 | |
6 | 3 | |
6 | 4 | |
8 | 5 | 5 + 6 2 = 5,5 {\\i1}=5,5 {\i1}=5,5 {\i} |
8 | 6 | 5 + 6 2 = 5,5 {\\i1}=5,5 {\i1}=5,5 {\i} |
Estes números são utilizados exactamente da mesma forma que as classificações normais.
Páginas relacionadas
Perguntas e Respostas
P: Qual é o coeficiente de correlação de grau do Spearman?
R: O coeficiente de correlação de classificação do Spearman é uma medida de correlação que mostra quão intimamente dois conjuntos de dados estão ligados. Ele só pode ser usado para dados que podem ser colocados em ordem, tais como o mais alto para o mais baixo.
P: Quem criou o coeficiente de correlação de classificação do Spearman?
R: Charles Spearman criou o coeficiente de correlação de classificação do Spearman.
P: Como é escrita a fórmula geral para o coeficiente de correlação de grau de Spearman?
R: A fórmula geral para o coeficiente de correlação de Spearman é escrita como ρ = 1 - 6∑d2/n(n2-1).
P: Quando o senhor deve usar o coeficiente de correlação de grau de Spearman?
R: O senhor deve usar o coeficiente de correlação de grau de Spearman quando quiser ver a que ponto dois conjuntos de dados estão ligados e se eles estão ligados de alguma maneira.
P: Com que tipo de dados o senhor trabalha?
R: Funciona com qualquer tipo de dados que possam ser colocados em ordem, tais como o mais alto para o mais baixo.
P: O senhor pode dar um exemplo de como o senhor usaria essa medida?
R: Um exemplo em que o senhor poderia usar essa medida seria se o senhor tivesse dados sobre o preço dos diferentes computadores, e dados sobre a velocidade dos computadores, então o senhor poderia ver se eles estão ligados, e até que ponto eles estão ligados usando r_s.