terça-feira, 20 de novembro de 2012

Medidas de correlação com o Microsoft Excel


Excel fornece funções estatísticas úteis para a medição de correlação entre duas variáveis. Como um lembrete, o benefício de usar um coeficiente de correlação para medir a relação entre duas variáveis, em oposição ao uso de covariância é que a unidade de medida não importa.

Mas uma advertência: Lembre-se que a correlação não mostrar causalidade. Ou seja, você pode facilmente mostrar que, como o número de cones de sorvete consumida aumenta durante um ano, o mesmo acontece com o número de afogamentos. Mas isso não significa que comer sorvete leva as pessoas a afogar-mais provavelmente, estas variáveis ​​são tanto de forma independente relacionada a outra variável, que de temperaturas. Correlação é simétrica, de modo a obter o mesmo coeficiente, se você mudar as variáveis. Não calcular um coeficiente de correlação se manipulado uma das variáveis. Use regressão linear em vez disso.

CORREL

Você usa a função CORREL no Excel para determinar se dois conjuntos de dados estão relacionados, e em caso afirmativo, como fortemente. O coeficiente de correlação varia de 1, indicando uma relação positiva perfeita linear, para -1, indicando uma relação perfeitamente linear negativo. Para calcular um coeficiente de correlação de uma amostra, o Excel usa a covariância das amostras e os desvios-padrão de cada amostra. Para usar a função CORREL no Excel, basta selecionar os dois conjuntos de dados para usar como argumentos e usar a seguinte sintaxe:

= CORREL (conjunto de dados 1, conjunto de dados 2)

Por exemplo, se você tem um conjunto de resultados de testes preliminares para uma amostra de funcionários na coluna
A e um conjunto de pontuações de desempenho de feedback da coluna B, como mostrado na Figura 4-6, e
você quer descobrir se eles estão relacionados e se sim, como força, você pode usar o Excel para
encontrar o coeficiente de correlação para as amostras.

A função retorna o valor de 0,87, indicando que os conjuntos estão positivamente relacionados (como o valor
de um sobe, o valor das outras também aumenta), mas a relação não é perfeito.

PEARSON

O produto Pearson função coeficiente de correlação momento, PEARSON, usa um diferente
equação para calcular o coeficiente de correlação. Esta fórmula não requer o
cálculo de cada desvio da média. Ainda assim, o coeficiente de correlação varia desde
1, indicando uma relação positiva perfeita linear, para -1, indicando uma perfeitamente linear negativa
relação. A função PEARSON usa a seguinte sintaxe:

= PEARSON (conjunto de dados 1, conjunto de dados 2)

Usando a função PEARSON sobre os dados mostrados na Figura 4-6 para calcular o coeficiente de correlação retorna o mesmo valor que a função CORREL faz.

RSQ

A função RSQ calcula o quadrado do coeficiente de correlação de Pearson através de pontos de dados em conjuntos de dados. É possível interpretar o valor de R-quadrado como a proporção da variância de y atribuível à variação em x. A função RSQ usa a seguinte sintaxe:
= RSQ (conjunto de dados 1, conjunto de dados 2)...

Nenhum comentário:

Postar um comentário