correlación significa una similitud o relación entre dos cosas, personas o ideas. Es una similitud o equivalencia que existe entre dos hipótesis, situaciones u objetos diferentes.
En el campo de la estadística y las matemáticas, la correlación se refiere a una medida entre dos o más variables que están relacionadas.
El término correlación es un sustantivo femenino que proviene del latín correlación.
La palabra correlación se puede reemplazar por sinónimos como: relación, equivalencia, nexo, correspondencia, analogía y conexión.
Coeficiente de correlación
En estadística el Coeficiente de correlación de Pearson (r), que también se denomina coeficiente de correlación producto-momento, mide la relación que existe entre dos variables dentro de la misma escala métrica.
La función del coeficiente de correlación es determinar la fuerza de la relación que existe entre conjuntos de datos o información conocidos.
El valor del coeficiente de correlación puede variar entre -1 y 1 y el resultado obtenido define si la correlación es negativa o positiva.
Para interpretar el coeficiente, es necesario saber que 1 significa que la correlación entre las variables es perfecto positivo y -1 significa que es perfecto negativo. Si el coeficiente es igual a 0 significa que las variables no dependen unas de otras.
En estadística también existe la Coeficiente de correlación de Spearman, llamado así por el estadístico Charles Spearman. La función de este coeficiente es medir la intensidad de la relación entre dos variables, sean lineales o no.
La correlación de Spearman sirve para evaluar si la intensidad de la relación entre las dos variables analizadas puede medirse mediante una función monótona (función matemática que conserva o invierte la relación de orden inicial).
Cálculo del coeficiente de correlación de Pearson
Método 1) Cálculo del coeficiente de correlación de Pearson mediante covarianza y desviación estándar.

Dónde
sXYes la covarianza;
sX y syrepresentan la desviación estándar, respectivamente, de las variables xey.
En este caso, el cálculo pasa por encontrar primero la covarianza entre las variables y la desviación estándar de cada una de ellas. Luego, divida la covarianza multiplicando las desviaciones estándar.
A menudo, el enunciado ya proporciona las desviaciones estándar de las variables o la covarianza entre ellas, simplemente aplicando la fórmula.
Método 2) Cálculo del coeficiente de correlación de Pearson con datos brutos (sin covarianza ni desviación estándar).
Con este método, la fórmula más directa es la siguiente:

Por ejemplo, asumiendo que tenemos datos con n = 6 observaciones de dos variables: nivel de glucosa (y) y edad (x), el cálculo sigue estos pasos:
Paso 1) Construya la tabla con los datos existentes: i, x, y, y agregue columnas en blanco para xy, x² e y²:

Paso 2: Multiplica xey para llenar la columna "xy". Por ejemplo, en la línea 1 tendremos: x1y1 = 43 × 99 = 4257.

Paso 3: Eleve al cuadrado los valores de la columna x y registre los resultados en la columna x². Por ejemplo, en la primera línea tendremos x12 = 43 × 43 = 1849.

Paso 4: Haga lo mismo que en el Paso 3, ahora usando la columna y y registre el cuadrado de sus valores en la columna y². Por ejemplo, en la primera línea tendremos: y12 = 99 × 99 = 9801.

Paso 5: Obtenga la suma de todos los números de columna y coloque el resultado en el pie de página de la columna. Por ejemplo, la suma de la columna Edad X es igual a 43 + 21 + 25 + 42 + 57 + 59 = 247.

Paso 6: Utilice la fórmula anterior para obtener el coeficiente de correlación:

Entonces tenemos:

Cálculo del coeficiente de correlación de Spearman
El cálculo del coeficiente de correlación de Spearman es un poco diferente. Para eso, necesitamos organizar nuestros datos en la siguiente tabla:

1. Teniendo en el enunciado 2 pares de datos, debemos introducirlos en la tabla. Por ejemplo:

2. En la columna "Ranking A", ordenaremos las observaciones que están en "Fecha A" de forma ascendente, siendo "1" el valor más bajo en la columna y n (número total de observaciones) el valor más alto en la columna "Fecha" LA". En nuestro ejemplo es:

3. Hacemos lo mismo para obtener la columna "Ranking B", usando ahora las observaciones en la columna "Datos B":

4. En la columna “d” ponemos la diferencia entre los dos Rankings (A - B). Aquí la señal no importa.

5. Eleve al cuadrado cada uno de los valores de la columna "d" y anote en la columna d²:

6. Suma todos los datos de la columna "d²". Este valor es Σd². En nuestro ejemplo Σd² = 0 + 1 + 0 + 1 = 2
7. Ahora usamos la fórmula de Spearman:

En nuestro caso, n es igual a 4, ya que observamos el número de líneas de datos (que corresponde al número de observaciones).
8. Finalmente, reemplazamos los datos en la fórmula anterior:

regresión lineal
La regresión lineal es una fórmula que se utiliza para estimar el posible valor de una variable (y) cuando se conocen los valores de otras variables (x). El valor de "x" es la variable independiente o explicativa e "y" es la variable dependiente o respuesta.
La regresión lineal se utiliza para ver cómo el valor de "y" puede variar en función de la variable "x". La línea que contiene los valores de verificación de la varianza se denomina línea de regresión lineal.
Si la variable explicativa "x" tiene un solo valor, la regresión se llamará Regresión lineal simple.
