Saltar al contenido
C

Correlación y regresión

La correlación es una medida estadística que indica la relación existente entre dos variables. Puede ser positiva, negativa o nula.

Por ejemplo, si una variable aumenta cuando la otra aumenta, se dice que hay una correlación positiva; si una variable aumenta cuando la otra disminuye, se dice que hay una correlación negativa.

La regresión, por otro lado, es una técnica estadística que se utiliza para estimar el valor esperado de una variable dependiente a partir de uno o varios valores de una variable independiente.

Es decir, la regresión busca encontrar la relación entre variables y utilizarla para hacer predicciones sobre una variable en función de otra.

En resumen, La Correlación se usa para medir la relación entre dos variables y la Regresión se usa para hacer predicciones sobre una variable en función de otra.

CorrelaciónRegresión
Mide la relación entre dos variablesEstima el valor esperado de una variable dependiente a partir de uno o varios valores de una variable independiente
Puede ser positiva, negativa o nulaBusca encontrar la relación entre variables y utilizarla para hacer predicciones
No implica una relación causa-efectoImplica una relación causa-efecto
No se utiliza para hacer prediccionesSe utiliza para hacer predicciones
Se calcula mediante la función de correlaciónSe calcula mediante un modelo de regresión

Ejemplos de correlación

  • La edad y la cantidad de ahorros: puede haber una correlación positiva entre estas dos variables, es decir, a medida que una persona envejece, suele tener más ahorros.
  • La temperatura y el consumo de helado: Puede haber una correlación positiva entre estas dos variables, es decir, a medida que aumenta la temperatura, suele aumentar el consumo de helado.
  • El tiempo de estudio y el rendimiento académico: Puede haber una correlación positiva entre estas dos variables, es decir, a medida que un estudiante dedica más tiempo al estudio, su rendimiento académico suele mejorar.
  • La cantidad de tiempo dedicado a ver televisión y el rendimiento académico: Puede haber una correlación negativa entre estas dos variables, es decir, a medida que un estudiante dedica más tiempo a ver televisión, su rendimiento académico suele disminuir.
  • El consumo de alcohol y la capacidad de conducir: Puede haber una correlación negativa entre estas dos variables, es decir, a medida que una persona consume más alcohol, su capacidad para conducir suele disminuir.

Es importante mencionar que la correlación no implica causación, por lo que no se puede inferir que una variable está causando el comportamiento de la otra, solo que existe una relación entre ellas.

Ejemplos de regresión

  • Estimar el precio de una casa en función del tamaño de la casa, el número de habitaciones y la ubicación.
  • Estimar el rendimiento académico de un estudiante en función de las horas de estudio y el nivel socioeconómico.
  • Estimar la cantidad de ventas de un producto en función del precio del producto y la publicidad.
  • Estimar la duración de un vuelo en función de la distancia entre dos ciudades y la velocidad media del avión.
  • Estimar la demanda de un producto en función de la economía y el precio del producto.

En estos ejemplos se busca encontrar una relación entre las variables independientes y la variable dependiente para poder hacer predicciones sobre esta última en función de las primeras.

Es importante mencionar que existen diferentes tipos de regresión como la regresión lineal, polinómica, logística, entre otras, cada una de ellas se aplica a un tipo específico de relación entre las variables.