La inesperada correlación de los ratios

Tomemos dos variables aleatorias independientes y positivas,

No tengo ni que decir que su correlación es prácticamente cero,

y que en su diagrama de dispersión tampoco vamos a poder leer otra cosa:

Ahora generamos otra variable independiente de las anteriores,

y calculamos el cociente de las primeras con respecto a esta:

¿Independientes? Hummmm…

Parece que no. Porque valores grandes del cociente aplastan a la vez a los valores de x e y y a la inversa. La correlación entre las nuevas variables crece con la del denominador, de hecho.

Así que ¡cuidado al dividir!

Nota: Lo aquí publicado es casi, casi, casi una traducción de esto.

4 comentarios sobre “La inesperada correlación de los ratios

  1. Sergio 9 Febrero, 2017 10:42

    No me parece un resultado tan sorprendente. De hecho ambas variables xz, yz dependen una misma única variable z. El mismo aumento de correlación ocurre si sumas o multiplicas por z .

  2. Sergio 9 Febrero, 2017 13:18

    Retiro el comentario anterior. Dividir es más perverso ya que es algo que se hace habitualmente con series de datos para normalizarlas o hacerlas corresponder a un escala determinada

  3. rvaquerizo 9 Febrero, 2017 14:30

    Mucho más perverso:

    set.seed(123)
    n <- 100
    x <- (runif(n) + 0.5)*100
    y <- (runif(n) + 0.5)*100
    cor(x,y)

    z <- (runif(n) + 0.5)*100

    xz <- x / z
    yz <- y / z

    xz <- x / z
    yz <- y / z
    cor(xz, yz)
    plot(xz, yz)

  4. rvaquerizo 9 Febrero, 2017 14:34

    Perdón me he equivocado en el copia pega:

    set.seed(123)
    n <- 100
    x <- (runif(n) + 0.5)*100
    y <- (runif(n) + 0.5)*100

    x <- sqrt(x)
    y <- sqrt(y)
    cor(x,y)

    z <- (runif(n) + 0.5)*100

    xz <- x / z
    yz <- y / z

    xz <- x / z
    yz <- y / z

    cor(xz, yz)

    plot(xz, yz)

Comenta

Your email address will not be published.

Puedes usar estas etiquetas y atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">