Cómo no restar números fuzzy

Esta entrada viene motivada por asuntos relacionados que me han sucedido en los últimos tiempos. El primero es un colega que me preguntó sobre si el paro había subido o bajado comparando datos de un par de trimestres.

La respuesta prima facie es evidente: restas las tasas publicadas y ya. Sin embargo, las cosas son un poco más complicadas si se tiene en cuenta que la EPA tiene un error. Es decir, existen infinitas trayectorias posibles entre las tasas de paro reales (pero desconocidas) de los dos trimestres. En térmimos matemáticos, la variación de la tasa de paro es X_1 - X_0, la diferencia de (presuntamente) dos variables aleatorias normales, que es otra variable aleatoria normal con colas que se extienden a ambos lados del cero.

¡La respuesta ya no es tan simple!

Y es todavía aún más compleja por el hecho de que las variables X_0 y X_1 no son independientes. La varianza de la resta es \text{Var}(X_0) + \text{Var}(X_1) - 2 \text{Cov}(X_0, X_1) y la covarianza entre X_0 y X_1 es > 0 por la construcción misma de la encuesta (aunque sea porque en ella se repiten gran parte de los sujetos).

El segundo asunto es este, es decir, un paquete de R para manipular números fuzzy. Traduzco parte de la presentación del paquete:

Los números fuzzy […] juegan un papel destacado en muchas situaciones de importancia teórica y práctica. Frecuentemente describimos nuestro conocimiento a través de números. Por ejemplo, «mido unos 180 cm» o «el cohete fue lanzado entre las 2 y las 3 de la tarde».

De igual manera, podemos decir que la tasa de paro está alrededor del 26%. Así que veamos qué nos pueden ofrecer estos números raros:

library(FuzzyNumbers)

A <- TrapezoidalFuzzyNumber(0, 1, 2, 3)
B <- TrapezoidalFuzzyNumber(1, 2, 3, 3.5)
plot(A, xlim=c(-3,4))
plot(B, add=TRUE, col=2, lty=2)
plot(B-A, add=TRUE, col="green", lty=4)

En el código anterior he creado dos números fuzzy trapezoidales. Luego los he restado y la salida es otro número trapezoidal. La representación gráfica de los tres es (con la diferencia en verde):

fuzzy_difference

Lo cual, si se me permite, es una chapuza. No sé de dónde ha salido esa teoría fuzzy y si quienes tuvieron la desvergüenza de ponerla en negro sobre blanco habían oído hablar del concepto de distribución de probabilidad. Malo es reinventar la rueda, pero peor es reinventarla cuadrada, ¿no? En particular:

  • ¿por qué no estarán los números fuzzy con integral igual a 1 como sería razonable?
  • ¿existirá en la teoría fuzzy el concepto de correlación?
  • ¿la inventarán algún día y publicarán artículos fuzzy como si fuesen algo novísimo?

Hummm…