|
Archivo
Entradas Etiquetadas ‘números’
Las leyes son un carajal. Últimamente he tenido que enfrentarme a algunas y me doy cuenta de que es un error que los abogados (y los legisladores) no hayan seguido nunca un buen curso de geometría euclídea.
Pongo un ejemplo. La Constitución Española (artículo 22) dice que las asociaciones deberán inscribirse en un registro a los solos efectos de publicidad. Pues bien, parece ser que una asociación, y nos ocurrió con la Comunidad R Hispano no es legal (para poder abrir una cuenta corriente, por ejemplo) de no inscribirse en el registro. ¿Pero no era a los solos efectos de publicidad? ¿Son lo mismo publicidad y legalidad?
En fin.
Hoy me toca volver a hablar de leyes y de cómo afectan a la labor estadística. En particular, a los estadísicos que nos movemos (en términos amplios) por libre los que usamos software libre y a los que nos encantan los datos libres. A los que nos gusta poder enriquecernos de las aportaciones de otros libremente y ponemos también libremente al servicio de la comunidad las propias.
Desde el punto de vista del software, disponemos de R. Podemos acceder a él y podemos reutilizarlo, copiarlo, cederlo, regalarlo. También cedemos, distribuimos y permitimos que otros reutilicen nuestras propias aportaciones. Acceso y reutilización son dos caras de la misma moneda.
¿Y respecto a los datos? Y en particular, ¿de los datos públicos? En España, está regulada por ley su redistribución (otra cosa es que los organismos titulares de dichos datos, como el INE, no estén al corriente de ella). Y ¿el acceso (que se supone que debería ser, en pura lógica, previo)? Pues hubo un borrador, del que hablé en otra ocasión, y que los avatares electorales convirtieron en papel mojado.

Pero ahora el gobierno ha sacado definitivamente a la luz (desde las cinco de la tarde de ayer) un nuevo borrador de la Ley de Transparencia con la particularidad adicional de que ha puesto a disposición de la ciudadanía un portal para que esta pueda realizar alegaciones y propuestas de mejora.
Por eso, desde estas páginas, quiero invitar a aquellos interesados en los datos públicos y en garantizar el acceso a los datos públicos tanto para él como para las generaciones posteriores, que lean el borrador, evalúen en qué medida salvaguardan su derecho de acceso a esos ficheros csv tan jugosos estadísticamente y que, de observar cualquier indicio de mejora, hablen ahora o callen para siempre (y no den el coñazo, con perdón, después).
Nota: el día 26 acudí al acto de inauguración del portal tuderechoasaber.es que facilita a los ciudadanos la solicitud de información al amparo de esta ley en ciernes. Invito a los lectores de esta bitácora a visitarlo y aprovecharlo y, a la vez, quiero felicitar (y a la vez agradecer) a David Cabo (@dcabo) y el resto del equipo que ha puesto en marcha dicho proyecto por su capacidad de iniciativa, trabajo y vocación de servicio público.
Llegó a mis manos el otro día un artículo sobre el reciente Mobile World Congress de BCN y en particular, sobre la significativa presencia de empresas de Israel en el mismo.
Y llegó a mis manos no tanto por el interés de quien me lo remitió por los teléfonos móviles o los arcanos del Talmud sino por el siguiente párrafo, en el que, entiendo, quiso ver algún quid (el subrayado está en el artículo):
Israel tiene una población próxima a la de Cataluña o Madrid. Invierte cerca del 5% en 2011 en i+D+I, más del doble que en España [...]
Esta afirmación, cierta, puede quererse utilizar prima facie para justificar el retraso tecnológico español frente a nuestro liliputesco vecino de enfrente, para significar algo así como: si España duplicase el gasto en I+D+i, nuestras empresas serían el no va más.
Pero bueno, habida cuenta de que el PIB español es de 1413 millardos de dólares y la inversión en I+D es del 1.35 %, la cantidad asignada a tal concepto es de 19000 millones de dólares. Y el 5 % del PIB de Israel son 11000 millones de dólares.
Quiere eso decir que, gastado con los mismos criterios que Israel, podríamos tener el mismo número de empresas igualmente punteras y devolver todavía 8000 millones de dólares a la Hacienda nacional para reducir el déficit. Incluso tendríamos, por añadidura, algún que otro premio Nobel de vez en cuando.
Obviamente no ocurre así. Y se puede escribir mucho acerca de los motivos. De hecho, no falta un catedrático de nosequé o un investigador de nosedónde que plaña periodicamente en prensa sobre el asunto. Y como es gente que sabe mucho de lo que habla, no quiero enmendarle la plana en lo macro.
Pero de lo micro, o más bien, de mi visión micro, de mi sesgada e insuficiente visión micro, sí que puedo escribir cuatro renglones.
De los recursos de I+D+i que fluyen a través de la universidad e instituciones similares, sé poco y dejo a otros que se expliquen. Pero he tropezado en alguna ocasión con esos fondos que bajo distintas denominaciones, concede el gobierno e instituciones públicas a empresas para que investiguen, desarrollen productos y lleven el pabellón rojigualda a las ferias de medio mundo.
- Así, conocí de primera mano el caso de una empresa que solía (y no sé si suele) obtener sus 100000 o 200000 euros anuales con proyectos PROFIT de diversa naturaleza. Recuerdo el de un año: consitía en una herramienta para la predicción de precios del suelo (¡era la época feliz!) que nunca vi usado para ningún fin —que no fuese el de redactar la memoria justificativa, claro está— ni generó ningún proyecto o servicio que no se agotase en el fin mismo de cobrar la subvención. Y poco más o menos con los otros.
- Un antiguo colega me llamó un día. Iba a lanzar una empresa con cierto personaje. Querían radicarla en Navarra. Dizque este individuo tenía buena relación con nosequé instituciones de allí y que sería fácil obtener subvenciones. ¿Para qué? Tanto da. Me podían haber dicho algo así como: “tenemos una idea cojonuda y estamos casi seguros de que vamos a conseguir financiación para desarrollarla; luego, ¡ya verás!” Pero no. La cuestión es que había acceso a la pasta y luego se vería bajo qué pretexto se ordeñaría la vaca pública.
- También trabajé en una empresa en el desarrollo de cierto producto. Realmente, lo que tenía de I+D era software libre desarrollado por algún tercero que, seguramente, ignoraba que en las antípodas usábamos sus ideas para ganar algún dinerillo. Pero estaba bien. Molón. Pues oí cierto tiempo después que estaban preparando una versión descafeinada (es decir, eliminando funcionalidad) de esa herramienta para crear otra (¡un rutilante nuevo producto!) cuyo única razón de ser era optar a las ayudas de nosequé organismo.
Me he entretenido en revisar, por ejemplo, las subvenciones concedidas dentro de la convocatoria 2006 del plan PROFIT para identificar algún producto, alguna idea, que al cabo de 6 años hubiese fructificado en productos o servicios estupendos. Y no he conseguido identificar, realmente, ninguno. Aunque pueda deberse a mi incompetencia, claro está.
En cualquier caso, hay algo que chirría. Mucho. Y los plañideros deberían llorar menos y explicarse más. Creo.
Me he entretenido en los últimos tiempos tratando de responder una pregunta que, sin inquietarme, no dejaba de despertar mi curiosidad.
En la escuela nos enseñaron a definir palabras. Una de las primeras reglas de aquel juego era que el término definido no podía usarse en la definición: casa no se puede utilizar para definir casa. Los niños lo entendíamos. Sin embargo, los mayores hacían trampa: en el DRAE, construir se define en términos de edificar y edificar, en términos de construir.
Efectivamente, cójase el diccionario. El DRAE, por antonomasia. Búsquese una palabra. Cualquiera. En su definición aparecen otras. Búsquense estas a su vez. Y continúese recursivamente. Pueden pasar dos cosas:
- Volver a tropezar con la palabra original.
- No volver nunca a tropezar con ella.
Supongo que esas palabras que aparecen en los ciclos tienen una importancia léxica distinta de las del resto. Uno podría llamarlas palabras axiomáticas, palabras cuyo significado debería conocer el hablante antes de consultar la herramienta que define, es decir, el diccionario.
Quizás uno pueda contemplar la dicusión anterior de manera euclídea. Cada definición vendría a ser un teorema de la geometría euclidiana. La demostración de un teorema puede remitir a otros teoremas previos. Pero no indefinidamente: existen cinco postulados que se dan por buenos sin demostración, que se suponen ciertos de antemano.
Igualmente, en el diccionario, uno podría preguntarse cuáles son esos términos que se supone debieran darse por sabidos y que un diccionario euclídeo debiera abstenerse de definir. O, al menos, marcar explícitamente como tales.
Para conseguir mi objetivo he hecho lo siguiente:
- Descargar la lista de palabras definidas en el DRAE, disponibles aquí y aquí.
- Consultar (programáticamente, por supuesto) en el DRAE cada una de ellas.
- Buscar la raíz de los términos que aparecen en la definición usando mi lematizador.
- Crear una tabla con tres columnas:
- lema
- raíz del término que aparece en la definición
- número de veces que aparece en la definición
Luego he analizado este conjunto de datos utilizando métodos de análisis de redes sociales. En efecto, considero que las palabras del diccionario, unas 88000, forman una red social en la que A es amiga de B si A aparece en la definición de B.
Y eso me permite responder una serie de preguntas. Por ejemplo, ¿cuántas palabras carecen de amigos? Es decir, ¿cuántas no aparecen en la definición de ninguna otra? Pues de las 87654 palabras del DRAE, son, exactamente, 51506, es decir, un 58.76 %. Incluyen desde a-, aarónico, aaronita, aba, ababa y ababillarse hasta zurumbo, zurupeto, zutanejo, zutuhil, zuzar y zuzo.
Las restantes 36148 palabras se usan en las definiciones de otras y van desde a, ababol, abacá, abacal, abacería, y ábaco hasta zurribanda, zurriburri, zurrón, zutano, zutujil y zuzón.
El siguiente paso del análisis consiste en eliminar aquellos términos que sólo entran en la definición de términos sin amigos o, recursivamente, en la definición de términos eliminados en el paso anterior. Por ejemplo, si A es un término sin amigos y B es un término que se usa en la definición de A y no en ningún otro, lo filtraría en este paso. Tras este filtrado, quedan 24683 términos, un 28.15 % de los términos originales. Seguro que Euclides pensaría que demasiados.
Los 11465 términos que se caen van desde ababol, abacal, abada, abajar, abakuá y aballar hasta zurriago, zurribanda, zurriburri, zutano, zutujil y zuzón. Encuentro en la lista términos como tridimensional, tropecientos, sobreexplotar, rutherfordio, presuntamente y perversión junto a otros como zangolotear, podrigorio, segueta, tolmera o tósigo, de cuya existencia a cabo de tener noticia.
De entre los restantes 24683 términos encontramos dos tipos. Por un lado, 197 familias aisladas de términos que son amigos entre sí, pero que no son amigos de otros términos. Por ejemplo, forman parte de estas familias parejas como violonchelista y violonchelo o triplas como tabulador, tabuladora y tabular.
Pero existe una familia de términos que comprende 24331 de ellos, un 27.75 % del total, que forma un clúster completo y que se extiende desde a, abacá, abacería, ábaco, abad y abadejo hasta zurdo, zuro, zurra, zurrador, zurrar y zurrón.
Quiero dejar constancia de que mis números son aproximados. Es posible que haya errores y, en efecto, he detectado algunos en el lematizador. Por ejemplo, este ha asignado a “nota” (musical) la raíz “notar” (verbo) en alguna ocasión. Etc.
No obstante, pienso que el número de términos en las definiciones es excesivo. ¿Debería la Academia esforzarse por reducir su número, por tratar de que la lista de palabras axiomáticas fuese más corta? Puede. Según algunos expertos, el número de palabras (en inglés) que utiliza activamente un hablante medio ronda las 20.000 y conoce (pasivamente) unas 40.000. Y estas cifras estarían dentro de los órdenes de magnitud que indico para el DRAE.
¿Cuál será, me pregunto, la opinión de mis lectores?
La otra de las películas que vi durante mis vacaciones en que resonaban ecos estadísticos fue Contagio. Como casi todas las películas, personaliza. Y es que a la gente le gusta ver caras. Así nos cuenta la historia de una rubia, su marido, su hija, etc. Excipiente lacrimógeno.
(Aunque alguien pueda querer ver en la rubia la trasunta de Gaëtan Dugas, el paciente cero; igual que —según algunos— Dugas, es la primera persona en contagiarse de un virus letal y lo transporta a EE.UU., donde se desencadena una epidemia).
Por otro lado, la película hace un buen papel mostrando de una manera bastante fidedigna el mecanismo de los sistemas de control epidemiológico y, en particular —y es lo que viene a cuento en esta bitácora— su “subyacente estadístico”. Tras las bambalinas trabajan estadísticos que analizan registros médicos en busca de evidencia de brotes y epidemias. Esta película tiene un componente documental que hace bastante justicia a su callada labor.
Y se lo merecen. Porque cuando se ha hablado de ellos ha sido, casi siempre, negativamente, cuando se han equivocado. Recuérdense los casos de la gripe aviar (aunque en este caso, aparentemente, se mezclaron intereses más oscuros) y la E. coli de los pepinos españoles. Bramó entonces la piel de toro contra el Instituto de Higiene de Hamburgo, que levantó la alerta y recomendó su retirada.
En esa época habría sido interesante leer el capítulo 2 del libro Numbers Rule your World, de Kaiser Fung, que relata la labor de la Food and Drug Administration (FDA) de los EE.UU. y otros organismos sanitarios en la detección de un foco de E. coli en EE.UU. muy similar al de los pepinos. Describe los mecanismos de recopilación de datos sobre ese tipo de infecciones, cómo se registran continuamente casos aislados y cómo, de vez en cuando, surgen brotes más serios que afectan a muchas personas. Pero, para complicar las cosas, no siempre en una misma ubicación: de tratarse de una partida de comida contaminada, esta puede haberse distribuido por una zona extensa, tal vez un país entero. Y, ¿cómo distinguir los estadios primeros de un brote del ruido de fondo de las infecciones aisladas? ¿Cuánto ha de esperarse? ¿Qué protocolos han de seguirse? ¿Cuál es el coste y el beneficio de levantar una alerta? ¿Qué riesgos existen al equivocarse? Sobre todo, ¿qué presiones existen? El capítulo recorre todos esos asuntos mientras acompaña al lector en un viaje estadístico-detectivesco que lo conduce a una plantación de espinacas en California. ¡Esta vez acertaron!
Es de lectura obligada para que, la próxima vez que algún instituto de control apunte con su dedo acusador a un camión lleno de verdura, podamos ser más ecuánimes.
El segundo aspecto relevante de la película tiene que ver con otro trasunto. Esta vez es Jude Law, que encarna a un bloguero que aprovecha el pánico de la población ante la pandemia para lucrarse divulgando con dolo noticias falsas, curas milagrosas y quién sabe qué.
Evoca el caso de la controversia alrededor de la vacuna triple vírica: en 1998, una de las más prestigiosas revistas médicas, The Lancet, publicó un artículo sobre un posible vínculo causal entre dicha vacuna y el autismo. Se supo después que el autor principal, Andrew Wakefield, tenía intereses ocultos y que había manipulado los datos. Pero aunque el artículo fue retirado, e, incluso, se explusó a Wakefield de la carrera médica, mucha gente dio por bueno el bulo. Y, en efecto, tal y como cuenta la Wikipedia (mi traducción)
Tras la controversia, la tasa de vacunación de la vacuna triple vírica en el Reino Unido descendió del 92% en 1996 al 84% en 2002. En 2006, la tasa de cobertura de la vacuna entre los menores de 2 años era del 85%, mientras que para el resto de las vacunas se situaba alrededor del 94%.
Y, en efecto, esto tuvo sus consecuencias:
[...] la incidencia de las tres enfermedades creció de manera importante en el Reino Unido. Mientras que en 1998 sólo se confirmaron 56 casos de sarampión, en el 2006 hubo 449 durante los primeros cinco meses del año. Además, se registró la primera muerte por dicha causa desde 1992. Los casos afectaron a niños que no se habían vacunado adecuadamente. [...]
Y, bueno, seguro que en todo esto algo de responsabilidad (o irresponsabilidad) tuvieron los medios… ¡pero esa es otra historia a la que, seguro, volveremos!
En fin, que veáis Contagio y que la veáis con los ojos adecuados.
Hacer una colada no es sencillo. Al menos si se tienen en cuenta todas las variables relevantes. En realidad, yo echo la ropa a la lavadora al tuntún y no sé de separar por colores ni por tipo de tela. Va todo junto. Y siempre uso el mismo programa, cantidad de detergente y del otro líquido azul que no sé para qué sirve.
Lo que me preocupa, la variable que con más atención considero, es el impacto ambiental, el consumo de energía. Más específicamente, las emisiones de CO2.
Por eso, siempre, antes de ponerla, echo un vistazo a la única fuente de información de la que dispongo, la página de REE. Por ejemplo, a la hora en que la hice funcionar, la madrugada del domingo, como a las cuatro de la mañana, el consumo de energía eléctrica en España tenía esta pinta:

Es decir, se estaban consumiendo unos 22 GW de energía eléctrica. Además, el porcentaje de energía renovable utilizada era relativamente alto y las emisiones de CO2, bajas:

En efecto, cuando la demanda es baja (y a esas horas de la madrugada, especialmente en domingo, el consumo tiene sus valles), las centrales renovables son capaces de cubrir un porcentaje mayor de ella y las contaminantes, las que queman carbón o gas, trabajan a medio ídem.
Dicho lo cual, añado que el mercado eléctrico español es un quilombo. Llevo desde siempre dedicando tiempo y cariño a tratar de entender cómo funciona, cuánto vale un kilowatio-hora, cómo se paga, quién recibe qué, de qué trata eso del déficit tarifario, si la energía renovable es rentable o no, por qué se enfada Iberdrola con las llamadas centrales termosolares, y aún no me aclaro. Y temo que de pasar las noches leyendo de claro en claro, y los días de turbio en turbio, con el poco dormir y de mucho leer libros sobre el sistema eléctrico, se me seque el cerebro y venga a perder el juicio.
Eso sí, a la vista del chorro de artículos sobre el tema, diríase que nadie está feliz con el estado de las cosas.
Mi modesta contribución al asunto, de manera que se me facilite el poner mis lavadoras y controlar mejor mi huella de carbono, pasa por realizar las siguientes tres sugerencias: la primera y más urgente, que el mercado se vuelva, si no transparente, al menos comprensible.
La segunda, que mi contador eléctrico sea capaz de ajustar —e indicar— el precio de la electricidad a la circunstancia horaria. Y que me indique, además, el CO2 que estoy generando. Todo ello para mejor ajustar mi consumo al interés mío, al común y al de los animalejos y arbolillos del campo.
Y la tercera, que me dejen tener una doble entrada de electricidad en casa. La una, con una potencia garantizada —concepto por el que pagaré muy gustosamente— y que me dé para mantener la iluminación, la nevera y tal vez el portátil. Y la otra, interrumpible por Iberdrola a voluntad, para el resto de las cosas. Y de manera que Iberdrola me pague por esa opción que le concedo y que bien le puede servir para mitigar los desajustes de producción y consumo no en un lado solo de la ecuación —que es el mecanismo tradicional— sino utilizando ambos a su conveniencia.
… cuando dice que hay que ver qué pasa y analizar las estadísticas. En lo demás, no lo sé (ni lo pienso decir aquí). Pero traigo el asunto a colación porque hace un par de días hablé, un tanto exteporáneamente, sobre desempleo y subsidios. Y uno de mis lectores hizo un comentario del que extraigo
No me gusta, no me gusta que se insinúe siempre que “España está llena de listos, que agotan el paro porque les sale mejor que trabajar”.
Ahora, Juan Rosell, presidente de la CEOE, nos dice:
[...] hay que ver qué pasa y analizar las estadísticas. Y estas dicen que como aquí el subsidio dura hasta 24 meses, la gente encuentra trabajo milagrosamente cuando falta un mes o dos para agotar el subsidio. Eso quiere decir que no está funcionando del todo bien.
Obviamente, en estas páginas no podemos estar más de acuerdo con el Sr. Rosell en cuanto a la necesidad de echarle un buen vistazo a los números. Y como él no nos dice más y yo ando con mucho trabajo estos días, aprovecho y pregunto:
- ¿Sabrá alguno de mis lectores a qué estadísticas se refire el Sr. Rosell? ¿Están disponibles?
- ¿Puede probarse estadísticamente su afirmación? ¿Nos puede regalar al resto de los lectores la demostración?
De la bitácora de Getstats y a través de un enlace publicado por Alberto Cairo en su cuenta de Twitter, he llegado a lo que los periodistas deberían saber (para informar correctamente cuando el asunto tiene tintes cuantitativos).
Proporciona un enlace a un documento que me tomo la libertad de traducir aquí. Se trata de una lista con los siguientes doce consejos:
- Si tropiezas con un número en una historia o comunicado de prensa, ten cuidado. Antes de darlo por bueno, pregúntate quién lo proporciona, cuáles son sus credenciales, si puede estar tratando de venderte algo. ¿Con qué otra evidencia se cuenta? ¿Cuáles son los números que no se muestran? ¿Por qué ese número precisamente ahora? Si el número procede de un estudio o de una investigación, ¿cuenta con visto bueno de algún experto de garantía?
- Husmea. ¿El número se refiere a una muestra? ¿A la población entera? En el primer caso, ¿la muestra se ha extraído adecuadamente? ¿Es representativa de la población?
- Profundiza. ¿Qué fue lo que se preguntó exactamente? La manera en que se formula una pregunta influye enormemente en la respuesta. Lo que se entiende por “tener trabajo” o “crimen violento” varía de persona a persona. Lo que la gente entiende puede no ser lo mismo que pensaba quien diseñó la encuesta.
- Para compendiar resultados pueden utilizarse distintos criterios. Por ejemplo, la media, que es altamente sensible a los valores extremos (la fortuna de Amancio Ortega incrementa el patrimonio medio de los españoles en unos 400 euros), pero también la mediana o la moda, con efectos distintos.
- La incertidumbre existe. Tenemos que estar seguros de la cifra obtenida no es efecto de la casualidad. Si se trata de una muestra, comprueba el margen de error, el ±3% que generalmente indican las compañías más serias. Si se dice en tal caso que el 52% de la muestra apoya X, el valor verdadero podría ser igualmente del 49%. Desconfía de los rankings, excepto los deportivos: el Real Madrid está por encima del Real Zaragoza por un buen motivo: ha obtenido más puntos en la liga. Pero la comparación de escuelas u hospitales es problemática y una escala simple podría no ser el instrumento adecuado: por ejemplo, un determinado hospital puede parecer peor, pero que suceda así porque recibe enfermos más graves. La comparación entre universidades o fuerzas policiales puede resultar no significativa si la diferencia entre puntuaciones es menor que el margen de error: si A obtiene 500 puntos y B 555, con un margen del error ±3% no puede decirse que A sea peor que B.
- Puede que los números indiquen una variación. Sin embargo, un solo cambio no significa una tendencia. Los saltos suceden a menudo. De suceder, podemos preguntarnos si obedecen a una recuperación o vuelta a la normalidad después de un salto en previo en la dirección opuesta (lo que algunos llaman regresión a la media). Si los números proceden de una encuesta, ¿excede el cambio el margen de error?
- De no realizarse un experimento controlado, (como los ensayos clínicos para estudiar el efecto de los nuevos medicamentos), es muy difícil poder afirmar que A causa B : los números pueden mostrar una asociación (una correlación) entre dos cosas como, por ejemplo, entre la obesidad y el cáncer. Pueden aparecer conexiones espurias debidas a un tercer factor no observado. El que los niños que usan teléfonos móviles presenten ciertos trastornos de conducta puede deberse a sus padres, cuyo comportamiento afecta a ambas cosas. Si los números sugieren una asociación, lo importante es evaluar su plausibilidad utilizando información adicional. El encontrar una posible causa puede estimular la investigación pero no debería ser utilizado para impulsar determinado tipo de políticas, por ejemplo. Tampoco se deben realizar recomendaciones sobre el consumo de ciertos alimentos basadas en presuntas asociaciones entre ellos y determinadas dolencias.
- Una pregunta clave es “¿de cuántos?”. Algunos sucesos son inusuales, como la muerte de un niño, y por eso son noticia. Pero tienen que considerarse en su contexto. La improbabilidad de un suceso es una medida de su relevancia como noticia. Pero es necesario distinguir lo que resulta importante para una determinada familia de lo que afecta al interés general.
- Los millones y los miles de millones son cifras difíciles de comprender si no se humanizan comparándolas, por ejemplo, con el país entero o mostrando su efecto sobre cada persona. Ciertas descripciones pueden ayudar a comprender el riesgo: es tan peligroso hacer un viaje de 100 km en moto como operarse con anestesia general.
- Una buena información debe ofrecer una visión equilibrada entre las cifras a las que se refiere. Es mejor centrarse en el número más probable que en los más extremos. Por ejemplo, en las historias sobre los efectos de una epidemia de gripe, en lugar de fórmulas como podría llegar a alcanzar valores tan altos como… son preferibles las del tipo es improbable que exceda… . Como los números pueden ser malinterpretados, es preferible eliminar el sesgo.
- El riesgo es arriesgado. Por ejemplo, la frase comer panceta diariamente aumenta el riesgo de llegar a padecer cáncer de intestino en un 20% viene a decir lo mismo que de cada 100 personas que comen panceta diariamente, una más acabarás sufriendo cáncer de intestino. Pero la primera es alarmista e inexacta. De estar disponible, es conveniente expresar la información en términos del número de afectados por cada cien o cien mil personas.
- Los medios digitales permiten mostrar datos de manera más dinámica e imaginativa. En cualquier caso, siempre hay que preguntarse: ¿son claros los gráficos? ¿Cuentan la misma historia que el texto?
En un país hipotético, E, tienen un mecanismo de protección social que garantiza a los desempleados un subsidio consistente en nueve mensualidades de 100 euros (por simplificar). En este país viven cuatro ciudadanos, A, B, C y D:
- A pierde su trabajo pero es diligente y capaz y encuentra otro al cabo de 5 meses. Recibe 500 euros de subsidio.
- B pierde su trabajo y tarda 15 meses en encontrar otro. Recibe 900 euros de subsidio.
- C pierde su trabajo y decide no buscar otro hasta agoter la prestación: con su guitarra y algunas chapuzas que le salen, vive. Recibe 900 euros.
- D trabaja y tiene envidia de C. Piensa que por 150 euros haría lo mismo que él. Pero no por 100.
Al gobierno de E se le ocurre lo siguiente: pagar un subsidio de 180 euros el primer mes, 160 el segundo y 200 - 20 * n, el enésimo, es decir,
- pagar 180 euros de subsidio el primer mes
- reducir mensualmente la cuantía del subsidio en 20 euros
En esta nueva situación:
- A recibiría 700 euros de subsidio en lugar de los 500
- B recibiría los mismos 900 euros que con el procedimiento anterior
- C recibiría menos: tendría que ponerse a trabajar antes.
- D se tomaría dos meses sabáticos recibiendo 380 euros de subsidio (o puede que no por miedo a no poder reengancharse al tercero).
En resumen, ninguno de los individuos implicados sale perdiendo y alguno de ellos, incluso, sale ganando.
Por otro lado, dependiendo del número de trabajadores de los que, en concreto, C y D son representantes, el coste del desempleo puede ser más alto para la seguridad social pero, por otra parte, puede que se trabajen —y por lo tanto, se reciban cotizaciones— más meses.
Notas finales:
- Algo parecido, pero más a lo bruto, existe en un país llamado España: su Seguridad Social, en determinados casos, paga la cuantía íntegra del subsidio de desempleo si el beneficiario abre una empresa (o algo así).
- Esta manera de proceder me parece más razonable que las de algún cavernícola.
- El autor de esta bitácora piensa que los economistas y los políticos no exploran lo suficiente las posibilidades que ofrece la geometría a la hora de diseñar determinado tipo de políticas y normas.
Informaba el otro día en estas páginas sobre la formación en captura de datos que hubo, dentro del ciclo charlas sobre de periodismo de datos, en MediaLab Prado.

Al final, una de esas imprevisibles circunstancias de última hora me impidió asistir.
Pero, menos mal, ya están disponibles los vídeos para echarles un vistazo este fin de semana.
La entrada de hoy la podía haber hecho en Twitter porque va a ser breve. Pero, ya que he tocado el tema de los impuestos y no tengo mucho tiempo, regalo a mis lectores una cifra sorprendente extraída de las páginas de la Agencia Tributaria.
Mirad los siguientes datos correspondientes al 2009:

Indican que en tal año, 16.7 millones de españoles declararon rendimientos del trabajo por un importe medio de casi 20.000 euros por barba, etc. Pero prestad atención a los rendimientos de actividades económicas, que son
las actividades extractivas, de fabricación, de comercio, de prestación de servicios, artesanía, actividad agrícola, actividad forestal, actividad ganadera, actividad pesquera, actividad de construcción, ejercicio de profesiones liberales, ejercicio de profesiones artísticas y actividades deportivas.
Es decir, los ingresos de los autónomos.
¿Será cierto que nuestro (yo lo soy) rendimiento anual medio es de únicamente 8.275 euros?
¡Joder con nosotros mismos!
|