Análisis de la supervivencia cuando ningún sujeto ha muerto

Me ha sobrevenido un problema de análisis de supervivencia curioso: ningún sujeto ha muerto. Dicho de otra manera, todas mis observaciones están censuradas por la derecha.

Los datos recogen la antigüedad de la cámara de fotos de los visitantes de cierto blog. Y debería uno poder estimar cada cuántos años renuevan la cámara, es decir, la vida promedio de esos aparatejos. Si embargo, no tenemos información de la edad de las cámaras en el momento de la renovación. Solo de su edad hoy. ¡Todas las observaciones están censuradas por la derecha!

Así que survreg no puede converger: se va para la derecha. ¿Qué impide que los sujetos tengan vida infinita?

live_forever

Estoy dándole vueltas a la cabeza con este problema. También he buscado algo por ahí, pero no he dado con la discusión de algún problema parecido por ninguna parte.

He simulado la edad de una cohorte de cámaras que se mueren según una Weibull (¿por qué no una Weibull? se usa mucho para estimar la vida de aparatejos) de diversos parámetros. Pero aún no sé cómo casar datos con simulaciones (¿momentos?).

Así que si alguien tiene una idea al respecto… ¡Que no deje pasar la ocasión de ilustrar al resto en los comentarios!

Finalmente, por si alguien quiere echarle un vistazo a los datos, los puede bajar así:

library(rvest)

res <- read_html("http://micro4tercios.com/foro/viewtopic.php?f=5&t=26600")
res <- html_nodes(res, 
             xpath='//*[@class="polls"]/dl/dd[@class="resultbar"]')
res <- as.numeric(html_text(res))
res <- res[!is.na(res)]

edad.camaras <- data.frame(tiempo = 0.5 * (0:(length(res)-1)) + 0.25, 
                           numero = res)

10 comentarios sobre “Análisis de la supervivencia cuando ningún sujeto ha muerto

  1. Olivier 28 noviembre, 2016 10:38

    Carlos,

    no observas duraciones, no hay seguimiento.
    Tampoco es una cohorte restrospectiva porque sólo están en la encuesta las camaras que sobrevivieron.
    Así que no creo que aqui se pueda hacer un análisis de supervivencia.
    Es tán sólo un estudio transversal, una instantanea!
    Así que sólo puedes calcular prevalencias: ¿qué proporción de camarás que se usan tienen más de x años?
    Un saludo. Olivier

  2. Iñaki 28 noviembre, 2016 11:44

    Cosas que me vienen a la cabeza de lectura en diagonal a continuación. Entiendo que te interesa saber cada cuánto se compra uno una nueva cámara, que no tiene por qué ser, en general, porque la anterior haya «muerto». Quizás cruzando los datos con cada cuánto Nikon, Canon o Sony sacan un nuevo modelo salgan cosas.

  3. Guillermo Luijk 28 noviembre, 2016 15:46

    Asunciones:
    1.- Cada cámara que «muere» es sustituida inmediatamente por otra. Dicho de otro modo, todo fotógrafo tiene siempre una cámara y la repone siguiendo una distribución de tiempos propia, por lo que no se hace precisa información de cámaras «muertas».
    2.- La encuesta supone un muestreo en el tiempo que, respecto a los momentos vitales en que se encuentra el conjunto de cámaras, sigue una distribución uniforme. Es decir, es equiprobable que la encuesta le haya caído a un fotógrafo cuando su cámara tiene 0 años, cuando está a punto de ser sustituida, o a cualquier edad intermedia.
    3.- Por 2, la edad media de las cámaras derivada de la encuesta es un estimador insesgado de la mitad del tiempo de vida medio. Por lo tanto: Tiempo de vida medio = 2 * Edad media de las cámaras encuestadas

    De los datos:
    Edad promedio de las cámaras=2,9 años
    Tiempo de vida medio de las cámaras=5,8 años

    PD: no me fío de la asunción 2

  4. Carlos J. Gil Bellosta 28 noviembre, 2016 17:25

    Olivier: estoy de acuerdo contigo. Pero quiero ir un poco más allá. Si tú me das una «foto» de las edades de una población, puedo intuir enseguida que hay una función de riesgo subyacente que masacra a los mayores de 80, etc. (y no a partir de los 150 años, por ejemplo).

    Podemos intuir que si tuviésemos datos propiamente «de supervivencia» (i.e., momentos de reemplazo) podríamos usar una Weibull para modelar el fenómeno. Digamos que la Weibull existe.

    Ahora no tenemos datos de supervivencia sino edades en un corte. ¿Tiene sentido preguntar qué Weibull sería más «compatible» con esa distribución? Intuitivamente, puedo descartar algunas: las que matarían las cámaras muy tempranamente; las que permitirían que las cámaras subreviviesen bonitamente 30 años. Entre esos extremos, ¿cuál me encajaría?

    Creo que el problema es legítimo y que tal vez con algunas hipótesis adicionales razonables, está bien planteado.

  5. Iñaki 29 noviembre, 2016 1:29

    Ciertamente. El problema es que esa Weibull probablemente estará en el número de disparos, dado que la vida de una réflex es básicamente la vida de su obturador. Por tanto, encontrarás la Weibull en términos de tiempo en rodajas de población que le den un uso similar a la cámara. En esa encuesta hay tiempos, y si los perfiles están mezclados… ¿Qué da una suma de Weibulls? Y si se reportan réflex y cámaras sin espejo, peor todavía.

  6. Carlos J. Gil Bellosta 29 noviembre, 2016 1:52

    Efectivamente, nos faltan muchos datos que nos permitirían afinar. La pregunta, sin embargo es: ¿qué es lo mejor que se puede hacer con los que hay? Igual, ciertamente, nada.

  7. Iñaki 29 noviembre, 2016 12:46

    Y me contraargumento a mí mismo: si asumimos (otro salto de fe) que los perfiles de usuario de los que hablaba están uniformemente representados en la encuesta, uno podría considerar el tándem usuario+cámara para la variable tiempo de vida, lo cual no tiene absolutamente ninguna utilidad para mí, usuario concreto con perfil concreto, pero podría tenerlo para una compañía de cámaras de fotos. Tu problema puede estar bien planteado desde este punto de vista: no cuanto dura una cámara aleatoria, sino cuanto dura una cámara aleatoria en manos de un usuario aleatorio.

  8. Iñaki 29 noviembre, 2016 12:48

    Perdón, *cuánto y *cuánto.

  9. Ivonne 30 noviembre, 2016 22:59

    Y si lo ves como una muestra de una distribución truncada?

  10. Emilio 7 diciembre, 2016 23:57

    1. Convoca a un grupo de expertos. Ellos identifican los desgastes de las cámaras y los factores que influyen en ellas, así como el índice de influencia de cada factor.
    2. Los expertos valoran cada factor de retirada de la cámara, en una escala que va de 1 a 9. Ponderan según los índices de influencia asociados.
    3. Transforman el resultado anterior en probabilidades mediante una transformación exponencial.

    Los puntos anteriores describen el método SLIM, que se utiliza para calcular probabilidades de fallos en las centrales nucleares. Si el método es válido para centrales nucleares, también lo es para calcular la probabilidad de supervivencia en cámaras fotográficas.

Los comentarios están desabilitados.