Ir al contenido principal

Modelo de Regresión de Crecimiento Logístico para Estimar el Número de Casos de Covid19 en Guatemala

Hace algunos días compartí un modelo de regresión para  estimar el incremento de casos basados en una proporción lineal.

Y aunque este modelo es sencillo de entender y sirve muy bien como introducción didáctica

Un modelo que explica mejor el crecimiento de poblaciones como los casos de covid19 es el modelo de regresión exponencial logística.

C/(1+A*exp(-B*X))

Este modelo supone dos cosas:

1. Un crecimiento inicial lento pero que con el tiempo se acelera (crecimiento exponencial)
2. Una restricción que obliga a desacelerar el crecimiento hasta que entre dos días no hay diferencia entre el número de casos. (asíntota superior)

Estos supuestos le confieren al modelo su clásica forma de "S"



Tomando en cuenta los números de casos del día 10 (desde el primer caso) al día 37, se obtiene un modelo muy similar a esto:

Pn = 674.7472/(1 + 143.1502*e^(-0.1206*n))

Modelo de Crecimiento Logístico para Contagios de Covid19 en Guatemala (días 10 al 37)

Predicciones para los dias 38 en adelante


Además de poder "pronosticar" la tendencia de la población y asumiendo que otros factores externos no influyan en el modelo (como los deportados),
otros 2 datos importantes que nos regala el modelo es:

1. El máximo número de casos esperados (asíntota superior): C = 675 personas.
2. El día (N) en el que empieza a reducirse el incremento de casos: Ln(A)/B = día 42 con 337 casos
.
Ahora bien, yo tendría mucho cuidado para creer con fé ciega en los resultados de estos modelos, puesto que son sólo una herramienta estadística simplificada (sólo se basa en el número de dia) de un fenómeno más complejo, donde muchos otros factores entran en juego.

Sin embargo si puedo utilizarlo para evaluar la eficacia de las medidas de contención aplicadas (cuarentena, toque de queda, limitación de movimiento).

Por ejemplo si realizamos el mismo ejercicio para los datos de los días 1 al 25, al inicio del contagio, obteniamos el siguiente modelo:

Pn = 1823359/(1+360852.2 * e^(-0.112 * n))

Donde se predecía una población contagiada máxima de 1.8 millones de personas (aprox. la mitad de la población de la Ciudad de Guatemala), alcanzando la mitad de dicho número en el día 114.

Note que (en la figura inferior) ambos modelos se comportaban muy similarmente hasta el día 30, cuando las medidas de contención empezaron a hacer su efecto, obligando a la disminuir la tendencia de contagios y por lo mismo cuasando la necesidad de actualizar el modelo con los datos más recientes.

Comparativa Modelo Inicial vs Modelo más Reciente


Nota: Para los amantes de la estadística, el presente modelo tiene una desviación estándar de 6.35 y un coeficiente de correlación de Pearson (para una variable regresora), dejo a su disposición el cálculo de demás valores estadísticos.

Conclusiones:

  1. Los modelos estadísticos pueden ser herramientas muy útiles para conocer con antelación el comportamiento de una población, sin embargo, deben tomarse con mucho cuidado puesto que son sensibles a la influencia de otros factores no tomados en cuenta en el modelo. (en nuestro caso, el ingreso de deportados contagiados).
  2. Es importante actualizar cada cierto tiempo el modelo, posiblemente eliminando los datos de los días más antiguos y agregando los datos más nuevos, para tomar en cuenta sólo la "influencia" de los fenómenos/restricciones más recientes,
  3. Este modelo es una simplificación que asume sólo una única ola de contagios, en modelos con múltiples olas de contagio  

Referencias:


https://www.researchgate.net/post/Logistic_Growth_Model_Is_it_suitable_for_COVID-19
https://people.richland.edu/james/lecture/m116/logs/models.html
https://www.mspas.gob.gt/index.php/noticias/covid-19/casos




Comentarios

Entradas populares de este blog

In God we trust, for the rest, bring data

The famous quote has been attributed to W. Edwards Deming, the father of modern quality management. Deming was heavily involved in the economic reconstruction of post World War 2 Japan that saw the country become the world economic powerhouse of the 1960s, 70s and 80s.   Deming had the fundamental philosophy that data measurement and analysis were essential to attaining superior performance in every facet of business. This fundamental principle still holds strong today for any business presence. A significant number of businesses have very little idea on how their business is performing; and more importantly identifying ways to improve it.  This quote by W. Edwards Deming, very concisely explains to us the importance of understanding and interpreting the large volume of data that gets created almost every day by the world.

How to Recover/Restore Root's password in MariaDB in Windows

Even though this post is not directly related with the world of data science, it is one of those rare cases when a post is well deserved to be written in case it can save somebody else's life, just like in my case. A few days ago, I went into a big trouble, because (silly me) in a rare case of overconfidense, I didn't write down a root's passwords for a new DB I was working on, again, silly me. After review a few pages in Google, I found there was no a very straight forward solution to accomplish this task, so I had to mix and try a few suggested solutions (bibliography below), like this: 1. In Windows, open a command line, using admin privilegies. 2. Navigate through the folder path till you reach MariaDB's bin folder, in my case it was: C:\Program Files\MariaDB 10.3\bin 3.Stop MySQL service, in case it's still running: net stop mysql 4.Then move to the data folder: cd .. cd data 5. And modify the my.ini file: notepad my.ini 6. Right below the ...

El gusto de la Estadística.

Dado que somos seres visuales, para nosotros, una imagen verdaderamente puede decir más que 1000 palabras. Si eso es cierto, imagina entonces cuanto puede decirnos una animación? talvez una gran historia? Hoy comparto uno de mis vídeos favoritos, donde el Doctor Hans Rosling (QDEP), nos muestra la historia reciente de la humanidad, mediante la visualización de datos.