¿Cuántos datos necesito?

Ya he tratado el tema de los datos en varios artículos anteriores. A menudo, la gente no sabe cuántos datos necesita realmente. En concreto, oigo con frecuencia la cantinela «La simulación requiere muchos datos, pero no tengo suficientes para alimentarla». Así que examinemos una situación en la que se dispone, digamos, del 40% de los datos que se desearía tener para tomar una decisión acertada y analicemos las opciones.

1) Puedes aplazar la decisión. En muchos casos, ninguna decisión es una decisión en sí misma porque la decisión la tomará la situación o las demás personas implicadas. Pero si realmente tienes la oportunidad de esperar y recopilar más datos antes de tomar la decisión, entonces debes medir el coste de la espera frente a la posible mejor decisión que podrías tomar con mejores datos. En cualquier caso, después de esperar, seguirá disponiendo de las siguientes opciones.

2) Usar el juicio «a ojo de buen cubero» y decidir basándose en lo que se sabe. Este enfoque agrava la falta de datos al ignorar también la complejidad del problema y cualquier enfoque analítico. (Irónicamente, este enfoque suele ignorar los datos de los que se dispone.) Se toma una decisión totalmente subjetiva, a menudo muy sesgada por la política. No hay duda de que algunas personas muy experimentadas pueden hacer juicios de valor bastante buenos. Pero también es cierto que muchos juicios de valor resultan pobres y podrían haberse beneficiado enormemente de un enfoque más analítico y objetivo.

3) Utilizar una hoja de cálculo u otro enfoque analítico que no requiera tantos datos. A primera vista, parece una buena idea y, de hecho, hay una serie de problemas para los que las hojas de cálculo son sin duda la mejor opción (o, al menos, la más adecuada). Pero para los problemas de modelización con los que solemos encontrarnos, las hojas de cálculo tienen dos limitaciones muy importantes: no pueden tratar la complejidad del sistema y no pueden tratar adecuadamente la variabilidad del sistema. Con este planteamiento, lo único que se hace es «prescindir» de los datos que faltan. No sólo se toma la decisión sin esos datos, sino que se finge que los datos que faltan no son importantes para la decisión. Un modelo demasiado simplificado que no tiene en cuenta la variabilidad ni la complejidad del sistema e ignora los datos que faltan… no parece una buena decisión.

4) Simule con los datos que tiene. Ningún modelo es perfecto. Por lo general, se trata de construir un modelo que cumpla los objetivos del proyecto lo mejor posible teniendo en cuenta el tiempo, los recursos y los datos disponibles. Probablemente todos estemos de acuerdo en que unos datos mejores y más completos dan como resultado un modelo más preciso, completo y sólido. Pero el valor del modelo no es un verdadero falso (valioso o inútil), sino más bien una escala graduada de valor creciente. Volviendo al problema de la variabilidad, es mucho mejor modelizar con estimaciones de variabilidad que limitarse a utilizar una constante. Del mismo modo, un modelo basado en un 40% de datos no proporcionará ni de lejos los resultados de uno con todos los datos deseados, pero seguirá superando a las técnicas analíticas que no sólo carecen de esos mismos datos, sino que además no tienen en cuenta la complejidad y la variabilidad del sistema.

Y a diferencia de los otros enfoques, la simulación no ignora los datos que faltan, sino que también puede ayudarle a identificar el impacto y priorizar las oportunidades de recopilar más datos. Por ejemplo, algunos productos tienen funciones que le ayudarán a evaluar el impacto de las conjeturas en sus resultados clave (KPI). También disponen de funciones que pueden ayudarle a evaluar dónde debe concentrar sus esfuerzos de recopilación de datos para ampliar la muestra o los conjuntos de datos pequeños con el fin de mejorar al máximo la precisión de su modelo. Y todas las simulaciones ofrecen la posibilidad de evaluar las mejores y peores posibilidades.

La perfección es enemiga del éxito. No puede dejar de tomar decisiones a la espera de datos perfectos. Pero puede utilizar herramientas lo suficientemente resistentes como para aportar valor con datos limitados. Sobre todo si esas mismas herramientas te ayudarán a comprender mejor el valor tanto de los datos existentes como de los que faltan.

¡Feliz modelaje!

Dave Sturrock
VP Operaciones – Simio LLC

¿Cuántos datos necesito?

Evolución del gemelo digital: Un viaje de 30 años que cambió la industria

Se busca ayuda

Simulación a través de visitas guiadas