Simio Sync Registration is now open! Register for the May 14 -15, 2025 event!
Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

Skip to content
Simio background artwork

¿Cuántos datos necesito?

Personal de Simio

junio 14, 2014

Ya he tratado el tema de los datos en varios artículos anteriores. A menudo, la gente no sabe cuántos datos necesita realmente. En concreto, oigo con frecuencia la cantinela «La simulación requiere muchos datos, pero no tengo suficientes para alimentarla». Así que examinemos una situación en la que se dispone, digamos, del 40% de los datos que se desearía tener para tomar una decisión acertada y analicemos las opciones.

1) Puedes aplazar la decisión. En muchos casos, ninguna decisión es una decisión en sí misma porque la decisión la tomará la situación o las demás personas implicadas. Pero si realmente tienes la oportunidad de esperar y recopilar más datos antes de tomar la decisión, entonces debes medir el coste de la espera frente a la posible mejor decisión que podrías tomar con mejores datos. En cualquier caso, después de esperar, seguirá disponiendo de las siguientes opciones.

2) Usar el juicio «a ojo de buen cubero» y decidir basándose en lo que se sabe. Este enfoque agrava la falta de datos al ignorar también la complejidad del problema y cualquier enfoque analítico. (Irónicamente, este enfoque suele ignorar los datos de los que se dispone.) Se toma una decisión totalmente subjetiva, a menudo muy sesgada por la política. No hay duda de que algunas personas muy experimentadas pueden hacer juicios de valor bastante buenos. Pero también es cierto que muchos juicios de valor resultan pobres y podrían haberse beneficiado enormemente de un enfoque más analítico y objetivo.

3) Utilizar una hoja de cálculo u otro enfoque analítico que no requiera tantos datos. A primera vista, parece una buena idea y, de hecho, hay una serie de problemas para los que las hojas de cálculo son sin duda la mejor opción (o, al menos, la más adecuada). Pero para los problemas de modelización con los que solemos encontrarnos, las hojas de cálculo tienen dos limitaciones muy importantes: no pueden tratar la complejidad del sistema y no pueden tratar adecuadamente la variabilidad del sistema. Con este planteamiento, lo único que se hace es «prescindir» de los datos que faltan. No sólo se toma la decisión sin esos datos, sino que se finge que los datos que faltan no son importantes para la decisión. Un modelo demasiado simplificado que no tiene en cuenta la variabilidad ni la complejidad del sistema e ignora los datos que faltan… no parece una buena decisión.

4) Simule con los datos que tiene. Ningún modelo es perfecto. Por lo general, se trata de construir un modelo que cumpla los objetivos del proyecto lo mejor posible teniendo en cuenta el tiempo, los recursos y los datos disponibles. Probablemente todos estemos de acuerdo en que unos datos mejores y más completos dan como resultado un modelo más preciso, completo y sólido. Pero el valor del modelo no es un verdadero falso (valioso o inútil), sino más bien una escala graduada de valor creciente. Volviendo al problema de la variabilidad, es mucho mejor modelizar con estimaciones de variabilidad que limitarse a utilizar una constante. Del mismo modo, un modelo basado en un 40% de datos no proporcionará ni de lejos los resultados de uno con todos los datos deseados, pero seguirá superando a las técnicas analíticas que no sólo carecen de esos mismos datos, sino que además no tienen en cuenta la complejidad y la variabilidad del sistema.

Y a diferencia de los otros enfoques, la simulación no ignora los datos que faltan, sino que también puede ayudarle a identificar el impacto y priorizar las oportunidades de recopilar más datos. Por ejemplo, algunos productos tienen funciones que le ayudarán a evaluar el impacto de las conjeturas en sus resultados clave (KPI). También disponen de funciones que pueden ayudarle a evaluar dónde debe concentrar sus esfuerzos de recopilación de datos para ampliar la muestra o los conjuntos de datos pequeños con el fin de mejorar al máximo la precisión de su modelo. Y todas las simulaciones ofrecen la posibilidad de evaluar las mejores y peores posibilidades.

La perfección es enemiga del éxito. No puede dejar de tomar decisiones a la espera de datos perfectos. Pero puede utilizar herramientas lo suficientemente resistentes como para aportar valor con datos limitados. Sobre todo si esas mismas herramientas te ayudarán a comprender mejor el valor tanto de los datos existentes como de los que faltan.

¡Feliz modelaje!

Dave Sturrock
VP Operaciones – Simio LLC