Calcula a la vez todas las estadísticas descriptivas estándar de tu conjunto de datos — tendencia central (media, mediana, moda), dispersión (varianza, desviación estándar, IQR), límites de cuartiles y z-scores — sin salir de la página. Pega números separados por comas, espacios, tabulaciones o saltos de línea; la calculadora ordena los datos, ejecuta las fórmulas y muestra el desarrollo intermedio para que verifiques cada número.
¿Qué es la Estadística?
La estadística es la ciencia matemática de recolectar, organizar, resumir, analizar e interpretar datos. Existe porque los números crudos — por ejemplo una lista de 200 calificaciones de examen — son demasiado ruidosos para captarlos de un vistazo. Las estadísticas descriptivas destilan ese ruido en un puñado de números que describen dónde están centrados los datos, cuánto se dispersan y cómo se comparan los valores individuales con el resto.
Medidas de tendencia central
Responden a la pregunta «¿cuál es un valor típico?». Cada una captura un sentido distinto de «centro»:
- Media (promedio aritmético): suma de todos los valores dividida por la cantidad. Sensible a valores atípicos — un único valor muy grande puede arrastrarla lejos del resto.
- Mediana: el valor central cuando los datos están ordenados. La mitad del conjunto está por debajo, la otra mitad por encima. Robusta frente a atípicos, por eso los reportes de precios de vivienda siempre citan la mediana, no la media.
- Moda: el valor que aparece con mayor frecuencia. Útil para datos categóricos («color más común») pero puede ser indefinida o no única en datos continuos.
Medidas de dispersión
La dispersión indica cuánto varían los datos. Una clase donde todos sacaron 70 tiene la misma media que otra con calificaciones de 30 a 100, pero la segunda tiene una dispersión enorme.
- Rango: máximo menos mínimo. Rápido de calcular, pero ignora todo lo que hay entre los extremos.
- Varianza: promedio de los cuadrados de las desviaciones respecto a la media. Elevar al cuadrado hace que desviaciones positivas y negativas cuenten y enfatiza los huecos grandes.
- Desviación estándar: raíz cuadrada de la varianza, en las mismas unidades que los datos originales. Aproximadamente la «distancia típica a la media».
- Rango intercuartílico (IQR): Q3 − Q1, el alcance del 50% central de los datos. Robusto a atípicos, lo que lo convierte en la base de los diagramas de caja y la regla estándar de detección de outliers.
Puntaje Z
El puntaje z expresa cualquier punto de datos en unidades de desviaciones estándar respecto a la media. La fórmula es:
z = (x - μ) / σ
Un z de 0 significa que el valor está exactamente en la media; +2 significa dos desviaciones por encima, −1,5 una y media por debajo. Para datos aproximadamente normales, la regla 68-95-99,7 dice que ~68% de los valores están dentro de z = ±1, ~95% dentro de ±2 y ~99,7% dentro de ±3 — por eso un z por encima de 3 o por debajo de −3 es lo bastante inusual como para investigar.
Aplicaciones de la estadística
La estadística sustenta casi todas las disciplinas cuantitativas:
- Ciencia: análisis experimental, pruebas de hipótesis, intervalos de confianza, valores p
- Negocios: investigación de mercados, control de calidad (Six Sigma lleva el nombre de un umbral de desviación estándar), pruebas A/B
- Medicina: ensayos clínicos, epidemiología, curvas dosis-respuesta, sensibilidad y especificidad de pruebas
- Ciencias sociales: análisis de encuestas, margen de error en sondeos, estudios demográficos
- Finanzas: varianza de carteras, ratio de Sharpe, Valor en Riesgo, todo el trading cuantitativo
Preguntas Frecuentes
Usa la media cuando los datos son aproximadamente simétricos y carecen de valores atípicos extremos — calificaciones de un examen típico, alturas de adultos en un país, temperaturas diarias durante un mes. La media utiliza todos los valores, así que captura la información completa del conjunto. Usa la mediana cuando los datos son sesgados o contienen atípicos. Los ingresos son el ejemplo clásico: un solo multimillonario en una muestra de 100 personas dispara la media muy por encima del ingreso típico, pero apenas mueve la mediana. Los precios de viviendas, tiempos de respuesta de servidores web y tiempos de espera hospitalarios se reportan como medianas por la misma razón. Motivo matemático: la media minimiza la suma de errores al cuadrado, la mediana minimiza la suma de errores absolutos. Los errores al cuadrado castigan duramente un único fallo grande, por eso la media persigue al atípico. Prueba práctica: si la media y la mediana difieren más de ~10% de la desviación estándar, es probable que tus datos estén sesgados y la mediana sea el resumen más seguro.
La desviación estándar poblacional divide por N (el recuento); la muestral divide por N−1. Ese N−1 se llama corrección de Bessel. ¿Por qué restar uno? Cuando calculas la media muestral y luego mides las desviaciones respecto a ella, los datos están más cerca de la media muestral que de la verdadera media poblacional — por construcción. Si divides por N subestimas sistemáticamente la varianza poblacional. Dividir por N−1 corrige ese sesgo en promedio, dando un estimador insesgado de la varianza poblacional. Regla práctica: si tienes toda la población (cada empleado de una empresa pequeña, cada nota de una clase que enseñaste), usa N. Si tienes una muestra extraída de una población mayor (1.000 votantes de 30 millones, 50 bombillas de la producción diaria de una fábrica) y quieres inferir algo sobre el todo, usa N−1. La mayoría del software usa N−1 por defecto: STDEV.S de Excel, std de NumPy con ddof=1, STDEV de Google Sheets. La diferencia importa más en muestras pequeñas — con N=1.000 es prácticamente nula, con N=4 es enorme. Usa el selector Muestra/Población encima del botón Calcular para cambiar el divisor: recalcula de un clic la varianza, la desviación estándar, el error estándar, el coeficiente de variación y las fórmulas de asimetría/curtosis. En modo muestral el error estándar es la DE muestral dividida por √n; en modo poblacional es la DE poblacional dividida por √n.
Distintos programas dan distintos Q1 y Q3 porque no existe una única definición acordada de percentil para un conjunto finito. Esta calculadora usa interpolación lineal exclusiva sobre el rango (n−1)·p: ordena los datos, calcula la posición fraccionaria pos = (n−1)·p donde p es 0,25 para Q1 y 0,75 para Q3, y luego interpola linealmente entre los dos valores ordenados que la rodean. Es exactamente el método detrás de PERCENTILE.INC y QUARTILE.INC de Excel, PERCENTILE de Google Sheets, el percentile por defecto de NumPy (interpolación lineal) y el quantile tipo 7 de R. NO es lo mismo que PERCENTILE.EXC de Excel (que usa la posición (n+1)·p) ni el método de bisagras de Tukey/Moore-McCabe que se enseña en muchos cursos introductorios, ambos pueden devolver IQR algo mayores en conjuntos pequeños. Así que si tu libro de texto u otra herramienta reporta Q1/Q3 un poco distintos a los nuestros, la causa casi siempre es la convención de percentil, no un error — para conjuntos grandes los métodos convergen y la diferencia desaparece. El IQR (Q3 − Q1) y las cercas de outliers 1,5·IQR de Tukey se calculan a partir de estos cuartiles interpolados.
Tres razones. Primera, elevar al cuadrado hace que desviaciones positivas y negativas cuenten como «distancia a la media» — sin cuadrado (o valor absoluto) las desviaciones suman cero por construcción, lo cual es inútil. Segunda, el cuadrado castiga más a las desviaciones grandes que a las pequeñas. Dos valores a 10 unidades de la media cuentan tanto como 50 valores a 2 unidades (10² = 100 frente a 50 × 2² = 200), así que la varianza es sensible a fallos grandes ocasionales, que suelen importar más en riesgo y control de calidad. Tercera, las desviaciones al cuadrado son matemáticamente convenientes: son diferenciables en todas partes (el valor absoluto no lo es en cero), se conectan limpiamente con la distribución normal y hacen que la varianza de una suma sea igual a la suma de varianzas para variables independientes. La desventaja es que la varianza tiene unidades equivocadas — dólares al cuadrado, kilogramos al cuadrado — por eso solemos citar la desviación estándar, su raíz cuadrada, que vuelve a las unidades originales. Existe la desviación absoluta media (MAD) y es robusta, pero carece de las propiedades algebraicas limpias que hacen de la varianza el estándar en la estadística clásica.
Un puntaje z te dice cuán inusual es un valor, en unidades de desviación estándar. z = (x − μ) / σ, donde x es tu valor, μ la media del conjunto y σ la desviación estándar. z positivo = por encima de la media, z negativo = por debajo, |z| = a cuántas desviaciones estándar de distancia. Para datos aproximadamente normales, la regla empírica (68-95-99,7) dice que cerca del 68% de los valores caen en z ∈ [−1, +1], el 95% en [−2, +2] y el 99,7% en [−3, +3]. Así que z = 1,5 está moderadamente sobre la media (mejor que ~93% de los valores), z = 2,5 marcadamente por encima (top ~0,6%), z = −3 es lo bastante raro como para sospechar un error o un caso especial. Los z-scores son cómo los exámenes SAT/CI se calibran (media 100, DE 15 implica IQ 130 con z = +2, top 2,3%), cómo los médicos marcan resultados de laboratorio fuera de rangos de referencia y cómo los profesionales de aprendizaje automático detectan atípicos antes de entrenar. Advertencia: la regla empírica solo funciona para distribuciones aproximadamente normales. Para datos sesgados o de colas pesadas, un z de 3 podría no ser raro en absoluto — los rendimientos diarios del bitcoin son famosos por romper esta regla.
El rango intercuartílico (IQR) es Q3 menos Q1 — la amplitud del 50% central de tus datos. Q1 es el percentil 25 (un cuarto de los valores está debajo), Q3 es el 75. El IQR es la medida estándar de dispersión robusta porque, a diferencia de la desviación estándar, es inmune a valores extremos: cambiar el dato más grande de 100 a 1.000.000 deja Q1, Q3 e IQR intactos. La regla de Tukey (1977) define como outliers los valores por debajo de Q1 − 1,5·IQR o por encima de Q3 + 1,5·IQR; los que sobrepasan 3·IQR se denominan «extremos». Los diagramas de caja dibujan cajas de Q1 a Q3, una línea en la mediana, bigotes hasta los puntos no atípicos más extremos y puntos para los atípicos. El factor 1,5 se eligió porque, para datos normales, marca aproximadamente el 0,7% de los valores — cerca de un umbral de z ±2,7. Usa la detección por IQR cuando tus datos puedan ser sesgados o de colas pesadas; usa la basada en z cuando sepas que la distribución es aproximadamente normal y quieras un criterio más nítido.
Porque cada valor aparece exactamente una vez. La moda es el valor más frecuente, pero si las 100 mediciones son decimales distintos — alturas de 100 estudiantes medidas al milímetro, tiempos de respuesta en milisegundos — ninguno se repite y la moda queda indefinida. Esta calculadora reporta «Sin moda» en ese caso en vez de elegir una arbitrariamente. Dos casos relacionados: los datos bimodales tienen dos valores empatados como más frecuentes (una clase con muchos estudiantes que fallan y muchos que sobresalen puede mostrar dos picos), y los datos multimodales tienen más de dos. Solución práctica del mundo real: agrupa los valores en intervalos (p. ej. alturas en cubos de 5 cm) y reporta el cubo modal en lugar del valor modal. Para datos continuos, la moda de un histograma suavizado (estimación por kernel) es más útil que la moda cruda. También por eso la media y la mediana acaparan la atención en estadística — siempre existen y son un único número, mientras que la moda puede faltar, ser única o ser múltiple.
La asimetría (skewness) mide la falta de simetría de la distribución. Una distribución simétrica (como la normal) tiene asimetría = 0. Asimetría positiva significa cola derecha larga (p. ej. ingresos, con unas pocas personas muy ricas); negativa, cola izquierda larga (p. ej. edad al fallecer en un país desarrollado). Prueba sencilla: si media > mediana, los datos son sesgados a la derecha; si media < mediana, a la izquierda. La curtosis mide cuán pesadas son las colas comparadas con una normal. Alta curtosis (leptocúrtica) significa más valores extremos de los que una normal predeciría — los rendimientos financieros son famosamente leptocúrticos, por eso los modelos basados en supuestos normales (Black-Scholes, VaR ingenuo) subestiman el riesgo de crash. Baja curtosis (platicúrtica) significa colas más delgadas. ¿Por qué importa? Muchas pruebas estadísticas suponen normalidad, lo que requiere asimetría ≈ 0 y exceso de curtosis ≈ 0. Con fuerte sesgo o colas gruesas, la media y la desviación estándar se vuelven engañosas, y conviene pasar a estadísticas robustas (mediana, IQR, media recortada) o transformar los datos (la log-transformación arregla datos positivos sesgados a la derecha).
Tres fallos clásicos que todo analista debe conocer. (1) Paradoja de Simpson: una tendencia que aparece en subgrupos puede invertirse al combinarlos. UC Berkeley fue demandada famosamente en 1973 por discriminación de género porque las mujeres tenían menor tasa global de admisión, pero departamento por departamento la tasa femenina era mayor — las mujeres simplemente aplicaban desproporcionadamente a departamentos más difíciles. (2) Sesgo de supervivencia: estudiar solo a los supervivientes da conclusiones sesgadas. Los ingenieros de la Segunda Guerra Mundial querían blindar los aviones de vuelta donde había más agujeros de bala; el estadístico Abraham Wald señaló que debían blindar donde los aviones de vuelta no tenían agujeros — esos eran los puntos que derribaban al resto. (3) Confundir correlación con causalidad: las ventas de helado correlacionan con los ahogamientos; ambos están causados por días calurosos de verano, no entre sí. Otras trampas incluyen la falacia del fiscal (confundir P(A|B) con P(B|A)), el p-hacking (correr 20 pruebas y reportar solo la significativa), la ley de Goodhart («cuando una medida se vuelve objetivo, deja de ser buena medida») y reportar una media precisa para datos sesgados. Siempre que un resumen estadístico te sorprenda, mira la distribución antes de concluir.