Estadística
La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población.
Los primeros estudios estadísticos que se hacían eran los censos, que son estudios descriptivos sobre todos los integrantes de una población. La elaboración de censos comenzó en la Edad Antigua, y sigue dándose en nuestros días. La Historia ofrece gran cantidad de ejemplos de actividad estadística.
A partir del siglo XIX, entre otros, con el aporte de Adolphe Quetelet (1796-1874), se crearon diferentes métodos de cálculo de probabilidades para determinar y analizar el tipo de datos que regulan algunos fenómenos.
Población estadística, en estadística, también llamada universo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones.
Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad. El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.
Tipos de parámetros estadísticos
Los primeros estudios estadísticos que se hacían eran los censos, que son estudios descriptivos sobre todos los integrantes de una población. La elaboración de censos comenzó en la Edad Antigua, y sigue dándose en nuestros días. La Historia ofrece gran cantidad de ejemplos de actividad estadística.
A partir del siglo XIX, entre otros, con el aporte de Adolphe Quetelet (1796-1874), se crearon diferentes métodos de cálculo de probabilidades para determinar y analizar el tipo de datos que regulan algunos fenómenos.
Población estadística, en estadística, también llamada universo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones.
Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad. El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.
Tipos de parámetros estadísticos
Un parámetro es un número que se obtiene gracias a una distribución de datos estadísticos y ayuda a organizar la información dada ya sea por una gráfica o una tabla.
Los principales tipos son:
- Centralización.
- Posición.
- Dispersión.
Estadística inferencial
La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una pequeña parte de esta. Su objetivo es obtener conclusiones útiles para hacer deducciones sobre una totalidad, basándose en la información numérica.
Estudio de la estadística inferencial
- Toma de muestras o muestreo, que se refiere a la forma adecuada de considerar una muestra que permita obtener conclusiones estadísticamente válidas y significativas.
- Estimación de parámetros o variables estadísticas, que permite estimar valores poblacionales a partir de muestras de mucho menor tamaño.
- Contraste de hipótesis, que permite decidir si dos muestras son estadísticamente diferentes, si un determinado procedimiento tiene un efecto estadístico significativo, etc.
- Diseño experimental.
- Inferencia bayesiana.
- Métodos no paramétricos.
Método
En el planteamiento se definen con precisión la población, la característica a estudiar, las variables, etc.
- Elaboración de un modelo: en caso de establecer un modelo teórico, se replantea el procedimiento y se llega a una conclusión lógica. Los posibles modelos son distribuciones de probabilidad.
- Extracción de la muestra: se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.
- Tratamiento de los datos: en esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media muestral, la varianza muestral.
Los métodos de esta etapa están definidos por la estadística descriptiva.
- Estimación de los parámetros: con determinadas técnicas se realiza una predicción sobre cuáles podrían ser los parámetros de la población.
- Contraste de hipótesis: los contrastes de hipótesis son técnicas que permiten simplificar el modelo matemático bajo análisis. Frecuentemente el contraste de hipótesis recurre al uso de estadísticos muestrales.
- Conclusiones: se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico que permite conocer cada vez mejor la población y características de estudio.
La media muestral o media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Sus propiedades son:
- Su cálculo es muy sencillo y en él intervienen todos los datos.
- Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:
- Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado, esto es, el valor de es mínimo cuando . Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.
- Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si
- entonces , donde es la media aritmética de los , para i = 1, ..., n y a y b números reales.
Moda
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva. Sus principales propiedades son:
- Cálculo sencillo.
- Interpretación muy clara.
- Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social.
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.17 Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:
Se toma como mediana
Propiedades de la mediana como parámetro estadístico:
- Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
- Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
- No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea.
Medidas de dispersión
Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican excesivamente la información. Estas medidas adquieren verdadero significado cuando van acompañadas de otras que informen sobre la heterogeneidad de los datos. Los parámetros de dispersión miden eso precisamente, generalmente, calculando en qué medida los datos se agrupan en torno a un valor central. Indican, de un modo bien definido, lo homogéneos que estos datos son. Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación típica o la desviación media, aunque también existen otras menos utilizadas como los recorridos o la meda; y medidas de dispersión relativas, como el coeficiente de variación, el coeficiente de apertura o los recorridos relativos.
Recorridos
El recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor valor que toma la misma. Es la medida de dispersión más sencilla de calcular, aunque es algo burda porque sólo toma en consideración un par de observaciones.
Desviaciones medias
Dada una variable estadística X y un parámetro de tendencia central, c, se llama desviación de un valor de la variable, xi, respecto de c, al número |xi - c|. Este número mide lo lejos que está cada dato del valor central c, por lo que una media de esas medidas podría resumir el conjunto de desviaciones de todos los datos.
se denomina desviación media de la variable X respecto de c a la media aritmética de las desviaciones de los valores de la variable respecto de c, esto es, si
entonces
De este modo se definen la desviación media respecto de la media (c = ) o la desviación media respecto de la mediana (c = ), cuya interpretación es sencilla en virtud del significado de la media aritmética.
Varianza y desviación típica:
La desviación típica, σ, se define como la raíz cuadrada de la varianza, esto es,
Para variables agrupadas en intervalos, se usan las marcas de clase (un valor apropiado del interior de cada intervalo) en estos cálculos.
Tasa
La tasa es un coeficiente que expresa la relación entre la cantidad y la frecuencia de un fenómeno o un grupo de fenómenos. Se utiliza para indicar la presencia de una situación que no puede ser medida en forma directa. Esta razón se utiliza en ámbitos variados, como la demografía o la economía, donde se hace referencia a la tasa de interés.
Comentarios
Publicar un comentario