LA estadística es el campo de las matemáticas que enumera hechos y cifras en el cual existe un conjunto de métodos que nos permiten recolectar datos y analizarlos, posibilitando así realizar alguna interpretación de los mismos. La estadística se divide en dos partes: descriptivo y inferencial. La estadística descriptiva se caracteriza por la organización, análisis y presentación de datos, mientras que la estadística inferencial tiene como característica el estudio de una muestra de una determinada población y, a partir de ella, la realización de análisis y la presentación de Dado.
Lea también: ¿Cuál es el margen de error de una encuesta?
Principios de estadística
A continuación, veremos los principales conceptos y principios de la estadística. A partir de ellos, será posible definir conceptos más sofisticados.
población o universo estadístico
La población o universo estadístico es el conjunto formado por todos los elementos que participan en un tema investigado en particular.
Ejemplos de universo estadístico
a) En una ciudad, todos los habitantes pertenecen al universo estadístico.
b) En un dado de seis caras, la población está dada por el número de caras.
{1, 2, 3, 4, 5, 6}
Datos estadísticos
Los datos estadísticos son un elemento que pertenece a la población en su conjunto, obviamente, estos datos deben estar relacionados con el tema de la investigación.
Población |
Datos estadísticos |
dados de seis caras |
4 |
Campeones brasileños de bicicleta de montaña |
Henrique Avancini |
Muestra
Llamamos a la muestra la subconjunto formado en base al universo estadístico. Se utiliza una muestra cuando la población es muy grande o infinita. En los casos en que la recopilación de toda la información del universo estadístico no sea factible por razones financieras o logísticas, también es necesario utilizar muestras.
La elección de una muestra es extremadamente importante para una encuesta y debe representar de manera confiable a la población. Un ejemplo clásico del uso de muestras en una encuesta es la realización de censo demográfico de nuestro país.
Variable
En estadística, la variable es objeto de estudio, es decir, el tema que la investigación pretende estudiar. Por ejemplo, al estudiar las características de una ciudad, el número de habitantes puede ser una variable, así como el volumen de lluvia en un período determinado o incluso el número de autobuses para el transporte público. Tenga en cuenta que el concepto de variable en estadística depende del contexto de investigación.
La organización de los datos en estadística se lleva a cabo en etapas, como en cualquier proceso organizativo. Inicialmente se elige el tema a investigar, luego se piensa el método de recolección de los datos de la investigación y el tercer paso es realizar la recolección. Finalizado este último paso, se realiza el análisis de lo recogido, y así, con base en la interpretación, se buscan resultados. Ahora veremos algunos conceptos importantes y necesarios para la organización de datos.
No pares ahora... Hay más después de la publicidad;)
papel
En los casos en que los datos se pueden representar mediante números, es decir, cuando la variable es cuantitativa, la lista de organización de estos datos. Una lista puede ser ascendente o descendente. Si una variable no es cuantitativa, es decir, si es cualitativa, no es posible utilizar la lista, por ejemplo, si los datos son sentimientos sobre un producto en particular.
Ejemplo
En un aula, se recogieron las alturas de los estudiantes en metros. Son: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Como la lista se puede organizar de forma ascendente o descendente, se deduce que:
rol: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Tenga en cuenta que, con el rollo ya ensamblado, es posible encontrar datos más fácilmente.
Tabla de distribución de frecuencia
En los casos en los que hay muchos elementos en la lista y muchas repeticiones de datos, la lista se vuelve obsoleta, ya que la organización de estos datos es impracticable. En estos casos, las tablas y el distribución de frecuencias sirven como una excelente herramienta organizativa.
En la tabla de distribución de frecuencia absoluta, debemos poner la frecuencia con la que aparece cada dato, es decir, el número de veces que aparece.
Construyamos la tabla de distribución para frecuencia absoluta las edades, en años, de los estudiantes de una clase determinada.
Distribución de frecuencia absoluta | |
Edad |
Frecuencia (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Total (FT) |
41 |
De la tabla podemos obtener la siguiente información: en la clase tenemos 2 alumnos de 8, 12 años Alumnos de 9 años, y 12 alumnos más de 10 años, y así sucesivamente, llegando a un total de 41 estudiantes. En la tabla de distribución de frecuencias acumuladas, debemos sumar la frecuencia de la fila anterior (en la tabla de distribución de frecuencia absoluta).
Construyamos la tabla de distribución de frecuencia acumulativa para edades de la misma clase que en el ejemplo anterior, consulte:
Distribución de frecuencia acumulada | |
Edad |
Frecuencia (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Total (FT) |
41 |
En la mesa de distribución de frecuencias relativas, se utiliza el porcentaje en el que aparece cada dato. Nuevamente haremos los cálculos basados en la tabla de distribución de frecuencia absoluta. Sabemos que 41 corresponde al 100% de los alumnos de la clase, así que para determinar el porcentaje de cada edad, simplemente dividimos la frecuencia de la edad por 41 y multiplicamos el resultado por 100, de modo que podamos escribirlo como un porcentaje.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Distribución de frecuencia relativa | |
Edad |
Frecuencia (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Total (FT) |
100% |
Lea también:Aplicación de yEstadísticas: Ffrecuencia Laabsoluto y FFrecuencia relativa
Clases
En los casos en que la variable sea continua, es decir, cuando tenga varios valores, es necesario agruparlos en intervalos reales. En estadística, estos intervalos se denominan clases..
Para construir la mesa de distribución de frecuencia en clases, debemos poner los intervalos en la columna de la izquierda, con su título apropiado, y en la columna de la derecha, debemos poner la frecuencia absoluta de cada uno de los intervalos, es decir, cuantos elementos pertenecen a cada uno su.
Ejemplo
Altura de los alumnos de 3º de bachillerato de un colegio.
Distribución de frecuencia en clases | |
altura (metros) |
Frecuencia absoluta (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Total (FT) |
16 |
Analizando la tabla de distribución de frecuencias en las clases, podemos ver que, en la clase de tercer año, tenemos 1 alumno que tiene una altura entre 1,40 my 1,50 m, así como tenemos 4 alumnos con una altura entre 1,50 y 1,60 m, y así sucesivamente. También podemos observar que los estudiantes tienen alturas entre 1,40 my 1,90 m, la diferencia entre estas medidas, es decir, entre la altura más alta y la más baja de la muestra, se denomina amplitud.
La diferencia entre los límites superior e inferior de una clase se llama amplitud de claseAsí, el segundo, que cuenta con 4 alumnos con alturas entre 1,50 metros (incluido) y 1,60 metros (no incluido), tiene un alcance de:
1,60 – 1,50
0,10 metros
Vea también: Medidas de dispersión: amplitud y desviación.
medidas de posición
Las medidas de posición se utilizan en los casos en que es posible construir un rollo numérico con los datos o una tabla de frecuencias. Estas medidas indican la posición de los elementos en relación con la lista. Las tres principales medidas de posición son:
Promedio
Considere la lista con los elementos (un1, a2, a3, a4, …, LaNo), la media aritmética de estos n elementos viene dada por:
Ejemplo
En un grupo de baile, las edades de los miembros fueron recopiladas y representadas en la siguiente lista:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Determinemos la edad promedio de los miembros de este grupo de baile.
Según la fórmula, debemos sumar todos los elementos y dividir este resultado por el número de elementos de la lista, así:
Por tanto, la edad media de los miembros es de 22 años.
Para obtener más información sobre esta medida de posición, lea nuestro texto: METROéMañana.
mediana
La mediana viene dada por el elemento central de una lista que tiene un número impar de elementos. Si la lista tiene un número par de elementos, debemos considerar los dos elementos centrales y calcular la media aritmética entre ellos.
Ejemplo
Considere la siguiente lista.
(2, 2, 3, 3,4, 5, 6, 7, 9)
Tenga en cuenta que el elemento 4 divide el rol en dos partes iguales, por lo que es el elemento central.
Ejemplo
Calcula la edad media del grupo de baile.
Recuerda que la lista de edades para este grupo de baile viene dada por:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Tenga en cuenta que el número de elementos de esta lista es igual a 10, por lo que no es posible dividir la lista en dos partes iguales. Entonces debemos tomar dos elementos centrales y realizar la media aritmética de estos valores.
Vea más detalles de esta medida de posición en nuestro texto: METROedian.
Moda
Llamaremos moda al elemento del rol que tiene mayor frecuencia, es decir, el elemento que más aparece en él.
Ejemplo
Determinamos la moda del rol de edad del grupo de baile.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
El elemento que aparece más es 21, por lo que la moda es igual a 21.
Medidas de dispersión
Las medidas de dispersión son se utiliza en los casos en que el promedio ya no es suficiente. Por ejemplo, imagina que dos coches han recorrido una media de 40.000 kilómetros. Solo con conocimiento de promedios podemos decir que los dos autos recorrieron kilómetros determinables cada uno, ¿verdad?
Sin embargo, imagina que uno de los coches ha recorrido 79.000 kilómetros y los otros 1.000 kilómetros, tenga en cuenta que solo con información sobre la media no es posible realizar declaraciones con precisión.
A medidas de dispersión nos dirá qué tan lejos están los elementos de una lista numérica de la media aritmética. Tenemos dos medidas importantes de dispersión:
Varianza (σ2)
Llamemos a la media aritmética de los cuadrados de la diferencia entre cada elemento en la tirada y la media aritmética de esa tirada como la varianza. La varianza está representada por: σ2.
Considere la lista (x1, X2, X3, …, XNo) y que tiene media aritméticaX. La varianza viene dada por:
Desviación estándar (σ)
La desviación estándar está dada por la raíz de la varianza, nos dice cuánto se dispersa un elemento en relación con la media. La desviación estándar se denota por σ.
Ejemplo
Determine la desviación estándar del conjunto de datos (4, 7, 10). Nótese que, para esto, es necesario determinar primero la varianza, y que, para eso, es necesario calcular primero el promedio de estos datos.
Reemplazando estos datos en la fórmula de varianza, tenemos:
Para determinar la desviación estándar, debemos extraer la raíz de la varianza.
Lea mas: Medidas de dispersión: varianza y desviación estándar
¿Para qué sirven las estadísticas?
Vimos que la estadística está relacionada con Problemas de recuento o de organización de datos. Además, tiene un papel importante en el desarrollo de herramientas que permitan el proceso de organización de datos, como en tablas. Las estadísticas también están presentes en varios campos de la ciencia, a partir de la recolección y tratamiento de datos, es posible trabajar con modelos matemáticos que permitan un mayor desarrollo en el área estudiada. Algunos campos en los que la estadística es fundamental: economía, meteorología, marketing, deportes, sociología y geociencias.
En meteorología, por ejemplo, los datos se recogen en un período determinado, después de ser organizados, se tratan, y así, con a partir de ellos se construye un modelo matemático que nos permite afirmar sobre el clima de días anteriores con un mayor grado de fiabilidad. La estadística es una rama de la ciencia que nos permite hacer declaraciones con cierto grado de confiabilidad, pero nunca con una certeza del 100%.
Divisiones estadísticas
La estadística se divide en dos partes, descriptiva e inferencial. La primera está relacionada con el conteo de los elementos involucrados en la investigación, estos elementos se cuentan uno a uno. A Estadísticas descriptivas, Nuestras herramientas principales son las medidas de posición, como la media, la mediana y la moda, así como medidas de dispersión como la varianza y la desviación estándar, también tenemos tablas de frecuencia y gráficos.
Aún en estadística descriptiva, tenemos una metodología muy bien definida para un presentación de datos con un grado considerable de fiabilidad que pasa por la organización y recopilación, resumen, interpretación y representación y, finalmente, análisis de datos. Un ejemplo clásico del uso de estadística descriptiva ocurre en el censo de población (cada 10 años) del Instituto Brasileño de Geografía y Estadística (IBGE).
LA Estadística inferencial, a su vez, se caracteriza no por recolectar datos de los elementos de una población uno a uno, sino por realizar la análisis de una muestra de esta población, extrayendo conclusiones sobre ella. En estadística inferencial, se debe tener cuidado al elegir la muestra, ya que debe representar muy bien a la población. Algunos resultados iniciales, como el promedio, en la estadística inferencial llamada esperanza, se deducen con base en el conocimiento de la estadística descriptiva.
Las estadísticas inferenciales se utilizan, por ejemplo, en las encuestas electorales. Se elige una muestra de la población, de manera que la represente, y así se realiza la investigación. Al elegir una muestra que no represente muy bien a esta población, decimos que la investigación es tendencioso y por lo tanto poco confiable.
ejercicios resueltos
Pregunta 1 - (U. F. Juiz de Fora - MG) Un profesor de física aplicó una prueba, por valor de 100 puntos, a sus 22 alumnos y obtuvo, como resultado, la distribución de calificaciones, que se ve en la siguiente tabla:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Realice los siguientes tratamientos de datos:
a) Escribe la lista de estas notas.
b) Determine la frecuencia relativa de la nota más alta.
Resolución
a) Para hacer la lista de estas notas, debemos escribirlas en forma ascendente o descendente. Entonces tenemos que:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b) Mirando el rollo, podemos ver que la nota más alta era igual a 90 y que su frecuencia absoluta es igual a 1, ya que solo aparece una vez. Para determinar la frecuencia relativa, debemos dividir la frecuencia absoluta de esa nota por la frecuencia total, en este caso igual a 22. Así:
Frecuencia relativa
Para pasar este número como porcentaje, debemos multiplicarlo por 100.
0,045 · 100
4,5%
Pregunta 2 - (Enem) Después de lanzar un dado en forma de cubo con caras numeradas del 1 al 6, 10 veces consecutivas, y tenga en cuenta el número obtenido en cada movimiento, la siguiente tabla de distribución de frecuencias.
Número obtenido |
Frecuencia |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
La media, la mediana y la moda de esta distribución de frecuencia son, respectivamente:
a) 3, 2 y 1
b) 3, 3 y 1
c) 3, 4 y 2
d) 5, 4 y 2
e) 6, 2 y 4
Resolución
Alternativa B.
Para determinar la media, tenga en cuenta que hay repetición de los números obtenidos, por lo que usaremos la media aritmética ponderada.
Para determinar la mediana, debemos organizar la lista de forma ascendente o descendente. Recuerda que la frecuencia es la cantidad de veces que aparece la cara.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Como el número de elementos en la lista es par, debemos calcular la media aritmética de los elementos centrales que dividen la lista por la mitad para determinar la mediana, así:
La moda viene dada por el elemento que más aparece, es decir, tiene la frecuencia más alta, por lo que tenemos que la moda es igual a 1.
Por tanto, la media, la mediana y la moda son, respectivamente, iguales a:
3, 3 y 1
por Robson Luiz
Profesor de matemáticas
En un grupo de personas las edades son: 10, 12, 15 y 17 años. Si un joven de 16 años se une al grupo, ¿qué pasa con la edad promedio del grupo?
Calcula el salario medio de esa empresa.