Distribución de frecuencia: definición y ejemplos

Distribución de frecuencia: definición y ejemplos

Una distribución de frecuencia es un gráfico o una tabla que muestra la frecuencia de un conjunto de datos.

Las presentaciones gráficas de frecuencia incluyen histogramas, diagramas de puntos y diagramas de tallo y hojas. También hay varias vistas tabulares, incluidas tablas de frecuencias comunes y tablas enumeradas.

Las estadísticas utilizan distribuciones de frecuencia para el análisis de datos. Todos los campos que utilizan estadísticas, incluidas todas las ramas de la ciencia y la tecnología, utilizan distribuciones de frecuencia.

Antes de pasar a esta sección, es una buena idea revisar las frecuencias estadísticas y las tablas de frecuencias.

Esta sección cubre:

  • ¿Qué es una distribución de frecuencia?
  • Tabla de distribución de frecuencia
  • Definición de distribución de frecuencia
  • Ejemplos de distribución de frecuencia

¿Qué es una distribución de frecuencia?

Una distribución de frecuencia es una visualización de datos. Específicamente, muestra el número de veces que ocurren eventos individuales.

Las distribuciones de frecuencia pueden ser gráficos o tablas. Recuerde que los datos cuantitativos son datos que registran un número. Estos pueden incluir variables como tamaño, masa, distancia, edad, duración, etc. Este tipo de datos funciona mejor como gráfico.

Recuerde también que los datos cualitativos son datos que registran datos no numéricos. Estos pueden incluir día de la semana, color, género, respuestas sí / no, tema, etc. Este tipo de datos suele funcionar bien como tabla.

Tabla de distribución de frecuencia

Una tabla de distribución de frecuencias, también conocida como tabla de frecuencias, es una visualización tabular de datos. Si bien las tablas de frecuencia funcionan bien para datos cualitativos, también pueden funcionar para datos cuantitativos, especialmente cuando se utilizan rangos en lugar de puntos de datos individuales.

Hay muchas formas de configurar una tabla de distribución de frecuencia. Por lo general, incluirán categorías de datos en una columna izquierda o en una columna superior. Entonces, el número correspondiente de eventos estará en la columna directamente a la derecha o debajo de la categoría.

Las tablas son excelentes para mostrar datos multivariados que incluyen tanto datos numéricos como cualitativos. Estos son conjuntos de datos que tienen más de una entrada coincidente para cada punto. Por ejemplo, considere una encuesta de personas que incluya su edad, sexo y sabor de helado favorito. Contiene tres elementos de datos para cada persona de la encuesta.

Definición de distribución de frecuencia

Una distribución de frecuencia es un gráfico o una tabla que muestra la frecuencia de eventos en un conjunto de datos. A veces, las listas también se consideran una distribución de frecuencia.

Ejemplos de distribución de frecuencia

Los ejemplos de distribuciones de frecuencia incluyen gráficos de puntos, gráficos circulares, histogramas, gráficos de barras y tablas de frecuencia.

A veces, las distribuciones de frecuencia también se clasifican en otras categorías. Por ejemplo, las distribuciones de frecuencia pueden incluir datos agrupados y no agrupados. Cuando se desagrupan los datos, proporcionan información sobre ocurrencias específicas en los datos. Cuando se agregan datos, generalmente incluye información sobre rangos de datos.

Las distribuciones de frecuencia también pueden ser distribuciones de frecuencia relativa o distribuciones de frecuencia acumuladas. Una distribución de frecuencia relativa muestra el número de veces que ocurre cada evento. Por otro lado, una distribución de frecuencia acumulada muestra el número total de eventos hasta ese punto.

Por ejemplo, considere los siguientes datos con respecto a la altura de 10 estudiantes diferentes en pulgadas:

$ 58, $ 58, 60, 60, 62, 63, 65, 65, 65, 70 $

Una tabla desagrupada se ve así.

ungrouped frequency distribution

Sin embargo, una matriz agrupada se ve así.

grouped frequency distribution

Los dos ejemplos anteriores son tablas de frecuencias relativas. Es decir, la columna de la derecha indica la frecuencia con la que se produce cada valor o rango. Sin embargo, una tabla de frecuencia acumulada de valores de grupo se ve así.

Grouped cumulative frequency table

Ejemplos de

Esta sección cubre ejemplos comunes de problemas relacionados con distribuciones de frecuencia y sus soluciones paso a paso.

Ejemplo 1

Categorice la distribución de frecuencias que se muestra en el histograma.

Histogram example 1 frequency distribution

Solución

Este ejemplo es una distribución de frecuencia agrupada con datos cuantitativos. Está agrupado porque cada barra representa el número de puntos de datos en un rango. El primer rango es de $ 0 a $ 3, el siguiente es de $ 3 a $ 6, luego de $ 6 a $ 9 y finalmente de $ 9 a $ 12.

También es una distribución de frecuencia relativa en lugar de una distribución de frecuencia acumulativa. Esto está claro porque la última barra es más corta que la anterior. En una distribución de frecuencia acumulativa, las frecuencias siempre aumentan.

La forma de los datos es aproximadamente normal porque los puntos de datos están agrupados alrededor del centro con menos puntos a la izquierda y a la derecha.

Ejemplo 2

Un restaurador entrevistó a todos los que un día acudieron a su restaurante. Preguntó a cada persona cuál era su elemento favorito del menú. Obtuvo los siguientes resultados:

Filetes de pollo: 55 personas

Ensalada: 12 personas

Papas fritas: 26 personas

Pastel: 72 personas

Hamburguesa: 35 personas

Utilice estos datos para crear un gráfico circular.

Solución

Recuerde que un gráfico circular usa una frecuencia relativa para encontrar el ángulo central de cada “rebanada”.

Es decir, para encontrar el ángulo central de cada rebanada, primero encuentre la frecuencia relativa, luego multiplíquela por 360 $ ^ { circ} $.

$ 55 + 12 + 26 + 72 + 35 = $ 200.

Por lo tanto, la frecuencia relativa de los filetes de pollo es $ frac {55} {200} $. Multiplicando eso por 360 $ ^ { circ} $, obtenemos 99 $. Por lo tanto, la rebanada de pastel correspondiente a los filetes de pollo tiene un ángulo de $ 99 ^ { circ} $ y representa $ frac {55} {200} = frac {11} {40} $ mésimas del círculo.

De la misma forma:

El ángulo de la ensalada es $ frac {12} {200} times360 ^ { circ} = 21.6 ^ { circ} $.

Entonces, el ángulo de las papas fritas es $ frac {26} {200} times360 ^ { circ} = 46.8 ^ { circ} $.

$ frac {72} {200} times360 ^ { circ} = 129.6 ^ { circ} $ para el pastel.

$ frac {35} {200} times360 ^ { circ} = 63 ^ { circ} $ para las hamburguesas.

Pie chart for frequency distribution

Ejemplo 3

example 3 frequency distribution

Supongamos que a 150 dólares se pregunta a personas de distintas edades sobre la tecnología que poseen. Con base en la tabla, encuentre la frecuencia relativa de cada evento enumerado. Si no hay suficiente información, explique por qué.

A. Alguien tiene un televisor

B. Una persona tiene entre 0 y 10 años y tiene un teléfono móvil.

C. La persona tiene una tableta pero no una computadora portátil.

Solución

R. Para hallar la probabilidad de que una persona posea un televisor, es necesario hallar el número de personas que poseen televisores. Dado que está estratificado por edad, sume todos los números en la columna denominada “televisión”. Eso es $ 1 + 4 + 20 + 15 + 10 = $ 50. Entonces, la probabilidad es $ frac {50} {150} = frac {1} {3} $.

B. En este caso, necesitamos encontrar la cantidad de personas que tienen entre 0 y 10 y que tienen un teléfono celular. Esto corresponde a la celda superior derecha, $ 3 $. Por lo tanto, la probabilidad es $ frac {3} {150} = frac {1} {50} $.

C. No hay suficiente información para responder esta pregunta. Aunque se conoce el número total de personas ($ 150), se desconoce la superposición en posesión de las tres tecnologías.

Ejemplo 4

Cree una tabla de frecuencia para los datos proporcionados (combinación de 2 sujetos y 1 numérico)

Se preguntó a 10 personas por sus mascotas. Se les preguntó cuántos animales tenían y si tenían al menos un perro y al menos un gato. Aquí están los resultados :

($ 1, n, n); ($ 4, y, y); ($ 3, y, y); ($ 3, n, y); ($ 2, y, y); ($ 3, y, y); ($ 0, n, n); ($ 2, n, y); ($ 2, n, y); ($ 1, sí, no).

Cuando el primer número es el número total de mascotas, la segunda columna indica si la persona tenía al menos un perro con una “y” que significa “sí” y una “n” que significa “no”. Asimismo, la última columna trataba sobre si la persona tenía al menos un gato.

Solución

En este caso, sería una buena idea incluir columnas para cada una de las tres preguntas. Es decir, incluya una columna para el número de mascotas, una columna para gatos y una columna para perros.

Hay varias formas de organizar estos datos, pero una forma lógica es organizarlos de menor a mayor en función del número total de mascotas.

Además de estas preguntas, hay otra información disponible en los datos. Por ejemplo, si una persona dice “no” para tener al menos un perro y al menos un gato, entonces no tiene ninguno. Asimismo, el número total de encuestados no es igual al número de personas con perros más el número de personas con gatos más el número de personas sin ninguno porque existe cierta superposición entre tener un perro y un gato.

Por lo tanto, la estructura de la tabla que tiene sentido es tener el número de mascotas a la izquierda, el número en este rango con perros, el número en este rango con gatos, el número sin ninguno y el número total de personas en este rango.

Aquí está la tabla resultante.

example 4 frequency distribution

Ejemplo 5

Histogram for example 5 cumulative distribution

Utilice la distribución de frecuencia acumulada dada para determinar el tamaño de cada rango.

Solución

El primer rango es de $ 0 a $ 100.000. La barra correspondiente tiene una altura de $ 4. Dado que esta es la primera barra, significa que hay $ 4 puntos de datos en el rango de 0 a $ 100.000.

La siguiente barra tiene una altura de $ 7. Dado que esta es una distribución acumulativa, hay $ 7-4 = $ 3 puntos de datos entre $ 100,000 y $ 200,000.

Del mismo modo, para $ 200 000 a $ 300 000, hay $ 12 a $ 7 = $ 5 de puntos de datos.

Para $ 300,000 a $ 400,000 hay $ 16-12 = $ 4 puntos de datos.

Luego, por $ 400,000 a $ 500,000, hay $ 18 a $ 16 = 2 puntos de datos.

Finalmente, el último rango de $ 500 000 a $ 600 000 tiene un punto de datos.

Problemas de práctica

  1. Categorice la distribución de frecuencias que se muestra en el histograma.
    histogram pp1 frequency
  2. Dos trabajadores de campo toman la temperatura de una masa de agua en diferentes lugares el mismo día. Un trabajador de campo tiene un termómetro que mide a la centésima de grado más cercana, y el otro tiene un termómetro que mide a la décima de grado más cercana. Recaudan 250 dólares de las lecturas entre los dos.
    ¿Qué tipo de gráfico funcionaría mejor para estos datos y por qué?
  3. En una encuesta de $ 90 estudiantes, 35 preferían clases de historia, 30 preferían ciencias, 15 preferían matemáticas y el resto prefería arte. Crea un gráfico circular para los datos.
  4. Encuentre las siguientes probabilidades basadas en la tabla dada que describe las cookies creadas para un evento.
    practice problem 4 table
    A. Probabilidad de que una galleta seleccionada al azar contenga dulces.
    B. Probabilidad de que una galleta al azar sea de chocolate.
    C. La probabilidad de que una galleta aleatoria sea simple con chispas de chocolate.
  5. Calcula la media con base en el diagrama de tallo y hoja dado.
    practice problem 5 frequency

Clave de respuesta

  1. Esta pantalla es ambigua. Cada rango puede tener un número creciente de puntos de datos o puede ser una distribución acumulativa.
  2. El mejor tipo de distribución de frecuencia para estos datos es un histograma. Hay muchos puntos de datos y se miden en diferentes puntos (décimas y centésimas), por lo que una gráfica o tabla de puntos sería confusa. El uso de rangos con un histograma funcionaría mejor.
  3. new pie chart pp3
  4. A. $ frac {30} {97} $
    B. $ frac {25} {97} $
    C. $ frac {50} {97} $
  5. $ frac {551} {24} $

Las imágenes / dibujos matemáticos se crean con GeoGebra.