Objetivos
- Medidas posición: media, mediana, moda, percentiles (CALCULAR e
INTERPRETAR)
- Medidas dispersión: recorrido, recorrido intercuartil, varianza,
desviación típica, coeficiente de variación (CALCULAR e
INTERPRETAR)
- Diagrama de caja y bigotes (INTERPRETAR)
- Medidas de forma: asimetría y curtosis (INTERPRETAR)
- Medida de concentración: índice de Gini y curva de Lorenz (CALCULAR
e INTERPRETAR)
Problema 1 (interpretación de estadísticos y cálculo)
Se recoge una muestra de “número de trabajadores” en una
serie de empresas de un polígono industrial. La muestra recogida se
resume en la tabla de frecuencias siguiente:
\[\begin{array}{|c|c|c|c|c|} \hline
\text{NÚM. DE} & \text{NÚM. DE} \\ \text{TRABAJADORES} &
\text{EMPRESAS} \\ \hline [0,10] & 31 \\ \hline
(10,20] & 66 \\ \hline (20,30] & 46 \\ \hline (30,40]
& 61 \\ \hline (40,50] & 63 \\ \hline
\end{array}\]
Responde a las siguientes preguntas:
- ¿Cuántas empresas se han chequeado en esta muestra?
- ¿Cuántas empresas tenían entre 10 y 40 empleados?
- ¿Cuál es el número medio de empleados por empresa? ¿Es exacto o
aproximado? ¿Por qué?
- Completa la frase: “La mitad de las empresas tiene menos de ……..
empleados”
- Completa la frase: “El 25% de las empresas tiene menos de ……..
empleados”
- Completa la frase: “El 25% de las empresas tiene más
de …….. empleados”
- El número de empleados más “habitual”, o “frecuente”, en las
empresas es ……”
- El “recorrido” del número de trabajadores por empresa es …….
- El recorrido intercuartil del número de trabajadores por empresa es
…….
- La desviación típica del número de empleados en las empresas es
…….
- La varianza del número de empleados en las empresas es …….
- El coeficiente de variación del número de trabajadores por empresa
es …….
- Los cálculos realizados en los apartados (c)-(l), son realmente
“estimaciones”, “aproximaciones”. ¿Por qué?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: (a) \(n=267\) empresas; (b)
\(173\) empresas con entre 10 y 40
empleados; (c) \(\overline{x}=27.2097\)
empleados; (d) Me=\(20+\frac{ \frac{50\cdot
267}{100} -97}{46} \cdot 10=27.9348\) (se trata de la mediana, o
percentil 50, pues la mitad de los datos están por debajo de la
mediana); (e) \(P_{25}=10+\frac{ \frac{25\cdot
267}{100} -31}{66} \cdot 10=15.4167\) (se trata del percentil 25,
pues el 25% de los datos están por debajo de él); (f) \(P_{75}=30+\frac{ \frac{75\cdot 267}{100} -143}{61}
\cdot 10=39.3852\) (se trata del percentil 75, pues el 75% de los
datos están por debajo de él, y por eso solo el 25% están por encima);
(g) Mo=\(15.974\) (es la moda, que se
toma como valor más repetido de la muestra); (h) Re=\(50\) trabajadores; (i) RQ=\(23.9685\) trabajadores; (j) \(s=13.5465\); (k) \(s^2=183.5066\); (l) \(CV=0.4979\); (m) Porque los datos
“verdaderos” no los tenemos. Están “agrupados” en intervalos, pero no
sabemos cómo están repartidos dentro de los intervalos.
Problema 2
Se realiza un estudio sobre los salarios mensuales de dos colectivos
de becarios: los becarios del Ministerio y los de Conselleria. Los
resultados de la encuesta se recogen en la tabla siguiente:
- MINISTERIO \(\begin{array}{|c|c|c|c|c|c|}
\hline \text{SALARIO} & 450–500 & 500–550 & 550–600 &
600–650 & 650–700 \\ \hline \text{NÚM. BECARIOS} & 8 & 10
& 23 & 5 & 2 \\ \hline \end{array}\).
- CONSELLERIA \(\begin{array}{|c|c|c|c|c|c|}\hline \text{SALARIO}
& 400–450 & 450–500 & 500–550 & 550–600 \\ \hline
\text{NÚM. BECARIOS} & 4 & 18 & 21 & 14 \\ \hline
\end{array}\).
Responde justificando los cálculos:
- ¿Qué colectivo está mejor pagado, en general?
- ¿Qué colectivo recibe sueldos más homogéneos?
- ¿Es cierto que más del 75% de becarios de Conselleria gana por
debajo de los 550 euros mensuales?
- ¿Cuál sería el salario máximo del 75% de becarios de Conselleria que
menos cobran?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: (a) Mejor pagados los de Ministerio pues la media es mayor
(\(557.2917>514.4737\)); (b) Más
homogéneos los de Conselleria pues el coeficiente de variación es menor
(\(3.8767<4.5774\)); (c) Hay 43 de
57 por debajo de 21€, y eso es un 75.44%. Así que sí es cierto; (d) Se
trata del percentil 75. Por tanto \(P_{75} =
500+\frac{ \frac{75\cdot 57}{100} -22}{21} \cdot 50=549.4048 =
549.4048\)€.
Problema 3
Una gran empresa quiere comparar 3 estrategias de trabajo (A, B y C).
Para ello divide a sus empleados en 3 grupos, y en cada grupo implementa
una de las estrategias. Al final, recoge la productividad de cada
empleado, medida como número de expedientes resultos al cabo de 1 mes.
Esas productividades vienen reflejadas en el diagrama de caja y bigotes
a continuación:

- Ordena las estrategias de mayor a menor productividad “general”
- ¿Qué estrategia da productividades más dispares en los
empleados?
- Completa la frase: “La mitad de los empleados de la estrategia C ha
tenido una productividad inferior a los ….. expedientes”
- Completa la frase: “Un 25% de los empleados de la estrategia A ha
tenido una productividad superior a los ….. expedientes”
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: (a) B > A > C (comparando las medianas que se
aprecian en las cajas); (b) A (las cajas dejan apreciar el rango
intercuartil, y es el único indicador disponible de la dispersión); (c)
35 (aprox., es la mediana, la línea de dentro de la caja); (d) 44
(aprox., es \(P_{75}\), que se puede
apreciar como el borde superior de la caja)
Problema 4
Para comparar la velocidad de impresión de dos modelos (A y B) de
impresora, se imprimen muchas páginas en negro y en color con cada
impresora, y se resumen todos esos tiempos en la tabla:
A |
Negro |
1.296 |
0.113 |
1.064 |
1.225 |
1.274 |
1.355 |
1.514 |
A |
Color |
2.741 |
0.184 |
2.380 |
2.665 |
2.819 |
2.865 |
2.938 |
B |
Negro |
1.518 |
0.148 |
1.237 |
1.435 |
1.493 |
1.599 |
1.869 |
B |
Color |
2.420 |
0.149 |
2.229 |
2.326 |
2.429 |
2.469 |
2.728 |
Contesta las preguntas con razonamientos breves (pero
suficientes):
- ¿Qué impresora és más rápida en cada tipo de impresión (negro y
color), en general?
- ¿Qué impresora es más regular en cada tipo de impresión, en general,
según la muestra?
- La mitad de las páginas impresas en color por la marca A tardan un
tiempo inferior a 2.741 seg. ¿Verdadero o falso?
- Todas las páginas imprimidas en negro con la impresora A han tardado
menos de 1.5 seg. ¿Verdadero o falso?
- ¿Qué impresora es más conveniente (=rápida) para una persona que
suele imprimir un 60% de páginas en negro y el 40% restante en
color?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: (a) Negro: A (porque su tiempo medio es menor que el de B),
Color: B (porque su tiempo medio es menor que el de A) ;(b) Regularidad
es como homogeneidad, es decir baja dispersión. Por tanto en Negro: A
(porque su CV=0.0872 es menor que el de B). En Color: B (porque su
CV=0.0616 es menor que el de A); (c) Falso, porque la media “no siempre”
divide a los datos en mitad por arriba y mitad por abajo. Esa propiedad
la tiene la mediana, que vale 2.819; (d) Falso, porque \(x_{max}=1.514\) significa que al menos una
página tardó más de 1.5 seg.; (e) Como para cada tipo de impresión es
mejor una impresora, la solución no es tan trivial. Calculamos la media
total ponderando con los porcentajes: A: \(\frac{60 \cdot 1.296 + 40 \cdot 2.741}{100} =
1.874\), B: \(\frac{60 \cdot 1.518 + 40
\cdot 2.420}{100} = 1.8788\). Por tanto la más conveniente (=
rápida) es la A, pero por muy poco.
Problema 5
La distribución de los datos de una muestra puede ser simétrica,
asimétrica a izquierda, o asimétrica a derecha. Relaciona los siguientes
histogramas (A, B y C), con las “frases” que los describen (D, E y F), y
con los valores del coeficiente de asimetría más apropiados (G, H e
I):

- D: “asimétrica a izquierda”
- E: “(prácticamente) simétrica”
- F: “asimétrica a derecha”
- G: \(g_1 = -1.5393728\)
- H: \(g_1 = 2.0444561\)
- I: \(g_1 = -0.0135897\)
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: A=E=I; B=F=H; C=D=G
Problema 6
Las dos tablas siguientes representan la distribución de riqueza de
dos comunidades. ¿En qué comunidad está más repartida la riqueza?
Calcula el índice de concentración de Gini de ambas, y representa las
curvas de Lorenz.
- A: \(\begin{array}{|c|c|} \hline
\text{EUROS} & \text{PERSONAS} \\ \hline 25 & 30 \\ 50 & 30
\\ 125 & 30 \\ 250 & 30 \\ \hline \end{array}\)
- B: \(\begin{array}{|c|c|} \hline
\text{EUROS} & \text{PERSONAS} \\ \hline 250 & 1000 \\ 750 &
1000 \\ \hline \end{array}\)
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL
PROBLEMA!)
Solución: Para calcular el índice de concentración de Gini
completamos columnas:
- A: \(\begin{array}{|c|c|} \hline
\text{EUROS } (x_i) & \text{PERSONAS } (n_i) & N_i & p_i
& x_i \cdot n_i & x_i \cdot n_i \text{ acum} & q_i & p_i
- q_i \\ \hline 25 & 30 & 30 & 25 & 750 & 750 &
5.55555555555556 & 19.4444444444444 \\ 50 & 30 & 60 & 50
& 1500 & 2250 & 16.6666666666667 & 33.3333333333333 \\
125 & 30 & 90 & 75 & 3750 & 6000 &
44.4444444444444 & 30.5555555555556 \\ 250 & 30 & 120 &
100 & 7500 & 13500 & 100 & 0 \\
\hline\end{array}\)
- B: \(\begin{array}{|c|c|} \hline
\text{EUROS } (x_i) & \text{PERSONAS } (n_i) & N_i & p_i
& x_i \cdot n_i & x_i \cdot n_i \text{ acum} & q_i & p_i
- q_i \\ \hline 250 & 1000 & 1000 & 50 & 250000 &
250000 & 25 & 25 \\ 750 & 1000 & 2000 & 100 &
750000 & 1000000 & 100 & 0 \\ \hline
\end{array}\)
De ahí \(I_{G,A} = \frac{83.3333333}{150} =
0.5556\), e \(I_{G,B} = \frac{25}{50} =
0.5\), por tanto la comunidad B tiene la riqueza más repartida
por tener MENOR índice de concentración.
Las curvas de Lorenz se dibujan uniendo los puntos \((p_i, q_i)\) desde el (0,0) hasta el (100,
100):
