Objetivos

Problema 1 (interpretación de estadísticos y cálculo)

Se recoge una muestra de “número de trabajadores” en una serie de empresas de un polígono industrial. La muestra recogida se resume en la tabla de frecuencias siguiente:

\[\begin{array}{|c|c|c|c|c|} \hline \text{NÚM. DE} & \text{NÚM. DE} \\ \text{TRABAJADORES} & \text{EMPRESAS} \\ \hline [0,10] & 31 \\ \hline (10,20] & 66 \\ \hline (20,30] & 46 \\ \hline (30,40] & 61 \\ \hline (40,50] & 63 \\ \hline \end{array}\]

Responde a las siguientes preguntas:

  1. ¿Cuántas empresas se han chequeado en esta muestra?
  2. ¿Cuántas empresas tenían entre 10 y 40 empleados?
  3. ¿Cuál es el número medio de empleados por empresa? ¿Es exacto o aproximado? ¿Por qué?
  4. Completa la frase: “La mitad de las empresas tiene menos de …….. empleados”
  5. Completa la frase: “El 25% de las empresas tiene menos de …….. empleados”
  6. Completa la frase: “El 25% de las empresas tiene más de …….. empleados”
  7. El número de empleados más “habitual”, o “frecuente”, en las empresas es ……”
  8. El “recorrido” del número de trabajadores por empresa es …….
  9. El recorrido intercuartil del número de trabajadores por empresa es …….
  10. La desviación típica del número de empleados en las empresas es …….
  11. La varianza del número de empleados en las empresas es …….
  12. El coeficiente de variación del número de trabajadores por empresa es …….
  13. Los cálculos realizados en los apartados (c)-(l), son realmente “estimaciones”, “aproximaciones”. ¿Por qué?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!) Solución: (a) \(n=267\) empresas; (b) \(173\) empresas con entre 10 y 40 empleados; (c) \(\overline{x}=27.2097\) empleados; (d) Me=\(20+\frac{ \frac{50\cdot 267}{100} -97}{46} \cdot 10=27.9348\) (se trata de la mediana, o percentil 50, pues la mitad de los datos están por debajo de la mediana); (e) \(P_{25}=10+\frac{ \frac{25\cdot 267}{100} -31}{66} \cdot 10=15.4167\) (se trata del percentil 25, pues el 25% de los datos están por debajo de él); (f) \(P_{75}=30+\frac{ \frac{75\cdot 267}{100} -143}{61} \cdot 10=39.3852\) (se trata del percentil 75, pues el 75% de los datos están por debajo de él, y por eso solo el 25% están por encima); (g) Mo=\(15.974\) (es la moda, que se toma como valor más repetido de la muestra); (h) Re=\(50\) trabajadores; (i) RQ=\(23.9685\) trabajadores; (j) \(s=13.5465\); (k) \(s^2=183.5066\); (l) \(CV=0.4979\); (m) Porque los datos “verdaderos” no los tenemos. Están “agrupados” en intervalos, pero no sabemos cómo están repartidos dentro de los intervalos.

Problema 2

Se realiza un estudio sobre los salarios mensuales de dos colectivos de becarios: los becarios del Ministerio y los de Conselleria. Los resultados de la encuesta se recogen en la tabla siguiente:

Responde justificando los cálculos:

  1. ¿Qué colectivo está mejor pagado, en general?
  2. ¿Qué colectivo recibe sueldos más homogéneos?
  3. ¿Es cierto que más del 75% de becarios de Conselleria gana por debajo de los 550 euros mensuales?
  4. ¿Cuál sería el salario máximo del 75% de becarios de Conselleria que menos cobran?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!)

Solución: (a) Mejor pagados los de Ministerio pues la media es mayor (\(557.2917>514.4737\)); (b) Más homogéneos los de Conselleria pues el coeficiente de variación es menor (\(3.8767<4.5774\)); (c) Hay 43 de 57 por debajo de 21€, y eso es un 75.44%. Así que sí es cierto; (d) Se trata del percentil 75. Por tanto \(P_{75} = 500+\frac{ \frac{75\cdot 57}{100} -22}{21} \cdot 50=549.4048 = 549.4048\)€.

Problema 3

Una gran empresa quiere comparar 3 estrategias de trabajo (A, B y C). Para ello divide a sus empleados en 3 grupos, y en cada grupo implementa una de las estrategias. Al final, recoge la productividad de cada empleado, medida como número de expedientes resultos al cabo de 1 mes. Esas productividades vienen reflejadas en el diagrama de caja y bigotes a continuación:

  1. Ordena las estrategias de mayor a menor productividad “general”
  2. ¿Qué estrategia da productividades más dispares en los empleados?
  3. Completa la frase: “La mitad de los empleados de la estrategia C ha tenido una productividad inferior a los ….. expedientes”
  4. Completa la frase: “Un 25% de los empleados de la estrategia A ha tenido una productividad superior a los ….. expedientes”
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!)

Solución: (a) B > A > C (comparando las medianas que se aprecian en las cajas); (b) A (las cajas dejan apreciar el rango intercuartil, y es el único indicador disponible de la dispersión); (c) 35 (aprox., es la mediana, la línea de dentro de la caja); (d) 44 (aprox., es \(P_{75}\), que se puede apreciar como el borde superior de la caja)

Problema 4

Para comparar la velocidad de impresión de dos modelos (A y B) de impresora, se imprimen muchas páginas en negro y en color con cada impresora, y se resumen todos esos tiempos en la tabla:

Marca Tipo \(\overline{x}\) \(s\) \(x_{\text{min}}\) \(P_{25}\) Me \(P_{75}\) \(x_{\text{max}}\)
A Negro 1.296 0.113 1.064 1.225 1.274 1.355 1.514
A Color 2.741 0.184 2.380 2.665 2.819 2.865 2.938
B Negro 1.518 0.148 1.237 1.435 1.493 1.599 1.869
B Color 2.420 0.149 2.229 2.326 2.429 2.469 2.728

Contesta las preguntas con razonamientos breves (pero suficientes):

  1. ¿Qué impresora és más rápida en cada tipo de impresión (negro y color), en general?
  2. ¿Qué impresora es más regular en cada tipo de impresión, en general, según la muestra?
  3. La mitad de las páginas impresas en color por la marca A tardan un tiempo inferior a 2.741 seg. ¿Verdadero o falso?
  4. Todas las páginas imprimidas en negro con la impresora A han tardado menos de 1.5 seg. ¿Verdadero o falso?
  5. ¿Qué impresora es más conveniente (=rápida) para una persona que suele imprimir un 60% de páginas en negro y el 40% restante en color?
Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!)

Solución: (a) Negro: A (porque su tiempo medio es menor que el de B), Color: B (porque su tiempo medio es menor que el de A) ;(b) Regularidad es como homogeneidad, es decir baja dispersión. Por tanto en Negro: A (porque su CV=0.0872 es menor que el de B). En Color: B (porque su CV=0.0616 es menor que el de A); (c) Falso, porque la media “no siempre” divide a los datos en mitad por arriba y mitad por abajo. Esa propiedad la tiene la mediana, que vale 2.819; (d) Falso, porque \(x_{max}=1.514\) significa que al menos una página tardó más de 1.5 seg.; (e) Como para cada tipo de impresión es mejor una impresora, la solución no es tan trivial. Calculamos la media total ponderando con los porcentajes: A: \(\frac{60 \cdot 1.296 + 40 \cdot 2.741}{100} = 1.874\), B: \(\frac{60 \cdot 1.518 + 40 \cdot 2.420}{100} = 1.8788\). Por tanto la más conveniente (= rápida) es la A, pero por muy poco.

Problema 5

La distribución de los datos de una muestra puede ser simétrica, asimétrica a izquierda, o asimétrica a derecha. Relaciona los siguientes histogramas (A, B y C), con las “frases” que los describen (D, E y F), y con los valores del coeficiente de asimetría más apropiados (G, H e I):

Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!)

Solución: A=E=I; B=F=H; C=D=G

Problema 6

Las dos tablas siguientes representan la distribución de riqueza de dos comunidades. ¿En qué comunidad está más repartida la riqueza? Calcula el índice de concentración de Gini de ambas, y representa las curvas de Lorenz.

Pulsa para ver soluciones (¡SOLO SI YA HAS HECHO UN INTENTO DEL PROBLEMA!)

Solución: Para calcular el índice de concentración de Gini completamos columnas:

  • A: \(\begin{array}{|c|c|} \hline \text{EUROS } (x_i) & \text{PERSONAS } (n_i) & N_i & p_i & x_i \cdot n_i & x_i \cdot n_i \text{ acum} & q_i & p_i - q_i \\ \hline 25 & 30 & 30 & 25 & 750 & 750 & 5.55555555555556 & 19.4444444444444 \\ 50 & 30 & 60 & 50 & 1500 & 2250 & 16.6666666666667 & 33.3333333333333 \\ 125 & 30 & 90 & 75 & 3750 & 6000 & 44.4444444444444 & 30.5555555555556 \\ 250 & 30 & 120 & 100 & 7500 & 13500 & 100 & 0 \\ \hline\end{array}\)
  • B: \(\begin{array}{|c|c|} \hline \text{EUROS } (x_i) & \text{PERSONAS } (n_i) & N_i & p_i & x_i \cdot n_i & x_i \cdot n_i \text{ acum} & q_i & p_i - q_i \\ \hline 250 & 1000 & 1000 & 50 & 250000 & 250000 & 25 & 25 \\ 750 & 1000 & 2000 & 100 & 750000 & 1000000 & 100 & 0 \\ \hline \end{array}\)

De ahí \(I_{G,A} = \frac{83.3333333}{150} = 0.5556\), e \(I_{G,B} = \frac{25}{50} = 0.5\), por tanto la comunidad B tiene la riqueza más repartida por tener MENOR índice de concentración.

Las curvas de Lorenz se dibujan uniendo los puntos \((p_i, q_i)\) desde el (0,0) hasta el (100, 100):