0. Los datos de la práctica

1. Probabilidad vs Inferencia Estadística

2. Dos tipos de inferencia

2.1. Estimación de parámetros

  • Estimación puntual: (sample estimates) dar un valor “razonable” del parámetro desconocido, a partir de la muestra observada.
  • Estimación por intervalo de confianza: (confidence interval) dar un intervalo de valores “razonables” del parámetro a partir de:
    • Los datos de la muestra y
    • Un nivel de confianza alto (por ejemplo \(80\)%, \(90\)%, \(95\)%, \(99\)%, etc.).

2.2. Contraste de hipótesis (test)

  • ¿Cuándo se plantea?
    • Cuando hay serias sospechas de que no se cumple un “presunto” supuesto.
    • \(\left\{ \begin{array}{l} H_0: \ \text{hipótesis nula (cierta hasta que se demuestre lo contrario)} \\ H_1: \ \text{hipótesis alternativa (falsa hasta que se demuestre lo contrario)} \end{array} \right.\)
  • PROCEDIMIENTO HABITUAL PARA LOS CONTRASTES:
    1. Se plantea el contraste \(H_0\) vs \(H_1\).
    2. Se toma una muestra.
    3. Con la muestra se calcula un estadístico “sensible” para distinguir \(H_0\) de \(H_1\).
    4. Se calcula el \(p\)-valor del estadístico. Mide la compatibilidad de de los datos observados con \(H_0\).
    5. Se elige un nivel de significación \(\alpha\) pequeño (\(10\)%, \(5\)%, \(1\)%, etc.) para limitar el riesgo de equivocarse (rechazando \(H_0\) cuando sea cierta).
    6. El procedimiento es:
      • \(p\)-valor \(\leq \alpha \Longrightarrow\) RECHAZAR \(H_0\) (en favor de \(H_1\))
      • \(p\)-valor \(> \alpha \Longrightarrow\) ACEPTAR \(H_0\) (en detrimento de \(H_1\))
    7. En general es imposible saber “con seguridad” si \(H_0\) es cierta o no, porque la muestra es posible bajo ambos supuestos:
      • Error tipo I: rechazar \(H_0\) cuando es cierta (es el error más grave, y por eso se limita con el nivel de significación \(\alpha\)).
      • Error tipo II: aceptar \(H_0\) cuando es falsa.
  • PROCEDIMIENTO ALTERNATIVO PARA CONTRASTES “SOBRE EL VALOR DE UN PARÁMETRO”:
    1. Se plantea el contraste \(\left\{ \begin{array}{ll} H_0: & \theta = \theta_0 \\ H_1: & \ldots \end{array} \right.\), donde \(\theta\) es el nombre del parámetro y \(\theta_0\) el presunto valor.
    2. Se elige un nivel de significación \(\alpha\) pequeño (\(10\)%, \(5\)%, \(1\)%, etc.) para limitar el riesgo de equivocarse (rechazando \(H_0\) cuando sea cierta).
    3. Se calcula el intervalo de confianza de nivel \(1 - \alpha\) para el parámetro en cuestión (teniendo en cuenta también \(H_1\)). Lo llamamos \(IC\).
    4. La decisión es:
      • Si \(\theta_0 \in IC \Longrightarrow\) ACEPTAR \(H_0\)
      • Si \(\theta_0 \notin IC \Longrightarrow\) RECHAZAR \(H_0\)
  • Ejemplo de contraste:
    1. Dicen que los zurdos son más inteligentes que los diestros. Vamos a ver:
      • \(H_0\): zurdos y diestros igual de inteligentes (a falta de pruebas)
      • \(H_1\): zurdos más inteligentes que diestros
    2. Reunimos un grupo de zurdos y otro de diestros, y les ponemos una serie de cuestionarios. Se supone que miden la inteligencia.
    3. Estadístico de contraste: \(T\) = “Media de nota de zurdos - Media de notas de diestros”
      • Es “sensible” a \(H_1\), porque:
        • Si \(H_1\) fuese cierta, \(T\) tendría un valor POSITIVO
        • Si \(H_1\) no es cierta. \(T\) tendría un valor cercano a “0”
    4. \(p\)-valor de \(T\): mide la compatibilidad de \(T\) con \(H_0\)
    5. Según el nivel de significación \(\alpha\) elegido por el usuario:
      • Si \(p\)-valor es muy pequeño (\(< \alpha\)), \(H_0\) es menos creíble y RECHAZAMOS \(H_0\) (aunque \(H_0\) podría ser cierta)
      • Si \(p\)-valor no es tan pequeño (\(\geq \alpha\)), ACEPTAMOS \(H_0\) (aunque \(H_0\) podría ser falsa)

3. La \(p\) de UNA binomial (o Bernoulli): contrastes de hipótesis e intervalo de confianza

  • \(X \sim \text{Bin}(n,p)\), donde
    • \(n =\) tamaño de la muestra (se conoce),
    • \(p =\) ??? (objetivo de la inferencia)
  • Ejemplos:
    1. Una moneda se lanza \(100\) veces dando \(37\) caras.
      • Variable \(X\) = “número de caras”
      • Modelo \(X \sim \text{Bin}(n=100, p=???)\) (\(p\) = “probabilidad de cara”)
      • Muestra \(X=37\).
      • ¿Cuánto vale la \(p\) de esta moneda? (estimación)
      • ¿Podemos fiarnos de que es una moneda “equilibrada” (\(p=0.5\))? (contraste)
    2. Una producción es serie saca \(5\) defectusos de los últimos \(300\) producidos.
      • Variable \(X\) = “número de productos defectuosos”
      • Modelo: \(X \sim \text{Bin}(n=300, p=???)\) (\(p\) = “tasa a largo plazo de unidades defectuosas” o “probabilidad de sacar una unidad defectuosa”)
      • Muestra: \(X=5\)
      • ¿Cuál es la \(p\) de esta producción? (estimación)
      • ¿Podemos fiarnos de que la tasa de defectos está bajo control, p.ej. \(p \leq 0.02\)? (contraste)
  • Inferencias sobre \(p\)
    • Estimación puntual de \(p\)
    • Intervalo de confianza para \(p\)
    • Contrastes habituales: \(\left\{ \begin{array}{l} H_0: \ p = p_0 \\ H_1: \ p \neq p_0 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ p = p_0 \\ H_1: \ p < p_0 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ p = p_0 \\ H_1: \ p > p_0 \end{array} \right.\) (donde \(p_0\) es un valor numérico concreto)
  • FUNCIÓN prop.test(x, n, p, alternative, conf.level) (atención, no olvides escribir los nombres de los argumentos que uses):
    • Argumentos:
      • x: número de éxitos de la muestra
      • n: tamaño de la muestra
      • p: sólo para el contraste, Valor presunto \(p_0\) (NULL por defecto)
      • alternative: sólo para el contraste. Dirección de \(H_1\).
        • "two.sided" para \(\neq\) (por defecto)
        • "less" para \(<\)
        • "greater" para \(>\)
      • conf.level: sólo para intervalo de confianza. Nivel de confianza (por defecto \(0.95\))
    • Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
      • p-value: el \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
      • sample estimates: la estimación puntual
      • confidence interval: el intervalo de confianza

EJERCICIO 1: Un alumno quiere valorar su tasa de éxito en preguntas de Estadística. Para ello coge problemas al azar de un libro, y los resuelve, de modo que al final de la sesión, ha resuelto correctamente \(19\) de los \(30\) problemas atacados.

  1. Calcula la estimación puntual de la “probabilidad de resolver correctamente un problema” de este alumno. (Sol.: \(0.6333333\))
  2. Calcula un intervalo de confianza para dicha probabilidad, usando un nivel del confianza del \(90\)%. (Sol.: \(p \in [0.4668433, 0.7753366]\) con una confianza del \(90\)%)
  3. El alumno quiere demostrar que su eficacia de resolver problemas es superior al 50%, es decir, quiere resolver el contraste \(\left\{ \begin{array}{l} H_0: \ p = 0.5 \\ H_1: \ p > 0.5 \end{array} \right.\). ¿Que dicen los datos si usa una significación \(\alpha = 5\)%? (Sol.: Quiere demostrar \(H_1: \ p > 0.5\), y el contraste devuelve un \(p\)-valor = \(0.1006213\). Como \(p\)-valor \(>\) \(\alpha\), entonces debe aceptar \(H_0\), por lo que no demuestra que su eficacia \(p\) sea superior al \(50\)%.)

FIN EJERCICIO 1

4. Las \(p\)’s de DOS binomiales (o pruebas de Bernoulli) independientes

  • \(X_1 \sim \text{Bin}(n_1,p_1)\), donde
    • \(n_1 =\) tamaño de la primera muestra (se conoce),
    • \(p_1 =\) ???
  • \(X_2 \sim \text{Bin}(n_2,p_2)\), donde
    • \(n_2 =\) tamaño de la segunda muestra (se conoce),
    • \(p_2 =\) ???
  • \(X_1\) y \(X_2\) independientes.
  • Ejemplo: Un tratamiento nuevo \(N\) asegura ser más efectivo que el actual \(A\), en cuanto a que produce mayor porcentaje de cxuración. ¿Es eso verdad? Si \(p_A\) es la tasa de curación del tratamiento actual y \(p_N\) es la tasa de curación del tratamiento nuevo, se trata de resolver el contraste \(\left\{ \begin{array}{l} H_0: \ p_N = p_A \\ H_1: \ p_N > p_A \end{array} \right.\)
  • Inferencias sobre \(p_1\) y \(p_2\)
    • Estimación puntual de \(p_1\) y \(p_2\)
    • Intervalo de confianza para la “diferencia” \(p_1 - p_2\)
    • Contrastes habituales: \(\left\{ \begin{array}{l} H_0: \ p_1 = p_2 \\ H_1: \ p_1 \neq p_2 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ p_1 = p_2 \\ H_1: \ p_1 < p_2 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ p_1 = p_2 \\ H_1: \ p_1 > p_2 \end{array} \right.\)
  • FUNCIÓN prop.test(x, n, p, alternative, conf.level) (atención, no olvides escribir los nombres de los argumentos que uses):
    • Argumentos:
      • x: vector con los DOS números de éxitos de las dos muestras
      • n: vector con los DOS tamaños de las dos muestras
      • p: sólo para contraste. Dejar su valor por defecto (NULL) para contrastar la igualdad de las dos proporciones.
      • alternative: sólo para contraste. Dirección de \(H_1\).
        • "two.sided" para \(\neq\) (por defecto)
        • "less" para \(<\)
        • "greater" para \(>\)
      • conf.level: sólo para intervalo de confianza. Nivel de confianza (por defecto 0.95)
    • Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
      • p-value: el \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
      • confidence interval: el intervalo de confianza para la diferencia \(p_1 - p_2\)
      • sample estimates: las estimaciones puntuales de \(p_1\) y \(p_2\)

EJERCICIO 2: Dos alumnos quieren comparar su tasa de efectividad en preguntas tipo test de estadística. Uno ha acertado 15 preguntas de 25, y el otro ha acertado 10 de 20. A priori, no se puede decir que uno sea mejor que el otro:

  1. Estimación puntual de la tasa de efectividad de cada alumno (Sol.: 0.6 y 0.5.).
  2. Intervalo de confianza al 99% para la diferencia de las dos tasas (Sol.: [-0.327924555079155 ; 0.527924555079155]).
  3. ¿Con estos datos se ha demostrado que algún alumno es mejor que el otro, usando un nivel de significación del 10%? Es decir, se quiere resolver el contraste \(\left\{ \begin{array}{l} H_0: \ p_1 = p_2 \\ H_1: \ p_1 \neq p_2 \end{array} \right.\) (Sol.: No, porque p-valor = 0.7121641 > 0.10, por tanto aceptar \(H_0\), que es que son iguales)

FIN EJERCICIO 2

5. La media \(\mu\) de UNA normal (o de cualquier modelo si la muestra es grande)

EJERCICIO 3: Se supone que el tiempo que emplea un operario en realizar una serie de tareas sigue el modelo normal. Se registra el tiempo, en minutos, que emplea en las 10 últimas tareas:

Tarea 1 2 3 4 5 6 7 8 9 10
Tiempo 5.05 5.1 5.21 4.98 4.58 4.94 5.1 5.15 5.46 5.11
  1. ¿Cuál es la estimación puntual de la media (de la normal que modeliza el tiempo de este operario)? (Sol.: \(5.068\))
  2. Calcula el intervalo de confianza para dicha media de la normal, usando un nivel de confianza del \(99\)% (Sol.: \([4.8389794, 5.2970206]\).).
  3. Asumiendo un nivel de significación del \(3\)%, ¿los datos demuestran que el verdadero tiempo medio es superior a \(5\) minutos? Es decir, se quiere resilver el contraste \(\left\{ \begin{array}{l} H_0: \ \mu = 5 \\ H_1: \ \mu > 5 \end{array} \right.\) (Sol.: Sale un \(p\)-valor = \(0.179895 > 0.03\), que conduce a aceptar \(H_0\), por lo que decidimos que no es superior a 5 minutos).

FIN EJERCICIO 3

6. Las medias \(\mu_1\) y \(\mu_2\) de DOS normales (o modelos cualesquiera si la muestra es grande)

  • Dos casos:
    • \(X_1 \sim \text{N}(\mu_1, \sigma^2_1)\) y \(X_2 \sim \text{N}(\mu_2, \sigma^2_2)\)
      • \(\mu_1 = ???\) y \(\mu_2 = ???\) (objetivos de la inferencia)
      • \(\sigma_1^2 = ???\) y \(\sigma_2^2 = ???\) (no importan)
    • \(X_1\) y \(X_2\) cualesquiera modelos, \(\mu_1 = E(X_1)\), \(\mu_2 = E(X_2)\), y \(n_1\) y \(n_2\) “grande”
      • \(\mu_1 = ???\) y \(\mu_2 = ???\) (objetivos de la inferencia)
  • Ejemplo: ver si un nuevo algoritmo \(A\) es más rápido que otro \(B\)
    • \(H_0: \ \mu_A = \mu_B\) (mismo tiempo medio)
    • \(H_1: \ \mu_A < \mu_B\) (menos tiempo medio el nuevo)
  • ¿Datos independientes o emparejados?
    • Ejemplo: dos personas realizan 10 tareas para ver quien es más rápido.
      • Si escojo 20 tareas distintas, y reparto 10 tareas a cada uno, el tiempo de cada tarea de una persona es independiente del tiempo de cadatarea de la otra, ya que no están haciendo lo mismo.
      • Si escojo 10 tareas distintas, y cada persona realiza esas 10 tareas, el tiempo de cada persona “en la misma tarea” está emparejado, porque la dificultad de la tarea afecta a ambos por igual.
  • Inferencias sobre \(\mu_1\) y \(\mu_2\)
    • Estimación puntual de \(\mu_1\) y \(\mu_2\) (o bien de \(\mu_1-\mu_2\) si son datos emparejados).
    • Intervalo de confianza para \(\mu_1 - \mu_2\)
    • Contrastes habituales:
      • \(\left\{ \begin{array}{l} H_0: \ \mu_1 - \mu_2 = \mu_0 \\ H_1: \ \mu_1 - \mu_2 \neq \mu_0 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ \mu_1 - \mu_2 = \mu_0 \\ H_1: \ \mu_1 - \mu_2 < \mu_0 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ \mu_1 - \mu_2 = \mu_0 \\ H_1: \ \mu_1 - \mu_2 > \mu_0 \end{array} \right.\) donde \(\mu_0\) es un valor concreto.
      • Si tomamos \(\mu_0=0\), los contrastes quedan: \(\left\{ \begin{array}{l} H_0: \ \mu_1 = \mu_2 \\ H_1: \ \mu_1 \neq \mu_2 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ \mu_1 = \mu_2 \\ H_1: \ \mu_1 < \mu_2 \end{array} \right.\) o bien \(\left\{ \begin{array}{l} H_0: \ \mu_1 = \mu_2 \\ H_1: \ \mu_1 > \mu_2 \end{array} \right.\).
  • FUNCIÓN t.test(x, y, alternative, mu, paired, var.equal, conf.level) (atención, no olvides escribir los nombres de los argumentos que uses):
    • Argumentos:
      • x: datos de la muestra 1.
      • y: datos de la muestra 2.
      • alternative: sólo para contraste. Dirección de \(H_1\).
        • "two.sided" para \(\neq\) (por defecto)
        • "less" para \(<\)
        • "greater" para \(>\)
      • mu: sólo para contraste. \(\mu_0\), el presunto valor (por defecto \(0\) para comparar la igualdad).
      • paired: IMPORTANTE. Por defecto FALSE, indica datos independientes. Si los datos están emparejados por el muestreo, poner TRUE.
      • var.equal: por defecto FALSE. Si hubiera motivos para suponer que las varianzas poblacionales son iguales, se pondría TRUE, pero no es el caso en esta práctica.
      • conf.level: sólo para intervalo de confianza. Nivel de confianza (por defecto 0.95).
    • Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
      • p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
      • confidence interval: el intervalo de confianza para la diferencia \(\mu_1 - \mu_2\).
      • sample estimates: la estimación puntual de \(\mu_1\) y \(\mu_2\) (si son dos muestras independientes) o de la diferencia \(\mu_1 - \mu_2\) (si son dos muestras emparejadas).

EJERCICIO 4: Para comparar la rapidez de dos operarios, se proponen 10 tareas distintas, las mismas para ambos (!), y se registra el tiempo de cada uno en cada tarea.

Oper. / Trab. 1 2 3 4 5 6 7 8 9 10
A 5.05 5.1 5.21 4.98 4.58 4.94 5.1 5.15 5.46 5.11
B 4.68 4.92 5.22 5.07 5.24 4.89 4.83 5.11 5.13 4.87
  1. Calcula el intervalo de confianza para el tiempo medio de cada uno, usando un nivel de confianza del \(99\)%. (Sol.: \([4.8389794, 5.2970206]\) para A, y \([4.8063675, 5.1856325]\) para B.)
  2. Asumiendo un nivel de significación del \(3\)%, ¿los datos demuestran alguna diferencia significativa en la velocidad de ambos operarios? Es decir, se quiere resolver el contraste \(\left\{ \begin{array}{l} H_0: \ \mu_1 = \mu_2 \\ H_1: \ \mu_1 \neq \mu_2 \end{array} \right.\) (Sol.: Sale un \(p\)-valor = \(0.4658923 > 0.03\), que conduce a aceptar \(H_0\), por lo que no existen diferencias significativas.)
  3. ¿Cómo quedaría el apartado anterior si los datos de la tabla fueran de 20 tareas distintas, asignando 10 a un operario y otras 10 a otro? (Sol.: Saldría un \(p\)-valor = \(0.4419082 > 0.03\), que conduce a aceptar \(H_0\), por lo que no existen diferencias significativas.)

FIN EJERCICIO 4

7. Las varianzas \(\sigma_1^2\) y \(\sigma_2^2\) de DOS normales independientes

8. Un contraste de normalidad

9. Bondad de ajuste de una muestra a un modelo (dado por tabla de probabilidades)

EJERCICIO 5: Una muestra presenta los valores \(0\), \(1\), \(2\) y \(3\) con frecuencias respectivas \(15\), \(35\), \(28\) y \(19\). Se presume que el modelo viene dado por las probabilidades \(P(X=0) = 0.2\), \(P(X=1) = 0.3\), \(P(X=2) = 0.3\), \(P(X=3) = 0.2\). ¿La muestra es compatible con dicho modelo usando una significación del \(10\)%? Es decir, se quiere resolver el contraste \(\left\{ \begin{array}{l} H_0: \ \text{la muestra viene del modelo } \begin{array}{|c|c|c|c|c|} \hline X & 0 & 1 & 2 & 3 \\ \hline f(X) & 0.2 & 0.3 & 0.3 & 0.2 \\ \hline\end{array} \\ H_1: \ \text{No } H_0 \end{array} \right.\) (Sol.: Se obtiene un \(p\)-valor = \(0.5233365 > 0.1\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con el modelo.)

FIN EJERCICIO 5

10. Contraste de independiencia entre dos variables cualitativas

  • Ejemplo: ¿Ser zurdo (o diestro) es independiente de ser hombre (o mujer)? En otras palabras, ¿el porcentaje de zurdos es igual entre hombres que entre mujeres? A falta de pruebas, pensaremos que sí, pero si hay indicios de que no es así, podemos ponerlo a prueba mediante una muestra.
  • Contraste \(\left\{ \begin{array}{l} H_0: \ X \text{ e } Y \text{ son independientes} \\ H_1: \ \text{No } H_0 \end{array} \right.\)
  • FUNCIÓN chisq.test(x, y) (atención, no olvides escribir los nombres de los argumentos que uses):
    • Argumentos:
      • Dos posibilidades:
        • x vector con los datos de la muestra de \(X\), e y vector con los datos de la muestra de \(Y\), o bien
        • x = tabla de frecuencias conjuntas de \(X\) e \(Y\) (que puede obtenerse con la función table() sobre los datos de ambas variables, o bien escrita como matriz usando la función matrix(...)). y se queda sin usar, porque x lo tiene todo.
    • Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
      • p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
      • Warning: mensaje de peligro de mala aproximación (si procede).
  • Recordatorio: para definir una matriz en R, se incluye el siguiente ejemplo:
    • \(\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}\)
    • matrix(data=c(1,2,3,4,5,6), ncol=3, byrow=TRUE)
    • se indican las entradas de la matriz, el número de columnas que tendrá, y si se rellena poner por filas.

EJERCICIO 6: Una muestra contiene \(82\) hombres diestros, \(8\) hombres zurdos, \(59\) mujeres diestras y \(11\) mujeres zurdas. ¿La muestra es compatible con que la “lateralidad manual” es independiente del “sexo”, usando una significación del \(5\)%? (Sol.: Se obtiene un \(p\)-valor = \(0.281197 > 0.05\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con que sean independientes.)

FIN EJERCICIO 6

11. Resumen de inferencia

12. Ejercicios preparatorios extra