2. Dos tipos de inferencia

Estimación de parámetros: intento de aproximar el valor del parámetro desconocido
Contraste de hipótesis: intento de verificar si el modelo de \(X\) es el que se supone a priori, o no.

2.1. Estimación de parámetros

Una muestra ayuda a “estimar” (o aproximar) el valor del parámetro
- Estimación puntual: se calcula el valor más creíble a partir de la muestra
- Estimación por intervalo de confianza: se calcula un intervalo de valores más creíbles a partir de la muestra y de un nivel de confianza dado por el usuario, por ejemplo \(0.8\), \(0.9\), \(0.95\), \(0.99\), etc. (o en porcentajes, \(80\)%, \(90\)%, \(95\)%, \(99\)%, etc.).

2.2. Contraste de hipótesis

¿Cuándo se plantea? Cuando el modelo cumple una “presunta” condición inicial, y hay serias sospechas de que ya no la cumple.
- \(\left\{ \begin{array}{l} H_0: \ \text{hipótesis nula} \\ H_1: \ \text{hipótesis alternativa} \end{array} \right.\)
- La hipótesis nula (\(H_0\)) se supone cierta hasta que una muestra demuestre lo contrario.
- La hipótesis alternativa (\(H_1\)) se sospecha o se quiere demostrar, pero se supone falsa hasta que una muestra demuestre lo contrario.
Procedimiento de contraste:
1. Muestrear: se observa una muestra
2. Tomar una decisión: según lo compatible que sea la muestra con \(H_0\).
  - Aceptar \(H_0\) (por creer que la muestra es compatible con ella)
  - Rechazar \(H_0\) (por creer que la muestra es muy incompatible con ella). Eso implica creer en \(H_1\).
Errores en la decisión: hay que intentar que sean lo menor posible, pero casi siempre son contrapuestos
- Error tipo I: rechazar \(H_0\) cuando es cierta (es el más grave).
- Error tipo II: aceptar \(H_0\) cuando es falsa.
Nivel de significación del contraste: es una cota superior de la probabilidad del Error tipo I. Se denota por \(\alpha\) y la impone el usuario según su criterio.
UN PROCEDIMIENTO ESTÁNDAR PARA CONTRASTES DE HIPÓTESIS HABITUALES:
1. Elegir un nivel de significación \(\alpha\): por ejemplo, \(0.001\), \(0.01\), \(0.05\),… (o en forma de porcentaje, \(0.1\)%, \(1\)%, \(5\)%,…)
2. Muestrear
3. Calcular el estadístico de contraste (depende del contraste concreto).
4. Calcular su \(p\)-valor (que mida la probabilidad de observar un estadístico de contraste tan incompatible con \(H_0\) o más aún, que el observado en la muestra.
5. Decisión:
  - RECHAZAR \(H_0\) si \(p\)-valor \(< \alpha\) (y aceptar en caso contrario)
  - Esto nos asegura un nivel de significación \(\alpha\).
OTRO PROCEDIMIENTO ESTÁNDAR PARA CONTRASTES DE HIPÓTESIS PARAMÉTRICOS:
- Si el contraste consiste en “desmentir” o no un “presunto” valor \(\theta_0\) de un parámetro \(\theta\) (que puede ser \(p\), \(\lambda\), \(\mu\), \(\sigma^2\), etc.).
  - \(\left\{ \begin{array}{l} H_0: \ \theta = \theta_0 \\ H_1: \ \theta \neq \theta_0 \end{array} \right.\)
- Se puede calcular el intervalo de confianza para \(\theta\) de nivel de confianza \(1 - \alpha\).
- Decisión:
  - ACEPTAR \(H_0\) si el presunto valor \(\theta_0\) pertenece al intervalo de confianza calculado (y rechazar en caso contrario)
  - Esto nos asegura un nivel de significación \(\alpha\).

4. Inferencia sobre la probabilidad de éxito \(p\) de una prueba de Bernoulli (o dos probabilidades de éxito \(p_1\) y \(p_2\) de dos pruebas de Bernoulli independientes)

Ejemplos:
- Estimar la proporción (o porcentaje a largo plazo) de efectividad de un tratamiento, de producción defectuosa, de favorables a una iniciativa, etc.
  - Una moneda se lanza \(100\) veces dando \(37\) caras. ¿Cuál es la probabilidad estimada de “cara”?
  - Una producción es serie saca \(5\) defectusos de los últimos \(300\) producidos. ¿Cuál es la tasa estimada de unidades defectuosas?
- Contrastar si esa proporción puede ser o no un valor preconcebido.
  - Una moneda “presuntamente” equilibrada está bajo sospecha de trucaje: ¿\(p = 0.5\), o bien \(p \neq 0.5\)?
  - Una producción es serie tiene una “presunta” tasa de defectos del \(1\)%, pero parace que se ha desajustado: ¿\(p = 0.01\), o bien \(p > 0.01\)?
- Contrastar si un nuevo tratamiento mejora al actual tratamiento.
  - Un tratamiento nuevo dice ser más efectivo (cura más pacientes) que el actual. ¿Es eso verdad? Si \(p_A\) es la tasa de curación del tratamiento actual y \(p_N\) es la tasa de curación del tratamiento nuevo, ¿\(p_N > p_A\), o bien es un bulo y \(p_N = p_A\)?
Situación general:
1. Un proceso de éxito/fracaso está caracterizado por la probabilidad (proporción, tasa o porcentaje) de éxito \(p\).
  - Inferencia 1: estimar dicha proporción
    - Con un valor concreto
    - Con un intervalo de confianza
  - Inferencia 2: contrastar:
    - si dicha proporción vale un “presunto” valor (es decir, \(p = p_0\)),
    - o bien si no lo es, con una de las tres opciones \(p \neq p_0\), \(p < p_0\) o \(p > p_0\).
2. Dos procesos (independientes) de éxito/fracaso están caracterizados por sus probabilidades (proporciones, tasas o porcentajes) de éxito \(p_1\) y \(p_2\).
  - Inferencia 1: estimar dichas proporciones
    - Con dos valores concretos respectivos
    - Con un intervalo de confianza para la diferencia \(p_1 - p_2\).
  - Inferencia 2: contrastar si
    - Ambas probabilidades coinciden (es decir, \(p_1 = p_2\)).
    - o bien si no coinciden, con una de las tres opciones \(p_1 \neq p_2\), \(p_1 < p_2\) o \(p_1 > p_2\).
FUNCIÓN prop.test(x, n, p, alternative, conf.level):
- Argumentos:
  - x: número de éxitos de la muestra (o vector con los dos números de éxitos de las dos muestras)
  - n: tamaño de la muestra (o vector con los dos tamaños de las dos muestras)
  - p: sólo si se hace el contraste:
    - para una sola muestra, “presunto” valor de \(p\), es decir, \(p_0\) (vale \(0.5\) por defecto)
    - para dos muestras, dejar su valor por defecto (NULL) para contrastar la igualdad de las dos proporciones.
  - alternative: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided" (para \(\neq\)), pero se debe cambiar a "greater" (si es \(>\)) o a "less" (si es \(<\)).
  - conf.level: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95.
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - sample estimates: la estimación puntual de la \(p\) si es una muestra (o de \(p_1\) y \(p_2\) si son dos muestras).
  - confidence interval: el intervalo de confianza para la \(p\) (si es una muestra), o para la diferencia \(p_1 - p_2\) (si son dos muestras).
  - p-value: el \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.

EJERCICIO 1: Un alumno quiere valorar su tasa de éxito en preguntas de Estadística. Para ello coge problemas al azar de un libro, y los resuelve, de modo que al final de la sesión, ha resuelto correctamente \(19\) de los \(30\) problemas atacados.

Calcula la estimación puntual de la “probabilidad de resolver correctamente un problema” de este alumno.
- Sol.: \(0.6333333\)
Calcula un intervalo de confianza para dicha probabilidad, usando un nivel del confianza del \(90\)%.
- Sol.: \(p \in [0.4668433, 0.7753366]\) con una confianza del \(90\)%
El alumno quiere demostrar que su eficacia de resolver problemas es superior al 50%. ¿Que dicen los datos si quiere una significación del \(5\)%?
- Sol.: Quiere demostrar \(H_1: \ p > 0.5\), y el contraste devuelve un \(p\)-valor = \(0.2012426\). Como \(p\)-valor \(>\) \(\alpha\), entonces debe aceptar \(H_0\), por lo que no demuestra su eficacia superior al \(50\)%.

FIN EJERCICIO 1

5. Inferencia sobre la media \(\mu\) de un modelo normal (o de cualquier modelo si la muestra es grande), o bien sobre la comparación de dos medias \(\mu_1\) y \(\mu_2\) de dos modelos normales (o de cualesquier modelo si las muestras son grandes)

Ejemplos:
- Analizar si está bien calibrada una máquina, por ejemplo, que dispensa 1500 cc de agua en botellas de agua mineral:
  - \(H_0: \ \mu = 1500\) (bien calibrada)
  - \(H_1: \ \mu \neq 1500\) (mal calibrada)
- Ver si un nuevo algoritmo \(X\) es más rápido que otro \(Y\)
  - \(H_0: \ \mu_X = \mu_Y\) (mismo tiempo medio)
  - \(H_1: \ \mu_X < \mu_Y\) (menos tiempo medio el nuevo)
Situación general:
- Un proceso modelizado por una variable normal \(X\) (o de cualquier tipo si la muestra es grande) de media desconocida.
  - Inferencia 1: estimar dicha media
    - Con un valor concreto
    - Con un intervalo de confianza
  - Inferencia 2: contrastar:
    - si dicha media vale un “presunto” valor (es decir \(\mu=\mu_0\)),
    - o bien si no lo es, con una de las tres opciones \(\mu \neq \mu_0\), \(\mu < \mu_0\) o \(\mu > \mu_0\).
- Dos procesos modelizados por sendas variables normales \(X\) e \(Y\) (o de cualquier tipo si las muestras son grandes), y cuyos datos son independientes entre sí o pueden estar emparejados por el muestreo.
  - Inferencia 1: estimar dichas medias
    - Con un valor concreto para cada una, si son muestras independientes.
    - Con un valor de “diferencia” entre ambas, si son muestras emparejadas.
    - Con un intervalo de confianza para la diferencia de las medias \(\mu_1 - \mu_2\) (en ambos casos)
  - Inferencia 2: contrastar si:
    - ambas medias coinciden (\(\mu_X = \mu_Y\))
    - o bien no coinciden, con una de las tres opciones \(\mu_X \neq \mu_Y\), \(\mu_X < \mu_Y\) o bien \(\mu_X > \mu_Y\)).
FUNCIÓN t.test(x, y, alternative, mu, paired, var.equal, conf.level):
- Argumentos:
  - x: datos de la primera muestra.
  - y: datos de la segunda muestra (si hay dos).
  - alternative: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided" (para \(\neq\)), pero se debe cambiar a "greater" (si es \(>\)) o a "less" (si es \(<\)).
  - mu: sólo si se hace el contraste:
    - para una sola muestra, “presunto” valor de \(\mu\)
    - para dos muestras, dejar su valor por defecto (0) para contrastar la igualdad de las dos medias, o cambiar si se presume una diferencia concreta distinta de \(0\).
  - paired: sólo para dos muestras. ¿Son datos emparejados por la forma de muestrear? Dejar por defecto (FALSE) si son independientes, y cambiar a TRUE si están emparejadas.
  - var.equal: sólo para dos muestras. ¿Se pueden considerar iguales las varianzas (poblacionales) de las dos muestras? Dejar por defecto (FALSE) si no se tienen indicios de lo contrario.
  - conf.level: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95.
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - sample estimates: la estimación puntual de la \(\mu\) (si es una muestra), de \(\mu_1\) y \(\mu_2\) (si son dos muestras independientes) o de la diferencia \(\mu_1 - \mu_2\) si son dos muestras emparejadas.
  - confidence interval: el intervalo de confianza para la \(\mu\) (si es una muestra), para la diferencia \(\mu_1 - \mu_2\) si son dos muestras emparejadas), o para las .
  - p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.

EJERCICIO 2: Para comparar la rapidez de dos operarios, se propone 10 tareas distintas, las mismas para ambos, y se registra el tiempo de cada uno en cada tarea.

Oper. / Trab.	1	2	3	4	5	6	7	8	9	10
A	5.05	5.1	5.21	4.98	4.58	4.94	5.1	5.15	5.46	5.11
B	4.68	4.92	5.22	5.07	5.24	4.89	4.83	5.11	5.13	4.87

Calcula el intervalo de confianza para el tiempo medio de cada uno, usando un nivel de confianza del \(99\)%.
- Sol.: \([4.8389794, 5.2970206]\) para A, y \([4.8063675, 5.1856325]\) para B.
Asumiendo un nivel de significación del \(3\)%, ¿los datos demuestran alguna diferencia significativa en la velocidad de ambos operarios?
- Sol.: Sale un \(p\)-valor = \(0.4658923 > 0.03\), que conduce a aceptar \(H_0\), por lo que no existen diferencias significativas.
¿Cómo quedaría el apartado anterior si los datos de la tabla fueran de 20 tareas distintas, asignando 10 a un operario y otras 10 a otro?
- Sol.: Saldría un \(p\)-valor = \(0.4419082 > 0.03\), que conduce a aceptar \(H_0\), por lo que no existen diferencias significativas.

FIN EJERCICIO 2

6. Inferencia sobre la igualdad de varianzas de dos poblaciones normales

Ejemplo: es conocido que la media de alturas en las poblaciones de hombres y muejres es distinta. ¿Lo es también la dispersión?
Situación general:
- Dos procesos modelizados por sendas variables continuas normales \(X\) e \(Y\) con varianzas \(\sigma_1^2\) y \(\sigma_2^2\) respectivas.
- Inferencia 1: estimar el cociente de ambas varianzas
  - Con un valor concreto.
  - Con un intervalo de confianza
- Inferencia 2: contrastar:
  - si dicho cociente vale un “presunto” valor (normalmente \(1\), que sería la igualdad de ambas varianzas)
  - o bien si no lo vale.
FUNCIÓN var.test(x, y, ratio, alternative, mu, conf.level):
- Argumentos:
  - x: datos de la primera muestra.
  - y: datos de la segunda muestra (si hay).
  - ratio: sólo si se hace el contraste. “Presunto” cociente de varianzas. Por defecto vale \(1\), y sirve para contrastar que sean iguales.
  - alternative: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided" (para \(\neq\)), pero se debe cambiar a "greater" (si es \(>\)) o a "less" (si es \(<\)).
  - conf.level: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95.
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - sample estimates: las estimaciones puntuales.
  - confidence interval: el intervalo de confianza.
  - p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.

6. Un contraste de normalidad

Cuando la muestra es pequeña, sólo se puede hacer inferencia sobre la media si los datos vienen de un modelo normal
Hay muchos contrastes que ayudan a decidir si una muestra es compatible con el modelo normal
- \(H_0\): la muestra viene de un modelo normal
- \(H_1\): no \(H_0\)
Los contrastes no son infalibles (y mucho menos para muestras pequeñas), por lo que hay que ser precavidos con esto.
Uno de los muchos contrastes de normalidad implementados en R, es el de Shapiro-Wilks.
FUNCIÓN shapiro.test(x):
- Argumentos:
  - x: datos de muestra
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.

7. El contraste (no paramétrico) Ji-cuadrado de Pearson sobre la bondad de ajuste

Ejemplo: un dado se usa para un juego de azar, y se sospecha que no está equilibrado, ¿cómo ponerlo a prueba?
Situación general:
- Podemos escribir el “presunto modelo” en forma de tabla de probabiliades (ver tabla más abajo)
- Podemos obtener una muestra y reprensentarla en tabla de frecuencias
- Inferencia: contrastar si la muestra es compatible con el modelo (es decir, la tabla de probabilidades)

El “presunto” modelo
.	\(X\)	\(x_1\)	\(x_2\)	…	\(x_k\)
.	\(f(x)\)	\(p_1\)	\(p_2\)	…	\(p_k\)

La muestra obtenida
.	\(x_i\)	\(x_1\)	\(x_2\)	…	\(x_k\)
.	\(n_i\)	\(n_1\)	\(n_2\)	…	\(n_k\)

Si se sospecha que el proceso ya no sigue el “presunto” modelo, y se quiere poner a prueba, se plantea el contraste:
- \(H_0\): la muestra se ajusta al “presunto” modelo
- \(H_1\): no \(H_0\)
FUNCIÓN chisq.test(x, p)
- Argumentos:
  - x: vector de las frecuencias absolutas de la muestra (suele ser el resultado de table() o bien directamente le vector c(\(n_1\) , \(n_2\) , \(\ldots\) , \(n_k\) ))
  - p: vector de probabilidades de la tabla, es decir c(\(p_1\) , \(p_2\) , \(\ldots\) , \(p_k\) ). Por defecto son todos iguales
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
  - Warning: mensaje de aviso si se está usando indebidamente el contraste.

EJERCICIO 3: Una muestra presenta los valores \(0\), \(1\), \(2\) y \(3\) con frecuencias respectivas \(15\), \(35\), \(28\) y \(19\). Se presume que el modelo viene dado por las probabilidades \(P(X=0) = 0.2\), \(P(X=1) = 0.3\), \(P(X=2) = 0.3\), \(P(X=3) = 0.2\). ¿La muestra es compatible con dicho modelo usando una significación del \(10\)%?

Sol.: Se obtiene un \(p\)-valor = \(0.5233365 > 0.1\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con el modelo.

FIN EJERCICIO 3

8. El contraste (no paramétrico) Ji-cuadrado de Pearson sobre la independiencia de dos variables cualitativas

Ejemplo: ¿es independiente el sexo de la lateralidad (uso de una mano u otra)? Si alguien piensa que no, ¿cómo ponerlo a prueba?
Situación general:
- Se observan conjuntamente dos variables \(X\) e \(Y\) cualitativas.
- Se puede disponer de las dos columnas de datos \((X,Y)\) o bien de la tabla de frecuencias conjuntas.
- Inferencia: contrastar si \(X\) es independiente de \(Y\)
  - \(H_0\): \(X\) e \(Y\) son independientes
  - \(H_1\): no \(H_0\)
FUNCIÓN chisq.test(x, y)
- Argumentos:
  - x: vector con los datos de \(X\), o bien matriz con la tabla de frecuencias conjuntas (que puede obtenerse a partir de table() sobre los datos originales, o bien escribirse directamente).
  - y: vector con los datos de \(Y\), o nada, si ya está todo en x.
- Devuelve: un objeto complejo que se muestra parcialmente en pantalla, del que interesa:
  - p-value: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.
  - Warning: mensaje de aviso si se está usando indebidamente el contraste.
Recordatorio: para definir una matriz en R, se incluye el siguiente ejemplo:
- \(\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}\)
- matrix(data=c(1,2,3,4,5,6), ncol=3, byrow=TRUE)
- se indican las entradas de la matriz, el número de columnas que tendrá, y si se quieren poner por filas.

EJERCICIO 4: Una muestra contiene \(82\) hombres diestros, \(8\) hombres zurdos, \(59\) mujeres diestras y \(11\) mujeres zurdas. ¿La muestra es compatible con que la lateralidad es independiente dle sexo, usando una significación del \(5\)%?

Sol.: Se obtiene un \(p\)-valor = \(0.281197 > 0.05\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con que sean independientes.

FIN EJERCICIO 4:

9. Ejercicios preapratorios extra

EJERCICIO 1
- 1.1. La variable x1 contiene datos que supondremos de una normal de media \(\mu\) desconocida.
  - 1. Calcula la media de la muestra.
  - 1. Realiza inferencia sobre la verdadera \(\mu\) del modelo que ha generado los datos.
    - (b1) Estimación puntual de la media.
    - (b2) Intervalo de confianza al 90% para la verdadera media \(\mu\).
    - (b3) ¿Se puede admitir que la media es 5 con una significación del 10% contra que la media no es 5?
    - (b4) ¿Se puede admitir que la media es 5 con una significación del 10% contra que la media es mayor que 5?
  - Sol.: (a) \(5.192\), (b1) \(5.192\), (b2) \([4.986376, 5.397624]\), (b3) p-valor = \(0.1232332\) > 0.1 (\(\alpha\)), por tanto ACEPTAMOS \(H_0: \mu=5\) por lo que la respuesta es SÍ. (b4) p-valor = \(0.0616166\) < 0.1 (\(\alpha\)), por tanto RECHAZAMOS \(H_0: \mu=5\) en favor de \(H_1: \mu > 5\), por lo que la respuesta es NO.
- 1.2. Los datos de la variables x2 y x3 recogen los tiempos de entrenamiento de 2 atletas.
  - 1. Calcula el tiempo medio de cada atleta.
  - 1. Si suponemos que los tiempos de los dos atletas siguen ambos modelos normales, ¿se puede aceptar que tienen la misma media desconocida usando una significación del 1%?
  - 1. Calcula el intervalo de confianza para la diferencia de las dos medias usando un nivel de confianza del 90%.
  - Sol.: (a) \(10.197\) y \(10.119\) resp., (b) p-valor = \(0.0205365\) > 0.01 (\(\alpha\)), por tanto ACEPTAMOS \(H_0: \mu_X = \mu_Y\), por lo que la respuesta es SÍ, (c) \([0.0247966, 0.1312034]\).
- 1.3. La hoja de datos x4 recoge los tiempos de dos operarios en realizar una serie de tareas (las mismas tareas para cada uno).
  - 1. Calcula el tiempo medio por tarea de cada operario.
  - 1. Si suponemos que los tiempos siguen ambos modelos normales, ¿se puede aceptar que ambos operarios son igual de eficientes (misma media desconocida) usando una significación del 5%?
  - Sol.: (a) \(79.31\) y \(79.7\) resp., (b) p-valor = \(0.8680351\) > 0.05 (\(\alpha\)), por tanto ACEPTAMOS \(H_0: \mu_X = \mu_Y\) por lo que la respuesta es SÍ.
EJERCICIO 2
- Contrasta si se puede aceptar o no que las varianzas (desconocidas) de los tiempos de los atletas son iguales usando una significación del 10%.
  - Sol.: p-valor = \(0.6484925\) > 0.10 (\(\alpha\)), por tanto ACEPTAMOS \(H_0\) (igualdad de varianzas), por lo que la respuesta es SÍ.
EJERCICIO 3
- 3.1. Un alumno se quiere presentar a las elecciones de delegado de curso si puede aceptar que va a tener un % de voto superior al 33%. Para ello pregunta a 13 compañeros, entre los que 9 declaran que le votarían. ¿Qué decisión debería tomar si asume una significación del 10%?
  - Sol.: p-valor = \(0.1336287\) > 0.10 (\(\alpha\)), por tanto ACEPTARÍA \(H_0: p=0.33\) (sale un aviso de aproximación que puede ser incorrecta), por lo que la respuesta es SÍ (pero con reparos).
- 3.2. Se quiere comparar la eficacia de dos tratamientos. Uno de ellos se aplica a un grupo de 25 personas de las que 14 mejoran. El otro se aplica a un grupo de 33 personas de las que sólo 11 mejoran.
  - 1. Calcula el porcentaje de éxito de cada tratamiento.
  - 1. Calcula un intervalo de confianza para cada \(p\) usando un nivel de confianza del 90%.
  - 1. Contrasta si se puede aceptar que los dos tratamientos tienen la misma eficacia (misma ‘p’) usando una significación del 10%.
  - 1. Contrasta si se puede aceptar que los dos tratamientos tienen la misma eficacia (misma ‘p’) usando una significación del 10% contra la hipótesis de que el primero es mejor que el segundo.
  - Sol.: (a) \(56\)% y \(33.3333333\)% resp., (b) \([0.3802979, 0.7266203]\) y \([0.203008, 0.4916309]\) resp., (c) p-valor = \(0.1446929\) > 0.10 (\(\alpha\)), por tanto ACEPTAMOS \(H_0: p_X = p_Y\) (la igualdad de eficacias) por lo que la respuesta es SÍ, (d) p-valor = \(0.0723464\) < 0.10 (\(\alpha\)), por tanto RECHAZAMOS \(H_0: p_X = p_Y\) (la igualdad de eficacias) por lo que la respuesta es NO.
EJERCICIO 4
- Contrasta si se ha hecho bien en el ejercicio 1.1. al asumir que los datos de la variable x1 venían de una normal usando una significación del 10%.
  - Sol: p-valor = \(0.0874044\) < 0.10 (\(\alpha\)), por tanto RECHAZAMOS \(H_0:\) (modelo normal), por lo que la respuesta es NO.
EJERCICIO 5
- Contrasta si se puede aceptar que el número de respuestas correctas de alumnos a un examen tipo test de 5 preguntas sigue el modelo binomial de \(n = 5\) y \(p = 0.5\), usando una significación del 10%, y donde los datos están en el vector x5.
  - Ayuda: dbinom(...) para obtener las probabilidades del modelo binomial y poder ponerlo en forma de tabla.
  - Sol.: p-valor = \(0.0886439\) < 0.10 (\(\alpha\)) por tanto RECHAZAMOS \(H_0:\) (modelo binomial del enunciado), por lo que la respuesta es NO. Ojo al aviso de aproximación incorrecta.
EJERCICIO 6
- Según la muestra de la encuesta realizada al inicio de curso, contrasta si se puede aceptar que las variables sobre internet en el móvil y el sistema operativo en PC son independientes, usando un nivel de significación del 10%.
  - Sol.: p-valor = \(0.7670897\) > 0.10 (\(\alpha\)) por tanto ACEPTAMOS \(H_0:\) (independientes), por lo que la respuesta es SÍ.

Práctica 4: Inferencia estadística básica

EI1012-MT1012 Estadística y Optimización (2015/2016)

Pablo Gregori, Universitat Jaume I de Castellón

0. Los datos de la práctica

1. Inferencia estadística