Copia el siguiente bloque de código en la consola de R para cargar los datos de la práctica (se utilizarán en la sección de ejercicios):
load(url('http://goo.gl/tqMDyM'))
ATENCIÓN: escribe siempre el nombre de los argumentos de las funciones, o se pueden dar errores involuntarios
sample estimates
)
dar un valor “razonable” del parámetro desconocido, a partir de la
muestra observada.confidence interval
) dar un intervalo de valores
“razonables” del parámetro a partir de:
test
)prop.test(x, n, p, alternative, conf.level)
(atención,
no olvides escribir los nombres de los argumentos que uses):
x
: número de éxitos de la muestran
: tamaño de la muestrap
: sólo para el contraste, Valor presunto \(p_0\) (NULL
por defecto)alternative
: sólo para el contraste. Dirección de \(H_1\).
"two.sided"
para \(\neq\) (por defecto)"less"
para \(<\)"greater"
para \(>\)conf.level
: sólo para intervalo de confianza. Nivel de
confianza (por defecto \(0.95\))p-value
: el \(p\)-valor del estadístico de contraste, que
sirve para tomar la decisión.sample estimates
: la estimación puntualconfidence interval
: el intervalo de confianzaEJERCICIO 1: Un alumno quiere valorar su tasa de éxito en preguntas de Estadística. Para ello coge problemas al azar de un libro, y los resuelve, de modo que al final de la sesión, ha resuelto correctamente \(19\) de los \(30\) problemas atacados.
FIN EJERCICIO 1
prop.test(x, n, p, alternative, conf.level)
(atención,
no olvides escribir los nombres de los argumentos que uses):
x
: vector con los DOS números de
éxitos de las dos muestrasn
: vector con los DOS tamaños de las
dos muestrasp
: sólo para contraste. Dejar su valor por defecto
(NULL
) para contrastar la igualdad de las dos
proporciones.alternative
: sólo para contraste. Dirección de \(H_1\).
"two.sided"
para \(\neq\) (por defecto)"less"
para \(<\)"greater"
para \(>\)conf.level
: sólo para intervalo de confianza. Nivel de
confianza (por defecto 0.95
)p-value
: el \(p\)-valor del estadístico de contraste, que
sirve para tomar la decisión.confidence interval
: el intervalo de confianza para la
diferencia \(p_1 - p_2\)sample estimates
: las estimaciones puntuales de \(p_1\) y \(p_2\)EJERCICIO 2: Dos alumnos quieren comparar su tasa de efectividad en preguntas tipo test de estadística. Uno ha acertado 15 preguntas de 25, y el otro ha acertado 10 de 20. A priori, no se puede decir que uno sea mejor que el otro:
FIN EJERCICIO 2
t.test(x, alternative, mu, conf.level)
(atención, no
olvides escribir los nombres de los argumentos que uses):
x
: datos de la muestra.alternative
: Dirección de \(H_1\).
"two.sided"
para \(\neq\) (por defecto)"less"
para \(<\)"greater"
para \(>\)mu
: \(\mu_0\), el
presunto valor (por defecto 0
).conf.level
: nivel de confianza (por defecto
0.95
).p-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.confidence interval
: el intervalo de confianza para la
\(\mu\)sample estimates
: la estimación puntual de la \(\mu\)EJERCICIO 3: Se supone que el tiempo que emplea un operario en realizar una serie de tareas sigue el modelo normal. Se registra el tiempo, en minutos, que emplea en las 10 últimas tareas:
Tarea | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
Tiempo | 5.05 | 5.1 | 5.21 | 4.98 | 4.58 | 4.94 | 5.1 | 5.15 | 5.46 | 5.11 |
FIN EJERCICIO 3
t.test(x, y, alternative, mu, paired, var.equal, conf.level)
(atención, no olvides escribir los nombres de los argumentos que
uses):
x
: datos de la muestra 1.y
: datos de la muestra 2.alternative
: sólo para contraste. Dirección de \(H_1\).
"two.sided"
para \(\neq\) (por defecto)"less"
para \(<\)"greater"
para \(>\)mu
: sólo para contraste. \(\mu_0\), el presunto valor (por defecto
\(0\) para comparar la igualdad).paired
: IMPORTANTE. Por defecto
FALSE
, indica datos independientes. Si los datos están
emparejados por el muestreo, poner TRUE
.var.equal
: por defecto FALSE
. Si hubiera
motivos para suponer que las varianzas poblacionales son iguales, se
pondría TRUE
, pero no es el caso en esta práctica.conf.level
: sólo para intervalo de confianza. Nivel de
confianza (por defecto 0.95
).p-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.confidence interval
: el intervalo de confianza para la
diferencia \(\mu_1 - \mu_2\).sample estimates
: la estimación puntual de \(\mu_1\) y \(\mu_2\) (si son dos muestras
independientes) o de la diferencia \(\mu_1 -
\mu_2\) (si son dos muestras emparejadas).EJERCICIO 4: Para comparar la rapidez de dos operarios, se proponen 10 tareas distintas, las mismas para ambos (!), y se registra el tiempo de cada uno en cada tarea.
Oper. / Trab. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
A | 5.05 | 5.1 | 5.21 | 4.98 | 4.58 | 4.94 | 5.1 | 5.15 | 5.46 | 5.11 |
B | 4.68 | 4.92 | 5.22 | 5.07 | 5.24 | 4.89 | 4.83 | 5.11 | 5.13 | 4.87 |
FIN EJERCICIO 4
var.test(x, y, ratio, alternative, conf.level)
(atención, no olvides escribir los nombres de los argumentos que
uses):
x
: datos de la muestra 1.y
: datos de la muestra 2.ratio
: sólo para contraste. \(k\), el presunto cociente (por defecto
\(1\) para comparar la igualdad de
varianzas).alternative
: sólo para contraste. Dirección de \(H_1\).
"two.sided"
para \(\neq\) (por defecto)"less"
para \(<\)"greater"
para \(>\)conf.level
: sólo para intervalo de confianza. Nivel de
confianza. Su valor por defecto es 0.95
.p-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.confidence interval
: el intervalo de confianza para
·\(\sigma^2_1 / \sigma^2_2\).sample estimates
: el cociente de las varianzas
muestrales.shapiro.test(x)
:
x
: datos de muestrap-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.chisq.test(x, p)
(atención, no olvides escribir los nombres de los argumentos que
uses)
x
: vector con las frecuencias (i.e. repeticiones) de
cada dato de la muestra. Si se tiene la muestra completa, las
frecuencias se consiguen con table()
aplicado a la
muestra)p
: vector de probabilidades del
modelo, es decir c(
\(p_1\) ,
\(p_2\) ,
\(\ldots\) ,
\(p_k\) )
.p-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.Warning
: devuelve un mensaje de peligro (de mala
aproximación, si no se cumplen ciertos requisitos). No es un error, pero
es importante indicarlo.EJERCICIO 5: Una muestra presenta los valores \(0\), \(1\), \(2\) y \(3\) con frecuencias respectivas \(15\), \(35\), \(28\) y \(19\). Se presume que el modelo viene dado por las probabilidades \(P(X=0) = 0.2\), \(P(X=1) = 0.3\), \(P(X=2) = 0.3\), \(P(X=3) = 0.2\). ¿La muestra es compatible con dicho modelo usando una significación del \(10\)%? Es decir, se quiere resolver el contraste \(\left\{ \begin{array}{l} H_0: \ \text{la muestra viene del modelo } \begin{array}{|c|c|c|c|c|} \hline X & 0 & 1 & 2 & 3 \\ \hline f(X) & 0.2 & 0.3 & 0.3 & 0.2 \\ \hline\end{array} \\ H_1: \ \text{No } H_0 \end{array} \right.\) (Sol.: Se obtiene un \(p\)-valor = \(0.5233365 > 0.1\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con el modelo.)
FIN EJERCICIO 5
chisq.test(x, y)
(atención, no olvides escribir los nombres de los argumentos que
uses):
x
vector con los datos de la muestra de \(X\), e y
vector con los datos
de la muestra de \(Y\), o bienx
= tabla de frecuencias conjuntas de \(X\) e \(Y\) (que puede obtenerse con la función
table()
sobre los datos de ambas variables, o bien escrita
como matriz usando la función matrix(...)
). y
se queda sin usar, porque x
lo tiene todo.p-value
: \(p\)-valor
del estadístico de contraste, que sirve para tomar la decisión.Warning
: mensaje de peligro de mala aproximación (si
procede).matrix(data=c(1,2,3,4,5,6), ncol=3, byrow=TRUE)
EJERCICIO 6: Una muestra contiene \(82\) hombres diestros, \(8\) hombres zurdos, \(59\) mujeres diestras y \(11\) mujeres zurdas. ¿La muestra es compatible con que la “lateralidad manual” es independiente del “sexo”, usando una significación del \(5\)%? (Sol.: Se obtiene un \(p\)-valor = \(0.281197 > 0.05\), por lo que se acepta \(H_0\), es decir, que la muestra sí es compatible con que sean independientes.)
FIN EJERCICIO 6
prop.test(x, n, p, alternative, conf.level)
prop.test(x, n, p, alternative, conf.level)
t.test(x, alternative, mu, conf.level)
t.test(x, y, alternative, mu, paired, var.equal, conf.level)
var.test(x, y, ratio, alternative, conf.level)
shapiro.test(x)
chisq.test(x, p)
chisq.test(x, y)
x1
contiene
datos que supondremos de una normal de media \(\mu\) desconocida.
x2
y x3
recogen los tiempos de entrenamiento
de 2 atletas.
x4
recoge los tiempos de dos operarios en realizar una serie de tareas
(las mismas tareas para cada uno).
x1
venían del modelo normal usando una significación del
10%. (Sol.: p-valor = \(0.0874044\)
< 0.10 (\(\alpha\)), por tanto
RECHAZAMOS \(H_0:\) (modelo normal),
por lo que la respuesta es NO.)x5
. Es decir \(\left\{
\begin{array}{l} H_0: \ \text{muestra viene de Bin(5, 0.5)} \\ H_1: \
\text{no } H_0 \end{array} \right.\) (ayuda:
para conseguir la tabla de probabilidad del modelo binomial necesitas la
función dbinom(...)
de la Práctica
3). (Sol.: p-valor = \(0.0886439\) < 0.10 (\(\alpha\)) por tanto RECHAZAMOS \(H_0:\) (modelo binomial del enunciado), por
lo que la respuesta es NO (sale un mensaje de aviso de aproximación
incorrecta).)x
), contrasta si se
puede aceptar que las columnas sobre internet en el móvil
(internet
) y el sistema operativo en PC
(so_pc
) son independientes, usando un nivel de
significación del 10%. Es decir, si \(\left\{
\begin{array}{l} H_0:\text{'internet' y 'so_pc'
independientes} \\ H_1: \ \text{No } H_0 \end{array} \right.\)
(Sol.: p-valor = \(0.7670897\) >
0.10 (\(\alpha\)) por tanto ACEPTAMOS
\(H_0:\) (independientes), por lo que
la respuesta es SÍ.)