load(url('http://goo.gl/tqMDyM'))
Se utilizarán en la sección de ejercicios.
prop.test(x, n, p, alternative, conf.level)
:
x
: número de éxitos de la muestran
: tamaño de la muestrap
: sólo si se hace el contraste: “presunto” valor de \(p\), es decir, \(p_0\) (vale \(0.5\) por defecto)alternative
: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided"
(para \(\neq\)), pero se debe cambiar a "greater"
(si es \(>\)) o a "less"
(si es \(<\)).conf.level
: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95
.sample estimates
: la estimación puntual de la \(p\)confidence interval
: el intervalo de confianza para la \(p\)p-value
: el \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.EJERCICIO 1: Un alumno quiere valorar su tasa de éxito en preguntas de Estadística. Para ello coge problemas al azar de un libro, y los resuelve, de modo que al final de la sesión, ha resuelto correctamente \(19\) de los \(30\) problemas atacados.
FIN EJERCICIO 1
prop.test(x, n, p, alternative, conf.level)
:
x
: vector con los dos números de éxitos de las dos muestrasn
: vector con los dos tamaños de las dos muestrasp
: sólo si se hace el contraste: dejar su valor por defecto (NULL
) para contrastar la igualdad de las dos proporciones.alternative
: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided"
(para \(\neq\)), pero se debe cambiar a "greater"
(si es \(>\)) o a "less"
(si es \(<\)).conf.level
: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95
.sample estimates
: la estimación puntual de \(p_1\) y \(p_2\)confidence interval
: el intervalo de confianza para la diferencia \(p_1 - p_2\)p-value
: el \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.EJERCICIO 2: Dos alumnos quieren comparar su tasa de efectividad en preguntas tipo test de estadística. Uno ha acertado 15 preguntas de 25, y el otro ha acertado 10 de 20. A priori, no se puede decir que uno sea mejor que el otro. ¿Qué diría la estadística con estos datos, si se usa un nivel de significación del 10%?.
FIN EJERCICIO 1
t.test(x, alternative, mu, conf.level)
:
x
: datos de la primera muestra.alternative
: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided"
(para \(\neq\)), pero se debe cambiar a "greater"
(si es \(>\)) o a "less"
(si es \(<\)).mu
: sólo si se hace el contraste: “presunto” valor de \(\mu\)conf.level
: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95
.sample estimates
: la estimación puntual de la \(\mu\)confidence interval
: el intervalo de confianza para la \(\mu\)p-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.EJERCICIO 3: Se supone que el tiempo que emplea un operario en realizar una serie de tareas sigue el modelo normal. Se registra el tiempo, en minutos, que emplea en las 10 últimas tareas:
Tarea | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
Tiempo | 5.05 | 5.1 | 5.21 | 4.98 | 4.58 | 4.94 | 5.1 | 5.15 | 5.46 | 5.11 |
FIN EJERCICIO 3
t.test(x, y, alternative, mu, paired, var.equal, conf.level)
:
x
: datos de la primera muestra.y
: datos de la segunda muestra.alternative
: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided"
(para \(\neq\)), pero se debe cambiar a "greater"
(si es \(>\)) o a "less"
(si es \(<\)).mu
: sólo si se hace el contraste: dejar su valor por defecto (0
) para contrastar la igualdad de las dos medias, o cambiar si se presume una diferencia concreta distinta de \(0\).paired
: ¿Son datos emparejados por la forma de muestrear? Dejar por defecto (FALSE
) si son independientes, y cambiar a TRUE
si están emparejadas.var.equal
: ¿Se pueden considerar iguales las varianzas (poblacionales) de las dos muestras? Dejar por defecto (FALSE
) si no se tienen indicios de lo contrario.conf.level
: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95
.sample estimates
: la estimación puntual de \(\mu_1\) y \(\mu_2\) (si son dos muestras independientes) o de la diferencia \(\mu_1 - \mu_2\) si son dos muestras emparejadas.confidence interval
: el intervalo de confianza para la diferencia \(\mu_1 - \mu_2\).p-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.EJERCICIO 4: Para comparar la rapidez de dos operarios, se propone 10 tareas distintas, las mismas para ambos, y se registra el tiempo de cada uno en cada tarea.
Oper. / Trab. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
A | 5.05 | 5.1 | 5.21 | 4.98 | 4.58 | 4.94 | 5.1 | 5.15 | 5.46 | 5.11 |
B | 4.68 | 4.92 | 5.22 | 5.07 | 5.24 | 4.89 | 4.83 | 5.11 | 5.13 | 4.87 |
FIN EJERCICIO 4
var.test(x, y, ratio, alternative, mu, conf.level)
:
x
: datos de la primera muestra.y
: datos de la segunda muestra (si hay).ratio
: sólo si se hace el contraste. “Presunto” cociente de varianzas. Por defecto vale \(1\), y sirve para contrastar que sean iguales.alternative
: sólo si se hace el contraste. Dirección de \(H_1\). Por defecto vale "two-sided"
(para \(\neq\)), pero se debe cambiar a "greater"
(si es \(>\)) o a "less"
(si es \(<\)).conf.level
: Nivel de confianza. Sólo si se pide el intervalo de confianza. Su valor por defecto es 0.95
.sample estimates
: las estimaciones puntuales.confidence interval
: el intervalo de confianza.p-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.shapiro.test(x)
:
x
: datos de muestrap-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.El “presunto” modelo (tabla de probabilidades) | |||||
---|---|---|---|---|---|
. | \(X\) | \(x_1\) | \(x_2\) | … | \(x_k\) |
. | \(f(x)\) | \(p_1\) | \(p_2\) | … | \(p_k\) |
La muestra obtenida (tabla de frecuencias) | |||||
---|---|---|---|---|---|
. | \(x_i\) | \(x_1\) | \(x_2\) | … | \(x_k\) |
. | \(n_i\) | \(n_1\) | \(n_2\) | … | \(n_k\) |
chisq.test(x, p)
x
: vector de las frecuencias absolutas de la muestra (suele ser el resultado de table()
o bien directamente le vector c(
\(n_1\) ,
\(n_2\) ,
\(\ldots\) ,
\(n_k\) )
)p
: vector de probabilidades de la tabla, es decir c(
\(p_1\) ,
\(p_2\) ,
\(\ldots\) ,
\(p_k\) )
. Por defecto son todos igualesp-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.Warning
: mensaje de aviso si se está usando indebidamente el contraste.EJERCICIO 5: Una muestra presenta los valores \(0\), \(1\), \(2\) y \(3\) con frecuencias respectivas \(15\), \(35\), \(28\) y \(19\). Se presume que el modelo viene dado por las probabilidades \(P(X=0) = 0.2\), \(P(X=1) = 0.3\), \(P(X=2) = 0.3\), \(P(X=3) = 0.2\). ¿La muestra es compatible con dicho modelo usando una significación del \(10\)%?
FIN EJERCICIO 5
chisq.test(x, y)
x
: vector con los datos de \(X\), o bien matriz con la tabla de frecuencias conjuntas (que puede obtenerse a partir de table()
sobre los datos originales, o bien escribirse directamente usando matrix(...)
).y
: vector con los datos de \(Y\), o nada, si ya está todo en x
.p-value
: \(p\)-valor del estadístico de contraste, que sirve para tomar la decisión.Warning
: mensaje de aviso si no se cumplen ciertas condiciones técnicas para usarlo.matrix(data=c(1,2,3,4,5,6), ncol=3, byrow=TRUE)
EJERCICIO 6: Una muestra contiene \(82\) hombres diestros, \(8\) hombres zurdos, \(59\) mujeres diestras y \(11\) mujeres zurdas. ¿La muestra es compatible con que la lateralidad es independiente del sexo, usando una significación del \(5\)%?
FIN EJERCICIO 6
x1
contiene datos que supondremos de una normal de media \(\mu\) desconocida.
x2
y x3
recogen los tiempos de entrenamiento de 2 atletas.
x4
recoge los tiempos de dos operarios en realizar una serie de tareas (las mismas tareas para cada uno).
x1
venían de una normal usando una significación del 10%.
x5
. Es decir \(\left\{ \begin{array}{l} H_0: \ \text{muestra viene de Bin(5, 0.5)} \\ H_1: \ \text{no } H_0 \end{array} \right.\) (ayuda: usa dbinom(...)
para poner el modelo binomial en forma de tabla de probabilidades).
x
), contrasta si se puede aceptar que las variables sobre internet en el móvil y el sistema operativo en PC son independientes, usando un nivel de significación del 10%. Es decir, si \(\left\{ \begin{array}{l} \text{'internet' y 'so_pc' independientes} \\ H_1: \ \text{No } H_0 \end{array} \right.\)