En esta práctica se presenta R como la “calculadora natural” para las probabilidades.
1. Probabilidad condicionada, teorema de la probabilidad total y teorema de Bayes
- Si \(P\) es una probabilidad, \(A\) es un suceso con probabilidad no nula, y \(A_1\), \(A_2\), …, \(A_n\) forma una partición disjunta del espacio muestral en sucesos con probabilidad no nula, entonces:
- Def (probabilidad condicionada): \(\displaystyle{P(B|A) = \frac{P(A \cap B)}{P(A)}}\)
- Tma (de la probabilidad total): \(P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + \cdots + P(B|A_n)P(A_n)\)
- Tma (de Bayes): \(\displaystyle{P(A_i|B) = \frac{P(B|A_i)P(A_i)}{P(B)} = \frac{P(B|A_i)P(A_i)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + \cdots + P(B|A_n)P(A_n)}}\)
- R se puede usar como una calculadora, usando las operaciones
+
, *
y /
, en la ventana de instrucciones.
2. Probabilidades en experimentos con equiprobabilidad de resultados
- Si el espacio muestral contiene \(n\) resultados posibles, y todos ellos son equiprobables, entonces cada uno tiene probabilidad \(\frac{1}{n}\).
- \(P(A) = \frac{\text{casos favorables a }A}{\text{casos posibles}}\)
- La combinatoria es una técnica de recuento automática, que ayuda a contar los casos posibles y favorables en algunas situaciones.
- En R:
- La potencia \(365^{30}\) se calcula mediante
365^30
y da \(7.3924081\times 10^{76}\).
- El factorial \(8!\) se calcula mediante
factorial(8)
y da 4.03210^{4}.
- El número combinatorio \(\binom{10}{4}\) se calcula mediante
choose(10,4)
y da \(210\).
3. Variables aleatorias y funciones asociadas a la probabilidad
- Si \(X\) es variable aleatoria, los sucesos más habituales son de la forma:
- \(X = a\)
- \(X \neq a\)
- \(X < a\)
- \(X \leq a\)
- \(X > a\)
- \(X \geq a\)
- \(a < X \leq b\)
- \(a < X < b\)
- \(a \leq X < b\)
- \(a \leq X \leq b\)
- donde \(a\) y \(b\) son dos números reales ordenados (\(a < b\))
- Cualquier otro suceso “razonable” se puede poner como unión disjunta de éstos (y su probabilidad es la suma de las probabilidades), o bien condicionadas.
- Gracias a la propiedad “del complementario” (\(P(\overline{A}) = 1 - P(A)\)) se pueden reducir unos casos a otros. Por ejemplo:
- \(P(X \neq a) = 1 - P(X = a)\)
- \(P(X > a) = 1 - P(X \leq a)\)
- Gracias a la propiedad de la union disjunta (\(P(A \cup B) = P(A) + P(B)\)) se puede conseguir la relación:
- \(P(X \leq b) = P(X \leq a) + P(a < X \leq b)\), y de ahí:
- \(P(a < X \leq b) = P(X \leq b) - P(X \leq a)\)
- Hay variables aleatorias DISCRETAS y CONTINUAS.
- Las discretas suelen tomar valores en los números naturales (0, 1, 2, etc.)
- Las continuas suelen tomar valores en un intervalo (continua) de números reales (\([0,1]\), o \([0, +\infty)\) o \(\mathbb{R}\)).
- En variable DISCRETA:
- \(X < 5\) es lo mismo que \(X \leq 4\), por tanto podemos traducir el caso \(X<a\) a \(X \leq a-1\).
- En variable CONTINUA:
- \(X < 5\) NO es lo mismo que \(X \leq 5\), pero sus probabilidades SÍ que son iguales. Por tanto podemos traducir el caso \(P(X<a)\) a \(P(X \leq a)\).
- Además, piensa un poco y verás que \(X < 5\) NO es lo mismo que \(X \leq 4\), ni \(X \leq 4.9\), ni \(X \leq 4.99\), ni \(X \leq 4.999\), etc.
- Por todo esto, sólo se han definido dos funciones asociadas a la probabilidad, que tienen algún detalle distinto según sea la variable discreta o continua
- \(F(x) = P(X \leq x)\), se llama función de distribución (y se usa para variable discreta y continua indistintamente)
- \(f(x)\):
- si \(X\) es variable aleatoria DISCRETA, se llama función de probabilidad, masa o cuantía, y \(P(X = x) = f(x)\)
- si \(X\) es variable aleatoria CONTINUA, se llama función de densidad de probabilidad, y no representa ninguna probabilidad, puesto que \(P(X = x) = 0\), lo que a su vez implica que:
- \(P(X < a) = P(X \leq a)\),
- La consecuencia de esto es que, en variable continua, los signos \(<\) y \(\leq\) son equivalentes para calcular probabilidades
- Cuantil de orden \(p\): valor \(x_p\) que cumple que \(P(X \leq x_p) = p\) (en variable continua). En variable discreta es algo más complicado, pero se puede usar la misma interpretación “valor, de modo que, la probabilidad de que la variable sea menor que dicho valor es \(p\)”.
4. Modelos de variables aleatorias
- ALGUNOS MODELOS DE VARIABLE DISCRETA:
- BINOMIAL \(Bi(n,p)\): número de éxitos en \(n\) intentos independientes, donde cada intento tiene probabilidad \(p\) de éxito
- En R, los parámetros son
Ensayos binomiales
\(=n\) y Probabilidad de éxito
\(=p\)
- BINOMIAL NEGATIVA \(BN(k,p)\): número de intentos necesarios para conseguir \(k\) éxitos, donde cada intento tiene probabilidad \(p\) de éxito
- En R, los parámetros son
Número de éxitos
\(=k\) y Probabilidad de éxito
\(=p\), pero ¡ojo!, R cuenta el número de fracasos, no el número de intentos. Por eso, hay que tener en cuenta que el número de fracasos es igual al número de intentos menos el número de éxitos (\(k\)).
- HIPERGEOMÉTRICA \(HG(N, n, p)\): número de éxitos al extraer \(n\) objetos de un lote de \(N\) objetos equiprobables, donde la proporción inicial de objetos tipo éxito es \(p\)
- En R, los parámetros son
m
\(=Np\), n
\(=N(1-p)\) y k
\(=n\).
- POISSON \(Po(\lambda)\): número de éxitos observados en un intervalo de tiempo o espacio, del que se sabe que el número medio es \(\lambda\)
- En R, el parámetro es
Media
\(=\lambda\).
- ALGUNOS MODELOS DE VARIABLE CONTINUA:
- UNIFORME \(U(a,b)\): número elegido completamente al azar en el intervalo \([a,b]\)
- En R, los parámetros son
Mínimo
\(=a\), Máximo
\(=b\).
- NORMAL \(N(\mu, \sigma^2)\): valor observado. No hay experimento prototipo. Por teorema del límite central, se puede aplicar a una suma de “muchas” variables aleatorias
- En R, los parámetros son
Media
\(=\mu\), Desviación típica
\(=\sqrt{\sigma^2}\) (observa que R usa la desviación típica, y no la varianza, por eso debes tener cuidado al poner esos datos).
5. ¿Cómo calcula probabilidades R-Commander?
- Para cada modelo de probabilidad, R-commander ofrece en el menú
Distribuciones
los cálculos:
- En variable DISCRETA
- Cuantiles: que calcula el valor de la variable que deja por debajo con cierta probabilidad al resto de valores
- Probabilidades acumuladas
- Cola izquierda: \(P(X \leq x)\), que coincide con \(F(x)\)
- Cola derecha: \(P(X > x)\)
- Probabilidades: \(f(x)\), que coincide con \(P(X = x)\)
- Gráfica: de \(f\) o \(F\)
- Muestra aleatoria: simula datos procedentes de esa variable
- En variable CONTINUA
- Cuantiles: que calcula el valor de la variable que deja por debajo con cierta probabilidad al resto de valores
- Probabilidades
- Cola izquierda: \(P(X \leq x)\) (coincide con \(F(x)\))
- Cola derecha: \(P(X > x)\)
- Gráfica: de \(f\) o \(F\)
- Muestra aleatoria: simula datos procedentes de esa variable
6. Algunos ejemplos de cómo adaptar tus probabilidades para calcularlas con R-commander
- Debes adaptarte a los resultados que te ofrece el R-Commander
- Ejemplos:
- \(P(X = 3)\):
- Si \(X\) discreta, pide probabilidades (no acumuladas), y de la tabla ofrecida escoge la del \(3\)
- Si \(X\) continua, es probable que sea un error, pues \(P(X=3) = 0\) (sin hacer cálculos)
- \(P(X \leq 3)\) (probabilidades acumuladas, cola izquierda de 3)
- \(P(X < 3)\) (probabilidades acumuladas, no es cola izquierda, hay que adaptarlo)
- Si \(X\) discreta: \(P(X < 3) = P(X \leq 2)\) (cola izquierda de 2)
- Si \(X\) continua: \(P(X < 3) = P(X \leq 3)\) (cola izquierda de 3)
- \(P(X > 3)\) (probabilidades acumuladas, cola derecha de 3)
- \(P(X \geq 3)\) (probabilidades acumuladas, no es cola derecha, hay que adaptarlo)
- Si \(X\) discreta: \(P(X \geq 3) = P(X > 2)\) (cola derecha de 2)
- Si \(X\) continua: \(P(X \geq 3) = P(X > 3)\) (cola derecha de 3)
- \(P(4 < X \leq 7)=\) (aplicamos fórmula) \(= F(7)-F(4)\) (resta de colas izquierda de 7 y 4)
- Las variantes a esta forma se deben adaptar, por ejemplo, para \(P(4 \leq X < 7)\):
- Si \(X\) discreta: \(P(4 \leq X < 7) = P(3 < X \leq 6)=\) (resta de colas izquierda de 6 y 3)
- Si \(X\) continua: \(P(4 \leq X < 7) = P(4 < X \leq 7)=\) (resta de colas izquierda de 7 y 4)
- Ejemplo del modelo binomial negativo:
- si \(X \sim BN(k=3, p=0.2)\) y se pide \(P(X \leq 10)\),
- Se pide probabilidad de “menor o igual a 10 intentos”
- Como se buscan \(k=3\) éxitos, entonces “menor o igual a 10 intentos” es lo mismos que “menor o igual a 10-3 fracasos”.
- Por tanto pedimos a R que calcule \(P(X_R \leq 10-3) = P(X_R \leq 7)\) (cola izquierda de 7)
7. Ejercicios
- Toma ejercicios realizados en clase y resuelve “la parte final” (la de buscar en tablas o aplicar fórmulas) con el R-Commander.