cosas de jb: La culpa no es de los floats

Sino, del que le da de comer.

Al final del ultimo post, comenté mi preocupación por la lenta convergencia, y culpe apresuradamente al uso de los objetos de tipo float.
Haciendo cuentas noté que no había nada raro en la convergencia.

El estimador era:
\[\tilde{\pi} = 4 * \frac{\sum^n_{t=1}I(\text{punto i esta dentro de circulo})}{n}\]
Esto se puede reescribir de la siguiente forma:
\[\tilde{\pi} = 4 * \tilde{F}\], donde \[\tilde{F} = \frac{\sum^n_{t=1}I(\text{1 si punto i esta dentro de circulo})}{n}\] Sabemos que $I(\text{1 si punto i esta dentro de circulo})$ es una variable aleatoria Bernoulli, entonces
$\tilde{F} = \frac{Y}{n}$ donde Y es una variable Binomial con parámetros $n$ y $p = \pi/4$.
\[E[\tilde{\pi}] = 4 * \frac{E[Y]}{n} = 4 * \frac{\pi}{4} * n * \frac{1}{n} = \pi\]

Ahora, la varianza es lo que nos interesa.
\[\begin{aligned}Var[Y] &= np(1-p)\\
Var[\tilde{F}] &= \frac{np(1-p)}{n^2} = \frac{p(1-p)}{n} = \frac{\tilde{F}(1-\tilde{F})}{n}\\
Var[\tilde{\pi}] &= 4^2Var[\tilde{F}] = 8\frac{\tilde{F}(1-\tilde{F})}{n}
\end{aligned}\]

Ahora, quiero generar un intervalo de confianza del $95\%$ (usando la normal, porque $n$ es muy grande), y quiero que ese intervalo tenga un tamaño del orden de $10^{-4}$. Teniendo la formula de la varianza del estimador, podemos calcular el $n$ para esa precisión: $n = 1035989708.4897318$. Acá queda claro que floats no tenía nada que ver con la falta de precision. Fue solo una cuestión de ansiedad.
De hecho, si usamos $n=10^9$, luego de un tiempito, tenemos el siguiente resultado

\[\tilde\pi = 3.141564804\, (3.67207693157*10^{-5})\]
y con un $\alpha = 5\%$ podemos construir el intervalo: $ [3.14149283129\; 3.14163677671]$

2 comments:

Anonymous said...: En resumen, el metodo es malisimo? :)

10^9 samples para 4 decimales! No hay algo mejor?; February 25, 2013 at 6:30 AM
jb said...: Si, es bastante malo.
Estaba mirando utilizar las Binomiales. Si tenemos $n$ Binomials de parámetros $p,n$, podemos usar el estimador maximoverosimil: \[\tilde{p} = \frac{\sum^nX_i}{n^2}$\]
Y
\[Var(\tilde{p}) = \frac{p(1-p)}{n^2}\], así que el desvio estandar tiende a 0 en velocidad del orden $O(n)$. El tema es que necesitamos un total de $n^2$, como antes (lo que tiene sentido, porque es lo mismo de otra forma.
Igual, esto abre la posibilidad de usar la Poisson para aproximar la Binomial, y tener la convergencia $O(n)$, pero el método dejo de ser simple; February 25, 2013 at 9:51 AM

cosas de jb

Sunday, February 24, 2013

La culpa no es de los floats

2 comments:

Amigos con blog

Blog Archive

About Me