Ir al contenido

Criterio de Cramér-von Mises

De Wikipedia, la enciclopedia libre

En estadística el criterio de Cramér-von Mises se emplea para juzgar la bondad de una función de distribución acumulada comparada con una función de distribución empírica , o para comparar dos distribuciones empíricas. También se utiliza como parte de otros algoritmos, tal como la estimación de la distancia mínima. Se define como:

Aplicándolo a una única muestra, es la distribución teórica y es la empírica. Alternativamente las dos distribuciones pueden ser estimadas empíricamente; esto se conoce como un caso de dos muestras.

El criterio lleva los apellidos de Harald Cramér y Richard Edler von Mises, quienes fueron los primeros en exponerlo entre los años 1928-1930. La generalización de las dos muestras es obra de Theodore Wilbur Anderson.[1]

El criterio es una alternativa al test de Kolmogorov-Smirnov.

Test de Cramér-von Mises (una muestra)

[editar]

Sean los valores observados, en orden creciente. Entonces el estadístico es[1]: 1153 [2]

Si este valor es mayor que el valor tabulado, se puede rechazar la hipótesis de que los datos provienen de la distribución

Test de Watson

[editar]

Una versión modificada del criterio es el test de Watson,[3]​ el cual usa el estadístico U2, donde[2]

donde

Test de Cramér–von Mises test (dos muestras)

[editar]

Sean y los valores observados en la primera y segunda muestra respectivamente, en orden creciente. Sean los rangos de x en la muestra combinada, y sean los rangos de y en la muestra combinada. Anderson[1]: 1149  muestra que

donde U se define como

Si el valor de T es mayor que los valores tabulados,[1]: 1154–1159  se puede rechazar la hipótesis de que las dos muestras provienen de la misma distribución. Esto implica que no hay duplicados en , , y en las secuencias . Por tanto es única, y su rango es en . Si hay duplicados, y en son valores idénticos, donde se puede utilizar el enfoque del medio rango[4]​ método: asignar a cada duplicado un rango de . En las ecuaciones precedentes, en las expresiones y , los duplicados pueden alterar las cuatro variables , , , y .

Referencias

[editar]
  1. a b c d Anderson (1962)
  2. a b Pearson & Hartley (1972) p 118
  3. Watson (1961)
  4. Ruymgaart (1980)

Bibliografía

[editar]

Lecturas

[editar]

Enlaces externos

[editar]