DISTRIBUCIÓN Z

                        Por:

Dr. Luis Antonio Pérez González

Universidad Politécnica del Valle de Toluca

lperez@ipac.com.mx

 

Ing. Mario Arrioja Rodríguez

Instituto Tecnológico de Orizaba

mlarrioja@yahoo.com

 

Ing. Carlos Díaz Ramos

Instituto Tecnológico de Orizaba

kdiaz@prodigy.net.mx

 

Contenido

 

Introducción

Distribución de los valores estandarizados con un estimador máximo verosímil de la varianza

Distribución de los valores estandarizados con el estimador  de la varianza

Distribución Z2

Distribución de

Conclusiones

 

Introducción

Los valores estandarizados  de una muestra aleatoria extraída de una distribución normal, son de gran utilidad en muchas aplicaciones de la estadística moderna. Así, podemos encontrar su aplicación en el control estadístico del proceso cuando se desea construir cartas de control para datos individuales no agrupados (Djauhari, Maman A., 1998); en el ensayo de significancia de la diferencia entre la media de un subgrupo y la media general (Cramér, H., 1999), etc.

Aunque varios autores han presentado la distribución exacta de Z (p.ej., Djauhari, Maman A., 1998; Cramér, Harald, 1999), no tenemos conocimiento de algún texto clásico de ingeniería que se ocupe de ella. El conocimiento de la distribución exacta de este estadístico hace posible el cálculo de algunas probabilidades importantes, la localización de sus valores esperados, y su forma y función característica, además de que permite la construcción de las curvas de potencia en las pruebas donde intervienen.

Al presentar la distribución normal hemos utilizado la letra Z para referirnos a la variable aleatoria distribuida N(0,1). Volveremos a utilizar esta letra en este capítulo, pero ahora, para asignárselo al estadístico que nos ocupa. La posible confusión por el re-uso de esta letra es histórica, y viene de que históricamente en muchas aplicaciones se ha cometido el error de atribuir a los valores estandarizados de poblaciones normales la propiedad de seguir una distribución normal estándar. Este error es especialmente grave cuando la cantidad de valores estandarizados, con base en los cuales se va a tomar alguna decisión, es pequeña.

Definición DZ1. Sea X1, X2, . . ., Xn una muestra aleatoria de una población de interés. El estadístico

(DZ1)                 

en donde  

(DZ2)             

y S es un estimador de la varianza, será llamado, indistintamente, “valor estandarizado” y “estadístico Z”. Su función de densidad de probabilidad y su función de distribución serán llamadas “función de densidad de probabilidad Z” y “función de distribución Z”, respectivamente.         

En lo que sigue encontraremos la distribución de Z correspondiente a muestras de poblaciones normales, utilizando primero el estimador máximo verosímil y después el estimador clásico de s2.

Distribución de los valores estandarizados con un estimador máximo verosímil de la varianza

Teorema DZ1. Si la muestra aleatoria X1, X2, . . ., Xn con base en la cual se calcula el estadístico Z es extraída de una población , entonces el estadístico Z se distribuye

(DZ3)                     

Demostración. Reemplacemos las Xi´s por nuevas variables Yi´s por medio de la transformación ortogonal Y = AX, donde A es la matriz ortonormal

(DZ4)  

y         

(DZ5)               

Se sabe (ver teorema DNM4) que la independencia y normalidad de los elementos de X y la ortogonalidad de A, implican que los componentes del vector Y = AX son independientes y normales. Además:

(DZ6)                  

(DZ7)             

(DZ8)             

lo que conduce a

(DZ9)                

(DZ10)          

con lo que (DZ2) se transforma en

(DZ11)          

Observando que la ecuación anterior nos lleva a

(DZ12)          

por eso, la f.d.p. de Z se encontrará definida en el intervalo .

Consideremos ahora la transformación

(DZ13)          

Utilizando (DZ12) obtenemos

(DZ14)          

con lo que (DZ13) queda como

(DZ15)          

en donde se identifican dos variables independientes: una variable aleatoria normal estándar en el numerador, y la raiz cuadrada de una chi-cuadrada con n-2 grados de libertad entre sus grados de libertad en el denominador. Esto nos lleva a concluir que W se distribuye t de Student con n-2 grados de libertad, o sea

(DZ16)          

Sea la transformación

(DZ17)          

Sabemos que

(DZ18)          

donde  es el jacobiano de la transformación.

En nuestro caso

(DZ19)            

y

(DZ20)          

(DZ21)          

Luego,

        

            

            .          

Es fácil probar que la media y la varianza de t están dadas por las expresiones,

(DZ22)            

Mencionamos, al principio de este capítulo, que frecuentemente la estandarización de observaciones N(m,s2) mediante el uso de la expresión  lleva a suponer que su distribución es N(0,1), por lo que incluso se le asigna el nombre de variable o estadístico Z, recurriendo al mismo símbolo que se utiliza para hacer referencia a una variable aleatoria normal estándar. Este supuesto es totalmente erróneo, según puede apreciarse en la figura DZ1. En ella se observa que para n = 3 la distribución tiene forma de U, para n = 4 la distribución es uniforme, cuando n = 5 la distribución es parabólica y cuando n = 10 se asemeja a la distribución t de Student.

Figura DZ1. La f.d.p. de Z para n = 3, 4, 5 y 10 cuando se usa el estimador máximo verosímil de s.

Distribución de los valores estandarizados con el estimador de la varianza

Mediante sencillas operaciones matemáticas se puede demostrar el siguiente corolario, en el que se pone de manifiesto la función de densidad del estadístico Z cuando se le calcula utilizando el estimador clásico de la varianza.

Corolario 1. Sea X1, X2, . . ., Xn una muestra aleatoria de una población N(0,s2). Sean

(DZ23)                      

La f.d.p. del estadístico

(DZ2)                           

está dada por la expresión:

(DZ24)          

Además:

(DZ25)                       

En la figura DZ2  se ilustra  la forma de esta distribución  para diferentes valores para n. Al igual que en la gráfica de la figura DZ1, la distribución tiene forma U, para n = 3, es uniforme para n = 4, es una parábola para n = 5, y cuando n = 10 se asemeja mucho más a la función de densidad de probabilidades t de Student.

Figura DZ2.  f.d.p. de t para n = 3, 4, 5 y 10 cuando se usa el estimador insesgado de s.

Distribución de Z2

Teorema 2. Sea X1, X2, . . ., Xn una muestra aleatoria de una población N(0,s2). Entonces, la distribución de t2 (ecuación 12) está dada por:

(DZ26)           .

Demostración. Haremos uso de las relaciones  encontradas anteriormente para llevar a cabo la demostración. De la ecuación (DZ12) encontramos que la función de densidad de probabilidades de Z2 se encontrará definida para .

Hagamos ahora la transformación

(DZ27)             

sustituyendo (DZ20) y (DZ22) en (DZ27) llegamos a

(DZ28)            

en donde puede observarse que W~F1,n-2, o lo que es lo mismo ~F1,n-2.                                        (28.5)

Sabemos que si Y~Fm,n, entonces (mY/n)/(1+mY/n)se distribuye b(m/2,n/2). Aplicando este resultado a (28.5) obtenemos:

~~        (29)

De esta relación resulta se sigue que la f.d.p. de t2 es la dada por la ecuación 26. Queda de esta manera demostrado el teorema.

Utilizando los mismos argumentos se puede demostrar que la f.d.p. de t2, cuando se usa el estimador insesgado de s2, es

   (30)

ya que en este caso las expresiones correspondientes a (27), (28),(28.5)y (29) nos conducen a:

~~      (31)

5. Distribución de .

Teorema 3. Sea X1, X2 , . . ., Xn una muestra aleatoria de una población N(0, s2) , y sea

                        (32)

en donde

 ,     (33)

Entonces, la distribución de t es

            (34)

Demostración.

Consideremos al igual que en la demostración del teorema 1, que las X1, X2, . . ., Xn se convierten en las nuevas variables Y1, Y2, . . ., Yn mediante la transformación ortogonal Y = AX, solamente que ahora Y1 y Y2 están dadas por

                   (35)

                          (36)

De la última ecuación se desprende que

                       (37)

Considerando las relaciones anteriores y las correspondientes de la sección 2, la ecuación (32) se transforma en

                  (38)

Así, de la ecuación anterior encontramos

                         (39)

con lo que llegamos a determinar que

               (40)

Consideremos ahora la siguiente transformación

                      (41)

Determinemos primeramente el término del radical del denominador

         (42)

Sustituyendo (38) y (42) en (41)

             (43)

La ecuación anterior nos indica que W sigue una distribución t de Student con n-2 grados de libertad.

El jacobiano de la transformación es:

                (44)

 Resulta de esta forma que:

  

      

Queda así demostrado así el teorema.

La media y la varianza de t están dadas por las ecuaciones

                   (45)

La figura DZ3 muestra la gráfica de la distribución. En ella se aprecia que su forma es semejante a la distribución t, forma que mantiene para diferentes valores de k y n.

 

Figura DZ3. f.d.p. de t cuando de usa el estimador máximo verosímil de s.

Distribución de .

Corolario 2. Dadas las consideraciones del teorema DZ3 y

                 ,

la f.d.p. de t es

       (46)

La media y la varianza de t están dadas por las ecuaciones

                      (47)

En la figura DZ4 se puede apreciar la gráfica de la distribución para k=3 y n=10. Como sucede para las diferentes combinaciones de n y k, su forma es muy parecida a la distribución t de Student.

 

Figura DZ4. f.d.p. de t cuando se usa  el estimador insesgado de s.

Conclusiones.

En la actualidad la velocidad de generación del conocimiento es cada vez mayor, surgiendo con ello nuevos modelos, herramientas y tecnologías, lo cual transforma cada vez  más dramáticamente la forma de hacer las cosas. Esto ha obligado a que los sistemas adquieran una capacidad de respuesta acorde con dicha velocidad, para aprovechar dichos avances en la mejora continúa de sus operaciones y mantenerse así, en un mercado  cada vez más competitivo. Debido a la elevada competitividad a la se enfrentan las organizaciones, ya no es suficiente la utilización de las técnicas clásicas para la mejora continua de los procesos; es necesario, en este momento y en los tiempos por venir, la utilización de conocimientos más avanzados para lograr eficientar significativamente sus resultados.

Los modelos estadísticos presentados en el presente artículo representan una eficiente alternativa en el control estadístico del proceso y en las pruebas de normalidad, más aun, cuando los enfoques de los modernos sistemas de calidad, como son 6s e ISO 9000, se apoyan fuertemente en el uso de modelos estadísticos para lograr  la mejora continua y la calidad total. Por tal motivo, es preocupación de los autores difundir el uso y aplicación de este tipo de herramientas entre los profesores y los practicantes de la Ingeniería Industrial.

Referencias

Ciucu, George, Virgil Craiu (1974). INFERENTA STATISTICA.Editura Didactica si Pedagogica-Bucaresti.

Cramér, Harald (1999). Mathematical Methods of Statistics. Princeton University Press.

Djauhari, Maman A. (1998). A unifying  concept of X chart and X-bar chart when sugroup sizes are equal. Department of Mathematics, Institut Teknologi Bandung, Indonesia.

Mood A. M., Graybill F. A. and Boes D. C. (1974). Introduction to The Theory of Statistics, third edition. McGrawHill.

Nomikos P and MacGregor J.F. (1995). Multivariate SPC Charts for Monitoring Batch Process. Technometrics. Vol. 37, No. 1.

Tracy N.D., Young J.C. and Mason R.L. (1992). Multivariate Control Chart for Individual Observations. Journal of Quality Technology, Vol. 24, No. 2.