Creación de un intervalo de confianza para la diferencia de dos medias con desviaciones estándar conocidas

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Creación de un intervalo de confianza para la diferencia de dos medias con desviaciones estándar conocidas

Libro Relacionado

Por Deborah J. Rumsey

Si conoce las desviaciones estándar de dos muestras de población, puede encontrar un intervalo de confianza (IC) para la diferencia entre sus medias o promedios. El objetivo de muchas encuestas y estudios estadísticos es comparar dos poblaciones, como los hombres contra las mujeres, las familias de bajos y altos ingresos y los republicanos contra los demócratas. Cuando la característica que se compara es numérica (por ejemplo, altura, peso o ingresos), el objeto de interés es la cantidad de diferencia en las medias (promedios) para las dos poblaciones.

Por ejemplo, es posible que desee comparar la diferencia en la edad promedio de los republicanos frente a los demócratas, o la diferencia en los ingresos promedio de los hombres frente a las mujeres. Usted estima la diferencia entre dos medias de población,

tomando una muestra de cada población (digamos, muestra 1 y muestra 2) y utilizando la diferencia de los dos medios de la muestra

más o menos un margen de error. El resultado es un intervalo de confianza para la diferencia de dos medias de población,

Si se conocen ambas desviaciones estándar de la población, la fórmula de un IC para la diferencia entre dos medias (promedios) de la población es la siguiente

son la media y el tamaño de la primera muestra y la desviación estándar de la primera población,

es dado (conocido);

y n2 son la media y el tamaño de la segunda muestra, y la desviación estándar de la segunda población,

es dado (conocido). Aquí z* es el valor apropiado de la distribución normal estándar para su nivel de confianza deseado. (Refiérase a la siguiente tabla para valores de z* para ciertos niveles de confianza.)

Valores de z* para varios niveles de confianzaNiveles de confianza Valor de z*80%1.2890%1.645 (por convención)95%1.9698%2.3399%2.58 Para

calcular un IC para la diferencia entre dos medias de población con desviaciones estándar conocidas, haga lo siguiente:

  1. Determine el nivel de confianza y encuentre el valor z* apropiado.
  2. Identificar Identificar
  3. Encuentra la diferencia, entre los medios de la muestra.
  4. Cuadrar y dividir por n1; cuadrar y dividir por n2. Suma los resultados y toma la raíz cuadrada.
  5. Multiplica tu respuesta del Paso 4 por z*. Esta respuesta es el margen de error.
  6. El extremo inferior de la IC es menos el margen de error, mientras que el extremo superior de la IC es más el margen de error.

Suponga que desea estimar con un 95% de confianza la diferencia entre la longitud media (promedio) de las mazorcas de dos variedades de maíz dulce (permitiéndoles crecer el mismo número de días bajo las mismas condiciones). Llama a las dos variedades Corn-e-stats y Stats-o-sweet. Supongamos por investigación previa que las desviaciones estándar de la población para los Maíz-e-stats y Estatus-o-dulce son de 0.35 pulgadas y 0.45 pulgadas, respectivamente.

  1. Debido a que desea un intervalo de confianza del 95%, su z* es 1,96.
  2. Suponga que su muestra aleatoria de 100 mazorcas de la variedad Corn-e-stats tiene un promedio de 8.5 pulgadas, y su muestra aleatoria de 110 mazorcas de Stats-o-sweet tiene un promedio de 7.5 pulgadas. Así que la información que tienes es:
  3. La diferencia entre los medios de la muestra, desde el Paso 2, es 8.5 – 7.5 = +1 pulgada. Esto significa que el promedio de Maíz-e-stats menos el promedio de Stats-o-sweet es positivo, lo que hace que Maíz-e-stats sea la más grande de las dos variedades, en términos de esta muestra. ¿Es esa diferencia suficiente para generalizar a toda la población? Eso es lo que este intervalo de confianza le ayudará a decidir.
  4. Cuadrado (0.35) para obtener 0.1225; dividido entre 100 para obtener 0.0012. Cuadrado (0.45); divide entre 110 para obtener 0.0018. La suma es 0.0012 + 0.0018 = 0.0030; la raíz cuadrada es 0.0554 pulgadas (si no se redondea).
  5. Multiplique 1.96 veces 0.0554 para obtener 0.1085 pulgadas, el margen de error.
  6. Su intervalo de confianza del 95% para la diferencia entre las longitudes promedio para estas dos variedades de maíz dulce es de 1 pulgada, más o menos 0.1085 pulgadas. (El extremo inferior del intervalo es 1 – 0.1085 = 0.8915 pulgadas; el extremo superior es 1 + 0.1085 = 1.1085 pulgadas.) Observe que todos los valores de este intervalo son positivos. Para interpretar estos resultados en el contexto del problema, puede decir con un 95% de confianza que la variedad Corn-e-stats es más larga, en promedio, que la variedad Stats-o-sweet, entre 0,8915 y 1,1085 pulgadas, según su muestra.

La tentación es decir: “Bueno, yo sabía que el maíz Corn-e-stats era más largo porque su media de muestra era de 8,5 pulgadas y Stat-o-sweet era de sólo 7,5 pulgadas en promedio. ¿Por qué necesito un intervalo de confianza?” Todo lo que esos dos números te dicen es algo sobre esas 210 mazorcas de maíz muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre las poblaciones enteras de maíz.

Note que usted podría obtener un valor negativo para

Por ejemplo, si hubieras cambiado las dos variedades de maíz, habrías obtenido -1 por esta diferencia. Usted diría que Stats-o-sweet promedia una pulgada más corto que Corn-e-stats en la muestra (la misma conclusión se expresa de manera diferente).

Si desea evitar valores negativos para la diferencia en las medias de la muestra, siempre haga que el grupo con la media de la muestra más grande sea su primer grupo – todas sus diferencias serán positivas.

Sin embargo, incluso si el grupo con la media de la muestra más grande sirve como primer grupo, a veces se obtienen valores negativos en el intervalo de confianza. Supongamos en el ejemplo anterior que la media de la muestra de Corn-e-stats fue de 7.6 pulgadas. Por lo tanto, la diferencia en la media de la muestra es 0.1, y el extremo superior del intervalo de confianza es 0.1 + 0.1085 = 0.2085 mientras que el extremo inferior es 0.1 – 0.1085 = -0.0085. Esto significa que la verdadera diferencia está razonablemente en cualquier lugar, desde que los Corn-e-stats son hasta 0.2085 pulgadas más largos hasta que los Stat-o-sweet son 0.0085 pulgadas más largos. Es demasiado cerca para saber con seguridad qué variedad es más larga en promedio.