Tema 3: Inferencia Estadística. Intervalos de confianza 1. Introducción Hemos visto en el tema anterior que la Estadística es la ciencia que se preocupa de la recogida de datos, su organización y análisis, así como de las predicciones que, a partir de esos datos pueden hacerse Los aspectos anteriores hacen que pudiese hablarse de dos tipos de Estadística: Descriptiva e Inferencial La Estadística Descriptiva se ocupa de tomar los datos de un conjunto dado, organizarlos en tablas o representaciones gráficas y del cálculo de unos números que nos informen de manera global del conjunto estudiado. No utiliza la Probabilidad Para la recogida de datos, hemos visto el Muestreo Estadístico, en el que hemos estudiado algunas formas de tomar una muestra de la población en estudio La Estadística Inferencial trata sobre la elaboración de conclusiones para una población, partiendo de los resultados de una muestra y del grado de fiabilidad de las conclusiones. Utiliza la Probabilidad. Una vez hecho el muestreo estadístico, el siguiente paso en nuestro estudio es la elaboración de conclusiones para la población a partir de los datos recogidos en la muestra. Como hemos visto, esto lo llevará a cabo la Estadística Inferencia o también conocida como la Inferencia Estadística. Vamos a analizar tres situaciones parecidas, pero muy distintas: • Problema 1: Las estaturas de los soldados de un regimiento tienen una media µ = 175 y una desviación típica de σ = 5 . (Ambos parámetros son poblacionales). ¿Cuál es la probabilidad de que la estatura media de 32 soldados que deben hacer guardia esta noche esté comprendida entre 174,4 y 175,6? (los 32 soldados son una muestra de la población) Conocemos Nos preguntamos La media de la La media x de una Población. µ = 175 muestra. ¿ P (174, 4 < x < 175, 6) ? • Problema 2: La estatura media de los 32 soldados que han sido seleccionados para hacer guardia es x = 175 cm ¿Cuál es la probabilidad de que la media, µ , de todos los soldados del regimiento esté en el intervalo (174,4;175,6)? Conocemos Nos preguntamos La media de la La media µ de una muestra. x = 175

muestra. ¿ P (174, 4 < µ < 175, 6) ?

• Problema 3: Afirman que la media de las estaturas de los soldados de un regimiento es µ = 175 . Para comprobarlom, extraemos una muestra de 32 soldados y calculamos su media, x = 175,8 . ¿Es razonable admitir la hipótesis de que µ = 175 ?

Conocemos La media de la muestra

Nos preguntamos ¿Es admisible la afirmación de que µ = 175 ?

En el problema 1, conocemos la población. A partir de ahí pretendemos deducir el comportamiento de las muestras. Esto no es lo más habitual, pero comenzaremos desde esta situación para comprender mejor la inferencia estadística. En el problema 2, conocemos una muestra y, a partir de ella, pretendemos deducir aspectos de la población. En concreto, pretendemos inferir el valor de la media de la población a partir del conocimiento de la media de una muestra. Este problema es el que nos planteamos como objetivo inicial en este tema. Este problema es un típico problema de inferencia estadística, estimar el valor de un parámetro de la población a partir de una muestra. En el problema 3, tenemos una afirmación, una hipótesis, la media de la población es µ = 175 . Pero no tenemos garantías de que sea cierto. Para contrastarlo, extraemos una muestra y, a partir de su resultado x = 175,8 , debemos decidir si la hipótesis si la hipótesis es o no admisible. Este problema lo resuelve también la inferencia estadística mediante los contrastes de hipótesis, que estudiaremos en el siguiente tema. 2. Intervalos característicos. 2.1.

Intervalos característicos

Definición (intervalo característico): Sea X una V.A. que se distribuye según una normal de media µ (media poblacional conocida). Llamaremos intervalo característico correspondiente a una probabilidad p, a un intervalo centrado en la media de la forma (µ − k , µ + k ) Es decir, la probabilidad de que un valor de la variable X pertenezca a dicho intervalo es p y lo expresaremos P ( µ − k < X < µ + k ) = p

Ejemplo: Hallemos el intervalo característico en una distribución N(0,1) correspondiente a una probabilidad 0,9. Sabemos que este caso µ = 0 y por tanto tenemos que P (0 − k < X < 0 + k ) = 0,9 . Gráficamente tenemos que

Tenemos que determinar el intervalo, es decir, k. Luego a partir del gráfico, tenemos que P ( X > k ) = 0, 05 ⇒ P ( X ≤ k ) = 0,95 . Si buscamos en la tabla de la normal de forma inversa tenemos que k=1,645. Luego el intervalo es (-1,645,1,645), es decir P (−1, 645 < X < 1, 645) = 0,9 Vamos a usar con mucha frecuencia intervalos característicos donde X siga una N(0,1) (gráfico) Entonces llamaremos k el valor crítico correspondiente a p (que no es más que un valor de la variable). Y lo denotaremos por zα / 2 . Por tanto, con esta nueva notación tenemos:

P( Z > zα / 2 ) = α / 2

P(− zα / 2 < Z < zα / 2 ) = p = 1 − α

y

Los valores críticos correspondientes a las probabilidades 0,9 0,95 y 0,99 son los más utilizados y son 1,645 1,96 y 2,575 respectivamente.

Ejemplo: Calcular los valores críticos correspondientes a la probabildad 0,95. (Es decir, tenemos que calcular zα /2 = k ) Sabemos que α = 0, 05 ⇒ α / 2 = 0, 025 , por tanto

P( Z > zα /2 ) = 1 − P( Z < zα /2 ) ⇒ P( Z < zα / 2 ) = 1 − P( Z > zα /2 ) = 0,975 A continuación miramos la tabla de la normal de forma inversa y obtenemos el valor crítico zα / 2 =1,96

2.2.

Intervalos característicios para N ( µ , σ )

Sea X una V.A. que se distribuye según una normal N ( µ , σ ) , si queremos determinar el intervalo característico para esta variable lo primero que tendremos que hacer es tipificar por tanto ( µ − k , µ + k ) ⇒ (− zα / 2 , zα /2 ) y tenemos que

P(− zα /2 < Z < zα / 2 ) = 1 − α Como sabemos Z =

X −µ

σ

⇒ P (− zα / 2 <

X −µ

σ

< zα /2 ) = 1 − α . Por tanto, nos queda que:

P ( µ − zα /2σ < X < µ + zα /2σ ) = 1 − α En consecuencia el intervalo característico para N ( µ , σ ) es ( µ − zα /2σ , µ + zα /2σ )

Ejemplo:

En una distribución N(18,4) halla los intervalos característicos para el 95%. Como la probabilidad asociada al intervalo es p=0,95 tenemos que el valor crítico para esta probabilidad es zα / 2 = 1, 96 . Puesto que el intervalo característico para una N ( µ , σ ) es ( µ − zα /2σ , µ + zα /2σ ) tenemos que el intervalo para los datos del ejemplo es (18 − 1, 96 ⋅ 4;18 + 1,96 ⋅ 4) es decir (10,16;25,84) ¿Qué ocurre si nuestra variable aleatoria no se distribuye según una Normal?¿Cómo determinamos el intervalo característico?. A esto dará respuesta el Teorema Central del Límite.

3. Teorema Central del límite. Sea X una V.A. que no se distribuye según una distribución normal (conocemos la media y la desviación típica de X µ , σ ) pero donde el tamaño de la muestra cumple que n ≥ 30 . Entonces tenemos que X → N ( µ ,

σ

)

n

Observación: Si X es una V.A. se define X como otra V.A. que se define como los valores medios de X.

Ejemplo: • Sea X el peso de las bolsas embasadas por una cierta máquina, donde µ = 500 y

σ = 35 . A priori no sabemos si es normal. Podemos definir X como la media de los pesos de las bolsas embasadas. Si el tamaño de la muestra que tomemos cumple n ≥ 30 entonces X → N ( µ ,

σ n

)

• Consideramos X una variable que se distribuye según N(500,35) y consideramos una muestra de tamaño 100. A)¿Calcular la probabilidad de que la media de la varialble X se menor que 495? B) Hallar el intervalo característico de X para una probabilidad del 95%.

4. Estimación puntual y estimación por intervalos Como hemos dicha anteriormente el objetivo de este tema es: “conocida una muestra, a partir de ella, pretendemos deducir aspectos de la población. En concreto, pretendemos

inferir el valor de la media de la población a partir del conocimiento de la media de una muestra”. Para estimar el valor de la media de la población podremos actuar mediante dos tipos de estimación: Estimación puntual y Estimación por intervalos. 4.1.

Estimación puntual

Desconocemos los datos de la población, pero disponemos de los datos de una muestra. Por lo tanto podemos calcular la media de la muestra, que denotaremos por x . Los parámetros de la población µ , σ podremos estimarlos así: • La media muestral, x , sirve para estimar la media poblacional µ • La desviación típica muestral sirve de poco mientras desconozcamos cuál es el el grado de aproximación de x a µ . Por ese motivo se procede a la estimación mediante un intervalo.

4.2.

Estimación por intervalos

A partir de una muestra de tamaño n, podemos estimar el valor del parámetro de la población del siguiente modo:

• Dando un intervalo dentro del cual confiamos que esté el parámetro. Que se llamará intervalo de confianza. • Hallando la probabilidad de que tal cosa ocurra. A dicha probabilidad se le llama nivel de confianza. Cuanto mayor sea el tamaño de la muestra, mayor eficacia tendremos en nuestra estimación. Esta eficacia se manifiesta de dos formas:

• En el tamaño del intervalo (cuanto más pequeño, más preciso estamos siendo) • En el nivel de confianza (más nivel de confianza significa más seguridad en la estimación) Tamaño de la muestra, longitud del intervalo y nivel de confianza son tres variables estrechamente relacionadas que manejaremos continuamente a lo largo de la unidad.

5. Intervalo de confianza para la media. Relación entre nivel de confianza, error admisible y tamaño de la muestra. 5.1.

Intervalo de confianza para la media

Se desea estimar la media µ , de una población cuya desviación típica σ , es conocida. Para ello, se recurre a una muestra de tamaño n de la cual se obtiene la media muestral x . Si la población de partida es normal, o si el tamaño de la muestra es n ≥ 30 (teorema central del límite), entonces el intervalo de confianza de µ con un nivel de confianza de (1 − α ) ⋅100% es ( x − zα / 2 ⋅

σ n

, x + zα /2 ⋅

σ n

)

Ejemplo: Deseamos valorar el grado de conocimientos en historia de una población de varios miles de alumnos. Sabemos que σ = 2,3 . Nos proponemos estimar µ pasando una prueba a 100 alumnos. a) Calcular el intervalo característico para x correspondiente a una probabilidad de 0,95. b) Una vez realizada la prueba a 100 alumnos concretos, se ha obtenido una media de x = 6,32 . Hallar el intervalo de confianza de µ con un nivel de significación del 95% Ejercicio:

• De una variable aleatoria, conocemos la desviación típica, σ = 8 , pero desconocemos la media poblacional µ , extraemos una muestra de tamaño n=60 cuya media obtenemos x = 37 . Estima µ mediante un intervalo de confianza del 99%.

• En una muestra de 50 jóvenes, encontramos que la dedicación media diaria de ocio es de 400 minutos y su desviación típica es 63 minutos. Calcula el intervalo de confianza de la media de la población al 95% de nivel de confianza. • (Selectividad 2008, modelo) El tiempo (en horas) que permanecen los coches en un determinado taller de reparación es una variable aleatoria con distribución Normal de desviación típica 4 horas. a) (1 punto) Se eligieron, al azar, 16 coches del taller y se comprobó que, entre todos, estuvieron 136 horas en reparación. Determine un intervalo de confianza, al 98’5%, para la media del tiempo que permanecen los coches en ese taller. • (Selectividad 2008, modelo) Una variable aleatoria X se distribuye de forma Normal, con media µ y desviación típica σ = 0’9. a) (1 punto) Una muestra aleatoria de tamaño 9 ha proporcionado los siguientes valores de X: 7’0, 6’4, 8’0, 7’1, 7’3, 7’4, 5’6, 8’8, 7’2. Obtenga un intervalo de confianza para la media µ, con un nivel de confianza del 97%.

5.2.

Relación entre nivel de confianza, error admisible y tamaño de la muestra.

Hemos visto que el (1 − α ) ⋅100% de las muestra cumplen que x − µ < zα /2 ⋅

El valor E= E = zα / 2 ⋅

σ

⇔ n = zα / 2 ⋅

σ

⇔ n zα / 2 ⋅

σ n

.

σ

se llama error máximo E E n admisible. Observamos que depende de α y de n del siguiente modo:



Cuanto mayor sea el tamaño de la muestra menor es E (más estrecho es el intervalo de confianza, es decir mejor será la estimación)



Cuanto mayor sea 1 − α (es decir, cuanto más seguros queramos estar de nuestra estimación) mayor es E.

Teniendo esto en cuenta, se nos pueden presentar dos situaciones o dos problemas: • Hallar el tamaño de la muestra dados E y α • Hallar el nivel de confianza conociendo E y n. Veamos cada uno de estos problemas.

Hallar el tamaño de la muestra dados E y α . De la fórmula del error máximo admisible E= zα / 2 ⋅

σ

σ n

σ

obtenemos despejando n:

σ  E = zα / 2 ⋅ ⇔ n = zα / 2 ⋅ ⇔ n =  zα / 2 ⋅  E E n 

2

Por tanto el tamaño de la muestra, conocidos E y α es

σ  n =  zα / 2 ⋅  E 

2

Observamos que:

• Al aumentar el nivel de confianza debemos aumentar el tamaño de la muestra. • Si el error es muy pequeño, el tamaño de la muestra será muy grande.

6. Intervalo de confianza para la proporción.

Consideremos la siguiente situación: El 15% de los jóvenes de 18 a 25 años son miopes. Nos proponemos elegir al azar a 40 jóvenes y nos preguntamos qué proporción, p de miopes habrá en esa muestra. Para cada individuo de la muestra la probabilidad de ser miope es de p=0,15. Como en la muestra hay n=40 individuos y X->”número de miopes en la muestra ”, entonces X sigue una distribución Binomial B(40,0,15). Teniendo en cuente el teorema central del límite podemos aproximar la distribución binomial a una distribución Normal N(np, npq ). Por tanto X->N(6,2,26). Teniendo en cuenta que la proporción de miopes de la muestra es p=

n º miopesdelamuestra x = 40 40

Podemos definir una nueva variable aleatoria P=X/n->N( >N( p,

n npq , ). p n

Es decir, P-

pq ). n

Si en una población la proporción de individuos que posee una cierta característica C es p, la proporción p, de individuos con dicha característica en las muestras de tamaño n sigue una distribución normal de media p y desviación típica

6.1.

pq . n

Intervalo de confianza para la proporción. Relación entre el error máximo admisible, nivel de confianza y tamaño de la muestra.

Si se desea estimar la proporción P, de individuos con una cierta característica que hay en una población. Para ello, se recurre a una muestra de tamaño n, en la que se obtiene la proporción muestral p. El intervalo de confianza de P con un nivel de confianza (1 − α ) ⋅100% es

( p − z1−α /2

pq , p + z1−α /2 n

pq ) n

Para este intervalo, se define el error máximo admisible como E= z1−α / 2

pq n

Tema 3-Intervalos de confianza.pdf

Problema 1: Las estaturas de los soldados de un regimiento tienen una media. μ =175 y una desviación típica de σ = 5. (Ambos parámetros son. poblacionales).

205KB Sizes 1 Downloads 196 Views

Recommend Documents

TEMA DE EUROVISION.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. TEMA DE ...

Tema 4.2.1_Guia rapida de zotero.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. Tema 4.2.1_Guia rapida de zotero.pdf. Tema 4.2.1_Guia rapida de zotero.pdf. Open. Extract. Open with. Sign I

Tema 3 de 3º.pdf
necesario conocer cómo se diseñan las letras (geometría) y los tipos de letra más comunes (de palo. seco, con serif, etc.). Características para personalizar las ...

tema 3 Geografía de Asia.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. tema 3 Geografía de Asia.pdf. tema 3 Geografía de Asia.pdf. Open. Extract. Open with. Sign In. Main menu.

Tema 15_Manejo programático de la TB XDR.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. Tema 15_Manejo programático de la TB XDR.pdf. Tema 15_Manejo programático de la TB XDR.pdf. Open. Extract.

BIO-Tema 20 - BASE MOLECULAR DE LA HERENCIA.pdf ...
There was a problem loading this page. BIO-Tema 20 - BASE MOLECULAR DE LA HERENCIA.pdf. BIO-Tema 20 - BASE MOLECULAR DE LA HERENCIA.pdf.

FILOSOFIA TEMA COM 1 TEMA 1.pdf
ABREGO, César: 9 (nueve). AGNELLO, Agostina: 9 (nueve). AGULLES S., Ma. Victoria: 9 (nueve) ... FERNANDEZ LLDD A, Juan: 9 (nueve). FIORENZA FILIPPA, Maximiliano: 9 (nueve). FRITZI-ER, Rocío: 8 (ocho). GARCÍA, Gonzalo Nicolás: 9 (nueve). GARRO, Gabrie

Tema Agricultura.pdf
Page 1 of 15. 1. Departamento Geografía e Historia IES Santa María de los Baños. Fortuna. Geografía de España 2o Bach..Paco H. Tradicionalmente, España ...

Tema livre.pdf
Page 1 of 1. Control No Time Presenter/Author Area Títle Authors. TL 01. 14:00 -14:15. EVELYN WINTER DA SILVA DRUG DEVELOPMENT DRUG-RESISTANT CANCER: IS IT POSSIBLE TO REVERSE THIS PROCESS? SILVA, E. , CHIARADIA-DELATORRE, L. , GOZZI, G. ,. GAUTHIER

tema 1.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. tema 1.pdf.

TEMA 5.pdf
KD 3.14, 3.3, 3.7, 3.8, 3.9. I. Berilah tanda silang (x) pada huruf di depan jawaban yang paling benar ! 21. 3 hm2 = . . . m. 2. A. 300 m. 2 C. 300.000 m. 2. B. 30.000 m. 2 D. 3.000.000 m. 2. 22. 14 m. Keliling bangun datar disamping adalah .... A. 2

TEMA 2.1.pdf
No es que tuviera miedo... pues era una de aquellas afortunadas niñas a quienes han. evitado expresamente las historias de fantasmas y los cuentos de hadas, ...

tema 8 BG.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. tema 8 BG.pdf.

TEMA 4.pdf
VERBO SUM. 1aSg SUM 1aPl SUMUS. 2aSg ES 2aPl ESTIS. 3aSg EST 3aPl SUNT. DESINENCIAS VERBALES. 1aSg -O / -M 1aPl -MUS. 2aSg -S 2aPl -TIS.

TEMA 9.pdf
Page 1 of 9. PEMERINTAH KABUPATEN LUMAJANG. DINAS PENDIDIKAN. UPT PENDIDIKAN KEC. LUMAJANG (KURIKULUM 13). ULANGAN KENAIKAN ...

tema-4_word_practica_07.pdf
TamaÒo 12. AlineaciÛn justificada. SangrÌa de francesa de 1 cm. 8) A la ̇ltima lÌnea le aplicas: Fuente Garamond. TamaÒo 10. AlineaciÛn derecha.

Tema 3.pdf
Whoops! There was a problem loading more pages. Retrying... Tema 3.pdf. Tema 3.pdf. Open. Extract. Open with. Sign In. Main menu. Displaying Tema 3.pdf.

Tema 1 Cosmetologia.pdf
Exemples: locions (producte actiu en aigua i alcohol), olis de massatge (mentol en oli de vaselina). DISPERSIONS. Són barreges de substàncies en les que es ...

TEMA 2.2.pdf
meteorológico Fengyun-1C, que orbitaba alrededor de nuestro planeta a una altura de casi 850 kilómetros. La maniobra. militar fue un éxito —el misil impactó de lleno contra el satélite—, pero desperdigó por el espacio al menos 150 000. frag

Tema 5 GEO.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. Tema 5 GEO.pdf.

Tema Penyelidikan DCP.pdf
Loading… Page 1. Whoops! There was a problem loading more pages. Retrying... Tema Penyelidikan DCP.pdf. Tema Penyelidikan DCP.pdf. Open. Extract. Open with. Sign In. Main menu. Displaying Tema Penyelidikan DCP.pdf.

Tema 9.pdf
Casona estrena en Buenos Aires La dama del alba (1944), La barca sin. pescador (1945) y Los árboles mueren de pie (1949). 9.3. EL TEATRO EN LOS AÑOS ...

05_CARANCA TEMA ASOCIADO.pdf
población que podría alcanzar la extinción de. la especie en su distribución continental –. fueguina. Foto: Marcelo de Cruz. Afortunadamente, la Secretaría.

TEMA 6.pdf
There was a problem previewing this document. Retrying... Download. Connect more apps... Try one of the apps below to open or edit this item. TEMA 6.pdf.