Escolar Documentos
Profissional Documentos
Cultura Documentos
Contedo Programtico
Distribuies de frequncia Representao grfica Medidas estatsticas Noes de probabilidade Variveis aleatrias Principais distribuies discretas e contnuas Estimao de parmetros Teste de hipteses
Bibliografia bsica:
Caroline C. Vieira. Notas de aula 1 semestre de 2012.
Mario F. Triola. Introduo Estatstica 10 Ed. M. N. Magalhes; Antonio C. P. de Lima. Noes de Probabilidade e Estatstica 2002.
1. Introduo
Definio de Estatstica: um conjunto de tcnicas que nos permite, de forma sistemtica, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos e experimentos.
Estatstica Descritiva: utilizada na etapa inicial da anlise para que possamos nos familiarizar com os dados, e tirarmos concluses informais e diretas a respeito de caractersticas de interesse com base nos dados observados. Inferncia Estatstica: Tcnicas que permitem extrapolar para a populao, concluses tiradas de subconjuntos ou amostras desta populao.
Conceitos:
Populao: um conjunto de dados / pessoas / objetos / etc. que possuem pelo menos uma caracterstica em comum de interesse do pesquisador. Exemplos: 1. a populao brasileira. 2. a totalidade dos carros produzidos no Brasil. 3. uma jazida de minrio de ferro de determinada mina. 4. o sangue no corpo de uma pessoa.
Amostra: um subconjunto desta populao obtida de acordo com certas regras (tcnicas de amostragem). 1. 2. 3. 4. a populao do Paran. carros produzidos pela Fiat. um testemunho ou poro retirada da mina. uma ampola de sangue colhida para um exame.
Estatstica Descritiva
Inferncia Estatstica
Dados: Conjuntos de valores, numricos ou no. Todo dado se refere determinada caracterstica (varivel). Tipos de Variveis: Qualitativas: quando os possveis valores que assume representam atributos ou qualidades.
Podem ser: Nominais: o conjunto dos possveis valores no possui uma ordenao natural. Ex: Sexo, Raa, Religio, etc. Ordinais: possvel ordenar o conjunto dos possveis valores. Ex: Classe Social, Escolaridade do chefe da famlia, etc.
Quantitativas: quando os possveis valores que assume so de natureza numrica. Podem ser:
Discretas: em geral so fruto de uma contagem. O conjunto de possveis valores enumervel. Ex: Nmero de filhos na famlia, nmero de pessoas chegando em uma fila, nmero de caras obtidas em 5 lanamentos de uma moeda etc. Contnuas: assumem valores em intervalos dos nmeros reais. Ex: peso, altura, idade, etc.
2. Estatstica descritiva
Apresentao dos dados: organizar os dados de maneira prtica e racional para o melhor entendimento do fenmeno que se est estudando. Pode ser por meio de tabelas e grficos.
Apesar de conter muita informao, a tabela de dados brutos no prtica para respondermos rapidamente a questes de interesse.
Assim, a partir da tabela de dados brutos normalmente construmos uma nova tabela denominada tabela de frequncia.
A tabela de frequncia mais simples aquela que lista os valores observados para determinada varivel, e o nmero de ocorrncias (ou frequncia absoluta) de cada um destes valores. Exemplos:
Sexo F M total fi 37 13 50 Turma A B total fi 25 25 50
fi Freq. absoluta: n de elementos pertencentes a uma classe. Outras Freqncias: Freqncia acumulada (fa): fa = freq. absoluta da classe + freq. absoluta das classes anteriores
Freqncia relativa acumulada (fra): fra = freq. relativa da classe + freq. relativa das classes anteriores
Exemplo:
Idade 17 18 19 20 21 22 23 24 25 fi 9 22 7 4 3 0 2 1 2 fa 9 31 38 42 45 45 47 48 50 fr (%) fra (%) 18 44 14 8 6 0 4 2 4 18 62 76 84 90 90 94 96 100
Total
50
100
No caso da varivel discreta assumir muitos valores e no caso das variveis contnuas, os dados sero classificados em grupos, possuindo diversos valores numa classe.
Exemplo:
Peso 44 |- 52 52 |- 60 60 |- 68 PMi 48 56 64 fi 11 19 7 fa 11 30 37 fr 0,22 0,38 0,14 fra 0,22 0,60 0,74
68 |- 76
76 |- 84 84 |- 92 92 |- 100 Total
72
80 88 96
7
1 4 1 50
44
45 49 50
0,14
0,02 0,08 0,02 1
0,88
0,90 0,98 1,00
Definies:
Limite inferior da classe (LI): o valor mnimo que a varivel alcana. Limite superior da classe (LS): o valor mximo que a varivel alcana. Amplitude da classe (h): a diferena entre o LS e o LI de uma mesma classe.
3. Calcular a amplitude das classes (h), de forma que as classes tenham a mesma amplitude. Para isso, toma-se: =
OBS: h deve ser tomado com nmero de casa decimais igual ou menor que os dados; e seu valor deve, sempre, ser arredondado para cima.
Notas
0,0 |- 1,5 1,5 |- 3,0 3,0 |- 4,5 4,5 |- 6,0 6,0 |- 7,5 7,5 |- 9,0 Total
fi
3 4 5 10 8 2 32
fa
3 7 12 22 30 32
fr (%)
9 13 16 31 25 6 100
fra (%)
9 22 38 69 94 100
20 Frq. Absoluta
15
10
0 17 18 19 20 21 Idade 22 23 24 25
Diagrama circular, disco ou pizza: Tipo de grfico muito utilizado para representao de variveis qualitativas.
Consiste num crculo dividido em setores, cujos tamanhos so proporcionais s freq. absolutas ou porcentagens correspondentes. til quando o nmero de classes pequeno.
Histograma: Este um grfico que parte de uma tabela de freqncia de dados agrupados. Este grfico consiste de retngulos contguos cuja base igual amplitude da classe correspondente e rea igual freqncia relativa de cada classe.
A altura de cada retngulo chamada de densidade da classe. A densidade da classe i o valor dado por:
. =
Obs: o histograma pode ainda ser representado por retngulos contguos cuja base igual amplitude da classe correspondente e altura igual freqncia absoluta (ou relativa) de cada classe.
0,035
Densidade 0,03 0,025 0,02 0,015 0,01 0,005 0 48 56 64 72 80 88 96 0,02 0,08 0,02 0,14 0,14 0,22
Polgono de Frequncia: Este grfico obtido unindo-se os pontos mdios de cada classe por segmentos de reta.
Este grfico fornece uma melhor idia da forma de distribuio dos dados. OBS: Devem-se acrescentar classes com freqncia zero em ambos os extremos da distribuio para ligar o grfico ao eixo horizontal.
0,015
0,01 0,005 0 48 56 64 72 80 88 96 Peso - Ponto Mdio
Ogiva: Representao grfica das freqncias acumuladas de uma tabela de freqncias de dados agrupados.
uma linha poligonal que parte do eixo horizontal no limite inferior da 1 classe e para cada limite superior indica a freqncia acumulada de sua classe.
60 49 44 Freq. acumulada 40 30 30 37 45 50
50
20 11 10 0 0 44 52 60 68 Pesos 76 84 92 100
2.4. Medidas
Medidas so resumos ou sumrios da informao trazida pela populao (ou amostra) em um nico nmero.
Existem diferentes classes de medidas, sendo as mais conhecidas as medidas de posio e disperso.
Definies: Parmetro: Resumo de uma caracterstica obtido a partir de todos os elementos de uma populao. Ex: mdia populacional (), desvio-padro populacional (). Estatstica: Resumo da caracterstica de interesse levando-se em conta apenas os elementos da amostra. Ex: mdia amostral ( ), desvio-padro amostral (s).
2.4.1.
Medidas de posio
Tendem a representar os elementos comuns da populao (ou amostra). Ex: mdia, moda, mediana, quartis, etc.
Mdia amostral ( ): um valor que representa o centro de massa ou ponto de equilbrio da distribuio (histograma). calculado por:
X1 + X2 + + Xn X= = n
Pn
i=1
Xi
Para melhor compreenso do conceito de mdia como centro de massa, imagine uma amostra com os seguintes valores {8, 9, 5, 5, 4, 3, 6, 4}.
Faamos um Diagrama de pontos, que um grfico til para visualizao de pequenas amostras.
Para tanto simplesmente plotamos um ponto para cada valor da amostra sobre um segmento de R que contenha todos os valores. Se houver repeties plotamos um ponto sobre o outro.
Note que a mdia pode ser pensada como um centro de massa porque se cada ponto tivesse a mesma massa, digamos 1kg, o tringulo representando a mdia equilibraria exatamente estes pesos.
Mdia = 5,5
... Xk
Total
... fk
n
fazemos:
1 1 + 2 2 + + = =
=1
=1
1
2 3 5 Total
3
4 2 1 10
0,3
0,4 0,2 0,1 1
Dados agrupados em classe: Para calcularmos a mdia nestes casos devemos inicialmente calcular o ponto mdio de cada classe, denotando-o por PMi.
=
=1
Vamos calcular a nota mdia dos 32 alunos de nosso exemplo a partir da tabela de distribuio de frequncias, incluindo o ponto mdio de cada classe.
Notas
0,0 |- 1,5 1,5 |- 3,0 3,0 |- 4,5 4,5 |- 6,0 6,0 |- 7,5 7,5 |- 9,0 Total
PMi
0,75 2,25 3,75 5,25 6,75 8,25
fi
3 4 5 10 8 2 32
PMi*fi
2,25 9 18,75 52,5 54 16,5 153
fr
0,09 0,13 0,16 0,31 0,25 0,06 1
PMi*fr
0,0675 0,2925 0,6 1,6275 1,6875 0,495 4,77
Assim, pela freq. absoluta: = 153 32 = 4,78 J pela freq. relativa: = 4,77
Em certas situaes, os valores de um conjunto de dados tm graus de importncia diferentes, o que nos leva a calcular uma mdia ponderada.
Em tais casos, calculamos a mdia ponderada atribuindo pesos (w) diferentes aos diversos valores. Assim, Pn w1 x1 + w2 x2 + + wn xn i=1 wi xi X= = Pn w1 + w2 + + wn i=1 wi
17+18+26 X= = 6; 75 4
Mdia Global:
Sejam X1; X2; : : : ; Xk as mdias aritmticas de k conjuntos de n1; n2; : : : ; nk elementos, respectivamente. A mdia aritmtica da srie formada pelo conjunto dos n1 + n2 + + nk elementos dada por:
n1 X 1 + + nk X k i=1 ni X i X= = Pk n1 + + nk i=1 ni Pk
Exemplo: 2 turmas de determinada disciplina. Turma 1: 40 alunos; mdia final (X1 ) = 8,5. Turma 2: 55 alunos; mdia final (X 2 ) = 7,0. Turma 1 + Turma 2 = 95 alunos
40 8; 5 + 55 7; 0 X= = 7; 63 95
Observaes: A mdia uma medida afetada por valores extremos. Se calcularmos o valor mdio de uma varivel para toda a populao, teremos a mdia populacional, normalmente designada pela letra grega (mi). Onde: =1 =
Mediana: o valor que divide o conjunto de dados ao meio, de tal forma que 50% dos valores observados so menores ou iguais mediana e 50% so maiores ou iguais a ela. Notao: md ou Md.
3. Se o nmero de observaes (n) for mpar, a mediana ser a observao central; e se n for par, a mediana ser o ponto mdio entre as duas observaes centrais.
Exemplos:
Os dois candidatos a md so o 2 e o 3. Ento, tomamos o ponto mdio entre eles como a mediana:
2+3 = = 2,5 2
Neste caso, = 3.
Moda:
A moda de um conjunto de dados o valor que ocorre com maior freqncia. Notao: mo ou Mo. Exemplo: { 1; 1; 3; 3; 5; 3; 3; 2}. = 3.
Se houver mais de duas modas diz-se que o conjunto multimodal. Por outro lado se nenhum valor se repete o conjunto no tem moda.
1. Localize a classe de maior freqncia (classe MODAL) e os limites superior (L) e inferior (l) desta classe.
O mtodo de Czuber determina a moda por interpolao usando a hiptese que leva seu nome:
A moda divide o intervalo da classe modal em distncias proporcionais s diferenas entre a freqncia da classe modal com a freqncia das classes adjacentes".
A partir da, utilizando os conceitos de semelhana dos tringulos e observando o histograma abaixo vemos que:
1 = fmo fant 2 = fmo fpos X = mo l
X 1 = hX 2
(onde h = L l)
Dessa Forma,
fmo fant mo = l + (L l) 2fmo (fant + fpos)
Classe Modal
44 |- 52
52 |- 60
60 |- 68 68 |- 76 76 |- 84 84 |- 92 92 |- 100 Total
19
7 7 1 4 1 50
mo = 55; 2
Medidas de tendncia central Propriedades: 1. Se somarmos uma constante c a todos os valores de um conjunto de dados, a moda, mdia e mediana ficam tambm acrescidas dessa constante. 2. Se multiplicarmos uma constante c a todos os valores de um conjunto de dados, a moda, mdia e mediana ficam tambm multiplicadas dessa constante.
Percentil (P): O percentil de ordem de um conjunto de dados um valor P% tal que % dos valores so inferiores ou iguais a ele e (100 - )% dos valores so maiores ou iguais a ele.
% fraa%
Exemplo: Para acharmos a mediana e o 1 quartil das notas dos alunos de nosso exemplo fazemos: Mediana (P50): 1. Classe 4,5|- 6,0.
2. 50 = 0,31. 3. = 0,38.
5,1
3,3.
2.4.2.
Medidas de variabilidade
Medem o espalhamento ou disperso dos dados. Complementam importantes informaes escondidas pelas medidas de posio.
Varincia amostral ( ):
A varincia uma medida de disperso que leva em conta todas as observaes feitas. Ela mede a disperso dos dados em torno da mdia amostral . Considere as observaes X1, X2, ... , Xn:
Temos
)2 1
Ex: - Aluno 1: 2 = 55 60
2
+ 57 60 2 + + 66 60 1
25 + 9 + 0 + 4 + 36 74 = = = 18.5 4 4
2
- Aluno 2: 2 = 38 60
2
+ 49 60 2 + + 81 60 1
Observao: Se calcularmos a varincia de uma populao de tamanho N, teremos a varincia populacional, normalmente designada pela letra grega (sigma). Onde:
2 =
=1
Inconvenientes da varincia: 1. As unidades de medida da varincia amostral so o quadrado da unidade original da varivel (m2 para altura, kg2 para peso, etc).
Para evitar-se este desconforto estabeleceu-se o desvio padro amostral definido por:
=1(
2 =
)2 1
2. No permite comparar a variabilidade de dados medidos em diferentes unidades de medida ou medidos na mesma unidade mas com mdias diferentes.
Aqui a soluo foi a criao de uma medida chamada coeficiente de variao que no sofre influncia nem da mdia nem da unidade de medida. O coeficiente de variao definido como:
Amostra = ( ) 100 Populao = ( ) 100
2 =1
Dados agrupados em classes: Para calcular a varincia nestes casos, considere o ponto mdio de cada classe, denotado por PMi e faa
2 = ou 1 = 1
2 =1 =1(
)2 1
2 =1
Exemplo:
Freq. cardaca 60 |- 65 65 |- 70 70 |- 75 PMi 62,5 67,5 72,5 fi 11 35 68 PMi*fi 687,5 2362,5 4930 PMi2*fi 42968,75 159468,75 357425
75 |- 80
80 |- 85 85 |- 90
77,5
82,5 87,5
20
12 10
1550
990 875
120125
81675 76562,5
90 |- 95
95 |- 100 Total
92,5
97,5
1
3 160
92,5
292,5 11780
8556,25
28518,75 875300
Assim,
= 11780 160 = 73,6 1 11780 2 = 875300 159 160 = 50,3 = 7,1
2
= 50,3
Varincia Propriedades: 1. Se somarmos uma constante c a todos os valores de um conjunto de dados, a varincia no sofre alterao. 2. Se multiplicarmos uma constante c a todos os valores de um conjunto de dados, a varincia fica multiplicada pela constante ao quadrado (c2).
Distribuio simtrica:
moda = mediana = mdia e
X = mo = md
= Mo = Md
Tipos de assimetria
Assimetria direita ou positiva: a distribuio apresenta uma cauda mais acentuada direita.
Assimetria esquerda ou negativa: a distribuio apresenta uma cauda mais acentuada esquerda.
2.5.2. Boxplot
uma representao grfica envolvendo os quartis. Definimos um retngulo com base inferior igual ao 1 quartil e base superior igual ao 3 quartil. A mediana representada por um segmento de reta no interior do retngulo.
A partir dos pontos mdios das bases superior e inferior, so traados segmentos que se estendem at os valores mximo e mnimo que no sejam observaes discrepantes (outliers). Uma observao considerada discrepante, quando esta assume um valor superior a DS ou inferior a DI, onde: DS = Q3 + 1,5(Q3 Q1) e DI = Q1 - 1,5(Q3 Q1)
Exemplo: As informaes abaixo se referem aos dados de tempos de prova (em segundos), de 150 corredores, selecionados aleatoriamente, que terminaram a Maratona da Cidade de Nova Iorque em um ano recente.
Q1 13955,5 Mediana 15326 Q3 17396,5 Min. 9631 Max. 25898
Observaes:
A diferena (Q3 Q1) denotada Intervalo Interquartil (IQR). Este intervalo abrange 50% das observaes centrais de um conjunto de dados ordenados.
Os Boxplots so convenientes para revelar a distribuio emprica dos dados, tendncias centrais, disperso e a presena de outliers.
Os Boxplots tambm so convenientes para realizar a comparao de dois ou mais conjuntos de dados. Exemplo: Boxplots da varivel consumo de combustvel (milhas por galo) de acordo com o tipo de estrada. Grfico construdo a partir de uma amostra de 20 carros de diferentes tipos e marcas.
Cada valor observado da varivel X deve consistir de no mnimo dois dgitos e a varivel pode ser tanto quantitativa discreta como contnua.
O ramo consistir de um ou mais dgitos iniciais se o valor da varivel for um nmero inteiro e do nmero inteiro, se o valor da varivel for um nmero com decimais.
Nas folhas, colocam-se os dgitos restantes se o valor observado for nmero inteiro, ou os decimais, caso contrrio.
Exemplo: Considere as seguintes notas de um teste de coordenao fsica, aplicado a 20 estudantes, aps eles terem ingerido uma quantidade de lcool igual a 0,1% do seu peso.
69 61 88 67 84 74 63 72 52 79 57 74 93 65 64 55
82
61
68
77
Ramo em Folhas ampliado Unidade das folhas = 1 5 275 6 91534718 7 49247 8 482 9 3 257 11345789 24479 248 3 5a 5b 6a 6b 7a 7b 8a 8b 9a 2 5 1 5 2 7 2 8 3
7 1 7 4 9 4
3 8 4
4 9
a: 0 a 4 b: 5 a 9
3.
Probabilidade
Conceitos iniciais
3.1.
Fenmeno Aleatrio: um acontecimento cujo resultado no pode ser previamente previsto com certeza. Um experimento aleatrio pode fornecer diferente resultados, mesmo que seja repetido sempre da mesma maneira. Exemplos:
1. O resultado do seu time no prximo jogo do Campeonato Brasileiro; 2. A altura de um aluno sorteado ao acaso nesta sala; 3. A taxa de inflao do ms de dezembro de 2011; 4. O resultado do lanamento de um dado.
Espao amostral ( ou S): o conjunto de todos os resultados possveis de um fenmeno ou experimento aleatrio. Pode ser finito ou infinito, de acordo com a quantidade de possveis resultados.
Evento (A; B; C; ... ;Z): qualquer subconjunto do espao amostral (). Exemplos: 1. Seu time no perde A = {empate, vitria}; 2. A altura do aluno est entre 1,40 e 1,60 B = (1,40; 1,60); 3. A taxa de inflao de dezembro de 2011 menor ou igual a 10% C = (- 1 ; 0,10]; 4. Ocorre uma face par D = {2; 4; 6}.
Evento elementar: um resultado ou evento que no pode mais ser decomposto em componentes mais simples.
Eventos especiais:
Evento impossvel ( ): o evento que nunca ocorre. Evento certo (): o evento que sempre ocorre.
= {1, 2, 3, 4, 6}
= {2}
Eventos complementares ( ou , ou ): O evento ocorre se o evento A no ocorre. formado por todos os pontos de que no esto em A. A e so complementares se, e somente se, = = . e
Para defini-se:
# () = = # () Neste caso dizemos que os resultados so equiprovveis.
4 1 = = 0,08 52 13
2. lanar duas moedas e observar a configurao obtida. c = cara; k = coroa. = {cc; ck; kc; kk} Qual a probabilidade de se obter zero caras? E uma cara?
A zero caras A = {kk} = 1 4. B uma cara B = {ck; kc} = 2 4.
Aproximao relativa.
da
probabilidade
pela
freqncia
Lei dos Grandes Nmeros: Ao se repetir um experimento um grande nmero de vezes, a probabilidade pela freqncia relativa de um evento tende para a probabilidade terica. A lei dos Grandes Nmeros afirma que a aproximao pela freqncia relativa tende a melhorar quando o nmero de observaes aumenta.
Formalmente, tem-se que: Considere n repeties independentes de um experimento aleatrio . Seja A um evento qualquer. Defina:
# = #
Quando o nmero de lanamentos muito grande, fri se estabiliza. Da, toma-se fri como a probabilidade de ocorrncia da face i.
2. Suponha que temos uma linha de produo em grande escala. Retiramos n itens desta linha de produo, e a cada retirada contamos o nmero de itens defeituosos (A = item defeituoso)
Podemos ento afirmar que a probabilidade frequencial de um item defeituoso nesta linha de produo 0,05.
1. 2. 3.
4. Regra da adio: = + ( )
5. = 1 (). Como A e so complementares temos = e = . Ento, pela regra da adio, = = + e pela regra 1, + = 1, logo = 1 .
6. Se B, ento () (). Podemos escrever B como = ( ). Os eventos A e so disjuntos, ento pela regra da adio podemos escrever = + ( ). Como, pela regra 3, ( ) 0 logo () ().
110
15
10 20 115
15
20 10 85
30
30 30 200
- = + = 200 + 200 = 200 = 0,7 - = + ( ) 30 85 15 100 = + = = 0,5 200 200 200 200 - = 1 = 1 200 = 200 = 0,85
30 170
110
30
140
A probabilidade condicional de A dado B revela a incerteza que se tem sobre o evento A supondo conhecida a verdade sobre o evento B. Podemos interpret-la como a chance relativa de A restrita ao fato de que B ocorreu.
Exemplos: 1. Uma urna contm 2 bolas brancas (B) e 3 bolas vermelhas (V). Suponha que so sorteadas duas bolas ao acaso, sem reposio.
2. As informaes abaixo se referem aos candidatos que prestaram vestibular na UFES em 2010:
Homem (H) Mulher (M) Total
Aprovado (A)
Reprovado (R) Total
8
4 12
14
6 20
22
10 32
Um aluno sorteado ao acaso. Qual a probabilidade de: Ser mulher e ter sido aprovado? Se mulher, ter sido aprovada? Ser mulher dado que foi aprovado?
Solues:
a. = 14 32 0,44
() () 14 32 20 32 14 20
b.
= 0,70
c.
() ()
14 32 22 32
14 22
0,64
Propriedades:
1. 2. 3. 4. 5. 6. |B = 1 |B = 0 0 (|) 1, para qualquer evento A. | = | + | ( |) | = | + | = | = 1 (|)
A definio de probabilidade condicional pode ser reescrita para fornecer uma expresso geral para a probabilidade da interseo de dois eventos:
= = ()
Exemplo: Acredita-se que na populao do ES 20% de seus habitantes sofrem algum tipo de alergia, sendo classificados como alrgicos para fins de sade pblica. Sendo alrgico, a probabilidade de ter reao a certo antibitico de 0,5. Para os no alrgicos esta probabilidade de apenas 0,05.
Escolhendo-se uma pessoa ao acaso da populao do ES, qual a probabilidade de que ela:
a. Seja do grupo dos alrgicos e tenha alergia ao ingerir o antibitico? b. Seja do grupo dos no alrgicos e no tenha alergia ao ingerir o antibitico?
A regra da multiplicao til para determinarmos a probabilidade de um evento que depende de outros eventos.
Exemplo:
Em uma fbrica de parafusos, as mquinas A e B produzem 2/3 e 1/3 da produo total, respectivamente. Da produo de cada mquina 2% e 0,8%, respectivamente, so parafusos defeituosos. Escolhendo-se aleatoriamente um parafuso, qual a probabilidade que ele seja defeituoso?
Para generalizarmos o conceito da probabilidade total, definimos: Definio: Dizemos que os eventos {A1; A2; ... ; An} formam uma partio do espao amostral se:
1. = 2.
=1
Teorema
da
Seja {A1; A2; ... ; An} uma partio do espao amostral e seja B um evento qualquer, ento,
= 1 + 2 + +
() = 1 1 + 2 2 + +
=1
() =
3.7. Independncia
Definio: Dois eventos A e B so independentes se a ocorrncia de um no afeta a probabilidade de ocorrncia do outro. Assim, tem-se que:
1. = () 2. = ()
Uma empresa produz peas em duas mquinas (1 e 2). Estas mquinas podem apresentar desajustes com probabilidade 0,05 e 0,1, respectivamente. Suponha que as mquinas trabalhem de forma independente.
No incio do dia um teste realizado e caso a mquina esteja fora do ajuste a mesma pra de operar e vai para manuteno. Para que se cumpra o nvel mnimo de produo diria necessrio que pelo menos uma mquina esteja funcionando. Qual a probabilidade de que a empresa cumpra a produo do dia?
E agora, usando o segundo e quarto termos da igualdade vem um resultado til que nos permite escrever a probabilidade de A dado B em termos da probabilidade de B dado A:
() =
Partindo desta expresso, e escrevendo o denominador usando a regra da probabilidade total, obtemos o Teorema de Bayes:
Teorema de Bayes: Se {A1; A2; ... ; An} for uma partio de e B um evento qualquer, ento:
( ) = 1 1 + +
Exemplos: 1. Suponha que um fabricante de sorvetes recebe 20% de todo o leite que consome da fazenda F1, 30% da fazenda F2 e o restante da F3. A vigilncia sanitria inspecionou as fazendas de surpresa e observou que 20% do leite produzido na fazenda F1 estava adulterado por adio de gua, o mesmo ocorrendo com 5% e 2% respectivamente nas fazendas F2 e F3.
Na indstria de sorvete os gales de leite so armazenados sem identificao das fazendas produtoras. Um galo sorteado ao acaso na indstria. Calcule:
a. A probabilidade de que o galo esteja adulterado.
a.
= 1 2 3 = 1 + 2 + 3
2. Das pacientes da clnica de Ginecologia com idade acima de 40 anos, 60% so ou foram casadas e 40% so solteiras. Sendo solteira, a probabilidade de ter tido um distrbio hormonal no ltimo ano de 10%, enquanto para as demais esta probabilidade aumenta para 30%.
Pergunta-se:
a. Qual a probabilidade de uma paciente escolhida ao acaso ter tido um distrbio hormonal no ltimo ano? b. Se a paciente escolhida tiver tido um distrbio, qual a probabilidade dela ser solteira? c. Escolhemos duas pacientes ao acaso e com reposio, qual a probabilidade de pelo menos uma ter o distrbio?
a.
b. =
()
0,10,4 0,22
0,188
c. Seja Hi o evento de que a i-sima paciente tenha tido distrbio hormonal. Da:
4.
Variveis Aleatrias
Sabe-se que um espao amostral ( ou S) o conjunto de todos os resultados possveis de um fenmeno ou experimento aleatrio. Em muitos casos no estamos interessados na descrio detalhada de todos os resultados, e mais interessante resumirmos o resultado atravs de nmeros.
Definio: Uma varivel aleatria (v.a.) uma funo que confere um nmero real a cada resultado no espao amostral de um experimento aleatrio. Uma varivel aleatria denotada por uma letra maiscula (por ex. X) e os valores que ela pode assumir como xi.
Exemplos:
1. E lanar duas moedas. O espao amostral desta experincia = {cc; ck; kc; kk} onde c = cara e k = coroa. Uma varivel aleatria pode ser nmero de caras, X = {0; 1; 2}.
(1; 1) = (6; 1)
(1; 6) (6; 6)
Classificao:
Varivel aleatria discreta: assume valores num conjunto finito ou infinito enumervel. EX: n de filhos, n de peas defeituosas em um lote, bits transmitidos que foram recebidos com erros.
Varivel aleatria contnua: seu conjunto de valores qualquer intervalo dos nmeros reais, o que seria um conjunto infinito no enumervel. EX: peso, altura, corrente eltrica, presso, temperatura, tempo.
2. No processo de fabricao de semicondutores o fabricante deve se preocupar com o nmero de partculas contaminantes. Se definirmos a varivel aleatria Y = nmero de partculas contaminantes em uma pastilha, os valores possveis de Y = {0; 1; 2; ...}.
Modelo Probabilstico: Um modelo probabilstico consiste em atribuir a cada valor da v.a. X a sua probabilidade de ocorrncia.
A funo que atribui a cada valor xi de X a sua probabilidade chamada de funo de probabilidade.
Assim se X uma varivel aleatria assumindo os valores x1, x2, ... , xn a funo de probabilidade associada a X :
= = = = 1, 2,
A distribuio de probabilidades de uma varivel aleatria X uma descrio das probabilidades associadas com os possveis valores de X. Esta descrio pode ser realizada em forma de tabelas ou grficos.
No exemplo da varivel aleatria nmero de caras num lanamento de duas moedas (supondo que as moedas sejam honestas e os lanamentos independentes) temos a seguinte distribuio de probabilidades:
2.
= 1
Exemplo: Com os dados do ltimo censo a assistente social do centro de sade constatou que na regio 20% das famlias no tm filhos, 30% possuem 1 filho, 35% possuem 2 filhos e as demais se dividem igualmente entre 3, 4 ou 5 filhos. Suponha que uma famlia seja escolhida aleatoriamente e defina a v.a. N como o nmero de filhos desta famlia. Construa a funo de probabilidade para N.
Soluo: Se N o nmero de filhos na famlia temos que os valores possveis de N so: {0; 1; 2; 3; 4; 5}. Supondo que todas as famlias tm chances iguais de serem sorteadas:
n de filhos pi 0 1 2 3 4 5
( )2 =
2 2
Exemplo: Um canal digital transmite dados com certa probabilidade de erro. Seja X o nmero de bits recebidos com erro nos quatro prximos bits transmitidos. Os valores possveis de X so {0; 1; 2; 3; 4}. Suponha que tenhamos as seguintes probabilidades:
0 = 0,6561; 1 = 0,2916; 2 = 0,0486;
3 = 0,0036; 4 = 0,0001.
= 0,4
Estudaremos nesta seo a distribuio de probabilidade de algumas variveis aleatrias, que por possurem caractersticas especiais comuns so agrupadas em famlias.
4.2.1.
Distribuio Bernoulli
Muitos experimentos so tais que os resultados apresentam ou no uma determinada caracterstica. Por exemplo:
Uma moeda lanada: o resultado cara ou no; Uma pea escolhida ao acaso de um lote contendo 500 peas: essa pea defeituosa ou no;
Em ambos os casos, estamos interessados na ocorrncia de sucesso ou fracasso. OBS: A palavra sucesso como usada aqui arbitrria e no representa, necessariamente, algo bom
Definio: Seja X uma varivel aleatria que assume os valores 1 (sucesso) e 0 (fracasso). Diz-se que X tem distribuio Bernoulli com parmetro p, onde p a probabilidade de sucesso.
Notao: X ~ Bernoulli(p)
A funo de probabilidade de X :
= = (1 )1 , = 0 1
Assim temos:
=
1 =0
= = 0 = 0 + 1 = 1
= = 1 =
1 =0
2 =
= 02 = 0 + 12 = 1 2 = = 1 2 = 2 = (1 )
4.2.2.
Distribuio Binomial
Se realizarmos n experimentos de Bernoulli de forma independente e se cada experimento tem probabilidade de sucesso igual a p (fixo), ento a varivel aleatria que conta o nmero de sucessos nestes n experimentos tem distribuio binomial.
Por exemplo:
Uma moeda lanada trs vezes; qual a probabilidade de se obter duas caras? Dez peas so extradas, ao acaso, com reposio, de um lote de 500 peas; qual a probabilidade de que pelo menos duas sejam defeituosas; sabendo-se que 10% das peas do lote so defeituosas?
= (1 )
k n-k
Mas quantos vetores de tamanho n com k sucessos e (n k) fracassos podem ser formados?
Para responder a essa pergunta, basta calcularmos o nmero de permutaes possveis de n elementos com k e (n k) repeties.
Definio: Uma distribuio de probabilidade Binomial resulta de um experimento que satisfaz os seguintes requisitos: 1. O experimento tem um nmero fixo de tentativas; 2. As tentativas devem ser independentes; 3. Cada tentativa deve ter todos os resultados classificados em duas categorias; 4. A probabilidade de um sucesso em cada tentativa, denotada por p, permanece constante.
A varivel aleatria X, correspondente ao nmero total de sucessos nas n tentativas do experimento, tem distribuio Binomial com parmetros n e p e funo de probabilidade:
= = (1 ) , = 0, 1, 2, , .
Notao X~Binomial(n; p)
Exemplos:
1. Um professor de Psicologia planeja dar um teste surpresa que consiste em 4 questes de mltipla escolha, cada uma com 5 alternativas possveis (a, b, c, d, e), uma das quais correta. Suponhamos que um aluno despreparado faa adivinhaes aleatrias. Qual a probabilidade de que este aluno acerte exatamente trs questes?
Soluo: Primeiramente, note que esse procedimento satisfaz os 4 requisitos para uma distribuio binomial.
A varivel aleatria X, nmero de respostas corretas dentre as 4 questes, pode assumir os valores {0, 1, 2, 3, 4}. Dessa forma, X ~ Binomial(4; 0,2).
2. Uma linha de produo em grande escala produz 6% de itens defeituosos. 30 itens da produo semanal so observados. Calcular a probabilidade de se observar pelo menos 2 itens defeituosos?
Soluo: Seja X = nmero de itens defeituosos dentre os 30 observados. X = {0, 1, 2, ..., 30}. X ~ Binomial(30; 0,06)
2 = 1 < 2 Onde, < 2 = = 0 + = 1
30 < 2 = 0
0,06
0,94
30
30 + 1
0,06
0,94
29
2 = 1 0,455469 0,545
A figura a seguir mostra exemplo de distribuies binomiais. Para n fixo (no exemplo n = 20) medida que p aumenta de 0 a 0,5 a distribuio se torna mais simtrica. O mesmo acontece se p diminui de 1 a 0,5.
Exemplo: No exemplo anterior da linha de produo, tem-se que o nmero esperado de itens defeituosos dentre os 30 observados :
= 30 0,06 = 1,8
4.2.3.
Distribuio de Poisson
til para descrever as probabilidades do nmero de ocorrncias num campo ou intervalo contnuo (em geral tempo ou espao).
A utilizao da distribuio de Poisson baseia-se nas seguintes hipteses: 1. A probabilidade de ocorrncia a mesma para dois intervalos quaisquer de igual comprimento. 2. A probabilidade de duas ou mais ocorrncias simultneas aproximadamente zero.
OBS: o nmero de ocorrncias no tem limite mximo. Ela uma v.a. discreta que pode assumir uma sequncia infinita de valores (X = 0, 1, 2, ...). Mdia e varincia de uma distribuio de Poisson
= =
Exemplos:
1. Suponha que estejamos interessados no nmero de carros que chegam a um caixa automtico drivethru de um banco durante um perodo de 15 minutos nas manhs de fins de semana. Considere que a anlise dos dados histricos mostre que o nmero mdio de carros que chegam no perodo considerado igual a 10.
Determine a probabilidade de: a) Exatamente 5 carros chegarem em 15 min.? X = n de carros que chegam em um perodo de 15 min qualquer.
e10 105 P (X = 5) = = 0; 0378 5!
Portanto,
e2 21 P (Y = 1) = = 0; 2707 1!
2. Suponha que os defeitos em fios para tear possam ser aproximados por um modelo de Poisson com mdia de 0,2 defeitos por metro. Inspecionando-se pedaos de fio de 6 metros de comprimento, determine a probabilidade de se encontrar menos de 2 defeitos.
= 6 0; 2 = 1; 2
P (X 1) = P (X = 0) + P (X = 1) e1;2 1; 20 e1;2 1; 2 = + 0! 1! = 0; 301 + 0; 3612 = 0; 6622
Distribuies de probabilidade contnuas: Dado que uma v.a. contnua X assume um conjunto infinito no enumervel de valores, torna-se impraticvel a idia de atribuir uma probabilidade a cada possvel valor de X, como era feito no caso de uma v.a. discreta.
Agora, o procedimento para a obteno de probabilidades levar em conta intervalos de valores e usar o histograma.
fi
f1 f2
fr
fr1 fr2
x2 |- x3
x7 |- x8
f3
f8
fr3
fr8
x8 |- x9
Total
f9
n
fr9
Lembre-se que na construo de um histograma, a altura correspondente a cada retngulo equivale densidade da classe, onde = / . Dessa forma, a rea de cada retngulo igual a freq. relativa da classe. Assim, dado que a soma das freq. relativas igual a 1, a rea total do histograma e do polgono de freqncias tambm 1.
di
Considere o intervalo (x1,x2). Temos que a probabilidade de um ponto qualquer cair entre x1 e x2 ser aproximadamente igual a rea do retngulo hachurado.
Se diminuirmos a amplitude dos intervalos, (aumentando, assim, o nmero de intervalos) tornando a mesma infinitamente pequena, o polgono de freqncias passar a ser uma curva.
di
1. 2.
x f (x) dx
Z 2 = V (X) =
x2 f (x) dx 2
1
Exemplo: Arquelogos estudaram certa regio e estabeleceram um modelo terico para a varivel C, comprimento de fsseis na regio (em cm). Suponha que C uma varivel aleatria contnua com a seguinte funo densidade de probabilidade:
8 < f (c) = :
1 40
c
10
+ 1 ; se 0 c 20 caso contrrio a
=
0
1 1 + 1 = 40 10 400 3
3 20 0
1 + 40 2
2 20 0
35 = 3
() =
0
20
1 + 1 40 10
2 4 20 0
1 () = 400 4
2 2
1 + 40 3
3 20 0
500 = 3
500 35 = 3 3
2
= 30,56 2
30,56 = 5,53
Propriedades da mdia:
1. = 2. = () 3. + = + 4. + = + ()
Propriedades da varincia:
1. = 0 2. = 2 () 3. + = 2 () 4. = ()
Definio: Uma v.a. contnua tem uma distribuio uniforme se todos os valores que assume so igualmente provveis.
Uma v.a. X tem distribuio Uniforme Contnua no intervalo [a, b], a < b, se sua funo densidade de probabilidade dada por:
1 , = ( ) 0,
Notao: X ~ Uniforme[a, b]
Exemplo: Uma professora planeja a aula to cuidadosamente, que a durao de suas aulas distribuda uniformemente entre 50 e 52 minutos. Isto , qualquer tempo entre 50 e 52 minutos possvel, e todos esses valores possveis so igualmente provveis.
Se selecionarmos aleatoriamente uma aula e designarmos X a v.a. representativa do tempo de aula, ento, X tem uma distribuio definida pela funo densidade
1 , = 2 0, 50 52
2 12
Exemplo: No exemplo anterior relacionado durao de aula de uma determinada professora, designou-se X a v.a. representativa do tempo de aula (em min.), onde X seguia uma distribuio Uniforme[50, 52]. Dessa forma, o tempo esperado de aula :
52 + 50 = = 51 2
4.4.2.
Distribuio Exponencial
Notao: X ~ Exp().
Para calcular probabilidades com a exponencial, precisamos resolver a integral correspondente ao intervalo de interesse. Assim,
Esta distribuio tem sido amplamente utilizada nas reas de fsica, engenharia, computao e biologia. Variveis como a vida til de equipamentos, tempos de falha, tempos de sobrevivncia de espcies e intervalos entre solicitaes de recursos so algumas das quantidades que tm sido modeladas pela exponencial.
Soluo: Representemos pela v.a. T, o tempo de vida da lmpada, e assim T ~ Exp(1 8000). A probabilidade desejada ser:
50 1 1 8000 8000
< 50 =
0
< 50 =
50 1 8000 0 50 8000
1 8000 0
1 8000 50
< 50 = 1
0,006
Dessa forma, a proporo de trocas por defeito de fabricao ser de aproximadamente 0,6%. Esse nmero relativamente pequeno, o que no
surpresa, tendo em vista que, como o parmetro = 1 8000, a durao mdia das lmpadas = 1 = 8000 horas.
Notao: X ~ N(, 2 ).
Propriedades da Normal:
1. simtrica em relao a . 2. 0 quando . 3. O valor mximo de ocorre quando = .
A distribuio Normal completamente especificada pela mdia e pela varincia 2 (parmetros da distribuio). A figura a seguir mostra exemplo de distribuies Normais.
z1
livro:
Procedimento para achar escores z a partir de reas conhecidas. 1. Desenhe uma curva em forma de sino e identifique a regio sob a curva que corresponde probabilidade dada. Se esta regio no for uma regio acumulada esquerda, trabalhe com regies conhecidas que sejam acumuladas esquerda.
Usando a rea acumulada esquerda, localize a probabilidade mais prxima no corpo da tabela da distribuio Normal e identifique o escore z correspondente.
livro:
Qual a distribuio de X - ?
Exemplo: Doentes sofrendo de certa molstia so submetidos a um tratamento intensivo cujo tempo de cura foi modelado por uma densidade Normal, de mdia 15 e desvio padro 2 (em dias). Seja X a v.a. que denota o tempo de cura, temos que X ~ N(15, 4).
Soluo:
a. > 17 = >
1715 2
= > 1
= 1 1 = 1 0,8413 = 0,1587
2015 2
b. < 20 = <
c. 14 < < 17 =
1415 2
< <
1715 2
= 0,5 < < 1 = < 1 ( < 0,5) 14 < < 17 = 0,8413 0,3085 = 0,5328
Uma questo interessante seria saber o tempo mximo necessrio para a recuperao de 25% dos pacientes, ou seja,
< = 0,25 15 = = 0,25 2
Exemplo: Selecionamos todas as possveis amostras de tamanho 2, com reposio, da populao {1, 3, 5, 5, 7}. Existem 5x5 = 25 possibilidades:
1e1 3e1 1e3 3e3 1e5 3e5 1e5 3e5 1e7 3e7
5e1
5e1 7e1
5e3
5e3 7e3
5e5
5e5 7e5
5e5
5e5 7e5
5e7
5e7 7e7
E suas mdias so: 1, 2, 3, 3, 4, 2, 3, 4, 4, 5, 3, 4, 5, 5, 6, 3, 4, 5, 5, 6, 4, 5, 6, 6 e 7, respectivamente. Como cada amostra tem probabilidade de ocorrncia igual a 1/25, a distribuio amostral de dada por:
( = ) 1
1 25 2
2 25 5
3 25 6
4 25 6
5 25 4
6 25 1
7 25
= =
2 = =
= 4,2
2 2 = 2,08
1 , ,
selecionadas da populao. (As amostras so selecionadas de modo que todas as possveis amostras de tamanho n tm a mesma chance de serem escolhidas).
Concluso:
A distribuio das mdias amostrais () ir se aproximar de uma distribuio normal medida que n aumentar. Ou seja, 2 ~N , .
distribuda, eis uma diretriz em comum: para amostras de tamanho n maior que 30, a distribuio de pode ser razoavelmente bem aproximada pela distribuio normal. A aproximao se torna melhor medida que o tamanho amostral n aumenta.
OBS: Populaes com distribuies muito assimtricas, requerem tamanhos de amostra muito maiores que 30.
2. Se a populao for normalmente distribuda, ento ser normalmente distribuda para qualquer tamanho amostral n.
Exemplo: Em uma certa cidade, a durao de conversas telefnicas em minutos, originrias de telefones pblicos, segue um modelo Exponencial com parmetro 1/3. Observando-se uma amostra aleatria de 50 dessas chamadas, qual ser a probabilidade delas, em mdia, no ultrapassarem 4 minutos?
Tendo em vista o alto valor de probabilidade encontrado, podemos dizer que praticamente certo que a media amostral estar abaixo de 4 min.
= .
Logo, a proporo amostral nada mais do que a mdia de v.a.s convenientemente definidas. Assumindo que a proporo de indivduos com a dada caracterstica na populao p e que os indivduos so selecionados aleatoriamente, temos que 1 , , formam uma seqncia de v.a.s independentes com distribuio de Bernoulli.
Assim, = e = (1 ). Logo,
=1
=1
(1 ) =
(0, 1).
Exemplo: Suponha que a proporo de peas fora de especificao em um lote de 40%. Tomada uma amostra de tamanho 30, a probabilidade de esta amostra fornecer uma proporo de peas defeituosas menor que 0,50 pode ser calculada de forma exata pela Binomial e aproximada pelo modelo Normal.
Soluo: Seja X a v.a. representando o nmero de peas defeituosas na amostra. Claramente, X ~ Binomial(30; 0,40). Logo, se representa a proporo amostral de peas defeituosas, temos que
< 0,50 = 30 < 0,50 = ( < 15) =
14 =0
Assim,
< 0,50 < 0,50 0,40 0,40 0,60 30
Temos, ento, mesmo para uma amostra no muito grande, uma proximidade razovel entre as duas respostas.
5.
INFERNCIA ESTATSTICA
Objetiva estudar a populao atravs de evidncias fornecidas pela amostra. No nosso caso, as amostras sero obtidas por amostragem aleatria simples (AAS).
5.1. Estimao
Definies: Parmetro: Resumo de uma caracterstica obtido a partir de todos os elementos de uma populao. Ex: mdia populacional (), desvio-padro populacional (), proporo populacional (p).
Estimador: combinao dos elementos da amostra, construda com a finalidade de representar, ou estimar, um parmetro de interesse. Notao: , , , etc.
Estimativa: Um valor especfico do estimador, obtido para uma amostra em particular.
5.1.1.
Estimao pontual
Um nico valor amostral usado como estimativa de um parmetro da populao. A seguir encontram-se alguns exemplos de estimadores pontuais.
Parmetro
Estimador 1 + 2 + + = = . = 2 = 2 =
=1(
)2 1 2
= =
5.1.2.
Intervalos de Confiana
A partir da estimao pontual, somos incapazes de julgar qual a possvel magnitude do erro que estamos cometendo.
Da, surge a idia de construir os intervalos de confiana, que so baseados na distribuio amostral do estimador pontual.
Definio: um intervalo de confiana (IC) uma faixa (ou um intervalo) de valores usada para estimar o verdadeiro valor de um parmetro populacional.
5.1.3.
E portanto,
2 = ~ N 0, ,
onde
2 = =
Daqui podemos determinar qual a probabilidade de cometermos erros de determinadas magnitudes. Por exemplo,
< 1,96 = 1 = 0,95 ou < 1,96 = 0,95
Que equivalente a
1,96 < < 1,96 = 0,95
E, finalmente,
1,96 < < + 1,96 = 0,95
Onde = 2
= 1,96. (Olhar na
= 1,96
4 100
= 0,8
Assim, estamos 95% confiantes de que o intervalo de 19,2 a 20,8 realmente contenha o verdadeiro valor de .
Para manter o intervalo de confiana em algum nvel desejado, tal como 95%, compensamos essa incerteza adicional construindo um intervalo de confiana um pouco mais largo.
Distribuio t de Student Se a distribuio de uma populao essencialmente normal (com forma aproximada de um sino), ento a distribuio de
=
O nico parmetro que define e caracteriza a forma dessa distribuio o nmero de graus de liberdade (g.l.), que corresponde ao nmero de valores amostrais que podem variar aps terem sido impostas certas restries aos dados amostrais.
Tem a mesma forma geral simtrica que a dist. Normal padro, mas reflete a maior variabilidade esperada em pequenas amostras;
Tem mdia igual zero;
O desvio padro varia com o tamanho da amostra, mas maior do que 1; medida que o tamanho amostral n se torna maior, a dist. t-Student se aproxima da dist. Normal padro.
Onde
Exemplo: Considere um teste de coliso de carros. A anlise de 12 carros danificados resulta num custo de conserto que parece ter distribuio em forma de sino, com mdia e desvio-padro a seguir (R$).
= 26.227 e = 15.873
Soluo:
1 = 0,95 Para . . = 1 = 11 = 2,201.
= 2,201
15.873 12
= 10.085,29
5.1.4.
; 1 =
onde =
(1)
a margem de erro.
Exemplo: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre determinado produto, e 70% delas preferiram a marca A. construa um IC de 90% para a proporo de pessoas que preferem a marca A. Soluo: Para 1 = 0,90
na tabela 1 2).
2
= 1,645. (Olhar
1) Abordagem otimista:
2) Abordagem conservativa:
Definio: Uma hiptese estatstica uma afirmao acerca dos parmetros de uma populao, ou acerca da distribuio da populao.
O objetivo de um teste de hipteses fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidncias que apiem ou no uma hiptese formulada.
Exemplo: exemplo 8.1 do livro do Magalhes.
Colhe-se uma amostra aleatria de elementos dessa populao, e com ela deseja-se comprovar ou no tal hiptese.
Passo 1: Formular as hipteses nula e alternativa. 0 (hiptese nula): a hiptese que estamos pondo prova. 1 (hiptese alternativa): hiptese que ser considerada aceitvel, caso 0 seja rejeitada.
Qualquer que seja a deciso tomada, vimos que estamos sujeitos a cometer erros. Erro do tipo I: Rejeitar 0 quando essa verdadeira.
Chamamos de a probabilidade de cometermos esse erro, isto ,
= 0 0
A definio da RC de pende da hiptese alternativa. Por exemplo, suponha que estamos realizando um teste para a mdia () de uma populao qualquer. Tem-se que, para:
1 : 0 = | < 1 > 2 1 : > 0 = | > 1 : < 0 = | <
Ou de forma equivalente:
1 1 : 0 = | < 1 > 2
2 1 : > 0 = | >
3 1 : < 0 = | <
Presuma que o desvio padro seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistncia trao de ao? (Adote um nvel de significncia de 5%)
Passo 4: Concluso.
Uma vez que = 3,16 pertence RC, rejeitamos 0 ao nvel de significncia de 5%. Ou seja, conclumos que a resistncia trao do ao mudou aps ter sido feito ajuste da mquina.
Exemplo: Um fabricante afirma que seus cigarros contm no mais que 30mg de nicotina. Uma amostra de 25 cigarros fornece mdia de 31,5mg e desvio padro de 3mg. No nvel de 5%, os dados refutam ou no a afirmao do fabricante?
Soluo: Passo 1:
0 : = 30 1 : > 30
Passo 2:
= ~ (24)
Em 2005, foi realizado um estudo com 500 viajantes que chegaram aos EUA. Desses, 360 disseram que o principal objetivo da visita os Estados Unidos era desfrutar as frias.
A proporo de viajantes estrangeiros que tiraram frias nos Estados Unidos em 2005 menor do que a proporo relatada em 1995? Considere um nvel de significncia de 5%.
Soluo:
Passo 1:
Passo 2:
~ N ,
(1)
Dessa forma,
= 0 0 (1 0 ) = 0,72 0,76 0,76(0,24) 500 = 2,09
Um enfoque alternativo consiste em calcular, supondo que a hiptese nula seja verdadeira, a probabilidade de se obter um valor da estatstica de teste que seja no mnimo to extremo quanto o que foi observado a partir da amostra. Essa quantidade chamada probabilidade de significncia ou p-valor.
Exemplo: No exemplo relacionado ao Servio de Imigrao e Naturalizao Americano, onde o objetivo era testar se proporo de viajantes estrangeiros que tiraram frias nos Estados Unidos em 2005 era menor do que a proporo relatada em 1995.
0,76(10,76) 500
= <
Podemos considerar probabilidades de significncia bilaterais. Um procedimento tomar o p-valor unilateral como sendo igual a 2 vezes o p-valor unilateral. Assim, a definio do p-valor depende da relao entre e 0 . Onde o estimador de .
1 Caso: se < 0 ,
= 2 < | 0 .
2 Caso: se > 0 ,
= 2 > | 0 .