Você está na página 1de 85

,

Universidade Federal Rural do Semi-Arido - UFERSA



Departamento de Ciencias Vegetais - DCV Fitotecnia

APOSTlLA DE ESTATisTICA

.. Professora: MSc. Gilmara Alves Cavalcanti

NatallRN

Mude

mas comece devagar,

porque a direcao e mais importante que a velocidade.

[ ... ]

Quando sair,

Procure andar pelo outto lado da rua. Depois mude de caminho,

ande por outtas ruas,

calmamente,

observando com atencao

os lugares por onde voce passa.

[ ... ]

Mude.

Lembre-se que a vida e uma so.

[ ... ]

Se voce nao enconttar razoes para ser livre, invente-as.

Seja criativo.

[ ... ]

Experimente coisas novas. Troque novamente. Mude, de novo. Experimente outra vez.

[ ... ]

(Clarice Lispector)

De tudo ficaram tres coisas:

,

A certeza de que estamos sempre a cornecar ...

A certeza de que e preciso continuar...

A certeza de que seremos interrompidos antes de terminar...

Portanto, devemos:

Fazer da interrupcao urn caminho novo ... Fazer da queda urn passo de danca ...

Do medo uma escada .

Do sonho urna ponte .

Da procura urn encontto ...

E assim tera valida a pena existir ... (Fernando Sabino)

2

PROGRAMA:

UNIDADE I: ESTATisTICA DESCRITIV A. 1.1 - Introducao.

1.2 - Coleta, Organizacao e Apresentacao de Dados.

1.3 - Medidas de Posicao (Medidas de Tendencia Central). 1.4 - Medidas de Dispersao e Achatamento.

UNIDADE II: CONJUNTOS E PROBABILIDADE. 2.1 - Conjuntos e Subconjuntos.

2.2 - Operacoes com Conjuntos.

2.3 - Conceitos de Probabilidade (Experimento, Espaco Amostral, Eventos). 2.4 - Probabilidade e suas Leis.

2.5 - Probabilidade Condicional.

UNIDADE III: VARIA VEIS ALEATORIAS E DISTRIBUICAO DE PROBABILIDADE. 3.1 - Variaveis Aleat6rias (Conceitos).

3.2 - Distribuicoes de Probabilidade Discretas.

3.3 - Funcoes de Distribuicao para Variaveis Aleat6rias Discretas. 3.4 - Distribuicoes de Probabilidade Contfnuas.

UNIDADE IV: DISTRIBUICOES ESPECIAIS DE PROBABILIDADE. 4.1 - Distribuicao Binomial.

4.2 - Distribuicao de Poisson.

4.3 - Distribuicao Normal.

4.4 - Distribuicao Qui-quadrado. 4.5 - Distribuicao T de Student.

UNIDADE V: TEORIA DE AMOSTRAGEM. 5.1 - Introducao.

5.2 - Amostragem Probabilistica (Amostragem Aleat6ria Simples, Amostragem Sistematica, Amostragem Estratificada.).

5.3 - Amostragem Nao-Probabilistica (Amostragem a Esmo ou sem Norma, Amostragem Intencionais ).

UNIDADE VI: TEORIA DE ESTIMACAO. 6.1 - Introducao.

6.2 - Estimacao por Ponto e por Intervalo.

6.3 - Estimando a Media em Grandes e Pequenas Amostras.

6.4 - Estimando a Diferenca entre Duas Medias em Grandes e Pequenas Amostras.

UNIDADE VII: TESTES DE HIPOTESES 7.1 - Hip6tese Estatistica.

7.2 - Erros Tipo I e II.

7.3 - Testes Unilaterais e Bilaterais. 7.4 - Testes Referentes a Medias.

7.5 - Teste de Ajustamento de Distribuicao Te6ricas. 7.6 - Testes de Independencias,

UNIDADE VIII: CORRELACAO E REGRESSAO LINEAR. 8.1 - Diagrama de Dispersao.

8.2 - Coeficiente de Correlacao,

8.3 - Regressao Linear Simples.

3

UNIDADE I: ESTATisTICA DESCRITIV A

1.1 - INTRODU<;AO.

ESTATisTICA _._ CIENCIA

"A ciencia nao e urn conhecimento definitivo sobre a realidade, mas urn conhecimento hipotetico, que pode ser questionado e corrigido".

(Sonia Vieira)

Ensinar ciencia na~ significa apenas descrever fatos, enunciar leis e apresentar novas descobertas, mas ensinar 0 metodo cientifico, que e a maneira de buscar 0 conhecimento.

~

ESTATisTICA: ferramenta do metodo cientffico

Os metodos estatisticos vern sendo cada vez mais utilizados nas mais divers as areas.

o que e Estatistica?

Definicoes:

(I) 'IE a parte da Matematica Aplicada que trata de chegar a conclusoes a partir de dados o bservados".

(2) "13 a ciencia que trata de da organizacao, descricao, analise e interpretacao de dados experimentais" .

(3) "13 a ciencia que se ocupa dos fen6menos aleat6rios".

(4) "13 0 estudo dos metodos e procedimentos para recolher, classificar, resumir e analisar dados e, a partir deles, estabelecer inferencias cientificas''.

(5) "Nao se limita ao levantamento e apresentacao de dados numericos dispostos em tabelas e graficos, mas tambem constitui na ciencia da tomada de decisoes ante a incerteza" .

(6) "13 a ciencia ocupada em medir com precisao a imprccisao''. (7) "13 a ciencia que se ocupa em medir a incerteza".

Generalizando:

13 a ciencia que coleta, c1assifica e avalia numericamente fatos que servirao de base para extrair conclusces. 13 urn conjunto de tecnicas para se obter conhecimento preciso a partir de informacoes incompletas; e urn sistema cientifico para coleta, organizacao, analise, interpretacao e apresentacao de informacoes que possam ser colocadas sob forma numerica, A Estatistica trata de ideias e metodos que visam aperfeicoar a obtencao de conclusoes a partir de informacoes numericas, na presenca da incerteza.

Pro/a. MSc. Gilmara Alves Cavalcanti 4

Metodos Estatisticos: sao metodos adaptados ao esclarecimento de dados quantitativos sujeitos a influencia de uma multiplicidade de causas.

Ramos da Estatistica:

a) Estatistica Descritiva: trata da observacao de fenomenos de mesma natureza, da coleta de dados numericos referentes a esses fenomenos, da sua organizacao e classificacao atraves de tabelas e graficos, bern como da analise e interpretacao. Utiliza mimeros para descrever fatos. A finalidade e tomar as coisas mais faceis de entender, relatar e discutir.

Ex.: taxa de desemprego; custo de vida; altura media de estudantes;

b) Probabilidade Estatistica: utilizado para situacoes que envolvem 0 acaso (aleatoriedade).

Ex.: jogos de cartas e de dados; jogos esportivos; decisao de atravessar uma rna;

c) Inferencia Estatistiea: estuda as caracteristicas de urna populacao com base em dados obtidos de amostras - Amostragem.

Ex.: provar urn pedaco de bolo; verificar a temperatura da agua de uma piscina; folhear urn novo livro; grandes processos industriais (amostra piloto);

RAZOES PARA 0 USO DA AMOSTRAGEM:

);> Custo (observacoes custam dinheiro, portanto, quanto maior 0 numero de dados, maior 0 custo envolvido ) - a amostragem reduz a quanti dade de dados e, conseqtientemente, os custos;

);> Valor da Informaeao dura poueo (para ser uti! a informacao deve ser obtida e usada rapidamente, visto que, as vezes 0 exame de urn artigo 0 destr6i) - a amostragem e a unica maneira de obter isso;

).> Tempo;

OBSI: Estatfstica Indutiva pode ser denominada como inferencial. Portanto, a estatistica indutiva estuda as caracteristicas de urna populacao, com base em dadosobtidos de amostras.

Inferencia = Indueao + Margem de Erro

OBS2: Os tres ramos da estatistica nao sao separados. Eles tendem a se entrelacar,

1.2 - 0 METODO ESTATisTICO (Coleta, Organizaeao e Apresentaeao de Dados),

A realizacao de urna pesquisa deve passar, necessariamente, pelas fases resurnidas no diagrama abaixo, se urn resultado satisfat6rio e preciso e desejado.

Definicao do Problema

Planejamento

Coleta dos Dados

... Critica dos
~ Dados
~
.....,__ Apresentacao
dos Dados Analise e Interpretacao dos Dados

Tabelas e Graficos

Pro/a. MSc. Gilmara Alves Cavalcanti 5

® DEFINICAo DO PROBLEMA: saber exatamente 0 que se pretende pesquisar, ou seja, definir corretamente 0 problema. Essa primeira fase consiste na formulacao correta do problema

a ser estudado. '

© PLANEJAMENTO: determinar 0 procedimento necessario para resolver 0 problema, como levantar informacces sobre 0 assunto objeto do estudo. E importante a escolha das perguntas, que na medida do possivel, devem ser fechadas. No caso de urn experimento, deve-se atentar para os objetivos que se pretende alcancar. 0 levantamento dos dados pode ser de dois tipos:

Censitdrio (envolve toda a populacao); Amostragem (utiliza-se urna parte da populacao); Outros elementos do planejamento de uma pesquisa sao: ./ Cronograma das atividades;

./ Custos envolvidos;

./ Exame das informacoes disponiveis; ./ Delineamento da amostra;

© COLETA DOS DADOS: consiste na busca ou compilacao dos dados. Pode ser classificada, quanto ao tempo, em:

a) Continua: quando realizada permanentemente;

b) Peri6dica: quando e feita em intervalo de tempo;

c) Ocasional: quando e efetuada em epoca pre-estabelecida;

® CRiTICA DOS DADOS: objetiva a eliminacao de erros capazes de provocar futuros enganos. Faz-se uma revisao critica dos dados suprimindo os valores estranhos ao levantamento.

© APRESENTACAo DOS DADOS: a organizacao dos dados denomina-se "Serie Estatistica''. Sua apresentacao pode ocorrer por meio de tabelas e graficos.

© ANALISE E INTERPRETACAO DOS DADOS: consiste em tirar conclusoes que auxiliem 0 pesquisador a resolver seu problema, descrevendo 0 fenomeno atraves do calculo de medidas estatisticas, especialmente as de posicao e as de dispersao.

INCERTEZA

PESQUISA ESTATisTICA

Palpites com relacao a acontecimentos futuros, a fim de prever 0 que acontecera, A: podemos confirmar nossas previsoes;

B: as previsoes podem nao ser confirmadas;

Permite analisar a natureza da realidade a fim de escolher as incertezas, testando as ideias atraves de pesquisas sistematicas

analise e interpretacao ..

NUMEROS (DADOS)

processamento IINFORMACOES ..

METODO ESTATisTICO

DADOS ESTATisTICOS: obtidos atraves de urn processo que envolve a observacao ou a mensuracao de itens.

1\ 4"). VARIA VEIS: valores que exibem urn '-L/ determinado grau de variabilidade.

Pro/a. MSc. Gilmara Alves Cavalcanti 6

1.2.1 - POPULA<;AO E AMOSTRA. VARIA VEIS.

Inferencia Estatistica

Obtencao de resultados para uma populacao com base em observacoes extraidas a partir de urna amostra retirada desta populacao.

POPULA<;AO:

E 0 conjunto de elementos (na totalidade) que tern, em comum, uma determinada caracteristica. Pode ser finita, como por exemplo, ° conjunto de alunos de uma determinada escola, ou infinita, como 0 mimero de vezes que se pode jogar urn dado.

AMOSTRA:

E qualquer subconjunto da populacao. A tecnica de selecao desse subconjunto de elementos e chamada de Amostragem.

VARIAVEL:

E condicao inerente a uma populacao natural existir variacao quanta aos atributos que lhe podem ser estudados. Portanto, a variabilidade e uma caracteristica comum a dados de observacao e experimentos. Urn atributo sujeito a variacao e descrito em Estatistica por uma varidvel.

Variavel

<Nominal Qualitativa

Ordinal (por Posto)

< I>iscreta Quantitativa

Continua

Variavel Qualitativa: os dados podem ser distribuidos em categorias mutuamente exclusivas. Ex.: sexo (masculino, feminino), cor, causa de morte, grupo sanguineo, etc.

Nominal: surge quando se definem categorias e se conta 0 numero de observacoes em cada categoria.

Ordinal: surge quando se definem categorias cujos valores relativos sao atribufdos para denotar ordem: primeiro, segundo, terceiro, etc.

Variavel Quantitativa: os dados sao expressos atraves de numeros, os quais estao associados as variaveis que estao sendo medidas. Ex.: idade, estatura, peso, etc.

Discreta: assume valores inteiros. Esta associada a ideia de contagem do numero de itens com determinada caracteristica.

Continua: assume qualquer valor em urn intervalo contfnuo. Esta associada a ideia de medicao.

Pro/a. MSc. Gilmara Alves Cavalcantl 7

Veja 0 exemplo de algumas variaveis:

Populacoes Tipos de Variaveis
Nominal Ordinal Continua Discreta
Alunos de Administracao Menino ! Menina 2° grau Idade I Peso N° da Matricula
Automoveis Cores Limpeza Km!h N° de Defeitos
Venda de Imoveis Acima do pre co Preco alto Valor R$ N° de Ofertas
, De uma forma gera1:

® PROBLEMAS FUNDAMENTAlS DA ANALISE ESTATisTICA:

e SOLUCAO:

(a) Como obter dados uteis?

Fases do Metodo Estatistico

(b) 0 que fazer com eles?

Organizacao e resumo dos dados afim de que se possa realizar a analise dos mesmos.

Em um artigo, de David Kupfer, sobre A Industria Brasileira ap6s 10 Anos de Liberalizacda Econbmica e possivel ler 0 seguinte comentario: "Por certo que caberia a uma analise criteriosa da evolucdo da produtividade industrial dirimir a duvida. No entanto, a precariedade das estatisticas disponiveis referentes it mensuraciio de indicadores de produtividade obscurece mais do que esclarece a questiio. Cabe observar que mudancas importantes na estrutura de precos relativos e a utilizaciio mais intensiva de materias-primas e componentes de terceiros, em especial, 0 crescimento do outsourcing internacional, que sucederam a abertura comercial mascaram os dados que, por razoes metodologicas, sdo baseados em series de valor da producdo e ndo de valor adicionado, como serial ideal. Desse modo, uma parcela da melhoria constatada deve ser atribuida a um efeito estatistico e ndo a modernizaciio dos procedimentos produtivos em sf'.

o paragrafo acima descreve de forma clara que a utilizacao de tecnicas Estatisticas como ferramenta de trabalho se toma fundamentalmente importante nos mais diversos setores.

LISTA DE EXERCicIOS 1.1 e 1.2

1. Explique a relacao existente entre a Estatistica e 0 metodo cientifico.

2. Defina 0 termo Estatistica.

3. Quais sao as tres areas principais da Estatistica e suas particularidades?

4. Defina os termos populacao e amostra?

5. Quais as principais razoes da amostragem?

6. Para ser util, que caracteristica deve ter uma amostra?

7. Como sao classificadas as variaveis?

8. A variabilidade existira em qualquer tipo de experimento? Justifique.

9. De exemplos de situacoes em que a Estatistica e util,

10. Exemplifique uma situacao pratica, em uma empresa, definindo cada fase do metodo estatfstico.

Profa. MSc. Gilmara ALves CavaLcanti 8

1.2.2 - REPRESENTAC;Ao TABULAR

Consiste em dispor os dados em linhas e colunas, distribuidas de modo ordenado, segundo algumas regras praticas e obedecendo it Resolucao mimero 886/66, de 26 de Outubro de 1966, do Conselho Nacional de Estatistica.

Componentes das Tabelas

a) Titulo: Explica 0 que a tabela contem. Responde a perguntas como: 0 que? tfenomenoy;

Onde? (local); Quando? (epoca).

b) Cabeealho: Indica 0 conteudo das colunas.

c) Coluna Indicadora: Especifica 0 conteudo das linhas.

d) Cabecalho da Coluna da Indicadora: Indica 0 conteudo da coluna indicadora,

e) Corpo: Caselas ou celulas onde sao registrados os dados.

f) Rodape: Notas de identificacao da fonte de onde foram coletados os dados.

OBS: A "fonte" corresponde it indicacao da entidade ou 6rgao responsavel pelo fomecimento dos dados ou pela sua elaboracao.

Tabela 01 - Casos registrados de intoxicacao humana, segundo a causa determinante. Brasil, 1993.

Causa Frequencia Absoluta Frequencia Relativa
Acidente 29.601 29.601 /43.905 = 0,67
Abuso 2.604 2.604/43.905 = 0,06
Suicidio 7.965 7.965/43.905 = 0,18
Pro fissional 3,735 3.735/43.905 = 0,09
Total 43.905 1 Fonte: IBOE

-+ Series Estatisticas: Sao os dados organizados em forma de tabelas. De acordo com a epoca de ocorrencia, 0 fenomeno e 0 local classificam-se, respectivamente, em: Temporal, Especificativa e Geografica.

a) Serle Temporal: os dados sao observados segundo a epoca de sua ocorrencia.

b) Serle Geografica: os dados sao observados segundo 0 local onde ocorreram.

c) Serle Especificativa: os dados sao agrupados segundo a modalidade (especie) de ocorrencia.

d) Serle Mista on de Dupla Entrada: corresponde a fusao de duas ou mais series simples, Pode ser visto como uma Tabela de Contingencia, a qual ocorre quando os elementos da amostra ou da populacao sao classificados de acordo com dois fatores.

Exemplos:

Tabela 01 - Populacao brasileira no periodo de 1940 a 1970.

Tabela 02 - Regiao de origem de universitarios. Sao Paulo, 2000.

1940 41.236.315

1950 51.944.397

1960 70.119.071

1970 93.139.037

Regiao f f%
Urbana 240 12
Suburbana 1400 70
Rural 360 18
Total 2000 100 Anos Populacao

Fonte: Livro de Estatfstica,

Fonte: Livro de Estatistica,

Pro/a. MSc. Gilmara Alves Cavalcanti 9

Tabela 03 - Entrevistados segundo a distribuicao ocupacional. Natal, 200 I.

Distribuicao Ocupacional

180

Entrevistados

Artesanato Gerencial

Services Burocraticos Trabalho Nao qualificado

52 29 34 65

Total

Fonte: Livro de Estatistica.

Exercicio 01:

Tabela 04 - Numero de alunos em uma exposicao de pintura segundo 0 sexo e 0 tipo de arte preferida. Sao Paulo, 2000.

Masculino Feminino

70 30

Sexo Tipo de Arte

Arte Arte

Classica

Moderna

80 20

Fonte: Livro de Estatistica.

De acordo com informacoes do IBGE, em 31.12.99, 0 pessoal administrativo ocupado em estabelecimentos publicos, era, segundo 0 tipo de ocupacao: Administracao, 41.371; Service pessoal, 6.067; Contabilidade, 2.989; Estatistica, 5.481; Limpeza e Conservacao, 26.520; Almoxarifado, 3.970; Servicos Gerais, 46.073; e Outros, 15.689. Nos estabelecimentos da rede particular, nas mesmas ocupacoes anteriores, as quantidades respectivas eram: 45.392, 4.555, 6.627,3.112,42.155,4.019,49.038 e 17.302. Dispor os dados acima em uma tabela, utilizando valores absolutos e relativos.

Exercicio 02:

Classifique as series estatisticas abaixo. Identifique os componentes que faltam e complete-os (de modo ficticio quando necessario).

Tabela 01 - Desempenho Operacional da Varig (em R$ milhoes), Natal, 1997 - 2001.

Anos Valores fr f%
1997 41
1998 37
1999 61
2000 198
2001 483 Fonte: Rev. Epoca, 15/Jul/2002

Tabela 02 - Parcela de gastos (em relacao ao total) com materiais e medicamentos em internacao pelo SUS, em 1994, segundo as regioes,

Regioes

43,19

Parcela de Gastos (%)

Norte

46,41

Nordeste

65,27

Sudeste

40,53

SuI

41,68

Centro-Oeste

Fonte: USP 1 Revista de Sande Publica

Tabela 03 - Candidatos a Deputado Estadual nos estados da regiao Nordeste. Brasil, 2002

Estados N° de Candidatos
Alagoas 267
Ceara 516
Maranhao 474
Paraiba 220
Pernambuco 631
Piauf 204
Rio Grande do Norte 233
Sergipe 237
Bahia 569 Fonte: Tribunal Superior Eleitoral

Tabela 04 - Fracionamento do salario no orcamento familiar do brasileiro (%). Brasil, 2002.

Habita9ao 35,4

Alimenta9ao 28,7

Saude, Tarifas Publicas, Transporte 19,4

Vestuario, Educayao, Lazer 16,5

Fonte: Rev. Epoca, 24/0612002

Pro/a. MSc. Gilmara Alves Cavalcanti 10

Tabela 05 - Principais causas de morte na Regiao Nordeste do Brasil, 1997.

Causas de Morte N° de Mortes
Homicfdio 331.361
Acidentes de Transite 220.784
Doencas Cerebrovasculares 103.973
Doencas do Coracao 74.505
Acidentes sem Especificacoes 69.949
Afogamento 66.441
Total 867.013
.. Fonte: Estudos Epidemiologiccs

Tabela 06 - Valor de uma divida de R$ 1.000 ao fim de 1 (urn) ano, de acordo com o tipo de financiamento. Brasil, 2002.

Tipo de Financiamento Montante (R$)

Empn!stimo Pessoal 1.847,84

Cheque Especial 3.087,46

Crediario 2.172,01

Cartao de Credito 3.296,01

Emprestimo em Financeiras 2.842,06

T b I 09 C

. ~

ttl d PIB 1991 2001

leci d (CX)

Tabela 07 - Balanca comercial do estado do Rio Grande do Norte, 1992-1999.

Anos Valor (VS$ mil)
Exportacoes Importacoes
1992 72.934 11.271
1993 81.288 16.393
1994 86.729 33.279
1995 79.228 34.542
1996 94.876 101.978
1997 93.504 125.445
1998 101.748 88.528
1999 115.473 84.267 Fonte: Boletim Conjuntural, SUDENE, Agosto!2000.

Tabela.08 -

Fabricantes Participacao (%)
1997 1998 1999
Johnson & Johnson 42,4 39,0 38,7
Kimberly Clark 16,0 21,9 25,7
Procter & Gamble 23,6 19,2 15,5
Outros 18,0 19,9 20,1 a e a - omposIYao es ru ura 0 , a , anos se eciona os o .
Setor 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Agricultura 7,8 7,7 7,6 9,9 9,0 8,3 8,0 8,2 8,2 7,7 8,0
Industria 36,2 38,7 41,6 40,0 36,7 34,7 35,2 34,6 35,6 37,5 35,8
Manufatura 24,9 26,4 29,0 26,8 23,9 21,5 21,6 21,0 21,5 22,5 21,1
Services 56,0 53,6 50,8 50,1 54,3 57,0 56,8 57,1 56,2 55,0 56,2
Total 100 100 100 100 100 100 100 100 100 100 100 Fonte: DECNA! IBOE

Tabela 10 - Estrutura do Comercio Exterior Brasileiro Segundo Destino e Origem, 1990 - 2002, anos selecionados, em %.

Anos Destino das Exportacoes Origem das Importacoes
EVA Mercosul VE Japao Outros EVA Mercosul VE Japao Outros
1990 24,6 4,2 32,5 7,5 31,2 20,4 11,2 22,6 7,2 38,7
1993 20,7 14,0 26,4 6,0 32,9 20,4 13,4 23,5 7,6 35,0
1996 19,5 15,3 26,9 6,4 31,9 22,4 15,6 26,7 5,2 30,1
1998 19,3 17,4 28,8 4,3 30,2 23,7 16,3 29,2 5,7 25,1
1999 22,6 14,1 28,6 4,6 30,1 24,1 13,6 30,5 5,2 26,5
2000 24,3 14,0 26,8 4,5 30,4 23,3 14,0 25,2 5,3 32,2
2001 24,7 10,9 25,5 3,4 35,4 23,5 12,6 26,7 5,5 31,7
2002 25,7 5,5 25,0 3,5 40,3 22,1 11,9 27,7 5,0 33,3 Fonte: SIstema Ahce ! MDIC

Pro/a. MSc. Gilmara Alves Cavalcanti 11

-+. Distribuieao de Freqtiencias

Tabelas com grandes numeros de dados sao cansativas e nao dao uma visao rapida e geral do fenomeno. Dessa forma. e necessario que os dados sejam organizados em uma distribuicao de frequencies (simples ou em classes).

Distribuiyao de Frequencias: serie estatistica em que os dados sao agrupados em classes, com suas respectivas frequencies absolutas, relativas e percentuais, com o objetivo de facilitar ao analista 0 seu estudo.

Construyao de uma Tabela Simples:

../ Dados Brutos: sao os dados apresentados desordenadamente, da forma como foram coletados .

../ Rol: sao os dados apresentados em ordem crescente. A partir da ordenacao os numeros sao dispostos em uma tabela com as respectivas frequencies.

Construyao de uma Distribuiyao de Frequencias em Classes:

Os seguintes componentes sao necessaries:

../ Dados Brutos: sao os dados apresentados desordenadamente, da forma como foram coletados .

../ Rol: sao os dados apresentados em ordem crescente .

../ Amplitude Total (A): e a diferenca entre 0 maior valor do rol (LS) e 0 menor valor (LI).

A=LS-LI

../ Numero de Classes (c): corresponde a quanti dade de classes, nas quais serao agrupados os elementos do rol. Para determinar c, utiliza-se a formula de Sturges:

c = 1 + (3,33333 ..... ).log(n) I '

onde n = numero de elementos do rol.

../ Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos atraves da formula:

i=A/c

I,

Outros elementos da tabela:

• L, = limite inferior de cada classe;

• Ls = limite superior de cada classe;

• PM ou x = ponto medio de cada c1asse ... PM = L, + (il2);

• f = frequencia absoluta = numero de ocorrencias de cada classe;

• fr = frequencia relativa .... ff = f I L f ;

• f% = frequencia percentual .... f% = 100.fr;

• F.J, = frequencia absoluta acumulada "abaixo de";

• F t = frequencia absoluta acumulada "acima de";

• F% .J, = frequencia percentual acumulada "abaixo de";

• F% t = frequencia percentual acumulada "acima de";

Pro/a. MSc. Gilmara Alves Cavalcanti 12

Exemplos:

1. BANCO DE DADOS 01 (Construir uma tabela simples):

Dados Brutos:
1 4 2 5
5 4 2 5
2 3 2 1
RoI: 3 o 4

2 3 2

Constru£ao da tabela simples:

Amilises:

o 2 1

3 4 3

2 2 4

1 3 2

Pro/a. MSc. Gilmara Alves Cavalcanti 13

2. BANCO DE DADOS 02 (Construtr uma tabela em classes):
Dados Brutos:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 ' 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
RoI:
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,83 1,83
1,83 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
Amplitude Total:

Numero de Classe: Intervalo de Classe:

Analises:

OBS: Na construcao de uma distribuicao de frequencies utilizando dados continuos perde-se certa quanti dade de informacao, visto que os val ores individuais perdem sua identidade quando agrupados em classes. Na distribuicao de frequencies construida utilizando dados discretos nao hi perda de informacao.

Pro/a. MSc. Gilmara Alves Cavalcanti 14

LISTA DE EXERCicIOS 1.2.2

-+ Construir uma tabela de distribuiciio de freqiiencia simples e analisar os resultados.

Banco de Dados 01.: Ntimero de caries em criancas.

131 101 011

1 2 1 200 1 6 4

o 3

2 3

2 1

o 2

o 4

o o

Banco de Dados 02.: Idade de pacientes submetidos a urn determinado exame.

85 85 85 85 85 87 88 88 88 88 88 88

88 88 88 88 89 89 89 90 90 90 90 90

Banco de Dados 03.: Erros de impressao por pagina,

9 743 6 5 823 623

11 7 4 2 3 2 4 7 3 2 1 3

3 2 5 4 3 6 2 8 2 3 4 1

o 3

2 1

2 1

02131

o 1 2 2 2

6 1 321

5 3 1

-+ Construir uma distribuiciio de frequencies em classes e analisar os resultados.

Banco de Dados 04.: Numero de filhos de urn grupo de SO casais.

2 3 021 1 1 325

6 1 140 1 5 6 0 2

141 3 1 762 0 1

3 1 357 1 3 1 1 0

304 122 1 232

Banco de Dados OS.: Salaries (em salaries minimos]' de funciomirios de uma determinada

empresa.
4,00 4,56 5,25 5,73 6,26 6,66 6~86 7,39 7,44 7,59 8,12 8,46
8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79
13,23 13,60 13,85 14,69 14,71 15,99 16,32 16,61 17,26 18,75 19,40 23,30
Banco de Dados 06.: Tempo de vida (em horas) de 40 componentes eletrfmicos submetidos
a urn experimento em urn laborat6rio industrial.
3,20 11,70 13,64 15,60 15,89 28,44 29,07 37,34 41,81 43,35
43,94 49,51 49,82 51,20 51,43 52,47 53,72 53,92 54,03 56,89
63,80 66,40 68,64 70,15 70,98 74,52 76,68 77,84' 80,91 84,04
85,70 86,48 88,92 89,28 91,36 91,62 98,79 102,39 104,21 124,27 Banco de Dados 07.: Safra anual (em alqueires/arvore) para 40 pessegueiros.

11,1 4,4 10,7 14,8 3,5 12,5 6,1 15,8 22,6 16,2

32,4 27,5 25,0 16,0 14,5 7,8 32,8 18,2 19,1 3,2

21,0 18,5 12,2 7,4 8,1 16,4 16,4 12,6 9,2 12,9

1,2 15,1 4,7 10,0 19,1 22,3 6,0 23,5 26,2 13,7

Banco de Dados OS.: Pluviosidade (mnr') anual, nos ultimos SO anos, na comunidade de
Ohio.
15,2 14,6 27,9 24,9 20,0 43,5 30,7 30,0 35,7 40,9
23,4 17,8 26,9 30,8 19,9 36,8 33,4 19,8 29,6 38,2
25,1 42,0 35,2 15,6 25,5 29,7 27,8 14,6 22,1 24,3
30,1 30,1 22,1 24,4 28,7 35,0 26,1 28,2 19,4 28,7
28,0 25,3 31,8 31,0 28,3 13,5 32,1 25,4 26,7 36,8 Pro/a. MSc. Gilmara Alves Cavalcanti 15

1.2.3 - REPRESENTA<;AO GRA.FICA

Tern como objetivo uma melhor visualizacao do conteudo das tabelas, expondo sempre que possivel, as mesmas informacoes nelas contidas. Os graficos mais usados sao: Diagrama de Linhas/Superficie Simples e em Faixa; Diagrama de ColunaslBarras Simples, Superpostas e Multiples; Diagrama de Setores em Cfrculo; Os graficos devem conter tftulo e escala.

1.2.3.1 - Diagrama de Linhas e de Superficie

v' Diagrama de Linhas/Superficie Simples: usado unicamente para representar series temporais.

v' Diagrama de Linhas/Superficie em Faixa: usado para comparar a evolucao de duas variaveis e, ao mesmo tempo, a evolucao de cada uma delas isoladamente.

f

Tempo

Diagrama de Linhas Simples

f

Tempo

Diagramade Superficie Simples

1.2.3.2 - Diagrama de Colunas e de Barras

f

Tempo

Diagrama de Linhas em Faixa

f

Tempo

Diagrama de Superficie em Faixa

./ Diagrama de ColunaslBarras Simples: usado para apresentar variaveis qualitativas ou ordinais. As variacoes quantitativas da tabela sao representadas por colunas dispostas verticalmente ou horizontal mente. E usado para representar qualquer tipo de serie.

Procedimento -

1) Tracar os eixos X e Y.

2) Eixo X (categorias da variavel em estudo).

3) Construir barras retangulares.

X (variavel de estudo: categorias) ____. base Y (frequencia ou frequencia relativa) _.,. altura

OBS:

(1) As barras sao desenhadas separadamente, de forma a ficar claro que a variavel e qualitativa ou ordinal.

(2) Os graficos de barras podem ser c1assificados em tres tipos: Simples, Superpostas (Remontadas) ou Multiplas.

(3) Os espacos entre cada coluna (ou barra) devem ser iguais entre si, e corresponder a no minimo 113 e no maximo 2/3, da medida da base.

Pro/a. MSc. Gilmara Alves Cavalcanti 16

../ Diagrama de ColunaslBarras Superpostas e Multiplas: usado para comparar 0 comportamento de duas ou mais variaveis (series mistas).

f

Categorias

Diagramade Colunas Simples

f

Legenda:

DCategoria 1 DCategoria 2

f

Categorias

Diagramade Colunas Superpostas

OBS: Os Diagramas de Barras Simples, Multiplas ou Superpostas obedecem ao mesmo criterio, entretanto, os retangulos sao construidos no sentido horizontal.

Categorias

Diagramade Co lunas Multiplas

1.2.3.3 - Diagrama de Setores em Cireulo (Grafieo de Pizza)

E urn circulo cuja area se divide em segmentos representativos das partes proporcionais de urn todo. E usado para apresentar variaveis qualitativas ou ordinals.

Procedimento -

1) Tracar uma circunferencia (360°).

2) Representar as categorias da variavel em estudo.

Calcular 0 valor do angulo central {100% - 360° -=>

f% - x L.... ....

x : valor do angulc central; _"'T'"' __

f %: frequencia relativa; 3) Marcar no circulo 0 valor de x.

x = (3,6).f%

1.2.3.4 - Histograma, Poligono de Freqnencias e Ogiva de Galton: sao os graficos representativos da distribuicao de frequencia em classes.

(a) Histograma Planejamento -

1. Largura (L):

L = (espaeo da origem - em em) + (n° de elasses).(distancia da base cada retangulo - em em)

2. Altura (H): H = (O,6).L

3. Medidas Graficas (MG):

3.1 - MG = H I (maior valor de "f" na tabela) = eonstante

3.2 - MG = eortante.Cf,}, eons tare. Cfil, const.nte.(f,}, ...... , eonstante.Cfol

altura do primeiro retangulo (em em) altura do segundo retangulo (em em) ....

Pro/a. MSc. Gilmara Alves Cavalcanti 17

f

f

r -•

.- - _,

• I

• I

• I

• I

· , ,

• • • • •

r --.

, .

I ,- - '"i

, , .

Classes

(b) Poligono de Frequencia

Corresponde a uma linha tracada a partir do ponto medio de cada retangulo do histograma. Pode referir-se as frequencies absolutas ou as frequencias relativas, conforme a escala utilizada no eixo vertical.

(c) Ogiva de Galton (Poligono de Frequencias Acumuladas)

A Ogiva de Galton tern por finalidade a representacao grafica das tabelas de frequencias acumuladas. Esse tipo de grafico pode ser utilizado para representar as frequencies "abaixo de" e "acima de".

Planejamento -

1. Largura (L):

L = (espaeo da origem - em em) + (n" de classes).(distaneia da base eada retangulo - em em)

2. Altura (H): H = (O,6).L

3. Medidas Graficas (MG): valores de F ..}, F t, F% ..} ou F% t.

FJ.

, Ft

Classes

Classes

Ogiva de Galton das Freqnencias Acumuladas "Abaixo de"

Ogiva de Galton das Frequencias Acumuladas "Acima de"

Profa. MSc. Gilmara Alves Cavalcanti 18

LISTA DE EXERCicIOS 1.2.3

1. Construa, de forma adequada, todos os possiveis graficos para cada uma das tabelas abaixo.

(a) Tabela 01. Producao brasileira de trigo, por Unidade da Federacao. 1994.

UF Quantidade (l000 t)

(g) TabeIa 07. Taxas munieipais de urbanizacao (em %). Alagoas, 1970.

Taxas (%) N° de Municipios

61--16 29

161-- 26 24

261-- 36 16

361-- 46 13

461-- 56 4

561-- 66 3

661--76 2

761-- 86 2

861--196 1

Sao Paulo 670

Santa Catarina 451

Parana 550

Goias 420

Rio de Janeiro 306

Rio Grande do Sui 560

Fonte: Ficticia

(b) Tabela 02. Rebanho brasileiro.

Es ecie Quantidade (1000 cabe9as)

Bovinos 140.000

Suinos 1.181

Bubalinos 5.491

Coelhos 1 1.200

Total 94

Fonte: Apostila de Estatistica

Fonte: IBGE

(h) Tabela 08. Estatura (em em) de 40 alunos do I' . B

co egro
Taxas(%) N° de Alunos
1501-- 154 4
1541-- 158 9
1581-- 162 11
1621-- 166 8
1661-- 170 5
170 H 174 3
Total 40
, . Fonte: Apostila de Estatfstica

(c) Tabela 03. Exportacoes brasileiras de

d t 'I 1990 1992

pro u os agnco as. -
Produto Quantidade (1000 t)
1990 1991 1992
Feijao 5.600 6.200 7.300
Arroz 8.600 9.600 10.210
Soja 4.000 5.000 6.000
.. Fonte: Ministerio da Agricultura

(d) Tabela 04. Situacao dos cinemato raficos, Brasil, 1967.

espetaculos

(i) Tabela 09. Quantidade de faltas no semestre

d 20 I d I" B

e a unos o co egio
Taxas (%) N° de Alunos
1 1-- 3 2
31-- 5 4
51-- 7 8
71-- 9 4
91--111 2
Total 20 Es ecificacao

2.488 1.722.348 3.933 131.330.488 89.581.234

Quantidade

Numero de Cinemas Lotacao dos Cinemas Sessoes por Dia

Filme de Longa Metragem Meia Entrada

Fonte: IBGE

(e) Tabela 05. Producao agricola do Estado A.

Brasil, 1995.

Fonte: Apostila de Estatfstica

Produtos

Quantidade (ton)

(j) Tabela 10. Quantidade de chuva caida em Natal, em mm", 1984-1993

Anos Quantidade de Chuva

1984 2.102

1985 2.224

1986 2.438

1987 1.478

1988 2.163

1989 J.155

1990 1.234

1991 1.359

1992 1.615

1993 852

Cafe Aciicar Milho Feiiao

400.000 200.000 100.000 20.000

Fonte: Ficticia

(t) Tabela 06. Entrada de migrantes em tres estados do Brasil 1992 - 1994

Anos Estado
Amapa Sao Paulo Parana
1992 2.291 1.626 609
1993 2.456 1.585 592
1994 2.353 1.389 708 Fonte: EMPARN

Pro/a. MSc. Gilmara Alves Cavalcanti 19

1.3 - MEDIDAS DE POSI<;AO (MEDIDAS DE TENDENCIA CENTRAL).

Os dados quantitativos, apresentados em tabelas e graficos, constituem a informacao basica do problema. Mas e conveniente apresentar medidas que mostrem a informacao de maneira resurnida. Frequentemente, urn conjunto de dados pode se reduzir a urna ou a algumas medidas numericas que resurnem todo 0 conjunto. Duas caracteristicas importantes dos dados, que as medidas numericas podem evidenciar sao: 0 valor central do conjunto e a dispersiio dos numeros. 0 capitulo a seguir trata das medidas de tendencia central.

MEDIDAS DE TENDENCIA CENTRAL

Sao medidas que tendem para 0 centro da distribuicao e tern a capacidade de representala como urn todo. Dao 0 valor do ponto em tomo do qual os dados se distribuem. As principais sao: Media Aritmetica, Mediana. Moda e algumas Separatrizes.

1.3.1 - MEDIA ARITMETICA

E a mais importante medida de tendencia central, pois possui propriedades matematicas convenientes. A media aritmetica pode ser definida em dois tipos: populacional (u ) e amostral

(X). Nos dois casos existem tres situacoes quanto aos calculos,

1. Dados apresentados em forma de dados brutos/rol:

A media sera:

x = L Xi soma de todos os elementos do rol

n numero de elementos do rol

Exemplo 01: A media minima para aprovacao em determinada disciplina e 5~0. Se urn estudante obtem as notas 7,5; 8,0; 3~5; 6,0; 2,5; 2,0; 5~5; 4,0; nos trabalhos mensais da disciplina em questao, pergunta-se se ele foi ou nao aprovado.

2. Dados apresentados em forma de distribuicao de frequencia simples:

A media:

Exemplo 02: Calcular a media do banco de dados 0 I. (Unidade II) e analisar 0 resultado.

3. Dados apresentados em forma de distribuicao de frequencia em classes:

A media:

x = L(PMj.fj)

n

Exemplo 03: Calcular a media do banco de dados 02. (Unidade II) e analisar 0 resultado.

Propriedades:

1. Em urn conjunto de numeros pode sempre ser calculada;

2. E unica para urn dado conjunto de numeros;

3. E sensivel (ou afetada) por todos os valores do conjunto;

4. Somando-se uma constante a cada valor do conjunto, a media ficara aurnentada do valor dessa constante. Similarmente se subtrairmos, multiplicarmos ou dividirmos.

5. A soma dos desvios dos numeros de um conjunto a contar da media e zero;

Profa. MSc. Gilmara Alves Cavalcanti 20

1.3.2 - MEDIANA

Valor que divide a distribuicao em duas partes iguais, em relacao a quanti dade de elementos.

Isto e, e 0 valor que ocupa 0 centro da distribuicao, de onde se conclui que 50% dos elementos ficam abaixo dela e 50% ficam acima. Colocados em ordem crescente, a mediana (Med ou Mel) e ou valor que divide a amostra, ou populacao, em duas partes iguais.

o

Med

100%

a) V ARIA VEL DISCRETA: os dados estao dispostos em forma de rol ou em uma distribuicao de frequencia simples.

• Se "n'' for Impar:

Med = elemento central (de ordem [en + 1)/2]°) -+

Exemplo 01: Calcular a mediana da serie: 3,4, 5, 6, 7, 8.

• Se "n'' for par:

2

centrais (de ordem (nl2r e [(nl2) + 1]0)

Med = media aritmetica dos dois elementos -+

Med

Exemplo 02: Calcular a mediana da serie: 8, 5, 10, 12.

Exemplo 03: Calcular a mediana do banco de dados 01 (Unidade II) e analisar 0 resultado.

b) V ARIA VEL CONTINUA: os dados estao agrupados em uma distribuicao de frequencies em

classes, entao: '

(10 Passo) Calcular a ordem, ou posicao da mediana, PMEd = (n/Z)", Como a variavel e continua nao importa se "n" e par ou impar.

(20 Passo) Atraves da F.J... identificar a classe que contem a mediana, isto e, a posicao da mediana.

(3° Passo) Utilizar a f6rmula:



LIMed = limite inferior da c1asse que contem a mediana;

PMed = posicao da mediana = L f = XO 2

elemento (le-se: x-esimo elemento);

• F ! - = frequencia absoluta acumulada "abaixo de" da c1asse anterior a c1asse que contem a mediana;

• fMed = frequencia absoluta da classe que contern a mediana;

• iMed = intervale da classe que contem a mediana;



Exemplo 04: Calcular a mediana do banco de dados 02 (Unidade II) e analisar 0 resultado.

Profa. MSc. Gilmara Alves Cavalcanti 21

1.3.3-MODA

Eo valor que ocorre corn maior frequencia, ou seja, aquele que mais se repete.

Ex.: Na serie 3, 4, 5, 7, 7, 7, 9,9 __.,. Mo = 7

• Serie Unimodal (tern urna unica moda). Ex.! Serie 3, 5, 6, 6, 6, 7,8

• Serie Bimodal (ocorrem duas modas). Ex.: Serie 2,5,5,5,6, 7, 9, 9, 9, 10, 10

• Serie Trimodal (ocorrem tres modas). Ex.: Serie 4, 4, 4, 5, 6, 7, 7, 7, 8, 9,9,9

• Serie Polimodal (ocorrem quatro ou mais modas) Ex.: Serie 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13

• Serie Amodal (nao existe moda). Ex.: Serie 0, 1,3,4, 7, 8

a) VARIA VEL DISCRETA: os dados sao apresentados ern forma de rol ou ern urna distribuicao de frequencia simples.

Mo = elemento que tenha maior frequencia

Exemplo 01: Calcular a moda do banco de dados 01 (Unidade II) e analisar 0 resultado.

b ) VARIA VEL CONTINUA: os dados sao apresentados ern urna distribuicao de frequencia ern classes.

Nesse caso, a moda pode ser deterrninada atraves de quatro processos.

1. Moda Bruta (MoB)

Corresponde ao ponto medio da classe modal, ou seja, I MoB = (LI + LS)/2

2. Moda de Pearson (Mop)

Utilizada mais especificarnente, juntarnente corn X e Med, para mostrar 0 comportarnento da distribuicao, ern relacao a concentracao ou nao de seus elementos.

Mop =3.Med-2.X I

Utiliza-se a Mop para a analise da assimetria. A distribuicao pode ser classificada, ern termo de simetria, de tres formas:

• Assimetria it esquerda: X < Med < Mop (concentracao a direita ou nos val ores maiores)

• Assimetria it dire ita: Mop < Med < X (concentracao a esquerda ou nos val ores menores)



Simetrica: Mop = Med = X (concentracao no centro)

Pro/a. MSc. Gilmara Alves Cavalcanti 22

3. Moda de King (MoK)

M LI ( fpost J .

oK = Mo + .1M

fant +fpost



liMo = limite inferior da classe modal;

fpost = frequencia absoluta da classe posterior a classe modal; fant = frequencia absoluta da classe anterior a classe modal; iMo = LS - LI = intervalo da classe modal;







4. Moda de Czuber (Mod:

onde

Exemplo 02: Ca1cular, para os quatro processos descritos anteriormente, a moda do banco de dados 02 (Unidade II) e analisar 0 resultado.

Medidas Vantagens Limitacoes
1. Reflete cada valor
Media 2. Possui propriedades matematicas 1. E influenciada por valores extremos
atraentes
Mediana 1. Menos sensivel que a media 1. Dificil detenninar para grandes quantidades
de dados
1. valor tipico: maior quanti dade de 1. Nao se presta a analise matematica
Moda val ores concentrados neste ponto 2. Pode nao ser moda para certos conjuntos de
dados 1.3.4 - SEP ARA TRIZES

Sao valores que dividem a distribuicao em partes iguais. Essas medidas sao utilizadas para se conhecer, com precisao, a distribuicao dos dados como urn todo.

• Mediana (Med): divide a distribuicao em duas partes iguais.

• Quartis (QI, Q2, Q3): dividem a distribuicao em quatro partes iguais.

• Decis (D!, D2, ... , D9): dividem a distribuicao em dez partes iguais.

• Percentis (PI, P2, ... , P99): dividern a distribuicao em cern partes iguais.

Calculo da Posi~ao das Separatrizes (Psep):

1) Mediana: PMed = Lf ; 2

. . _ x·(Lf) _ .

2) Quartis: PQ - , x-I, 2, 3,

, 4

. . _ x.eLf) _ .

3) Decis: PD - , x-I, 2, ... , 9,

x 10

. . x'(Lf) _ .

4) Percentis: P, = , x-I, 2, ... , 99,

, 100

Proia. MSc. Gilmara Alves Cavalcanti 23

a) VARIA VEL DISCRETA: uma vez que a posicao da separatriz esta definida (conforme os calculos acima demonstrados) podemos encontrar a referida medida com a ajuda da frequencia absoluta acumulada "abaixo de" (F J... ) disposta na distribuicao de frequencies simples. 0 valor da separatriz desejada corresponde ao elemento que se encontra na coluna da variavel em estudo ("coluna indi cadora").

Exemplo 01: Calcular QI, D6 e P85 do banco de dados 01 (Unidade II)

b) V ARIA VEL CONTINUA: 0 calculo de uma separatriz para uma variavel disposta em uma distribuicao de freqnencia em classes e similar ao calculo da mediana em uma distribuicao de frequencia em classes. De forma mais detalhada 0 procedimento e realizado atraves dos seguintes passos:

(l ° Passo) Calcular a posicao da separatriz conforme 0 "cdlculo da posiciio das separatrizes", Como a variavel e continua nao importa se "n" (tamanho da amostra) e par ou fmpar.

(20 Passo) Atraves da F.J, identificar a classe que contem a separatriz, isto e, a pOSi~80 da separatriz.

(3° Passo) Utilizar a formula:

. (Psep - F J... - ) .

Separatriz= LIsep + .ISep

fsep

OBS: A nomenclatura "Separatriz ou Sep" da formula acima deve ser substituida pela separatriz a ser determinada.

Exemplo 02: Calcular Q3, D3 e PS8 do banco de dados 02 (Unidade II).

Interpretaeao das Separatrizes:
Mediana Quartis
25% Q3
50%
25%
Med Q2
25%
50% QI
25% Decis

10%
10%
10%
·
·
·
·
10%
10%
10% Percentis

1%
1%
1%
·
·
·
·
1%
1%
1% Pso

Profa. MSc. Gilmara Alves Cavalcanti 24

Exercicios de Fixacao:

Com base nas tabelas a seguir determine: Media) Mediana, Moda, QI; D4 e Pgo. Analise os resultados.

Tabela 01 - Notas de alunos. Natal) 2000.

Notas N° de Alunos
4 1
5 5
6 6
7 5
8 3
Total 20
r Fonte: Livro de Estatfstica.

a e a - a e e paClen
Classes F
10 1-- 20 5
201-- 30 10
301-- 40 15
401-- 50 10
501--160 5
Total 45
, . . tes. Natal, 2004.

T b I 02 Id d d

Fonte: Livro de Estatfstica,

Tabela 03 - Numero de faltas em urn mes de aula dos alunos. Natal, 2005.

X f
1 1
2 3
3 5
4 2
Total Fonte: Livro de Estatfstica.

Tabela 04 - Pesos de pacientes (em kg). Natal, 2005.

X f
82 5
85 10
87 15
89 8
90 4
Total Fonte: Livro de Estatistica

Pro/a. MSc. Gilmara Alves Cavalcanti 25

1.4 - MEDIDAS DE DISPERSAO E ACHATAMENTO

1.4.1 - MEDIDAS DE DISPERSAO: Medem 0 grau de variabilidade ou "espalhamento" dos elementos de uma distribuicao. Medir a variabilidade e verificar se tais observacoes se concentram mais para urn lade ou outro da curva (Histograma) ou se dispoem simetricamente em tome de urn valor central (geralmente a media). 0 valor zero indica ausencia de dispersao; a dispersao aumenta a medida que aumenta 0 valor da medida. Imagine a seguinte situacao:

Tabela 01- Notas de alunos em cinco avaliacoes. Natal, 2004.

Alunos Notas Media
Antonio 5 5 5 5 5 5
Joao 6 4 5 4 6 5
Jose 10 5 5 5 0 5
Pedro 10 10 5 0 0 5 ' Observa-se que:

a) As notas de Antonio nao variaram;

b) As notas de Joao variaram menos do que as notas de Jose;

c) As notas de Pedro variaram mais do que as notas de todos os outros alunos;

Estas observacoes sao verificadas atraves das medidas de dispersao. As principais sao: Amplitude, Varidncia, Desvio Padriio.Desvio Media e Coeficiente de Variaciio.

1.4.1.1 - AMPLITUDE: Da uma ideia do campo de variacao dos elementos.

A = Xmax - Xmin

Exemplo 01: No exemplo anterior: AAntonio =?; AJoao =?; AJose =?; Apedro = ?

Atraves da amplitude verifica-se que as notas de Antonio nao variaram, enquanto que, as de Joao variaram menos que as de Jose. Alem disso, observa-se que ndo houve variaciio entre as notas de Jose e Pedro.

OBS: A amplitude ndo mede bern a dispersiio dos dados porque, usam-se apenas as valores extremos, e ndo todos os elementos da distribuicdo. Apesar disso, e muito utilizada como medida de dispersdo por ser facil de calcular e de interpretar.

1.4.1.2 - VARIANCIA: E a medida de dispersao mais utilizada. E 0 quociente entre a soma dos quadrados dos desvios e 0 mimero de elementos. E c1assificada em dois tipos:

1. Variancia Populacional (0'2):

2. Variancia Amostral (s 2 ):

" -2 2 ~(Xi -X)

S = -=~_c___~_

n-l

No caso de dados agrupados em uma distribuicao de frequencies simples au em classes, a variancia pode ser definida como:

1. Variancia Populacional ( 0'2 ):

2. Variancia Amostral (S2):

" -2

2 ~(Xi - X) .fj

0' = ='------

n

" - 2

2 ~(Xi - X) .f

s = -='---'----

n-l

'Profa. MSc. Gilmara Alves Cavalcanti 26

onde Xi representa 0 valor de cada observacao (no caso de dados agrupados em uma tabela simples), ou 0 ponto medic (no caso dos clados agrupados em uma distribuicao de frequencies em classes).

ATEN<;AO: A variancia apresenta unidade de medida igual ao quadrado da unidade de medida dos dados. Por exemplo, se os dados estao em metros (m), 0 valor da variancia encontrado corresponde a metros quadrados (rrr').

4. SOLU<;AO: utilizar 0 desvio padrtio como unidade de medidas dos dados.

1.4.1.3 - DESVIO PADRAO: Medida de dispersao que apresenta as mesmas propriedades da variancia, exceto que, 0 resultado final corresponde a mesma unidade de medidas dos dados. E definido como sendo a raiz quadrada da variancia,

Desvio Padrao Populacional ( o ):

2. Desvio Padrao Amostral (s):

No caso de dados agrupados em uma distribuicao de frequencies simples ou em classes, 0 desvio padrao pode ser definido como:

Desvio Padrao Populacional (o ):

OBS: Quanto maior 0 valor do desvio padrao significa que mais dispersos estao os elementos em tome da media.

Desvio Padrao Amostral (s ):

onde Xi representa 0 valor de cada observacao (dados agrupados em tabela de distribuicao de frequencias simples), ou 0 ponto media (dados agrupados em tabela de distribuicao de frequencies em classes).

Exemplo 02: Calcular 0 desvio padrao da Tabela 01 (Notas dos alunos em cinco avaliacoes). Exemplo 03: Calcular 0 desvio padrao do banco de dados 01 (Unidade II).

Exemplo 04: Calcular 0 desvio padrao do banco de dados ~2 (Unidade II).

1.4.1.4 - DESVIO MEDIO (DM): 0 desvio medic, ou media dos desvios, e a media aritmetica dos valores absolutos dos desvios tornados em relacao a uma das seguintes medidas de tendencia central: media ou mediana.

a) Desvio Medio para Dados BrutoslRol: Quando os val ores nao vierem dispostos em uma tabela de frequencies, 0 desvio medic sera calculado, atraves das seguintes formulas:

• Desvio Medic em relacao a Media:

DM = _L...:__lx_i ------'-xl

n

• Desvio Medic em relacao a Mediana:

DM = =L:....:._lx_i -_M_e____.:.dl

n

Pro/a. MSc. Gilmara Alves Cavalcanti 27

b) Desvio Medic para Dados Tabulados: Se os valores vierem dispostos em uma tabela de frequencias, simples ou em classes, serao usadas as seguintes formulas:

• Desvio Medio em relacao a Media:

. "Ix. - XI·f

DM=L. 1 1

n



Desvio Medic em relacao a Mediana:

n

onde, Xj representa urn valor individual (no caso de uma distribuicao de frequencia simples) ou 0 ponto medic (PMi) da classe (no easo de urna distribuicao de frequencia em classes).

OBS:

1. 0 desvio medio e mais vantajoso que a amplitude, visto que leva em consideracao todos os val ores da distribuicao.

2. 0 desvio medic, calculado levando-se em consideracao os desvios em tome da mediana, e minimo, ou seja, e menor do que qualquer desvio medic calculado com base em qualquer outra medida de tendencia central.

3. Apesar de 0 desvio medic expressar aceitavelmente a dispersao de uma amostra, nao e tao frequentemente empregado como 0 desvio padrao (nao apresenta propriedades matematicas interessantes ).

Exemplo 05: Calcular 0 desvio medio do banco de dados 01 (Unidade II).

Exemplo 06: Calcular 0 desvio medic do banco de dados 02 (Unidade II).

1.4.1.5 - COEFICIENTE DE V ARIA<;AO (CV)

o coeficiente de variacao e a razao entre 0 desvio padrao e a media. 0 resultado e multiplicado por 100, para que 0 coeficiente de variacao seja dado em porcentagem.

s

CV ==.100 X

,

OBSj: Urn CV alto indica que a dispersao dos dados em torno da media e muito grande.

OBS2: Quando as medidas sao expressas em unidades diferentes como peso/atura, capacidade/comprimento, etc .. , nao se pode cornpara-Ias atraves do desvio padrao, por este ser uma medida absoluta de variabilidade. Utiliza-se entao 0 CV, que e urna medida relativa que expressa 0 desvio padrao como uma porcentagem da media aritmetica. Quanto mais proximo de zero, mais homogenea e a distribuicao. Quanto mais distante, mais dispersa.

Exemplo 07: Calcular 0 coeficiente de variacao do banco de dados 01 (Unidade II).

Exemplo 08: Calcular 0 coeficiente de variaeao do banco de dados 02 (Unidade II).

Pro/a. MSc. Gilmara Alves Cavalcanti 28

1.4.2 - MEDIDAS DE ACHATAMENTO

1.4.2.1 - INDICE DE ASSIMETRIA DE PEARSON

ASSIMETRIA: Mostra a forma da distribuicao (visualizada pelo histograma alisado) e men sura 0 quanta ela se distancia da condicao de normalidade. Mede-se atraves do Indice de assimetria de Pearson, "a", ou atraves dos momentos.

X-Mop

a=--~

s

Analise:

Indice de Assimetria de Pearson

Se a < 0, a distribuicao e assimetrica it. esquerda ou negativa;

Se a> 0, a distribuicao e assimetrica it. direita ou positiva; Se a = 0 a distribuicao e simetrica;

1.4.2.2 - COEFICIENTE PERCENTILICO DE CURTOSE.

MEDIDAS DE CURTOSE: A curtose ou excesso indica ate que ponto a curva de frequencies de uma distribuicao se apresenta mais afilada ou mais achatada do que uma curva-padrao, denominada de curva normal. De acordo com 0 grau de curtose, podemos ter tres tipos de curvas de frequencia:

a) Curva ou Distribui~iio de Frequsncias Mesocartica: se a curva de frequencies apresentar urn grau de achatamento equivalente ao da curva normal.

b) Curva ou Distribuidio de Freqidncias Platictatica: uma curva platicurtica apresenta-se com alto grau de achatamento, superior ao da curva normal.

c) Curva ou Distribui~iio de Frequencias Leptocurtica: uma curva Ieptocurtica revela urn alto gran de afilamento, superior ao normal.

As medidas de curtose ou achatamento medem 0 grau de concentracao dos elementos de uma distribuicao. Podem ser calculadas atraves do coeficiente percentilico de curtose ou atraves dos momentos.

• Dq = Desvio quartilico;

• P90 = Nonagesimo percentil;

• PIO = Decimo percentil;

onde D = Q3 -QI

q 2

Dq Coeficiente Percentllico de Curtose: k = --=----

(P90 - ~o)

Analise (em relaeao ao achatamento):

Se K < 0.263, a distribuicao e afunilada (LEPTOCURTICA) Se K> 0.263, a distribuicao e achatada (PLATICURTICA) Se K = 0.263, a distribuicao e normal (MESOCURTICA)

Exemplo 09: Calcular 0 indice de Assimetria de Pearson (Banco de Dados 02) e 0 Coeficiente Percentilico de Curtose (Banco de dados 01 e Banco de Dados 02).

Exercicios de Fixacao:

1. Calcule a variancia, 0 desvio padrao, 0 desvio medic e 0 coeficiente de variacao dos exercicios do

Capitulo 03 (Tabela 01, Tabela 02, Tabela 03 e Tabela 04). '

Profa. MSc. Gilmara Alves Cavalcanti 29

2. Urn teste de Estatfstica aplicado a dois grupos de 50 alunos apresentou os resultados a seguir. Ca1cule 0 coeficiente de variacao (CV) e analise os resultados.

1\ B

Media

Desvio- Padrao

Grupo

Notas

6 6,2

2 1,5

3. Dada a distribuicao de salarios abaixo, detenninar: a mediana, 0 Indice de assimetria de Pearson e 0 coeficiente percentflico de curtose. Analise os resultados.

Salaries

10 15 20 18 4

Frequencias

201-- 25 251-- 30 301-- 35 351-- 40 401--145

LISTA DE EXERCicIO 1.3 E 1.4

Identifique situacoes que sejam adequadas as tabelas a seguir, de forma que todos os seus componentes sejam determinados. Calcule, para cada caso, as medidas a seguir e analise os resultados encontrados.

MEDIDAS DE TENDENCIA CENTRAL

(h) Variancia;

(i) Desvio padrao; G) Desvio Medio;

(k) Coeficiente de Variacao;

(I) Indice de Assimetria de Pearson;

(m) Coeficiente Percentilico de Curtose;

MEDIDAS DE DISPERSAO

(a) Media; (b) Mediana; (c) Moda;

(d) Moda de Pearson; (e) QI e Q3;

(f) D9;

(g) PIO e P90;

Tabela 01

X f
10 3
11 5
15 9
19 10
21 2
26 1
Total 30 Tabela 02

.
Classes f
10 1-- 12 5
121-- 14 10
141-- 16 17
161-- 18 19
181-- 20 11
201-- 22 4
221-- 24 6
241--126 1
Total 73 Profa: MSc. Gilmara Alves Cavalcanti 30

UNIDADE II: PROBABILIDADE

As unidades anteriores mostram como apresentar os dados e como calcular medidas que descrevem caracteristicas especificas destes dados. Mas, 0 pesquisador alem de construir tabelas e graficos, calcular medias e desvios padroes, sempre tern a intencao de fazer INFERENCIAS.

+

Para fazer INFERENCIA ESTATISTICA usam-se tecnicas que exigem 0 conhecimento de

PROBABI LI DADE.

DETERMINISTICO

...

MODELO MATEMATICO

PROBABILISTICO

FENOMENOS DE OBSERV A<;AO

..

Os fenomenos estudados pela Estatistica sao aqueles que mesmo em condicoes normais de experimentacao variam de uma observacao para outra, dificultando a previsao de resultados futuros. Para a explicacao de fenomenos aleatorios utiliza-se 0 modelo probabilistico (CALCULO DAS PROBABILIDADES)

2.1 - CONJUNTOS E SUBCONJUNTOS

Teoria dos Conjuntos

Georg Cantor (1872)

>

>

"Estima-se que sao falados 2.790 idiomas em todo 0 mundo, porem nenhum deles 6 entendido por todos os povos. No entanto, em qualquer lugar da terra a sentenca 3 + 4 = 7 6 compreendida: a matemdtica une a humanidade, constituindo uma Iinguagem comum a todos os povos".

2.1.1- CONCEITOS PRIMITIVOS

)io> Conjunto: associamos a ideia de grupo, colecao ou classe;

)io> Elemento: sao os objetos ou "coisas" que constituem 0 conjunto;

)io> Pertinencia: associamos it ideia de constituir 0 conjunto (pertencer);

Exemplos:

a) P = conjunto dos numeros pares entre 1 e 9; Elementos = 2, 4, 6 e 8.

b) N = conjunto dos algarismos do mimero 3186;

Elementos = 1, 3,6 e 8.

c) L = conjunto dos numeros da Iota; Elementos = 1,2, 3, ...... , 99, 00.

d) B = Os alunos dessa sala formam urn conjunto;

Elementos = cada aluno 6 urn elemento.

-+ A ideia de constituir 0 conjunto associamos ao conceito primitivo de pertence (0 elemento pertence ao conjunto).

Notaeaor

• Letras maiusculas (A, B, C): conjuntos;

• Letras minusculas (a, b, c): elementos;

• E : pertence;

• ~ : nao pertence;

Exemplos:

a) 6 E P

b) 7 ~ N

c) 8 E L

d) 2 ~ B

Proja. MSc. Gilmara Alves Cavalcanti 3 I

2.1.2 - REPRESENTA<;AO DE UM CONJUNTO

Considere 0 conjunto, D, formado pelos elementos do, re, mi, fa, sol, Ia, e si.

-+ Representacao Tabular: enumeracao de seus elementos. Apresentados entre chaves, separados por virgulas e sem repeticao (nao importa a ordem dos elementos). Entao,

D = {do, re, mi, fa, sol, la, si}

-+ Representaeao atraves de uma Propriedade: os elementos sao descritos atraves de uma propriedade caracteristica que os determina. Entao, D = {x I x e nota musical}.

-+ Representaeao atraves do Diagrama de Venn: os elementos sao simbolizados por pontos interiores em uma regiao plana, limitada por urna regiao fechada. Entao,

re nu si

fa sol

2.1.3 - TIPOS DE CONJUNTOS

-+ Conjunto Unitarior e todo conjunto formado por urn unico elemento. (n(A) = 1, onde n(A) e o mimero de elementos distintos de conjunto).

Exemplos:

a)A={5}

b) B = {x I x e estrela do sistema solar} = {sol}

-+ Conjunto Vazio: nao possui elemento algurn. Representa-se por ~ ou { }. (n(A) = 0).

Exemplos:

a) A = { x I x e mimero e O.x = 5} = ~

b) B = {x I x e palavra proparoxitona da lingua portuguesa nao acentuada} = ~

-+ Conjunto Finito: e todo conjunto que contando os elementos, urn a urn, chega-se ao fim da contagem.

Exemplos: a) A = {a, b, c, d, e, f} b) C = ~ c) B = {x I x e brasileiro} d) D = {4, 3, I}

-+ Conjunto Infinito: e todo conjunto que nao e finito.

Exemplos:

a) N = {O, 1, 2, 3, 4, ...... }: Numeros Naturais

b) Z = { ..... ,-2, -1, 0, 1, 2, ...... }: Numeros Inteiros

-+ Conjunto Universo (U): e aquele ao qual pertencem todos os elementos desse estudo. Pode ser finito ou infinito.

OBS: Quando estudamos os numeros que podem resultar da contagem de unidades, entao, U e 0 conjunto dos mimeros naturais:

N = {O, 1,2,3, 4, ...... }.

Problemas:

1. Considere 3X + 6 = ° e U = {O, 1,2, 3, .. }. Solucao:

(1°) 3X + 6 = 0 => 3X = - 6 => X = - 2

(20) - 2 ~ U => S = ~

u

B

A

2. Considere 2X - 10 = ° e U = {a, 1,2, ... }. Solucao:

(I") 2X - 10 = ° => 2X = 10 => X = 5

(20) 5 E U => S = {5}

Proja. MSc. Gilmara Alves Cavalcanti 32

-+ Conjunto das Partes

Considere, M = {{2, 3}, {5}; {2, 5}}. Entao, {5} E M; {{5}} c M ou {{2, 3}, {5} eM}

Seja urn conjunto A finito. E possivel construir urn novo conjunto cujos elementos sejam todos os subconjuntos possiveis de A. Esse novo conjunto e denominado conjunto das partes de A. peA) = {x 1 x c A}

ExempIo: A = {a, b} -+ Subconjuntos de A = $, {a}, {b}, {a, b} => peA) = {$, {a}, {b}, {a, b}}

,

Nurnero de Subconiuntos: n(A) = k => A tern 2k subconjuntos

No exernplo anterior, n(A) = 2 => A tern 2k = 22 = 4 subconjuntos.

-+ Conjunto dos Niimeros Naturais: eo conjunto N= {D, 1,2,3,4,5, }

OBS!: Usamos 0 simbolo (*) para indicar a exclusao do elernento 0 (zero) de qualquer conjunto numerico. Portanto, N* = {I, 2, 3, 4,5, ........ }.

OBS2: Neste conjunto sao definidas duas operacoes fundarnentais: adicao e multiplicacao.

OBS3: Dado urn natural "a", tal que a *- 0,0 simetrico de "a" nao existe em N: - a ~ N. Por isso, a subtracao (a - b) nao tern significado em N.

Propriedades:

1. Associativa da Adicao: (a + b) +c = a + (b + c), 'If a, b, c E N;

2. Comutativa da Adicao: (a + b) = (b + a), 'If a, bEN;

3. Elemento Neutro da Adicao: (a + 0) = a, "if a E N;

4. Associativa da Multiplicacao: (a.b).c = a.(b.c), 'If a, b, c E N;

5. Cornutativa da Multiplicacao: (a.b) = (b.a), 'If a, bEN;

6. Elemento Neutro da Multiplicacao: (a.I) = a, 'If a E N;

7. Distributiva da Multiplicacao z Adicao: a.(b + c) = (a.b) + (a.c), 'If a, b, C E N;

-+ Conjunto dos Niimeros Inteiros: eo conjunto Z= (, .. , -3, -2, -I, 0, 1,2, 3, ..... }

OBS!: Usamos 0 simbolo (+) para indicar a exclusao dos elementos negativos e 0 simbolo (-) para indicar a exclusao dos elementos positivos. Portanto,

• Z+ = {O, 1,2,3, 4, ... } = N => conjunto dos inteiros nao negativos;

• Z- = { , -3, -2, -1, D} => conjunto dos inteiros nao positivos;

• Z* = { , -3, -2, -1, 1,2, 3, ... } => conjunto dos inteiros nao nuIos;

OBS2: Z: = {I, 2, 3, 4, ... }, ou ainda, Z~ = { ... ,-3,-2,-1};

OBS3: Todo numero natural e urn inteiro => NeZ;

Operac5es em Z:

1. Simetrico ou Oposto para a Adicao: 'If a E Z existe - a E Z tal que a + (-a) = 0;

2. Subtracao: (a- b) = a + (- b), "if a, b E Z;

3. Todas as propriedades validas para os mimeros naturais (Propriedades de 1 a 7);

Divisibilidade: Dizernos que 0 inteiro "a" e divisor do inteiro "b", alb, quando existe urn inteiro "c" tal que c.a = b.

alb <=> (:3 C E Z I c.a = b)

Exemplos: a) 2112 => 6.2 = 12 c) -21-14 => 7. (-2) = -14 e) D 10 => 1. 0=0

b) 3 1-18 => (-6).3 = -18 d) 410 => 0.4 = 0 f) -5 12D => (-4). (-5) = 20

Proia. MSc. Gilmara Alves Cavalcanti 33

OBS4: Quando "a" e divisor de "b", dizemos que "b" e divisfvel por "a", ou "b" e multiple de "a". Para urn inteiro "a" qualquer: D(a) = conjunto dos divisores de a;

M(a) = conjunto dos multiplos de a;

Exemplos: a) D(2) = {I, -1, 2, -2} ::::;. M(2) = {O, ± 2, ± 4, ± 6, }

b) D(-3) = {I, -1,3, -3} ::::;. M(-3) = {O, ± 3, ± 6, ± 9, }

c) D(O) = Z ::::;. M(O) = {O}

OBSs: Urn mimero inteiro "p" e primo quando, p * 0, 1 e -1, => D(P) = {I, -1, p, -pl. Por exemplo, 2, -2, 3, -3,5, -5, 7 e -7 sao primos.

-+ Conjunto dos Numerus Racionais: eo conjunto Q= {x I x = p/q; P E Z e q E Z*}. Para 0 qual adotam-se as seguintes definicoes:

a c

(1 a) Igualdade: - = -¢:> ad ::;:: be ;

b d

(2a) Ad' - a e ad + be

lyao: - + - = .

b d bd'

(J") Multiplicacao: a . ~ = ac ; b d bd

OBSt: Numero racional e todo mimero que pode ser eserito em forma de fracao, com nurnerador inteiro e denominador diferente de zero.

OBS2: Racionais n Irracionais = $

OBS3: No conjunto dos racionais podemos destacar:

• Q+ = conjunto dos racionais nao negativos;

• Q- = conjunto dos racionais nao positivos;

• Q* = eonjunto dos racionais nao nulos

OBS4: Sao numeros raeionais:

• Todo numero inteiro: -4 E Q, 0 E Q, 183 E Q;

• Todos os numeros decimais finitos: 2,72 E Q,8/5 E Q, -0,23 E Q;

• Todos os mimeros decimais infinitos e periodicos: 0,3333 ... E Q, 0,1815555 .... E Q;

OBSs: Verifique que, Q = Q+ U Q- enquanto Q+ n Q- = {O}

a d

- -=

b'c

a c

OBS6: Divisao de fracoes:

Operacoes em Q:

a e e

(M.2) b' d = d

(M.3) (:).1 = : ;

(MA) Para todo a E Q e a * 0 existe ~ E Q tal que: ~. ~ = 1

b b a b a

a

b

Pro/a. MSc. Gilmara Alves Cavalcanti 34

Representayao Decimal: Todo mimero racional, ~, pode ser representado por um numero b

decimal. Passa-se urn mimero racional ~ para a forma de numero decimal dividindo 0 inteiro b

"a" pelo inteiro "b". Nesse caso podem ocorrer dois casos:

(I") 0 numero decimal tern uma quantidade finita de algarismos, diferentes de zero => decimal

3 1 1 27

exata, Exemplos: a) - = 3 b) - = 0 5 c) - = 0 05 d) -- = 0 027

1 2' 20' 1000'

(2°) 0 numero decimal tern uma quantidade infinita de algarismos que se repetem periodicamente => dizima periodica. Exemplos: a) _!_ = 0,333 .... = 0,3 (periodo 3)

3

b) ~ = 0,2857142857142 .. , = 0,2857142 (periodo 285714) 7

OBS8: Decimal Exata => pode ser transfonnada em uma frayao da seguinte forma: 0 numerador e 0 numeral decimal sem a virgula, e 0 denominador e 0 algarismo 1 seguido de tantos zeros quantas forem as decimais do numeral dado.

Exemplos: ° 37 = 37 2 631 = 2631

- '100 ' 1000

63 4598 = 634598

, 10000

-+ Conjunto dos Numeros Reais: e 0 conjunto obtido da uniao do conjunto dos numeros racionais com 0 dos numeros irracionais: R= {x J x E Q ou x e Irracional}. Portanto, e 0 conjunto fonnado por todos os numeros com representacao decimal, isto e, casas decimais exatas ou peri6dicas (rnimeros racionais) e as decimais nao exatas e nao peri6dicas (mimeros irracionais) => R = {Q U Irracionais}.

OBSt: Todo numero racional e numero real: , Q c R;

OBS2: Admite-se tambem: R*, R+, K, R:, R~

• R+ = conjunto dos racionais nao negativos;

• K = conjunto dos reais nao positivos;

• R* = conjunto dos reais nao nulos

ORS3: Estaoem R os numeros irracionais: .J2 = 1,41421...; n= 3,14159 ...

Operayoes em R: As operacoes de adicao e multiplicacao em R gozam das mesmas propriedades

*

vistas para 0 conjunto Q. Em R tambem e definida a operacao de subtracao e em R tambem e

definida a divisao,

Intervalos: Podemos representar 0 conjunto de numeros reais associando cada x ERa um ponto de uma reta R.









I .J2

• >

-2

-3/2

-1

o

1

2

Intervalo e qualquer conjunto continuo de R. Dados p e q reais (p < q) pode-se definir:

• Intervalo Fechado => [p, q]: Conjunto: {x E R J p ~ x ~ q};

• Intervalo Aberto => ]p,q [: Conjunto: {x E R J P < x < q};

• Intervalo Fechado a Esquerda => [p, q [: Conjunto: {x E R J p ~ x < q};

• Intervalo Fechado a Direita => Jp, q]: Conjunto: {x E RJp<x ~ q};

Profa; MSc. Gilmara Alves Cavalcanti 35

2.1.4 - SUBCONJUNTO

Considere,

B = todas as pessoas brasileiras; } C = todos os homens brasileiros;

D = todas as mulheres brasileiras;

HeM sao subconjuntos de B;

Seja, T = pelo menos uma pessoa que nao seja brasileira ~ T nao e subconjunto de B. Portanto, H e B e M e B (le-se: H esta contido em B) e (le-se.M esta contido em B);

T a. B (le-se : T nao esta contido em B);

Urn conjunto A e subconjunto de urn conjunto B se, e somente se, todo elemento de A pertencer aBo

Exemplos:

a) {2, 5, 3} e {2, 5, 3, 8, 9}

b) {2, 5, 3} e {2, 5, 3,}

c) {2,5,3} a. {2,5,7,9}

d) A@)

BeA

Propriedades

1. 0 con junto vazio e subconjunto de qualquer conjunto; <l> e A, '\I A.

2. Todo conjunto e subconjunto de si mesmo; A e A, \;f A.

2.1.5 - IGUALDADE DE CONJUNTOS

Dois conjuntos A e B sao iguais se, e somente se, possuem os mesmos elementos.

A = B <=> ('\I x) ~(x E A <=> X E B) I ou ainda I A = B <=> A e Be B e A

Exemplos: a) {I, 2, 3} = {3, 2, I}

b) {b, c, d, e} = {e, b, d, c}

c) A = {I, 2, 4} e B = {x I x e divisor positivo de 4} A=B

2.2 - OPERA(OES COM CONJUNTOS

2.2.1 - UNIAO (u): A uniao de dois conjuntos A e B e 0 conjunto formado pelos elementos pertencentes a A ou a B.

A u B = {x I x E A ou X E B}

Exemplos:

a)A={I,2,3}eB={6,7} ~ AuB={1,2,3,6,7}

b) C = {I, 2, 3,4} e D = {3, 4, 5, 6, 7} ~ CuD = {I, 2, 3, 4, 5, 6, 7}

c) A = {x I x e par} e B = {2, 4, 6} ~ A u B = {x I x e par}

~ Representaeao da Uniao de Conjuntos em Diagrama de Venn:

U

Be)

c

c C

C

C

Regiao Hachurada: (A u B)

Profa; MSc. Gilmara Alves Cavalcanti 36

~ Propriedades da Uniao:

1. A u A = A, V A~

2. A u ~ = A, V A;

3.A u B=B u A, V A,B;

4. (A u B) u C = A u (B u C), V A, B, C;

5. A c B => A u B = B, V A, B;

B c A => A u B = A, V A, B;

Conseqtientemente, (AI u A2 U A3 U ... U An) = {x I x E AI ou X E A2 ou .... ou X E An}

2.2.2 - INTERSE<;AO (n): A intersecao de dois conjuntos A e B e 0 conjunto formado pelos elementos pertencentes a A £ a B.

I A n B = {x I x E A e x E B} ,.

Exemplos:

a) A = {I, 2, 3, 4} e B = {3, 4,5,6, 7} => A n B = {3, 4} b)C={1,2,3}eD={7,8,9} => CnD=~

c) E = {4, 5, 6} e F = {2, 3,4,5,6, 7} => E n F = E

d) A = {I, 3, 5, 7, 9} e B = {2, 4, 6, 8} => A n B = ~

OBS: Quando a intersecao entre dois conjuntos e 0 conjunto ~ dizemos que sao conjuntos DISJUNTOS.

~ Representacao da Interseeau de Conjuntos em Diagrama de Venn:

A([) .'.' B ;:;

u

Regiao Hachurada: (A n B)

(A n B) = ~ => DISJUNTOS

~ Propriedades da Intersecaor

1. A n A = A, V A;

2. A n ~ = ~, V A;

3.A n B=B n A, V A,B;

4. (A n B) n C = A n (8- n C), V A, B, C;

5. A c B => A n B = A, V A, B; B c A => A n B = B, V A, B;

Conseqiientemente, (AI n A2 n A3 n ... nAn) = {x I x E Al ex E A2 e .... ex E An}

2.2.3 - DIFEREN<;A: Dados dois conjuntos A e B, chamamos de diferenca (A - B) ao conjunto formado pelos elementos que pertencem a A e nao pertencem a B.

I (A - B) = {x I x E A e ~ ~ B} I

Exemplos:

a)A={1,2,3,4,5}eB={4,5,6,7,8,9} => A-B={1,2,3} e B-A={6,7,8,9} b)C={1,2,3,4,5,6}eD={3,4,5} => C-D={1,2} e D-C=~

c) A = {2, 3, 5} e B = {4, 6, 7} => A - B = {2, 3, 5} = A e B -A = {4, 6, 7} = B

~ Representaeao da Diferenea de Conjuntos em Diagrama de Venn:

u

A(IT) ........••..•. ' ••...••.••.••.. ' ....•.. ' ...• ' ..... .. B

,'.

Pro/a. MSc. Gilmara Alves Cavalcanti 37

Regiao Hachurada: (A - B)

u

Bi

.

. .

.

.

Se B c A ~ B -A = $

Regiao Hachurada: (B - A)

-+ Propriedades da Diferenea:

1. A - A = $, \f A;

2. A - $ = A, \f A;

3. $ - A = $, \f A;

4. B c A => B -A = $, \f A, B;

5. A *- B => A - B *- B - A, \f A, B;

6. A n B = $ <=> A - B = A, \f A, B;

2.2.4 - COMPLEMENTAR: Quando dois conjuntos A e B sao tais que A c B, da-se 0 nome de complementar de A em Bit diferenca (B - A). Representa-se por, C~ ou A. Sejam A e B dois conjuntos tais que A c B. Chama-se complementar de A em relacao a B ao conjunto cujos elementos sao todos aqueles que pertencem aBe nao pertencem a A.

I A c B <=> C~ = {x I x ~ A e x E B}

OBS: Condicao necessaria e suficiente para que exista C~ e que A c B.

Exemplos:

a) A = {I, 2, 3} e B = {I, 2, 3, 4, 5} -+ A c B => existe C~ = B - A = {4, 5} b)D= {1,2, 3,4} eE= {3,4,6, 7} -+ D a: E => nao existe C~

c) A = {113, 114} e B = {111, 112, 113, 114} -+ A c B => existe C ~ = B - A = {Ill, 112}

-+ Representaeae do Complementar de Conjuntos em Diagrama de Venn:

u

Regiao Hachurada: C~ = A

CA =B-A

B

-+ Propriedades do Complementar:

1. C1 = $, \f A, B;

2. ci = A, \f A;

3. C: = $;

4. (AuB)=AnB, \f A,B;

5. (A (l B) = Au B, \f A, B;

Profa. MSc. Gilmara Alves Cavalcanti 38

2.3 - CONCEITOS DE PROBABILIDADE (EXPERIMENTO, ESPA<;O AMOSTRAL, EVENTOS)

2.3.1 - EXPERIMENTOS ALEATORIOS (E): Urn experimento e 0 processo de observar urn fenomeno que tern variacao em seus resultados. Por exemplo,

E\: Retirar uma carta de urn baralho com 52 cartas e observar seu naipe; E2: Jogar uma moeda 10 vezes e observar 0 numero de caras obtidas;

E3: Retirar com ou sem reposicao, bolas de urna uma que contem 5 bolas brancas e 6 pretas; E4: Jogar urn dado e observar 0 numero mostrado na face superior;

E5: Contar 0 mimero de pecas defeituosas da producao diaria da maquina A;

2.3.2 - ESPA<;O AMOSTRAL (S ou Q): Eo conjunto de todos os resultados possiveis de urn experimento. Por exemplo,

a) E = Jogar urn dado e observar 0 numero mostrado na face superior ~ S =?

b) E = Jogar duas moedas e observar 0 resultado 0+ S =?

2.3.3 - EVENTOS: E qualquer subconjunto do espaco amostral. Por exemplo,

a) E = Jogar tres moedas e observar 0 resultado 0+ S =?

Seja 0 evento, A = ocorrer pelo menos duas caras. ____..,.. A = ?

b) E = Lancar urn dado e observar a face superior 0+ S = ?

Seja 0 evento, B = ocorrer multiple de 2. ____..,.. B = ?

0+ Relaeoes entre Eventos

(i) (Au B): eo evento que ocorre se A ocorre, ou B ocorre ou ambos ocorrem;

(ii) (A n B): eo evento que ocorre se A e B ocorrem;

(iii) A C ou A: e 0 evento que ocorre se A nao ocorre;

(iv) Dois eventos A e B sao denominados rnutuamente exclusivos se eles nao puderem ocorrer simultaneamente, isto e, (An B) = $.

2.4 - PROBABILIDADE E SUAS LEIS

Definis;ao 1: E 0 grau de confianca que se tern na ocorrencia de urn determinado evento.

Definicao 2: Seja A urn evento associado a urn determinado experimento, a sua probabilidade e verificada por:

P(A) = numero de maneiras que ocorre 0 evento A = # A

numero de maneiras que ocorre 0 espaco amostral # S

Axiomas da Probabilidade: Seja A urn evento e considere peA) a probabilidade desse evento. Essa probabilidade deve satisfazer as seguintes condicoes:

(a) o s peA) :s; 1 ;

(b) peS) = 1;

(c) Se A e B forem eventos mutuamente exclusivos, entao, peA u B) = peA) + PCB);

Exemplos:

1. Lanca-se urn dado. Qual e a probabilidade de sair urn numero impar? Qual e a probabilidade de sair 0 numero 2?

2. Uma carta e extraida ao acaso de urn baralho. Qual e a probabilidade de sair urn as?

Proja. MSc. GilmaraAlves Cavalcanti 39

Teoremas:

I. Se $ e conjunto, entao: P( $ ) = 0;

2. Se A eo complemento de evento A, entao P( A) = 1 - peA);

3. Se AcB, entao: peA) :s; PCB);

4. Teorema da Soma: Se A e B sao dois eventos quaisquer, entao: peA u B) = peA) + PCB) - peA n B) 5. Teorema da Soma: Se A, B e C sao tres eventos quaisquer, entao:

P(AuBuC) = peA) + PCB) P(C)-P(AnB) - P(AnC) -P(BnC) + P(AnBnC)

2.5 - PROBABILIDADE CONDICIONAL

Definicao: Denomina-se probabilidade condicional a probabilidade de ocorrer determinado evento sob uma dada condicao. Sejam A e B dois eventos, denota-se peA I B) a probabilidade condicionada do evento A quando 0 evento B tiver ocorrido por,

P(AI B)= P(AnB) PCB)

ou

P(BI A) P(AnB) peA)

Exemplo 01: Dois dados sao lancados, registrando-se os resultados com (XI, X2). Considere os seguintes eventos: A = {( X!, X2); X, + X2 = IO} e B = {( X" X2); X, > X2}. Calcule: peA), PCB), peA I B) e PCB I A).

A partir da definicao de Probabilidade Condicional pode-se ensinar 0 Teorema do Produto:



P(AI B) P(AnB) => P(AnB)=P(B).P(AI B) PCB)

P(BI A)= P(AnB) => P(AnB)=P(A).P(BI A) peA)



-+ Independencia

Definis:ao: Dois eventos independentes quando a probabilidade de ocorrer urn deles nao e modificada pela ocorrencia do outro, isto e, P( A) = P( A I B) ou P( B) ~ P( B I A). Se A e B sao

independentes entao,

I peA n B)=P(A).P(B)

Exemplo 02: Urn dado e uma moeda sao lancados ao mesmo tempo. Qual e a probabilidade de ocorrer cara na moeda sabendo que ocorreu numero 6 no dado?

Exemplo 03: Urn numero e escolhido ao acaso no conjunto {I, 2, 3, ... , 20}. Verifique se os eventos A e B sao independentes no seguinte caso: A = 0 numero escolhido e par e B = 0 numero escolhido e multiple de 3.

Pro/a. MSc. Gilmara Alves Cavalcanti 40

LISTA DE EXERCICIOS 02

1. Urn casal tern dois filhos. Qual e a probabilidade de: (a) 0 primogenito ser homem? (b) Os dois filhos serem homens? (c) Pelo menos urn dos filhos ser homem?

2. No cruzamento de ervilhas amarelas homozigotas (AA) com ervilhas verdes homozigotas (aa) ocorrem ervilhas amarelas heterozigotas CAa). Se estas ervilhas forem cruzadas entre si, ocorrem erviIhas amarelas e verdes, na proporcao de tres para urna. Suponha que foram pegas ao acaso, tres ervilhas resultantes do cruzamento de ervilhas amarelas heterozigotas. Qual e a probabilidade das tres serem verdes?

3. Uma caixa contem dez pecas das quais quatro sao defeituosas. Sao retiradas duas pecas, uma ap6s a outra. Calcular a probabilidade de ambas serem boas (com reposicao e sem reposicao).

4. Tres componentes C., C2 e C3 de urn microsc6pio sao postos em serie (em linha reta). Suponha que esses mecanismos sejam dispostos em ordem alfabetica. Sejam os eventos: A = C2 esta a direita de C, e B = C3 esta a direita de Ct. Os eventos A e B sao independentes?

5. Sejam A e B dois eventos associados a urn experimento. Suponha que peA) = 0,4 e peA U B) = 0,7. Seja PCB) = p. Pergunta-se: (a) Para que valor de p, A e B serao mutuamente excludentes? (b) Para que valor de p, A e B serao independentes?

6. Cada urna de duas pessoas joga tres moedas equilibradas. Qual e a probabilidade de que elas obtenham 0 mesmo numero de caras?

7. Jogam-se dois dados. Desde que as faces mostrem mimeros diferentes, qual e a probabilidade de que urna face seja quatro?

8. Urn dado e lancado e, independentemente, urna carta e extraida de urn baralho completo. Qual sera a probabilidade de que: (a) 0 dado mostre urn numero par e a carta seja de urn naipe vermelho? (b) 0 dado mostre urn numero par ou a carta seja de urn naipe vermelho?

9. Uma eaixa contem 4 valvulas defeituosas e 6 perfeitas. Duas valvulas sao extraidas juntas. Uma delas e ensaiada e se verifiea ser perfeita. Qual e a probabilidade de que a outra valvula tambem seja perfeita?

10. Suponha que a probabilidade de urn homem com 50 anos viver mais 10 anos seja igual a 32%, e que a probabilidade de que sua esposa que tern 40 anos, viver mais 10 anos e de 58%. Qual e a probabilidade de que: (a) 0 casal viva mais 10 anos? (b) Somente urn viva mais 10 anos? (c) Pelo menos urn viva maislO anos?

11. Uma urna 1 contem 10 bolas braneas e 8 bolas vermelhas. A urna 2 contem 6 bolas brancas e 5 bolas vermelhas. Uma bola e eseolhida da uma 1 e eolocada na uma 2. Em seguida, uma bola e eseolhida ao aeaso da uma 2 . Qual a probabilidade de que a bola escolhida seja vermelha?

12. Considere duas umas A e B, a uma A contem uma bola branca e uma preta, e a urna B contem duas bolas brancas e tres pretas. Uma bola e escolhida da uma A e colocada na uma B. Em seguida, uma bola e escolhida da uma B. Qual a probabilidade de que: (a) Ambas sejam da mesma cor? (b) A primeira seja preta dado que a segunda foi branea?

13. Em uma populacao, sabe-se que 0 numero de mulheres e duas vezes maior que ados homens. Sabe-se tambem que 6% dos homens sao daltonicos e 3% das mulheres sao daltonicas, Se uma pessoa e selecionada, ao acaso, e verifiea-se que e daltonica, determine a probabilidade

de que seja do sexo feminino. '

Pro/a. MSc. Gilmara Alves Cavalcanti 41

UNIDADE III: V ARIA VEIS ALEATORIAS E DISTRIBUICAO DE PROBABILIDADE

3.1 - VARIA VEIS ALEATORIAS (CONCEITOS)

E condicao inerente a uma populacao existir variacao quanto aos atributos que lhe podem ser estudados. Portanto, a V ARIABILIDADE e uma caracteristica comum a dados de observacao e experimentos. Urn atributo sujeito a variacao e descrito por uma V ARIA VEL. Suponha a seguinte situacao:

Urn pesquisador cria, em laboratorio, ratos de uma so raca, em condicoes controladas de alimentacao e manejo. E razoavel considerar que os pesos desses ratos variam. Sabe-se que,

o Os machos pesam mais do que as femeas; ~

o Os animais ganham peso com a idade;

o Ratos de mesmo sexo, nascidos no mesmo dia tern pesos variaveis;

V ARIABILIDADE: Resulta de um soma de fatores nao controlados. ~ 0 peso dos ratos e uma variavel aleatoria, X (v.a e toda variavel influenciada pelo acaso).

As variaveis aleatorias (v.a's) sao classificadas em:

~ Variavel Aleatoria Discreta: assume urn numero finito ou infinito contavel de valores numericos. Da uma ideia de contagem (os valores que podem ser associados aos numeros naturais (1,2,3, .... )). Por exemplo, mimero de crias em animais.

~ Variavel Aleatoria Continua: assume um valor dado por urna medida numa escala continua, isto e, todos os valores possiveis num intervalo real. Isto e, assume infinitos valores em urn dado intervalo. Da uma ideia de medicao, Por exemplo, peso e comprimento de animais.

© DEFINICAo DE VARIA VEL ALEATORIA

Urn modele de probabilidade associado a urn experimento contem dois componentes: (i) 0 espaco amostral;

(ii) As probabilidades associadas a cada resultado elementar.

Definicao 01: Uma variavel aleatoria X associa um valor numerico a cada resultado elementar de urn experirnento.

Definicao 02: E uma funcao definida em urn espaco amostral, quando a me sma representa urn fenomeno aleatoric. E geralmente representada por X, onde a funcao de X associa a cada elernento s E Sum numero real, Xes).

~ Contradominio (Rx): E mimero de val ores possiveis da variavel aleatoria X. Exemplo 01: E = lancamento de urn dado 5 vezes.

X = numero de vezes que aparece 0 numero 2 ~ R, = {a, 1,2,3,4, 5} Exemplo 02: E = lancamento de uma moeda 2 vezes.

X = numero de caras obtidas nos dois lances 0+ R, = {O, 1, 2}

Definicao 03: Seja E urn experimento e S urn espaco amostral associado ao experimento. Uma funcao X, que associe a cada elemento s E S urn numero real, Xes), e denominada varidvel aleatoria.

X

Definicao 04: Seja X uma variavel aleatoria, Se 0 mimero de valores possiveis de X, isto e Rx, for finito ou infinito numeravel entao X e uma variavel aleatoria discreta.

S

-+ A cada valor Xi da variavel aleatoria X, podemos associar a sua probabilidade de ocorrencia.

3.2 - DISTRIBUIf;OES DE PROBABILIDADE DISCRETAS

E uma expressao matematica aplicavel a multiplas situacces desde que determinadas premissas sejam respeitadas. Ela torna possivel 0 calculo de uma probabilidade por meio da simples aplicacao de formulas ou, as vezes, da leitura de urna tabela.

Distribuicao de Probabilidade: E 0 conjunto de todos os valores que podem ser assurnidos pela variavel discreta, com as respectivas probabilidades.

Exemplo 01: Considere 0 lancamento de urn dado. A distribuicao dos resultados do jogo de urn dado e dada por:

x P(X)
1 116
2 116
3 116
4 116
5 116
6 1/6
Total 1 P(X)

1/6

....
-,.- r- - ,- - -
.. 1 2

6

x

3

4

5

Exemplo 02: Seja a variavel aleat6ria X representando 0 numero de caras em 3 lancamentos de uma moeda. Como a moeda e honesta, os 8 pontos amostrais do espaco amostral tern a mesma probabilidade 1/8. Portanto, a distribuicao da v.a X e dada por:

s = {(c, c, c); (c, c, k); (c, k, c); (k, c, c); (k, k, c); (k, c, k); (c, k, k); (k, k, k)}

x P(X)
0 118
1 3/8
2 3/8
3 118
Total 1 3/8

118

At. P (X)
- l- i-
- r- l
.. X

o

1

2

3

Observar que X = 1 corresponde aos pontos amostrais ckk, kck, kkc, isto e, a probabilidades de X = 1 e 3/8.

Pro/a. MSc. Gilmara Alves Cavalcanti 43

3.3 - FUNC;OES DE DISTRIBUIC;AO PARA VARIA VEIS ALEATORIAS DISCRETAS

Definicao (Funfiio de Probabilidade): Chama-se funcao de probabilidade (f.p) da variavel aleat6ria discreta X, que assume val ores XI, X2, ...• Xn• a funcao P(Xi), que a cada valor de Xi associa sua probabilidade de ocorrencia, isto e:

p(Xj) = f (Xi) = P(X = Xi) = pi,

e deve satisfazer as seguintes condicoes: { (a) p5Xi) ;,::: ° para todo i; (b) LP(xJ;:::: 1;

.~ i=!

A funcao de probabilidade de uma variavel aleat6ria discreta pode ser representada graficamente pelo histograma de probabilidades.

Considere novamente a v.a X representando o numero de caras em 3 lancamentos de uma Moeda honesta. Na figura ao lado temos 0 Histograma de probabilidade de v.a X

fex)

y

°

3

1 2

Exemplo 01: Supor que 30% das arvores de urna reserva florestal estao infestadas por urn parasita. Quatro arvores sao selecionadas aleatoriamente. Seja X a variavel aleat6ria representando 0 numero de arvores na amostra selecionada que tern 0 paras ita presente. Obter a distribuicao de probabilidade de X e 0 histograma de probabilidade.

X=o X= 1 X=2 X=3 X=4
NNNN NNNI NNII NIII I I II
NNIN NINI I N I I
NINN NIIN I IN I
INNN INNI I lIN
IN IN
lINN Como 30% das arvores estao infectadas

, temos, P(I) = 0,3 e PeN) = 0,7. Como a populacao de arvores e muito grande e a amostra e muito pequena considerar as observacoes nas 4 arvores como independentes. Pela independencia temos:

PeN N N N) = (0,7).(0,7).(0,7).(0,7) = 0,2401 -+ P(X = 0) = 0,2401

PeN N N I) = (0,7).(0,7).(0,7).(0,3) = 0,1029 -+ P(X = 1) = 4.(0,1029) = 0,4116 PeN N I I) = (0,7).(0,7).(0,3).(0,3) = 0,0441 -+ P(X = 2) = 6.(0,0441) = 0,2646 PeN I I I) = (0,7).(0,3).(0,3).(0,3) = 0,0189 -+ P(X = 3) = 4.(0,0189) = 0,0756 P(I I I I) = (0,3).(0,3).(0,3).(0,3) = 0,0081 -+ pex = 4) = 0,0081

A f - d

b bilidade da v.a X e dada por:

UllyaO epro a
x f(x)
° 0,2401
1 0,4116
2 0,2646
3 0,0756
4 0,0081
Total 1 0,4

0,3

0,2 0,1

°

1 2

3

4

Profa. MSc. Gilmara Alves Cavalcanti 44

Definicao (Funflio de Distrlbuicdo Acumulada): Seja X uma variavel aleatoria discreta, Define-se a funcao de distribuicao acumulada, F, da variavel aleat6ria X como:

00

F(x) = P(X ::; x) = LP(xj), Xj ::; x. j=l

Exemplo: Suponha a seguinte distribuicao de probabilidade da variavel aleat6ria X.

0, se x < 0

I / 3, se 0 s x s I F(x) = 112, se I < x ::; 2

1, se x> 2

x

o

1

2

peX)

1/3

1/6

112

Muitos experimentos sao executados sob diferentes conjuntos de suposicoes. Por causa da sua importancia e da sua vasta area de aplicacoes, estes experimentos recebem nomes especiais. Na proxima unidade, vamos derivar as distribuicoes de probabilidade das variaveis aleatorias associadas com estes experimentos e estudar algumas de suas propriedades. Dentre algumas distribuicoes discretas podemos citar: Bernoulli, Binomial, Poisson, entre outras,

3.4 - DISTRIBUI<;OES DE PROBABILIDADE CONTiNUAS

Se a variavel X for continua, somente havera interesse na probabilidade de que a variavel assuma valores dentro de determinados intervalos, sendo sua distribuicao de probabilidades caracterizada por uma funcao densidade de probabilidade (f.d.p),

No capitulo 1, descrevemos como observacoes numa variavel continua podem ser representadas num histograma. Quando determinamos urn grande numero de observacoes e os intervalos de classe sao reduzidos, 0 histograma tende para uma curva suave chamada curva de frequencia.

Se a altura da curva e padronizada tal que a area abaixo e igual a I, 0 grafico e chamado de curva de probabilidade. A altura da curva de probabilidade em qualquer ponto x e usualmente denotada por f (x), e sua funcao e chamada defunfiio densidade de probabilidade (fd.p).

3.5 - FUN<;OES DE DISTRIBUI<;Ao PARA VARIA VEIS ALEATORIAS CONTiNUAS

Suponha que X e uma variavel aleatoria cujo contradomfnio e formado por urn mimero finito muito grande de valores, digamos 0 intervalo o::;x::; 1. A cada valor esta associado um numero nao negativo P(Xi) = P(X = Xi) , i = 1, 2, .... cuja soma e igual a 1. Se for utilizado 0 mesmo conceito para 0 caso continuo, nao se pode indagar qual a probabilidade do i-esimo valor de X, pois os valores possiveis de X nao sao numeraveis, dai p(xD nao faz sentido. Desta forma, a funcao e substituida por uma funcao f definida para todos os val ores de x, 0::; x::; I.

Definiyao (Funrlio Densidade de Probabilidade): Diz-se que X e uma variavel aleatoria continua, se existir uma funcao f, denominada funcao densidade de probabilidade (f.d.p) de X que satisfaca as seguintes condicoes:

Profa. MSc. Gilmara Alves Cavalcanti 45

(a) f (x) ;:::: 0, qualquer que seja x;

+<0

(b) ff(x)dx = 1; (a area total sob a curva vale 1)

-00

b

(c) para quaisquer a e b com -co < a < b < -teo, teremos P(a::;; X:::; b) = ff(x)dx;

a

Portanto, X e urna variavel aleat6ria continua se X puder tomar todos os valores em algum intervalo.

NOTAS:

1. Para variaveis aleat6rias continuas, a f.d.p f (x) nao representa a probabilidade de X=x.

Aqui, a f.d.p relaciona a probabilidade de urn intervalo [a, b] a area sob a curva entre a e b.

2. P{X = x} = 0, isto e, com urna variavel aleat6ria continua, a probabilidade de X = x e sempre igual a zero. Somente tern senti do calcular probabilidades em intervalos.

3. P{a:S; X :s; b} = P{a < X ::;; b}= P{a :s; X < b} = P{a < X < b}, pois P{X=a}=P{X=b}=O.

Urn outro modo de descrever uma distribuicao de probabilidade e especificar urna funcao chamada funcao distribuicao acumulada, ou simplesmente funcao distribuicao (f.d) representada por F(x).

Definicao (Funriio de Distribuiriio AcumuJada): Seja X urna variavel aleatoria continua. Define-se a funcao de distribuicao acumulada, F, da variavel aleat6ria X como:

x

F(x) = P(X :s; x) = ff(t)dt, Xj :s; x, em qualquer ponto x no qual f(x) e continua,

-00 F' (x) = dF(x) = f(x).

dx

NOTAS:

'<0

1. F(xo) = ff(x)ca.

-00

2. P{XI < X < X2} = F(X2) - F(xt).

3. FC - co) = 0 e FC + co) = 1.

Exemplo: Suponha X seja uma variavel aleat6ria continua com f.d.p:

{2X' 0 < x < 1 f(x) =

0, para quaiquer outros val ores

F(x) =

0, se x s O

x x x

f2sds=2 fsds=2.(S2 12)1 =x2, O<x::::;;l 000

1, sex> 1

OBS: As variaveis aleat6rias cujos valores resultam de algum processo de mensuracao, de urn modo geral, sao as variaveis aleat6rias continuas. Por exemplo, 0 peso ou a altura de pessoas de urna cidade; 0 tempo de vida de urna Iampada; 0 diametro de rolamentos de esferas; etc.. Dada uma variavel aleatoria continua X, deseja-se saber qual a f.d.p de X. Para atingir este objetivo alguns modelos sao comurnente usados para representar a f.d.p de variaveis continuas, entre eles: o modelo Normal, Exponencial, Gama, Qui-quadrado, entre outros.

Pro/a. MSc. Gilmara Alves Cavalcanti 46

3.6 - ESPERAN<;A MATEMATICA

-+ Varhivel Aleatoria Discreta

Defini9aO 01: Seja X uma variavel aleat6ria discreta, com valores possiveis XI, Xl, .... 'Xn. Seja P(Xi) = P(X = Xi), i = 1, 2, .... ,n, ..... Entao 0 valor esperado de X (ou esperanca matematica de X), denotado por E(X) e definido como:

<IJ

E(X) = L x.pfx,)

j~l

o valor esperado, a exemplo da media aritmetica para distribuicoes de frequencies, e uma medida de tendencia central ou posicao, s6 que utiliza a frequencia relativa ou probabilidade.

Defini£ao 02: Se X e uma variavel aleat6ria discreta com funcao de probabilidade P(Xi), 0 valor esperado da funcao H(x), denotada por E[H(x)] e definido como:

<IJ

E[H(X)] = LH(x).p(xj)

j~l

-+ Varhivel Aleatoria Continua

Defini9aO: Seja X uma variavel aleat6ria continua, com f.d.p. 0 valor esperado de X e definido como:

p = E(X) = r: x.f(x)dx

);> Propriedades do Valor Esperado:

1. E( c) = c, onde c e uma con stante.

2. E( cX) = c.E(X), onde c e uma constante

3. Sejam X e Y duas variaveis aleat6rias quaisquer. Entao, E(X ± Y) = E(X) ± E(Y).

4. Sejam n variaveis aleat6rias Xi, Xl, ... , Xn. Entao, E(XI + ... + Xn) = E(XI) + ... + E(Xn).

5. Seja (X, Y) uma variavel aleat6ria bidimensional e suponha-se que X e Y sejam independentes. Entao, E(XY) = E(X).E(Y).

VARIAN CIA

-+ Variavel Aleatoria Discreta

Defini£ao: Seja X uma variavel aleat6ria. Definimos a variancia de X, denotada por VeX) ou (j~ da seguinte maneira:

VeX) = E[X - E(X)f = E(Xl) - [E(x)f

-+ Variavel Aleatoria Continua

Definicao: Seja X uma variavel aleat6ria continua. Definimos a variancia de X, denotada por

+~

VeX) ou cr~ da seguinte maneira: VeX) = E[X - E(X)]2 = J[x - E(X)] 2 J(x)dx.

-00

}i;> Propriedades da Varisncla:

1. V (c) = 0, onde c e uma constante;

2. V (X + c) = V (X), onde c e uma con stante;

3. V(cX) = c2.V(X);

4. Se (X, Y) for uma variavel aleat6ria bidimensional, e se X e Y forem independentes.

Entao, VeX ± Y) = VeX) + V(Y).

5. Sejam XI, Xl, ... , Xn, n variaveis aleat6rias. Entao, VeX! + ... + Xn) =V(XI) + ... + V(Xn).

Pro/a. MSc. Gilmara Alves Cavalcanti 47

Exemplo 01: Considere a v.a X representando 0 numero de caras em 3 lancamentos de uma moeda. Calcule E(X) e Var(X).

x P(X) x.P(X) x1.P(X)
0 118 0 0
1 3/8 3/8 3/8
2 3/8 6/8 12/8
3 118 318 9/8
Total 1 12/8 24/8 <i)

E(X) = I>iP(XJ = 12/8 = 1,5

i=!

VeX) = E[X - E(X)]2 = E(X2) - [E(x)f VeX) = (24/8) - (I,5i = 3 - 2,25 = 0,75

Exemplo 02: Seja a distribuicao uniforme com f.d.p dada:

f {1I2, - 1 < x < 1

(x) =

0, para quaiquer outros valores

, LI 1

J.1 = E(X) = x.-.dx = 0 I 2

Entao:

2 II 2 1 1

a =Var(X)= x .-.dx=-

I 2 3

LISTA DE EXERCicIOS 03

1. Considere familias com tres filhos. Uma familia e observada verificando-se a idade eo sexo das criancas. Seja a variavel aleatoria: X = numero de criancas do sexo masculino. Determine a distribuicao de probabilidade de X e 0 seu valor esperado e variancia,

2. Considere 0 lancamento de urn dado. Seja X 0 numero rnostrado na face superior. Determine a distribuicao de probabilidade de X e represente-a graficamente. Encontre E(X) e VeX).

3. Seja X urna v.a com R, = {-I, 0, I} com probabilidades: 113, 1/2 e 116, respectivamente.

a) Seja, Y = 3X + 1. Construa a distribuicao de probabilidade de Y; Encontre E(Y).

b) Seja, Z = X2. Construa a distribuicao de probabilidade de Z; Encontre VeZ).

4. Considere 0 lancamento de dois dados. Seja a variavel aleat6ria X = a soma dos pontos obtidos. Determine f(X), FeX) e E(X).

5. Suponha urna moeda onde cara tern tres chances a rnais que coroa. Considere tres lancamentos. Seja X, 0 mimero de caras obtido nos tres lances. Calcule VeX).

6. Urn jogador joga urn dado urna vez, se ocorrer 1, 2 ou 3 ele recebe 0 dobro do numero obtido rnais R$ 1,00. Caso contrario, ele paga 0 triplo do mimero obtido menos R$ 10,00. Calcule 0 ganho esperado do jogador.

7. Urn jogador lanca urn dado nao viciado. Se ocorrer urn numero primo ele ganha este numero em dolares. Mas se ocorrer urn mimero que nao seja primo ele perde este mimero em dolares.

Este jogo e favoravel ao jogador? .

8. Considere 0 lancamento de urn dado nao viciado. Sejam as v.a's: X = 0 dobro do numero obtido; Y = 1 ou 3, conforme ocorra urn n" impar ou par. Encontre 0 desvio padrao de X e de y.

9. Com base na questao 8, considere a funcao Z = H(X + V). Encontre 0 desvio padrao dessa funcao, Determine E(Z) e V(Z).

10. Urna valvula eletronica e posta em urn soquete e testada. Suponha que a probabilidade do teste ser positivo (+) e %. Suponha tambem que urn grande mimero de valvulas esta sendo testado. Os ensaios continuam ate que a primeira positiva apareca. Defini-se a seguinte variavel aleatoria: X = mimero de testes necessaries para concluir 0 experimento. Encontre a distribuicao de probabilidade de X.

Pro/a. MSc. Gllmara Alves Cavalcanti 48

UNIDADE IV: DISTRIBUICOES ESPECIAIS DE PROBABILIDADE

~ DISTRIBUIC;AO BERNOULLI

Considere a realizacao de urn experimento cujo resultado pode ser urn SUCESSO (se acontecer 0 evento de interesse) ou urn FRACASSO (se 0 evento nao.se realizar), isto e, existem somente dois resultados possiveis,

Defini£ao: Seja X uma variavel aleatoria com valores 0 e 1. Entao, a funcao de probabilidade da variavel aleat6ria X, chamada de distribuicdo de Bernoulli e dada por:

P(X = 1) = P (Sucesso)

P(X = 0) = (l-P) (Fracasso)

I I(x) = P(X = x) = px .(1- p)l-x; x=O,1 I

Exemplos:

1. Lancamento de uma moeda;

2. Extracao de uma bola de uma urna contendo M bolas brancas eN bolas pretas;

3. Selecao de urn item de uma caixa contendo itens perfeitos e defeituosos;

Principais Caracteristicas: (a )Media: fleX) = p.

(b) Variancia: a2(X) = p.(I - p) = p.q.

4.1 - DISTRIBUIC;AO BINOMIAL

E uma distribuicao que resulta da soma de variaveis aleatorias binarias. Isto e, 0 experimento binomial e aquele no qual uma sequencia de ensaios de Bernoulli e executada.

Definicao: Seja a variavel aleatoria X 0 numero total de sucessos em n ensaios independentes de Bernoulli. Seja P a probabilidade de sucesso e (I-P) a probabilidade de fracasso. Entao, X e chamada de variavel aleatoria binomial se as seguintes condicoes sao satisfeitas:

( i ) cada ensaio tern somente dois resultados sucesso (S) ou fracasso (F); ( ii ) a probabilidade de sucesso e a mesma em cada ensaio;

( iii) os ensaios sao independentes;

Se X e uma variavel aleatoria binomial em n ensaios de Bernoulli, com probabilidade P de sucesso e (l-P) de fracasso, a funcao de probabilidade da variavel aleat6ria X, chamada de distribuiciio binomial e dada por:

I(x) ~ P(X ~ x) ~ (: Y' .(1- P),,-'; x~O,I, ... .n.

Notas:ao: X ~ Bin (n, P). Exemplos:

1. Lanca-se uma moeda dez vezes. Entao, X e 0 numero de caras observadas;

2. Extraem-se tres bolas de urna urna, com reposicao, contendo quatro bolas brancas e oito bolas pretas. Entao, X e 0 mimero de bolas pretas extraidas;

3. Selecionam-se quatro itens, com reposicao, de urna caixa contendo tres itens defeituosos e sete itens perfeitos. Entao, X e 0 mimero de itens defeituosos extraidos.

Principais Caracteristicas: (a) Media: fleX) = np.

(b) Variancia: a2 (X) = np.(1- p)=n.p.q.

Pro/a. MSc. Gilmara Alves Cavalcanti 49

LISTA DE EXERCicIOS 04 (Binomial)

1. De urn lote contendo vinte itens, dos quais cinco sao defeituosos, quatro itens sao extraidos com reposicao, Qual a probabilidade de se obter: (a) exatamente urn item defeituoso? (b) pelo menos um item defeituoso?

2. Seja a variavel aleatoria X, 0 mimero de caras em quatro lancamentos de uma moeda. Qual a probabilidade de se obter: (a) Exatamente duas caras? (b) Pelo menos uma cara? (c) Mais de umacara?

3. Em uma familia com cinco criancas, qual a probabilidade de que haja exatamente dois meninos, supondo que os sexos sao equiprovaveis.

4. A probabilidade de um menino ser dalt6nico e 8%. Qual e a probabilidade de serern dalt6nicos todos os quatro meninos que se apresentaram, em determinado dia, para um exame oftalrnol6gico?

5. Urn exame e constituido de 100 testes com cinco altemativas, onde apenas uma e correta. Quantos testes acertam, em media, um aluno que nada sabe sobre a materia do exame? Qual e a variancia da distribuicao?

6. Uma moeda e lancada 64 vezes. Determine a media eo desvio padrao do mimero de caras obtidas.

4.2 - DISTRIBUIC;AO DE POISSON

E tambem conhecida como lei dos fenomenos raros, e uma distribuicao de variavel descontinua, utilizada quando a probabilidade de urn acontecimento, embora muito pequena, podera verificarse quando tomamos uma amostra muito grande. E urn caso particular da distribuicao Binomial, onde P e muito pequeno e n e tao grande que a media e uma constante finita e igual a J1 .

Em alguns casos conhece-se 0 numero de sucessos, porem se toma diflcil e, as vezes, sem sentido determinar 0 numero de fracassos ou 0 numero total de provas. Por exemplo,

1. Automoveis que passam em uma esquina = pode-se num determinado intervalo de tempo anotar 0 numero de carros que passaram, porem, 0 mimero de carros que deixaram de passar pela esquina nao podera ser determinado.

2. Numero de emendas nurna fita colante = pode-se determinar quantas emendas existem, porem nao e possivel contar quantas emendas nao ocorreram.

Muitos experimentos consistem na observacao de urn mimero infinito de valores inteiros 0, 1, 2, .... em urn intervalo continuo de tempo ou em uma regiao continua do espaco. A unidade de tempo pode ser urn minuto, uma hora, urn dia, urna semana; e a unidade de espaco pode ser comprimento, area, volume. A distribuicao de Poisson se aplica a experimentos que conduzem a resultados discretos em urn espaco continuo.

Definis-ao: Seja X uma variavel aleatoria de Poisson com valores possiveis 0, 1, 2, ... Entao, a probabilidade, ou funcao de probabilidade da variavel aleatoria X, chamada distribuicdo de Poisson e dada por:

-..c AX

f(x) = P(X = x) = e " ; x=O,I, ... e A, > O. x.

Proia. MSc. Gilmara Alves Cavalcanti 50

onde e = 2,71828 .... e A.. e 0 numero medic de sucessos que ocorrem em um dado intervalo de

tempo ou regiao do espaco, '

Exemplo:

1. 0 numero de mortes por ano, de uma doenca rara, em uma grande cidade;

2. 0 numero de erros de impressao por pagina em um grande volume impresso;

3. 0 mimero de acidentes de autom6vel por mes, em urna grande cidade;

4. 0 numero de defeitos em urn produto manufaturado;

5. 0 numero de chamadas por minuto em uma central telefonica;

6. 0 numero de ratos por acre em uma grande fazenda;

7. 0 mimero de avioes que chegam por hora em um grande aeroporto;

Principais Caracteristicas: (a) Media: f.1 = E(X) = A.. •

(b) Variancia: a2 := E(X2) - [E(X)]2 = A..

Aproximacao pela Binomial:

+np ( )"

A aproximacao: B(x;n,p):: e . np ,e boa se n e bastante grande e p pequeno, e de xl

tal sorte tal que: np s 7. Por exemplo, considere a aproximacao B(2; 1000,0.0001). Temos que np = (1000).(0.0001) = 0.1, entao:

LISTA DE EXERCicIOS 04 (Poisson)

1. Se 0 mimero de chamadas telefonicas que urn operador recebe entre 9:00 e 9:05h segue uma distribuicao de Poisson com A.. = 2, qual e a probabilidade de que 0 operador nao receba nenhuma chamada amanha, no mesmo intervalo?

2. Um livro tern 200 paginas e 200 erros de impressao distribuidos ao acaso. Qual a probabilidade de que uma pagina contenha: (a) Exatamente dois erros? (b) Menos de 2 erros?

3. Urn PBX recebe uma media de 5 chamadas por minuto. Supondo que as chamadas que chegam constituam uma distribuicao de Poisson, obter a probabilidade de que 0 PBX nao receba nenhuma chamada durante urn intervalo de urn minuto.

4. Utilizando os dados do problema anterior, calcule a probabilidade de se obter no maximo 2 chamadas em 4 minutos.

4.3 - DISTRIBUICAO NORMAL

Definicao: Seja X uma variavel aleat6ria continua. A funcao de probabilidade de X, normalmente distribuida e dada por:

onde,

f.1 = media da distribuicao;

o? = variancia da distribuicao;

1! = 3.1416.' ...

exp (e) = 2.71828 ....

Pro/a. MSc. Gilmara Alves Cavalcanti 51

Grafico da Distribuicao Normal:

Notayao: X ~ N (fl ,(]"2)

--------------------______ Z

f.1

Caracteristicas da Distribuiyao Normal:

a) A variavel aleat6ria X pode assumir qualquer valor real;

b) E a mais importante distribuicao de probabilidade, sendo aplicada em inumeros fen6menos e utilizada para 0 desenvolvimento teorico da estatistica;

c) 0 grafico e uma curva em fonna de sino, simetrico em tome da media, u ;

d) A area total sobre a curva vale 1, porque essa area corresponde area corresponde it probabilidade da variavel aleat6ria assumir qualquer valor real;

e) Como a curva e simetrica em tome da media, os valores maiores do que a media e os valores menores do que a media ocorrem com igual probabilidade;

f) A configuracao da curva e dada por dois parametres: fl e (]"2. Se 0 valor de u mudar, a posicao da distribuicao e alterada (figura 1); enquanto que, se 0 valor de (]"2 mudar, altera-se a dispersao da distribuicao (figura 2);

PROBLEMAS para 0 caIculo das probabilidades:

I) Integracao de f(x), pois para 0 calculo e necessario 0 desenvolvimento em series;

2) Elaboracao de urna tabela de probabilidades, pois f(x) depende de dois parametres, f.1 e (]"2, o que acarretaria urn grande trabalho para tabelar essas probabilidades considerando-se as varias combinacoes de fl e (]"2 •

SOLUCAO: transformacao de variaveis (X em Z) => Distribuicao Normal Padrao

Distribuieao Normal Padrio (ou Distribuicao Normal Reduzida): E a distribuicao Normal com media igual a zero e variancia igual a 1, ou seja, Z -N(O, 1).

Definiyao: Se a variavel X possuir uma distribuicao Normal, com media f.1 e desvio padrao a , a variavel Z que efetuara esta reducao e dada pela equacao, Z = ( x: fl ), onde Z - N(O, 1)

Graficamente:

A funcao de probabilidade da variavel Z sera:

Uso da tabela de Distribuiyao Normal Padrao:

o

X

Existem varies tipos de tabelas que of ere cern as areas (probabilidades) sob a curva Normal Padrao, sendo a TABELA DE FAIXA CENTRAL 0 tipo mais freqiiente.

Pro/a. MSc. Gilmara Alves Cavalcanti 52

Fomece a area sob a curva normal padrao entre Z = 0 e qualquer valor positivo de Z, ou seja, P(O:$ Z:$ Zo).

o z, Z

0+ DISTRIBUI(:XO NORMAL E APROXIMAC;XO PELA BINOMIAL

Se a amostra for grande (n grande), a distribuicao Binomial pode ser aproximada a distribuicao Normal. Neste caso, a variavel reduzida sera dada por: Z ~ ( ~ J

Quanto maior for 0 valor de n, melhor sera a aproximacao, Na pratica, se (np> 5) e (nq > 5), dizse que a Binomial aproxima-se da Normal. Graficamente, se n e grande a aparencia da distribuicao Binomial e geralmente a seguinte:

P(x)

···., •• tt ··,· .. •

Observa-se que, a distribuicao Binomial e DISCRETA, enquanto que," a distribuicao Normal e CONTINUA. Diante disso, para que a aproximacao seja feita corretamente e necessario que se faca urna CORREC~O DE CONTINUIDADE (valor X = x da Binomial corresponde 0 intervalo detx - 0,5) e (x + 0,5)).

LISTA DE EXERCicIOS 04 (Normal)

1. Calcule as seguintes probabilidades:

(a) P(O s Z :$ 1)

(b) P(-2,55 :$ Z :$ 1,2)

(e) peZ 2:: 1,93) (d) peZ :$ 1,93)

2. Suponha que a pressao sanguinea em individuos com" idade entre 15 e 25 anos e urna variavel aleat6ria com distribuicao aproximadamente normal de media 120 mmHg e desvio padrao 8 mmHg. Calcule a probabilidade de urn individuo nessa faixa etaria apresentar pressao:

(a) entre 110 e 130 mmHg; (b) maior do que 140 mmHg;

3. A duracao de urn certo cornponente eletronico tern media 850 dias e desvio padrao 45 dias. Calcular a probabilidade desse componente durar:

(a) entre 700 e 1000 dias; (b) mais que 850 dias; (e) menos que 750 dias;

4. Suponha que a quantidade de colesterol em 100 ml de sangue tern distribuicao normal com media 200 mg e desvio padrao 20 mg. Qual a probabilidade de urna pessoa apresentar entre 200 e 225 mg de colesterol por 100 ml de sangue? Qual a probabilidade de uma pessoa apresentar menos de 190 mg de colesterol?

5. As alturas dos alunos da turma de Engenharia sao normalmente distribufdas com media 1,60 e desvio padrao 0,30. Encontre a probabilidade de urn aluno medir:

(a) entre 1,50 me 1,80 m; (e) menos de 1,48 m;

(b) mais de 1,75 m; (d) qual deve ser a medida minima para escolhermos 10% dos mais altos?

Pr~fa. MSc. Gilmara Alves Cavalcanti 53

6. Suponha que 0 tempo medic de permanencia em urn hospital para doencas cronicas seja de 50 dias, com urn desvio padrao de 10 dias. Pressupondo que 0 tempo de permanencia tern distribuicao aproximadamente normal, qual e a probabilidade de urn paeiente permaneeer no

hospital: (a) mais de 30 dias? (b) menos de 30 dias;

7. Suponha que a estatura de recem nascidos do sexo masculino e uma variavel aleat6ria com distribuicao aproximadamente normal de media 50 em e desvio padrao 2,50 em. Caleule a

probabilidade de urn recem nascido ter estatura: (a) inferior a 48 em; (b) superior a 52cm;

8. X e urna variavel aleat6ria continua, tal que X-N(12, 25). Qual a probabilidade de uma

observacao ao acaso: (a) ser menor do que -3; (b) eair entre -1 e IS?

4.4 - DISTRIBUI<;AO QUI-QUADRADO

Trata-se de urn modelo de distribuicao continua muito importante para a teoria da inferencia estatistica. Seja X], X2, •.. , xp, "p" variaveis aleat6rias independentes, normalmente distribuidas, com media zero e variancia 1. Define-se variavel aleatoria com distribuicao qui-quadadro, como:

2 2 2 2

X P = XI + x2 + ... + X P ,

Onde, p e urn parametro da funcao densidade denominado grau de liberdade. Normalmente utiliza-se a letra grega rp para indicar 0 grau de liberdade.

Pode-se demonstrar que:

Conforme 0 rnimero de graus de liberdade (valor do parametro), a curva que descreve a funcao densidade tern determinada forma.

A distribuicao qui-quadrado esta tabelada. A tabela da a abscissa da distribuicao para diversas areas (probabilidades) da cauda a direita. Assim

a

o

Exemplos:

a) Admita rp = 9 e a = 5% situacao:

b) Sendo rp = 25 e a seguinte

a = 2,5%

16,9

X inf

x sup

Pro/a. MSc. Gilmara Alves Cavalcanti 54

Na tabela:

Em (a) Entrando-se na l" coluna com rp = 9, e na l" linha com a = 0,05, encontra-se na intersecao dessa linha e coluna 0 valor 16,9.

Em (b) 0 valor da abscissa a direita, X2 sup: Entrando-se na l" coluna com tp = 25, e na P linha com a = 0,025, encontra-se na intersecao dessa linha e coluna 0 valor 40,6.

Em (b) 0 valor da abscissa it esquerda, X2 inf: Entrando-se na l" coluna com rp = 25, e na P linha com a = 0,975 = (1.000 - 0,025), encontra-se na intersecao dessa linha e coluna 0 valor 13,1.

A distribuicao de X2 (le-se qui-quadrado) e urn caso particular da distribuicao Gama, sendo muito empregada em estatistica Nao-parametrica, urna vez que a estatistica X 2 , utilizada para verificacao do ajuste de modelos probabilfsticos teoricos a urn conjunto de dados observados segue tal distribuicao. A funcao densidade de probabilidade e dada por:

_ 1 (%-1) (-~)

f(x) - (/2) ( r .e 2 v r vl2

Em que: v sao os graus de liberdade e r(n) e a funcao Gama. Para "n" inteiro e positivo, r(n)=(n - I)!

Principais Caracteristicas: (a) Media: JI = E(X) = v.

(b) Variancia: 0"2 = E(X2) - [E(X)f = 2.u

4.5 - DISTRIBUIC;AO T DE STUDENT

Trata-se de urn modelo de distribuicao continua que se assemelha a distribuicao normal padrao, N (0, I). E utilizada para inferencias estatisticas, particularmente, quando se tern amostras com tamanhos inferiores a 30 elementos.

A distribuicao t tambem possui urn parametro denominado grau de liberdade (rp). A media da sua distribuicao e zero, e sua variancia e dada por:

Var[tg>1 = 0-2 (tg» = _L, (rp > 2) rp-2

A distribuicao t e simetrica em relacao a sua media.

Para valores de rp < 30 a distribuicao "t" apresenta maior dispersao que a N (0, 1), ja que 0 desvio padrao, nestes casos, e maior do que 1, que e 0 desvio padrao da distribuicao Normal Padrao.

A distribuicao esta tabelada e a tabela da as abscissas da distribuicao para diversas areas (probabilidades) nas caudas. Trata-se de urna tabela bicaudal.

Admita: rp = 9 e a = 5%

a 12 = 0,025

-2,2622

°

2,2622

Pro/a. MSc. Gilmara Alves Cavalcanti 55

UNIDADE V: TEO RIA DE AMOSTRAGEM

5.1 - INTRODUC;AO AMOSTRAGEM: Eo ato de obter uma amostra (n) de uma populacao (N).

TECNICAS DE AMOSTRAGEM: Sao criterios segundo os quais os elementos da populacao serao seleeionados para a amostra. Existem dois grupos de procedimentos de amostragem: os . probabilfsticos e os nao-probabiltsticos.

AMOSTRAGEM AMOSTRAGEM NAO
PROBABILisTICA PROBABILisTICA
Amostragem Aleatoria Simples Amostragem Intencional
Amostragem Estratificada Amostragem por "Juris"
Amostragem Sistematica Amostragem por Tipicidade
Amostragem por Conglomerados Amostragem por "Quotas" Ao coletarmos uma amostra podemos faze-la com ou sem reposicao, caso a amostragem seja realizada com reposicao, urn mesmo indivfduo tern chance de pertencer mais de uma vez a amostra, 0 que nao acontece no caso da amostragem ser sem reposicao, Independentemente da maneira como a amostra e coletada (com ou sem reposicao) 0 importante e que os individuos que comporao a amostra deverao ser seleeionados atraves de urn processo aleatoric qualquer (sorteio), pois, somente nestas condicoes, podemos apliear os modelos probabilisticos da estatistica a esta amostra, 0 que vai garantir a validade dos testes estatisticos que serao realizados com base nos resultados destas amostras. Os principais tipos de amostragem sao:

• Probabilistica ou Aleatoria: quando todos os individuos da populacao tern probabilidade eonhecida e nao nula de pertencer a amostra.

• Nao Probabilistica, Nao Aleatoria, Escolha Racional ou Escolha Justificada: quando alguns individuos da populacao tern probabilidade desconheeida ou nula de pertencer a amostra.

5.2 - AMOSTRAGEM PROBABILisTICA

-+ AMOSTRAGEM ALEATORIA SIMPLES: Esta tecnica so pode ser aplicada em populacoes homogeneas e de tamanho conhecido. Suponha uma populacao de tamanho "N", da qual se pretende obter uma amostra de tamanho "n" de elementos. Sera possivel, atraves de analise combinatoria, onde temos combinacao de "N" elementos tornados "n" a "n", (C~), obter 0 mimero possivel de amostras simples de tamanho "n". Enurneram-se todos os individuos da populacao e sorteia-se (por meio de urn dispositivo aleatoric qualquer), os individuos que

comporao a amostra. Neste tipo de amostragem podem ser retiradas N" amostras diferentes com reposicao ou C: amostras diferentes sem reposicao.

Exemplo: Suponha urn hospital que trata de 5 tipos de doencas, A, B, C, D, e E. Deseja-se fazer urn estudo em 3 dessas doencas, De quantas maneiras podemos eseolher esses 3 tipos?

a) Solueae Matematica: CJ = 5! = 10 amostras distintas de tamanho 3;

3!(5 - 3)!

b) Solucao Pratica: ABC, ABE, ACE, BCD, BDE, ABE, ACD, ADE, BCE, CDE.

Pro/a. MSc. Gilmara Alves Cavalcanti 56

~ AMOSTRAGEM ESTRA TIFICADA: E uma tecnica utilizada quando a populacao a ser estudada e heterogenea, deste modo, subdivide-se a populacao em estratos (sub-populacoes) que sejam homogeneos dentro de si, e heterogeneos entre si, e aplica-se uma das outras tecnicas de amostragem, para retirar-se sub-amostras dentro de cada estrato, de modo que a amostra final seja representativa da populacao, como urn todo (contenha individuos de todos os estratos). Quanto ao tamanho das sub-amostras retiradas (n.) e classificada em:

1. Uniforrne: quando de K estratos, retiram-se amostras de mesmo tamanho n, independentemente do tamanho do estrato.

2. Proporcional: quando 0 tamanho da amostra retirado em cada estrato (n.) e proporcional ao tamanho do estrato.

Exemplo: Consideremos urn estudo realizado em propriedades rurais de urn municipio, composto por 1000 propriedades rurais, distribuidas, quanto a sua area, conforrne Tabela 01, e que neste municipio sejam amostradas 50 propriedades.

Tabela 01 - Distribuicao do mimero de propriedades rurais de urn municipio qualquer, quanto a area e numero de propriedades a serem amostradas por estrato (classes).

Area (ha)

N° de Propriedades

Amostra Estratificada (N = 50)

Uniforrne Proporcional

01-- 20 201-- 50 501-- 100 1001-- 200 2001-- 400

500 320 100 50 50

10 25

10 16

10 5

10 3

10 1

Total

1000

50 50

-+ AMOSTRAGEM SISTEMATICA: E urna simplificacao da amostragem aleatoria simples (AAS). E aquela que ocorre quando a selecao dos elementos que constituirao a amostra e feita por urn sistema imposto pelo pesquisador. Neste caso, apenas 0 primeiro elemento da amostra sera sorteado, e os demais serao retirados em urna progressao aritmetica, com razao k, em que:

k=N In,

onde, N = tamanho da populacao e n = tamanho da amostra ate se completar 0 tamanho da amostra desejado.

Exemplo: A escolha de 3 elementos, em uma populacao com 5 elementos A, B, C, DeE, podera ser feita supondo a escolha:

a) Os elementos de ordem impar. ABC D E

'--------y--~

ACE

b) Os primeiros elementos:

ABC D E

'--_--y- _ ____J

ABC

c) Os tiltimos elementos:

ABC D E

'-_--y- _ ____J

C D E

0+ AMOSTRAGEM POR CONGLOMERADOS: A amostragem por conglomerados e a amostragem por area. Quando uma populacao apresenta urna subdivisao natural em grupos menores (denominados conglomerados), sorteia-se urn mimero suficiente desses grupos (conglomerados) e todos os elementos destes van compor a amostra. Divide-se a area ocupada pela populacao em partes de estudo, como por exemplo, para uma cidade cada unidade amostral pode ser urn bairro, urna rua, urn quarteirao, urn condominio, etc.

Profa. MSc. Gilmara Alves Cavalcanti 57

5.3 - AMOSTRAGEM NAO-PROBABILisTICA

Esse tipo de amostragem tern como caracteristica a impossibilidade da aplicacao de formulas estatisticas para calcular erros de amostra CErro Amostral: E a diferenca que podera ocorrer quando analisamos os resultados de uma amostra, e 0 que obterlamos se examinassemos toda a populacao ).

-+ AMOSTRAGEM INTENCIONAL: Neste tipo de amostragem 0 pesquisador esta interessado na opiniao de determinados elementos da populacao, mas nao representativos da mesma. 0 pesquisador nao se dirige a massa de pessoas da populacao, e sim a alguem representante dos mesmos. 0 pesquisador escolhe deliberadamente certos elementos da populacao para formar a amostra, baseado num pre-julgamento.

Exemplo: Pesquisa de mere ado para lancar uma nova marca de leite longa vida tipo A. 0 pesquisador selecionara individuos com poder aquisitivo medic/alto, que sao os principais consumidores deste produto (publico alvo), embora toda a populacao independentemente do poder aquisitivo possa ser consumidora deste produto.

-+ AMOSTRAGEM POR "JURIS": Utilizada quando se deseja obter informacoes detalhadas, durante certo espaco de tempo, sobre questoes especificas.

Exemplo: Audiencia de Radio e TV e Orcamento Familiar sao exemplos de pesquisas cuja amostragem pode ser por "Juris". Nesses casos, sao escolhidas pessoas representativas do ponto de vista da classe socio-economicas, pedindo-lhes que preencham re1at6rios ou diaries de despesas.

-+ AMOSTRAGEM POR TIPICIDADE: E quando se utiliza urn subgrupo que seja tipico, em relacao a populacao como urn todo.

Exemplo: Informacoes sobre saude no esporte. Escolhem-se atletas de determinada modalidade esportiva, para obter as informacoes e, generaliza-las.

-+ AMOSTRAGEM POR "QUOTAS": Utilizadas em levantamentos de mercado, previas eleitorais e sondagem de opiniao publica - mesmo dando margem a polemicas, devido as tecnicas probabilisticas. A amostragem por quotas e feita peia fixacao do tamanho da amostra e posteriormente a estratificacao. E facil a posteriori, verificar 0 erro amostral sofrido pelo tamanho da amostra.

Exemplo: Amostrar 80 frangos num galpao com 3000 frangos, amostrar peixes em urn 1 ago , pessoas nurna praca, etc.

Outras consideracoes:

-+ INACESSIBILIDADE A TODA POPULA<;Ao: A amostragem e realizada na parte da populacao que e acessivel.

Exemplo: Controle de qualidade nurna linha de produeao de pecas para motores. S6 tem-se acesso as pecas que ja estao prontas, embora as que ainda serao produzidas fazem parte da populacao de pecas para motores produzidos por aqueia linha de producao,

-+ POPULA<;Ao FORMADA POR MATERIAL CONTINUO: Processo utilizado para se amostrar liquidos, gases ou s6lidos. Homogeniza-se 0 material a ser amostrado e em seguida colhe-se a amostra.

Pro/a. MSc. Giimara Alves Cavalcanti 58

Calculo do Tamanho da Amostra:

PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM ALEATORIA SIMPLES

Sejam:

• N: tamanho da populacao;

• n: tamanho da amostra;

• no: uma primeira aproximacao para 0 tamanho da amostra;

• Eo: erro amostral toleravel;

expressao:

Conhecendo 0 tamanho N da populacao, podemos corrigir 0 calculo anterior por:

Urn primeiro calculo do tamanho da amostra po de ser feito, atraves da seguinte

u»,

n=----=-

N+no

Exemplo: Suponha que a universidade deseja investigar 0 nivel de satisfacao dos alunos quanta aos seus services. Com esse intuito e realizada uma pesquisa de opiniao publica junto aos alunos da instituicao. Para minimizar as despesas uma amostra deve ser extraida da populacao de 3000 alunos. Supondo urn erro amostral de 5%, qual deve ser 0 tamanho da amostra?

• N= 3000

• Eo = 5%

• n=?

1 1 1

n =-= = =400

o £2 (0 05)2 0 0025

0' ,

n = N.no = 3000.(400) = 352,94 == 353 N + no 3000 + 400

PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM ESTRATIFICADA

Estratificar urna populacao e dividi-la em "L" sub-populacoes denominadas estratos, tais que:

nl + n2 + n3 + .... + nl = n,

onde os extratos sao mutuamente exclusivos. Apos a determinacao dos estratos, seleciona-se urna amostra aleatoria de cada sub-populacao, Se as diversas sub-amostras tiveram tamanhos proporcionais ao respectivo nurnero de elementos nos estratos, teremos a estratificacdo proporcionaZ.

Exemplo: Com 0 objetivo de levantar 0 estilo de lideranca preferido por urna escola, vamos realizar urn levantamento por amostragem.

Professores: PI P2 P3 P4 Ps P6 P7 P8 P9 PIO Servidores: S I S2 S3 S4 S5 S6 S7 S8 S9 S 10

Suponha:

../ Preferencia quanto ao estilo de lideranca possa ser homogeneo dentro de cada categoria . ../ A realizacao de urna amostragem aleat6ria estratificada, proporcional por categoria .

../ Obter urna amostra global de tamanho n = 10.

Estratos Proporcao na Populacao Tamanho do Subgrupo na
Amostra
Professores 10/50 = 0,20 (20%) n = (0,20).10 = 2
Servidores 10/50 = 0,20 (20%) n = (0,20).10 = 2
Alunos 30/50 = 0,60 (60%) n = (0,60).10 = 6 Profa. MSc. Gilmara Alves Cavalcanti 59

PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM SISTEMATICA

Seja N a populacao en a amostra. Entao, calcula-se 0 intervalo de amostragem (N/n) ou 0 inteiro mais proximo "a". Sorteia-se, utilizando a tabua dos mimeros aleatorios, urn mimero x entre 1 e "a" formando-se a amostra dos elementos correspondentes aos mimeros:

x; x + a; x + 2.a; ... x + (n - l).a

Exemplo:

Seja,

• N = 500

• n= 50

Entao: 500150 = 10, ou seja, a = 10.

Sorteia-se urn numero de 1 alD. Seja (x = 3) 0 mimero sorteado.

Logo, os elementos nurnerados por: 3, 13,23,33, ..... serao os componentes da amostra.

PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM POR CONGLOMERADOS

1. Dividir em conglomerados a populacao

Conglomerados (Companhias )

2. Selecionar aleatoriamente os conglomerados

3. Pesquisar todos os individuos dos conglomerados selecionados Amostra (trabalhadores das Companhias Selecionadas)

Profa. MSc. Gilmara Alves Cavalcanti 60

Suponha a seguinte situacao:

Populacao: X.

Parametro: () (media, variancia, desvio-padrao, ... ). . Amostra aleatoria simples, com reposicao, de tamanho n. Estatfstica(T): T = f(XI,X2, ... ,xJ ~ to ~ B.

Validade da Resposta ~ Sele-;ao de todas as amostras.

DISTRIBUI<;OES AMOSTRAIS

POPVLA<;AO (X)

AMOSTRAS (n)

o

-Distribuicao Amostral da Estatistica T

(i) Uma populacao X, com certo parametro de interesse;

(ii) Todas as amostras retiradas da populacao, de acordo com certo procedimento (amostragem); (iii) Para cada amostra extraida, calcula-se 0 valor t da estatfstica T;

(iv) Os valores de t formam uma nova populacao, cuja distribuicao recebe 0 nome de distribuicao amostral de T;

-+ DISTRIBUI<;AO AMOSTRAL DA MEDIA

Seja X uma populacao de media f1 e variancia 0'2,da qual se extrai uma amostra aleatoria de "n" elementos, (XI' X2' ••• , Xn)' Sabe-se que a media amostral e dada por, X = 1_.r Xi . Como a n i=I

amostra e aleatoria, cada Xi tem a mesma distribuieao que a populacao. Entao,

E(Xj) = f1 e Var(x;) = CJ2 •

c:i¥' Demonstrayao:

- (1 n J 1 n n 0'2 0'2

~ Var(X)=Var -Lx; =-2 'LVar(Xi)=~'-2-=-

n ,=1 n i=I n n

Pro/a. MSc. Gilmara Alves Cavalcanti 61

Portanto,

x ~ N(/1,a2 1 n) I

z = X - jJ _ N(O, 1) a I';;;

OBS: A variancia com que se dispersam os possiveis valores da estatistica X e n vezes menor que a variancia da populacao de onde a amostra e retirada.

No caso de amostragem sem reposicao de populacoes finitas a independencia entre os valores Xi nao se veri fica, entao:

Exemplo:

- (a2 N -n)

X-N /1,-.--

n N-l

Seja X = {2, 3, 4, 5}. Extrair aleatoriamente, com reposicao, amostras de 2 elementos e determinar:

a) Media e variancia populacionaI; b) Media e variancia da distribuicao amostraI das medias;

Solucao:

b) Numero de amostras possiveis: N n = 42 = 16 amostras.

(2,2) (2,3) (2,4) (2,5) 2,0 2,5 3,0 3,5 X - N(Il, (j2 / n)
(3,2) (3,3) (3,4) (3,5) q 2,5 3,0 3,5 4,0
(4,2) (4,3) (4,4) (4,5) 3,0 3,5 4,0 4,5
(5,2) (5,3) (5,4) (5,5) 3,5 4,0 4,5 5,0 E(X) = jJ(X) = 3,5
Var(X) = a2 1 n = 0,625
X 2.0 2.5 3.0 3.5 4.0 4.5 5.0
P(X) 1116 2/16 3/16 4/16 3116 2/16 1116
n
~ E(X) = LXi'p(x;) = 3,5 e Var(X)=E(X2)-[E(X)f =0,625
i~1 -+ DISTRIBUI<;AO AMOSTRAL DA PROPORC;Ao

Seja X uma populacao infinita epa probabilidade de sucesso de certo evento. Seja (Xl' X2 , ••• , X n) uma amostra aleatoria de tamanho n, e x 0 nUmero de sucessos na amostra.

I

Variavel aleatoria com distribuicao Binomial com media np, e variancia, npq.

Profa. MSc. Gilmara Alves Cavalcanti 62

-+ A distribuicao amostral da proporcao (ou freqnencia relativa - / ou p)~ / = xl n , sera dada

por:

/ - Ni pc pq 1 n)

r:tr Demonstracao:

-+ E(/) = E(X) =!.E(x) = np = p

n n n

-+ Vart f] = var(x) = ~.Var(x) = n~q = pq onde q = (1- p)

n n n n

Se n for grande (n2::30) a distribuicao amostral de/(ou p) sera normal. Sabe-se que, nesses casos, pode-se aproximar a distribuicao Binomial pela distribuicao Normal. Portanto,

I f - N(p,pq In) I

Sendo, Z ~ Jiifn - N(O, 1), a variavel normal padronizada da propo~o. pqln

Exemplo:

Seja X = {Mi, M2, Hi}, onde sueesso e a ocorrencia de uma mulher. Retirar as possfveis amostras de tamanho 2, com reposicao, Determinar:

a) 0 valor de/para cada amostra.

b) A media e a variancia da variavel aleatoriaj,

Solucao:

Sucesso: Ocorrencia de uma mulher -+ p = 2/3 e, consequentemente, q = 113 Calcular: / = x / n = (mimero de mulheres) 1 (tamanho da amostra)

a) 0 valor de/para eada amostra:
Amostras MIMJ MJM2 MJHJ M2MJ M2M2 M2HI HIMJ HJM2 HJHJ
[=x/n 1 1 112 1 1 112 112 112 0
Ji 0 112 1
P(tJ 119 4/9 4/9 Sabe-se que: / ~ N(p,pq 1 n), entao:

E(/) = p=2/3

b) Media e variancia da variavelji;

Var(/)=pq = (2/3).(1/3) =119

n 2

INFERENCIA ESTATiSTICA

ESTIMA<;AO (Pontual e Intervalar)

TESTES DE HIPOTESES (Parametricos e Nao-Parametricos)

Profa. MSc. Gilmara Alves Cavalcanti 63

UNI~ADE VI: TEORIA DE ESTIMACAo

6.1 - INTRODUC;Ao

Usualmente e impraticavel observar toda urna populacao, seja pelo custo carissimo seja por dificuldades diversas. Examina-se entao urna amostra. Se essa amostra for bastante representativa, os resultados obtidos poderao ser generalizados para toda a populacao.

o pesquisador podera levantar hipoteses das possibilidades das generalizacoes dos resultados aos experimentos semelhantes. Devera testar essas hipoteses que poderao ser rejeitadas.

Urn experimento pode ter por finalidade a determinacao da estimativa de urn parametro de urna funcao.

Toda conclusao tirada por uma amostragem, quando generalizada para a populacao, vira acompanhada de urn grau de incerteza ou risco.

Ao conjunto de tecnicas e procedimentos que permitem dar ao pesquisador urn grau de confiabiIidade, de confianca, nas afirmacoes que faz para toda a populacao, baseadas nos resultados das amostras, damos 0 nome de Inferencia Estatistica.

o problema fundamental da Inferencia Estatistica, portanto, e medir 0 grau de incerteza ou risco dessas generalizacoes, Os instrumentos da Inferencia Estatlstica permitem a viabilidade das conclusoes por meio de afirmacoes estatfsticas.

Populacao (N)

Amostra(n)

Inferencia Estatistica

Casos Gerais:

• Verificar 0 sabor de urn bolo;

• Verificar a temperatura da agua de urna piscina;

• A valiar a qualidade de urn Iivro;

Conceitos Importantes:

-+ Populaeao: Eo conjunto de individuos (ou objetos), tendo pelo menos uma variavel cornum observavel (na totalidade).

-+ Amostra: Qualquer subconjunto da populacao.

-+ Amostra Aleat6ria: Seja X urna variavel populacionaL Uma amostra aleatoria e 0 conjunto de n variaveis aleatorias independentes, (xpx2, ••• ,xJ, extraidas de uma populacao, tal que cada

Xi tern a mesma caracteristica, ou distribuicao da variavel X.

-+ Parametro: E a medida usada para descrever uma caracteristica da populaeao,

-+ Estimador (Estatistica): E a medida us ada para descrever urna caracteristica da amostra.

-+ Estimativa: E 0 valor numerico do estimador. Por exernplo, X = 17,8 e uma estimativa da media populacional u ,

Profa. MSc. Gilmara Alves Cavalcanti 64

6.2 - ESTIMA<;AO DE PARAMETROS (POR PONTO E POR INTERV ALO).

Urn dos objetivos basicos da experimentacao e' a estimacao de parametres. Estuda-se uma populacao cuja distribuicao e considerada conhecida por meio de uma funcao densidade de

probabilidade, f'(X; () I. () 2, ... , () p) onde X e uma variavel aleatoria e () i, i = 1,2, .. " p, sao os parametres da distribuicao. Por exemplo,

-+ x ~ N (p ,,,') onde f (x; p ,,,') = ,,1.exp[ - ~ (x : It)' J portanto a distribuicao de X, que e nonnaI, depende de 2 parametres u , 17 2 •

Temos de avaliar urn ou mais parametres da distribuicao populacionaI, tomando por base uma amostra casual simples X" X2, ••.• Xn• 0 principal problema e procurar funcoes de observacoes que fornecam estimativas dos parametres.

A distribuicao dessas funcoes deve estar concentrada 0 mais possivel em tomo dos

"

verdadeiros valores dos parametres de e. Estas funcoes, como ja vimos, sao estimadores: e e

o valor numerico deles, calculados usando as observacoes x., X2, .... x, sao as estimativas dos

"

parametres: e o- Por exemplo,

~ X = _!_ i Xi e urn estimador de Ji e X = X 0' e uma estimativa. n i=!

1 n

~ S2 = ~l L(xi - X)2 e urn estimador de 172 e S2 = 820 e uma estimativa

n i=1

calculada na amostra.

Vimos no capitulo anterior a distribuicao por amostragem de dois estimadores: a media e a proporcao amostral. Lembrando:

Se X - N (Ji ,0'2) entao X - N(Ji,(J'2 / n)

Se pea proporcao com Ji = p e 172 = p.q, entao, p - N(p, pq / n)

TIPOS DE ESTIMACAO ~ Ha dois tipos fundamentais: POR PONTO e POR INTERV ALO.

ESTIMACAO POR PONTO

Na Estimacdo par Ponto, a partir das observacoes, calcula-se uma estimativa, usando 0 estimador ou "estatfstica",

A distribuicao por amostragem dos estimadores toma possivel 0 estudo das qualidades de urn estimador.

QUALIDADES DE UM BOM ESTIMADOR:

Quanto maior 0 grau de concentracao da distribuicao amostral do estimador em tome do verdadeiro valor do parametro pcpulacional, tanto melhor sera 0 estimador. As principais qualidades que deve ter um estimador sao:

a) Consistencia

b) Ausencia de vicio

c) Eficiencia

d) Suficiencia

Profa. MSc. Gilmara Alves Cavalcanti 65

(a) Consisteneia

"-

Definh;ao: Urn estirnador () e consistente para estirnar e, se lim(P 1 e - () I> s) = O. Por

n~ro

exemplo, X e urn estimador consistente para J1 .

(b) Ausencia de Vieio ou Justeza

Definicao: Urn estimador e e nao-viciado, nao-tendencioso, nao viesado ou justo se E( e) = () . Por exemplo, X e urn estimador nao-viciado para J1 pois E(l') = u .

(c) Eflciencia

" "-

Definiryao: Dados dois estimadores () 1 e e 2, definimos eficiencia de urn parametro com relacao

"- '"

a outro, para urn mesmo tamanho de amostra, como Er = Yare () 2)/ Yare () I)' Urn estimador e

"

mais eficiente que outro se sua variancia for menor que a do outro. Por exemplo, se () I e menos

" ..... .....

eficiente que () 2, entao Er < 1. Caso e 1 e mais eficiente que e 2, entao Er > 1.

(d) Suficiencia

"-

Definiryao: Urn estimador e de e e suficiente se contem 0 maximo possfvel de informacoes com relacao ao parametro por ele estimado, em forma bern mais simples de dizer. 0 estimador

" ..........

e de e e suficiente se, para qualquer outro estimador e k, a distribuicao de e k for

independente de e .

Ha criterios para a escolha de estimadores. Por exernplo, 0 Metodo da Maxima Verossimilhanca, 0 Metoda dos Momentos e 0 Metodo de Bayes.

ESTIMACAO PONTUAL: a partir da amostra procura-se obter urn unico valor de certo

+- parametro populacional.

"', Em geral e INSUFICIENTE Exemplo: A media amostral e urn estirnador

pontual da media populacional.

ESTIMACAO INTERV ALAR: a partir da amostra procura-se construir urn intervalo de variacao, Or :::; B :::; 82 , com certa probabilidade de conter 0 verdadeiro parametro populacional.

ESTIMACAO POR INTERVALO

A estimacao por pontos de urn parametro nao possui urna medida do possivel erro cometido na estimacao. Uma maneira de expressar a precisao da estimacao e estabelecer limites, que com certa probabilidade incluam 0 verdadeiro valor do parametro da populacao,

Esses Iimites sao chamados de limites de confianca: determinam urn Intervalo de Confianca, no qual devera estar 0 verdadeiro valor do parametro,

Logo, a estimacao por intervalo consiste na fixacao de dois valores tais que (1 - a ) seja a probabilidade de que 0 intervalo, por eles determinado, contenha 0 verdadeiro valor do parametro,

© a: nivel de significancia (nivel de incerteza ou grau de desconfianca) © (1 - a ): niveI de confianca ou nivel de confiabilidade

Profa. MSc. Gilmara Alves Cavalcanti 66

Logo, a partir de informacao de amostra, devemos calcular os Iimites de urn intervalo, valores criticos, que em (1 - a )% dos casos inclua 0 valor do parametro a estimar e em a % dos casos nao inc1ua 0 valor do parametro.

Assim como as estimacoes pontuais, os intervalos de confianca podem ser vistos como uma tecnica para se fazer inferencia estatistica, Isto e, a partir de urn intervalo de confianca, construido com os elementos amostrais, pode-se inferir sobre urn parametro populacional.

• Fundamenta-se nas distribuicoes amostrais;

• e : Parametro populacional;

~

• e: Estimador de e;

~

• A partir da distribuicao de probabilidade de 8 e possivel construir urn intervalo

~ A

81 ~ 8 ~ B2, que contem 8, e exigir que a probabilidade do intervalo seja de (1- a).

o valor da probabilidade (1- a) que usualmente assume os valores 90%, 95%, 98%, etc., e denominado NivEL DE CONFIANCA, enquanto que, 0 valor a e chamado NivEL DE SIGNIFICANCIA e, representa 0 erro que se esta cometendo quando se afinna que a

probabilidade do intervalo, 01 ~ B ~ 82, conter 0 verdadeiro valor do parametro populacional e (1- a).

© Vantagem: Permite uma ideia da precisao com que foi calculada a estimativa do parametro, pois expressa 0 erro aceito ao calcula-la.

o Intervalo muito pequeno -+ ALTA PRECISAO DA ESTIMATIVA DO PAJUMETRO

8 Quanto menor 0 grau de confianca -+ MENOR PRECISAO DA ESTIMATIVA DO PAJUMETRO

Suponha as seguintes informacoes:

{ ~=25 X=12 S = 1,2

A partir desses dados temos:

IC (95%) = (11,51 < X < 12,49): Amplitude = 0,98 Ie (99%) = (11,31 < X < 12,67): Amplitude = 1,36

6.3 - ESTIMANDO A MEDIA EM GRANDES E PEQUENAS AMOSTRAS.

INTERV ALO DE CONFIANCA PARA A MEDIA

Neste caso, existem 2 metodos para estimativa de f.l atraves do intervalo de confianca; As utilizacoes desses metodos dependem do tamanho da amostra ou do fato de ter ou nao conhecimento do valor do desvio-padrao populacional. Se n ~ 30 e a variancia populacional e conhecida utiliza-se o metodo da distribuicao normal (a variavel sera a "Z"). No entanto, para amostras pequenas (n < 30) e variancia amostral conhecida utiliza-se 0 metodo da distribuicao t-Student (a variavel sera a "t").

Fatores

T

Metodos

Distribuicao Distribuicao

Normal t-Student

Tamanho da amostra Variancia conhecida Variavel utilizada

n ~ 30

n<30

Z

Profa. MSc. Gilmara A/ves Cava/canti 67

CASO 01:

Intervalo de Confianca para a Media Populacional com a Varidncia Populacional Conhecida

Seja X ~ N(j.1;O'2). Sabe-se que 0 estimador de u , X (media amostral), tern distribuicao de probabiIidade dada por:

X ~ N (j.1, (j2 1 n) ; para populacoes infinitas '''aJ

- ( 0'2 N -n)

X ~ N u, ~. -- ,para populacoes finitas

n N-l ,

Entao, Z == X - J.l ~ N(O, 1) O'IJ;;

Normal

Padrao

o

Fixando-se urn nivel de confianca (1- a) tem-se:

( X-Ji )

P -Za/2 ~ O'IJ;; ~Za/2 ==l-a

CAS002:

Intervalo de Confianca para a Media Populacional com a Varidncia Populacional Desconhecida .

• Estimar (F com base na amostra, "s",

• Como "s" e urna v.a a substituicao s6 e verificada para amostras grandes (n;;:::30) -+ s = a.

• "s" e urn estimador viesado para a; mas aurnentando 0 tamanho da amostra 0 vies tende a desaparecer; portanto 0 IC para Ji pode ser construido.

• Quanto menor a amostra mais necessaria se torna a introducao de urna correcao: t (n - I) ao inves de Z.

Sabe-se que, X ~ N(Ji,(F2 1 n) e Z = X 1n ~ N(O; 1). 0'1 n

~ X-j.1

Entao, t n-J = C .

s t-Jn

Distribuicao

t-Student

o

( X-p J

p -tal2 s sl.ffi ~tal2 =I-a

Profa. MSc. Gilmara Alves Cavalcanti 68

Para 0 caso de populacoes finitas:

(- s !fa-n - S !fa-n),

P X-fa12, r' --'5.jJ'5.X+faI2· c· -- =l-a

-s n N-l -in N-l

Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraida de urna populacao normal. Construir urn intervalo de confianca para a media ao niveI de 95%.

Solucao:

Dados: Media amostral: X = 8,7 Desvio-padrao amostral: s = 2 Variavel: t (n -I) = t (9; 5%) = 2,2622

t

-2,2622 °

2,2622

p( 8, 7 - (2,2622).10 "J1'; 8,7 + (2,2622).10 ) = 95% P(7,27 '5. jJ '5.10,13) = 95%

Interpretayao: 0 intervalo [7,27; 1O,13J contem a verdadeira media com 95% de confianca,

INTERVALO DE CONFIANCA PARA A PROPORCAO

Sabe-se que,

f ~ N(p,pq in) , para populacoes infinitas. ~) pq N-n

f ~ N (p, -;;. N _ 1 ) , para populacoes finitas.

Para n ;;:: 30: distribuicao binomial ::::::- normal, entao:

Z == I - p ~ N(O, 1) ,jpqin

°

Fixando-se urn niveI de confianca (1- a) tem-se:

( I-p J

P-Za/2'5. ~::S;ZaI2 =l-a

-ir«!»

Se n ;;:: 30 pode-se substituir p e q por f e (1 - fJ:

( Jf(l- f) JfO- f))

P l-za/2' n ::S;p::S;f+Zal2' n ==l-a

Profa: MSc. Gilmara Alves Cavalcanti 69

6.4 - ESTIMANDO A DIFEREN<;A ENTRE DUAS MEDIAS EM GRANDES E PEQUENAS AMOSTRAS.

INTERVALO DE CONFIANCA PARA A DIFERENCA ENTRE MEDIAS DE DUAS POPULACOES

CASO 01:

Intervalo de Confianca para a Diferenca Entre Medias de Duas Popula~jjes Normals (Varldncias Conhecidas)

Portanto,

E, Z = (X I-X2) - (PI - P2) , para amostras aleat6rias independentes.

0'2 0'2

~l +~2

nl n2

o intervalo de confianca e dado por:

CASO 02:

Intervalo de Confianca para a Diferenca entre Medias de Duas Populacoes Normais de mesma Varliincia Desconhecida

Se XI ~ N(PI' 0'2) e X 2 ~ N(P2' 0'2), e, entao X, e X2 sao independentes. Entao,

Portanto,

Como 0'2 e desconhecida, deve ser estimada por:

2 (nl-l).s;+(n2-l)·si

s =~~~~~~--~

c n, +n, -2

o intervalo de confianca e dado por:

em que os graus de liberdade da variavel t sao dados por: (n, + n2 - 2).

Profa. MSc. Gilmara Alves Cavalcanti 70

Exemplo: Seja Xl ~ N(IlI' 2,89) e X 2 ~ N(1l2' 1,69). Da populacao 1 foi extraida uma amostra de 25 elementos obtendo-se Xl::::: 42, e da populacao 2 foi extraida uma amostra de 16 elementos obtendo-se X2 ::::: 35. Construir 0 IC ao nfvel de confianca de 10% para (PI - 112)'

Solucao:

p(( 42 - 35) - (1,64). 2,89 + 1,69 s III - 112 -:;; (42 - 35) + (1,64). 2,89 + 1,69)::::: 90%

25 16 ,25 16

P(6,22 -:;; PI - 112 ~ 7,78)= 90%

Interpretayao: 0 intervalo [6.22; 7.78] contem 0 verdadeiro valor de (Ill - P2) com 90% de confianca,

LISTA DE EXERCicIOS 06

1. Foram retiradas 25 pecas da producao diaria de uma maquina, encontrando-se para uma medida uma media de 5,2 mm. Sabendo-se que as medidas tern distribuicao normal com desviopadrao populacional l.Z mm, construir IC para a media (90%,95% e 99%).

2. De uma distribuicao normal com (j'2 = 1,96, obteve-se a seguinte amostra: 25,2; 26,0; 26,4; 27,1; 28,2; 28,4. Determinar 0 intervale de confianca para a media da populacao, sendo a = 0,05 e a = 0,10.

3. Suponha que as alturas dos alunos de nossa faculdade tenham distribuicao normal com (J' = 15 cm. Foi retirada uma amostra aleatoria de 100 alunos obtendo-se X = 175 em. Construir, ao nivel de 95% 0 IC para a verdadeira altura media dos alunos.

4. Dados n = 10, X = 110 e S = 10, detenninar os intervalos de confianca para ~ aos niveis de 90% e 95%.

5. Vma amostra aleatoria de 400 domicilios mostra-nos que 25% sao casas de aluguel. Qual e 0 IC da proporcao de casas de aluguel? a = 0,05 .

6. Vma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a agua fluorada. Encontrar os Ie de 90% e 95% para a populacao favoravel a fluoracao.

7. Em 50 lances de uma moeda foram obtidas 30 caras. A partir de urn IC de 96%, pode-se dizer que a moeda e honesta?

Profa. MSc. Gilmara Alves Cavalcanti 71

8. Numa pesquisa de mercado, n = 400 pessoas foram entrevistadas sobre detenninado produto, e 60% destas pessoas preferiram a marca A. Construa urn IC para a proporcao a urn nivel de 95%.

9. Digitadores sao treinados em uma empresa em duas turmas distintas. Na primeira turma (Turma J), utiliza-se urn rnetodo japones de ensino, e na segunda turma (Turma A) utiliza-se urn

metodo alemao. Amostras de cada turma foram escolhidas, onde observou-se s; = 4,1 e

s~ = 4,3. Os dados obtidos estao abaixo. Construir urn IC para a diferenca entre medias, 90%.

J 10

A 15

Tempos (min)

Turma

13 12

9 18

10 14

16 15

13 10 15 12

17 17 15 16

10 17

9 11

10 17

13 14

14

10. Suponha duas populacoes normal mente distribuidas de forma que: X1-(1J.1 ,25) e a populacao II normal, onde, Xr(}.t2,40). Os dados obtidos sao definidos abaixo. Construa urn IC para ().tl -J.l2) ao nivel de 95%.

I 12

II 13

Dados

Populacao

14 17

15 14

14 13

13 16

17 17

14 18

13 16

11. Urn teste psicol6gico destinado a medir a precisao com que uma pessoa julga outras pessoas, foi realizado. As notas possfveis do teste variam de 0 a 4 I. Durante sua elaboracao 0 teste foi aplicado it varies grupos a diferentes de pessoas. De acordo com os resultados observados, construa urn intervalo de confianca para a diferenca entre as medias dos dois grupos a urn nfvel de 10%.

1 2

Homens Mulheres

133 162

25,34 24,94

5,05 5,44

Grupo

Sexo

n

x

s

Profa. MSc. Gilmara Alves Cavalcanti 72

UNIDADE VII: TESTES DE HIPOTESES

Suponha que certa distribuicao dependa de urn parametro () e que nao se conheca () ou, entao, ha razces para acreditar que () variou, seja pelo passar do tempo ou, entao, pela introducao de novas tecnicas na producao, por exemplo.

A Inferencia Estatfstica fornece urn processo de 'analise denominado Teste de Hipoteses, que permite se decidir por urn valor do pararnetro B ou por sua modificacao com um grau de risco conhecido. 0 Teste de Hipotese e urn Processo de Decisiio Estatistica.

Regra de decisao que pennite aceitar ou rejeitar uma hip6tese, decisao esta que e tomada em funcao dos valores amostrais. Em outras palavras, formula-se uma hip6tese quanto ao valor do parametro populacional, e pelos elementos amostrais faz-se urn teste que indicara a rejeicao, ou nao, da hip6tese nula (Ha).

7.1-HIPOTESE ESTATisTICA

rJ7'> HIPOTESE ESTATiSTICA: Suposicao quanto ao valor de umparametro ou quanta a natureza da distribuicao de uma probabilidade de uma variavel populacional.

rJ7'> TIPOS DE HIPOTESES:

Hn: Hipotese Nula. E aquela que sera testada, sendo sempre contraria ao resultado do experimento.

HI: Hipotese Alternativa. E qualquer hip6tese diferente da hipotese nula, sendo sempre a favor do resultado do experimento.

7.2 - ERROS TIPO I Ell

Erro Tipo I (a): P(rejeitar Ho I Ho e verdadeira) Erro Tipo II (P): P(aceitar Ho I Ho e falsa)

Deseja-se: reduzir ao minimo as probabilidades dos

Realidade

Rejeitar Ho

Decisao

Aceitar Ho

Erro Tipo I (a) Decisao Correta (l - P)

Ho e verdadeira Ho e falsa

Decisao Correta (l - a) Erro Tipo II (13)

TAREF A DIFICIL: para uma amostra de tamanho n a probabilidade de se incorrer em urn erro tipo II aumenta a medida que diminui a probabilidade do erro tipo I (vice-versa).

REDU<;AO SIMULTANEA DOSERROS

AUMENTODO TAMANHO DE «n"

7.3 - TESTES UNILATERAIS E BILATERAIS

a) Ho :(}==(}o HI :B::f:.(}o

b) u, :(}=Bo HI :(}<Bo

c) Ho :(}=Bo HI:B >Bo

Pro/a. MSc. Gilmara Alves Cavalcanti 73

vr PROCEDIMENTO PARA CONSTRUC;AO DO TESTE DE HIPOTESE:

1. Enunciar as hipoteses Ho e HI.

2. Fixar 0 limite do erro a , e identificar a variavel do teste.

3. Detenninar as RA e RC para Ro, com 0 auxilio das tabelas estatisticas, considerando a e a variavel do teste.

4. Com os elementos amostrais, calcular 0 valor da variavel do teste.

S. Concluir pela aceitacao ou rejeicao de Ro pela comparacao do valor obtido no 4° passo comRAeRC.

TESTES PARAMETRICOS: a hip6tese e fonnulada com respeito ao valor de urn parametro populacional.

TESTES NAO-PARAMETRICOS: a hipotese e fonnulada com respeito a natureza da distribuicao da populacao.

TESTES PARAMETRICOS

7.4 - TESTES REFERENTES A MEDIAS E PROPOR<;OES -+ TESTE PARA A MEDIA

{fl =f: flo (a)

1. Enunciar as hip6teses: H 0 : II = flo X HI: f.1 < fl 0 (b) fl > flo (c)

2. Fixar 0 nivel de significancia a. Admitindo ()2 desconhecida, a variavel do teste sera t(n-I ).

3. Detenninar RA (Regiao de Aceitacao) e RC (Regiao de Critica ou de Rejeicao) atraves da tabela 1.

X -f.1 4. Calcular a variavel do teste -+ (cal = S /.r;; .

5. Conclusoes:

a)Se -tal2 :::;,tcal :::;,ta12.naosepoderejeitarHo• Se (cal > t a / 2 OU (cal < -(a 12 , rejeita-se Ro.

b) Se t cal > -t a , nao se pode rejeitar Ro.

Se (cal < -(a' rejeita-se Ro.

c) Se t cal < t a , nao se pode rejeitar Ho• Se t: > fa' rejeita-se Ro.

Profa. MSc. Gilmara Alves Cavalcanti 74

Exemplo: Os registros de urn colegio atestam para calouros admitidos uma nota media de 115. Para testar a hip6tese de que a media de uma nova tunna e a mesma, tirou-se ao acaso, uma amostra de 20 notas, obtendo-se media 118 e desvio-padrao 20. Admitir a =5% para efetuar 0 teste.

Solucao:

Dados: I' = 115, n = 20, X == 118, S = 20 e a == 0,05 .

{H :1'=115

1. Enunciar as hip6teses: 0

HI :1' '* 115

3. Determinar RA e RC:

2. a =5%

Variavel: ten_i) == t(I9) -H(19,5%) = 2,093

-2,093

°

2,093

4. Calcular a estatfstica do teste: t = X - fl = 118 -115 == 0,67 . cal S I .In 20 I 50

5. Conclusao: como - 2,093 c:; teal c:; 2,093 nao se pode rejeitar Ho ao nivel de significancia de 5%, ou seja, a media da nova turma e a mesma.

-+ TESTES PARA PROPORCOES

{P* Po (a)

1. Enunciar as hip6teses: n, : P = Po X HI: P < Po (b) p> Po (c)

2. Fixar 0 niveI de significancia a. A variavel escolhida e Z, normal padrao. 3. Determinar RA e RC atraves da tabela da distribuicao normal padrao, Z.

4. Calcular a variavel do teste -+ Z == f - Po

cal I

vpoqo In

5. Conclusoes:

a) Se - Zal2 c:; Zeal s Za12' nao se pode rejeitar Ho.

Se Zeal> Zal2 OU Zeal < -ZaI2' rejeita-se Ho.

b) Se Z cal > - Z a , nso se pode rejeitar Ho· Se Zeal < -Za' rejeita-se Ho.

C) Se Zeal < Za' nao se pode rejeitar Ho.

Se Zeal> Za' rejeita-se Ho.

Profa. Gilmara Alves Cavalcanti 75

Exemplo: As condicoes de mortalidade de uma regiao sao tais que a proporcao de nascidos vivos que sobrevivem ate 60 anos e 0.6. Testar essa hipotese ao nivel de 5% se em 1000 naseimentos amostrados aleatoriamente, verificou-se 530 sobreviventes ate 60 anos.

Solucao:

Dados: Po = 0,6, n = 1000, a = 0,05 e f = 53011000 = 0,53.

{Ho :p=0,6 1. Enunciar as hip6teses:

H, :p:;t:O,6

2. a =5%

Variavel: Z(2,5%) = 1,96

3. Determinar RA e RC:

-1,96

°

1,96

4 C I 1 ,. d Z f - Po 0,53 - 0,60 4 42

. a eu ar a estatistica 0 teste: cal == = = -, .

~Poqo In ~(0,60)(0,40)/l000

5. Conclusao: como - Zeal S; -1,96 rejeita-se Ho ao nivel de significancia de 5%, ou seja, as condicoes de mortalidade da regiao de nascidos vivos que sobrevivem ate 60 anos e diferente de 60%.

-+ TESTE PARA IGUALDADE DE DUAS MEDIAS

CASO 01:

Varitincias Populacionais Conhecidas, lndependentes e Normals.

2. Fixar 0 nivel de significancia a. A variavel escolhida e Z, normal padrao, Portanto,

- - ( a} a;)

(Xl -X2)~N Jil - Ji2'-+-

nl n2

3. Determinar RA e RC atraves da tabela da distribuicao normal padrao, Z.

5. Conclusoes:

a) Se - Zal2 S; Zeal S; Za12' nao se pode rejeitar Ho.

Se Zeal> Zal2 ou Zeal < -Za/2' rejeita-se Ho·

Profa. Gilmara Alves Cavalcanti 76

CAS002:

Varidncias Populacionais Desconhecidas

. . , {Ho :J11 ::::;J12 OU J11 - J12 ==d

1. Enunciar as hipoteses: .

H 0 . J11 *- J12 OU J11 - J12 *- d

2. Fixar 0 niveI de significancia a. A variavel escolhida e t-Student, t(nl+nl-2)'

3. Determinar RA e RC atraves da tabela t.

4. Calcular a variavel do teste:

t - (XI - X2) - (J11 - J12)

cal -

Sc' (nl + n2)

».».

s == (nl -1).SI2 +(n2 -1).si

c

onde

5. Conclusoes:

a) Se - t al2 :$; t cal ::;; tal 2' nao se pode rejeitar Ho.

Se t cal > (a 12 OU t cal < -t a12' rejeita-se Ho·

TESTES NAO-PARAMETRICOS

{Teste de Adequacao do Ajustamento TESTE QUI-QUADRADO

Teste de Associacao

7.5 - TESTE DE AJUSTAMENTO DE DISTRIBUI<;AO TEORICAS -+ TESTE QUI-QUADRADO DE ADEQUA<;AO

Suponha que em uma detenninada amostra de tamanho n, observou-se que urn conjunto de eventos possiveis, E.,E2, ... ,Ek, ocorreram com as freqnencias observadas 01'02, ... ,Ok; e que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem com frequencias esperadas, e I , e 2 , ••• , e k •

Objetivo: verificar de
Eventos E] E2 E3 Ek modo significativo se
Frequencias Observadas °1 °2 °3 Ok as frequencies
Frequencies Esperadas e1 e2 e3 ek o bservadas diferem
das esperadas.
Conceitos Imnortantes: r:JT EVENTO: qualquer ocorrencia associada a urn fenomeno aleat6rio.

r:JT FREQUENCIA OBSERVADA: e a frequencia que se observa atraves da realizacao de urn determinado experimento aleat6rio.

r:JT FREQUENCIA ESPERADA: e a frequencia que se espera que aconteca sem a realizacao de determinado experimento aleatoric.

Profa. Gilmara Alves Cavalcanti 77

Procedimento para a Constru9ao do Teste:

1. Enunciar as hiPoteses:{ Ho: nao ha discrepancias entre as frequencies OJ e ej• HI: ha discrepancies entre as frequencias OJ e ej•

2. Fixar 0 nivel de significancia a. A variavel escolhida e X(~-I)' onde k e 0 numero de eventos.

3. Determinar RA e RC atraves da tabela X 2 •

4. Calcular a variavel do teste:

5. Conclusoes:

a) Se X2 cal < X2 sup, nao se pode rejeitar Ho.

Se X2 cal> X2 sup, rejeita-se Ho.

Exemplo: Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipotese de a moeda ser honesta adotando-se a = 5%.

Solucao:

1. Enunciar as hiPoteses:{Ho: A moeda e honesta

HI: A moeda nao e honesta

2. a =5%.

Variavel: Xfk-l) = X(22) ~ XI~h = 3,84.

Eventos

35 50

65 50

a =5%.

3. Determinar RA e RC atraves da tabela X2.

4. Calcular a variavel do teste

Cara

Coroa

Frequencia Observada Frequencia Esperada

3,84

2 _ (35 - 50)2 + (65 - 50)2 _ 9

Xcal - 50 50-

5. Conclusao: Como X;o/ > 3,84, rejeita-se Ho, concluindo-se corn risco de 5%, que a moeda nao e honesta,

Profa. Gilmara Alves Cavalcanti 78

7.6 - TESTE DE INDEPENDENCIA

~ TESTE QUI-QUADRADO DE ASSOCIAC;AO

• Objetivo: estudar a associacao ou dependencia, entre duas variaveis.

• Tabela de Contingencia: representacao das frequencias observadas. ,

• Calculo das frequencias esperadas tern como base a definicao de v.a independentes.

X e Y independentes: P(Xj, Yj) = P(Xi).P(Yj)

Procedimento para a Construs:ao do Teste:

1. Enunciar as hip6teses:

Ho: as variaveis sao independentes (as variaveis nao estao associadas). HI: as variaveis sao dependentes (as variaveis estao associadas).

2. Fixar 0 nivel de significancia a. A variavel escolhida e XfL-l).(C-l)' onde Leo nurnero de linhas da tabela de contingencia e Ceo mimero de colunas.

3. Determinar RA e RC atraves da tabeia X2 •

4. Calcular a variavel do teste:

onde, eij= ((soma da linha i)(soma da colunaj))/(total de obs.)

5. Conclusoes: Se X2 cal < X2 sup, nao se pode rejeitar Ho.

Se X2 cal> X2 sup, rejeita-se Ho.

Exemplo: Testar ao nivel de 5% se ha discrepancia entre as preferencias por sabor da pasta de dentes e 0 bairro.

da X!I = tf (oij -eij)2

i=t J=l eij

X~I = (70 - 60)2 + ... + (85 - 62,5)2 = 37,88

60 62,5

5. Conclusao: Como X;al > 12,6, rejeita-se Ho, ao niveI de 5%, ou seja, que dependencia entre 0 sabor da pasta

de dentes e 0 bairro. . 79

Sabor da Bairros L
Pasta A B C
Limao 70 44 86 200
Chocolate 50 30 45 125
Hortela 10 06 34 50
Outros 20 20 85 125
L 150 100 250 500
1. Enunciar as hip6teses:
Ho: A preferencia pelo sabor independe do bairro
HI: A preferencia pelo sabor depende do bairro
4. Calcular a variavel do teste: T bId F

E

a e a e requencias spera
Sabor da Bairros
Pasta A B C
Lirnao 60 40 100
Chocolate 37.5 25 62.5
Hortela 15 10 25
Outros 37.5 25 62.5 2. a =5%.

Variavel: XfL-IHC-t) = X(~) ~ X(~" = 12,6

3. Determinar RA e RC atraves da tabela X2 :

12,6

LISTA DE EXERCicIOS 07

1. Uma amostra de 25 elementos resultou media 13,5 com desvio-padrao 4,4. Efetuar 0 teste ao nivel de 0,05 para a hip6tese que !-l *' 16; e !-l < 16.

2. Urn fabricante de pneus faz dois tipos. Para 0 tipo A, cr:::: 2500 milhas, e para 0 tipo B, cr:::: 3000 milhas. Urn taxi testou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 milhas e 26000 miIhas de duracao media dos respectivos tipos. Adotando-se urn risco de 4%, testar a

hip6tese de que a vida media dos dois tipos de pneus e a mesma. ~

3. Dois tipos de tinta foram testados sob as mesmas condicoes meteoroI6gieas. 0 tipo A registrou urna media de 80 em com urn desvio de 5 em 5 partes. 0 tipo B, urna media de 83 em com urn desvio de 4 em 6 partes. Adotando urn nivel de 5%, testar a hip6tese de igualdade de medias.

4. Uma pesquisa revelou que das 500 donas de easa consultadas, 300 preferiram 0 detergente A. Testar a hip6tese ao nivel de 0,04 para H, : p:::: 0,5 contra HI : p:j:. 0,5.

5. Sabe-se por experiencia que 5% da producao de urn detenninado artigo e defeituosa. Urn novo empregado e contratado, Ele produz 600 pecas do artigo com 82 defeituosas. Ao nivel de 10%, verificar se 0 novo empregado produz pecas com maior Indice de defeitos que 0 existente.

6. De duas populacoes normais X. e X2 com variancias 25, levantaram-se duas amostras de

n n

tamanhos ill = 9 e il2 = 16, obtendo-se: LXii = 27 e I X2i = 32. Ao nivel de 20% testar se ha

,=1 i=1

diferenca entre as medias das duas populacoes,

7. Urn supennercado nao sabe se deve comprar lampadas da marca A ou B, de mesmo preco. Testa urna amostra de 100 lampadas de cada urna das marcas, obtendo: XA =1160 h, X B =1140 h, SA = 90 h e S8 :::: 80 h. Ao nivel de 2,5% testar a hip6tese de que as marcas sao igualmente boas contra a hip6tese de que as da marca A sao melhores que as da marca B.

8. No congresso Americano grupos de Democratas e Republicanos votaram em urn projeto de interesse nacionaI como esta na tabela abaixo. Ao nivel de 5%, testar a hip6tese de nao haver diferenca entre os dois partidos, com relacao a esse projeto.

Votos A Favor Contra 'Indecisos Total
Partido
Democratas 85 78 37 200
Republicanos 118 61 25 204
Total 203 139 62 404 9. Deseja-se saber se 0 fato de urna pessoa ficar resfriada esta relacionado ao fato de tomar certa vacina. Para isso levantou-se uma amostra casual de 100 individuos obtendo-se:

Ficar resfriado Resfriado Nao Resfriado
Ser vacinado
Vacinado 15 20
Nso vacinado 25 40 Ao nivel de 5%, testar as hip6teses de independencia entre: ser vacinado e ficar resfriado.

Profa. Gilmara Alves Cavalcanti 80

UNIDADE VIII: CORRELACAO E REGRESSAO LINEAR SIMPLES

Existem situacoes nas quais interessa estudar 0 comportamento conjunto de duas variaveis. Por exemplo, dados de peso e altura de pessoas. Pode haver interesse em estabelecer em que medida aumenta 0 peso, quando a altura aumenta. 0 comportamento conjunto de duas variaveis quantitativas pode ser observado graficamente atraves do Diagrama de Dispersiio, e nurnericamente atraves do Coeficiente de Correlacno.

- 0 termo CORRELA(:,AO significa ate que ponto duas variaveis estao correlacionadas entre si.

8.1 - DIAGRAMA DE DISPERSAo

o diagrama de dispersao e urn dispositivo grafico utilizado para verificar 0 grau de associacao, correlacao ou dependencia entre duas variaveis.

Procedimento:

1) Tracar 0 sistema de eixos cartesianos;

2) Representar uma variavel no eixo X e a outra no eixo Y;

3) Colocar os valores das variaveis sobre os eixos e marcar um ponto para cada par de valores;

~ Graficamente a correlacao pode ser classificada em tres tipos:

Correlaeao Positiva

Correlaeao Negativa

Correlacao Nula

Y

Y

Y

X

• Correladio Positiva: as variaveis X e Y crescem no mesmo sentido.

• Correlacdo Negativa: as variaveis X e Y variam em sentidos contraries, ou seja, quando X cresce, Y em media decresce.

• Correladio Nula: ausencia de correlacao.

OBS: Correlacao positiva entre duas variaveis mostra apenas que essas variaveis crescem no mesmo sentido, Nao indica que aumentos sucessivos e~ X causam aumentos sucessivos em Y.

Pro/a. MSc. Gilmara Alves Cavalcanti 81

8.2 - COEFICIENTE DE CORRELA«;Ao

Mede 0 grau de correlacao entre duas variaveis,



Corr (X, Y) = I ~ X e Y tern correlacao perfeita positiva;

Corr (X,Y) = ° ~ X e Y tern correlacao nula, sao independentes; Corr (X,Y) = -1 ~ X e Y tern correlacao perfeita negativa;





OBS: A correlacao e mais forte quanto mais pr6xima for de - 1 ou de 1, nesse caso, os pontos se aproximam ainda mais de uma reta.

Indice de Correlaeao Analise
0,75 s Corr (X, Y) s 1 Correlacao Forte
0,50 s Corr (X, Y) s 0,75 Correlacao Media
I Corr (X, Y) I < 0,5 Correlacao Fraca
Corr (X, Y) = 0 Ausencia Correlacao
Corr (X, Y) > 0 Correlacao Direta ou Positiva
Corr (X, Y) < 0 Correlacao Inversa ou Negativa
Corr (X, Y) = ± 1 Correlacao Perfeita COEFICIENTE DE DETERMINA«;Ao (CD): Diz ate que ponto a variacao de Y e exp1icada pela variacao de X.

CD(X, Y) = [ Corr(X, Y) f

8.3 - REGRESSAO LINEAR SIMPLES

Muitas vezes estamos interessados em estudar 0 comportamento conjunto de duas variaveis, como visto anteriormente. Em outras situacoes, ha interesse em estudar como uma variavel varia em funcao da outra. Por exemplo, considere a questao de idade e peso das criancas. Normalmente existe 0 interesse em estudar como 0 peso varia em funcao da idade.

Quando se estuda a variacao de uma variavel Y em funcao de uma variavel X, diz-se que Yea variavel dependente (ou resposta) e que X e a variavel independente (ou explanat6ria). No caso do exemplo, sabe-se que 0 peso das criancas varia em funcao da idade. Entao, peso e a variavel dependente e idade e a variavel explanatoria.

Muitas vezes a posicao dos pontos no diagrama de dispersao sugere a existencia de uma relacao funcionaI entre duas variaveis. Surge entao 0 problema de determinar uma funcao que exprima esse re1acionamento. A analise de regressao tern por objetivo descrever atraves de urn modelo matematico, a relacao existente entre duas variaveis, a partir de n observacoes dessas variaveis.

Pro/a. MSc. Gilmara Alves Cavalcanti 82

Reta de Regressao: Para ajustar uma reta de regressao linear simples aos dados e preciso obter os coeficientes angular e linear da reta.

.:. Coejiciente Angular (b) - da a inclinacao da reta:

LXY ~[iLX~L»]

b = -----=----:----:-:--=

IX2 _ (IXY

n

.:. Coejiciente Linear (a) - e a ordenada do ponto em que a reta corta 0 eixo das ordenadas.

a == Y -bX

Reta de Regresslio: I Y = a + hX I

A

A equacao da reta de regressao permite calcular os valores de Y para quaisquer valores de X

dentro do intervalo estudado, mesmo que esses valores nao existam na amostra (PREVISAO).

Escolha da Variavel Explanat6ria: Quando os valores de X sao fixados a priori ajusta-se a regressao de Y contra X. Mas nem sempre os valores de X sao fixados a priori. Entao, pode-se ajustar a regressao de Y contra X, como a regressao de X contra Y. Para escolher entre as duas regressoes, e razoavel identificar a variavel que deve ser prevista, conhecido 0 valor da outra variavel. Ajusta-se a regressao de Y contra X toda vez que se pretende estudar a variacao de Y (prever Y), em funcllo da variacao de X.

OBSERV AyOES:

• As equacoes de regressao podem ser uteis quando usadas para predizer 0 valor de uma variavel, dado urn valor determinado da outra variavel;

• S6 devemos utilizar a equacao da reta de regressao se r indica a existencia de uma correlaeao linear significativa;

• Os dados amostrais emparelhados podem conter urn ou mais pontos de influencia (outliers), os quais afetam fortemente 0 grafico da reta de regressao;

Exemplo 01: Numero de anos de atendimento ao publico e mimero de c1ientes de 5 Empresas de Seguro de Autom6veis.

Anos de Atendimento (X)

8

72

Numero de Clientes (Y)

x y X.Y X2 Y~
2 48 96 4 2304
4 56 224 16 3136
5 64 320 25 4096
6 60 360 36 3600
8 72 576 64 5184
25 300 1576 145 18320 .. 80, c I

~ 60.i

o I

.g 40 ~

~ 0 \ i :ii 20 !

E 1

~ .

z 0 +--~-~----.-~- ~-------. ..------~-----



Diagrama de Dispersao (X,V)









. 0

2

4

6

8

Anos de Atendimento

Profa. MSc. Gilmara Alves Cavalcanti 83

Diagrama de Dispersao: Correlacao positiva entre as variaveis X e y.

Coeficiente de Correlacao: Correlacao forte.

Coeficiente de Determinacao:

CD(X,Y)= [CorreX,y)]2 = (O,95i = 0,9025 = 90,25%

Reta de Regressao:

a = Y - bX=60-(3,8).(5)=41

Y = a + bX = 41 + e3,8 ).X

Previsoes:

Se, X = 7 entao, Y = 67,6 Se, X = 10 entao, Y = 79

Conclusoes:

A partir dos resultados observados conclui-se que:

.;' As variaveis em estudo, anos de atendimento ao publico e numero de cIientes das 5 Empresas de Seguro de Automoveis, apresentam correlacao forte e positiva entre si. Portanto, ambas crescem no mesmo sentido, ou seja, 0 aumento no numero de anos de atendimento esta correlacionado com 0 aumento no numero de clientes .

.;' 90,25% da variabilidade ocorrida quanto ao numero de c1ientes e devida a variabilidade decorrida dos anos de atendimento .

.;' Estima-se que em 7 anos de atendimento, as 5 empresas atenderam a aproximadamente 68 cIientes, ao passo que, para 10 anos de atendimento e possivel prever que essa estimativa passe a ser de 79 clientes.

Profa. MSc. Gilmara Alves Cavalcanti 84

Nos exercicios a seguir verifique 0 cornportamento eonjunto das variaveis, de forma grafica e numerica e ajuste a reta de regressao, Para alcancar esse objetivo determine as medidas abaixo e analise os resultados eneontrados.

v' Diagrama de Dispersao;

v' Coefieiente de Correlacao;

./ Coeficiente de Determinacao; ./ Ajuste da Reta de Regressao; v' Previsoes;

Exercicio 01:

P

, id

d 1 'b I h iti

t

eso seeo e peso unu o~ em gramas, ego u os epa ICOS em ra os.
Peso Seeo (X) Peso Urnido (Y)
2,0 6,7
2,2 7,7
2,0 6,5
2,2 7,4
1,9 6,1
2,3 7,4
Exercicio 02:

Quantidade de procaina hidrolisada, ern 10 moles/litro, no sangue, em funcao do tempo decorrido ap6s sua administracao

Tempo (min) Quantidade hidrolisada
2 3,5
3 5,7
5 9,9
8 16,3
10 19,3
12 25,7
14 28,2
15 32,6
Proja. MSc. Gilmara Alves Cavalcanti 85