Você está na página 1de 69

APOSTILA DE ESTATÍSTICA

Profª. Drª. Natália Castelo Branco


2019
SUMÁRIO

AULA 1: A CIÊNCIA ESTATÍSTICA, SEUS CONCEITOS E USOS ................. 3


AULA 2: TIPOS DE PESQUISAS E TIPOS DE VARIÁVEIS ............................ 8
AULA 3: TÉCNICAS DE AMOSTRAGEM E TIPOS DE AMOSTRAS ............ 13
AULA 4 : TAMANHO DA AMOSTRA E ERRO AMOSTRAL .......................... 21
AULA 5: ORGANIZAÇÃO DE DADOS E REPRESENTAÇÕES GRÁFICAS . 29
AULA 6: MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE DISPERSÃO
......................................................................................................................... 36
AULA 7: INTRODUÇÃO A PROBABILIDADE................................................ 42
AULA 8: PROBABILIDADE – OPERAÇÕES BÁSICAS ................................ 49
AULA 9: DISTRIBUIÇÃO BINOMIAL .............................................................. 59
AULA 10: DISTRIBUIÇÃO NORMAL .............................................................. 64

DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 1: A CIÊNCIA ESTATÍSTICA, SEUS CONCEITOS E USOS

O que é estatística?

A estatística é uma parte da matemática que fornece métodos para a coleta,


organização, descrição, análise e interpretação dos dados, viabilizando a
utilização dos mesmos nas tomadas de decisão.
A Estatística é considerada como Ciência no sentido do estudo de uma
população. Com as outras Ciências mantém a relação de complemento,
quando utilizada como instrumento de pesquisa.

Qual a sua utilidade?

A Estatística preocupa-se com o processo de descobrir sobre o mundo real e


como ele opera frente às variações e incertezas, coletando e dando sentido
aos dados. A Estatística é um instrumento fornecedor de informações que
subsidiarão a tomada de decisões, baseadas em fatos e dados.

Três tipos fundamentais de investigação estatística (métodos diferentes


de coletar dados):

 Pesquisas;
 Experimentos e
 Estudos Observacionais

 Pesquisas: Uma pesquisa é, em geral, usada para determinar os pontos


de vista de um grupo bem definido de pessoas.
 Experimentos: processo que permite a coleta de observações sob
determinadas condições impostas pelo pesquisador visando conhecer o
efeito de um ou mais fatores; determina quais sujeitos (unidades
experimentais) recebem quais tratamentos (idealmente usando forma de
alocação aleatória).

3
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
 Estudos Observacionais: simplesmente comparamos os sujeitos que
tenham recebido cada um dos tratamentos. Muitas vezes úteis para
identificar as possíveis causas dos efeitos, mas, não podem estabelecer
confiavelmente causação. Apenas experimentos apropriadamente
desenhados e executados podem confiavelmente demonstrar causação.

Primeiros Conceitos:
População ou Universo É o conjunto de elementos para os
quais desejamos que as nossas
conclusões sejam válidas – o universo
de nosso estudo.
População finita É aquela em que é possível enumerar
todos os seus elementos.
População infinita É aquela em que não é possível
enumerar todos os seus elementos.
Censo Estudo através de todos os elementos
da população.
Amostragem É o processo através do qual é
selecionada uma amostra de uma
população. Nesta etapa define-se
quais unidades populacionais irão
fazer parte da amostra.
Amostra É uma parte desta população, ou
seja, um subconjunto não vazio de
uma população.
Obs.: Quanto maior a amostra mais precisos e confiáveis serão os resultados.

A pesquisa estatística pode ser feita através de dois processos:

 CENSO
 Grande população
 Resultado exato
4
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
 População finita

 AMOSTRA
 Economia de tempo
 Economia de custos
 População infinita ou muito grande

Apesar do processo amostral apresentar estas vantagens sobre o processo


censitário ele acaba perdendo em precisão, pois é estudado apenas um
subconjunto da população. Nesse caso todo resultado de amostra está sujeito
a um erro amostral, o que não ocorre no censo, porém este custa mais caro,
leva mais tempo e dá mais trabalho, principalmente quando a população é
muito grande.

PESQUISAS: Levantamento de dados acerca da(s) característica(s) de


interesse de uma determinada população.

Exemplo: Uma pesquisa sobre idade e sexo dos estudantes universitários


existentes no Estado de São Paulo.
Quem faz parte desta população?
1 - Os estudantes que, no momento atual, realizam estudos universitários?
2 – Devemos incluir também os que já foram estudantes universitários?
3 – Os que estão se formando?
4 - Os que acabaram de passar no vestibular?
5 – Os que estão trancados?

Outros Conceitos:

Variáveis Características da população e/ou


amostra que podem ser observadas
ou medidas em cada elemento da
população.

5
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Casos Elementos observados na população
Parâmetro Uma característica numérica
estabelecida para toda uma
população.
Estimador Uma característica numérica
estabelecida para uma amostra.
Estimativa O valor numérico assumido pelo
estimador numa determinada
amostra.

Por exemplo: no fenômeno coletivo eleição para prefeito do município de João


Pessoa, a população é o conjunto de todos os eleitores habilitados na
respectiva cidade. Um parâmetro é a proporção de votos do candidato A. Uma
amostra pode ser um grupo de 1.000 eleitores selecionados em todo o
município. Um estimador é a proporção de votos do candidato A obtida na
amostra. O valor resultante do estimador, a proporção amostral, é a
estimativa.

Desta forma, a Estatística pode ser dividida em duas grandes áreas: Descritiva
e Inferencial:
I) ESTATÍSTICA DESCRITIVA - é a parte da Estatística que tem por objetivo
descrever os dados observados. São atribuições da Estatística Descritiva:
a) A organização dos dados.
b) A redução dos dados.
c) A representação dos dados.
d) A obtenção de algumas informações que auxiliam a descrição do fenômeno
observado.

• A organização dos dados consiste na ordenação e crítica quanto à correção


dos valores observados, falhas humanas, omissões, abandono de dados
duvidosos, etc.

6
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
• Redução dos dados - O entendimento e compreensão de grande quantidade
de dados através de simples leitura de seus valores individuais é uma tarefa
extremamente árdua e difícil mesmo para o mais experimentado pesquisador,
portanto deveremos tabular os dados.
• A representação dos dados - Os dados estatísticos podem ser mais
facilmente compreendidos quando apresentados através de uma
representação gráfica, a qual permite uma visualização instantânea de todos os
dados. Os gráficos quando bem representativos, tornam-se importantes
instrumentos de trabalho.
• A obtenção de algumas informações que sumarizam os dados, facilitando a
descrição dos fenômenos observados.

II) ESTATÍSTICA INFERENCIAL (ou Indutiva) - é a parte da Estatística que tem


por objetivo obter e generalizar conclusões para a população a partir de uma
amostra. Complementando o processamento estatístico, no caso de uma
estimação, a Estatística Indutiva estuda os parâmetros a partir do uso de
estimadores usando o cálculo das probabilidades, elemento este que
viabiliza a inferência estatística. Em resumo, um estudo estatístico completo
que recorra às técnicas de Estatística Inferencial irá envolver também, direta ou
indiretamente, tópicos de Estatística Descritiva, Cálculo das Probabilidades e
Amostragem.

Exercício: Cite exemplos de pesquisas (reais ou fictícias) aplicando os


conceitos apresentados acima na sua formulação.

7
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 2: TIPOS DE PESQUISAS E TIPOS DE VARIÁVEIS

Pesquisas: Uma pesquisa é, em geral, usada para determinar os pontos de


vista de um grupo bem definido de pessoas.

TIPOS DE PESQUISAS

Pesquisa Qualitativa - As pesquisas qualitativas têm caráter exploratório:


estimulam os entrevistados a pensar e falar livremente sobre algum tema,
objeto ou conceito. Elas fazem emergir aspectos subjetivos, atingem
motivações não explicitas, ou mesmo não conscientes, de forma espontânea. É
normalmente utilizada quando não se conhece muito bem o universo a ser
estudado. Neste tipo de pesquisa observa-se detalhadamente um pequeno
número de elementos, sem uma formulação criteriosa das características a
serem levantadas. Neste tipo de pesquisa não se costuma aplicar métodos
estatísticos e, por isto, não a abordaremos neste curso.

Pesquisas Quantitativas - As pesquisas quantitativas são mais adequadas


para apurar opiniões e atitudes explicitas e conscientes dos entrevistados, pois
utilizam instrumentos padronizados (questionários, formulários, fichas, etc.).
São utilizados quando se sabe exatamente o que deve ser perguntado para
atingir os objetivos da pesquisa. Permitem que se realizem projeções para a
população representada. Elas testam, de forma precisa, as hipóteses
levantadas para a pesquisa e fornecem índices que podem ser comparados
com outros. Características de interesse de uma população são levantadas
(observadas ou medidas), mas sem manipulação. Nesse tipo de pesquisa
observam-se diversas características dos elementos de uma certa população.
A observação é feita naturalmente e sem interferência do pesquisador.
Também chamadas de “levantamento” ou “survey”.

8
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
TIPOS DE VARIÁVEIS

Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com


grande quantidade de valores numéricos resultantes de um censo ou de uma
amostragem. Estes valores numéricos são chamados dados estatísticos.
As informações ou dados característicos dos fenômenos ou populações são
denominados variáveis estatísticas ou simplesmente variáveis. Conforme
suas características particulares podem ser classificadas como: Quantitativas
e Qualitativas.

Em geral, uma mesma população pode ser caracterizada por mais de um tipo
de variável. Assim os inscritos num vestibular, por exemplo, podem ser
contados, medidos ou pesados, podem ser agrupados segundo o sexo ou área
de estudo e podem ainda ser classificados segundo as notas obtidas nas
provas prestadas.

O objetivo de estudarmos os níveis de mensuração das variáveis estatísticas


consiste em determinar a complexidade da análise das variáveis
(características de interesse) envolvidas no estudo de uma população ou de
uma amostra. As pessoas de uma comunidade podem ser estudadas sob
diversos ângulos. Por exemplo, podem ser classificadas quanto ao SEXO
(masculino/feminino), quanto à ESTATURA (baixa/média/alta), quanto à
RENDA (pobres/ricas) etc. SEXO, ESTATURA, RENDA são variáveis, isto é,
são características às quais podemos associar conceitos ou números e assim
expressar, de certa maneira, informações sob a forma de medidas.

QUALITATIVAS: São aquelas que resultam de uma classificação por tipo ou


atributo. Ex: Cor dos olhos (prestos, castanhos, azuis, etc); causa mortis
(moléstias cardiovasculares, cânceres, moléstias do aparelho digestivo, etc);
sexo (masculino ou feminino). Nem sempre os elementos de uma população
são exclusivamente contáveis. Muitas vezes, eles podem ser qualificados

9
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
também segundo algumas de suas características típicas. Nesses casos, as
variáveis podem ser agrupadas em nominais ou ordinais (por postos).

Nominais - quando puderem ser reunidas em categorias ou espécies com


idênticos tipos ou atributos. Aqui se incluem os agrupamentos por sexo, área
de estudo, desempenho, cor, raça, nacionalidade e religião. É o nível de
mensuração mais baixo, mais rudimentar possível.

Exemplos:
a) População: moradores de um cidade
Variável: cor dos olhos (pretos, castanhos, azuis, etc.)
b) População: funcionários da empresa X
Variável: sexo (masculino, feminino)

Ordinais (ordenação ou por posto) - quando os elementos forem reunidos


segundo a ordem em que aparecem dispostos numa lista ou rol. São típicas
desta forma de agrupamento, as listas classificatórias de concursos e as
tabelas de campeonatos.

Exemplos:
c) População: estudantes de uma escola de 2o. grau
Variável: grau de escolaridade (1a. série, 2a. série, 3a. série)
d) População: pessoas adultas economicamente ativas
Variável: renda (baixa, média, alta)

QUANTITATIVAS - São aquelas que podem ser expressas em termos


numéricos. Ex: Número de filhos, renda, tempo de resposta de um sistema. Em
geral, são as resultantes de medições, enumerações ou contagens. São
subdivididas em contínuas e discretas. conforme abaixo.

Contínuas - são aquelas que podem assumir qualquer valor num certo
intervalo de medida, podendo ser associados ao conjunto dos números reais,

10
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
ou seja, seus valores possíveis formam um conjunto não enumerável. Entre
outras, enquadram-se nesta categoria as medidas de tempo, comprimento,
espessura, área, volume, peso e velocidade.

Exemplos:
Ex: Idade, Peso Líquido, Diâmetro externo, Índice de liquidez.
g) População: peças produzidas por uma máquina
Variável: diâmetro externo (p. ex., 0,96 cm)
h) População: estudantes de uma escola
Variável: tempo de estudo diário em certa disciplina (p. ex., 2,30 h)

Discretas (ou descontínuas) - quando só podem assumir determinados


valores num certo intervalo, podendo ser associadas ao conjunto dos números
inteiros, ou seja, seus possíveis valores formam um conjunto finito ou
enumerável. Em geral, representam números inteiros resultantes do processo
de contagem, como o número de alunos por sala, de créditos por disciplinas,
de pacientes atendidos diariamente num hospital, etc.

Exemplos:
Ex: Número de filhos, pontos obtidos em cada jogada, número de defeitos por
unidade.

De modo geral, as medições dão origem as variáveis contínuas e as


contagens ou enumerações, as variáveis discretas. Designamos estas
variáveis por letras latinas, em geral, as últimas: X, Y, Z. Muitas características
podem ser mensuradas de várias formas, e nem sempre, fica evidente qual
delas é a mais apropriada.

Exemplo: Nível de satisfação de um funcionário com a política de trabalho da


empresa.
a) Em termos do trabalho que você exerce na empresa, você se sente:
1 – Muito Satisfeito 2 – Pouco satisfeito 3 – Insatisfeito

11
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
b) Dê uma nota de 0 (zero) a 10 (dez), relativa ao seu grau de satisfação
com o trabalho que você exerce na empresa. Nota _____.

12
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 3: TÉCNICAS DE AMOSTRAGEM E TIPOS DE AMOSTRAS

Na maioria das vezes, não é conveniente, ou mesmo possível realizar o


levantamento dos dados referentes a todos os elementos de uma população.
Portanto, analisamos parte da população, isto é amostramos.

AMOSTRA: É uma parte da população, ou seja, um subconjunto não vazio ou


parte da população. Duas considerações devem ser feitas sobre o estudo
amostral dos fenômenos. Uma diz respeito aos cuidados que se deve tomar
para assegurar que a amostra seja representativa da população. Para atender
a essa exigência, deve-se selecionar os elementos de forma aleatória, de modo
que todo e qualquer elemento da população tenha a mesma chance de
participar da amostra. A outra exigência diz respeito à precisão dos dados
coletados, buscando minimizar os erros que poderiam induzir a conclusões
equivocadas. O número de elementos de uma amostra é chamado o tamanho
da amostra, e denotado por n. Vantagens de uma amostra: É barata - É rápida
- É atualizada - É sempre viável.

AMOSTRAGEM: Processo de seleção de uma amostra.

ESTIMATIVA: Valor calculado com base na amostra, e usado com a finalidade


de avaliar aproximadamente um parâmetro.

13
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
TÉCNICAS DE AMOSTRAGEM

AMOSTRAGEM PROBABILÍSTICA E NÃO PROBABILISTICA

Distinguiremos dois tipos de amostragem: a probabilística e a não


probabilística. A amostragem será probabilística se todos os elementos da
população tiverem probabilidade conhecida, e diferente de zero, de pertencer à
amostra. Nesse caso este tipo de amostragem é o que dá a melhor garantia de
representatividade da amostra em relação à população. Segundo essa
definição, a amostragem probabilística implica em um sorteio com regras bem
determinadas, cuja realização só será possível se a população for finita e
totalmente acessível.

Caso contrário, a amostragem será não probabilística, ou seja, quando a


seleção é subjetiva, a escolha dos elementos da amostra é feita de forma não
aleatória, justificadamente ou não. A chance que cada elemento tem de ser
selecionado na amostra e desconhecida. Decorre disso que as probabilidades
de serem identificadas características semelhantes da amostra e da população
são pequenas ou inconsistentes.

A utilização de uma amostragem probabilística é a melhor recomendação que


se deve fazer no sentido de se garantir a representatividade da amostra, pois o
acaso será o único responsável por eventuais discrepâncias entre população e
amostra, o que é levado em consideração pelos métodos de análise da
Estatística Indutiva (ou Inferência Estatística).

As amostras não probabilísticas são também, muitas vezes, empregadas em


trabalhos estatísticos, por simplicidade ou por impossibilidade de se obterem
amostras probabilísticas, como seria desejável.

Como em muitos casos, os efeitos da utilização de uma amostragem não


probabilística podem ser considerados equivalentes aos de uma amostragem

14
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
probabilística, resulta que os processes não probabilísticos de amostragem
têm também sua importância.
Apresentamos a seguir alguns casos de amostragem não probabilística.

• Amostragem probabilística (aleatória) - a probabilidade de um elemento da


população ser escolhido é conhecida.
– Usa alguma forma de sorteio - aleatoriedade
• Amostragem não probabilística (não aleatória) - Não se conhece, a priori,
a probabilidade de um elemento da população vir a pertencer à amostra.

TIPOS DE AMOSTRAS PROBABILÍSTICAS

Amostragem Aleatória Simples (AAS) - Uma amostra aleatória simples


(AAS) é aquela em que cada elemento da população tem a mesma chance de
pertencer a amostra. Em um sorteio, por exemplo, para retirar uma amostra de
9 alunos de uma sala de 90 alunos, utilizasse um sorteio com todos os
números dos alunos escritos em papeis dentro de um saco. Para amostras
grandes utiliza-se a Tabela de Números Aleatórios.

Outra forma é fazer uma lista da população e sorteiam-se os elementos que


farão parte da amostra. É equivalente a um sorteio lotérico.

Propriedade básica: cada subconjunto da população com o mesmo nº de


elementos tem a mesma chance de ser incluído na amostra. Em particular,
cada elemento da população tem probabilidade p = n/N de pertencer à
amostra, ou seja, todos os elementos da população têm igual probabilidade de
pertencer à amostra, e todas as possíveis amostras têm também igual
probabilidade de ocorrer.

AMOSTRAGEM COM REPOSIÇÃO: Uma amostra é dita com reposição


quando as unidades amostrais são devolvidas a população, após cada
extração.

15
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AMOSTRAGEM SEM REPOSIÇÃO: Quando a unidade amostral que é
investigada não volta novamente para a população. Nesse caso, utilizamos
este tipo de amostragem para pequenas amostras. A diferença básica entre um
tipo e outro de amostragem é a possibilidade de um elemento ser ou não
considerado mais de uma vez na amostra que está sendo produzida.

Amostragem sistemática - Essa amostragem é feita através de um sistema


possível de ser aplicado, pois a população já se encontra ordenada. Os
elementos da população apresentam-se ordenados e são retirados
periodicamente (de cada k elementos, um é escolhido). Assim, por exemplo,
em uma linha de produção, podemos a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produção diária.

Considere o exemplo: N = 800, n = 50 e a população já ordenada, poderemos


adotar o seguinte procedimento: sortear um número de 1 a 16 (note-se que
800/50 = 16), o qual indicaria o primeiro elemento sorteado para a amostra; os
demais elementos seriam periodicamente retirados de 16 em 16.

A principal vantagem da amostragem sistemática está na grande facilidade na


determinação dos elementos da amostra. O perigo em adotá-la está na
possibilidade da existência de ciclos de variação da variável de interesse,
especialmente se o período desses ciclos coincidir com o período de retirada
dos elementos da amostra. Por outro lado, se a ordem dos elementos na
população não tiver qualquer relacionamento com a variável de interesse,
então a amostragem sistemática terá efeitos equivalentes à causal simples,
podendo ser utilizada sem restrições.

Amostragem estratificada - É comum termos populações que se dividam em


subpopulacões (estratos) e como cada estrato pode ter um comportamento
diferente do outro, a amostra deve considerar a existência desses estratos e a
sua proporção em relação a população.

16
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Usada quando a população pode ser dividida em subgrupos (estratos)
relativamente homogêneos. Muitas vezes, a população se divide em
subpopulações ou estratos, sendo razoável supor que, de estrato para estrato,
a variável de interesse apresente um comportamento substancialmente
diverso, tendo, entretanto, comportamento razoavelmente homogêneo dentro
de cada estrato. Em tais casos, se o sorteio dos elementos da amostra for
realizado sem se levar em consideração a existência dos estratos, pode
acontecer que os diversos estratos não sejam convenientemente
representados na amostra, a qual seria mais influenciada pelas características
da variável nos estratos mais favorecidos pelo sorteio. Evidentemente, a
tendência da ocorrência de tal fato será tanto maior quanto menor o tamanho
da amostra.

Exemplos: A estratificação de uma cidade em bairros, quando se deseja


investigar alguma variável relacionada à renda familiar; a estratificação de uma
população humana em homens e mulheres, ou por faixas etárias; a
estratificação de uma população de estudantes conforme suas especializações,
etc.

• A seleção em cada estrato deve ser aleatória.


Exemplos:
• Pesquisas de mercado:

17
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
– homens e mulheres;
– faixas etárias.

• Pesquisas eleitorais:
– região demográfica;
– cidades pequenas médias e grandes;
– área urbana e rural.

Exercício 1: Em uma escola existem 250 alunos, distribuídos em séries


conforme a tabela. Obtenha uma amostra de 40 alunos e preencha a tabela.

Série População Amostra


1ª 35
2ª 32
3ª 30
4ª 28
5ª 35
6ª 32
7ª 31
8ª 27
Total 250 40

Exercício 2: Uma universidade apresenta o seguinte quadro relativo aos seus


alunos do curso de Matemática. Obtenha uma amostra proporcional
estratificada de 100 alunos.

Série População Amostra


1ª 85
2ª 70
3ª 80
4ª 75

18
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Total 100

Exercício 3: Uma cidade X apresenta o seguinte quadro relativo as suas


escolas de 1º grau. Obtenha uma amostra proporcional estratificada de 120
estudantes .

Escola Homens Mulheres Amostra -H Amostra - M Total


A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 120

19
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
OS 7 MANDAMENTOS PARA SELEÇÃO DE UMA AMOSTRA OU
EXPERIMENTO

1. É extremamente útil, antes de iniciar o levantamento de dados, definir


como os dados serão registrados (codificação, elaboração de tabelas, os casos
de falta de informação ou impossibilidade de efetuar a medida).

2. Amostra piloto: é o estudo preliminar sobre a forma de coleta de dados.


Visa revelar as dificuldades dos métodos de apuração dos dados. É uma
simulação do estudo observacional ou experimento propriamente dito.

3. Um experimento é dito planejado quando estão definidos: a) unidade


experimental b) a variável ou variáveis em análise e a forma como será ou
serão medidas c) os tratamentos em comparação d) a forma como os
tratamentos serão designados às unidades experimentais.

4. Explicitação dos objetivos com bastante clareza, a fim de evitar dúvidas


posteriores.

5. Especificação do grau de precisão desejado.

6. Escolha dos instrumentos de medida e da forma de amostragem.

7. Em caso de aplicação de questionários, tomar cuidado com


questionários longos, pois eles costumam diminuir a qualidade da resposta.
Também é recomendável evitar questões onde o respondente pode assinalar
mais de uma alternativa como resposta.

20
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 4 : TAMANHO DA AMOSTRA E ERRO AMOSTRAL

ERRO AMOSTRAL

É a diferença entre o valor que a estatística pode acusar e o verdadeiro


valor do parâmetro que se deseja estimar.
O erro amostral tolerável é à margem de erro aceitável em um estudo
estatístico, ou seja, é quanto um pesquisador admite errar na avaliação dos
parâmetros de interesse numa população. Para esclarecer melhor, é quando o
apresentador do telejornal, em ano de eleições, anuncia: “O candidato Fulano
de Tal tem 42% das intenções de voto, 2 para mais, 2 para menos.”
Quando o apresentador cita “2 para mais, 2 para menos”, ele se refere ao
erro amostral tolerável para aquela pesquisa de intenções de voto.
Evidentemente, erros surgem quando utilizamos a informação amostral
para predizer valores da população. Obteríamos 100% de exatidão, somente
se a população inteira fosse amostrada. Também, amostras diferentes levam
a erros diferentes, como podemos ver no exemplo a seguir.

VARIAÇÃO DEVIDO A AMOSTRAGEM

Um grande estudo sobre força de trabalho pesquisou aproximadamente


5700 pessoas. Vamos utilizar o grupo de estudo como uma população
relativamente pequena, da qual selecionaremos amostras.
Uma das questões que o estudo abordava era a imagem corporal: 69%
das pessoas consideraram-se acima do peso. Suponha que quiséssemos
utilizar uma pequena amostra para estimar esse número na população.
Extraímos uma amostra aleatória de tamanho 20 dessas pessoas
(amostrando dos registros do computador) e observamos que 45% da amostra
consideravam-se acima do peso. Isto é bem distante do valor da população de
69%.
Tentamos novamente e vimos que 85% de nossa segunda amostra de
20 pessoas consideravam-se acima do peso. Para a terceira amostra, o

21
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
número foi 65%. Estávamos mais perto agora! Será que estamos ficando
melhores nisso? Ao todo, extraímos 10 amostras dessa população, cada uma
de tamanho 20. Aqui estão as porcentagens das pessoas incluídas em cada
uma das amostras que se consideraram acima do peso: 45, 85, 65, 75, 65, 90,
65, 55, 55, 75.
A porcentagem na população é de 69%. Contudo, essas porcentagens
amostrais variam de 45% a 90%. O processo que estamos utilizando não está
produzindo estimativas confiáveis. Parece haver chances aproximadamente
iguais de obter respostas acima e abaixo do valor populacional.
Você já deve ter ouvido que os resultados de amostras pequenas não
são confiáveis. Vamos coletar mais informação:
Desta vez, obteremos amostras aleatórias de 500 pessoas.
Na primeira vez que fizemos isso, 72,6% da amostra acharam que
estavam acima do peso.
Para a amostra seguinte foram 69,8%.
Seguem-se os resultados para as 10 amostras de tamanho 500: 72,6;
69,8; 69,2; 73,2; 65,2; 69,6; 69,6; 69,2; 71,4; 67,0.
Nenhuma das respostas é exatamente correta; porém, estamos nos
saindo muito melhor, extraindo amostras de tamanho 500 do que quando
extraímos de tamanho 20. Todas as nossas respostas estão razoavelmente
próximas do valor de 69% na população. Fazer uma estimativa a partir de uma
amostra de 500 pessoas parece ser uma maneira razoavelmente confiável de
obter-se uma estimativa do valor na população.
Aproximadamente, metade da amostra tem valores muito grandes e
metade, muito pequenos, logo, nesse sentido, o procedimento amostral é não-
viciado. A diferença entre o valor na amostra e o valor real na população (aqui
69%) denominamos de erro aleatório ou casual. Portanto, quanto maior for a
amostra, tanto menor tende a ser o erro amostral. Precisamos tomar o
cuidado de não citar uma porcentagem sem mencionar, também, o tamanho
da amostra.

22
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
CÁLCULO DO ERRO AMOSTRAL E TAMANHO DA AMOSTRA

Obs.: um passo importante antes de iniciar o cálculo do tamanho da


amostra é definir qual o erro amostral tolerável para o estudo que será
realizado.
Observe a seguinte fórmula:

, onde:
n0 é a primeira aproximação do tamanho da amostra
E0 é o erro amostral tolerável (Ex.: 2% = 0,02 )

, onde:
N é o número de elementos da população
n é o tamanho da amostra
Observe o seguinte exemplo para compreender melhor:

23
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
EXEMPLOS

Em uma empresa que contém 2000 colaboradores, deseja-se fazer uma


pesquisa de satisfação. Quantos colaboradores devem ser entrevistados para
tal estudo?

Resolução

N = 2000
Definindo o erro amostral tolerável em 2%
E0 = 0,02
n0 = 1 / (E0)2
n0 = 1 / (0,02)2
n0 = 2500
n = (N . n0) / (N + n0)
n = (2000 . 2500) / (2000 + 2500)
n = 1111 colaboradores
Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser
entrevistados para a pesquisa.
Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%.

N = 2000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (2000 . 625) / (2000 + 625)
n = 476 colaboradores

Através deste segundo cálculo, é possível observar que, quando aumentamos


a margem de erro, o tamanho da amostra reduz.

24
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
25
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
E se houvesse 300.000 colaboradores na empresa?

N = 300.000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (300.000 . 625) / (300.000 + 625)
n = 623 colaboradores

Observe que a diferença entre n e n0, neste último cálculo, é muito


pequena.
Portanto: se o número de elementos da população (N) é muito grande, a
primeira aproximação do tamanho da amostra já é suficiente.
Observe ainda:
N = 2000
E0 = 0,04
n = 476 colaboradores = 23,8% da população
N = 300.000
E0 = 0,04
n = 623 colaboradores = 0,2% da população

26
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
EXERCÍCIOS

1. Em uma operadora de saúde, se pretende avaliar o desempenho dos


médicos cooperados. Você como auditor foi incumbido de calcular o tamanho
de uma amostra a ser coletada pela técnica de amostragem aleatória simples.
Sendo assim, qual deve ser o tamanho desta amostras e deseja garantir um
erro amostral não superior a 2%?

2. Num hospital com 1000 funcionários, deseja-se estimar a percentagem dos


favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória
simples que garanta um erro amostral não superior a 5%?

3. Determine o tamanho da amostra no levantamento do peso de uma


determinada peça produzida em larga escala. Pelas especificações técnicas do
produto, o desvio-padrão é de 15 kg. Admita um erro amostral de 1,5 kg e
considere um nível de confiança de 95%.

27
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
28
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 5: ORGANIZAÇÃO DE DADOS E REPRESENTAÇÕES GRÁFICAS

A organização dos dados consiste na ordenação e crítica quanto à correção


dos valores observados, falhas humanas, omissões, abandono de dados
duvidosos, etc.

COLETA DE DADOS

Após cuidadoso planejamento e a devida determinação das características


mensuráveis do fenômeno coletivamente típico que se quer pesquisar, damos
início à coleta dos dados numéricos necessários à sua descrição. A coleta
dos dados poderá ser feita de diversas formas. A ideal é aquela que maximiza
os recursos disponíveis, dados os objetivos e a precisão previamente
estipulados.

FASES DO MÉTODO OU TRABALHO ESTATÍSTICO

No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local


onde este se manifestará a frequência de sua ocorrência, e outras
particularidades julgadas importantes. Quando os dados se referirem ou
estiverem em poder de pessoas, sua coleta poderá ser realizada mediante
respostas a questionários previamente elaborados. Esses questionários podem
ser enviados aos entrevistados para devolução posterior ou podem ser
aplicados pelos próprios pesquisadores ou por entrevistadores externos ou
contratados, devidamente treinados. Os dados ou informações representativas
dos fenômenos ou problema em estudo podem ser obtidos de duas formas:
por via direta ou por via indireta.

Por via direta - quando feita sobre elementos informativos de registro


obrigatório (p. ex.: nascimentos, casamentos, óbitos, matrículas de alunos etc.)
ou, ainda, quando os dados são coletados pelo próprio pesquisador através de
entrevistas ou questionários. A coleta direta de dados, com relação ao fator
tempo, pode ser classificada em:
29
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
a) contínuo também denominado registro é feita continuamente, tal como a de
nascimentos, óbitos, etc.;
b) periódica, quando feita em intervalos constantes de tempo, como os
censos(de 10 em 10 anos), os balanços de uma empresa comercial, etc.;
c) ocasional, quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergência, como no caso de epidemias que assolam ou
dizimam seres humanos.

Por via indireta - quando é inferida de elementos conhecidos (coleta direta)


e/ou conhecimento de outros fenômenos relacionados com o fenômeno
estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade
infantil, que é feita através de dados colhidos via coleta direta.

CRÍTICA DOS DADOS

Os dados colhidos por qualquer via ou forma e não previamente organizados


são chamados de dados brutos. Esses dados brutos, antes de serem

30
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
submetidos ao processamento estatístico propriamente dito, devem ser
“criticados", visando eliminar valores impróprios e erros grosseiros que
possam interferir nos resultados finais do estudo. A crítica é externa quando
visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas; é interna quando se observa
o material constituído pelos dados coletados. É o caso, por exemplo, da
verificação de somas de valores anotados.

APURAÇÃO OU PROCESSAMENTO DOS DADOS

Uma vez assegurado que os dados brutos são consistentes, devemos


submetê-los ao processamento adequado aos fins pretendidos. A apuração ou
processamento dos dados pode ser manual ou eletrônica. Os processos e
métodos estatístico a que um conjunto de dados pode ser submetido serão
nosso objeto de estudo nas aulas seguintes.

EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem
ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais
fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior
obtenção de medidas típicas.
No caso particular da estatística descritiva, o objetivo do estudo se limita, na
maioria dos casos, à simples apresentação dos dados, assim entendida a

31
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
exposição organizada e resumida das informações coletadas através de
tabelas ou quadros, bem como dos gráficos resultantes.

A representação dos dados - Os dados estatísticos podem ser mais


facilmente compreendidos quando apresentados através de uma
representação gráfica, a qual permite uma visualização instantânea de todos os
dados. Os gráficos quando bem representativos, tornam-se importantes
instrumentos de trabalho.
Depois de coletado os dados, estes dados devem ser organizados para
que possam evidenciar informações relevantes, em termos dos objetivos da
pesquisa. Esta etapa é usualmente chamada de descrição dos dados. Um
conceito importante nesta fase do trabalho é a distribuição de frequências.

Distribuição de freqüências: compreende a organização dos dados de


acordo com as ocorrências dos diferentes resultados observados. Pode ser
apresentada em tabelas ou em gráficos; com frequências absolutas ou
relativas.
Ex: Uma distribuição de freqüências do grau de instrução deve informar
quantas (ou a porcentagem) de pessoas que se enquadram em cada categoria
preestabelecida do grau de instrução.

Variável Discreta:

32
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
O gráfico deve ser ressaltado. Linhas auxiliares e eixos devem ser “discretos”.
A escala das frequências deve iniciar no zero.

33
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Variáveis Contínuas:

Dupla Classificação: Permite verificar se os dados de duas variáveis indicam


alguma associação. A associação entre duas ou mais variáveis implica que o
conhecimento de um altera a probabilidade de algum resultado da outra.

34
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
ANÁLISE DOS RESULTADOS

Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o


todo (população) a partir de informações fornecidas por parte representativa do
todo (amostra). Assim, realizadas as fases anteriores (Estatística descritiva),
fazemos uma análise dos resultados obtidos, através dos métodos da
Estatística Inferencial, que tem por base a indução ou inferência, e tiramos
desses resultados conclusões e previsões.

35
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 6: MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE DISPERSÃO

Aprenderemos agora o cálculo de medidas que possibilitem representar um


conjunto de dados (valores de uma variável quantitativa, isto é, informações
numéricas), relativos à observação de determinado fenômeno de forma
reduzida.
Estes índices estatísticos são as MEDIDAS DE POSIÇÃO e, dentre as mais
importantes, citamos as Medidas de Tendência Central, que recebem tal
denominação pelo fato dos dados observados tenderem, em geral, a se
concentrar em torno de valores centrais. Dentre as medidas de tendência
central, destacamos:

a Média Aritmética ou Média;


a Moda;
a Mediana.

As outras medidas de posição são as SEPARATRIZES, que englobam:


a própria mediana;
os quartis;
os percentis.

1. MÉDIA ARITMÉTICA (ou simplesmente MÉDIA)


Definição: Dada uma população constituída de N elementos, X1, X2, ..., XN
sua média, mede o valor médio do conjunto de dados, sendo expressa na
mesma unidade, e definida por:

x = MÉDIA: SOMA DAS OBSERVAÇÕES


NÚMERO DE OBSERVAÇÕES

A soma dos valores menores que a média amostral é igual a soma dos valores
maiores que a média amostral.

36
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
MODA
Definição : Dado um conjunto de valores, a moda, denotada Mo, é o valor que
ocorre com maior frequência, ou seja, é o valor mais frequente do conjunto de
dados.
OBS.: i) A moda de um conjunto de dados pode não existir
ii) A moda de um conjunto de dados pode não ser única

MEDIANA = n+1,
2
se n+1 não é um número inteiro, a mediana é a média das duas observações.
2

Definição: Considere uma série (conjunto de dados) ordenada, constituído de


n valores. A mediana, denotada Me , é o valor que divide o conjunto em duas
partes iguais ( isto é, em duas partes de 50% cada). A mediana divide as
observações ordenadas ao meio. O número de observações menores que a
mediana é igual ao número de observações maiores que ela.

QUARTIS: dividem o conjunto de dados em quartos, isto é, 4 pedaços cada um


com 25% das observações. Desta forma o primeiro quartil tem 25% das
observações abaixo e 75% acima; o segundo quartil (mediana) tem metade
abaixo e metade acima; e o terceiro quartil tem 75% abaixo e 25% acima.
O primeiro quartil (Q1) é a mediana de todas as observações com posição
estritamente abaixo da posição da mediana, e o terceiro quartil (Q3) é a
mediana das que estão acima.
São uma forma de resumir os dados através de:

 Mínimo
 1º Quartil
 2º Quartil ou mediana
 3º Quartil

37
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
 Máximo

MEDIDAS DE DISPERSÃO

Medir a dispersão é calcular uma medida que permita avaliar o quanto os


dados estão espalhados.
Existem várias medidas de dispersão dos dados:
 Amplitude;
 Amplitude interquartil;
 Variância amostral;
 Desvio padrão amostral

AMPLITUDE TOTAL: É a medida mais simples do grau de dispersão dos


dados.
Amplitude = Maior observação – Menor Observação
É fortemente afetada pela presença de valores atípicos nos extremos dos
dados.

AMPLITUDE INTERQUARTIL: AIQ = Q3 - Q1

Tão simples quanto a amplitude, mas não é afetada pela presença de


observações muito grandes ou muito pequenas.

VARIÂNCIA E DESVIO PADRÃO

São as medidas mais populares de dispersão dos dados.


A ideia é medir a distancia das observações ao centro dos dados (média) e
obter a média destas distâncias. Assim:

38
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
VARIÂNCIA - A variância de um conjunto de dados ( amostra ou população )
mede a variabilidade do conjunto em termos de desvios quadrados em relação
à média aritmética do conjunto. É uma quantidade sempre não negativa e
expressa em unidades quadradas do conjunto de dados, sendo de difícil
interpretação.

DESVIO PADRÃO: É a raiz quadrada da variância.

Regra do 68% e 95%

Se os dados tem uma distribuição normal:

a) 68% das observações devem cair a uma distância


menor que um desvio padrão da média, isto é,
no intervalo:  x - sd x , x + sd x 
b) 95% das observações devem cair a uma distância
menor que um desvio padrão da média, isto é,
no intervalo:  x - 2  sd , x + 2  sd
DISCIPLINA: ESTATÍSTICA
x x  39

PROFESSORA: NATÁLIA CASTELO BRANCO


VALORES ATÍPICOS (OUTLIERS)

 Valores atípicos – ou “outliers” são observações que se afastam da


normalidade, no caso de uma variável significa observações que estão
muito longe do grosso dos dados.

40
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
FORMA DE DISTRIBUIÇÃO DOS DADOS

(a) Unimodal
(a) Unimodal (b) Bimodal
(b) Bimodal (c) Trimodal
(c) Trimodal

(d)(d)Symmetric
Simétrico (e)(e) Positively assimétrico
Positivamente skewed (f) Negativamente
(f) Negatively skewed
assimétrico
(long upper tail) (long lower tail)
(calda superior longa) (calda inferior longa)

(g)
(g) Symmetric
Simétrico (h)(h)Bimodal
Bimodal with
com gap
lacuna (i) Forma
Exponential shape
exponencial

spike

(j) Spike
(j) Pico no in pattern
padrão

outlier outlier

(k)(k) Outliers
Valores atípico (l) Truncation
(l) Truncamento plus
mais outlier
valor atípico

Fig. Figure
2.3.10 Características
2.3.10 a seremtoprocuradas
Features look for inem histogramas
histograms ande stem-and-leaf
gráficos de ramo-e-folhas
plots.

From Chance Encounters by C.J. Wild and G.A.F. Seber, © John Wiley & Sons, 2000.

41
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 7: INTRODUÇÃO A PROBABILIDADE

Nas aulas anteriores, procuramos entender uma variável, estudando o


comportamento de uma amostra de observações. Desta forma, estudamos, por
exemplo, a distribuição de frequências do uso (sim ou não) de programas de
alimentação popular, a partir de uma amostra de famílias de um certo bairro.
Assim, predomina o raciocínio indutivo, em que a partir da organização e
descrição dos dados observados, procuramos fazer conjecturas sobre o
problema em estudo.
Nesta seção faremos o raciocínio de forma inversa, em que procuraremos
entender como poderão ocorrer os resultados de uma variável, considerando
certas suposições a cerca de um problema em estudo (raciocínio dedutivo).

Exemplo: Supondo que 60% das famílias do bairro usam programas de


alimentação popular, o que se pode deduzir sobre a percentagem de famílias
que usam estes programas, numa amostra aleatória simples de 10 famílias?

A resposta a esta indagação não é um simples número, pois, dependendo das


10 famílias selecionadas na amostra, teremos resultados diferentes. Para
responder adequadamente a esta pergunta, precisamos apresentar quais os
possíveis resultados e como eles podem ocorrer. Esta descrição é feita em
termos dos chamados modelos probabilísticos.

MODELOS PROBABILISTICOS

Os modelos probabilísticos, ou modelos de probabilidade, são construídos a


partir de certas hipóteses ou conjecturas sobre o problema em questão e
constituem-se de duas partes: (I) dos possíveis resultados e (II) de uma certa
lei que nos diz quão provável é cada resultado (ou grupos de resultados).

EXEMPLO: Lançar uma moeda e observar a face voltada para cima. Os


possíveis resultados são cara e coroa. Se admitirmos que a moeda é

42
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
perfeitamente equilibrada e o lançamento for imparcial, podemos também dizer
que a probabilidade de ocorrer cara é a mesma de ocorrer coroa.
A teoria da probabilidade é utilizada para modelar fenomenos aleatórios, ou
seja, que envolvam incertezas. As ações de lançar uma moedaou um dado,
girar uma roleta ou sortear uma carta geram experimentos cujos resultados são
incertos, ou seja, aleatórios. Mesmo que o resultado dos experimentos sejam
incertos, sempre haverá um resultado.

CONCEITOS BÁSICOS

ESPAÇO AMOSTRAL: Conjunto de todos os resultados possíveis do


experimento. Representado pela letra Ω.
Exemplos:
a) Lançar uma moeda e observar a face voltada para cima. Temos, neste caso,
dois resultados possíveis: cara e coroa. Então, o espaço amostral é o conjunto
Ω = { cara, coroa }
b) Lançar um dado com os lados numerados de um a seis e observar o número
de pontos marcados no lado voltado para cima. Temos: Ω = { 1, 2, 3, 4, 5, 6 }
c) Numa urna com bolas azuis e vermelhas, extrair uma bola e observar sua
cor. Temos: Ω = { azul, vermelha }
d) Num certo bairro, indagar a uma família se ela costuma utilizar-se de algum
programa de alimentação popular: Um possível espaço amostral para esta
situação é Ω = { sim, não }. Considerando porém, a possibilidade do
respondente não saber, se negar a responder à indagação, podemos ser
levados a tornar o espaço amostral mais amplo: Ω’ = { sim, não, não sabe, não
respondeu }
e) Num certo bairro, selecionar uma amostra de 10 famílias e verificar quantas
delas se utilizaram de algum programa de alimentação popular nos últimos dois
meses. Um espaço amostral adequado é Ω = { 0, 1, 2, ..., 10}
f) Numa certa escola de primeiro grau, selecionar uma criança e medir sua
altura. Como a altura é uma variável contínua, o espaço amostral precisa ser

43
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
construído como um conjunto de números reais, tal como Ω = { x, tal que x Ɛ Ʀ
e 0 < x < 1,80 m }.
Ressaltamos que s especificação do espaço amostral pode não ser única (veja
o item “c”, por exemplo), pois depende daquilo que estamos observando, como
também de algumas considerações sobre o problema.

EVENTO: Conjunto de resultados possíveis.


Obs: podemos dizer que A é um evento se e somente se A é um subconjunto
do espaço amostral Ω, pois Ω é o conjunto de todos os resultados possíveis.
Exemplos: Considerando o lançamento de um dado, podemos ter interesse,
por exemplo, nos seguintes eventos:
A = ocorrer um número par, ou seja, A = { 2, 4, 6 }
B = ocorrer um número menor que 3, ou seja, B = { 1, 2 }
C = ocorrer o ponto seis, ou seja, C = { 6 }
D = ocorrer um ponto maior que seis, ou seja, D = { }

COMPLEMENTO DE UM EVENTO: Um evento ocorre se qualquer dos


resultados que formam esse evento ocorre.

PROBABILIDADES

As probabilidades são valores entre 0 (zero) e 1 (um). E a soma das


probabilidades de todos os resultados possíveis do experimento deve ser igual
a 1 (um).
Exemplo: Vamos apresentar os modelos probabilísticos para os itens (a), (c) e
(d), alocando, de forma intuitiva, a probabilidade de cada resultado do espaço
amostral. O princípio que norteia a alocação destas probabilidades será
apresentado em seguida.
a) No lançamento da moeda perfeitamente equilibrada e o lançamento
imparcial, os resultados tornam-se equiprováveis, donde podemos alocar
probabilidade 0,5 (um meio) tanto para cara quanto para coroa.

44
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
c) Na seleção de uma bola de uma urna, para construirmos um modelo
para a cor da bola a ser extraída, precisamos conhecer a quantidade (ou a
percentagem) de bolas de cada cor, existentes na urna. Se existirem, por
exemplo, 7 bolas azuis e 3 vermelhas e, admitindo também, que a bola seja
extraída aleatoriamente, temos o seguinte modelo.
d) No problema de verificar se a família de um bairro costuma utilizar-se de
programas de alimentação popular, vamos supor, por simplicidade, a
inexistência de não resposta, ou seja, qualquer que seja, qualquer que seja a
família selecionada, as possíveis respostas devem estar em Ω = { sim, não}.
Como no caso anterior, torna-se necessário o conhecimento da distribuição
desta característica na população. Por exemplo, se admitirmos que em todo
bairro 60% das famílias utilizam e 40% não utilizam programas de alimentação
popular e admitindo, também, que a família seja selecionada aleatoriamente,
podemos explicitar o modelo probabilístico.

PRINCIPIO DA EQUIPROBABILIDADE

No exemplo do item “c”, fizemos o seguinte raciocínio: “Como a seleção é


aleatória, toda bola da urna tem a mesma probabilidade de ser selecionada.
Como existem 7 bolas azuis, dentre as 10 bolas de urna, a probabilidade de
selecionar uma bola azul é 7/10 (ou 0,7). Analogamente, a probabilidade de
selecionar uma bola vermelha é 3/10 (ou 0,3).
O princípio da equiprobabilidade é usualmente enunciado em termos da
probabilidade de algum evento, como apresentaremos a seguir.
PRINCIPIO DA PROBABILIDADE: Quando as características do experimento
sugerem N possíveis resultados, todos com igual probabilidade de ocorrência,
a probabilidade de um certo evento A, contendo n resultados, pode ser definida
por

P(A) = n/N = número de resultados de A/ número total de


resultados

45
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Uma forma mais geral de alocar probabilidades a eventos, a partir do
conhecimento das probabilidades de resultados individuais, é somando as
probabilidades dos resultados que integram o evento. Este procedimento pode
ser usado mesmo quando os resultados não são equiprováveis. Neste caso
estamos admitindo que os resultados de um experimento são mutuamente
exclusivos, ou seja, ao realizar o experimento vai ocorrer somente um
resultado.

EXEMPLO 1: Seja uma urna com 5 bolas brancas, 3 vermelhas e 2 pretas.


Selecionar uma bola ao acaso. Qual a probabilidade da bola selecionada ser
branca ou vermelha?

Solução: P (branca ou vermelha) = P(branca) + P(vermelha) = 5/10 + 3/10 =


8/10 (ou 0,8). Também chegaríamos a este resultado se lembrássemos que a
soma de todos os resultados possíveis é igual a 1 (um). Assim, P(branca) +
P(vermelha) + P(preta) = 1, ou: P (branca e vermelha) = 1 – P(preta) = 1 – 2/10
= 8/10

Dizemos que dois eventos são independentes quando a ocorrência de um


deles não altera a probabilidade de ocorrência do outro. Por exemplo, em dois
lançamentos de um dado, os eventos A = número par no primeiro lançamento e
B = numero par no segundo lançamento podem ser admitidos como
independentes, já que a ocorrência de A (ou de B) nada tem a ver com a
ocorrência de B (ou de A).
Quando a ocorrência de um evento puder ser interpretada como resultante da
ocorrência simultânea de dois outros eventos independentes, sua probabilidade
pode ser obtida pelo produto das probabilidades individuais destes eventos
independentes.

EXEMPLO 2: Lançar um dado perfeitamente equilibrado duas vezes. Calcular


a probabilidade de ocorrer número par em ambos os lançamentos.

46
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Solução: P(número par em ambos os lançamentos) = P(nº par no 2º
lançamento) = (0,5) x (0,5) = 0,25
União de eventos = Evento A ou B = contém todos os resultados em A ou B
(incluindo aqueles em ambos). Ele ocorre se pelo menos um deles A ou B
ocorre.
Interseção de eventos = Evento A e B = contém todos os resultados que estão
em ambos A e B. Ele ocorrer se ambos A e B ocorrem.
Eventos mutuamente exclusivos = não podem ocorrer ao mesmo tempo

REGRA DA ADIÇÃO

Para dois eventos quaisquer P (A ou B) = P(A) + P(B) – P(A e B)


Para eventos mutuamente exclusivos P (A ou B) = P(A) + P(B)

PROBABILIDADE CONDICIONAL

A probabilidade condicional de A ocorrer dado que B ocorre é dada por


P(A/B) = P(A e B)
P (B)

REGRA DA MULTIPLICAÇÂO

P (A e B) = P(A/B) x P(B)
P(B/A) x P(A)

INDEPENDÊNCIA ESTATÍSTICA

Os eventos A e B são estatisticamente independentes se souber que B ocorreu


não fornece nenhuma informação nova sobre a chance de A ocorrer.

P(A/B) = P(A) ou P(B/A) = P(B)

47
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Se A e B são estatisticamente independentes, então P (A e B) = P(A) x P(B)
Se os eventos são fisicamente independentes então, sob qualquer modelo de
probabilidade razoável, eles serão estatisticamente independentes.
Supor que os eventos são independentes quando na realidade não são, pode
frequentemente levar a respostas exageradamente altas ou exageradamente
baixas.

48
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 8: PROBABILIDADE – OPERAÇÕES BÁSICAS

O ponto interessante de se usar eventos é que podemos Combinar os


eventos, resultando em outros eventos, usando-se operações lógicas. Estas
operações lógicas são baseadas em 3 palavras: OU, E e NÃO. Ou seja, dados
os eventos E e F, vamos construir novos eventos usando as três palavras
acima. Vamos usar os diagramas de Venn para visualizar estes novos eventos.

E E F : Ambos os eventos ocorrem

E OU F : Ou ocorre o evento E, ou ocorre o evento F, ou ambos

NÃO E : O evento F não ocorre

Vamos voltar ao exemplo do lançamento dos dois dados. Definimos o


evento C como “Sair 1 no primeiro dado” e D como “Sair 1 no segundo dado”.

49
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
A seguir estão representados todos os resultados possíveis, ou seja, o
espaço amostral.

(1;1)(2;1)(3;1)(4;1)(5;1)(6;1)
(1;2)(2;2)(3;2)(4;2)(5;2)(6;2)
(1;3)(2;3)(3;3)(4;3)(5;3)(6;3)
(1;4)(2;4)(3;4)(4;4)(5;4)(6;4)
(1;5)(2;5)(3;5)(4;5)(5;5)(6;5)
(1;6)(2;6)(3;6)(4;6)(5;6)(6;6)

A área EM NEGRITO da primeira coluna representa o evento C.


A área EM NEGRITO da primeira linha representa o evento D.

(1;1)(2;1)(3;1)(4;1)(5;1)(6;1)
(1;2)(2;2)(3;2)(4;2)(5;2)(6;2)
(1;3)(2;3)(3;3)(4;3)(5;3)(6;3)
(1;4)(2;4)(3;4)(4;4)(5;4)(6;4)
(1;5)(2;5)(3;5)(4;5)(5;5)(6;5)
(1;6)(2;6)(3;6)(4;6)(5;6)(6;6)

Se queremos o evento E = C ou D, seria representado por toda a área


sombreada. Se estamos interessados no evento F = C e D, teríamos somente
a célula EM VERMELHO.

REGRA DA ADIÇÃO

O exemplo anterior ilustra a REGRA da ADIÇÃO.


Para quaisquer dois eventos E e F, P(E ou F) = P(E È F) = P(E) + P(F) –
P(E e F)= P(E) + P(F) – P(E Ç F)
Note que se só somássemos as probabilidades dos eventos E e F,
estaríamos contando duas vezes o evento G = E e F.
Para o exemplo dos 2 dados: P(C ou D) = 11/36 = 6/36 + 6/36 – 1/36

50
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Então, para dois eventos quaisquer P (A ou B) = P(A) + P(B) – P(A e B)

EVENTOS MUTUAMENTE EXCLUSIVOS

Algumas vezes, o evento que representa a interseção de dois eventos, D


= E e F, é um conjunto vazio, ou seja, quando o evento E ocorre, o evento F
não ocorre, e vice-versa.
Quando isso acontece, ou seja, quando P(E e F) = 0, chamamos os
eventos E e F de eventos MUTUAMENTE EXCLUSIVOS.

Neste caso, a regra da adição fica:


P(E ou F) = P(E È F) = P(E) + P(F)
Então, para eventos mutuamente exclusivos P (A ou B) = P(A) + P(B),
pois não existem elementos em comum com os dois eventos.

(1;1)(2;1)(3;1)(4;1)(5;1)(6;1)
(1;2)(2;2)(3;2)(4;2)(5;2)(6;2)
(1;3)(2;3)(3;3)(4;3)(5;3)(6;3)
(1;4)(2;4)(3;4)(4;4)(5;4)(6;4)
(1;5)(2;5)(3;5)(4;5)(5;5)(6;5)
(1;6)(2;6)(3;6)(4;6)(5;6)(6;6)

Vamos ver, agora, o evento A = “A soma nos dois dados é 3” (em verde)
e o evento B = “A soma nos dois dados é 6” (em amarelo).
Note que os dois eventos são mutuamente exclusivos. Então,
P(A ou B) = 7/36 = 5/36 + 2/36 = P(A) + P(B)

EVENTOS COMPLEMENTARES
Para qualquer evento E, P(E) = 1 – P(NÃO E) = 1 – P( EC )
Esta regra é bastante interessante quando a probabilidade do evento
complementar é mais fácil de ser calculada do que a do evento de interesse.

51
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Por exemplo, se queremos saber a probabilidade do evento A = “Não
saíram dois valores “1””, temos:
P(A) = 1 - P(AC) = 1 – P(dois valores “1”) = 1 – 1/36 = 35/36

PROBABILIDADES CONDICIONAIS

Algumas vezes, dependendo da informação que temos sobre


determinado evento, podemos ter diferentes avaliações sobre a sua
probabilidade. Por exemplo, se fôssemos calcular a probabilidade de que uma
casa caia amanhã, pensaríamos que essa probabilidade seria muito maior se
soubéssemos que um terremoto está sendo esperado para esta região.

Vamos voltar aos nossos dados. Vamos jogar o primeiro dado, anotar o
resultado, e então jogar o segundo. Estamos interessados em saber a
probabilidade de que, conhecendo-se o valor do primeiro dado, a soma dos
dois resultados seja 3. Antes do lançamento de qualquer dado, a probabilidade
da soma ser três é de 2/36. Lançamos o primeiro dado e o resultado foi 1. Qual
é, agora, a probabilidade da soma ser 3?

Antes de jogarmos o 1º dado, o espaço amostral tinha 36 eventos


elementares, mas agora que o evento C=“deu 1 no primeiro lançamento”
ocorreu, teremos um “espaço amostral reduzido”:

(1;1)(1;2)(1;3)(1;4)(1;5)(1;6)

Neste espaço amostral reduzido a 6 realizações, existe apenas uma


cuja soma é 3: (1,2). Logo, esta probabilidade condicional será de 1/6. Iremos
representar esta probabilidade da seguinte maneira: P(A|C)= 1/6 (a
probabilidade de A dado C).

Tivemos que olhar o “espaço reduzido” onde ocorreu o evento A, e


depois tivemos que olhar as realizações onde ocorreram A e C, ou seja,

52
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
podemos escrever a probabilidade condicional da seguinte maneira: P(A|C) =
(P(AC)/P(C))
Olhando para esta definição, podemos notar que: P(A|A) = 1 e, se A e C
fossem mutuamente exclusivos, P(A|C) = 0
Portanto, a probabilidade condicional de A ocorrer dado que B ocorre é
dada por P(A/B) = P(A e B)
P (B)

REGRA DA MULTIPLICAÇÃO

Re-arrumando a definição de probabilidade condicional, iremos chegar


na Regra da Multiplicação:

P(AÇC) = P(A|C) P(C)


De modo análogo,
P(AÇC) = P(C|A) P(A)

EVENTOS INDEPENDENTES

Dizemos que dois eventos A e C são INDEPENDENTES se a ocorrência


de um deles não tem influência na probabilidade do outro. Por exemplo, o
lançamento de um dado não teria nenhuma influência no outro, a não ser que
eles fossem “ligados”! Em termos da Probabilidade Condicional, esta definição
pode ser representada por: P(A|C) = P(A) e P(C|A) = P(C)

Assim, no caso de eventos independentes, P(A|C) = P(C), e a regra da


multiplicação fica P(AÇC) = P(A) P(C)
Vamos voltar ao exemplo dos dados... Sejam os eventos A, C e D tais
que
A = “A soma dos dois dados é 3”
C = “Sai “1” no primeiro dado”
D = “Sai “1” no segundo dado”

53
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
P(C|D) = P(C e D)/P(D) = (1/36)/(6/36) = 1/6 = P(C)

Ou seja, C e D são eventos independentes! Intuitivamente, a soma dos


dois lançamentos ser 3 não parece ser independente do evento C, sair 1 no
primeiro lançamento. Vamos ver isso na
fórmula: P(A|C) = P(A e C)/P(C) = (1/36)/(6/36) = 1/6 ¹ 1/18 = P(A)

Ou seja, A e C não são eventos independentes!


Portanto, se os eventos A e B são estatisticamente independentes se
souber que B ocorreu não fornece nenhuma informação nova sobre a chance
de A ocorrer.

P(A/B) = P(A) ou P(B/A) = P(B)

Se A e B são estatisticamente independentes, então P (A e B) = P(A) x


P(B). Se os eventos são fisicamente independentes então, sob qualquer
modelo de probabilidade razoável, eles serão estatisticamente independentes.
Supor que os eventos são independentes quando na realidade não são,
pode frequentemente levar a respostas exageradamente altas ou
exageradamente baixas.

RESUMO DAS OPERAÇÕES BÁSICAS

Vamos, então, relembrar todas as regras que vimos até aqui.


Considerando dois eventos E e F quaisquer,
Regra da Adição: P(E ou F) = P(E) + P(F) – P(E e F)
Eventos Complementares: P(E) = 1 – P(EC)
Regra da Multiplicação: P(E e F) = P(E|F) P(F) = P(F|E) P(E)
Regra especial da Multiplicação: Quando dois eventos E e F são
independentes, P(E e F) = P(E) P(F)

54
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
EXEMPLO 1:

Qual o evento com maior probabilidade, o de se obter ao menos um “6”


em quatro lançamentos de um dado honesto, ou o de se obter ao menos um
“duplo 6” em 24 lançamentos de dois dados honestos? À primeira vista, pode-
se pensar que os dois eventos têm a mesma probabilidade. Vamos calculá-la.
Qual a probabilidade de se obter ao menos um “6” em quatro lançamentos de
um dado honesto? Este é um bom exemplo de quando é mais fácil usar a
probabilidade do evento complementar para se calcular a probabilidade do
evento de interesse.
Seja E = Sair ao menos um “6” em quatro lançamentos. O evento
complementar seria “Não sair “6” em NENHUM lançamento”
Se Ei for o evento “Não sair “6” no i-ésimo lançamento”, com i = 1,2,3,4,
como os eventos Ei são independentes, P(EC) = P(E1 e E2 e E3 e E4).
Aplicando a regra especial da multiplicação e a do evento complementar, P(E)
= 1 - P(EC) = 1 – (5/6)4 = 1 – 0,482 = 0,518
Vamos considerar, agora, a probabilidade do evento B de conseguirmos
um ao menos um “duplo 6” em 24 lançamentos de dois dados. De novo, é mais
simples calcularmos a probabilidade do evento complementar BC de “não sair
nenhum “duplo 6” em 24 lançamentos de dois dados”.
Defina por Bi o evento “não sair um duplo 6 na iésima jogada de dois
dados”, i = 1,2,...,24. A probabilidade de cada Bi seria P(Bi) = 35/36. Assim,
P(B) = 1 - P(BC) = 1 – (35/36)24 = 1 – 0,509 = 0,491.
Ou seja, o evento E é mais provável que o evento B.

CÁLCULO DA PROBABILIDADE CONJUNTA

Cálculo de Probabilidade Conjunta: Probabilidade de ocorrência de um evento


conjunto A e B (isto é, A ᴖ B)

P(A ᴖ B) = número de resultados favoráveis de A e B


número total resultados do espaço amostral

55
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
P( carta ser vermelha e às) = 2 ases vermelhos = 1
52 cartas no baralho 26

PROBABILIDADE CONDICIONAL

Existem situações nas quais estamos interessados a probabilidade de um


evento A sabendo que o evento B ocorreu.
EXEMPLO 1: Sabendo que a pessoa selecionada aleatoriamente de uma
população tem história familiar de diabete (evento B), pode-se querer saber
qual a probabilidade dessa pessoa ter diabete (evento A). Então vamos estudar
como a probabilidade de um evento A muda depois de sabermos que algum
outro evento B ocorreu. Esta “nova” probabilidade de A é chamada de
probabilidade condicional do evento A dado que (ou sabendo que) o evento B
ocorreu.
Notação : P(Aǀ B)

CÁLCULO DA PROBABILIDADE CONDICIONAL

EXEMPLO 2: P( carta vermelha dado que é um ás) = 2 ases vermelhos = 1


4 ases 2
Uma probabilidade condicional nada mais é do que uma probabilidade
calculada a partir de um subconjunto do Ω (isto é, em relação ao espaço
amostral reduzido) e não mais a partir do espaço amostral original Ω.

Evento Vermelha Preta Total


Ás 2 2 4
Não Ás 24 24 48
Total 26 26 52

56
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Espaço amostral reduzido

P(carta vermelha ǀ ás) = P(verm. e ás) = 2/52 = 2 = 1


P(ás) 4/52 4 2

P(carta ás ǀ vermelha) = P(ás e verm.) = 2/52 = 2 = 1


P(verm.) 26/52 26 13

Definição: Se A e B são dois eventos quaisquer tal que P(B) > 0, então define-
se a probabilidade condicional de A dado B, P(A ǀ B), como sendo
P(A ǀ B) = P (A ᴖ B)
P (B)
Note que pela definição acima, P (A ᴖ B) e P (B) são calculados em relação ao
espaço amostral original Ω.

Considerações: Pode-se notar que a probabilidade condicional de A dado B,


P(AǀB), pode ser calculada:
 Diretamente, pela consideração da probabilidade de A em relação
ao espaço amostral reduzido B.
 Ou empregando a definição dada, onde P (A ᴖ B) e P(B) são
calculados em relação ao espaço amostral original Ω.

REGRA DO PRODUTO DA PROBABILIDADE

A partir da definição de probabilidade condicional, obtém-se a regra do produto


(ou regra da multiplicação) de probabilidades,
P (A ᴖ B) = P (A ǀ B) x P (B)
Esta regra é bastante útil para calcular a probabilidade de ocorrência conjunta
dos eventos A e B. Ou seja, esta regra usa o conceito da probabilidade
condicional para se obter a probabilidade de ocorrência conjunta de, no caso,
dois eventos.

57
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Exemplo 3: Uma urna contém 2 bolas brancas (B) e 3 vermelhas (V). Suponha
que sorteemos 2 bolas ao acaso, sem reposição. Isto significa que escolhemos
a 1ª bola, verificamos sua cor e não devolvemos à urna; misturamos as bolas
restantes e retiramos à 2ª bola. Pregunta-se: Qual a probabilidade:
a) De se obter 2 bolas brancas?
b) De se obter uma bola branca?
c) De se obter nenhuma bola branca?

58
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 9: DISTRIBUIÇÃO BINOMIAL

PRINCIPAIS DISTRIBUIÇÕES DISCRETAS

A partir de agora iremos definir e discutir algumas distribuições especiais que


são largamente utilizadas em aplicações de probabilidade e estatística.
Ou seja, existem variáveis aleatórias que são bastante utilizadas em situações
práticas. As distribuições de probabilidades dessas variáveis aleatórias têm
uma forma definida, isto é, essas distribuições nos fornecem modelos para
atribuir probabilidades.

DISTRIBUIÇÃO DE BERNOULLI

Um experimento particularmente simples é um no qual somente 2 possíveis


resultados existem.

EXEMPLOS:
1) Uma moeda é lançada: o resultado ou é cara ou é coroa.
2) Um dado é lançado: ou ocorre a face 6, ou não (neste caso, ocorrendo
uma das faces: 1, 2, 3, 4, ou 5).
3) Uma peça é escolhida, ao acaso, de um lote contendo 300 peças: esta
peça é defeituosa ou não.
4) Uma pessoa é escolhida ao acaso, dentre 500 pessoas: é ou não é do
sexo masculino.

O resultado de cada experimento acima pode ser classificado como sucesso ou


fracasso. Para cada experimento anterior podemos designar os dois resultados
possíveis de experimento por 0 e 1. Então vamos definir a V.A X que assume
apenas 2 valores: X = 1 se ocorre sucesso e X = 0 se ocorre fracasso.
Indicaremos por p a probabilidade de sucesso, isto é, P (Sucesso) = P(S) = p, 0
< p < 1;

59
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Definição: Dizemos que V.A. X tem uma distribuição de Bernoulli (ou é uma
V.A de Bernoulli) com parâmetro p (com 0 < p < 1).
Se X assume somente os valores 0 e 1 com função de probabilidade:
P (X = x) = px q1-x , x = 0, 1, onde = q = 1-p
ou escrevendo de outra maneira;
P (X=1) = p, P(X=0) = 1 – p

Observação:
1) ∑ P(X = x1) = (1 - p) + p = 1
2) Muitas vezes, denotamos (1 - p) por q, isto é: (1 - p) = q

EXEMPLO 1: Experimento – lançamento de um dado equilibrado.


Seja X = 1, se a face 6 ocorre e X = 0, caso contrário. Determine a função da
probabilidade.
Solução: X 0 1
P (X=x) 5/6 1/6

Considere agora n ensaios de Bernoulli, isto é, suponha que repitamos um


ensaio de Bernoulli n vezes. Suponha que as repetições são independentes
(resultado de um ensaio não afeta o resultado de qualquer outro ensaio). A
probabilidade de sucesso em cada ensaio é constante (é sempre p). Um
resultado qualquer será constituído de uma sequência de sucessos e
fracassos, ou, de uns e zeros.

EXEMPLO 2: Repetindo uma ensaio de Bernoulli 7 vezes (n = 7), um possível


resultado poderia ser FSSFSFS ou (0, 1, 1, 0, 1, 0, 1).
A probabilidade de tal resultado é: (1 – p) p p (1 – p) p (1 – p) p = p4 (1 – p)³ ,
numero de sucessos 4 e número de fracassos 3 , onde P (Sucesso) = p.

EXEMPLO 3: Um dado é lançado 9 vezes (n = 9). Qual a probabilidade de se


obter a face 3 cinco vezes?

60
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
EXEMPLO 4: Dez peças são extraídas, ao acaso com reposição, de um lote de
300 peças. Qual a probabilidade de que duas peças sejam defeituosas,
sabendo-se que 5% das peças do lote são defeituosas?

EXEMPLO 5: Qual a probabilidade de que, dentre 5 pessoas escolhidas ao


acaso entre 500 pessoas, duas sejam do sexo masculino?

EXEMPLO 6: Uma moeda é laçada 3 vezes. Qual a probabilidade de se obter


2 caras?
Resolução: Supondo que a moeda é honesta.
P (sucesso) = P(cara) = ½ ; P (fracasso) = P(coroa) = ½
Estamos interessados na probabilidade do evento
A = { SSF, SFS, FSS}
P(A) = P (SSF) + P(SFS) + P(FSS) = ½ ½ ½ + ½ ½ ½ + ½ ½ ½ = 3/8

Em termos de V.A, se X – representa o número de caras. Então o que


queremos calcular é a P(X = 2).
P (X = 2) = ?
Vamos supor agora que P(S) = p.
Logo P (F) = 1 – p = q, com 0 < p < .
Então, P(SSF) = P(FSS) = P (SFS) = p²q, logo P (A) = 3p²q.

Para o exemplo 6 podemos construir a tabela abaixo.


Nº de Se p =
sucessos Eventos Probab 1/2
0 {FFF} q³ 1/8
{SFF, FSF,
1 FFS} 3pq² 3/8
{SSF, SFS,
2 FSS} 3p²q 3/8
3 {SSS} p³ 1/8

61
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Em geral: Se X V.A que representa o número de sucessos em n ensaios de
Benoulli (ou n experimentos independentes). Os possíveis valores de X são 0,
1, 2, ......., n. Queremos: P(X = k) ?
Ou seja: em uma sequência de n ensaios (ou experimentos), queremos a
probabilidade de obter K sucessos.
Obter k sucessos é equivalente a obter (n-K) fracassos, k= 0, 1, 2. ...,n; com
P(S) = p e P(F) = 1 – p = q.
Uma sequência particular seria: {SSS....S} ou {FFF...F}
K sucessos (n-k) fracassos
A probabilidade de tal sequência é: pk qn-k, devido a independência dos
experimentos. Quantas sequências com k sucessos e (n-k) fracassos podemos
formar?
EXEMPLO 7: n = 5, k = 3, de quantas maneiras posso escolher 3 posições em
5 para colocar sucesso?
Podemos formar: C (k,n) = n! sequências
k! (n-k)!

Logo: P (X= k) = C(k,n) pk qn-k, k = 0, 1, 2, ..., n.

Definição: Chama-se experimento binomial ao experimento:


i) que consiste em n ensaios de Bernoulli,
ii) cujos ensaios são independentes;
iii) e a probabilidade de sucesso em cada ensaio é sempre igual a p.

Definição: Se X é uma V.A que representa o número de sucessos em n ensaios


(ou experimentos) de Bernoulli.
Então X é uma V.A binomial com parâmetros n e p é dada por:
P (X= k) = C(k,n) pk qn-k, k = 0, 1, 2, ..., n.

Se X é uma V.A. binomial com parâmetros n e p, denota-se por X ~ Bin (n,p).


Esperança de X : E (X) = np
Variância de X: Var(X) = np(1-p) = npq

62
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
63
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
AULA 10: DISTRIBUIÇÃO NORMAL

A distribuição normal é uma das distribuições mais importantes da estatística.


A distribuição Normal foi introduzida pelo matemático francês Abraham De
Moivre em 1733. Foi usada por ele para aproximar probabilidades associadas
com V. Binomiais quando n é grande.
Todavia, o trabalho de Moivre foi perdido (por algum tempo) e,
independentemente Karl Gauss desenvolveu a distribuição Normal 100 anos
mais tarde (aproximadamente).
A Curva Normal – também conhecida como Gaussiana, é um modelo teórico
ou ideal que resulta muita mais de uma equação matemática do que um real
delineamento de pesquisa com posterior coleta de dados. Entretanto, a
utilidade da curva normal para o pesquisador pode ser evidenciada através de
suas aplicações a efetivas situações de pesquisa.

MODELO NORMAL

Definição: Dizemos que a V.A. X tem distribuição Normal com parâmetros μ e


Ϭ². A distribuição tem forma de sino, é simétrica e possui amplitude infinita.

Notação X ~ N (μ, Ϭ²)

Quando dizemos que esta distribuição é simétrica, e que sua média e sua
mediana coincidem, isso significa dizer que a área sob a curva antes de μ é
igual a área sob a curva depois de μ.
Conhecidos os valores de μ e Ϭ, a fórmula anterior fica determinada para
qualquer valor de X.
É possível calcular qual é a probabilidade (ou a proporção de valores) em cada
intervalo de dados.
Denotamos por N(μ, Ϭ) ou N(μ, Ϭ²), a distribuição Normal com média μ e
desvio padrão Ϭ (ou variância Ϭ² isto é, X ~ N (μ, Ϭ²).

64
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
A área sob o gráfico de f(x) (ou sob a curva de frequência normal) é igual a 1.
Esta propriedade vale para quaisquer valores de (μ, Ϭ).
Área sob o gráfico de f(x) em um intervalo especificado representa a
probabilidade (essencialmente, a proporção de casos ou frequência relativa) no
intervalo.

CALCULANDO PROBABILIDADES

A probabilidade é a área sob a curva. Cada distribuição tem sua própria tabela?
Então seria uma infinidade de distribuições normais que significa uma
infinidade de tabelas. Esta tarefa é facilitada pelo uso da variável

Z=X–μ
Ϭ

Desta forma, somente é necessário construir uma tabela para a distribuição


normal padrão, N(0,1).

Teorema 1: Se X ~N (μ, Ϭ²) e Y = aX+b, onde a e b são constantes e a ≠ 0,


então Y ~ N (aμ+b, a² Ϭ²).

Corolário: Seja X ~ N (μ, Ϭ²). Então, Z = X – μ ~ N (0,1)


Ϭ

A distribuição normal padrão: Quando uma distribuição normal tem μ = 0 e Ϭ² =


1, a distribuição é chamada de distribuição normal padrão ou reduzida.

EXEMPLO 1: Vamos estudar a distribuição da renda anual de uma cidade


norte-americana. A renda anual média é de 5.000,00 e o desvio padrão,
1.500,00. Admitindo-se que a distribuição de renda anual tenha distribuição
normal, e X = 7000,00. Calcule:
Z = 7000 – 5000/1500 = + 1,33

65
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Vamos assim que uma renda anual de 7000,00 corresponde a 1,33 desvios
padrões acima da média anual de 5000,00.

EXEMPLO 2: Vamos agora determinar a probabilidade associada a um escore


situado entre 5000,00 – a própria média – e 7000,0. Em outras palavras, qual a
probabilidade de escolher-se de forma aleatória, numa só tentativa, uma
pessoa dessa cidade cuja renda anual caia entre 5000,00 e 7000,00?

Passo – a – passo:
1) Transforme o escore bruto (X) em escore Z

Z = X – μ = Z = 7000 – 5000/1500 = + 1,33


Ϭ
P = 0,4082 = 0,41 = 41%

Usando a Tabela da distribuição normal, procurar a porcentagem da frequência


total (sob a curva que cai entre o escore z e a média.

Então concluímos que a probabilidade de extrair aleatoriamente um sujeito


dessa população, e sua renda anual esteja compreendida nesses limites é de
41%.

No presente caso, entretanto, precisamos ir um passo além e subtrair de 50% a


porcentagem obtida na Tabela, ou seja, aquela porcentagem da área que se
localiza à direita (ou à esquerda) da média. Esta afirmação é verdadeira
porque a Tabela sempre registra a porcentagem da área que vai da média até
um dado z.

EXEMPLO 3: Ao trabalhar com uma distribuição normal do grau de


contentamento manifestado por um grupo de inquilinos beneficiários do serviço
público de habitação, vamos supor que μ = 10 e Ϭ = 2. Calcule o escore Z
para X = 3.

66
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Z = X – μ = 3 – 10 = - 3,5
Ϭ 2

Nota: conhecendo-se um escore z (padronizado), é sempre possível obter-se o


escore bruto X equivalente mediante o emprego da seguinte fórmula:

X = Z x Ϭ + μ = (- 3,5 ) x (2) + 10 = - 7 + 10 = 3

A curva normal pode ser usada em conjunção com os escores z (escores


padronizados) e a Tabela da distribuição normal no cálculo da probabilidade
associada a qualquer dado da distribuição.

Obs: Não esquecer que a curva normal é uma distribuição de frequências e a


frequência total sob a curva é igual a 100%, essa curva apresenta uma área
central que circunda a média, onde se localiza os escores mais frequentes, e
há, ainda, áreas menores progressivamente mais próximas de ambas as
extremidades (caudas), onde encontramos, em pequenas proporções, escores
muito altos e muito baixos.

DISTRIBUIÇÃO NORMAL : PROPRIEDADES

Cerca de 68% dos valores se situam no intervalo de -1 a +1 desvio padrão da


média.
Cerca de 95% dos valores se situam no intervalo de -2 a +2 desvios padrão da
média.
Cerca de 99,7% dos valores se situam no intervalo de -3 a +3 desvios padrão
da média.
Portanto, uma proporção constante da área total sob a curva normal cairá entre
a média e qualquer distância dada a contar de X – desde que a mensuração
seja feita em unidades de desvio padrão.

67
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
EXEMPLO 4: Imagine um grupo de trabalhadores com média salarial R$400,00
e desvio padrão R$50,00. Qual a probabilidade de encontrarmos um
trabalhador que tenha salário entre R$390,00 e R$450,00?
Passo-a- passo:
1) A distribuição original (X) tem média R$400,00 e desvio R$50,00
2) Podemos então encontrar os valores de Z correspondentes a X = R$390,00
e X = R$450,00
Z1 = (390 – 400)/50 = 0,2
Z2 = (450 – 400)/50 = 1,0
Assim, podemos dizer que a probabilidade do salário (X) ficar entre R$390,00 e
R$450,00 é a mesma de termos Z entre 0,2 e +1,0.
Observando a tabela de distribuição normal de Z, temos 0,0793 para ±0,2 (não
há diferença entre 0,2 e +0,2, uma vez que a curva é simétrica) e 0,3413 para
1,0.
Como a distribuição Z tem média 0, temos 0 0,2 à esquerda do zero e o +1,0 à
direita do zero. P (390 < X < 450) = P (0,2 < Z < 0) + P (0 < Z < 1,0) = 0,0793 +
0,3413 = 0,4206.
Ou seja, temos que em média 42% dos trabalhadores ganham entre R$390,00
e R$450,00.

Obs: Para ler a tabela de distribuição normal Z, procure os dois primeiros


algarismos na primeira coluna e depois o último algarismo na primeira linha.
Para achar o 1,00 é fácil. Basta acharmos o 1,0 na primeira coluna e depois o
0,00 na primeira linha. Ficamos com 0,3413. Se quisermos achar Z = 1,55,
temos que achar o 1,5 na primeira coluna e depois o 0,05 na primeira linha.
Ficamos com 0,4395. Por último, se quisermos achar Z = 3,38, procuraremos o
3,3 na primeira coluna e o 0,08 na primeira linha. Acharemos o valor 0,4996.

EXEMPLO 5: Suponha que numa certa universidade, a altura dos estudantes


do sexo masculino tenha distribuição normal com média μ = 1,70 cm e desvio
padrão Ϭ = 10 cm. Calcule o evento X > 1,80.

68
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO
Z = X – μ = 180 – 170 = + 1,0
Ϭ 10

P (X > 180) = P (Z > 1) = 0,3413 = 0,50 – 0,3413 = 0,1587

EXEMPLO 6: Suponha que o desempenho dos alunos das três últimas fases
do Curso de Computação da UFSC tenha distribuição normal com média 2,5 e
desvio padrão 0,6³. Selecionando aleatoriamente um aluno desta população,
qual a probabilidade dele acusar desempenho entre 2 e 3,5?

RESOLVAM...

OBSERVAÇÕES FINAIS

1) P (Z ≤ z) = P(Z ≥ - z)
2) P(Z ≤ - z) = P(Z ≥ z)
3) Lembrando: P( a < Z < b) = P (Z < b) – P (Z ≤ a)
4) A probabilidade de ocorrência de um evento qualquer, num conjunto de
alternativas, é igual à soma das probabilidades separadas. Ou seja, se
as V.A’s X1, X2, ..., Xk são então a soma X1, X 2, ..., Xk N (μ1 + μ2 + ...μk ,
Ϭ²1 + Ϭ²2 + ..., Ϭ²k), em eventos mutuamente exclusivos
5) Média Amostral : X ~N (μ, Ϭ²/n)

69
DISCIPLINA: ESTATÍSTICA
PROFESSORA: NATÁLIA CASTELO BRANCO

Você também pode gostar