EM
ENGENHARIA
FEIRA DE SANTANA
2018
-1-
ÍNDICE
1 ESTATÍSTICA
1.1 Introdução à Estatística
1.1.1 Método Estatístico
1.1.2 A Estatística
1.1.3 Fases do Método Estatístico
1.1.4 A Estatística nas Empresas
1.1.5 Atividades Complementares
1.2 População e Amostra
1.2.1 Atividades Complementares
1.3 Variáveis quantitativas contínuas e discretas
1.3.1 Atividades Complementares
1.4 Variáveis qualitativas nominais e ordinais
1.4.1 Atividades Complementares
1.5 Planejamento de experimento e amostragem
1.5.1 Controlando os Efeitos das Variáveis
1.5.2 Replicação e Tamanho da Amostra
1.5.3 Aleatorização e Outras Estratégias Amostrais
1.5.4 Erros Amostrais
1.5.5 Atividades Complementares
1.6 Tabelas de freqüência
1.6.1 Tabelas
1.6.2 Séries Estatísticas
1.6.3 Séries Conjugadas. Tabela de Dupla Entrada
1.6.4 Dados Absolutos e Dados Relativos
1.6.5 Atividades Complementares
1.6.6 Distribuição de Freqüência
1.6.7 Atividades Complementares
1.7 Gráficos Estatísticos
1.7.1 Diagramas
1.7.2 Gráfico Polar
1.7.3 Cartograma
1.7.4 Pictograma
1.7.5 Atividades Complementares
-2-
2 MEDIDAS ESTATÍSTICAS
2.1 Medidas de tendência central (média, mediana, moda)
2.1.1 Média Aritmética (X)
2.1.2 Moda (Mo)
2.1.3 Mediana (Md)
2.1.4 Atividades Complementares
2.2 Medidas de Dispersão ou de Variabilidade
2.2.1 Amplitude Total
2.2.2 Variância e Desvio Padrão
2.2.3 Coeficiente de Variação
2.2.4 Atividades Complementares
3 PROBABILIDADE
3.1 Experimento Aleatório
3.2 Espaço Amostral
3.3 Eventos
3.4 Probabilidade
3.5 Eventos Complementares
3.6 Eventos Independentes
3.7 Eventos Mutuamente Exclusivos
3.8 Exercícios resolvidos
3.9 Atividades Complementares
3.10 Teorema de Bayes
-3-
1 CONCEITOS FUNDAMENTAIS
1.1 Introdução à Estatística
-4-
1.1.1.2 O Método Experimental
Exemplo:
→ A determinação das causas que definem o preço de uma mercadoria. Para aplicarmos
o método experimental, teríamos que fazer variar a quantidade da mercadoria e
verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria
existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos
consumidores deveria permanecer constante, seria necessária a fixação do nível geral
dos preços das outras necessidades etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,
denominado método estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes,
admite todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
1.1.2 A Estatística
A utilização das PESQUISAS é muito comum nas mais diversas atividades humanas.
Muitas decisões são tomadas tendo como ponto de partida a análise de resultados de
cuidadosas pesquisas.
Exemplos:
→ Na época das eleições, as pesquisas eleitorais fornecem elementos para que os
partidos e os candidatos redimensionem a campanha eleitoral.
→ Quando do levantamento de um novo produto, as indústrias realizam pesquisas junto
aos consumidores para sondar a aceitação desse produto.
→ Emissoras de televisão frequentemente fazem pesquisas com os espectadores, a fim
de observarem a aceitação de seus programas.
Conclusão:
A Estatística é uma parte da Matemática Aplicada que estuda métodos para a coleta, a
organização, descrição, análise e interpretação de dados. Todo o seu estudo objetiva,
entre outros, a tomada de decisões.
-5-
A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma
empresa.
Exemplo:
→ Na Faculdade Pereira de Freitas, o conhecimento de seus problemas (condições de
funcionamento, produtividade), a formulação de soluções apropriadas e um
planejamento objetivo de ação.
-6-
1.1.3.5 Análise dos resultados
Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo
(população) a partir de informações fornecidas por parte representativa do todo
(amostra). Assim, realizadas as fazes anteriores (Estatística Descritiva), fazemos
uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou
Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados
conclusões e previsões.
-7-
1.1.5 Atividades Complementares
2. As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de
que método?
3. O que é Estatística?
10. Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz
necessária.
As pessoas de uma comunidade podem ser estudas sob diversos ângulos. Por exemplo,
podem ser estudadas quanto ao sexo (masculino ou feminino), quanto à estatura
(baixa, média ou alta), quanto à renda (pobres e ricas), etc.
Sexo, estatura e renda são variáveis, isto é, são propriedades as quais podemos
associar conceitos ou números e assim expressar, de certa maneira, informações sob
a forma de medidas.
POPULAÇÃO (ou UNIVERSO) é qualquer conjunto de INFORMAÇÕES que tenham,
entre si, uma CARACTERÍSTICA COMUM.
Voltemos às pessoas da citada comunidade. O conjunto de TODAS as estaturas constitui
uma POPULAÇÃO DE ESTATURAS; o conjunto de TODOS os pesos constitui uma
POPULAÇÃO DE PESOS; o conjunto de TODAS as cores de olhos constitui uma
POPULAÇÃO DE CORES DE OLHOS.
Exemplo:
-8-
Imaginemos uma escola com 400 alunos (meninos, idades entre 6 e 16 anos).
Exemplo:
→ para o fenômeno “sexo” não dois os resultados possíveis: masculino e feminino;
→ para o fenômeno “número de filhos” há um número de resultados possíveis, expresso
através dos números naturais: 0, 1, 2, 3, 4, ..., n;
→ para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem
tomar um número infinito de valores numéricos dentro de um determinado intervalo.
Definições:
Um PARÂMETRO é uma medida numérica que descreve alguma característica de uma
população.
Uma ESTATÍSTICA é uma medida numérica que descreve alguma característica de uma
amostra.
Exemplos:
→ Parâmetros: Quando Lula foi eleito presidente em 2006, ele recebeu 60,83% dos
95.838.220 votos no segundo turno. Se encararmos a coleção de todos esses votos
como a população a ser considerada, então 60,83% é um parâmetro, não uma
estatística.
→ Estatística: Com base em uma amostra de 877 executivos pesquisados, achou-se
que 45% deles não contratariam alguém que cometesse um erro tipográfico em sua
solicitação de emprego. Esse número de 45% é uma estatística porque se baseia em
uma amostra, não da população inteira de todos os executivos.
Definições:
- 10 -
Dados Quantitativos consistem em números que representam contagens ou medidas.
Dados Qualitativos (ou categóricos ou de atributos) podem ser separados em
diferentes categorias que se distinguem por alguma característica não-numérica.
Exemplos:
→ Dados Quantitativos: Os pesos de modelos.
→ Dados Qualitativos: Os sexos (masculino/feminino) de atletas profissionais.
Definições:
Dados Discretos surgem quando o número de valores possíveis é ou um número finito
ou uma quantidade “enumerável”. (Isto é, o número de valores possíveis é 0, ou 1, ou 2
e assim por diante.)
Dados (numéricos) Contínuos resultam de infinitos valores possíveis que
correspondem a alguma escala contínua que cobre um intervalo de valores sem vazios,
interrupções ou saltos.
Exemplos:
→ Dados Discretos: Os números de ovos que as galinhas botam são dados discretos
porque representam contagens.
→ Dados Contínuos: As quantidades de leite das vacas são dados contínuos porque são
medidas que podem assumir qualquer valor em um intervalo contínuo. Durante um
dado intervalo de tempo, uma vaca pode produzir uma quantidade de leite que pode
ser qualquer valor entre 0 e 5 galões. Seria possível obter-se 2,34315 galões, porque
a vaca não é restrita a quantidades discretas de 0, 1, 2, 3, 4 ou 5 galões.
- 12 -
Outra maneira comum de classificar dados é usar quatro níveis de mensuração:
nominal, ordinal, intervalar e razão.
Tudo parece indicar que uma das grandes preocupações do homem é – e sempre foi – a
MEDIÇÃO: Medir terras, a quantidade de gado no pasto, a riqueza, porções de
medicamentos etc.
A invenção dos números (isto é, de palavras capazes de expressar quantidades) permitiu
que o homem deixasse de guardar informações num lugar físico, concreto (ex: pedrinhas
e gravetos), para guardá-las num lugar psicológico: A MEMÓRIA.
Com a escrita, o homem supera esse problema. O ALGARISMO – representação gráfica
do número possibilitou-lhe anotar as informações como garantia contra o esquecimento.
MEDIR uma magnitude (GRANDEZA) significa associar a essa magnitude um NÚMERO
REAL.
Quando se mede uma grandeza, realizam-se em cadeia, as seguintes operações:
- Definição do que vai ser medido;
- Definição de um critério para a medição, isto é, de uma ESCALA;
- Leitura;
- Interpretação.
Embora número seja sempre número, as magnitudes diferem umas das outras quanto à
classe a que pertencem: Estatura, peso, velocidade, inteligência, maturidade,
temperatura, beleza etc.
O processo de mensuração depende do NÍVEL, isto é, da CLASSE a que pertence a
magnitude (= GRANDEZA).
Cada nível supõe certas características associadas às grandezas nele contidas. Assim, há
características de 1º Nível, 2º Nível, 3º Nível e 4º Nível. A complexidade e a informação
aumentam com o Nível.
Níveis de Mensuração:
1º NÍVEL – O Nível Nominal de Mensuração é caracterizado por dados que consistem
em nomes, rótulos ou categorias apenas. Os dados não podem ser ordenados (tal como
do menor para o maior). É o nível de mensuração mais baixo, mais rudimentar possível.
Sua escala de medida chama-se NOMINAL. A base, o fundamento para a atribuição dos
números é de natureza QUALITATIVA, DISTINTIVA.
Exemplos:
→ Sim/não/indeciso: Respostas de pesquisa.
→ Cores: As cores de carros dirigidos por estudantes da faculdade (vermelho, preto,
azul, branco, e assim por diante).
Numa sala há 8 alunos, 5 dos quais do sexo masculino. Convencionando que os homens
serão designados por 1 e as mulheres, por 2, tudo o que se pode fazer é escrever.
- 13 -
Notar que não tem sentido matemático fazer a operação 3 x 2 = 6, pois 2 NÃO
REPRESENTA uma QUANTIDADE, mas sim, uma CATEGORIA. Por essa razão, esse 2
poderia ser substituído pelo símbolo , daí resultando 3 = 3 mulheres.
Como os dados nominais não têm ordenação ou significado numérico, eles não devem
ser usados para cálculos. Algumas vezes, usam-se números associados às diferentes
categorias (especialmente quando os dados são codificados para computador),
mas esses números não têm qualquer significado computacional e qualquer média
calculada com eles não tem qualquer significado.
Conclusão: No 1º Nível, os algarismos têm cara de números, mas não são números:
São CATEGORIAS. Portanto, não são possíveis operações aritméticas com valores
atribuídos às VARIÁVEIS. O 1º Nível presta-se a CODIFICAÇÕES e estas comportam,
no máximo, CONTAGENS.
Outros exemplos:
→ Números de telefones: João → 3292-3541
→ Placas de automóveis: APA 4506 (carro da Adriana)
→ Camisas de jogadores: Pelé → 10
Exemplos:
→ Postos: Com base em vários critérios, uma revista classifica cidades de acordo com
suas “condições de habitação”. Esses postos (primeiro, segundo, terceiro, e assim por
diante) determinam uma ordenação. No entanto, as diferenças entre os postos não
têm significado. Por exemplo, a diferença de “segundo menos primeiro” pode sugerir
2 - 1 = 1, mas essa diferença de 1 não tem significado porque não é uma quantidade
que possa ser comparada a outras tais diferenças. A diferença entre a primeira e a
segunda, cidades, não é a mesma que a diferença entre a segunda e a terceira
cidades. Usando a classificação da revista a diferença entre Belo Horizonte e Ipatinga,
não pode ser comparada quantitativamente com a diferença entre Belém e Marabá.
→ Notas em Cursos: Um professor de faculdade atribui notas A, B, C, D ou F. Essas
notas podem ser arranjadas em ordem, mas não podemos determinar as diferenças
entre elas. Por exemplo, sabemos que A é maior do que B (assim, há uma ordem),
mas não podemos subtrair B de A (assim, a diferença não pode ser encontrada).
→ Notas em Cursos: resultantes de provas tradicionais – produzem mensurações de
2º nível. Assim, se João tirou 8 e Maria, 4, é mais possível concluir que João sabe
mais que Maria, embora NÃO se possa concluir que João saiba o dobro do que ela
sabe.
- 14 -
3º NÍVEL – O Nível Intervalar de Mensuração é como o nível ordinal, com a
propriedade adicional de que a diferença entre quaisquer dois valores de dados é
significativa. No entanto, os dados nesse nível não têm um ponto inicial zero natural
(quando o nada da quantidade está presente). É no 3º nível que surge, pela 1ª vez, uma
escala de medida propriamente dita. É a escala INTERVALAR, caracterizada pela
existência de:
- Uma unidade de medida (arbitrária, porém fixa);
- Um zero relativo, isto é, convencional.
Exemplos:
→ Anos: Os anos 1000, 2000, 1776 e 1492. (O tempo não começa no ano 0, de modo
que o ano 0 é arbitrário e não um ponto inicial zero natural que represente “nenhum
tempo”.)
→ As escalas termométricas. O zero é convencional em todas, bem como a distância
entre dois traços contíguos – os chamados GRAUS.
Assim, se o corpo A está a 40ºC e outro, B, a 10ºC, não tem sentido dizer que A é
“quatro vezes mais quente” que B só porque 40:10 = 4. Os valores são ordenados, e
podemos determinar a sua diferença de 30ºC. No entanto, não há um ponto inicial
natural. O valor de 0ºC pode parecer um ponto inicial, mas é arbitrário e não significa
ausência total de calor. Como 0ºC não é um ponto inicial zero natural, é errado dizer
que 50ºC é duas vezes mais quente do que 25ºC. Mas não há dúvida de que A é bem
mais quente que B.
Exemplos:
→ Pesos: Os pesos (em quilates) de diamantes de anéis (0 representa nenhum peso, e
4 quilates é duas vezes mais que 2 quilates).
→ Preços: Os preços de livros-texto (R$0,00 representa nenhum custo, e um livro de
R$90,00 custa três vezes um livro de R$30,00).
Esse nível de mensuração é chamado nível de razão porque o ponto inicial zero torna as
razões significativas. Entre os quatro níveis de mensuração, a maior dificuldade surge
entre os níveis intervalar e de razão.
- 15 -
1.4.1 Atividades Complementares
- 16 -
4. Além do Básico
a. Interpretação do Aumento da Temperatura. Na tirinha do desenho “Born
Loser” de Art Sansom, Brutus expressa satisfação com o aumento da temperatura
de 1º para 2º. Quando perguntam a ele o que há de tão bom em relação a 2 º, ele
responde “É duas vezes mais quente do que essa manhã”. Explique por que Brutus
está errado mais uma vez.
b. Interpretação da Pesquisa Política. Um pesquisador entrevista 200 pessoas e
lhes pergunta sobre o partido político de sua preferência. Ele codifica as respostas
como 0 (para PT), 1 (para PSDB), 2 (para PMDB), 3 (para quaisquer outras
respostas). Ele calcula, então, a média dos números e obtém 0,95. Como se pode
interpretar esse valor?
c. Escala para Classificação de Comida. Um grupo de estudantes desenvolve uma
escala de classificação da qualidade da comida da lanchonete, com 0
representando “neutra: nem boa nem ruim”. Dão-se números negativos para
refeições ruins e números positivos para refeições boas, com o valor absoluto dos
números correspondendo a seriedade da má ou boa qualidade. As três primeiras
refeições tiveram classificações 2, 4 e -5. Qual é o nível de mensuração para tal
classificação? Justifique sua escolha.
- 17 -
1.5 Planejamento de Experimento e Amostragem
Devemos entender que o método usado para coletar dados é absoluta e criticamente
importante, e devemos saber que a aleatoriedade é particularmente importante.
Se os dados amostrais não forem coletados de maneira apropriada, eles
podem ser de tal modo inúteis que nenhuma manipulação estatística poderá
salva-los.
A aleatoriedade comumente desempenha papel crucial na determinação de
quais dados coletar.
Os métodos estatísticos são direcionados pelos dados. Normalmente, obtemos dados de
duas fontes distintas: estudos observacionais e experimentos.
Definições:
Em um estudo observacional, observamos e medimos características específicas, mas
não tentamos modificar os sujeitos objeto do estudo.
Em um experimento, aplicamos algum tratamento e passamos, então, a observar seu
efeito sobre os sujeitos.
Exemplos:
→ Estudo Observacional: uma pesquisa do Gallup, por exemplo, simplesmente
observa as pessoas (em geral, através de entrevistas) sem modificá-las de modo
algum.
→ Experimento: o teste clínico da droga Liptor envolve o tratamento de algumas
pessoas com a droga, de modo que as pessoas tratadas são modificadas.
Definições:
Em um estudo transversal, os dados são observados, medidos e coletados em um
ponto no tempo.
Em um estudo retrospectivo (ou de controle de caso), os dados são coletados do
passado, voltando-se no tempo (através de exames de registros, entrevistas e assim por
diante).
Em um estudo prospectivo (ou longitudinal ou de coorte), os dados são coletados no
futuro, de grupos (chamados coortes) que compartilham fatores comuns.
Essas três definições se aplicam aos estudos observacionais, mas agora mudamos nossa
atenção para os experimentos. Os resultados de experimentos são algumas vezes
destruídos por causa do confundimento.
Definição:
O confundimento ocorre em um experimento quando o pesquisador não está apto a
distinguir entre os efeitos de diferentes fatores.
Tente planejar o experimento de modo que o confundimento não ocorra.
Por exemplo, suponha que um professor na faculdade experimente uma nova tática de
freqüência (“sua média no curso cai um ponto para cada aula que você mata”), mas
ocorre um inverno excepcionalmente ameno, sem chuvas ou temporais fortes que
atrapalharam a freqüência no passado. Assim, se a freqüência melhorar, não poderemos
determinar se essa demora se deveu à nova tática ou ao inverno ameno. Os efeitos da
tática de freqüência e do tempo foram confundidos.
- 18 -
1.5.1 Controlando os Efeitos das Variáveis
Um dos elementos–chave no planejamento de um experimento é o controle dos efeitos
das variáveis. Podemos obter tal controle usando dispositivos como experimentos
cegos, blocos, planejamento experimental completamente aleatorizado ou um
planejamento experimental rigorosamente controlado, descritos a seguir.
Experimento Cego - Em 1954, planejou-se um experimento maciço para testar a
eficácia da vacina Salk na prevenção da pólio, que matava ou paralisava milhares de
crianças. Naquele experimento, um grupo de tratamento recebeu a vacina Salk real,
enquanto um segundo grupo recebeu um placebo que não continha qualquer droga. Nos
experimentos que envolvem placebos, há sempre um efeito placebo, que ocorre
quando um sujeito não tratado relata melhora nos sintomas. (A melhora relatada no
grupo placebo pode ser real ou imaginada.) Esse efeito placebo pode ser minimizado ou
contabilizado através do uso de um experimento cego, uma técnica em que o sujeito
não sabe se está recebendo o tratamento ou o placebo. O experimento cego nos permite
determinar se o efeito do tratamento é ou não significativamente diferente do efeito do
placebo. O experimento da pólio foi do tipo duplo-cego, o que significa que a ocultação
ocorreu em dois níveis (1) as crianças que recebiam a injeção não sabiam se estavam
recebendo a vacina Salk ou um placebo, e (2) os médicos que davam as injeções e
avaliavam os resultados também não sabiam.
Blocos – No planejamento de um experimento para testar a eficácia de um ou mais
tratamentos, é importante colocar os sujeitos (em geral, chamados unidades
experimentais) em grupos diferentes (ou blocos) de tal modo que os grupos sejam muito
semelhantes. Um bloco é um grupo de sujeitos que são semelhantes nos modos que
possam afetar o resultado do experimento.
Ao conduzir um experimento que testa um ou mais tratamentos diferente,
forme blocos (ou grupos) de sujeitos com características similares.
Planejamento Experimental totalmente Aleatorizado – Na decisão de como associar
os sujeitos aos diferentes blocos, você pode usar a seleção aleatória ou tentar controlar
cuidadosamente a associação, de modo que os sujeitos dentro de cada bloco sejam
semelhantes. Uma abordagem é usar um planejamento experimental completamente
aleatorizado, onde os sujeitos são colocados nos blocos através de um processo de
seleção aleatória. Um exemplo de um planejamento experimental totalmente
aleatorizado é a característica do experimento da pólio: as crianças foram destinadas ao
grupo de tratamento ou ao grupo placebo através de uma seleção aleatória (equivalente
à jogada de uma moeda).
Existe uma técnica especial – Amostragem – para recolher amostras, que garante,
tanto quanto possível, o acaso na escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido,
o que garante à amostra o caráter de representatividade, e isto é muito escolhido, pois,
como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados
obtidos nas amostras dessa população.
Planejamento Rigorosamente Controlado – Outra abordagem para atribuir sujeitos
aos grupos é usar um planejamento rigorosamente planejado, no qual os sujeitos são
escolhidos cuidadosamente de modo que em cada bloco sejam similares em relação ao
que é importante ao experimento. Em um experimento que testa a eficácia de uma droga
feita para baixar a pressão sanguínea, se o grupo do placebo inclui um homem de 30
anos, com excesso de peso, fumante e que consome sal e gordura em abundância, o
grupo do tratamento deve incluir, também, uma pessoa com características semelhantes
(o que, nesse caso, seria fácil de achar).
- 19 -
1.5.2 Replicação e Tamanho da Amostra
Além do controle dos efeitos das variáveis, outro elemento-chave do planejamento
experimental é o tamanho das amostras. As amostras devem ser grandes o bastante
para que o comportamento errático, que é característica de amostras muito pequenas,
não disfarce os verdadeiros efeitos dos diferentes tratamentos. A repetição de um
experimento é chamada replicação, e a replicação é usada efetivamente quando temos
sujeitos suficientes para reconhecer diferenças a partir de tratamentos diferentes. (Em
outro contexto, replicação se refere à repetição ou duplicação de um experimento de
modo que os resultados possam ser confirmados ou verificados). Com replicação,
tamanhos amostrais grandes aumentam a chance de reconhecimento dos efeitos de
diferentes tratamentos. No entanto, uma amostra grande não é, necessariamente, uma
boa amostra. Embora seja necessário ter uma amostra que seja suficientemente grande,
é mais importante ter uma amostra na qual os dados tenham sido escolhidos de alguma
maneira apropriada, tal como seleção aleatória (descrita mais adiante).
Use um tamanho de amostra grande o bastante para que possa ser vista a
verdadeira natureza de quaisquer efeitos e obtenha a amostra usando um
método apropriado, tal como um baseado em aleatoriedade.
No experimento planejado para testar a vacina Salk, 200.000 crianças receberam a
verdadeira vacina e 200.000 outras crianças receberam um placebo. Como o
experimento real usou tamanhos amostrais suficientemente grandes, a eficácia da vacina
pôde ser comprovada. No entanto, embora os grupos de tratamento e de placebo fossem
muito grandes, o experimento teria sido um fracasso se os sujeitos não tivessem sido
destinados a cada grupo de um modo que tornasse ambos os grupos semelhantes no que
era importante para o experimento.
Na estatística, como na vida, um dos piores erros consiste em coletar dados de uma
maneira não apropriada. Não podemos deixar de enfatizar esse ponto muito importante:
Se os dados amostrais não forem coletados de maneira adequada, eles
podem ser de tal modo inúteis que nenhuma manipulação estatística
poderá salvá-los.
Vamos, agora, definir os métodos de amostragem mais comuns.
Definições:
Em uma amostra aleatória, membros de uma população são selecionados de tal modo
que cada membro individual tenha chance igual de ser selecionado.
Uma amostra aleatória simples (amostragem casual) de tamanho n é selecionada de
tal modo que toda amostra possível de mesmo tamanho n tem a mesma chance de ser
escolhida.
- 20 -
Exemplo:
→ Vamos obter uma amostra representativa para a pesquisa da estatura de noventa
alunos de uma faculdade:
a. Imagine uma sala de aula com 60 alunos arrumados em 6 filas de 10 alunos cada.
Suponha que o professor selecione uma amostra de 10 alunos jogando um dado e
selecionando a fila correspondente ao resultado da jogada. O resultado é uma
amostra aleatória porque cada estudante individual tem a mesma chance (uma
chance em seis) de ser escolhido. No entanto, a amostra não é uma amostra aleatória
simples porque nem todas as amostras de tamanho 10 têm a mesma chance de
serem escolhidas. Por exemplo, esse planejamento amostral, ao usar um dado para
selecionar uma fileira, torna impossível selecionar 10 estudantes que estejam em filas
diferentes (mas há uma chance em seis de selecionar os 10 estudantes da primeira
fila).
b. Numeramos os alunos de 01 a 90. Escrevemos os números, de 01 a 90, em pedaços
iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a
caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números
que formarão a amostra. Neste caso, 10% da população.
- 21 -
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo
qualquer da mesma, a partir da qual iremos considerar números de dois, três ou mais
algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-
versa), verticalmente (de cima para baixo ou vice-versa) ou formando o desenho de uma
letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo.
Assim, para o nosso exemplo, considerando a 18ª linha, tomamos os números de dois
algarismos (tantos algarismos quanto formam o maior número da população), obtendo:
61 02 01 81 73 92 60 66 73 58 53 34
Evidentemente, o número 92 será desprezado, pois não consta da população, como será
abandonado um numeral que já tenha aparecido.
Temos, então:
61 02 01 81 73 60 66 58 53 34
Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma
amostra das estaturas dos noventa alunos.
Exemplo:
→ Supondo, no exemplo anterior (b), que, dos noventa alunos, 54 sejam meninos e 36
sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra
de 10% da população. Logo, temos:
b.1
- 22 -
Com a amostragem estratificada, subdividimos a população em pelo menos dois
subgrupos (ou estratos) que compartilham as mesmas características (tais como sexo ou
faixa etária) e em seguida, extraímos uma amostra de cada subgrupo (ou estrato).
Exemplo:
→ Pesquisas Eleitorais – Selecionamos aleatoriamente 30 zonas eleitorais de um
grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas
zonas selecionadas. Isso é muito mais rápido e muito menos dispendioso do que
selecionar uma pessoa de cada uma das muitas zonas da área populacional. Os
resultados da amostragem estratificada ou por conglomerado podem ser ajustados ou
ponderados para corrigir quaisquer representações desproporcionais de grupos.
Exemplos:
→ os prontuários médicos de um hospital;
→ os prédios de uma rua;
→ as linhas de produção.
Nesses casos, a seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemática.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar
um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o
tamanho da amostra em 10% da população.
Exemplo:
→ Suponhamos uma rua contendo 900 prédios, dos quais desejamos obter uma amostra
formada de cinqüenta prédios. Podemos, neste caso, usar o seguinte procedimento:
como 900 50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive),
o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos
seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse
o 4, tomaríamos, pelo lado direito da rua, o 4º prédio, o 22º, o 40º etc., até
voltarmos ao início da rua, pelo lado esquerdo.
- 23 -
1.5.4 Erros Amostrais
Não importa quão bem planejemos e executemos o processo de coleta da amostra,
provavelmente sempre haverá algum erro nos resultados.
Exemplo:
→ Selecione aleatoriamente 1000 adultos, pergunte a eles se formaram no Ensino Médio
e a porcentagem amostral de respostas “sim”. Se você selecionar aleatoriamente
outra amostra de 1000 adultos, é provável que você obtenha uma porcentagem
amostral diferente.
Definições:
Um erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado da
população; tais erros resultam das flutuações amostrais devidas ao acaso.
Um erro não-amostral ocorre quando os dados amostrais são coletados, registrados ou
analisados incorretamente (tal como a seleção de uma amostra tendenciosa, o uso de um
instrumento de medida defeituoso, ou cópia incorreta dos dados).
Após ler toda esta seção, é fácil ficarmos espantados com a variedade de diferentes
definições. Mas lembre-se desse ponto principal: o método usado para coletar os dados é
absoluta e criticamente importante, e devemos saber que a aleatoriedade é
particularmente importante. Se os dados amostrais não forem coletados de maneira
apropriada, os dados podem se tornar tão inúteis que nenhuma manipulação estatística
poderá salva-los.
- 24 -
1.5.5 Atividades Complementares
1. Resolva:
a. Pesquisa – peso dos colegas de sua classe (incluindo você).
Amostra – correspondente a 30% da população.
Sugestão – faça uso da caderneta de seu professor e da Tabela dos Números
Aleatórios (5ª e 6ª colunas, de baixo para cima).
- 25 -
4. O diretor de uma faculdade, na qual estão matriculados 280 meninos e 320 meninas,
desejoso de conhecer as condições de vida extra-escolar de seus alunos e não
dispondo de tempo para entrevistar todas as famílias, resolveu fazer um
levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor,
os elementos componentes da amostra.
Nº DE ESTUDADANTES
ESCOLAS
MASCULINO FEMININO
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955
7. Mostre como seria possível retirar uma amostra de 32 elementos de uma população
ordenada formada por 2.432 elementos.
Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à
amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?
1.648º, 290º, 725º, 2.025º, 1.120º.
- 26 -
9. Identifique o tipo de estudo observacional (transversal, retrospectivo ou prospectivo).
a. Pesquisa Médica – Um pesquisador da Faculdade de Medicina da UFMG obtém dados
sobre ferimentos na cabeça examinando os registros do hospital dos últimos 5 anos.
b. Psicologia do Trauma – Um pesquisador do Hospital Mt Sinai planeja obter dados
acompanhando (até o ano 2010) irmãos de vítimas fatais do ataque terrorista ao
World Trade Center em 11 de setembro de 2001.
c. Estatística do Desemprego – O Ministério do Trabalho obtém dados atuais do
desemprego pesquisando 50.000 pessoas este mês.
d. Ganhadores de Loteria – Um economista coleta dados entrevistando pessoas que
ganharam na loteria entre os anos de 1995 e 2000.
- 27 -
11. Identifique as amostras aleatórias e as amostras aleatórias simples.
a. Amostragem de Comprimidos de Aspirina – Um farmacêutico mistura bem
um recipiente com 1000 comprimidos de Bufferin e retira, então, 50 que devem
ser testados para verificar o conteúdo exato de aspirina. Esse planejamento
amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples?
Explique.
b. Amostragem de Estudantes – Uma sala de aula compõe-se de 30 alunos,
sentados em 5 filas diferentes, com seis alunos em cada fila. O instrutor joga um
dado e o resultado é usado para selecionar uma amostra dos estudantes em uma
fila particular. Esse plano amostral resulta em uma amostra aleatória? Em uma
amostra aleatória simples? Explique.
c. Amostra de Conveniência – Um repórter de notícias se coloca em uma esquina
e obtém uma amostra de residentes da cidade selecionando cinco adultos que
passam e perguntando sobre seus hábitos de fumo. Esse plano amostral resulta
em uma amostra aleatória? Em uma amostra aleatória simples? Explique.
d. Amostra Sistemática – Um engenheiro de controle da qualidade seleciona cada
centésima fonte de computador que passa em uma esteira transportadora. Esse
plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória
simples? Explique.
e. Amostra Estratificada – O shopping do Vale planeja realizar uma pesquisa de
mercado com 100 homens e 100 mulheres em Ipatinga, a qual consiste em um
número igual de homens e mulheres. Esse plano amostral resulta em uma
amostra aleatória? Em uma amostra aleatória simples? Explique.
f. Amostra por Conglomerado – Um pesquisador de mercado seleciona
aleatoriamente 10 quarteirões em Timóteo e pergunta então a todos os adultos
residentes nos quarteirões selecionados se possuem ou não um aparelho DVD.
Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória
simples? Explique.
- 28 -
1.6 Tabelas de freqüência
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E
isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que
irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo,
permitindo-nos determinações administrativas e pedagógicas mais coerentes e
científicas.
Definições:
Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se
de:
Corpo – conjunto de linhas e colunas que contém informações sobre a variável em
estudo;
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem nos seus cruzamentos com as colunas;
Casa ou Célula – espaço destinado a um só número;
Título – conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
Exemplo:
PRODUÇÃO DE CAFÉ
BRASIL – 2005-06
PRODUÇÃO
ANOS
(1.000 t)
2005 2 134
2006 2 594
FONTE: IBGE.
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos
colocar:
um traço horizontal () quando o valor é zero, não só quanto à natureza das coisas,
como quanto ao resultado do inquérito;
três pontos (...) quando não temos os dados;
- 29 -
1.6.1 Séries Estatísticas
Definição:
Série estatística é toda tabela que apresenta a distribuição de um conjunto de dados
estatísticos em função da época, do local ou da espécie.
Daí, podemos inferir que numa série estatística observamos a existência de três
elementos ou fatores: o tempo, o espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica,
geográfica e específica.
FONTE: APA.
FONTE: APA.
- 30 -
1.6.1.3 Séries Específicas ou Categóricas
Descrevem os valores da variável, em determinado tempo e local, discriminados segundo
especificações ou categorias.
Exemplo:
a. A industria da soja gera cerca de 1,5 milhão de empregos diretos. Representa 20% do
sistema agroindustrial. (Revista Isto é)
EXPORTAÇÃO b.
BRASILEIRA
REBANHOS BRASILEIROS
2005
1992
QUANTIDADE
QUANTIDADE
PRODUTOS (em bilhões de ESPÉCIES
(1.000 cabeças)
toneladas)
Bovinos 154.440,8
Grãos 20,5 Bubalinos 1.423,3
Farelo 14,2 Eqüinos 549,5
Óleo 2,4 Asininos 47,1
Muares 208,5
FONTE: Companhia Nacional de Abastecimento Suínos 34.532,2
(Conab). Ovimos 19.955,9
Caprinos 12.159,6
Coelhos 6,1
FONTE: IBGE.
- 31 -
1.6.3 Dados Absolutos e Dados Relativos
Definições:
Dados Absolutos, são dados estatísticos resultantes da coleta direta da fonte, sem
outra manipulação se não a contagem ou medida. A leitura dos dados absolutos é
sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e
fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso
imprescindível que faz a Estatística dos dados relativos. O número de vezes que um valor
da variável, de uma pesquisa, é citado representa a freqüência absoluta daquele valor.
Dados Relativos são o resultado de comparações por quociente (razões) que se
estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de
percentagens, índices, coeficientes e taxas. A freqüência relativa é o quociente
entre a freqüência absoluta de uma variável e o total de citações de todas as variáveis da
pesquisa.
1.6.3.1 As percentagens
Consideremos a série:
Com esses dados, podemos formar uma nova coluna na série em estudo;
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão
matriculados no 1º grau, 8, aproximadamente, no 2º grau e 1 no 3º grau.
O emprego da percentagem é de grande valia quando é nosso intuito destacar a
participação da parte no todo.
- 32 -
Consideremos, agora, a série:
MATRÍCULAS NAS ESCOLAS
DA CIDADE A e B - 2007
Nº DE ALUNOS
CATEGORIAS
CIDADE A CIDADE B
Ensino Fundamental 19.286 38.660
Ensino Médio 1.681 3.399
Ensino Superior 234 424
Total 21.201 42.483
Dados fictícios.
Qual das cidades tem, comparativamente, maior número de alunos em cada período?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a
respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa fica
bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes
às percentagens, obtemos:
O que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo
número de alunos em cada grau.
Definição:
Os Índices são razões entre duas grandezas tais que uma não inclui a outra.
Exemplos:
→ Índice Cefálico = (diâm. transverso da cabeça diâm. longitudinal do crânio) x 100
→ Quociente Intelectual = (idade mental idade cronológica) x 100
→ Densidade Demográfica = população superfície
→ Índices Econômicos:
Produção per capta = valor total da produção população
- 33 -
1.6.3.3 Os Coeficientes
Definição:
Os Coeficientes são razões entre o número de ocorrências e o número total (número de
ocorrências e número de não ocorrências).
Exemplos:
→ Coeficiente de Natalidade = número de nascimentos população total
→ Coeficiente de Mortalidade = número de óbitos população total
→ Coeficientes Educacionais:
Coeficiente de evasão escolar = nº de alunos evadidos nº inicial de matrículas
1.6.3.4 Os Coeficientes
Definição:
As Taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1, 1000
etc.) para tornar o resultado mais inteligível..
Exemplos:
→ Taxa de Mortalidade = coeficiente de mortalidade x 1000
→ Taxa de Natalidade = coeficiente de natalidade x 1000
→ Taxa de Evasão Escolar = coeficiente de evasão escolar x 100
Exercício Resolvido:
O Estado A apresentou 733.986 matrículas na 1ª série, no início do ano de 1994, e
683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e 412.457
matrículas. Qual o Estado que apresentou maior evasão escolar?
A → TEE = (733.986 – 683.816) x 100 733.986 = 6,83 = 6,8%
B → TEE = (436.127 – 412.457) x 100 436.127 = 5,42 = 5,4%
O Estado que apresentou maior evasão escolar foi A.
FONTE: IBGE.
c. d.
VACINAÇÃO CONTRA A AQUECIMENTO DE UM MOTOR
POLIOMELITE - 1993 DE AVIÃO DE MARCA X
REGIÕES QUANTIDADE TEMPERATURA
MINUTOS
Norte 211.209 (ºC)
Nordeste 631.040 0 20
Sudeste 1.119.708 1 27
Sul 418.785 2 34
Centro-Oeste 185.823 3 41
4 49
FONTE: Ministério da Saúde. 5 56
6 63
Dados fictícios.
e.
PRODUÇÃO BRASILEIRA DE AÇO BRUTO
1991-93
QUANTIDADE (1.000 t)
PROCESSOS
1991 1992 1993
Oxigênio básico 17.934 18.849 19.698
Forno elétrico 4.274 4.637 5.065
EOF 409 448 444
f.
EXPORTAÇÃO BRASILEIRA
1985-1990-1995
IMPORTADORES 1991 1992 1993
América Latina 13,0 13,4 25,6
EUA e Canadá 28,2 26,3 22,2
Europa 33,9 35,2 20,7
Ásia e Oceania 10,9 17,7 15,4
África e Oriente Médio 14,0 8,8 5,5
- 35 -
3. Pesquise, junto à secretaria da faculdade, os dados necessários ao preenchimento da
tabela abaixo:
Nº DE DADOS RELATIVOS
ESCOLAS
ALUNOS POR. 1 POR 100
A 175 0,098 9,8
B 222 ... ...
C 202 ... ...
D 362 ... ...
E 280 ... ...
F 540 ... ...
Total 1781 1,000 100,0
Cálculos: A → 175 x 1 1781 = 0,098
- 36 -
ALUNOS
PERÍODOS %
MATRICULADOS
1ª 546
2ª 328
3ª 280
4ª 120
Total 1.274
MATRÍCULAS
PERÍODOS
MARÇO NOVEMBRO
1º 480 475
2º 458 456
3º 436 430
4º 420 420
Total 1.794 1.781
a. Calcule a taxa de evasão por período.
b. Calcule a taxa de evasão da faculdade.
11. São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que
sua área terrestre é de 248.256 km2, calcule a sua densidade demográfica.
12. Considere que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):
população: 15.957,6 mil habitantes;
- 37 -
superfície: 586.624 km2;
nascimentos: 292.036;
óbitos: 92.281.
Calcule:
a. o índice de densidade demográfica;
b. a taxa de natalidade; a taxa de mortalidade.
13. Uma frota de 40 caminhões, transportando, cada um, 8 toneladas, dirige-se a duas
cidades A e B. Na cidade A são descarregados 65% desses caminhões, por 7
homens, trabalhando 7 horas. Os caminhões restantes seguem para a cidade B, onde
4 homens gastam 5 horas para o seu descarregamento. Em que cidade se obteve
melhor produtividade?
14. Um professor preencheu um quadro, enviado pela D.F., com os seguintes dados:
Calcule:
a. a taxa de evasão, por período;
b. a taxa de evasão total;
c. a taxa de aprovação, por período;
d. a taxa de aprovação geral;
e. a taxa de recuperação, por período;
f. a taxa de recuperação geral;
g. a taxa de reprovação na recuperação geral;
h. a taxa de aprovação, sem a recuperação;
i. a taxa de retidos, sem a recuperação.
TABELA 1
ESTATURAS DE 40 ALUNOS DA FACULDADE A
166 160 161 150 162 160 165 167 164 160
162 168 161 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
1.6.5.2 Rol
Partindo dos dados acima – tabela primitiva – é difícil averiguar em torno de que valor
tende a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda,
quantos alunos se acham abaixo ou acima de uma dada estatura.
Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia exata do
comportamento do grupo como um todo, a partir dos dados não ordenados. A maneira
mais simples de organizar os dados é através de uma certa ordenação (crescente ou
decrescente). A tabela obtida através da ordenação dos dados recebe o nome de rol.
TABELA 2
ESTATURAS DE 40 ALUNOS DA FACULDADE A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora, podemos saber, com relativa facilidade, qual a menor estatura (173 cm); que a
amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor
particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há
uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda,
que há poucos valores abaixo de 155 cm e acima de 170 cm.
- 39 -
No exemplo que trabalhamos, a variável em questão, estatura, será observada e
estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna
e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido.
Denominamos freqüência o número de alunos que fica relacionado a um determinado
valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de
freqüência:
TABELA 3
ESTATURAS
FREQ
(cm)
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Mas o processo dado é ainda inconveniente, já que exige muito mais espaço, mesmo
quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a
solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos
valores em vários intervalos.
Assim, se um dos intervalos for, por exemplo, 154 158 —( ׀é um intervalo fechado à
esquerda e aberto à direita, tal que: 154 ≤ x < 158), em vez de dizermos que a estatura
de 1 aluno é de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157
cm, dizemos que 9 alunos têm estaturas entre 154, inclusive, e 158 cm.
Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em
Estatística, preferimos chamar os intervalos de classes.
Chamando de freqüência de uma classe o número de valores da variável pertencente à
classe, os dados da Tabela 3 podem ser dispostos como na Tabela 4, denominada
distribuição de freqüência com intervalos de classe:
Exemplo:
- 40 -
TABELA 4
ESTATURAS DE 40 ALUNOS
DA FACULDADE A - 2007
ESTATURAS
FREQUÊNCIA
(cm)
150 154 —׀ 4
154 158 —׀ 9
158 162 —׀ 11
162 166 —׀ 8
166 170 —׀ 5
170 174 —׀ 3
Total 40
Dados fictícios.
Notas:
Se nosso intuito é, desde o início, a obtenção de uma distribuição de freqüência
com intervalos de classe, basta, a partir da Tabela 1, fazemos uma tabulação.
Quando os dados estão organizados em uma distribuição de freqüência, são
comumente denominados dados agrupados.
Assim, em nosso exemplo, o intervalo 154 ι— 158 define a segunda classe (i = 2). Como
a distribuição é formada de seis classes, podemos afirmar que k = 6.
Nota:
- 41 -
Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do
IBGE, em termos desta quantidade até menos aquela, empregando, para isso, o
símbolo ( —׀inclusão de li e exclusão de Li). Assim, o indivíduo com uma estatura de
158 cm está incluído na terceira classe (i = 3) e não na segunda.
3) Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe é a
medida do intervalo que define a classe.
Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada
por hi. Assim:
hi = Li - li
Nota:
É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação:
AT hi = k
6) Ponto médio de uma classe (x i) é, como o próprio nome indica, o ponto que divide
o intervalo de classe em duas partes iguais.
Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites de
da classe (média aritmética):
xi = (li + Li) 2
Nota:
O ponto médio de uma classe é o valor que a representa.
- 42 -
A soma de todas as freqüências é representada pelo símbolo de somatório (∑):
∑(i=1 → k)fi = n
Para a distribuição em estudo, temos: ∑(i=1 → 6)fi = 40 ou ∑fi = 40
Podemos, agora, dar à distribuição de freqüência das estaturas dos quarenta alunos da
faculdade A, a seguinte representação tabular técnica:
TABELA 5
ESTATURAS DE 40 ALUNOS DA
FACULDADE A
ESTATURAS
i fi
(cm)
1 150 154 —׀ 4
2 154 158 —׀ 9
3 158 162 —׀ 11
4 162 166 —׀ 8
5 166 170 —׀ 5
6 170 174 —׀ 3
∑fi = 40
TABELA 6
ESTATURAS
fi
(cm)
3 5׀— ׀ 3
6 11׀— ׀ 4
12 22׀— ׀ 5
23 46׀— ׀ 6
47 90׀— ׀ 7
91 181׀— ׀ 8
182 362׀— ׀ 9
... ...
Além da regra de Sturges, existem outras fórmulas empíricas que pretendem resolver o
problema da determinação do número de classes que deve ter a distribuição (há quem
prefira: i = h). Entretanto, a verdade é que essas fórmulas não nos levam a uma
decisão final; esta vai depender, na realidade, de um julgamento pessoal, que deve estar
ligado à natureza dos dados, da unidade usada para expressa-los e, ainda, do objetivo
- 43 -
que se tem em vista, procurando, sempre que possível, evitar classe com freqüência nula
ou com freqüência relativa muito exagerada etc.
Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema
da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a
amplitude total pelo número de classes:
h ≈ AT / i
Quando o resultado não é exato, devemos arredondá-lo para mais.
Outro problema que surge é a escolha dos limites dos intervalos, os quais deverão ser
tais que forneçam, na medida do possível, para pontos médios, números que facilitem os
cálculos – números naturais.
Em nosso exemplo, temos:
Para n = 40, pela Tabela 6, i = 6 Logo: h = (173 -150) / 6 = 23/6 = 3,8 ≈ 4
Isto é, seis classes de intervalos iguais a 4.
Resolva:
1) As notas obtidas por 50 alunos de uma classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 4 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9
i NOTAS xi fi
1
0 2 —׀ 1 1
2
2 4 —׀ .... ....
3
4 6 —׀ .... ....
4
6 8 —׀ .... ....
5
8 10 —׀ .... ....
6
∑fi = 50
b. Agora responda:
1. Qual a amplitude amostral?
2. Qual a amplitude da distribuição?
3. Qual o número de classes da distribuição?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo da classe?
c. Complete:
1. h3 = .... 2. n = .... 3. l1 = .... 4. L3 = .... 5. x2 = .... 6. f5 = ....
- 44 -
1) Freqüências simples ou absolutas (fi) são os valores que realmente representam
o número de dados de cada classe.
Como vimos, a soma das freqüências simples é igual ao número total dos dados:
∑ fi = n
2) Freqüências relativas (fri) são os valores das razões entre as freqüências simples e
a freqüência total:
Como vimos, a soma das freqüências simples é igual ao número total dos dados:
fri = fi /∑ fi
- 45 -
O conhecimento dos vários tipos de freqüência ajuda-nos a responder a muitas questões
com relativa facilidade, como as seguintes:
a. Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm?
Esses são os valores da variável que formam a segunda classe. Como f 2 = 9, a
resposta é : 9 alunos.
b. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?
Esses valores são os que formam a primeira classe. Como fr 1 = 0,100, obtemos a
resposta multiplicando a freqüência relativa por 100:
0,100 x 100 = 10
Logo, a percentagem de alunos é 10%.
c. Quantos alunos têm estatura abaixo de 162?
É evidente que as estaturas consideradas são aquelas que formam as classes de
ordem 1, 2 e 3. Assim, o número de alunos é dado por:
F3 = ∑(i=1 → 3) fi = f1 + f2 + f3 F3 = 24
Portanto, 24 alunos têm estatura abaixo de 162 cm.
d. Quantos alunos têm estatura não-inferior a 158 cm? O número de alunos é dado por:
∑(i=1 → 6) fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27
Ou, então:
∑(i=1 → 6) fi – F2 = n - F2 = 40 – 13 = 27
xi fri
x1 f1
x2 f2
. .
. .
. .
xn fn
∑ fi = n
Exemplo:
Seja x a variável “número de cômodos das casas ocupadas por vinte famílias
entrevistadas”:
TABELA 9
i xi fi
1 2 4
2 3 7
3 4 5
4 5 2
- 46 -
5 6 1
6 7 1
∑ = 40
i xi fi fri Fi Fri
1 2 4 0,20 4 0,20
2 3 7 0,35 11 0,55
3 4 5 0,25 16 0,80
4 5 2 0,10 18 0,90
5 6 1 0,05 19 0,95
6 7 1 0,05 20 1,00
∑ = 20 ∑ = 1,00
Nota:
Se a variável toma numerosos valores distintos, é comum trata-la como uma
variável contínua, formando intervalos de classe de amplitude diferente de um.
Este tratamento (arbitrário) abrevia o trabalho, mas acarreta alguma perda de
precisão.
Resolva:
1) Complete a distribuição abaixo, determinando as freqüências simples:
i xi fi Fi
1 2 .... 2
2 3 .... 9
3 4 .... 21
4 5 .... 29
5 6 .... 34
∑ = 20
- 47 -
1) Conhecidas as notas de alunos:
84 68 33 52 47 73 68 61 73 77
74 71 81 91 65 55 57 35 85 88
59 80 41 50 53 65 76 85 73 60
67 41 78 56 94 35 45 55 64 74
65 94 66 48 39 69 89 86 42 54
Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e
10 para intervalo de classe.
- 48 -
xi 3 4 5 6 7 8
fi 2 5 12 10 8 3
Determine:
a. ∑ fi
b. As freqüências relativas;
c. As freqüências acumuladas;
d. As freqüências relativas acumuladas.
7) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:
ÁREAS
300 ι— 400 ι— 500 ι— 600 ι— 700 ι—800 ι— 900 ι— 1.000 ι— 1.100 ι— 1.2000
(m2)
Nº DE 14 46 58 76 68 62 48 22 6
LOTES
Nº ACIDENTES 0 1 2 3 4 5 6 7
Nº MOTORISTAS 20 10 16 9 6 5 3 1
Determine:
a. o número de motoristas que não sofreram nenhum acidente;
b. o número de motoristas que sofreram pelo menos 4 acidentes;
c. o número de motoristas que sofreram menos de 3 acidentes;
d. o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes;
e. a percentagem dos motoristas que sofreram no máximo 2 acidentes.
- 49 -
a.
i xi fi fri Fi
1 0 1 0,05 ....
2 1 .... 0,15 4
3 2 4 .... ....
4 3 .... 0,25 13
5 4 3 0,15 ....
6 5 2 .... 18
7 6 .... .... 19
8 7 .... .... ....
∑ = 20 ∑ = 1,00
b.
i CLASSES xi fi Fi fri
- 50 -
Definição:
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo
objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais
rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão que às séries.
Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência
entre os termos da série e determinada figura geométrica, de tal modo que cada
elemento da série seja representado por uma figura proporcional.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais
para ser realmente útil:
a. Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária,
assim como de traços desnecessários que possam levar o observador a uma análise
morosa ou com erros.
b. Clareza – o gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
c. Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo.
Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas.
1.7.1 Diagramas
Definição:
Os diagramas são gráficos geométricos de, no máximo, duas dimensões: para sua
construção, em geral, fazemos uso do sistema cartesiano.
PRODUÇÃO BRASILEIRA
DE ÓLEO DE DENDÊ
1987-92
QUANTIDADE
ANOS
(1.000 t)
1987 39,3
1988 39,1
1989 53,9
1990 65,1
1991 69,1
1992 59,5
FONTE: Agropalma.
- 51 -
Assim, um ano dado (x) e a respectiva quantidade (y) formam um par ordenado (x, y),
que pode ser representado num sistema cartesiano.
FONTE: Agropalma.
c.
- 52 -
1.7.1.2 Gráfico em Colunas ou em Barras
É a representação de uma série por meio de retângulos, dispostos verticalmente (em
colunas) ou horizontalmente (em barras).
Exemplos:
a. Gráfico em colunas
PRODUÇÃO BRASILEIRA DE
CARVÃO MINERAL BRUTO
1987-92
QUANTIDADE
ANOS PRODUZIDA
(1.000 t)
1989 18.196
1990 11.169
1991 10.468
1992 9.241
PRODUÇÃO BRASILEIRA DE
CARVÃO MINERAL BRUTO
1989-92
20000
mil toneladas
15000
10000
5000
0
1989 1990 1991 1992
- 53 -
b. Gráfico em Barras
EXPORTAÇÕES BRASILEIRAS
MARÇO-1995
VALOR
ESTADOS
(US$ milhões)
São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
FONTE: SECEX
EXPORTAÇÕES BRASILEIRAS
MARÇO - 1995
São Paulo
Minas Gerais
Espírito Santo
Paraná
Santa Catarina
FONTE: SECEX
Notas:
- 54 -
Sempre que os dizeres a serem inscritos são extensos, devemos dar preferência ao
gráfico em barras (séries geográficas e específicas). Porém, se ainda assim
preferirmos o gráfico em colunas, os dizeres deverão ser dispostos de baixo para
cima, nunca ao contrário.
A ordem a ser observada é a cronológica, se a série for histórica, e a
decrescente, se for geográfica ou categórica.
A distância entre as colunas (ou barras), por questões estéticas, não deverá ser
menor que a metade nem maior que os dois terços da largura (ou da altura) dos
retângulos.
40.000
30.000
US$ milhões
20.000 exportação
importação
10.000
- 55 -
0
1989 1990 1991 1992 1993
FONTE: Ministério da Fazenda.
Exemplo:
Dada a série:
- 56 -
REBANHO SUÍNO DO SUDESTE
REBANHO SUÍNO DO SUDESTE DO
DO BRASIL
BRASIL - 1992
1992
QUANTIDADE
ESTADOS
(mil Minas
cabeças)
Gerais
Notas:
O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
- 57 -
Exemplo:
→ Dada a série:
PRECIPITAÇÃO PLUVIOMÉTRICA
RECIFE - 1993
MESES MILÍMETROS
Janeiro 49,6
Fevereiro 93,1
Março 63,6
Abril 135,3
Maio 214,7
Junho 277,9
Julho 183,6
Agosto 161,3
Setembro 49,2
Outubro 40,8
Novembro 28,6
Dezembro 33,3
PRECIPITAÇÃO PLUVIOMÉTRICA
RECIFE - 1993
OUT
SET NOV
DEZ
AGO
JUL JAN
300
FEV
JUN
MAI MAR
ABR
FONTE: Ministério da Agricultura
- 58 -
1.7.3 Cartograma
O cartograma é a representação sobre uma carta geográfica.
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou políticas.
Distinguimos duas aplicações:
a. Representar dados absolutos (população) – neste caso, lançamos mão, em geral,
dos pontos, em número proporcional aos dados.
b. Representar dados relativos (densidade) – neste caso, lançamos mão, em geral,
de hachuras ou cores.
Exemplo:
- 59 -
Nota:
Quando os números absolutos a serem representados forem muito grandes, no
lugar de pontos podemos empregar hachuras.
1.7.4 Pictograma
O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua
forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de
figuras.
Exemplos:
- 60 -
1.7.5 Atividades Complementares
COMÉRCIO EXTERIOR
BRASIL – 1984-93
QUANTIDADE (1.000 t)
ANOS
EXPORTAÇÃO IMPORTAÇÃO
1984 141.737 53.988
1985 146.351 48.870
1986 133.832 60.597
1987 142.378 61.975
1988 169.666 58.085
1989 177.033 57.293
1990 168.095 57.184
1991 165.974 63.278
1992 167.295 68.059
1993 183.561 77.813
Total 1.794 1.781
Fonte: Min. Indústria, Comércio e Turismo.
FONTE: IBGE.
- 61 -
4. Represente as tabelas por meio de gráficos em setores:
a. b.
ÁREA TERRESTRE PRODUÇÃO DE FERRO GUSA
BRASIL BRASIL - 1993
RELATIVA UNIDADES DA PRODUÇÃO
REGIÕES
(%) FEDERAÇÃO (1.000 t)
Norte 45,25 Minas Gerais 12.888
Nordeste 18,28 Espírito Santo 3.174
Sudeste 10,85 Rio de Janeiro 5.008
Sul 6,76 São Paulo 2.912
Centro-Oeste 18,86
FONTE: Instituto Brasileiro de Siderurgia.
Total 100,00
FONTE: IBGE.
EXPORTAÇÃO BRASILEIRA
1985-1990-1995
NATUREZA
ANOS
PRÓPRIOS (%) ALUGADOS (%) CEDIDOS (%)
1990 62,7 22,9 14,4
1991 70,3 16,5 13,2
FONTE: IBGE.
- 62 -
2 MEDIDAS ESTATÍSTICAS
Definição:
Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número
deles:
X = xi n
Sendo:
X a média aritmética;
xi os valores da variável;
n o número de valores.
- 63 -
2.1.1.1 Dados Não-Agrupados
Quando desejamos conhecer a média dos dados não-agrupados, determinamos a média
aritmética simples.
Exemplos:
→ Sabendo-se que a produção leiteira diária de vaca A, durante uma semana, foi de 10,
14, 13, 15, 16, 18 e 1 litros, temos, para produção média da semana:
X = (10 + 14 + 13 + 15 + 16 + 18 +1) : 7 = 14
Logo: X = 14 litros
7
No exemplo anterior, temos:
i 1
d1 = (-4) + 0 + (-1) + ... + 7 = 0
- 64 -
2.1.1.3 Dados Agrupados
2.1.1.3.1 Sem Intervalos de Classe
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável
o número de filhos do sexo masculino:
TABELA 2.1
No DE
fi
MENINOS
0 2
1 6
2 10
3 12
4 4
∑ = 34
Neste caso, como as freqüências são números indicadores da intensidade de cada valor
da variável, elas funcionam como fator de ponderação, o que nos leva a calcular a média
aritmética ponderada, dada pela fórmula:
X = (∑ xifi) ÷ (∑ fi)
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna
correspondente ao produto xifi:
TABELA 2.2
xi fi xif i Temos, então: ∑ xifi = 78 e ∑ fi
0 2 0 Logo: X = (∑ xifi) ÷ (∑ fi) = 78 ÷ 34 = 2,3
1 6 6
2 10 20
3 12 36 Nota:
4 4 16 Sendo x uma variável discreta, como
∑ = 34 ∑ = 78 interpretar o resultado obtido, 2 meninos e 3 décimos
de menino?
O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem
2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade
numérica em relação ao número de meninos.
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
xi 1 2 3 4 5 6
fi 2 4 6 8 3 1
Temos:
xi fi xif i
1 2 2
2 4 ...
3 6 ...
4 8 ...
5 3 ... - 65 -
6 1 ...
∑ = ... ∑ = ...
Como: ∑ xifi = ...., ∑ xifi = .... e X = (∑ xifi) ÷ (∑ fi)
Temos: X = .... ÷ .... = 3,4
TABELA 2.3
ESTATURAS
i fi
(cm)
1 150 ι— 154 4
2 154 ι— 158 9
3 158 ι— 162 11
4 162 ι— 166 8
5 166 ι— 170 5
6 170 ι— 174 3
∑ = 40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os
pontos médios e outra para os pontos xifi:
TABELA 2.4
ESTATURAS
i fi xi xifi
(cm)
1 150 ι— 154 4 152 608
2 154 ι— 158 9 156 1.404
3 158 ι— 162 11 160 1.760
4 162 ι— 166 8 164 1.312
5 166 ι— 170 5 168 840
6 170 ι— 174 3 172 516
∑ = 40 ∑ = 6.440
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
Temos:
- 66 -
i xi fi xifi
1 500 8 4.000
2 .... 10 ....
3 .... 11 ....
4 .... 16 ....
5 .... 13 ....
6 .... 5 ....
7 1.100 1 ....
∑ = .... ∑ = ....
TABELA 2.5
ESTATURAS
i fi xi fi xifi
(cm)
1 150 ι— 154 4 152 -2 -8 0
2 154 ι— 158 9 156 -1 -9 -17
3 158 ι— 162 11 160 0 0 0
4 162 ι— 166 8 164 1 8 0
5 166 ι— 170 5 168 2 10 0
- 67 -
6 170 ι— 174 3 172 3 9 27
x0 = 160 ∑ = 40 ∑ = 10
Notas:
O processo breve, com a nova variável definida por nós, só pode ser usado em
distribuições que apresentam intervalos de classe de mesma amplitude.
O processo breve pode, também, ser aplicado para as distribuições sem intervalos
de classe, bastando fazer h = 1.
Exercício Resolvido:
Temos:
i xi fi yi xif i
1 500 8 -3 -24 0
2 600 10 -2 -20 0
3 700 1 -1 -11 -55
4 800 16 0 0 0
5 900 13 1 13 0
6 1.000 5 2 10 0
- 68 -
7 1.100 1 3 3 26
x0 = 800 ∑ = 64 ∑ = -29
Como: h = 100
Vem: X = x0 + (∑ yifi x h) ÷ (∑ fi) = 800 + (-29) 100 ÷ 64 = 754,69 = R$ 755,00
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
xi 30 ι— 50 ι— 70 ι— 90 ι— 110 ι— 130
fi 2 8 12 10 5
Temos:
i xi fi yi xif i
1 40 ... ... ...
2 ... ... ... ... ...
3 ... 12 ... ...
4 ... ... ... ...
5 ... ... 2 ... ...
x0 = ... ∑ = ... ∑ = ...
Como: h = ...
Vem: X = x0 + (∑ yifi x h) ÷ (∑ fi) = ... + ... x ... ÷ ... = 84,3
Emprego da Média
A média é utilizada quando:
a) Desejamos obter a medida de posição que possui a maior estabilidade;
b) Houver a necessidade de um tratamento algébrico ulterior.
Definição:
Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.
Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa indústria.
TABELA 2.5
ESTATURAS
i fi
(cm)
1 150 ι— 154 4
2 154 ι— 158 9
3 158 ι— 162 11
4 162 ι— 166 8
5 166 ι— 170 5
6 170 ι— 174 3
∑ = 40
Nota:
Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo,
o que faz uso da fórmula de Czuber:
Mo = l* + D1 ÷ (D1 + D2) x h*
Na qual:
l* é o limite inferior da classe modal;
h* é a amplitude da classe modal;
- 70 -
D1 = f* - f(ant);
D2 = f* - f(post).
Sendo:
f* a frequência simples da classe modal;
f(ant) a freqüência simples da classe anterior à classe modal;
f(post) a freqüência simples da classe posterior à classe modal.
Assim, para a distribuição da Tabela 1, temos: D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3
Donde: Mo = 158 + 2 (2 + 3) x 4 = 158 + 2 x 4 (2 + 3) = 158 + 8 ÷ 5 = 159,6 cm
Resolva:
Complete o esquema para o cálculo da moda da distribuição de freqüência:
CUSTOS
i fi
(R$)
1 450 ι— 550 8
2 550 ι— 650 10
3 650 ι— 750 11
4 750 ι— 850 16
5 850 ι— 950 13
6 950 ι— 1050 5
7 1050 ι— 1150 1
∑ = 64
Emprego da Moda
A moda é utilizada:
a) Quando desejamos obter uma medida rápida e aproximada de posição;
b) Quando a medida de posição deve ser o valor mais típico da distribuição.
Definição:
A mediana é outra medida de posição definida como o número que se encontra no
centro de uma série de números, estando estes dispostos segundo uma ordem. Em
outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem
de grandeza, é o valor situado de tal forma no conjunto que separa em dois
subconjuntos de mesmo número de elementos.
- 71 -
2.1.3.1 Dados Não-Agrupados
Dada uma série de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9
De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação
(crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo número de
elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa
série, há quatro elementos acima dele e quatro abaixo.
Temos, então: Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição,
qualquer dos números compreendidos entre os dois valores centrais da série.
Convencionou-se utilizar o ponto médio.
Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21
Tem para mediana a média aritmética entre 10 e 12.
Logo: Md = (10 + 12) ÷ 2 = 11
Verificamos que, estando ordenados os valores de uma série e sendo n o número de
elementos da série, o valor mediano será:
- o termo de ordem (n + 1) ÷ 2, se n for ímpar;
- a média aritmética dos termos de ordem n ÷ 2 e (n ÷ 2) + 1, se n for par.
Podemos comprovar tal fato nas séries dadas:
- para n = 9, temos (9 + 1) ÷ 2 = 5. Logo, a mediana é o quinto termo da série, isto é:
Md = 10
- para n = 8, temos 8 ÷ 2 = 4 e (8 ÷ 2) + 1= 5. Logo, a mediana é a média aritmética
do quarto e do quinto termos da série, isto é: Md = (10 + 2) ÷ 2 = 11
Notas:
O valor da mediana pode coincidir ou não com um elemento da série, como
vimos. Quando o número de elementos da série é ímpar, há coincidência. O
mesmo não acontece, porém, quando esse número é par.
A mediana e a média aritmética não têm, necessariamente, o mesmo valor. Na
primeira série apresentada, por exemplo, temos: X = 10,4 e Md = 10
A mediana, como vimos, depende da posição e não dos valores dos elementos na
série ordenada. Essa é uma das diferenças marcantes da mediana e a média (que
se deixa influenciar, e muito, pelos valores extremos). Essa propriedade das
medianas pode ser constatada através dos exemplos a seguir: 5, 7, 10, 13, 15
X = 10 e Md = 10
5, 7, 10, 13, 65 X= 20 e Md = 10
TABELA 2.6
Nº DE
fi Fi
MENINOS
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ = 34
Sendo: (∑ f1) ÷ 2 = 34 ÷ 2 = 17
A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2
da variável, sendo este o valor mediano. Logo: Md = 2 meninos
Nota:
No caso de existir uma freqüência acumulada (F1), tal que: F1 = (∑ f1) ÷ 2
A mediana será dada por: Md = (xi + xi + 1) ÷ 2
Isto é, a mediana será a média aritmética entre o valor da variável
correspondente a essa freqüência acumulada e o seguinte.
Exemplo:
TABELA 2.7
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑=8
Temos: 8 ÷ 2 = 4 = F3
Logo: Md = (15 + 16) ÷ 2 = 31 ÷ 2 = 15,5
Resolva:
1) Complete o esquema para o cálculo da mediana das distribuições:
a.
xi 2 4 6 8 10
- 73 -
fi 3 7 12 8 4
Temos:
xi fi Fi
2 3 ...
4 7 10
6 12 ...
8 8 30
10 4 ...
∑ = ...
Como: ∑ fi ÷ 2 = .... ÷ 2
Vem: Md = ....
TABELA 6
ESTATURAS
i fi Fi
(cm)
1 150 ι— 154 4 4
2 154 ι— 158 9 13
3 158 ι— 162 11 24 classe mediana
4 162 ι— 166 8 32
5 166 ι— 170 5 37
6 170 ι— 174 3 40
∑ = 40
Temos: (∑ f1) ÷ 2 = 40 ÷ 2 = 20
Como há 24 valores incluídos nas três primeiras classes da distribuição e como
pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos
que este deve estar localizado na terceira classe (i =3), supondo que as seqüências
dessas classes estejam uniformemente distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, z
partir do limite inferior, a distância:
(20 – 13) ÷ 11 x 4 = 7 ÷ 11 x 4
E a mediana será dada por:
- 74 -
Md = 158 + 7 x 11 ÷ 4 = 160,54 = 165 cm
Na prática, executamos os seguintes passos:
fi
F (ant ) h *
2
Md f *
f*
Na qual:
l* é o limite inferior da classe mediana;
F* (ant) é a freqüência acumulada da classe anterior à classe mediana;
f* é a freqüência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
Resolva:
1) Complete o esquema para o cálculo da mediana da distribuição de freqüência.
Temos:
i CUSTOS (R$) fi Fi
1 450 ι— 550 8 8
2 550 ι— 650 .... 18
3 650 ι— 750 .... ....
4 750 ι— 850 .... ....
5 850 ι— 950 .... ....
6 950 ι— 1.050 .... ....
7 1.050 ι— 1.150 .... ....
- 75 -
∑ =....
(∑ fi) ÷ 2= .... ÷ 2 = ....
l* = ...., F(ant) = .... e h* = ....
Logo: Md = .... + (.... - ....) .... ÷ .... = ....
Isto é: Md = R$ 769,00
Nota:
* No caso de existir uma freqüência acumulada exatamente igual a (∑ f i) ÷ 2, a
mediana será o limite superior da classe correspondente.
Exemplo:
i CLASSES fi Fi
1 0 ι— 10 1 1
2 10 ι— 20 3 4
3 20 ι— 30 9 13
4 30 ι— 40 7 20
5 40 ι— 50 4 24
6 50 ι— 60 2 26
∑ = 20
(∑ fi) ÷ 2 = 26 ÷ 2 = 13
Logo: Md = L* = 30
Emprego da Mediana
Empregamos a mediana quando:
a) desejamos obter o ponto que divide a distribuição em partes iguais;
b) há valores extremos que afetam de uma maneira acentuada a média;
c) a variável em estudo é salário.
- 76 -
Calcule:
I. a média; II. a mediana; III. a moda.
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8;
8,7 e 7,2.
Determine:
a) a nota média;
b) a nota mediana;
c) a nota modal.
xi 3 4 5 6 4 8
fi 4 8 11 10 8 3
Calcule:
a) a média;
b) a mediana;
c) a moda.
NOTAS 2 3 4 5 6 7 8 9 10
Nº DE
1 3 6 10 13 8 5 3 1
ALUNOS
Determine:
a) a nota média;
b) a nota mediana;
c) a nota modal.
b.
xi 50 58 66
fi 20 50 30
- 77 -
7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4,
15. Determine a soma dos desvios. -
11. Você fez dois trabalhos num semestre e obteve as notas 8,5 e 5,5. Qual deve ser a
nota que você deve tirar no 3º trabalho para que a média dos três seja 7:
12. Numa empresa, vinte operários têm salário de R$ 4.000,00 mensais; dez operários
têm salário de R$ 3.000,00 mensais e trinta têm salário de R$ 2.000,00 mensais.
Qual é o salário médio desses operários:
13. Explique a relação média aritmética e média ponderada. Pesquise caso necessário.
14. Numa grande empresa, em três setores pesquisados num determinado dia, foram
constatadas faltas de funcionários, assim distribuídos:
* 4% no setor administrativo;
* 8% no setor de produção;
* 12% no setor comercial.
Calcule a média de faltas desse dia, considerando que, no setor de produção, há 200
funcionários, o setor administrativo tem 50 funcionários e o setor comercial tem 75
funcionários.
15. Um carro, numa viagem, andou 5 horas a 60 km por hora. Determine a velocidade
horária média nessas 8 horas de viagem.
16. A média aritmética entre 50 números é igual a 38. Dois números são retirados: o
número 55 e o 21. Calcule a média aritmética dos números que restaram.
17. Um ourives fez uma liga fundindo 200 g de ouro 14 k (quilates) com 100 g de ouro 16
k. O número que dá a melhor aproximação em quilates de ouro obtido é:
- 78 -
a) 14,5 k b) 14,6 k xc) 14,7 k d) 15,0 k e) 15,5 k
18. Num concurso de vestibular para dois cursos A e B, compareceram 500 candidatos
para o curso A e 100 candidatos para o curso B. Na prova de Matemática, a média
aritmética geral, considerando os dois cursos, foi 4,0.
Mas, considerando apenas os candidatos ao curso A, a média cai para 3,8.
A média dos candidatos ao curso B, na prova de Matemática, foi:
a) 4,2 xb) 5,0 c) 5,2 d) 6,0 e) 6,2
19. Seja M a média aritmética de 15 números quaisquer. Subtraindo-se 10 unidades de
cada um desses números, obtêm-se 15 novos números, cuja média aritmética é:
a) M – 15 b) M + 150 xc) M – 10 d) M + 10 e) 10 M
20. Considere um grupo formado por cinco amigos com idade de 13, 13, 14, 14 e 15
anos. O que acontece com a média de idade desse grupo, se um sexto amigo com 16
anos juntar-se ao grupo?
a) Permanece a mesma b) Diminui 1 ano c) Aumenta 12 anos
d) Aumenta mais de 1 ano xe) Aumenta menos de 1 ano
- 79 -
temperatura média de duas cidades é a mesma, e igual a 24ºC. A outra poderá ter uma
variação pequena de temperatura e possuir, portanto, no que se refere à temperatura,
um clima mais favorável.
Vemos, então, que a média – ainda que considerada como um número que tem a
faculdade de representar uma série de valores – não pode, por si mesma, destacar o
grau de homogeneidade o heterogeneidade que existe entre os valores que compõem o
conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z:
x: 70, 70, 70, 70, 70.
y: 68, 69, 70, 71, 72.
z: 5, 15, 50, 120, 160.
Suas médias aritméticas são 70, 70 e 70.
Entretanto, é fácil notar que o conjunto x é mais homogêneo que os conjuntos y e z, já
que todos os valores são iguais à média.
O conjunto y, por sua vez, é mais homogêneo que o conjunto z, pois há menor
diversificação entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores
de uma variável em torno de um valor de tendência central tomado como ponto de
comparação, podemos dizer que o conjunto x apresenta dispersão ou variabilidade
nula e que o conjunto y apresenta uma dispersão ou variabilidade menor que o
conjunto z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o
coeficiente de variação.
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma
coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total,
maior a dispersão ou variabilidade dos valores da variável.
Relativamente aos três conjuntos de valores mencionados no início deste capítulo,
temos:
ATx = 70 – 70 = 0, (dispersão nula)
ATy = 72 – 68 = 4
ATz = 160 – 5 = 155
- 80 -
2.2.1.2 Dados Agrupados
* Sem intervalos de classe:
Neste caso, ainda temos: AT = x(máx) – x(mín)
Exemplo: Considerando a tabela abaixo:
xi 0 1 2 3 4
fi 2 6 12 7 3
Temos: AT = 4 – 0 = 4
TABELA 2.8
ESTATURAS
i fi
(cm)
1 150 ι— 154 4
2 154 ι— 158 9
3 158 ι— 162 11
4 162 ι— 166 8
5 166 ι— 170 5
6 170 ι— 174 3
∑ = 40
- 81 -
Ou, lembrando que ∑ fi = n S2 = ∑ (xi - X)2 ÷ n
Nota:
Quando nosso interesse não se restringe à descrição dos dados mas, partindo da
amostra, visamos tirar inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor n – 1 em lugar de n.
Podemos, ainda, com o intuito de conservar a definição, calcular a variância
usando o divisor de n e, em seguida, multiplicar o resultado por n ÷ (n – 1).
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em
unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático,
é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação
práticas, denominada desvio padrão, definida como a raiz quadrada da variância e
representada por s: S = √s2
Assim: √(∑ (xi - X)2 ÷ n) (1)
Nota:
Tanto o desvio padrão como a variância são usados como medidas de dispersão
ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha
em vista.
A variância é uma medida que tem pouca utilidade como estatística descritiva,
porém é extremamente importante na inferência estatística e em combinações de
amostras.
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua
compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a
média aritmética (X) é um número fracionário, o que torna pouco prático o cálculo das
quantidades (xi - X)2.
Podemos simplificar os cálculos fazendo uso da igualdade:
∑ (xi - X)2 = ∑ xi2 - (∑ xi)2 ÷ n
Assim, substituindo ∑ (xi - X)2 por seu equivalente em (1), obtemos:
s = √(∑ xi2 - (∑ xi)2 ÷ n)
que pode ser escrita do seguinte modo: s = √(∑ xi2 ÷ n - (∑ xi ÷ n)2) (2)
Não apenas este método é usualmente mais prático, como também mais preciso. Quando
a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do
erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo os
resultados do cálculo ser menos exatos do que quando a fórmula (2) é usada.
O desvio padrão goza de algumas propriedades, dentre as quais destacamos:
1) Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma
variável, o desvio padrão não se altera: yi = xi ± c sy = sx
2) Multiplicando-se todos os valores de uma variável por uma constante (diferente de
zero), o desvio padrão fica multiplicado por essa constante: yi = xi x c sy = c x sx
Essas propriedades nos permitem introduzir, no cálculo do desvio padrão, simplificações
úteis, como veremos mais adiante.
Para o cálculo do desvio padrão, consideremos os seguintes casos:
- 82 -
Tomemos como exemplo, o conjunto de valores da variável x:
40, 45, 48, 52, 54, 62, 70
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas
colunas: uma pra x1 e outra para x12. Assim:
TABELA 2.9
xi x12
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
∑ = 371 ∑ = 20.293
Como n = 7, temos:
s = √(∑ xi2 ÷ n - (∑ xi ÷ n)2) = √(20 ÷ 7 - (371÷ 7)2) = 9,486
Resolva:
1) Complete o esquema para o cálculo do desvio padrão, dados os valores da variável:8,
10, 11, 15, 16, 18
Temos:
xi x1 2
8 64
.... ....
.... ....
.... ....
.... ....
n = .... ∑ = .... ∑ = ....
O modo mais prático de se obter o desvio padrão é abrir, na tabela dada, uma coluna
para os produtos fixi e outra para fixi2, lembrando que para obter fixi2 basta multiplicar
cada fixi pelo seu respectivo xi. Assim:
TABELA 2.10
xi fi fi xi fi xi2
0 2 0 0
1 6 6 48
2 12 24 43
3 7 21 63
4 3 12 48
∑ = 30 ∑ = 63 ∑ = 165
Resolva:
1) Complete o esquema para o cálculo do desvio padrão da distribuição:
xi 1 2 3 4 5 6
fi 2 5 8 6 3 1
Temos:
xi fi f i xi f i xi2
1 2 2 2
2 .... .... ....
3 .... .... ....
4 .... .... ....
5 .... .... ....
6 .... .... ....
∑ = .... ∑ = .... ∑ = ....
Logo: s = √(∑ fixi2 / n - (∑ fixi / n)2) = √(.... / .... - (.... / ....)2) = 1,24
TABELA 2.11
ESTATURAS
i fi xi fixi f ixi2
(cm)
1 150 ι— 154 4 152 608 92.416
2 154 ι— 158 9 156 1.404 219.024
3 158 ι— 162 11 160 1.760 281.600
4 162 ι— 166 8 164 1.312 215.168
- 84 -
5 166 ι— 170 5 168 840 141.120
6 170 ι— 174 3 172 516 88.752
∑ = 40 ∑ = 6.440 ∑ = 1.038.080
TABELA 2.12
ESTATURAS
i fi xi yi fiyi fiyi2
(cm)
1 150 ι— 154 4 152 -2 -8 16
2 154 ι— 158 9 156 -1 -9 9
3 158 ι— 162 11 160 0 0 0
4 162 ι— 166 8 164 1 8 8
5 166 ι— 170 5 168 2 10 20
6 170 ι— 174 3 172 3 9 27
h = 40 ∑ = 40 ∑ = 10 ∑ = 80
Nota:
Valem as mesmas observações que fizemos para a média aritmética.
- 85 -
6) Aplicamos a fórmula.
Exercício resolvido:
1) Calcule o desvio padrão da distribuição, pelo processo breve.
Resolva:
1) Complete o esquema para o cálculo do desvio padrão da distribuição, pelo processo
breve:
CLASSES 30 ι— 50 ι— 70 ι— 90 ι— 110 ι— 130
fi 2 8 12 10 5
Temos:
i xi fi yi fiyi fiyi2
1 40 2 .... .... ....
2 .... .... .... .... ....
3 .... .... .... .... ....
4 .... .... .... .... ....
5 .... .... .... .... ....
h = .... ∑ = .... ∑ = .... ∑ = ....
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para uma série de valores cujo valor médio é
200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o
fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego
quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão ou variabilidade, quando expressa em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos ao seu valor médio, medida essa
denominada coeficiente de variação (CV):
- 86 -
CV = s/X x 100
Para a distribuição da Tabela 2.11, onde X = 161 cm e s = 5,57 cm, temos:
CV = 5,57 / 161 x 100 = 3,459
Daí: CV = 3,5%
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivíduos:
X s
ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2 kg
Temos:
CVE = 5 / 175 x 100 = 2,85%
CVP = 2 / 68 x 100 = 2,94%
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as
estaturas.
Nota:
Se bem que, para qualificar a dispersão de uma distribuição, seja mais proveitoso
o coeficiente de variação, não devemos deduzir daí que a variância e o desvio
padrão careçam de utilidade. Pelo contrário, são medidas muito úteis no
tratamento de assuntos relativos à inferência estatística, como já dissemos.
- 87 -
b.
CLASSES 1,5 ι— 1,6 ι— 1,7 ι— 1,8 ι— 1,9 ι— 2,0 ι— 2,1 ι— 2,2
fi 4 8 12 15 12 8 4
Nº DE CARAS 0 1 2 3 4 5
FREQÜÊNCIAS 1 14 34 29 16 3
CLASSES 2 ι— 6 ι— 10 ι— 14 ι— 18 ι— 22
fi 5 12 21 15 7
7) Calcule os desvios padrões das distribuições do exercício 8, capítulo 2.1.4.
8) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio
padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
9) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e
o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?
11) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão
igual 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm,
sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um
dos grupos? Qual o grupo mais homogêneo?
12) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um
coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?
A 26 32 28 30 27 31
B 15 45 19 42 31 22
- 88 -
16) Considere as idades dos alunos de 3 grupos A, B e C:
Então:
a) obtenha a média de idade de cada grupo;
b) calcule a variância de cada grupo;
c) calcule o desvio padrão de cada grupo.
17) Numa competição de salto triplo, três atletas disputavam apenas uma vaga para uma
olimpíada entre faculdades de uma cidade. Cada atleta fez 4 tentativas obtendo os
seguintes resultados:
18) Responda:
a) Quando numa pesquisa o desvio padrão é zero?
b) Quando que uma distribuição é considerada homogênea?
19) A tabela a seguir mostra o número de acertos numa prova com 10 questões
aplicadas numa turma com 50 alunos.
Nº da questão 1 2 3 4 5 6 7 8 9 10
Quantidade de 15 20 12 25 48 40 35 10 30 40
acertos
Obtenha:
a) a média de acertos por questão;
b) o desvio padrão dessa distribuição.
21) Numa escola é adotado o seguinte critério: a nota da primeira prova é multiplicada
por 1, a nota da segunda prova é multiplicada por 2 e a nota da última prova é
multiplicada por 3. Os resultados, após somados, são divididos por 6. Se a média
obtida por esse critério for maior ou igual a 6,5, o aluno é dispensado das atividades
- 89 -
de recuperação. Suponha que um aluno tenha tirado 6,3 na primeira prova e 4,5 na
segunda. Quanto precisará tirar na terceira para ser dispensado da recuperação?
Positivo
500,00 10
1.000,00 5
1.500,00 1
2.000,00 10
5.000,00 4
10.500,00 1
Total 31
3. PROBABILIDADE - Introdução
- 90 -
aleatória e das duas principais distribuições de probabilidades de variáveis discretas e
contínuas.
3.3 Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento
aleatório.
Assim, qualquer que seja E, se E S (E está contido em S), então E é um evento de S.
- 91 -
Exemplo:
No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
A = {2, 4, 6} S; logo, A é um evento de S.
B = {1, 2, 3, 4, 5, 6} S; logo, B é um evento certo de S (B = S).
C = {4} S; logo, C é um evento elementar de S;
D = S; logo, D é um evento impossível de S.
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser
definidos pelas sentenças:
“Obter um número par na face superior.”
“Obter um número menor ou igual a seis na face superior.”
“Obter o número 4 na face superior.”
“Obter um número maior que 6 na face superior.”
3.4 Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que
todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um
conjunto equiprovável.
Chamamos de probabilidade de um evento A (A S) o número real P(A), tal que:
P(A) = n(A) / n(S)
Onde:
n(A) é o número de elementos de A;
n(S) é o número de elementos de S.
Exemplos:
a. Considerando o lançamento de uma moeda e o evento A “obter cara", temos:
S = {Ca, Co} n(S) = 2
A = {Ca} n(A) = 1
Logo: P(A) = 1/2
O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos
50% de chance de que apareça cara na face superior.
Pelos exemplos que acabamos de ver, podemos concluir que, sendo n(S) = n:
a. a probabilidade do evento certo é igual a 1: P(S) = 1
b. a probabilidade do evento impossível é igual a zero: P() = 0
c. a probabilidade de um evento E qualquer (E S) é um número real P(E), tal que:
0 ≤ P(E) ≤ 1
d. a probabilidade de um evento E qualquer E qualquer é, lembrando que n(E) = 1:
P(E) = 1/n
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
- 93 -
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de
realização do segundo evento, a probabilidade de que tais eventos se realizem
simultaneamente é dada por: p = p1 x p2
Exemplo:
Lançamos dois dados. A probabilidade de obtermos 1 no primeiro dado é: p 1 = 1/6
A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é:
p = 1/6 x 1/6 = 1/36
3.8 Exercícios
1) Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho
de 52 cartas?
- 95 -
2) Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50.
Determine a probabilidade de:
a. o número ser divisível por 5;
b. o número terminar em 3;
c. o número ser divisível por 6 ou por 8;
d. o número ser divisível por 4 e por 6.
- 96 -
12) Uma moeda é lançada três vezes. Calcule a probabilidade de obtermos:
a. três caras;
b. duas caras e uma coroa;
c. uma cara somente;
d. nenhuma cara;
e. pelo menos uma cara;
f. no máximo uma cara.
14) Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50,
determine a probabilidade de, em uma extração ao acaso:
a. obtermos a bola de número 27;
b. obtermos uma bola de número par;
c. obtermos uma bola de número maior que 20;
d. obtermos uma bola de número menor ou igual a 20.
15) Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 apresentam defeitos.
a. Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma
defeituosa?
b. Se um freguês vai compras 2 geladeiras, qual é a probabilidade de levar 2
defeituosas?
c. Se um freguês vai compras 2 geladeiras, qual é a probabilidade de levar pelo
menos uma defeituosa?
18) Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma
peça é escolhida ao acaso. Calcule a probabilidade de que:
a. ela não tenha defeitos graves;
- 97 -
b. ela não tenha defeitos;
c. ela seja boa ou tenha defeitos graves.
19) Considere o mesmo lote do problema anterior. Retiram-se 2 peças ao acaso. Calcule
a probabilidade de que:
a. ambas sejam perfeitas;
b. pelo menos uma seja perfeita;
c. nenhuma tenha defeitos graves;
d. nenhuma seja perfeita.
- 98 -
matemática em seu tempo. Assim, foi admitido na Royal Society de Londres, que
congrega cientistas renomados do Reino Unido. Segundo os documentos da entidade, o
reverendo possuía amplo conhecimento de geometria e dominava todas as áreas da
matemática e filosofia da época.
A idéia de Bayes para o cálculo de probabilidades foi publicada postumamente pela Royal
Society com o título "Ensaio Voltado para Solução de um Problema na Doutrina do Acaso"
e é uma explicação de como ele abordava os problemas propostos pelos matemáticos
anteriores a ele. O trabalho passou a ser conhecido como Teorema de Bayes, uma
técnica de estatística e estimativa que virou uma lei fundamental da matemática.
Palpite calculado
Essencialmente o que a proposta do reverendo trazia de inovador era o caráter subjetivo
na previsão de um evento, ou seja, a opinião do matemático que manipula os números
entra de modo significativo nos cálculos. Essa opinião é baseada na quantidade de
informação que se tem nas mãos sobre as condições de ocorrer tal evento. As
informações vão definitivamente influenciar a previsão. Então, numa disputa de cara ou
coroa, por exemplo, todo mundo concorda que a chance de alguém ganhar é de 50%.
Mas se o trato for de jogar a moeda quatro vezes, o método bayesiano de fazer previsão
vai se ajustando a cada jogada. Se der "cara" nas duas primeiras jogadas, as chances
para as jogadas posteriores não serão mais meio-a-meio, segundo Bayes. Usando esse
método na previsão das chances de um time A vencer um time B, deve-se levar em
conta as informações que se tem sobre resultados anteriores a essa disputa, como
quantas vezes A venceu B, e as experiências e opiniões de especialistas sobre esse jogo,
o campeonato e os jogadores.
Usar o cálculo da probabilidade é justamente fazer palpites sobre determinados eventos,
se vão ocorrer ou não. Ele é considerado ciência porque estuda com lógica e
racionalidade as chances de um evento ocorrer.
Apesar de estar baseado rigidamente na lógica e na razão, o Teorema de Bayes passou
por várias controvérsias à medida que os estudos sobre probabilidade e estatística
evoluíam. Até hoje ele é criticado por incluir o caráter subjetivo - a opinião - no ajuste de
cálculos, e por isso ser "sem pé nem cabeça" do ponto de vista dos matemáticos
conservadores e compromissados com a objetividade.
Na época em que viveu, certamente o reverendo não tinha tanta necessidade de prever
riscos e benefícios de alguma aplicação financeira ou se algum veículo de locomoção teria
muita chance de quebrar ou não.
Hoje sua teoria pode ser aplicada a quase todas as áreas do conhecimento, nas
pesquisas científicas ou no cotidiano das pessoas. Autoridades de saúde pública não
podem deixar de usar os cálculos probabilísticos na previsão de alcance de uma
epidemia. As economias mundiais não vivem mais sem a previsão de inflação,
desemprego ou da alta ou baixa da cotação das moedas. Apesar de sempre terem sido
criticados, Thomas Bayes e suas idéias continuam desafiando a intuição e o "achismo"
nas nossas apostas e palpites diários.
Segundo o primeiro axioma do cálculo de probabilidades, valores probabilísticos de um
evento A qualquer não podem ser menores que zero nem maiores que 1 e a
probabilidade do evento certo é igual a 1. Em termos formais, temos: 0≤P(A)≤1. O valor
zero é atribuído ao evento impossível e os valores intermediários, aos eventos possíveis
ou incertos. A segunda lei diz que a probabilidade de qualquer evento ocorrer dentre um
número n de eventos alternativos mutuamente exclusivos A e B é igual à soma das
probabilidades dos eventos individuais. Formalmente: P(A ou B) = P(A) + P(B). A
terceira lei fala que a probabilidade de dois eventos A e B ocorrerem é igual à
multiplicação da probabilidade condicional P(A/B) – lê-se “probabilidade de A dado B” –
pela probabilidade de B, o que pode ser formalizado de modo simplificado assim:
P(AeB)=P(A/B)×P(B). Pelo mesmo raciocínio, P(B eA) = P(B/A) × P(A).
- 99 -
Do terceiro axioma, assumindo-se por comutação que P(AeB)= P(BeA), deduz-se o
teorema de Bayes que tem a seguinte formulação básica:
P(A/B) = P(B/A)/P(B) x P(A)
Nessa fórmula, a probabilidade do evento A ocorrer em vista do evento B (P(A/B)) é
dada por três fatores: a verossimilhança de A (a probabilidade de B dado A); a
probabilidade prévia de B; e a probabilidade prévia de A.
Tomemos o seguinte exemplo para nos ajudar a entender o uso do teorema de Bayes
para o cálculo da probabilidade de um evento: um médico avalia duas ocorrências
possíveis que podem estar se dando com um paciente que reclama de problemas
respiratórios. Considerando-se, para simplificar o exemplo, que há apenas duas
modalidades de problemas desse tipo, digamos bronquite e pneumonia, o raciocínio
empregado para se avaliar essas ocorrências em termos bayesianos parte das
probabilidades prévias desses eventos tal como dadas estatisticamente.
Assim, admitamos que a incidência de pneumonia (P(pn)) é muito mais rara que a de
bronquite (P(br)), digamos 100 vezes menos freqüente, segundo os registros
estatísticos. Em termos matemáticos, P(br) = 100/101 e P(pn) = 1/100.
Digamos, porém, que o paciente apresente um sintoma e1 que ocorra em 1 de cada 2
pacientes com pneumonia, mas apenas em 1 de cada 500 pacientes com bronquite.
Assim, a verossimilhança de cada um dos eventos será P(e1/pn) = 1/2 e P(e1/br) =
1/500.
- 100 -