Você está na página 1de 84

CENTRO UNIVERSITÁRIO DE ENSINO SUPERIOR DO AMAZONAS

COORDENAÇÃO DE CIENCIAS DA COMPUTAÇÃO

ESTATÍSTICA

Disciplina: Probabilidade e Estatística


2

Conteúdo

1 A natureza da estatística

2 População, amostra e amostragem

3 Representação gráfica de séries estatísticas

4 Distribuição de freqüência

5 Medidas de posição

6 Medidas de dispersão

7 Medidas de assimetria e curtose

8 Números índices

9 Probabilidade

10 Correlação e regressão linear simples


3

CAPÍTULO 1
A NATUREZA DA ESTATÍSTICA

A Estatística é a parte da Matemática Aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

 É uma ferramenta adequada para descrever os acontecimentos e tirar conclusões sobre os dados
coletados nas observações;
 Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos
coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem;
 Um instrumento fundamental para o estudo quantitativo e qualitativo dos fenômenos aleatórios e
coletivos, quaisquer que sejam seus campos de observação.

O significado da palavra Estatística – Um conjunto de dados numéricos relativos a uma categoria de


fatos, agrupados de forma que possam ser analisados.

1. PANORAMA HISTÓRICO

Todas as ciências têm suas raízes na história do homem.


A Matemática, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário,
empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante.
Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimento, de óbitos,
faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras aos povos, cobravam
impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”.
Envolviam aspectos quantitativos e qualitativos que eram de interesse do Estado, relativos á
necessidade de tomada de decisão face à realidade dos fatos registrados (tais como reservas de alimentos,
disponibilidade de armamentos e homens para a realização de um cerco ou resistência ao sítio que fosse
imposto, por exemplo).
Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas.
A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como
batizados, casamentos, funerais, originando as primeiras tabelas e os primeiros números relativos.
Nesta época o registro quantitativo - qualitativo dos dados se desprendeu do caráter de atendimento ao
controle do Estado, para aplicar-se a campos particulares de conhecimento;
No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente cientifica.
Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu
objetivo e suas relações com as ciências.
As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das
probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se
4

tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes
desse todo (amostra).
2. A ESTATÍSTICA NAS EMPRESAS

2.1. APLICAÇÕES:

As técnicas estatísticas, associadas com programas adequados de computação, constituem valiosos


instrumentos na administração.

 Lançamento de um novo produto no mercado – Pesquisa de mercado para conhecer as preferências


dos consumidores no mercado de interesse;
 Auditoria nos livros de uma empresa para se certificar de que os lançamentos refletem efetivamente
a situação financeira da companhia – Verifica uma amostra de documentos escolhidos aleatoriamente e,
com base nessa amostra, fazer inferências (tendências) sobre toda a população;
 Experiências para garantir que um novo remédio lançado no mercado é seguro e eficiente – Testar
um remédio consiste em tomar dois grupos tão semelhantes quando possível, e dar o remédio a um
grupo (grupo experimental), mas não ao outro (grupo de controle), e verificar então se os resultados nos
dois grupos são diferentes;
 Estatística na administração pública – Produto Interno Bruto (PIB) e o índice de Preço ao
Consumidor (IPC);
 Consultoria a um órgão de trânsito sobre a viabilidade e eficiência da instalação de controladores de
velocidade em pontos estratégico da cidade – Análise do registro de ocorrências definindo quando, onde,
de que forma para definirmos os locais estratégicos para investir em equipamento e pessoal.

A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu
administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu
tríplice trabalho de organizar, dirigir e controlar a empresa.
Através de sondagem, por meio de coleta de dados, podemos conhecer a realidade geográfica e social,
os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e
estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou
longo prazos.
A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser
adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da
qualidade do produto e mesmo dos possíveis lucros e/ou perdas.
Tudo isso que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de
garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho.
O esquema do planejamento é o plano, que pode ser resumido, com auxilio da Estatística, em tabelas e
gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatístico que lhes deram origem.

2.2. OBJETIVOS

 Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos
coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem;
 Descrever adequadamente todos os grandes grupos de pessoas, animais ou acontecimentos que
pretendemos estudar, tanto em relação aos padrões típicos como à variação esperada.
5

2.2.1. Por que um administrador deve estudar ESTATÍSTICA?


Para através de técnicas específicas ser capaz de saber:
 Como extrair informações significativas de pilhas de dados brutos;
 Como analisar tendência sobre a natureza de uma população com base em observações de uma
amostra dela extraída;
 Como predizer taxas de ocorrência de eventos aleatórios;
 Como entender e interpretar cálculos estatísticos efetuados por outras pessoas.

3. ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL

3.1. ESTATÍSTICA DESCRITIVA


É a parte da estatística que nos permite coletar, organizar e interpretar de uma maneira eficaz um
conjunto de dados de um fenômeno pesquisado. Permite-nos descrever adequadamente todos os grandes
grupos de pessoas, animais ou acontecimentos que pretendemos estudar, tanto em relação aos padrões
típicos como a variação esperada.
Utiliza de rol, tabelas, fórmulas para cálculos, gráficos que permitam descrever resumidamente os
fenômenos.

3.2. ESTATÍSTICA INFERENCIAL OU INDUTIVA


Consiste em obter e generalizar conclusões, a partir da análise e interpretação dos dados. Ou seja,
inferir propriedades para o todo (população) com base na parte (amostra). O processo de generalização está
associado a uma margem de incerteza devido ao fato de que a conclusão baseia-se em uma parcela do total
de observações.

4. MÉTODO

É um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja; Maneira de
ordenar a ação segundo certos princípios.

4.1. Método Científico – Ordem seguida na investigação, no estudo, na persecução de quaisquer fatos.
Dos métodos científicos podemos destacar o método experimental e o estatístico.

4.1.1. Método Experimental


Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo
que o pesquisador possa descobrir seus efeitos, caso existam. Aplicado no estudo da Física, da Química etc.

4.1.2. Método Estatístico


Aplicamos o método estatístico quando precisamos estudar fenômenos que se refere a um conjunto
onde suas características próprias estão sujeitas a condições peculiares e complexas, influenciados por
vários fatores.
Na impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-
as, registrando essas variações e procurando determinar, no resultado final, que influência cabem a cada
uma delas.
Exemplo: Determinação das causas que definem o preço de uma mercadoria.
6

As causas não são fixas, no momento da pesquisa. Não existe uma uniformidade dos salários, o
gosto dos consumidores não é constante, seria necessária a fixação do nível geral dos preços das outras
necessidades e outros fatores. Todas as causas variam.
5. FASES DO MÉTODO ESTATÍSTICO

Quando se pretende um estudo estatístico completo, existem diversas fases do trabalho que devem
ser desenvolvidas para se chegar aos resultados finais do estudo. Essas etapas ou operações são
chamadas fases do trabalho estatístico.

5.1 Definição do Problema


A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema
a ser estudado. Além de considerar minuciosamente o problema objeto do estudo, o analista deverá
examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação
de que necessita pode, muitas vezes, ser encontrada nesses últimos.

Exemplo: Um fabricante de sabonete, que deseja lançar um produto novo no mercado, poderia estar
interessado em um estudo sobre as características dos consumidores atuais. Não havendo estudos
semelhantes, ele deverá formular o problema com base em sua própria experiência.
Uma lista de fatores relevantes deverá resultar dessa investigação preliminar:
 Número de unidades consumidas por família em cada ano;
 Número médio de pessoas que compõe cada família;
 Número de membros adultos da família, as marcas preferidas e assim por diante.
Saber exatamente o que se pretende pesquisar é o mesmo que definir corretamente o problema.

5.2 Planejamento
O passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste
em determinar o procedimento necessário para resolver o problema e, em especial, como levantar
informações sobre o assunto objeto do estudo.
 Que dados deverão ser obtidos?
 Como obtê-los?
 O que será pesquisado?
 Quem participará da pesquisa? (Critérios de inclusão e exclusão)
 Em que setor geográfico será feita a pesquisa?
 Qual o grau de precisão exigido na pesquisa?
 Qual o tipo de amostragem?
 Qual o tamanho da amostra?
 Quais materiais serão necessários para realizar a pesquisa?
 Qual o tempo disponível para fazer a pesquisa?
 Qual o custo previsto?
 Qual a verba destinada ao projeto? Etc.

É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se pretende atingir. Mais
especificamente, na fase do planejamento a preocupação maior reside na escolha das perguntas, bem como
sua correta formulação, qualquer que seja a modalidade de coleta dos dados.
7

O planejamento pode ser dividido em: censitário que é utilizado quando a contagem for completa, ou por
amostragem quando for parcial.
Exemplos: Censitário → levantamento do IBGE.
Amostragem → opinião dos eleitores sobre o presidente.
5.3 Coleta de Dados
Após planejamento e análise do que se quer pesquisar, damos inicio à coleta dos dados numéricos
necessários à sua descrição.
Pode ser direta e indireta:
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos,
casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos
alunos de uma escola, quando os dados são coletados pelo próprio pesquisador através de questionários,
como é o caso do censo demográfico etc.
É classificada em:
a. Contínua (registro) - quando feita continuamente.
b. Periódica - quanto feita em intervalos constante de tempo, como os censos.
c. Ocasional - quanto feita extemporaneamente, a fim de atender a conjuntura ou a uma emergência,
como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta é indireta quando é inferida de elementos conhecidos (direta) e/ou do conhecimento de outros
fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a
mortalidade infantil, que é feita através de dados colhidos por outra coleta direta.

5.4 Crítica de Dados


Obtidos os dados, eles devem ser cuidadosamente criticados, á procura de possíveis falhas e
imperfeições, a fim de não incorremos em erros grosseiros, que possam influir sensivelmente nos resultados.
É externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação
das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da
coleta.

5.5 Apuração dos dados


Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser
manual ou eletrônica.

5.6 Exposição ou apresentação dos dados.


Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o
exame daquilo que está sendo objeto de tratamento estatístico.

5.7 Análise dos resultados


O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações
fornecidas por parte representativa do todo (amostra).

APRESENTAMOS O DIAGRAMA DA ESTATÍSTICA DESCRITIVA

Organização ou Tabulação Apresentação Tabela


Coleta
critica de dados dos dados dos dados
De Análise
dados
Gráfico
8

QUESTÕES
1. O que estatística?
2. Diferencie Estatística Descritiva de Estatística Inferencial.

CAPÍTULO 2
POPULAÇÃO, AMOSTRA E AMOSTRAGEM

1. POPULAÇÃO E AMOSTRA
1.1. População - é o conjunto de elementos (pessoas, coisas, objetos) que têm em comum uma
característica em estudo. A população pode ser:

i. Finita: quando apresenta um número limitado de indivíduos.


Exemplos: (a) A população constituída por todos os parafusos produzidos em uma fábrica em um
dia. (b) Nascimento de crianças em um dia em Manaus.

ii. Infinita: quando o número de observações for infinito.


Exemplo: A população constituída de todos os resultados (cara e coroa) em sucessivos lances de
uma moeda.

1.2. Amostra - é o conjunto de elementos retirados da população, suficientemente representativos dessa


população. Através da análise dessa amostra, estaremos aptos para analisar os resultados da
mesma forma que se estudássemos toda a população.
Eis alguns exemplos:

Exemplo 1:

"Os campos de aplicação da Estatística são muitos e


os mais variados."
 
Estudos de
mercado
 
O gerente de uma fábrica de detergentes pretende
lançar um novo produto para lavar louça, uma empresa
especialista em estudos de mercado é encarregada de
"estimar" a percentagem de potenciais de compradores
desse produto.

População: Conjunto de todos os agregados familiares do País.


9

Amostra: Conjunto de alguns agregados familiares, inquiridos pela empresa.


Problema: Pretende-se, a partir da percentagem de respostas afirmativas, dos inquiridos sobre a
compra do novo produto, obter uma estimativa do número de compradores na População.
Exemplo 2:
"Os campos de aplicação da Estatística são muitos e os mais variados."
Medicina
Pretende-
se
estudar o 
efeito de
um novo
medicam
ento para
curar
determina
da
doença. É
seleciona
do um
grupo de
20
doentes,
administr
ando-se o
novo
medicam
ento a 10
desses
doentes
escolhido
s ao
acaso e o
medicam
ento
habitual 
aos
restantes.

População: Conjunto de todos os doentes com a doença que o medicamento a estudar pretende
tratar.
Amostra: Conjunto dos 20 doentes selecionados.
Problema: Pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para
tomar uma decisão sobre qual dos medicamentos é melhor.
Exemplo 3:
"Os campos de aplicação da Estatística são muitos e os mais variados."
Controle de O administrador de uma fábrica de parafusos pretende assegurar-se de que a
Qualidade percentagem de peças defeituosas não excede um determinado valor, a partir do qual
determinada encomenda poderia ser rejeitada.
1

     
População: Conjunto de todos os parafusos fabricados ou a fabricar pela
fábrica, utilizando o mesmo processo.
Amostra: Conjunto de parafusos escolhidos ao acaso de entre o lote de
produzidos.
Problema:
Pretende-se, a partir da percentagem de parafusos
defeituosos presentes na amostra, "estimar" a percentagem
de defeituosos em toda a produção.

Exemplo 4:
"Os campos de aplicação da Estatística são muitos e os mais variados."
Pedagogia Um conjunto de pedagogos desenvolveu uma técnica nova para a aprendizagem da
leitura, na escola primária, a qual, segundo dizem, encurta o tempo de aprendizagem
relativamente ao método tradicional.
     
População: conjunto de todos os alunos que entram para a
escola primária, sem saber ler.
Amostra: conjunto de alunos de algumas escolas
selecionadas para este estudo. Os alunos foram
separados em dois grupos para se aplicarem as
duas técnicas em confronto.
Problema: do estudo da amostra, decidir qual a técnica
melhor.
Outros exemplos.

a. População: Todos os eleitores do estado do Amazonas.


Amostra: 3.000 eleitores entrevistados em uma pesquisa de opinião.

b. População: Todos os livros e lançamento anual de uma grande firma.


Amostra: Livros e lançamentos escolhidos aleatoriamente para auditoria.
c. População: Produtos de um fornecedor a serem embarcados.
Amostra: Inspeção de algumas peças de item escolhido aleatoriamente.

Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo.

2. AMOSTRAGEM

2.1. Amostragem Aleatória Simples


Este tipo de amostra é equivalente a um sorteio lotérico.

Exemplo: Vamos obter uma amostra representativa para pesquisa da estatura de noventa alunos de uma
escola:
a. Numeramos os alunos de 01 a 90 (numera-se a população).
1

b. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro


de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel retiramos, um a um,
nove números que formarão a amostra. Neste caso, 10% da população.

Quando o número de elementos da amostra é grande, utilizamos a Tabela de Números Aleatórios,


construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. A leitura
da tabela pode ser feita horizontalmente (da direita para esquerda ou vice-versa), verticalmente (de cima
para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho
de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo.

2.2. Amostragem proporcional estratificada


Muitas vezes a população se divide em sub-populações – estratos.

Exemplo: Supondo, que em uma sala de aula com noventa alunos, sendo que 54 são meninos e 36 são
meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo femin ino) e queremos uma amostra de 10%
da população. Logo, temos:
SEXO POPULAÇÃO 10% AMOSTRA
54  10
= 5,4
M 54 100 5
36  10
= 3,6
F 36 100 4
90  10
= 9,0
Total 90 100 9

2.3. Amostragem sistemática


Quando os elementos da população já se acham ordenados, não há a necessidade de construir o
sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as
linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por
um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.

Esta amostragem é semelhante à aleatória simples, mas a listagem é ordenada. Devemos seguir os
seguintes passos:

 Divide-se o tamanho da população (N) pelo tamanho da amostra (n), obtendo um intervalo de
retirada (k).
 sorteia-se o ponto de partida.
 a cada k elementos retira-se uma para amostra.

Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para
pertencer à amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da
população.

Exemplo: Suponhamos uma rua com 450 casas, das quais desejamos obter uma amostra formada por 25
casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento:
1

1º Passo: como 450/25 = 18, portanto o intervalo é 18.

2º Passo: escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento
sorteado para a amostra;

3º Passo: os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que
o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.

3. TIPO DE VARIÁVEIS
Variáveis podem ser classificadas da seguinte forma:

3.1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa,
ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas.

3.1.1. Variáveis discretas: características mensuráveis que podem assumir apenas um número
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros.
Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias
por litro de leite, número de cigarros fumados por dia.

3.1.2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala
contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser
medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo
(relógio), pressão arterial, idade.

3.2. Variáveis Qualitativas (ou categóricas): são as características que não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos. Podem ser nominais ou ordinais.

3.2.1. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos
olhos, fumante/não fumante, doente/sadio.

3.2.2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o,
2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro,
fevereiro,..., dezembro).

Outros exemplos:

O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o
sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não
significa que a variável sexo passou a ser quantitativa!
Exemplo dos ursos marrons (continuação):

No conjunto de dados ursos marrons, são qualitativas as variáveis sexo (nominal) e mês da
1

observação (ordinal); são quantitativas contínuas as demais: idade, comprimento da cabeça, largura
da cabeça, perímetro do pescoço, perímetro do tórax, altura e peso.

EXERCÍCIO
1) Amostragem estratificada. Em uma fábrica existem 180 funcionários, sendo: 8 no financeiro; 6 no fiscal; 4
no RH; 7 no CPD; 9 na Manutenção; 46 na Embalagem; 80 na Produção; 20 na Expedição. Crie uma
tabela que obtenha uma amostra de 80 funcionários.

2) Amostragem estratificada. O diretor de uma escola, na qual estão matriculados 280 meninos e 320
meninas, deseja conhecer as condições de vida extra-escolar de seus alunos e não dispõe de tempo
para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa
clientela. Obtenha, para este diretor, os elementos componentes da amostra.

3) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n 1= 40, n2 = 100
e n3 = 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra
foram retirados do 3º estrato, determine o número de elementos da amostra.

4) Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas, a partir da
amostragem sistemática?

5) De uma população de 480 elementos ordenados, retire uma amostra sistemática de tamanho 20.

6) Deseja-se retirar uma amostra sistemática de 10 unidades de uma população de tamanho 890.

7) Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (contínuas ou discretas):


a. Da População, alunos de uma cidade estuda-se a variável, cor de olhos.
b. Da População, estação meteorológica de uma cidade, estuda-se a variável, precipitação
pluviométrica, durante um ano.
c. Da População, Bolsa de Valores de São Paulo, estuda-se a variável, número de ações negociadas.
d. Da População, funcionários de uma empresa, estuda-se a variável, salários.
e. Da População, pregos produzidos por uma máquina, estuda-se a variável, comprimento.
f. Da População, casais residentes em uma cidade, estuda-se a variável, sexo dos filhos.
g. Da População, propriedades agrícolas do Brasil, estuda-se a variável, produção de algodão.
h. Da População, segmento de reta, estuda-se a variável, comprimento.
i. Da População, bibliotecas da cidade de São Paulo, estuda-se a variável, número de volumes.
j. Da População, aparelhos produzidos em uma linha de montagem, estuda-se a variável, número de
defeitos por unidade.
1

Tabela de Números Aleatórios


1
1

CAPÍTULO 3
REPRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICAS

1 TABELAS
É um quadro que resume um conjunto de observações.

Uma tabela compõe-se de:


a. corpo – conjunto de linhas e colunas que contêm informações sobre variável em estudo;
b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas;
d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que inscrevem nos
seus cruzamentos com as colunas;
e. casa ou célula – espaço destinado a um só número;
f. título – conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?,
Quando?, Onde?, localizado no topo da tabela.

Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as


chamadas, colocados, de preferência, no seu rodapé.

Exemplo:
PRODUÇÃO DE CAFÉ TÍTULO
BRASIL - 1998-02
PRODUÇÃO
ANOS CABEÇALHO
(1.000 t)
1998 2.535 CASA OU CÉLULA
CORPO 1999 2.665
2000 2.122 LINHAS
2001 3.750
2002 2.007
RODAPÉ FONTE: IBGE.

COLUNA COLUNA
INDICADORA NUMÉRICA

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:
o um traço horizontal ( - ) quando o valor é zero;
o três pontos ( ... ) quando não temos os dados;
o zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
o um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.
1

3.2 SÉRIES ESTATÍSTICAS


Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época,
do local ou da espécie.

2.1 Séries históricas, cronológicas, temporais ou marchas


Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo
variáveis.
Exemplo:
PRODUÇÃO DE FERTILIZANTES
FOSFATADOS – BRASIL
1996-00

ANOS QUANTIDADE (t)

1996 3.570.115
1997 4.504.201
1998 5.448.835
1999 4.373.226
2000 4.024.813
FONTE: Associação Nacional para Difusão de Adubos e
Corretivos Agrícolas.

2.2 Séries geográficas, espaciais, territoriais ou de localização


Descrevem os valores da variável, em determinado instante, discriminados segundo regiões.
Exemplo:
PRODUÇÃO DE OVOS DE
GALINHA NO BRASIL - 2001
QUANTIDADE
REGIÃO
2.3 Séries específicas ou (1.000 dúzias) categóricas
Descrevem os valores da Norte 66.092 variável, em determinado tempo e
local, discriminados segundo Nordeste 356.810 especificações ou categorias.
Exemplo: Sudeste 937.463
Sul
REBANHOS BRASILEIROS485.098
- 2001
Centro-Oeste 118.468
QUANTIDADE
ESPÉCIE
FONTE: IBGE
(1.000 dúzias)
Bovinos 139.599
Bufalinos 1.181
Eqüinos 5.855
Asininos 1.304
Muares 1.984
Suínos 32.121
Ovinos 20.085
Caprinos 11.313
Coelhos 909
FONTE: IBGE

3.3 SÉRIES CONJUGADAS


TABELA DE DUPLA ENTRADA

Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de
uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única
tabela, obtemos uma tabela de dupla entrada.
1

Exemplo:
TELEFONES INSTALADOS - 1999-2001
REGIÃO 1999 2000 2001
Norte 373.312 403.712 457.741
Nordeste 1.440.531 1.567.006 1.700.467
Sudeste 8.435.308 8.892.409 8.673.660
Sul 2.106.145 2.192.762 2.283.581
Centro-Oeste 803.013 849.401 944.075
Total 13.158.309 13.905.290 14.059.524
Fonte: IBGE

A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série
geográfico-histórica ou geográfico-temporal.

EXERCÍCIOS
1) Classifique as séries estatísticas:
a) b)
PRODUÇÃO DE BORRACHA NATURAL – AVICULTURA BRASILEIRA
1991-93 1992

ANOS TONELADAS NÚMERO


ESPÉCIES
(1.000 cabeças)
1991 29.543 Galinhas 204.160
1992 30.712 Galos, frangos, frangas e pintos 435.465
1993 40.663 Codornas 2.488
FONTE: IBGE FONTE: IBGE

c)
EXPORTAÇÃO BRASILEIRA
1985-1990-1995
1985 1990 1995
IMPORTADORES
% % %
América Latina 13,0 13,4 25,6
EUA e Canadá 28,2 26,3 22,2
Europa 33,9 35,2 20,7
Ásia e Oceania 10,9 17,7 15,4
África e Oriente Médio 14,0 8,8 5,5
Fonte: MIC e SECEX

2) Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t, oriundas


da Arábia Saudita, no valor de US$ 1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de
US$ 6.034.946.000; e 561.024 t, do Japão, no valor de US$ 1.518.843.000. Confeccione a série
correspondente e classifique-a, sabendo que os dados acima foram fornecidos pelo ministério da
fazenda.

Gráficos Estatísticos

A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos,
permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os
valores da série. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos
simplicidade, clareza e veracidade devem ser considerados, quando da elaboração de um gráfico.
1

Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma análise morosa ou com erros.

Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em
estudo.

Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo.

Diretrizes para a construção de um gráfico:

 O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-se acrescentar
subtítulos;
 A orientação geral dos gráficos deve ser da esquerda para a direita;
 As quantidades devem ser representadas por grandezas lineares;
 Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 (zero);
 Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do leitor ao longo
da leitura. Um tracejado muito cerrado dificulta o exame do gráfico;
 A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para cima;
 Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente lidos, partindo
da margem horizontal inferior ou da margem esquerda.

Leitura e interpretação de um gráfico:

 Declarar qual o fenômeno ou fenômenos representados, a região considerada, o período de tempo, a


fonte dos dados, etc.;
 Examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua execução, no conjunto
e nos detalhes;
 Analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o máximo e o
mínimo, assim como as mudanças mais bruscas;
 Investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato exposto é
estacionário;
 Procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproximado, etc.

Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.

3.1 Diagramas

São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de
séries estatísticas. Eles podem ser:
2

Gráficos em linhas ou lineares.

É um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de
dados constituem as chamadas séries históricas.

Exemplo: Vendas de televisões de tubo em R$ 1000,00 nos anos de 2001 a 2007 da empresa LL da
Amazônia Ltda, localizadas em Manaus.

Vendas de TV da Empresa LL - Manaus


Mil Reais
500
400
300
200
100
0
2001 2002 2003 2004 2005 2006 2007
Fonte: Fictícia

Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos
horizontalmente (em barras) ou verticalmente (em colunas).

 Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.

 Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados.

Se as legendas não são breves usa-se de preferência o gráfico em barras na horizontal. A ordem a
ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica.

Exemplo: População Brasileira nas décadas de 40 a 70 em milhões.


2

População Brasileira emMilhões

100
80
60
40
20
0
1940 1950 1960 1970
Fonte: Fictícia

Gráficos em colunas superpostas.

Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada
barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou
mais atributos.

São freqüentemente usados para representação de séries cronológicas com um grande número de
períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas
séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico.

Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a


parte interna da figura formada pelos gráficos desse fenômeno é denominada de área de excesso.

Exemplo: População urbana do Brasil por região de 1940 a 1980 (x 1000)


2

Gráficos em setores.

Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar
a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores
quantas são as partes.

Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico
em setores só deve ser empregado quando há, no máximo, sete dados.

Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.

Exemplo: Representar a série em gráficos de barras e gráfico de setor:

Matrículas nos cursos da Cidade A


2009
CATEGORIA N.º DE ALUNOS %
Alfabetização 25.286 62,90
Médio 11.681 29,06
Superior 3.234 8,04
Total 40.201 100,00
Fonte Fictícia

Representação em barras Representação em setores

Gráfico Polar

É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam em seu
desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao
longo do ano, ou da temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o ano, etc.

Exemplo: Movimento Mensal de Compras de uma agência em 2006.


Meses Valores
(R$ 1.000,00)
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
2

Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Fonte: dados Fictícios

Movimento Mensal de Compras de uma agência em 2006

Fonte: Dados Fictícios, em mil reais.


24

3.2 Estereogramas:

São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas
representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser
interpretado dada a pequena precisão que oferecem.

3.3 Pictogramas:
São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a
vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem
ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e
não de detalhes minuciosos. Veja o exemplo abaixo:
25

3.4 Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

Exemplo:
População da Região Sul do Brasil – 1990

População da Região Sul do Brasil – 1990

Densidade populacional da Região Sul do Brasil


26

EXERCÍCIOS
3) Faça a representação em linha dos dados contidos na série abaixo:
PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ
1987- 92

ANOS QUANTIDADE (1.000 t)

1987 39,3
1988 39,1
1989 53,1
1990 65,1
1991 69,1
1992 59,5
FONTE: Agropalma
4) Escolha o melhor tipo de gráfico para representar os vários tipos de séries.
a) Os dez Estados que fizeram maior número de Transplantes de rim em 98.
Estados No de
Transplantes
DF 34
BA 38
ES 56
PE 56
CE 87
PR 181
RJ 181
MG 231
SP 756
FONTE: Assoc. Brasileira de Transplante de Órgãos.

b) Área Terrestre do Brasil


REGIÃO PERCENTUAL
NORTE 45,25
NORDESTE 18,28
SUDESTE 10,85
SUL 6,76
CENTRO-OESTE 18,86
FONTE: IBGE

c) IMUNIZAÇÕES - DOSES APLICADAS POR MUNICÍPIO - 1997


MUNICÍPIO DOSES APLICADAS
ERECHIM 51.215
NOVO HAMBURGO 110.844
PORTO ALEGRE 615.317
RIO GRANDE 84.997
SANTA MARIA 107.701
FONTE: Minstério da Saúde.

d) COMÉRCIO EXTERIOR BRASIL - 1988/1993


Anos Exportação Importação
1988 169.666 58.085
1989 177.033 57.293
1990 168.095 57.184
1991 165.974 63.278
1992 167.295 68.059
1993 182.561 77.813
FONTE: Ministério da Indústria, Comércio e Turismo.
27

e) O estado das florestas do planeta e o que foi devastado pela ocupação humana - em milhões de
km.
Continente Área Desmatada Área Atual de
Florestas
Oceania 0,5 0,9
Ásia 10,8 4,3
África 4,5 2,3
Europa 6,8 9,6
América do Sul 2,9 6,8
América do Norte e 3,2 9,4
Central
FONTE: World Resources Institute

5) De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais,
assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar
esses dados, classifique e faça uma representação gráfica.

6) De acordo com Ministério da Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos
de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564.
Faça uma tabela para apresentar esses dados, classifique e faça uma representação gráfica.

7) Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia,
Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de
ensino, respectivamente, segundo o MEC. Faça uma tabela para apresentar esses dados, classifique e faça
uma representação gráfica.

8) Faça a representação gráfica em polar da série a seguir, em que a fonte é fictícia:


Precipitação pluviométrica
de Santa Maria – RS - 1999
Meses Precipitação (mm)
Janeiro 174,8
Fevereiro 36,9
Março 83,9
Abril 462,7
Maio 418,1
Junho 418,4
Julho 538,7
Agosto 323,8
Setembro 39,7
Outubro 66,1
Novembro 83,3
Dezembro 201,2

9) ENADE – 2006. A legislação de trânsito brasileira considera que o condutor de um veículo está dirigindo
alcoolizado quando o teor alcoólico de seu sangue excede 0,6 gramas de álcool por litro de sangue. O gráfico
abaixo mostra o processo de absorção e eliminação do álcool quando um indivíduo bebe, em um curto espaço
de tempo, de 1 a 4 latas de cerveja.
28

Considere as afirmativas a seguir.


I - O álcool é absorvido pelo organismo muito mais lentamente do que é eliminado.
II - Uma pessoa que vá dirigir imediatamente após a ingestão da bebida pode consumir, no máximo, duas latas de
cerveja.
III - Se uma pessoa toma rapidamente quatro latas de cerveja, o álcool contido na bebida só é completamente eliminado
após se passarem cerca de 7 horas da ingestão.
Está(ão) correta(s) a(s) afirmativa(s)
(A) II, apenas (B) I e II, apenas (C) I e III, apenas (D) II e III, apenas (E) I, II e III.

CAPÍTULO 4
DISTRIBUIÇÃO DE FREQÜÊNCIA

Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em grupos de classe
ou categorias convenientemente estabelecidas e numericamente ordenadas.

Nas distribuições de freqüência, os dados são agrupados segundo um critério de magnitude, em classe ou
pontos, permanecendo constante o fato, local e tempo, de tal forma que se possa determinar a percentagem
ou número, de cada classe. É um tipo de apresentação que condensa uma coleção de dados conforme as
freqüências ou repetições de seus valores.

A construção da distribuição de freqüência depende do tipo de dado com os quais se está lidando:
contínuos ou discretos.
29

O histograma mostra a Pirâmide etária relativa de homens e mulheres nos anos de 1997 e 2007.
1. DISTRIBUIÇÃO SEM INTERVALOS DE CLASSE
Distriduições em que não há uma necessidade de ordenar a variável em estudo em intervalos.
Digamos que um aluno ao fazer a avaliação institucional do CIESA, tem as seguintes opções péssimo,
ruim, bom, muito bom e ótimo . Portanto podemos organizar esse dados em uma distribuição de frequencia
sem intervalos de classe, veja o exemplo:
Exemplo 1: Na avaliação institucional do CIESA, temos o item “auto-avaliação dos alunos” de uma
determinada turma de Logística, vejam a tabela primitiva (dados coletados sem ordenação).
Ruim Ruim Bom Muito Bom Bom
Bom Bom Muito Bom Ótimo Ótimo
Bom Ruim Muito Bom Muito Bom Bom
Péssimo Muito Bom Ótimo Muito Bom Bom

Podemos organizar esses dados (rol):


Péssimo Bom Bom Muito Bom Muito Bom
Ruim Bom Bom Muito Bom Ótimo
30

Ruim Bom Bom Muito Bom Ótimo


Ruim Bom Muito Bom Muito Bom Ótimo

Com esses dados podemos construir uma distribuição de freqüência sem intervalos de classe:

Conceito Número de alunos


Péssimo 1
Ruim 3
Bom 7
Muito Bom 6
Ótimo 3
  20

Exemplo 2: Número de Partos Produzidos em uma maternidade, contagem diária durante um mês:
0; 1; 0; 2; 1; 4; 4; 1; 2; 1; 3; 2 ; 4; 4; 1; 4; 1; 2; 4; 2; 4; 4; 3; 2; 2; 4; 2; 3; 4; ;

ROL (ordenando os fenômenos)


0; 0; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4.

Número de partos Dias


0 2
1 6
2 8
3 4
4 10
Total 30

2. DISTRIBUIÇÃO DE FREQUENCIA COM INTERVALOS DE CLASSE


Distribuições em que ordenamos a variável em estudo em intervalos.

2.1 TABELA PRIMITIVA E ROL


Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que
compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores:

TABELA 1
ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm )
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
31

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela
primitiva.

A tabela obtida após a ordenação dos dados recebe o nome de rol.

TABELA 2
ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173
cm);
2.2 DISTRIBUIÇÃO DE FREQÜÊNCIA
Denominamos freqüência o número de vezes que o elemento fica relacionado a um determinado valor
da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência.

TABELA 3
Estat. Freq. Estat. Freq. Estat. Freq.
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1   
157 1 166 1 Total 40

O processo da tabela de freqüência dado é ainda inconveniente, já que exige muito espaço. A solução
é o agrupamento dos valores em vários intervalos, denominado: Distribuição de freqüência com intervalos de
classe:
TABELA 4
ESTATURA DE 40 ALUNOS DO
COLÉGIO A
Estaturas (cm) Freqüências
150 ├─ 154 4
154 ├─ 158 9
158 ├─ 162 11
162 ├─ 166 8
166 ├─ 170 5
170 ├─ 174 3
Total 40

Assim, se um dos intervalos for, por exemplo, 154 ├─ 158 (é um intervalo fechado à esquerda e
aberto à direita, diremos que nove alunos têm estaturas entre 154, inclusive, e 158 cm, exclusive.

Deste modo, estaremos agrupando os valores de variável em intervalos, sendo que, em Estatística,
preferimos chamar os intervalos de classes.

Atenção: o sinal ├─ significa que o número onde que está fechado é incluído na contagem, e o aberto é
excluído.
32

Ex. No intervalo de 150 cm (incluindo) a 154 cm ( excluindo este valor ) na Tabela 2 existem 4 alunos.
Representamos assim 150 ├─ 154.

2.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA COM CLASSE

Vantagens – Ganhamos em simplicidade e visualização.


Desvantagens – Perdemos em pormenores (detalhes)
– Os valores não aparecem individualmente.

2.3.1 CLASSE

Classe de freqüência ou, simplesmente, classes são intervalos de variação de variável.


Representadas simbolicamente por i, sendo i = 1,2,3,...,k (onde k é o número total de classes da
distribuição).

Classe: Agrupamento dos valores da variável em intervalos. Intervalos de variações da variável.


i = índice n.º de classes
k = n.º total de classes da distribuição.

2.3.2 LIMITES DE CLASSE

Determinamos limites de classe os extremos de cada classe.


Li = limite inferior
Ls = limite superior

Amplitude: Medida do intervalo observado da variável, da classe ou da amostra.

2.3.3 AMPLITUDE TOTAL DA AMOSTRA ( AT )

É a diferença entre o valor máximo e o valor mínimo da amostra:

AT= Xmáx – Xmin

Xmáx = valor máximo da amostra


Xmin = valor mínimo da amostra

Ex. Na tabela 2 a amplitude de variação amostral é de 173 – 150 = 23 cm.

2.3.4 AMPLITUDE DE UM INTERVALO DE CLASSE

É a medida do intervalo que define a classe


hi = Ls – Li

2.3.5 AMPLITUDE TOTAL DA DISTRIBUIÇÃO DE CLASSE (AT)

É a diferença entre o limite superior da última classe (máximo) e o limite inferior da primeira classe
(mínimo).
AT = L(máx) – L(min)
33

L (máx ) = Limite superior da última classe


L (mín) = Limite inferior da primeira classe

2.3.6 PONTO MÉDIO DE UMA CLASSE


Ponto que divide o intervalo de classe ao meio, ou seja, é o ponto que divide o intervalo de classe de
classe em duas partes iguais.
Li  Ls
xi =
2

2.3.7 FREQÜÊNCIA SIMPLES OU ABSOLUTA

É o número de observações correspondentes a essa classe ou a esse valor.

Soma de todas as freqüências.

 fi = n

Podemos, agora, dar a distribuição de freqüência das estaturas dos quarentas alunos do Colégio A a
seguinte representação tabular técnica:

TABELA 4.1
ESTATURA DE 40 ALUNOS DO COLÉGIO A
i Estaturas (cm) fi hi xi
1 150 ├─ 154 4 4 152
2 154 ├─ 158 9 4 156
3 158 ├─ 162 11 4 160
4 162 ├─ 166 8 4 164
5 166 ├─ 170 5 4 168
6 170 ├─ 174 3 4 172
    40    
L(máx ) 174
ℓ2 =154 ℓ (mín) 150-
L5 =170 AT 24

3 TIPOS DE FREQÜÊNCIAS PARA DISTRIBUIÇÃO COM CLASSES

Freqüência simples ou absoluta (fi) são os valores que realmente representam o número de dados de
cada classe.

Freqüência relativa (fr) são os valores das razões entre as freqüências simples de cada classe e o
somatório das freqüências, freqüência total.

fi
fr = . 100
f i

Freqüência acumulada (fac) é o total das freqüências de todos os valores inferiores ao limite superior
do intervalo de uma dada classe:
34

fac = f1 + f2 + … + fk

Freqüência acumulada relativa (frac) de uma classe é a freqüência acumulada da classe, dividida pela
freqüência total da distribuição.
f ac
frac = . 100
 fi
Considerando a Tabela 4, podemos montar a seguinte tabela com as freqüências estudadas:

TABELA 4.2
i Estaturas (cm) fi xi fr fac frac
1 150 ├─ 154 4 152 0,100 4 0,100
2 154 ├─ 158 9 156 0,225 13 0,325
3 158 ├─ 162 11 160 0,275 24 0,600
4 162 ├─ 166 8 164 0,200 32 0,800
5 166 ├─ 170 5 168 0,125 37 0,925
6 170 ├─ 174 3 172 0,075 40 1,000
    40    1,000   
ROTEIRO PARA ELABORAÇÃO DA TABELA DE FREQUÊNCIA COM CLASSE

1) Transformar os dados Brutos em rol;

2) Encontrar a Amplitude Amostral, AA;

3) Definir o nº de classes, para isso podemos usar as seguintes metodologia:

a) O número de classe é determinado pela raiz quadrada do número de observações*: k = n


b) A regra de Sturges descrita da seguinte forma, k = 1 + 3,3(log n);

AT
4) Determinar a amplitude do intervalo de classes, h= ;
k

5) Determinar os limites das classes;

6) Construir a tabela de freqüência conforme as classes.

7) BOM SENSO.

Número de Classe – Não existe regra fixa para se determinar o número de classe. STURGES
SUGERE uma Regra para determinação do número de classes desde que
se conheça o número de observações.

Obs.
K = 1 + 3,33 Log N
K = Nº de Classe
H = AT N = Nº de Elementos
K H = Intervalo de Classe
AT = Amplitude Total
35

Aplicando os conhecimentos coloque em rol crescente e construa uma distribuição de


freqüência continua.

Idade: 25, 25, 20, 21, 20, 28, 29, 30, 32, 24, 33, 34, 36, 38, 40, 42, 44, 50, 45, 48

Nº = 20 ( Nº de observações )
Valor Máximo = 50
Valor Mínimo = 20
AT = Max –Min
AT = 30

Calculando o nº de classe temos:

K = 1 + 3,33 Log N
K = 1 + 3,33 Log Ro
K = 1 + 3,33 ( 1,301029 )
K = 5,33 = 5 ( Nº de Classe que deverá ter a distribuição

Sendo o menor valor da série, devemos toma-lo como o primeiro elemento, ou seja o limite inferior
da 1º Classe. Como a amplitude é 6, somaremos ao limite inferior, o que nos dará o limite superior (
26). Assim sucessivamente até que o último número da série ( 50 ) esteja contido na última classe
da distribuição vejamos:

Idade ( anos ) Tabulação Freqüência ( fi)


20 | ------------ 26 6

26 | ------------ 32 3

32 | ------------ 38 4

38 | ------------ 44 3

44 | ------------ 50 4

20

EXERCÍCIO

1. Calcule as classes e Preencha a distribuição de freqüência:


36

Foi contado o nº de alunos por sala de aula para dimensionarmos a Escola,

38 49 26 7 41 52 47 46
46 9 22 8 22 24 16 25
16 41 20 12 51 12 19 30
23 20 27 48 31 26 52 41
52 22 49 21 33 51 16 29

i Nº de alunos No de salas ( fi ) xi fr fac frac


1 ├─ 14
2 ├─ 22
3 ├─ 30
4 ├─ 38
5 ├─ 46
6 ├─ 54

Responda:

a. Qual amplitude da distribuição (AT)?


b. Qual o limite inferior da 5ª classe?
c. Qual o limite superior da 2ª classe?
d. Qual a amplitude do 6º intervalo de classe (h i )?
e. fi = ?
f. Quantas salas existem com 30 alunos inclusive e 38 exclusive?
g. Quantas salas existem com 22 alunos inclusive e 46 exclusive?
h. Quanto por cento de salas tem entre 30 alunos inclusive e 46 exclusive?
4 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO

HISTOGRAMA

É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. À
distribuição da tabela 4 corresponde ao seguinte histograma.

POLÍGONO DE FREQÜÊNCIA

É um gráfico em linha, sendo as freqüências (fi) marcadas sobre perpendiculares ao eixo horizontal,
levantadas pelos pontos médios (xi) dos intervalos de classe. À distribuição da tabela 4 corresponde ao
seguinte polígono de freqüência.
37

POLÍGONO DE FREQÜÊNCIA ACUMULADA

É traçado marcando-se as freqüências acumuladas (fac) sobre perpendiculares ao eixo horizontal,


levantadas nos pontos correspondentes aos limites superiores (Li) dos intervalos de classe. Portanto, à
distribuição da tabela 4 corresponde ao seguinte polígono de freqüência acumulada.

EXERCÍCIO

1. O controle de qualidade de uma indústria selecionou 48 caixas na linha de produção e anotou em cada
caixa o número de peças defeituosas, obtendo os seguintes dados:
2 -0 -0 -4 -3 -0 -0 -1 -0 -0 -1 -1 -2 -1 -1 -1 -1 -1 -1 -0 -0 -0 -3 -0
-0 -0 -2 -0 -0 -1 -1 -2 -0 -2 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -1 -0
Determinar:
a) o rol;
b) a tabela de distribuição de freqüência sem intervalos;
c) qual a porcentagem de caixas que apresentam 2 ou mais peças defeituosas?

2. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo
o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve
os seguintes dados:
10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26
-24 -20 -7 -18 -17 -28 -35 -22 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 16 -12 -20

a) Monte a tabela de distribuição de freqüência com intervalos.


b) Faça uma análise dos resultados.

3. A amostra abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por
uma firma comercial:
38

14 -12 -11 -13 -14 -13 -12 -14 -13 -14 -11 -12 -12 -14 -10 -13 -15 -11 -15 -13 -16 -17 -14 -14
Forme uma distribuição de freqüências sem intervalos.

4. Considere os salários quinzenais de 100 funcionários da Empresa Yasmim Ltda (em US$):
151 -152 -154 -155 -158 -159 -159 -160 -161 -161 -161 -162 -163 -163 -163 -164 -165 -165 -165 -166 -166
-166 -166 -167 -167 -167 -167 -167 -168 -168 -168 -168 -168 -168 -168 -168 -168 -168 -169 -169 -169 -169
-169 -169 -169 -170 -170 -170 -170 -170 -170 -170 -171 -171 -171 -171 -172 -172 -172 -173 -173 -173 -174
-174 -174 -175 -175 -175 -175 -176 -176 -176 --176 -177 -177 -177 -177 -178 -178 -178 -179 -179 -180 -180
-180 -180 -181 -181 -181 -182 -182 -182 -183 -184 -185 -186 --187 -188 -190 -190

Pede-se determinar:
a) A amplitude amostral;
b) O número de classes;
c) A amplitude das classes;
d) Construir a tabela de distribuição de freqüências com as classes;
e) Qual a porcentagem de funcionários que ganham salários com valor igual ou superior a US$179;
f) Qual a porcentagem de funcionários que ganham salários com valores inferiores a US$163;
g) O histograma;
h) O polígono de freqüência;
i) Qual o ponto médio da 3ª classe.

5. O conjunto de dados amostrais a seguir fornece uma lista do número de minutos que 50 assinantes da
internet gastaram durante sua conexão mais recente.
50 29 72 7 36 30 19 67 46 42
41 41 59 17 44 30 56 37 31 39
18 56 11 77 69 21 54 33 54 44
40 34 56 22 39 80 23 39 31 88
78 17 73 7 28 62 29 51 53 20
Determine: (a) Construa uma distribuição de freqüência que tenha sete classes; (b) Faça o histograma.

6. Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes:

100 122 130 140 152 160 164 176 180 188 192 200 216
104 126 134 146 156 160 170 176 184 190 194 200 218
116 128 138 150 156 162 170 178 186 190 196 200
120 128 140 150 156 162 176 180 186 192 196 210

a) Construa uma distribuição de freqüências, com h = 20 e limite inferior para a primeira classe igual a
100.
b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$ 160,00
(exclusive)?
c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00 (inclusive) e R$
200,00 (exclusive)?
d) Faça o histograma, o polígono de freqüência e o polígono de freqüência acumulada.

7. Um administrador fez uma pesquisa de satisfação em sua empresa de um determinado item e obteve os seguintes
resultados:
Ruim Péssimo Bom Muito Bom Bom
Bom Bom Muito Bom Ruim Ruim
Bom Ruim Muito Bom Muito Bom Bom
Péssimo Muito Bom Ótimo Muito Bom Bom
39

Determine, (a) Uma distribuição de freqüência; (b) O histograma.

8. Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros):

Construa uma tabela sem intervalo de classe e determine:


a)  f i ;
b) as freqüências relativas (em percentuais);
c) as freqüências acumuladas;
d) as freqüências acumuladas (relativas em percentuais).

9. Dada as notas dos alunos da disciplina de Estatística em uma turma no CIESA:


7 7 8 8 8
7 7 8 8 9
7 7 8 8 9
7 7 8 8 9
Construa uma tabela e determine:
a)  f i ;
b) as freqüências relativas (em percentuais);
c) as freqüências acumuladas;
d) as freqüências acumuladas relativas (em percentuais).

QUESTÕES OBJETIVAS DOS CAPÍTULOS: 2, 3, 4

8. (SMV) Da população, aparelhos produzidos em uma linha de montagem, estuda-se a variável, número de
defeitos por unidade. A variáveis é:
a) Qualitativas ordinal;
b) Qualitativas nominal;
c) Quantitativas discretas;
d) Quantitativas contínuas.
e) N.D.A.

9. (SMV) Para a realização de uma auditoria em uma firma, 16 contas, dentre as 120 por elas mantidas,
foram aleatoriamente selecionadas para verificação da presença de erro ou não.
I. A população consiste de todas as contas mantidas pela firma.
II. A variável observada é do tipo qualitativa ordinal.
III. A amostra consiste das 16 contas selecionadas
Pode-se afirmar que:
a) Apenas I é correta.
b) Apenas II é correta.
c) Apenas III é correta.
d) Apenas I e III são correta.
e) I, II e III são corretas.
40

10. (SMV) O tipo de gráfico que procura demonstrar em figuras é:

a) Gráfico de setores b) Ogiva de Galton c)Gráfico Pictórico d)Cartograma e) Gráfico Polar

11. (SMV) Os intervalos de classe podem ser apresentados de várias maneiras, dentre as situações abaixo, a
correta é :
a) 5 – 10 compreende todos os valores entre 5 e 10, inclusive os extremos;
b) 5 – 10 compreende todos os valores entre 5 e 10, exclusive os extremos;
c) 5 |–| 10 compreende todos os valores entre 5 e 10, exclusive os extremos;
d) 5 |– 10 compreende todos os valores entre 5 e 10, exclusive o 5 e inclusive o 10;
e) 5 –| 10 compreende todos os valores entre 5 e 10, inclusive o 5 e exclusive o 10;

12. (J.A.) Marque a afirmativa correta


1-…(Três pontos),quando não se dispuser dos dados.
2-…(Três pontos),é quando se dispõe do dado.
3- – – (Traço) Quando o dado for nulo.
4- – – (Traço) Quando o dado existe.
Resposta:

a)Estão certas 1 e 3 b)Estão certas 1 e 4 c)Estão certas 2 e 3 d)Estão certas 2 e 4 e) N.D.A.

13. (SMV) Os dados abaixo, mostram a distribuição de freqüência d levantamento de dados sobre o salário de
50 funcionários de uma determinada empresa.
Quant. de salários mínimos Quant. de funcionários
2 |– 4 14
4 |– 6 16
6 |– 8 10
8 |– 10 07
10|– 12 03
50
É correto afirmar que;
a) 60% dos funcionários recebem menos do que 6 salários mínimos;
b) 20% dos funcionários recebem acima de 6 salários mínimos;
c) 5% dos funcionários recebem menos do que 3 salários mínimos;
d) 80% dos funcionários recebem de 6 a 8 salários mínimos.
e) N.D.A.

14. (SMV) ENADE


41

Das regiões estudadas, aquela que apresenta o maior percentual de jovens com carteira assinada, dentre os
jovens que são assalariados do setor privado, é:
a) Belo Horizonte b) Recife c) Distrito Federal d) São Paulo e) Salvador
42

CAPÍTULO 5
MEDIDAS DE POSIÇÃO

1. MÉDIA ARITMÉTICA - x

É o quociente da divisão da soma dos valores da variável pelo número deles:


x
 xi
n
Sendo xi os valores da variável e n o número de valores.

DADOS NÃO-AGRUPADOS

Determinamos a média aritmética simples.

Exemplo:
Sabendo-se que a produção leiteira diária da vaca A, durante a semana, foi de 10, 14, 13, 15, 16, 18, e
12 litros, temos, para produção média da semana:
10  14  13  15  16  18  12 98
x = = = 14.
7 7

Logo: x = 14 litros

DESVIO EM RELAÇÃO À MÉDIA

A diferença entre cada elemento de um conjunto de valores e a média aritmética.

di = xi – x

Exemplo:
d1 = 10 – 14 = – 4
d2 = 14 – 14 = 0
d3 = 13 – 14 = – 1
d4 = 15 – 14 = 1
d5 = 16 – 14 = 2
d6 = 18 – 14 = 4
d7 = 12 – 14 = – 2

PROPRIEDADE

O somatório dos desvios em relação a média é igual a zero


 x i  x  0

Do exemplo anterior vamos fazer o somatório:


  xi  x  = –4 + 0 –1 +1 +2 +4 –2 = 0
43

DADOS AGRUPADOS

Sem intervalos de classe

Consideramos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de
filhos do sexo masculino.
Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável,
elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada.
x
 xifi
 fi
xi fi xi fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
34 78

78
x=
34
 2,3  x = 2,3 meninos

Com intervalos de classe

Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe
coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio de fórmula:
x
 x ifi
 fi
onde xi é o ponto médio da classe.
i ESTATURAS (cm) fi xi xifi
1 150 ├── 154 4 152 608
2 154 ├── 158 9 156 1.404
3 158 ├── 162 11 160 1.760
4 162 ├── 166 8 164 1.312
5 166 ├── 170 5 168 840
6 170 ├── 174 3 172 516
      40 6.440

6440
x=
40
 161  x = 161 c

2. A MODA (Mo)
O valor que ocorre com maior freqüência em uma série de valores.

DADOS NÃO-AGRUPADOS
44

Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com
a definição, procurar o valor que mais se repete
A série de dados : 7, 8, 9, 10, 10, 10, 11, 12, 13, 15, tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum
apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13, que não apresenta moda (amodal).

Em outros casos, ao contrario, pode haver dois ou mais valores de concentração. Dizemos, então, que
a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 5, 7, 7, 7, 8, 9, temos duas modas: 4 e 7
(bimodal).

DADOS AGRUPADOS
Sem intervalos de classe

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino.
Filhos do sexo masculino
(xi) Número de famílias (fi)
0 2
1 6
2 10
3 12
4 4
 fi = 34

A freqüência máxima (12) corresponde o valor da variável 3.Logo, o número de filhos modal é3,Mo = 3.

Com intervalos de classe

Sendo:
f a freqüência simples da classe modal
fant a freqüência simples da classe anterior à classe modal
fant a freqüência simples da classe anterior à classe modal
É o valor dominante que está compreendido entre os limites da classe modal
Método para o cálculo da moda é dado pela fórmula de Czuber:

1
Mo  Li  .h
1   2
No qual:
Li é o limite inferior da classe modal
h é o intervalo de classe modal
 1 = f - fant
 2 = f - fpost
Exemplo: Calcular a moda usando a fórmula de Czuber.
i ESTATURAS (cm) fi
1 150 ├── 154 4
2 154 ├── 158 9
3 158 ├── 162 11
4 162 ├── 166 8
5 166 ├── 170 5
45

6 170 ├── 174 3


      = 40

3 A MEDIANA

É outra medida de posição definida como o número que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem.

3.1 DADOS NÃO-AGRUPADOS

Série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, o primeiro passo a ser dado é o de ordenação dos
valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Em seguida, tomamos aquele número central que apresenta o mesmo
número à direita e à esquerda. Temos, então: Md = 10.

Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos
números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.

Assim, a série de valores ordenados: 2, 6, 7, 10, 12, 13, 18, 21, tem para mediana a média aritmética
entre 10 e 12. Logo:

10  12 22
Md = = = 11
2 2

3.2 DADOS AGRUPADOS

3.2.1 Sem intervalos de classe

É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das


freqüências. É dada por
n
2

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino.
Filhos do sexo masculino Número de famílias
(xi) (fi) fac
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
34
Sendo: 34/ 2 = 17

A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor de 2 da variável,
sendo este o valor mediano. Logo,
Md = 2 meninos.

Exemplo: A distribuição mostra a nota de uma disciplina de uma turma


Nota (xi) Número de alunos fac
46

(fi)
5 3 3
6 5 8
7 4 12
8 3 15
9 1 16
16
16 67
Sendo, = 8 = fac2 , a mediana é Md = = 6,5.
2 2
A nota mediana desta turma é 6,5.

3.2.2 Com intervalos de classe

Neste caso o problema consiste em determinar o ponto do intervalo em que está


compreendida a mediana.
i ESTATURAS (cm) fi fac
1 150 ├── 154 4 4
2 154 ├── 158 9 13
3 158 ├── 162 11 24
4 162 ├── 166 8 32
5 166 ├── 170 5 37
6 170 ├── 174 3 40
      40

n 40
Temos : = = 20
2 2

Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20.º lugar, a partir do início da série, vemos que este deve estar localizado na
terceira classe (i = 3).
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4 (162 – 158), devemos tomar, a
partir do limite inferior, a distância.
Sendo:
n 
  f ant .h
Md = Li +  2 
f md
No qual:
Li é o limite inferior da classe mediana;
fant é a freqüência acumulada da classe anterior à classe mediana;
fmd é a freqüência simples da classe mediana;
h é a amplitude do intervalo da classe mediana;

Temos:
20  13
Md = 158 +  4 = 158 + 2,54 = 160,54
11
Isto é:
Md = 160,5 cm

Exercícios

1) Encontre a média dos seguintes conjuntos de observações.


a) X = {2, 3, 7, 8, 9}. R: 5,8
47

b) Y = {10, 15, 22, 18, 25, 16}. R: 17,67


c) Z = {1, 3, 6, 8}. R: 4,5
d) T = {1, 3, 6, 100}. R: 27,5

3.2 Encontre a média das notas na disciplina de Estatística Aplicada.

Notas na disciplina de
Estatística Aplicada
Notas fi
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02

3) Dados os conjuntos abaixo, calcule a média aritmética, mediana e moda.


A = {3, 5, 2, 1, 4, 7, 9}.
B = {6, 12, 15, 7, 6, 10}.
C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}.
D = {4, 4, 10, 5, 8, 5, 10, 8}.

4) Calcule a média aritmética, a mediana e a moda da distribuiçã o:


xi fi
2 3
4 5
5 8
7 6
10 2
Σfi = 24

5) Encontre a moda e a mediana das notas na disciplina de Estatística Aplicada.


.
Notas na disciplina de
Estatística Aplicada
Notas fi
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02

FONTE: Dados hipotéticos.

6) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Calcule a média


aritmética, a mediana e a moda.
Salários (R$) fi
400 ⌐ 500 12
500 ⌐ 600 15
600 ⌐ 700 8
700 ⌐ 800 3
48

800 ⌐ 900 1
900 ⌐ 1000 1
Σ = 40

7) Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros):

Construa uma tabela sem intervalo de classe e determine a média aritmética, a moda e a mediana (Nota.
A tabela já foi montada no capítulo anterior):

8) Uma pesquisa sobre os gastos semanais com refeições re alizados pelos funcionários de determinada
empresa está consolidada na tabela de distribuição abaixo:
Gastos semanais fi
(R$)
10,00 a 19,99 6
20,00 a 29,99 8
30,00 a 39,99 12
40,00 a 49,99 9
50,00 a 59,99 5
60,00 a 69,99 3

Determine:
a) a média aritmética;
b) a moda;
c) a mediana.

4 Medidas de Separatrizes

São números que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade
de elementos da série.

Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50%
dos valores da seqüência, é também uma medida de separatriz. Além da mediana, as outras medidas de
separatrizes que destacaremos são: quartis, decis e percentis.

Quartis

Se dividirmos a série ordenada em quatro partes, cada uma ficará com seus 25% de seus elementos.
Os elementos que separam estes grupos são chamados de quartis.

 O primeiro quartil, que indicaremos por Q1, separa a seqüência ordenada deixando 25% de seus
valores à esquerda e 75% de seus valores à direita.
 O segundo quartil, que indicaremos por Q2, separa a seqüência ordenada deixando 50% de seus
valores à esquerda e 50% de seus valores à direita. Portanto, o Q 2 é a Mediana da série.
49

 O terceiro quartil, que indicaremos por Q3, separa a seqüência ordenada deixando 75% de seus
valores à esquerda e 25% de seus valores à direita.

Decis

Se dividirmos a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos. Os
elementos que separam estes grupos são chamados de decis.

 O primeiro decil, que indicaremos por D1, separa a seqüência ordenada deixando 10% de seus valores
à esquerda e 90% de seus valores à direita.
 De modo análogo são definidos os outros decis.

Percentcis

Se dividirmos a série ordenada em cem partes, cada uma ficará com 1% de seus elementos. Os
elementos que separam estes grupos são chamados de centis ou percentis.

 O primeiro percentil, que indicaremos por P1, separa a seqüência ordenada deixando 1% de seus
valores à esquerda e 99% de seus valores à direita.
 De modo análogo são definidos os outros percentis.

Observamos que os quartis e decis são múltiplos dos percentis, então basta estabelecer uma relação entre
eles, ou seja, todas as medidas podem ser identificadas como percentis:

D1 = P10
D2 = P20
Q1 = P25 D3 = P30
D4 = P40
Q2 = P50 D5 = P50
D6 = P60
Q3 = P75 D7 = P70
D8 = P80
D9 = P90

4.1. Dados agrupados com intervalos de classe

Para obtermos a fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula de mediana:

i .n
 f ant
Pi = . L + 100
h
f

Sendo:
Pi – Percentil i (1, 2, 3, ..., 99);
50

L - limite inferior da classe que contém o percentil;


n – número de elementos da série ( Σfi);
fant – freqüência acumulada da classe anterior à classe que contém o percentil;
f - freqüência simples da classe que contém o percentil;
h - amplitude do intervalo da classe.

Exemplo: Calcule os quartis da tabela abaixo:


i ESTATURAS (cm) fi Fi
1 150 ├── 154 4 4
 Q1 2 154 ├── 158 9 13
3 158 ├── 162 11 24
 Q3 4 162 ├── 166 8 32
5 166 ├── 170 5 37
6 170 ├── 174 3 40
      = 40 .
O quartil 2 = Md , que calculamos anteriormente:

Primeiro Quartil  Q1 = P25


25 . n 25.40
Temos, =  =10
100 100
25.n
*  F(ant) 10  4   4
Q1 = P25 = . ℓ + 100 h * =. 154 + = 156,7 cm
9
f*

Terceiro Quartil  Q3 = P75

75 . n 75  40
Temos,   = =30
100 100
75 n
 F(ant)  30  24  4
Q3 = P25 = . ℓ* + 100 = 162 + = 165 cm
h* 8
f*
Exercício

9) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Calcule a Q1, Q2 e Q3.
Salários (R$) fi
400 ⌐ 500 12
500 ⌐ 600 15
600 ⌐ 700 8
700 ⌐ 800 3
800 ⌐ 900 1
900 ⌐ 1000 1
Σ = 40

10) Utilizando-se do enunciado abaixo, determine os valores do Primeiro Quartil, Terceiro Quartil, Primeiro
Decil e Nono Decil:

Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de
natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A
coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa
acumulada. Não existem observações coincidentes com os extremos das classes.
51

Classes P (%)
70 – 90 5
90 – 110 15
110 – 130 40
130 – 150 70
150 – 170 85
170 – 190 95
190 – 210 100
52

CAPÍTULO 6
MEDIDAS DE DISPERSÃO

1. Dispersão ou Variabilidade

Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável
em torno de um valor de tendência central tomado como ponto de comparação.

Exemplo 1: Consideremos os seguintes conjuntos de valores das variáveis x, y e z:


X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.

Calculando a média aritmética de cada um desses conjuntos, obtemos:


x
 x i  x = 350 = 70
n 5

y
 y i  y = 350 = 70
n 5

z
 z i  z = 350 = 70
n 5
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.

Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os
valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre
cada um de seus valores e a média representativa.
Podemos dizer então que o conjunto X apresenta dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou
de variabilidade.

2. Amplitude Total

É a diferença entre o maior e o menor dos valores da série. A utilização da amplitude total como
medida de dispersão é muito limitada, pois sendo uma medida que depende apenas dos valores externos, é
instável, não sendo afetada pela dispersão dos valores internos.

2.1 Dados não-agrupados


A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x(max.) – x(mín)

Exemplo 2: Para os valores: 40, 45, 48, 52, 54, 62 e 70.


Temos,
AT = 70 – 40 = 30  AT = 30
53

Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de
sua concentração. É evidente que, quanto maior a amplitude total, maior é a dispersão ou variabilidade dos
valores da variável.
Relativamente aos três conjuntos de valores mencionados no início:

ATx = 70 – 70 = 0 (dispersão nula)


ATy = 72 – 68 = 4
ATz = 160 – 5 = 155

2.2 Dados agrupados

2.2.1. Sem intervalos de classe

AT = x(max.) – x(mín.)

Exemplo 3: Considerando a tabela abaixo:


xi 0 1 2 3 4
fi 2 6 12 7 3

Temos:
AT = 4 – 0 = 4  AT = 4

2.2.2. Com intervalos de classe

Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite
inferior da primeira classe:

AT = L(max.) – ℓ(mín.)

Exemplo 4: Considerando a distribuição abaixo:


i ESTATURAS (cm) fi
1 150 ├── 154 4
2 154 ├── 158 9
3 158 ├── 162 11
4 162 ├── 166 8
5 166 ├── 170 5
6 170 ├── 174 3
      fi =40
Temos:
AT = 174 – 150 = 24
Logo:
AT = 24 cm

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado.
Ela é apenas uma indicação aproximada da dispersão ou variabilidade.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no
controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais
importante que a exatidão e a estabilidade.
3. Variância e Desvio Padrão
54

3.1 Introdução

Como já vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são,
na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a
totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por
isso mesmo, os mais geralmente empregados.

Variância (s2)
A variância leva em consideração os valores extremos e os valores intermediários, isto é, expressa
melhor os resultados obtidos. A variância relaciona os desvios em torno da média, ou, mais especificamente, é
a média aritmética dos quadrados dos desvios*.
 x  x  2 (da população)**
2   i
n

Quando temos dados descritos de uma da amostra e não da população, o denominador da


expressão deverá ser igual a (n – 1), em vez de n. A razão desse procedimento reside no fato de que,
utilizando-se o divisor (n – 1), obtém-se uma estatística melhor do parâmetro de população.
  xi  x  2 (amostra)
s 
2

n 1

s2 
1   x 2
 x i2   i  (forma prática)
ou
n 1  n 

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente; por isso,
tem pouca utilidade na estatística descritiva, mas é extremamente importante na inferência estatística e em
combinações de amostras.

Desvio padrão (s)


O desvio-padrão é a medida mais usada na comparação de diferenças entre conjuntos de dados, por
ter grande precisão. O desvio padrão determina a dispersão dos valores em relação à média e é calculado por
meio da raiz quadrada da variância.
DESVIO PADRÃO = VARIÂNCIA
Para dados amostrais:

s
 x i  x
2

n 1
1 
 x i2 
  x i  2 
ou s (forma prática)
n 1  n 

Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade.
O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em
combinações de amostras.
* Nota: Lembremos que  di = (xi – x ) = 0, por esse motivo usamos o quadrado dos desvios para definirmos a variância.
* *Nota: Não trabalharemos com dados populacionais neste curso.
Propriedades do desvio padrão

O desvio padrão goza de algumas propriedades, dentre as quais destacamos:


55

1ª) Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável, o desvio
padrão não se altera:
yi = xi  c  sy = sx

2ª) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio
padrão fica multiplicado por essa constante:
yi = c . xi  sy = c . sx
Essas propriedades nos permitem introduzir, no cálculo do desvio padrão, simplificações úteis.

3.2 Dados não-agrupados

Exemplo 5: Tomemos, como exemplo, o conjunto de valores da variável x:

40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para
xi e outra para xi2. Assim:
xi xi2
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
 = 371  = 20.293

O desvio padrão populacional é,

1 
 x i 
  xi  
2

=
1  3712 
s   = 10,25
2
 20293
n 1  n  7 1  7 

3.3 Dados agrupados

3.3.1 Sem intervalos de classe


56

Como, neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando a
fórmula:

x i  x fi
2
s  2 1 
 f i x i 
2
  fi xi  
2


s 2
 ou
n 1 n 1  n 

1 
 f i x i 
  fi xi  
2

 (forma prática)
s 2

n 1  n 

Exemplo 6: Consideremos a distribuição da tabela abaixo:

xi 0 1 2 3 4
fi 2 6 12 7 3

O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os
produtos fixi e outra para fixi2, lembrando que para obter fixi2 basta multiplicar cada fixi pelo seu respectivo xi.
Assim:

xi fi fixi fixi2
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
 = 30  = 63  = 165

O desvio padrão é:
1 
 f i x i 
  fixi  
2

=
1  63 
2
= 1,13
s 2
165  
n 1  n  30  1  30 

3.3.2 Com intervalos de classe

Exemplo 7: Tomemos como exemplo a amostra da distribuição da estatura de 40 alunos do colégio A,


calcular o desvio padrão amostral

I Estaturas (cm) fi xi fixi fixi2


1 150 ├─ 154 4 152 608 92.416
2 154 ├─ 158 9 156 1.404 219.024
3 158 ├─ 162 11 160 1.760 281.600
4 162 ├─ 166 8 164 1.312 215.168
5 166 ├─ 170 5 168 840 141.120
6 170 ├─ 174 3 172 516 88.752
  fi =40  fixi = 6.440  fixi = 1.038.080
2

Comecemos por abrir as colunas para xi (ponto médio), para fixi e para fixi2. Assim:
57

1   f x 2
 f i x i2   i i  =
1  6440 
2
= 5,64
s 1038080  
n 1  n  40  1  40 

Portanto,
s = 5,64 cm

4 Coeficiente de variação (CV)

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode
ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a
20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos
dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão dos dados em
termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV).

s
CV  100
x
Exemplo 8:
Para uma distribuição em que a média é 161 cm e s = 5,57 cm, temos o seguinte coeficiente de
variação:
5,57
CV = 100 = 3,5%
161

Diz- se que uma distribuição tem:


 Baixa dispersão: CV  15%
 Média dispersão: 15% < CV < 30%
 Alta dispersão: CV  30%

Exemplo 9: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivíduos, calcular os respectivos coeficientes de variação e compará-los, para saber qual obteve a maior
dispersão relativa.

x s
ESTATURA 175 cm 5,0 cm
PESO 68 kg 2,0 kg

Exercício
1) Calcule a amplitude total e o desvio padrão dos conjuntos de dados:
a. 1, 3, 5, 9
b. 20, 14, 15, 19, 21, 22, 20
c. –10, –6, 2, 3, 7, 9, 10

2) O número de carros vendidos por cada um dos vendedores de um negócio de automóveis durante um mês
particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Determinar (a) a média, (b) a mediana, (c) a
moda, (d) o desvio padrão.

3) A distribuição a seguir mostra como varia a idade de um grupo de jovens que participam de uma colônia de
férias. Determine (a) A amplitude total e (b) O desvio padrão.
58

Idade (anos) Número de Jovens


10 2
12 5
13 1
14 5
15 3
16 4

4) Calcule a amplitude e o desvio padrão das distribuições abaixo:


a) Em um período de um mês, há o seguinte registro de atendimentos de urgência em um hospital em Manaus.
xi 0 1 2 3 4
fi 1 5 10 8 2
b) Em uma amostra contendo crianças e jovens, temos a distribuição em classes:
Idade (anos) 2 ├─ 6 ├─ 10 ├─ 14 ├─ 18 ├─ 22
fi 5 12 21 15 7

5) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa
está consolidada na tabela de distribuição abaixo:

Gastos semanais (R$) fi


10,00 a 19,99 6
20,00 a 29,99 8
30,00 a 39,99 12
40,00 a 49,99 9
50,00 a 59,99 5
60,00 a 69,99 3
Determine:
(a) A média aritmética;
(b) A variância;
(c) O desvio padrão.

6) Para duas emissões de ações ordinárias da indústria eletrônica, o preço médio diário, no fechamento dos
negócios, durante um período de um mês, para as ações A, foi de R$ 150,00 com um desvio padrão de R$
5,00. Para as ações B, o preço médio foi de R$ 50,00 com um desvio padrão de R$ 3,00. Em relação ao nível
do preço, qual dos tipos de ações é mais variável?

Exercício Complementar
7) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma
certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140,
140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a média, (b) a
mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de variação, para este grupo de salários.

8) Considerando que foi extraída uma amostra aleatória simples de 10 alunos de uma grande escola, cuja variável
em estudo é a nota obtida em Matemática, obteve-se: 5, 7, 8, 6, 5, 4, 8, 9, 10 e 6. Determine a média da
amostra, a variância da amostra e o desvio padrão da amostra.

9) Dado os salários dos funcionários de uma determinada empresa.


Salários semanais para 100 operários não especializados
Salários semanais fi
140 |-- 160 7
160 |-- 180 20
180 |-- 200 33
59

200 |-- 220 25


220 |-- 240 11
240 |-- 260 4
∑fi =100
Calcule usando a definição:
a. A média aritmética;
b. A variância;
c. O desvio padrão.

10) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para
realizar a auditoria de 50 balanços contábeis. Calcular (a) a média, (b) o desvio padrão, para o tempo de
auditoria necessário para esta amostra de registro.
Tempo necessário para a auditoria de balanços contábeis.
Tempo de auditoria. Nº de balanços.
(min.) (fi)
10 |-- 20 3
20 |-- 30 5
30 |-- 40 10
40 |-- 50 12
50 |-- 60 20
Total 50

11) Considerando que as três distribuições hipotéticas apresentam os valores indicados abaixo:
DISTRIBUIÇÃO
A B
N = 200 N = 50
fx = 4000 fx = 500
fx2 = 85000 fx2 = 5450

a) Determine os indicadores: média aritmética, variância, desvio padrão e coeficiente de variação.


b) Baseado nos resultados encontrados mencione a distribuição que apresenta maior homogeneidade e a que
apresenta maior heterogeneidade.

12) A distribuição das alturas de um grupo de pessoas apresentou uma altura média de 182 cm e um desvio padrão
de 15 cm, enquanto que a distribuição dos pesos, apresentou um peso médio de 78 kg, com um desvio padrão
de 8 kg. Qual das duas distribuições apresentou maior dispersão? Por quê?

13) Considere as duas amostras abaixo:


Amostra “A”: 23; 32; 18; 14; 37; 11; 16; 5; 27; 34;
Amostra “B”: 132; 158; 220; 97; 114; 215; 238; 179; 108; 142; 150.
Determine para cada uma destas amostras:
a) média aritmética;
b) moda, mediana;
c) o desvio padrão;
d) qual dos processos apresenta maior variabilidade? Por quê?
60

CAPÍTULO 7
MEDIDAS DE ASSIMETRIA E CURTOSE

1. MEDIDAS DE ASSIMETRIA

Estas medidas referem-se à forma da curva de uma distribuição de freqüência, mais especificamente do
polígono de freqüência ou do histograma. Denomina-se assimetria o grau de afastamento de uma distribuição
da unidade de simetria.

 Simetria
Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda.

x = Md = Mo

 Assimetria

Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na cauda
esquerda ou na direita da curva de freqüências.

Assimetria à direita (ou positiva)


Em uma distribuição assimétrica positiva, ou assimetria à direita, tem-se:
Mo < Md < x

Mo Md x

Assimetria à esquerda (ou negativa)


Em uma distribuição assimétrica negativa, ou assimetria à esquerda, predominam valores inferiores à
Moda.
x < Md < Mo

x Md Mo
61

Observar que a Média “puxa” a cauda da Distribuição para seu lado, em função de ser a média uma medida
não resistente, ou seja, ser altamente sensível aos valores extremos da série de dados.

Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são:

1.1. COEFICIENTE DE ASSIMETRIA DE PEARSON


É uma medida de assimetria que não depende dos valores da variável em estudo, e portanto serve para
comparações entre distribuições diferentes.

3  ( x  Md )
As 
s
O valor em módulo do Coeficiente de Pearson indica a intensidade da assimetria, e o seu sinal indica a direção
da assimetria.

0,15  |As|  1 Assimetria Moderada


|As| > 1 Assimetria Forte
As < 0 Assimetria Negativa
As > 0 Assimetria Positiva

2. MEDIDAS DE ACHATAMENTO OU CURTOSE

A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização da


dispersão em uma distribuição. Esta medida quantifica a concentração ou dispersão dos valores de um
conjunto de dados em relação às medidas de tendência central em uma distribuição de freqüências.

Para uma distribuição de freqüências, o Coeficiente percentílico de curtose pode ser calculado conforme a
fórmula abaixo:
Q 3  Q1
C
2(P90  P10 )
Denominamos Curtose o grau de achatamento de uma distribuição em relação à Distribuição Normal. A
distribuição de referência (Distribuição Normal) é denominada MESOCÚRTICA (Meso = Meio, Central, etc).
Quando a distribuição apresenta uma curva de freqüência mais fechada (mais aguda em sua parte superior),
ela é denominada LEPTOCÚRTICA (Lepto = Delgado, Alongado, Magro, etc). Quando a distribuição apresenta
uma curva de freqüência mais aberta (mais achatada em sua parte superior), ela é denominada PLATICÚRTICA
(Plato = Chato, Plano, Largo, etc).

Uma distribuição é classificada quanto ao grau de achatamento como:


 Leptocúrtica: quando a distribuição apresenta uma curva de freqüência bastante fechada, com os dados
fortemente concentrados em torno de seu centro, C < 0,263.
 Mesocúrtica: quando os dados estão razoavelmente concentrados em torno de seu centro, C = 0,263.
 Platicúrtica: quando a distribuição apresenta uma curva de freqüência mais aberta, com os dados
fracamente concen em torno de seu centro, C > 0,263.
62

Exercício
1. Uma distribuição de freqüência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2,12. Calcule
o coeficiente de assimetria.

2. Calcule o coeficiente de assimetria de cada distribuição.


Distribuição A
Peso (kg) Fi
2 ├─ 6 6
6 ├─ 10 12
10 ├─ 14 24
14 ├─ 18 12
18 ├─ 22 6
60
x = ......
Md = .......
Mo = .......
s = .......
As = .......

Distribuição B
Peso (kg) fi
2 ├─ 6 6
6 ├─ 10 12
10 ├─ 14 24
14 ├─ 18 30
18 ├─ 22 6
78
x = ......
Md = .......
Mo = .......
s = .......
As = .......

Distribuição C
Peso (kg) fi
2 ├─ 6 6
6 ├─ 10 30
10 ├─ 14 24
14 ├─ 18 12
18 ├─ 22 6
78
x = ......
Md = .......
Mo = .......
s = .......
As = .......

3. Dada a distribuição de peso dos funcionários de uma determinada empresa:


63

PESO (kg) 50|----- 60 60|----- 70 70|----- 80 80|----- 90 90|----100


FUNCIONÁRIOS 5 10 15 8 3
Determine:
a) A média aritmética;
b) A mediana;
c) O coeficiente de assimetria;
d) a distribuição é simétrica? Justifique a sua resposta.

QUESTÕES OBJETIVAS DOS CAPÍTULOS: 5, 6, 7

4. A média de uma série de valores iguais a uma constante é:


a) Zero;
b) A unidade;
c) Não é possível calcular;
d) O valor da constante;
e) N.D.A.

5. (FISCAL DE TRIBUTOS DE MG-96) Um candidato obteve, nas diversas provas de um concurso, as seguintes
notas com os respectivos pesos:
Matéria Nota Peso
Português 66 3
Contabilidade 63 3
Estatística X 2
Direito 79 2
A média aritmética ponderada, obtida pelo candidato foi de 69,3. A nota que o candidato obteve em Estatística
foi de:
a) 66
b) 68
c) 70
d) 72
e) 74

6. Dentre as medidas de posição, aquela que apresenta sempre a mesma quantidade de elementos, à sua
esquerda e à sua direita é:
a) A moda
b) A mediana
c) A média aritmética
d) A variância
e) N.D.A.

7. Numa curva simétrica, podemos afirmar que:


a) a média é maior que a moda, que por sua vez é maior que a mediana;
b) a média é menor que a moda, que por sua vez é menor que a mediana;
c) a média, a moda e a mediana são medidas iguais;
d) a média é igual a moda e a mediana é nula;
e) N.D.A.
64

8. O desvio padrão de um conjunto de dados é 9. A variância será:


a) 3
b) 36
c) 18
d) 81
e) N.D.A.

9. (Controladoria de arrecadação RJ 2004 FJG) Os valores de uma amostra de cinco elementos são: 4, 3, 3,
5, 5. A variância dessa amostra é de:
a) 4,00
b) 3,00
c) 2,33
d) 1,00
e) N.D.A.

10.
11. Sabe-se que uma distribuição apresentou as seguintes medidas:
Q1 = 24,4cm Q3 = 41,2cm P10=20,2cm P90 = 49.5cm,
com tais medidas a curtose é :
a) Leptocúrtica
b) Platicúrtica
c) Mesocúrtica
d) Assimétrica.
e) N.D.A.
65

CAPÍTULO 8
CAPÍTULO 9

PROBABILIDADE

1 Histórico

Os primeiros estudos matemáticos sobre probabilidades foram feitos pelos italianos Cardano (1501 - 1576)
e Galileu Galilei (1564 - 1642) e tratavam dos jogos de dados.
Em 1654, o francês Pascal (1612 -1668) foi procurado por Chevalier de Méré amigo seu e jogador
profissional, que lhe apresentou questões do tipo: “Em oito lances de um dado, um jogador deve tentar o
número 1, mas, depois de três tentativas fracassadas, o jogo é interrompido por seu oponente. Como ele
poderia ser indenizado?”. Resolvido os problemas de Méré, Pascal escreveu a seu amigo Fermat (1601 -
1665) expondo-lhe vários problemas. Essa correspondência entre os dois, onde encontram-se inúmeros
problemas de probabilidade resolvidos, foi o ponto de partida para a moderna teoria das Probabilidades. As
idéias centenárias de Cardano foram esquecidas. Pascal e Fermat nada publicaram a respeito, mas o
holandês Huygins (1629 - 1695), tendo conhecimento desses estudos, passou a interessar-se e, em 1657,
publicou “Sobre o raciocínio em jogo de dados”, o primeiro livro sobre a Teoria das Probabilidades. Dentre os
matemáticos que contribuíram para a evolução dessa teoria destacam-se: o suíço Bernoulli (1654-1705), o
francês Moivre (1667 - 1754), o francês Laplace (1749 - 1827) e os Russos Tchebycheff (1821 - 1894) e
Markov (1856 - 1922).
Atualmente, a Teoria das Probabilidades tem muita importância e várias aplicações em estatística,
economia, engenharia, física, química, sociologia, biologia e vários outros campos do conhecimento.

2 Conceitos básicos de probabilidade

2.1. Experimento probabilístico

Definição
Um experimento probabilístico é uma ação ou um ensaio por meio do qual resultado específico
(contagem, medidas e respostas) são obtidos. A conseqüência de um único ensaio em um experimento
probabilístico é um resultado (ponto amostral). O conjunto de todos os resultados possíveis de um experimento
probabilístico é o espaço amostral. Um evento consiste em um ou mais resultados e é um subconjunto do
espaço amostral.

Exemplos de experimentos probabilísticos:


a) No “lançamento de uma moeda”, temos o espaço amostral {cara, coroa}.
b) No “lançamento de um dado”, temos o espaço amostral: {1, 2, 3, 4, 5, 6}. 
c) “Dois lançamentos sucessivos de uma moeda”, temos o espaço amostral: {(ca,ca); (co,co); (ca,co); (co,ca)}.
66

d) No “nascimento de uma criança”, temos o espaço amostral: {feminino, masculino}.


e) No “resultado de uma partida de futebol” temos o espaço amostral: {vitória, empate, derrota}.

2.2. Eventos
Um evento de um experimento aleatório é qualquer subconjunto do espaço amostral desse
experimento. O número de elementos de um evento E será representado por n(E).

2.2.1. Eventos unitário, certo e impossível


Dois ou mais eventos elementares de certo espaço amostral são ditos:

 Evento Unitário: é formado por um único elemento do espaço amostral.


Ex.: ocorrência da face 3 no lançamento de um dado.

 Evento Certo: é aquele que ocorre em qualquer realização do experimento.


Se E = S, E é chamado de evento certo.
Ex.: no lançamento de um dado fatalmente sairá a face 1, 2, 3, 4, 5 ou 6.

 Evento Impossível: é aquele que não ocorre em qualquer realização do experimento.


Se E = Ø, E é chamado de evento impossível.
Ex.: No lançamento de um dado sair a face 7.

Exemplo: No lançamento de um dado e a observação da face voltada para cima, temos os eventos:
67

* Evento A: a face observada é um nº par.


A = {2, 4, 6}, n(A) = 3

* Evento B: a face observada é um quadrado perfeito.


B = {1, 4}, n(B) = 2

* Evento C: a face observada é um número múltiplo de 5.


C = {5}, n(C) = 1
(evento unitário)

* Evento D: a face obtida é um número menor que 7.


D = { 1, 2, 3, 4, 5, 6}, n(D) = 6
(evento certo)

* Evento F: a face obtida é um número maior que 6.


F = { }, n(F) = zero
(evento impossível)
68

2.2.2. Evento complementar


Para um evento A qualquer, o complementar de A, denotado por A é dado por A = S – A, ou seja, é um outro
conjunto formado pelos elementos que pertencem a S e não pertencem a A. O resultado da reunião de A e A é
exatamente o espaço amostral.
Exemplo:
1. Coroa é complementar de cara (e vice-versa).
2. O conjunto de cartas de paus, ouros e copas é complementar do conjunto de espadas.
3. Num jogo em que acontece um (empate), o evento complementar é (ganhar, perder).
4. Numa jodada de um dado que sai o número (1), o evento complementar é (2,3,4,5,6).

2.2.3. Evento mutuamente exclusivos

 Evento Mutuamente Exclusivo: Caracteriza-se quando dois ou mais eventos não podem ocorrer simultaneamente, ou
seja, a ocorrência de um exclui a possibilidade de ocorrência do outro e vice-versa.

Exemplos:
1. Se a carta é de copas, então ela não é de ouro;
2. Se o tempo está nublado, então não há sol.

Eventualmente poderão esgotar todos os resultados possíveis, nesse caso serão chamados de
mutuamente excludentes e exaustivos.

 Eventos não mutuamente exclusivos


Caracteriza-se quando dois ou mais eventos podem ocorrer simultaneamente.

2.2.4. Evento independente e condicionado

 Evento Independente: Dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas,
comportando-se cada um de maneira que lhe é própria sem influenciar os demais.

Caracteriza-se, portanto, quando a ocorrência de um evento não for afetada pela ocorrência do outro, sendo a recíproca
verdadeira.

Ex.: Consideremos o lançamento de duas moedas:


Temos: S = {(ca, ca), (ca, co), (co, co), (co, ca)}
Os resultados dos eventos são independentes de uma moeda para outra.

 Evento Condicionado: Quando associados dois ou mais eventos a um experimento aleatório qualquer, dizemos que eles
são condicionados a outro evento A do mesmo experimento.
Caracteriza-se quando a ocorrência de um evento B qualquer dependa da ocorrência de outro evento A.

Ex.: retirada, sem reposição, de duas cartas vermelhas de um baralho completo.

Exemplos: Decida se os eventos são dependentes ou independentes

1. Selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do baralho (B).
Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes.

2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B).
Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes.
69

Importante!
 Um evento certo é o próprio espaço amostral;
 Um evento impossível é o subconjunto vazio do espaço amostral.

3 Tipos de Probabilidade

Há três tipos de probabilidade: clássica, empírica e subjetiva. A probabilidade de um evento E ocorrer é


escrita como P(E) – lê-se “a probabilidade do evento E”.

3.1. Probabilidade Clássica

Definição
A probabilidade clássica (ou teórica) é usada quando cada resultado no espaço amostral tem a mesma
probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por

ou

Exemplos:
a. No lançamento de uma moeda qual a probabilidade de obter cara:
S = { ca, co } , n(S) = 2
P(A) = = 0,5 = 50%
A = {ca} , n(A) = 1
b. No lançamento de um dado qual a probabilidade de obter um número par:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
P(A) = = 0,5 = 50%
A = { 2, 4, 6 }, n(A) = 3 
c. No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
P(A) = = 1,0 = 100%
A = { 1, 2, 3, 4, 5, 6 }, n(A) = 6
d. No lançamento de um dado qual a probabilidade de obter um número maior que 6:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
A = {  }, n(A) = 0
P(A) = = 0 = 0%
Exercícios:
1. No lançamento de um dado e a observação da face voltada para cima, determine a probabilidade de se
obter:
A) Um número ímpar.
B) Um número múltiplo de 3.
C) Um número menor que 7.
D) Um número maior que 6.

2. No lançamento simultâneo de dois dados e a observação das faces voltadas para cima, determine a
probabilidade de se obter:
A) Números iguais.
B) A soma dos números igual a 9.

3.2. Probabilidade empírica e Lei dos Grandes números

Definição
A probabilidade empírica (ou estatística) baseia-se em observações obtidas em experimentos
probabilísticos. A probabilidade empírica de um evento E é a freqüência relativa desse evento.
frequência do evento E
P E  
frequência total
Exemplo: Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré:
Tipo de peixe Quantidade
Matrinxã 13
Tambaqui 17
Tucunaré 10
Total 40
Qual a probabilidade de se pescar um Tambaqui?
17
P(Tambaqui) = = 0,425 = 42,5%
40

Lei dos grandes números


À medida que um experimento é repetido mais e mais vezes, a probabilidade empírica de um evento
tende à sua probabilidade teórica (real).

Exemplo: Como exemplo dessa lei, suponha que você queira determinar a probabilidade de obter
cara com uma moeda normal.
O mapa de dispersão abaixo mostra o resultado de similar jogada da moeda 500 vezes. Observe que, à
medida que o número de jogadas cresce, a probabilidade de obter cara fica mais perto da probabilidade
teórica, que é de 0,5.
3.3. Probabilidade subjetiva

O terceiro tipo de probabilidade é a subjetiva. A probabilidade subjetiva resulta da intuição, estimativa,


ou de um “palpite bem fundamentado”. Veja os exemplos:
 Dado o estado de saúde do paciente e a extensão dos ferimentos, um médico pode sentir que
esse paciente tem uma chance de 90% de se recuperar completamente.
 Um analista de negócios pode predizer que a chance dos funcionários de uma determinada
companhia entrarem em greve é de 0,25.

4 Propriedades da probabilidade

 Uma probabilidade não pode ser negativa ou maior que 1. Assim, a probabilidade de um evento
E está entre 0 e 1.
0  P(E)  1
 A soma das probabilidades de todos os resultados de um espaço amostral é de 1 (100%). Uma
conseqüência importante desse fato é que, se souber a probabilidade de um evento E, poderá
obter a probabilidade do complemento do evento E.

Probabilidade de Eventos Complementares

Sabemos que um evento A pode ocorrer ou não. Sendo P(A) a probabilidade de que ele ocorra
(sucesso) e P(Ā) a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a
relação:
P(A) + P(Ā) = 1

Exemplo: Sabemos que a probabilidade de tirar o nº 4 no lançamento de um dado é igual 1/6. Logo, a
probabilidade de não tirar o nº 4 no lançamento de um dado:
P(Ā) = 1− P(A)
1 5
P(Ā) = 1 − = .
6 6

Exercícios
1) Uma caixa contém bolas numeradas de 1 a 15. Retira-se uma bola ao acaso, qual a probabilidade de se
obter uma bola cujo número seja múltiplo de 4?
2) Qual é a probabilidade de um eleitor amazonense escolhido ao acaso não ter votado em Amazonino
Mendes na eleição de 2008?
 Cerca de 1.050.230 votaram em outro candidato ou em outra opção.
 Cerca de 1250.000 votaram em Amazonino Mendes.
3) Determine a probabilidade, considerando uma companhia que seleciona funcionários ao acaso para um
teste de drogas. A companhia usa um computador para selecionar aleatoriamente números de
funcionários em um intervalo que vai de 1 a 6.296.
a) Obtenha a probabilidade de selecionar um número menor do que mil.
b) Obtenha a probabilidade de selecionar um número maior do que mil.
c) Obtenha a probabilidade de selecionar um número divisível por mil.
d) Obtenha a probabilidade de selecionar um número não divisível por mil.
4) Dada a distribuição de freqüência dos números de eleitores brasileiros (em milhões) de acordo com a idade.
Idade dos eleitores em anos frequência (em milhões)
18 a 20 10,8
21 a 24 13,9
25 a 34 40,1
35 a 44 43,3
45 a 64 53,7
65 ou mais 31,9

Obtenha a probabilidade de um eleitor escolhido ao acaso:


a) Ter entre 21 e 24 anos;
b) Não ter entre 18 a 20 anos.
5) Quando duas flores boca-de-leão cor-de-rosa (RW) são cruzadas, há quatro resultados possíveis
igualmente prováveis para a estrutura genética da descendência: vermelho (RR), cor-de-rosa (RW), cor-
de-rosa (WR) e branco (WW). Então, se duas bocas-de-leão forem cruzadas, qual será a probabilidade
de a descendente ser (a) cor-de-rosa? (b) vermelha? (c) branca?

6) O diagrama mostra o número de trabalhadores (em milhares) por setor numa certa cidade. Calcule a
probabilidade de: a) Um trabalhador escolhido ao acaso estar empregado no setor de serviços. b) Um
trabalhador escolhido ao acaso não estar empregado no setor de serviços.

5 Probabilidade Condicional e a Regra da Multiplicação


5.1. Probabilidade condicional

Uma probabilidade condicional é a probabilidade de ocorrer um evento, dado que outro evento já
ocorreu. A probabilidade condicional de o evento B ocorrer, dado que o evento A já ocorreu, é denotada
por P(B|A) – lida como “probabilidade de B, dado A”.

Exemplos:
1. Duas cartas são selecionadas em seqüência em um baralho comum (52 duas cartas). Determine a
probabilidade de a segunda ser uma dama, dado que a primeira foi um rei. Assuma que o rei não seja
recolocado.
Solução: Uma vez que a primeira carta foi um rei e não foi recolocada, restou no baralho 51 cartas, quatro
delas damas. Assim,
4
P(B|A) =  0,078.
51

2. A tabela abaixo mostra os resultados de um estudo no qual pesquisadores examinaram o QI de 102 crianças
e a presença de um gene específico nelas. (a) Obtenha a probabilidade de determinada criança ter um QI alto, dado que
ela tem o gene.
Gene Gene não Total
presente presente
QI alto 33 19 52
QI normal 39 11 50
Total 72 30 102

Solução: Existem 72 crianças com o gene. O espaço amostral, portanto, consiste de 72 crianças. Delas, 33
têm QI alto. Assim,
33
P(B|A) =  0,458.
72

(b) Determine a probabilidade de uma criança não ter o gene.


(c) Determine a probabilidade de uma criança não ter o gene, dado que ela tem um QI normal.

5.2. Probabilidade de eventos independentes


Como dois eventos são independentes se a ocorrência de um deles não afeta a probabilidade de
ocorrência do outro, então
P(B|A) = P(B) ou P(A|B) = P(A)
Os eventos que não são independentes são dependentes (condicionados)

Exemplos:
1. Qual a probabilidade de selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do
baralho (B).
Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes (ou condicionados.
4
Probabilidade de selecionar um rei: P(A) =
52
4
Probabilidade de selecionar uma dama(de ocorre B após ter ocorrido A): P(B|A) = .
51
2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B).
Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes.
1
Probabilidade de ocorrer cara: P(A) =
2
1
Probabiliade de obter a face 6 (de ocorrer B após ter ocorrido A): P(B|A) = P(B) = .
6

5.3. A regra da Multiplicação (e)

A probabilidade de dois eventos A e B ocorrerem em seqüência é:

a) para eventos condicionados:


Se  A e B são dois eventos, a probabilidade de B ocorrer: depois de A ter acontecido é definida por:
P(BA), ou seja, é chamada probabilidade condicional de B. Neste caso os eventos são dependentes e
definidos pela fórmula:
P (A e B) = P (A ∩ B) = P (A) . P (BA)

b) para eventos independentes:

Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do
outro e vice-versa.

P (A e B) = P (A ∩ B) = P (A) . P (B)

6 Regra da Adição

6.1. Eventos mutuamente exclusivos


Na seção anterior vimos como obter a probabilidade de dois eventos, A e B, ocorrerem em seqüência.
Nesta seção, vamos obter a probabilidade de pelo menos um dos eventos ocorrer. Probabilidades como
essas são denotadas como P(A ou B) e dependem dos eventos serem mutuamente exclusivas.

Definição

Dois eventos A e B serão mutuamente exclusivos se A e B não puderem ocorrer ao mesmo tempo.

A e B são mutuamente exclusivos. A e B não são mutuamente exclusivos.

Exemplos: Decida se os eventos são mutuamente exclusivos. Explique seu raciocínio.

1. Jogue um dado. A: obter um 3. B: obter um 4.

2. Escolha um estudante. A: escolher um estudante do sexo masculino. B: escolher um estudante com


especialidade em enfermagem.

3. Escolha um doador sanguíneo. A: o doador é do tipo O. B: O doador é do sexo feminino.


6.2. Regra da Adição

a) para eventos mutuamente exclusivos

P (A ou B) = P (A U B) = P (A) + P (B)

b) para eventos não mutuamente exclusivos

P (A ou B) = P (A U B) = P (A) + P (B) – P (A ∩ B)
Exemplos:
1. No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4:
Solução: Os dois eventos são mutuamente exclusivos então:  
1 1 2 1
P(nº 3 ou nº 4) = + = =
6 6 6 3
2. No lançamento de um dado qual a probabilidade de se tirar um número menor que 3 ou um número
ímpar.
2 3 1 4 2
P(nº menor do que ou nº ímpar) = + – = = ≈ 0,667.
6 6 6 6 3
Exercícios
1. Joga-se um dado duas vezes. Qual a probabilidade de se obter a face 5 em ambas as jogadas?
Resposta: 1/36

2. Uma caixa contém 100 peças das quais 5 são defeituosas. Seleciona-se ao acaso uma peça, que não é
recolocada e, seleciona-se outra peça. Qual a probabilidade de que ambas as peças retiradas sejam
defeituosas? Resposta: 0,2%
3. Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré:
Tipo de peixe Quantidade
Matrinxã 13
Tambaqui 17
Tucunaré 10
Total 40
a) Qual a probabilidade de se pescar um Tucunaré?
b) Em uma captura, qual a probabilidade de se pescar ou a Matrinxã ou um Tucunaré?
c) Em duas capturas (sem reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré?
d) Em duas capturas (com reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré?

4. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:


a) a probabilidade de essa peça ser defeituosa;
b) a probabilidade de essa peça não ser defeituosa.

5. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas,
1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual
é a probabilidade de as três bolas retiradas da 1ª: 2ª e 3ª urnas serem, respectivamente, branca, preta e
verde.

6. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas.
Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. R: 30%

7. Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas.
Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. Resposta: 24%

8. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5
bolas verdes. Qual a probabilidade de que ambas sejam da cor branca?.

9. Uma caixa contém 3 bolas brancas, 4 pretas e 5 vermelhas. Retirando-se uma bola, qual a probabilidade
de ela ser branca ou vermelha?
10. Um júri consiste de nove pessoas naturais do local e três naturais de outros estados, Se dois dos jurados
são selecionados aleatoriamente para uma entrevista, qual a probabilidade de serem ambos naturais de
outro estado? Resposta: 4,55%

11. Em uma caixa há sete lâmpadas, sendo quatro boas e três queimadas. Retirando três lâmpadas ao
acaso, sem reposição, qual a probabilidade de que:
a) Todas sejam boas; R: 24/210
b) Todas sejam queimadas. R: 6/210

12. Na jogada de um dado, qual a probabilidade de sair um 6 ou um número ímpar.

13. Ao selecionar uma carta de um baralho, obtenha a probabilidade de tirar um 4 ou um às.

14. Ao selecionar uma carta de um baralho, obtenha a probabilidade de tirar um 4 ou um naipe de ouro.

15. Um banco de sangue registra o tipo sanguíneo e o fator Rh de doadores durante os últimos cinco dias
conforme a tabela a seguir:

Determine as seguintes probabilidades:


(a) Doador ter tipo sangüíneo O;
(b) Doador ser fator Rh positivo;
(c) Doador ter tipo sangüíneo A ou B;
(d) Doador ter tipo sanguíneo B ou ser Rh negativo.

Questões objetivas

16. (UERJ) - Um instituto de pesquisa colheu informações para saber as intenções de voto no segundo turno
das eleições para governador do estado. Os dados estão indicados no quadro abaixo:
Intenção de Voto Percentual
Candidato A 26%
Candidato B 40%
Votos nulos 14%
Votos Brancos 20%
Escolhendo aleatoriamente um dos entrevistados, verificou-se que ele não vota no candidato B. A
probabilidade de que esse eleitor vote em branco é
(A) 1/6 (B) 1/5 (C) 1/4 (D) 1/3 (E) 2/5
17. (UF São Carlos) - Uma urna tem 10 bolas idênticas numeradas de 1 a 10. Se retirarmos uma bola da
urna, a probabilidade de não obtermos a bola número 7 é igual a
(A) 2/2 (B) 9/10 (C) 1/10 (D) 9/11 (E) 1/5

18. (FUVEST) - Escolhem-se ao acaso dois números distintos de 1 a 20. Qual a probabilidade de que o
produto dos números escolhidos seja ímpar?
(A) 9/38 (B) 1/2 (C) 9/20 (D) 1/4 (E) 8/25

19. (UniRio) - As probabilidades de três jogadores marcarem um gol cobrando um pênalti são,
respectivamente, 1/2, 2/5 e 5/6. Se cada um bater um único pênalti, a probabilidade de todos errarem é
igual a
(A) 3% (B) 5% (C) 17% (D) 20% (E) 25%

20. (UEM-PR) - Um número é escolhido ao acaso entre os 20 inteiros, de 1 a 20. A probabilidade de o


número escolhido seja primo ou quadrado perfeito
(A) 1/5.
(B) 2/25.
(C) 4/25.
(D) 2/5.
(E) 3/5.

21. (UNESP) - Dois dados perfeitos e distinguíveis são lançados ao acaso. A probabilidade de que a soma
dos resultados obtidos seja 3 ou 6 é
(A) 7/18.
(B) 1/18.
(C) 7/36.
(D) 7/12.
(E) 4/9.

22. (Santa Casa-SP) - Num grupo de 60 pessoas, 10 são torcedores do São Paulo, 5 são torcedoras do
Palmeiras e as demais são torcedoras do Corínthians. Escolhido ao acaso um elemento do grupo, a
probabilidade de ele ser torcedora do São Paulo ou do Palmeiras é
(A) 40%.
(B) 25%.
(C) 50%.
(D) 30%.
(E) n.d.a.

23. (CESGRANRIO) - Em uma amostra de 500 peças, existem exatamente quatro defeituosas, Retirando-se,
ao acaso, uma peça dessa amostra, a probabilidade de ela ser perfeita é de
(A) 99,0%.
(B) 99,1%.
(C) 99,2%.
(D) 99,3%.
(E) 99,4%.

24. (CESGRANRIO) - Uma urna contém 4 bolas brancas e 5 bolas pretas. Duas bolas, escolhidas ao acaso,
são sacadas dessa urna, sucessivamente e sem reposição. A probabilidade de que ambas sejam brancas
vale
(A) 1/6.
(B) 4/9.
(C) 20/81.
(D) 2/9.
(E) 16/81.

25. (CESGRANRIO) - Uma urna contém 4 bolas vermelhas, 3 bolas azuis e 3 bolas brancas. Qual é a
probabilidade de retirarmos uma bola vermelha e, sem reposição desta, uma branca?
(A) 1/15.
(B) 2/15.
(C) 3/15.
(D) 4/15.
(E) 10/15.

26. (FEI-SP) - Numa moeda viciada, a probabilidade de ocorrer face cara num lançamento é igual a 4 vezes
mais a probabilidade de ocorrer coroa. A probabilidade de ocorrer cara num lançamento dessa moeda
é:
(A) 40%.
(B) 80%.
(C) 25%.
(D) 20%.
(E) 50%.

7 Análise Combinatória

Quando a contagem direta do número de possibilidades é muito trabalhosa, podemos nos valer da
análise combinatória para determinar os números de casos favoráveis e/ou possíveis dos experimentos
estudados. Para tanto, é necessário primeiro classificar adequadamente o grupamento e depois aplicar a
fórmula correta.

7.1 Notação Fatorial:


Define-se como fatorial de um número n (n!), sendo esse número um inteiro maior do que 1.
n! = n . (n−1) . ... . 1
Exemplos:
5! = 5.4.3.2.1 = 120
7! = 7.6.5.4.3.2.1 = 5040
7.2 Permutação

Permutar é (re)ordenar os elementos de um conjunto numa seqüência previamente definida. As


permutações podem ser:

a) Permutação sem Repetição


Conjuntos com elementos distintos.
Pn = n!
Exemplo: Três membros de uma organização social se ofereceram como voluntários, para compor a
diretoria, para o próximo ano, assumindo as funções de Presidente, Tesoureiro e Secretário. Qual o número
de maneiras pelas quais os três podem assumir tais cargos?

P3 = 3!= 6

b) Permutação com Repetição


Conjuntos com alguns elementos iguais entre si.
n!
Pnt1 t k 
t !

Exemplo: Quantos anagramas distintos têm na palavra MISSISSIPI?


10!
P104 ,4  = 6300
4! 4!

Obs.: Os anagramas são permutações (troca de lugar) das letras da palavra.

Exercícios resolvidos
1) Encontre o anagrama de cada palavra abaixo:
a) AMOR:
P4 = 4! = 4.3.2.1 = 24
b) CASTELO:
P7 =7! = 5040
c) ARARA:
5! 120
P53,2  = =10
3! 2! 6.2

2) Em cada uma das dez bolas de uma urna está impressa uma letra da frase FELIZ NATAL. Sorteadas as
bolas uma a uma, qual a chance de surgir a tal mensagem?
1 4
P = 2 ,2 = = 0,0001%
P10 10!

7.3 Arranjo

Quando a permutação é feita com apenas uma parte dos elementos do espaço amostral, ou seja, por
arranjo se entende o número total de permutações possíveis nos subconjuntos de ‘r’ elementos de um
conjunto composto por ‘n’ elementos.

Permutar sem reposição significa extrair o elemento, avalia-lo e descarta-lo, quando o item
selecionado é devolvido ao conjunto de origem antes do próximo sorteio, fala-se em permutação com
reposição.

Arranjo com reposição:


An,r = nr

Exercícios resolvidos

1) Calcule os arranjos com reposição:


a) A9,3 = 9 x 9 x 9 = 93 = 729
b) A9,2 = 9 x 9 = 92 = 81

2) Quantos números de dois algarismos se podem formar com os dígitos 1, 2 e 3.


A3,2 = 32 = 9

Exercício de aplicação

1) Qual o número máximo formado pela empresa de Telefonia celular que você usa com em Manaus?

2) Qual o número máximo de CPF formado formados com 11 dígitos?

Arranjo sem reposição:

n!
An,r = 
n  r !

Exercícios resolvidos

1) Calcule os arranjos sem reposição:

a) A9,3 = 9 x 8 x 7 = 504

b) A9,2 = 9 x 8 = 72

2) Um grupo de Cinco pessoas, deseja montar uma chapa eleitoral composta por um presidente, um vice e
um tesoureiro. Calcule quantas chapas podem ser formadas.

5! 5! 5.4.3.2!
A5,3 =  = = = 60
5  3 ! 2! 2!

Observe que se utiliza um arranjo quando se quer formar grupos a partir de um conjunto maior em
que a ordem é importante.

7.4 Combinação
Quando as escolhas se distinguem só pela qualidade e não pela ordem dos elementos. Para se
calcular o número de combinações possíveis de ‘n’ elementos, tomando-se ‘r’ de cada vez, usa-se a
expressão:
n!
Cn,r=
r!  n  r !
Exercícios resolvidos
1) Calcule a seguinte combinação:
15! 15.14.13.12! 15.14.13
C15,3 = = = = 455
3!15  3! 3!.12! 3.2.1

2) Qual a probabilidade de tirarmos 5 cartas de espadas sem reposição de um baralho de 52 cartas:


13 12 11 10 09
Método tradicional: P(5 espadas) = x x x x = 0,0005...
52 51 50 49 48
C13,5 13.12.11 .10.9
Técnica de contagem: P(5 espadas) = = = 0,0005...
C 52,5 52.51.50.49.48

3) De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B. Qual a probabilidade
de, escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham sangue tipo B:
C15,3
P (3 sangue B) = = 0,399
C 20,3

4) Qual a probabilidade de retirarmos 2 ases em uma amostra de 5 cartas retiradas de um baralho de 52


cartas:
C 4, 2  C 48,3
P (2 ases) =
C 52 ,3

5) Qual a probabilidade de retirarmos 4 ases em uma amostra de 13 cartas retiradas de um baralho de


52 cartas:
C 4, 4  C 48, 9
P (4 ases) =
C 52,13
6) Cinco pessoas constituem a junta de diretores de uma empresa. Suponha que somente três destes
diretores sejam convidados a representar a empresa num banquete. Quantas combinações diferentes
seriam possíveis para compor este trio?
5! 5! 5.4.3.2!
C5,3 = = = = 10
3!  5  3 ! 3! 2! 3! 2!

Observe que se utiliza uma combinações quando se quer formar grupos a partir de um conjunto maior
em que a ordem não é importante.

Exercícios (ver Larson pág. 120)

1) Sistema de segurança. O código de acesso a um sistema de um carro consiste de 4 dígitos, quantos


códigos diferentes estão disponíveis?

2) Diretoria. Uma diretoria deve ser escolhida a partir de 15 candidatos. Os cargos são de presidente,
vice-presidente, secretário e tesoureiro. De quantas maneiras os cargos podem ser preenchidos?

3) Letras. De quantas letras distinguíveis as letras da palavra estatística podem ser escritas?
CAPÍTULO 10

Bibliografia
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. 2005.
MEDEIROS, Ermes da Silva Et al. Estatística 1 - Para Os Cursos De: Economia, Administração E Ciências Contábeis . São Paulo:
Atlas, 2006
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª edição. Editora Saraiva, 2002.
TRIOLA, Mário. Introdução a Estatística. Editora LTC. 9ª edição. 2005.
LARSON, Ron e FARBER, Betsy. Estatística Aplicada. 2ª edição, Ed. Pearson-Prentice hall, São Paulo, 2007.
FREUND, John e SIMON, Freund. Estatística Aplicada - Economia, Administração e Contabilidade . Editora Bookman. 9ª edição.
2002.
LEVIN Jack, e FOX, James A. Estatística para Ciências Sociais, 9ª Edição. São Paulo. Pearson Prentice Hall, 2008.
Laponi, J. C. , Estatística Usando Excel, 4ª Edição, Editora Campus, RJ, 2005.
.

Você também pode gostar