Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
Conteúdo
1 A natureza da estatística
4 Distribuição de freqüência
5 Medidas de posição
6 Medidas de dispersão
8 Números índices
9 Probabilidade
CAPÍTULO 1
A NATUREZA DA ESTATÍSTICA
A Estatística é a parte da Matemática Aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
É uma ferramenta adequada para descrever os acontecimentos e tirar conclusões sobre os dados
coletados nas observações;
Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos
coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem;
Um instrumento fundamental para o estudo quantitativo e qualitativo dos fenômenos aleatórios e
coletivos, quaisquer que sejam seus campos de observação.
1. PANORAMA HISTÓRICO
tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes
desse todo (amostra).
2. A ESTATÍSTICA NAS EMPRESAS
2.1. APLICAÇÕES:
A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu
administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu
tríplice trabalho de organizar, dirigir e controlar a empresa.
Através de sondagem, por meio de coleta de dados, podemos conhecer a realidade geográfica e social,
os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e
estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou
longo prazos.
A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser
adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da
qualidade do produto e mesmo dos possíveis lucros e/ou perdas.
Tudo isso que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de
garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho.
O esquema do planejamento é o plano, que pode ser resumido, com auxilio da Estatística, em tabelas e
gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatístico que lhes deram origem.
2.2. OBJETIVOS
Conjunto de processos que têm por objetivo a observação, a classificação e a análise dos fenômenos
coletivos (ou de massa) e, por fim, a indução das leis a que eles obedecem;
Descrever adequadamente todos os grandes grupos de pessoas, animais ou acontecimentos que
pretendemos estudar, tanto em relação aos padrões típicos como à variação esperada.
5
4. MÉTODO
É um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja; Maneira de
ordenar a ação segundo certos princípios.
4.1. Método Científico – Ordem seguida na investigação, no estudo, na persecução de quaisquer fatos.
Dos métodos científicos podemos destacar o método experimental e o estatístico.
As causas não são fixas, no momento da pesquisa. Não existe uma uniformidade dos salários, o
gosto dos consumidores não é constante, seria necessária a fixação do nível geral dos preços das outras
necessidades e outros fatores. Todas as causas variam.
5. FASES DO MÉTODO ESTATÍSTICO
Quando se pretende um estudo estatístico completo, existem diversas fases do trabalho que devem
ser desenvolvidas para se chegar aos resultados finais do estudo. Essas etapas ou operações são
chamadas fases do trabalho estatístico.
Exemplo: Um fabricante de sabonete, que deseja lançar um produto novo no mercado, poderia estar
interessado em um estudo sobre as características dos consumidores atuais. Não havendo estudos
semelhantes, ele deverá formular o problema com base em sua própria experiência.
Uma lista de fatores relevantes deverá resultar dessa investigação preliminar:
Número de unidades consumidas por família em cada ano;
Número médio de pessoas que compõe cada família;
Número de membros adultos da família, as marcas preferidas e assim por diante.
Saber exatamente o que se pretende pesquisar é o mesmo que definir corretamente o problema.
5.2 Planejamento
O passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste
em determinar o procedimento necessário para resolver o problema e, em especial, como levantar
informações sobre o assunto objeto do estudo.
Que dados deverão ser obtidos?
Como obtê-los?
O que será pesquisado?
Quem participará da pesquisa? (Critérios de inclusão e exclusão)
Em que setor geográfico será feita a pesquisa?
Qual o grau de precisão exigido na pesquisa?
Qual o tipo de amostragem?
Qual o tamanho da amostra?
Quais materiais serão necessários para realizar a pesquisa?
Qual o tempo disponível para fazer a pesquisa?
Qual o custo previsto?
Qual a verba destinada ao projeto? Etc.
É preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se pretende atingir. Mais
especificamente, na fase do planejamento a preocupação maior reside na escolha das perguntas, bem como
sua correta formulação, qualquer que seja a modalidade de coleta dos dados.
7
O planejamento pode ser dividido em: censitário que é utilizado quando a contagem for completa, ou por
amostragem quando for parcial.
Exemplos: Censitário → levantamento do IBGE.
Amostragem → opinião dos eleitores sobre o presidente.
5.3 Coleta de Dados
Após planejamento e análise do que se quer pesquisar, damos inicio à coleta dos dados numéricos
necessários à sua descrição.
Pode ser direta e indireta:
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos,
casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos
alunos de uma escola, quando os dados são coletados pelo próprio pesquisador através de questionários,
como é o caso do censo demográfico etc.
É classificada em:
a. Contínua (registro) - quando feita continuamente.
b. Periódica - quanto feita em intervalos constante de tempo, como os censos.
c. Ocasional - quanto feita extemporaneamente, a fim de atender a conjuntura ou a uma emergência,
como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta é indireta quando é inferida de elementos conhecidos (direta) e/ou do conhecimento de outros
fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a
mortalidade infantil, que é feita através de dados colhidos por outra coleta direta.
QUESTÕES
1. O que estatística?
2. Diferencie Estatística Descritiva de Estatística Inferencial.
CAPÍTULO 2
POPULAÇÃO, AMOSTRA E AMOSTRAGEM
1. POPULAÇÃO E AMOSTRA
1.1. População - é o conjunto de elementos (pessoas, coisas, objetos) que têm em comum uma
característica em estudo. A população pode ser:
Exemplo 1:
População: Conjunto de todos os doentes com a doença que o medicamento a estudar pretende
tratar.
Amostra: Conjunto dos 20 doentes selecionados.
Problema: Pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para
tomar uma decisão sobre qual dos medicamentos é melhor.
Exemplo 3:
"Os campos de aplicação da Estatística são muitos e os mais variados."
Controle de O administrador de uma fábrica de parafusos pretende assegurar-se de que a
Qualidade percentagem de peças defeituosas não excede um determinado valor, a partir do qual
determinada encomenda poderia ser rejeitada.
1
População: Conjunto de todos os parafusos fabricados ou a fabricar pela
fábrica, utilizando o mesmo processo.
Amostra: Conjunto de parafusos escolhidos ao acaso de entre o lote de
produzidos.
Problema:
Pretende-se, a partir da percentagem de parafusos
defeituosos presentes na amostra, "estimar" a percentagem
de defeituosos em toda a produção.
Exemplo 4:
"Os campos de aplicação da Estatística são muitos e os mais variados."
Pedagogia Um conjunto de pedagogos desenvolveu uma técnica nova para a aprendizagem da
leitura, na escola primária, a qual, segundo dizem, encurta o tempo de aprendizagem
relativamente ao método tradicional.
População: conjunto de todos os alunos que entram para a
escola primária, sem saber ler.
Amostra: conjunto de alunos de algumas escolas
selecionadas para este estudo. Os alunos foram
separados em dois grupos para se aplicarem as
duas técnicas em confronto.
Problema: do estudo da amostra, decidir qual a técnica
melhor.
Outros exemplos.
Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo.
2. AMOSTRAGEM
Exemplo: Vamos obter uma amostra representativa para pesquisa da estatura de noventa alunos de uma
escola:
a. Numeramos os alunos de 01 a 90 (numera-se a população).
1
Exemplo: Supondo, que em uma sala de aula com noventa alunos, sendo que 54 são meninos e 36 são
meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo femin ino) e queremos uma amostra de 10%
da população. Logo, temos:
SEXO POPULAÇÃO 10% AMOSTRA
54 10
= 5,4
M 54 100 5
36 10
= 3,6
F 36 100 4
90 10
= 9,0
Total 90 100 9
Esta amostragem é semelhante à aleatória simples, mas a listagem é ordenada. Devemos seguir os
seguintes passos:
Divide-se o tamanho da população (N) pelo tamanho da amostra (n), obtendo um intervalo de
retirada (k).
sorteia-se o ponto de partida.
a cada k elementos retira-se uma para amostra.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para
pertencer à amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da
população.
Exemplo: Suponhamos uma rua com 450 casas, das quais desejamos obter uma amostra formada por 25
casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento:
1
2º Passo: escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento
sorteado para a amostra;
3º Passo: os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que
o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.
3. TIPO DE VARIÁVEIS
Variáveis podem ser classificadas da seguinte forma:
3.1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa,
ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas.
3.1.1. Variáveis discretas: características mensuráveis que podem assumir apenas um número
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros.
Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias
por litro de leite, número de cigarros fumados por dia.
3.1.2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala
contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser
medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo
(relógio), pressão arterial, idade.
3.2. Variáveis Qualitativas (ou categóricas): são as características que não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos. Podem ser nominais ou ordinais.
3.2.1. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos
olhos, fumante/não fumante, doente/sadio.
3.2.2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o,
2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro,
fevereiro,..., dezembro).
Outros exemplos:
O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o
sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não
significa que a variável sexo passou a ser quantitativa!
Exemplo dos ursos marrons (continuação):
No conjunto de dados ursos marrons, são qualitativas as variáveis sexo (nominal) e mês da
1
observação (ordinal); são quantitativas contínuas as demais: idade, comprimento da cabeça, largura
da cabeça, perímetro do pescoço, perímetro do tórax, altura e peso.
EXERCÍCIO
1) Amostragem estratificada. Em uma fábrica existem 180 funcionários, sendo: 8 no financeiro; 6 no fiscal; 4
no RH; 7 no CPD; 9 na Manutenção; 46 na Embalagem; 80 na Produção; 20 na Expedição. Crie uma
tabela que obtenha uma amostra de 80 funcionários.
2) Amostragem estratificada. O diretor de uma escola, na qual estão matriculados 280 meninos e 320
meninas, deseja conhecer as condições de vida extra-escolar de seus alunos e não dispõe de tempo
para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa
clientela. Obtenha, para este diretor, os elementos componentes da amostra.
3) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n 1= 40, n2 = 100
e n3 = 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra
foram retirados do 3º estrato, determine o número de elementos da amostra.
4) Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas, a partir da
amostragem sistemática?
5) De uma população de 480 elementos ordenados, retire uma amostra sistemática de tamanho 20.
6) Deseja-se retirar uma amostra sistemática de 10 unidades de uma população de tamanho 890.
CAPÍTULO 3
REPRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICAS
1 TABELAS
É um quadro que resume um conjunto de observações.
Exemplo:
PRODUÇÃO DE CAFÉ TÍTULO
BRASIL - 1998-02
PRODUÇÃO
ANOS CABEÇALHO
(1.000 t)
1998 2.535 CASA OU CÉLULA
CORPO 1999 2.665
2000 2.122 LINHAS
2001 3.750
2002 2.007
RODAPÉ FONTE: IBGE.
COLUNA COLUNA
INDICADORA NUMÉRICA
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:
o um traço horizontal ( - ) quando o valor é zero;
o três pontos ( ... ) quando não temos os dados;
o zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
o um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.
1
1996 3.570.115
1997 4.504.201
1998 5.448.835
1999 4.373.226
2000 4.024.813
FONTE: Associação Nacional para Difusão de Adubos e
Corretivos Agrícolas.
Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de
uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única
tabela, obtemos uma tabela de dupla entrada.
1
Exemplo:
TELEFONES INSTALADOS - 1999-2001
REGIÃO 1999 2000 2001
Norte 373.312 403.712 457.741
Nordeste 1.440.531 1.567.006 1.700.467
Sudeste 8.435.308 8.892.409 8.673.660
Sul 2.106.145 2.192.762 2.283.581
Centro-Oeste 803.013 849.401 944.075
Total 13.158.309 13.905.290 14.059.524
Fonte: IBGE
A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série
geográfico-histórica ou geográfico-temporal.
EXERCÍCIOS
1) Classifique as séries estatísticas:
a) b)
PRODUÇÃO DE BORRACHA NATURAL – AVICULTURA BRASILEIRA
1991-93 1992
c)
EXPORTAÇÃO BRASILEIRA
1985-1990-1995
1985 1990 1995
IMPORTADORES
% % %
América Latina 13,0 13,4 25,6
EUA e Canadá 28,2 26,3 22,2
Europa 33,9 35,2 20,7
Ásia e Oceania 10,9 17,7 15,4
África e Oriente Médio 14,0 8,8 5,5
Fonte: MIC e SECEX
Gráficos Estatísticos
A representação gráfica das séries estatísticas tem por finalidade representar os resultados obtidos,
permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os
valores da série. A escolha do gráfico mais apropriado ficará a critério do analista. Contudo, os elementos
simplicidade, clareza e veracidade devem ser considerados, quando da elaboração de um gráfico.
1
Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma análise morosa ou com erros.
Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em
estudo.
O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-se acrescentar
subtítulos;
A orientação geral dos gráficos deve ser da esquerda para a direita;
As quantidades devem ser representadas por grandezas lineares;
Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 (zero);
Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do leitor ao longo
da leitura. Um tracejado muito cerrado dificulta o exame do gráfico;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para cima;
Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente lidos, partindo
da margem horizontal inferior ou da margem esquerda.
3.1 Diagramas
São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de
séries estatísticas. Eles podem ser:
2
É um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de
dados constituem as chamadas séries históricas.
Exemplo: Vendas de televisões de tubo em R$ 1000,00 nos anos de 2001 a 2007 da empresa LL da
Amazônia Ltda, localizadas em Manaus.
Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos
horizontalmente (em barras) ou verticalmente (em colunas).
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados.
Se as legendas não são breves usa-se de preferência o gráfico em barras na horizontal. A ordem a
ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica.
100
80
60
40
20
0
1940 1950 1960 1970
Fonte: Fictícia
Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada
barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou
mais atributos.
São freqüentemente usados para representação de séries cronológicas com um grande número de
períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas
séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico.
Gráficos em setores.
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar
a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores
quantas são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico
em setores só deve ser empregado quando há, no máximo, sete dados.
Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam em seu
desenvolvimento determinada periodicidade, como, por exemplo, a variação da precipitação pluviométrica ao
longo do ano, ou da temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o ano, etc.
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Fonte: dados Fictícios
3.2 Estereogramas:
São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas
representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser
interpretado dada a pequena precisão que oferecem.
3.3 Pictogramas:
São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a
vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem
ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e
não de detalhes minuciosos. Veja o exemplo abaixo:
25
3.4 Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
Exemplo:
População da Região Sul do Brasil – 1990
EXERCÍCIOS
3) Faça a representação em linha dos dados contidos na série abaixo:
PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ
1987- 92
1987 39,3
1988 39,1
1989 53,1
1990 65,1
1991 69,1
1992 59,5
FONTE: Agropalma
4) Escolha o melhor tipo de gráfico para representar os vários tipos de séries.
a) Os dez Estados que fizeram maior número de Transplantes de rim em 98.
Estados No de
Transplantes
DF 34
BA 38
ES 56
PE 56
CE 87
PR 181
RJ 181
MG 231
SP 756
FONTE: Assoc. Brasileira de Transplante de Órgãos.
e) O estado das florestas do planeta e o que foi devastado pela ocupação humana - em milhões de
km.
Continente Área Desmatada Área Atual de
Florestas
Oceania 0,5 0,9
Ásia 10,8 4,3
África 4,5 2,3
Europa 6,8 9,6
América do Sul 2,9 6,8
América do Norte e 3,2 9,4
Central
FONTE: World Resources Institute
5) De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais,
assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar
esses dados, classifique e faça uma representação gráfica.
6) De acordo com Ministério da Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos
de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564.
Faça uma tabela para apresentar esses dados, classifique e faça uma representação gráfica.
7) Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia,
Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de
ensino, respectivamente, segundo o MEC. Faça uma tabela para apresentar esses dados, classifique e faça
uma representação gráfica.
9) ENADE – 2006. A legislação de trânsito brasileira considera que o condutor de um veículo está dirigindo
alcoolizado quando o teor alcoólico de seu sangue excede 0,6 gramas de álcool por litro de sangue. O gráfico
abaixo mostra o processo de absorção e eliminação do álcool quando um indivíduo bebe, em um curto espaço
de tempo, de 1 a 4 latas de cerveja.
28
CAPÍTULO 4
DISTRIBUIÇÃO DE FREQÜÊNCIA
Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em grupos de classe
ou categorias convenientemente estabelecidas e numericamente ordenadas.
Nas distribuições de freqüência, os dados são agrupados segundo um critério de magnitude, em classe ou
pontos, permanecendo constante o fato, local e tempo, de tal forma que se possa determinar a percentagem
ou número, de cada classe. É um tipo de apresentação que condensa uma coleção de dados conforme as
freqüências ou repetições de seus valores.
A construção da distribuição de freqüência depende do tipo de dado com os quais se está lidando:
contínuos ou discretos.
29
O histograma mostra a Pirâmide etária relativa de homens e mulheres nos anos de 1997 e 2007.
1. DISTRIBUIÇÃO SEM INTERVALOS DE CLASSE
Distriduições em que não há uma necessidade de ordenar a variável em estudo em intervalos.
Digamos que um aluno ao fazer a avaliação institucional do CIESA, tem as seguintes opções péssimo,
ruim, bom, muito bom e ótimo . Portanto podemos organizar esse dados em uma distribuição de frequencia
sem intervalos de classe, veja o exemplo:
Exemplo 1: Na avaliação institucional do CIESA, temos o item “auto-avaliação dos alunos” de uma
determinada turma de Logística, vejam a tabela primitiva (dados coletados sem ordenação).
Ruim Ruim Bom Muito Bom Bom
Bom Bom Muito Bom Ótimo Ótimo
Bom Ruim Muito Bom Muito Bom Bom
Péssimo Muito Bom Ótimo Muito Bom Bom
Com esses dados podemos construir uma distribuição de freqüência sem intervalos de classe:
Exemplo 2: Número de Partos Produzidos em uma maternidade, contagem diária durante um mês:
0; 1; 0; 2; 1; 4; 4; 1; 2; 1; 3; 2 ; 4; 4; 1; 4; 1; 2; 4; 2; 4; 4; 3; 2; 2; 4; 2; 3; 4; ;
TABELA 1
ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm )
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
31
A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela
primitiva.
TABELA 2
ESTATURA DE 40 ALUNOS DO COLÉGIO A ( cm)
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173
cm);
2.2 DISTRIBUIÇÃO DE FREQÜÊNCIA
Denominamos freqüência o número de vezes que o elemento fica relacionado a um determinado valor
da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência.
TABELA 3
Estat. Freq. Estat. Freq. Estat. Freq.
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1
157 1 166 1 Total 40
O processo da tabela de freqüência dado é ainda inconveniente, já que exige muito espaço. A solução
é o agrupamento dos valores em vários intervalos, denominado: Distribuição de freqüência com intervalos de
classe:
TABELA 4
ESTATURA DE 40 ALUNOS DO
COLÉGIO A
Estaturas (cm) Freqüências
150 ├─ 154 4
154 ├─ 158 9
158 ├─ 162 11
162 ├─ 166 8
166 ├─ 170 5
170 ├─ 174 3
Total 40
Assim, se um dos intervalos for, por exemplo, 154 ├─ 158 (é um intervalo fechado à esquerda e
aberto à direita, diremos que nove alunos têm estaturas entre 154, inclusive, e 158 cm, exclusive.
Deste modo, estaremos agrupando os valores de variável em intervalos, sendo que, em Estatística,
preferimos chamar os intervalos de classes.
Atenção: o sinal ├─ significa que o número onde que está fechado é incluído na contagem, e o aberto é
excluído.
32
Ex. No intervalo de 150 cm (incluindo) a 154 cm ( excluindo este valor ) na Tabela 2 existem 4 alunos.
Representamos assim 150 ├─ 154.
2.3.1 CLASSE
É a diferença entre o limite superior da última classe (máximo) e o limite inferior da primeira classe
(mínimo).
AT = L(máx) – L(min)
33
fi = n
Podemos, agora, dar a distribuição de freqüência das estaturas dos quarentas alunos do Colégio A a
seguinte representação tabular técnica:
TABELA 4.1
ESTATURA DE 40 ALUNOS DO COLÉGIO A
i Estaturas (cm) fi hi xi
1 150 ├─ 154 4 4 152
2 154 ├─ 158 9 4 156
3 158 ├─ 162 11 4 160
4 162 ├─ 166 8 4 164
5 166 ├─ 170 5 4 168
6 170 ├─ 174 3 4 172
40
L(máx ) 174
ℓ2 =154 ℓ (mín) 150-
L5 =170 AT 24
Freqüência simples ou absoluta (fi) são os valores que realmente representam o número de dados de
cada classe.
Freqüência relativa (fr) são os valores das razões entre as freqüências simples de cada classe e o
somatório das freqüências, freqüência total.
fi
fr = . 100
f i
Freqüência acumulada (fac) é o total das freqüências de todos os valores inferiores ao limite superior
do intervalo de uma dada classe:
34
fac = f1 + f2 + … + fk
Freqüência acumulada relativa (frac) de uma classe é a freqüência acumulada da classe, dividida pela
freqüência total da distribuição.
f ac
frac = . 100
fi
Considerando a Tabela 4, podemos montar a seguinte tabela com as freqüências estudadas:
TABELA 4.2
i Estaturas (cm) fi xi fr fac frac
1 150 ├─ 154 4 152 0,100 4 0,100
2 154 ├─ 158 9 156 0,225 13 0,325
3 158 ├─ 162 11 160 0,275 24 0,600
4 162 ├─ 166 8 164 0,200 32 0,800
5 166 ├─ 170 5 168 0,125 37 0,925
6 170 ├─ 174 3 172 0,075 40 1,000
40 1,000
ROTEIRO PARA ELABORAÇÃO DA TABELA DE FREQUÊNCIA COM CLASSE
AT
4) Determinar a amplitude do intervalo de classes, h= ;
k
7) BOM SENSO.
Número de Classe – Não existe regra fixa para se determinar o número de classe. STURGES
SUGERE uma Regra para determinação do número de classes desde que
se conheça o número de observações.
Obs.
K = 1 + 3,33 Log N
K = Nº de Classe
H = AT N = Nº de Elementos
K H = Intervalo de Classe
AT = Amplitude Total
35
Idade: 25, 25, 20, 21, 20, 28, 29, 30, 32, 24, 33, 34, 36, 38, 40, 42, 44, 50, 45, 48
Nº = 20 ( Nº de observações )
Valor Máximo = 50
Valor Mínimo = 20
AT = Max –Min
AT = 30
K = 1 + 3,33 Log N
K = 1 + 3,33 Log Ro
K = 1 + 3,33 ( 1,301029 )
K = 5,33 = 5 ( Nº de Classe que deverá ter a distribuição
Sendo o menor valor da série, devemos toma-lo como o primeiro elemento, ou seja o limite inferior
da 1º Classe. Como a amplitude é 6, somaremos ao limite inferior, o que nos dará o limite superior (
26). Assim sucessivamente até que o último número da série ( 50 ) esteja contido na última classe
da distribuição vejamos:
26 | ------------ 32 3
32 | ------------ 38 4
38 | ------------ 44 3
44 | ------------ 50 4
20
EXERCÍCIO
38 49 26 7 41 52 47 46
46 9 22 8 22 24 16 25
16 41 20 12 51 12 19 30
23 20 27 48 31 26 52 41
52 22 49 21 33 51 16 29
Responda:
HISTOGRAMA
É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. À
distribuição da tabela 4 corresponde ao seguinte histograma.
POLÍGONO DE FREQÜÊNCIA
É um gráfico em linha, sendo as freqüências (fi) marcadas sobre perpendiculares ao eixo horizontal,
levantadas pelos pontos médios (xi) dos intervalos de classe. À distribuição da tabela 4 corresponde ao
seguinte polígono de freqüência.
37
EXERCÍCIO
1. O controle de qualidade de uma indústria selecionou 48 caixas na linha de produção e anotou em cada
caixa o número de peças defeituosas, obtendo os seguintes dados:
2 -0 -0 -4 -3 -0 -0 -1 -0 -0 -1 -1 -2 -1 -1 -1 -1 -1 -1 -0 -0 -0 -3 -0
-0 -0 -2 -0 -0 -1 -1 -2 -0 -2 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -0 -1 -0
Determinar:
a) o rol;
b) a tabela de distribuição de freqüência sem intervalos;
c) qual a porcentagem de caixas que apresentam 2 ou mais peças defeituosas?
2. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo
o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve
os seguintes dados:
10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26
-24 -20 -7 -18 -17 -28 -35 -22 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 16 -12 -20
3. A amostra abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por
uma firma comercial:
38
14 -12 -11 -13 -14 -13 -12 -14 -13 -14 -11 -12 -12 -14 -10 -13 -15 -11 -15 -13 -16 -17 -14 -14
Forme uma distribuição de freqüências sem intervalos.
4. Considere os salários quinzenais de 100 funcionários da Empresa Yasmim Ltda (em US$):
151 -152 -154 -155 -158 -159 -159 -160 -161 -161 -161 -162 -163 -163 -163 -164 -165 -165 -165 -166 -166
-166 -166 -167 -167 -167 -167 -167 -168 -168 -168 -168 -168 -168 -168 -168 -168 -168 -169 -169 -169 -169
-169 -169 -169 -170 -170 -170 -170 -170 -170 -170 -171 -171 -171 -171 -172 -172 -172 -173 -173 -173 -174
-174 -174 -175 -175 -175 -175 -176 -176 -176 --176 -177 -177 -177 -177 -178 -178 -178 -179 -179 -180 -180
-180 -180 -181 -181 -181 -182 -182 -182 -183 -184 -185 -186 --187 -188 -190 -190
Pede-se determinar:
a) A amplitude amostral;
b) O número de classes;
c) A amplitude das classes;
d) Construir a tabela de distribuição de freqüências com as classes;
e) Qual a porcentagem de funcionários que ganham salários com valor igual ou superior a US$179;
f) Qual a porcentagem de funcionários que ganham salários com valores inferiores a US$163;
g) O histograma;
h) O polígono de freqüência;
i) Qual o ponto médio da 3ª classe.
5. O conjunto de dados amostrais a seguir fornece uma lista do número de minutos que 50 assinantes da
internet gastaram durante sua conexão mais recente.
50 29 72 7 36 30 19 67 46 42
41 41 59 17 44 30 56 37 31 39
18 56 11 77 69 21 54 33 54 44
40 34 56 22 39 80 23 39 31 88
78 17 73 7 28 62 29 51 53 20
Determine: (a) Construa uma distribuição de freqüência que tenha sete classes; (b) Faça o histograma.
100 122 130 140 152 160 164 176 180 188 192 200 216
104 126 134 146 156 160 170 176 184 190 194 200 218
116 128 138 150 156 162 170 178 186 190 196 200
120 128 140 150 156 162 176 180 186 192 196 210
a) Construa uma distribuição de freqüências, com h = 20 e limite inferior para a primeira classe igual a
100.
b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$ 160,00
(exclusive)?
c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00 (inclusive) e R$
200,00 (exclusive)?
d) Faça o histograma, o polígono de freqüência e o polígono de freqüência acumulada.
7. Um administrador fez uma pesquisa de satisfação em sua empresa de um determinado item e obteve os seguintes
resultados:
Ruim Péssimo Bom Muito Bom Bom
Bom Bom Muito Bom Ruim Ruim
Bom Ruim Muito Bom Muito Bom Bom
Péssimo Muito Bom Ótimo Muito Bom Bom
39
8. Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros):
8. (SMV) Da população, aparelhos produzidos em uma linha de montagem, estuda-se a variável, número de
defeitos por unidade. A variáveis é:
a) Qualitativas ordinal;
b) Qualitativas nominal;
c) Quantitativas discretas;
d) Quantitativas contínuas.
e) N.D.A.
9. (SMV) Para a realização de uma auditoria em uma firma, 16 contas, dentre as 120 por elas mantidas,
foram aleatoriamente selecionadas para verificação da presença de erro ou não.
I. A população consiste de todas as contas mantidas pela firma.
II. A variável observada é do tipo qualitativa ordinal.
III. A amostra consiste das 16 contas selecionadas
Pode-se afirmar que:
a) Apenas I é correta.
b) Apenas II é correta.
c) Apenas III é correta.
d) Apenas I e III são correta.
e) I, II e III são corretas.
40
11. (SMV) Os intervalos de classe podem ser apresentados de várias maneiras, dentre as situações abaixo, a
correta é :
a) 5 – 10 compreende todos os valores entre 5 e 10, inclusive os extremos;
b) 5 – 10 compreende todos os valores entre 5 e 10, exclusive os extremos;
c) 5 |–| 10 compreende todos os valores entre 5 e 10, exclusive os extremos;
d) 5 |– 10 compreende todos os valores entre 5 e 10, exclusive o 5 e inclusive o 10;
e) 5 –| 10 compreende todos os valores entre 5 e 10, inclusive o 5 e exclusive o 10;
13. (SMV) Os dados abaixo, mostram a distribuição de freqüência d levantamento de dados sobre o salário de
50 funcionários de uma determinada empresa.
Quant. de salários mínimos Quant. de funcionários
2 |– 4 14
4 |– 6 16
6 |– 8 10
8 |– 10 07
10|– 12 03
50
É correto afirmar que;
a) 60% dos funcionários recebem menos do que 6 salários mínimos;
b) 20% dos funcionários recebem acima de 6 salários mínimos;
c) 5% dos funcionários recebem menos do que 3 salários mínimos;
d) 80% dos funcionários recebem de 6 a 8 salários mínimos.
e) N.D.A.
Das regiões estudadas, aquela que apresenta o maior percentual de jovens com carteira assinada, dentre os
jovens que são assalariados do setor privado, é:
a) Belo Horizonte b) Recife c) Distrito Federal d) São Paulo e) Salvador
42
CAPÍTULO 5
MEDIDAS DE POSIÇÃO
1. MÉDIA ARITMÉTICA - x
DADOS NÃO-AGRUPADOS
Exemplo:
Sabendo-se que a produção leiteira diária da vaca A, durante a semana, foi de 10, 14, 13, 15, 16, 18, e
12 litros, temos, para produção média da semana:
10 14 13 15 16 18 12 98
x = = = 14.
7 7
Logo: x = 14 litros
di = xi – x
Exemplo:
d1 = 10 – 14 = – 4
d2 = 14 – 14 = 0
d3 = 13 – 14 = – 1
d4 = 15 – 14 = 1
d5 = 16 – 14 = 2
d6 = 18 – 14 = 4
d7 = 12 – 14 = – 2
PROPRIEDADE
DADOS AGRUPADOS
Consideramos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de
filhos do sexo masculino.
Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável,
elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada.
x
xifi
fi
xi fi xi fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
34 78
78
x=
34
2,3 x = 2,3 meninos
Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe
coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio de fórmula:
x
x ifi
fi
onde xi é o ponto médio da classe.
i ESTATURAS (cm) fi xi xifi
1 150 ├── 154 4 152 608
2 154 ├── 158 9 156 1.404
3 158 ├── 162 11 160 1.760
4 162 ├── 166 8 164 1.312
5 166 ├── 170 5 168 840
6 170 ├── 174 3 172 516
40 6.440
6440
x=
40
161 x = 161 c
2. A MODA (Mo)
O valor que ocorre com maior freqüência em uma série de valores.
DADOS NÃO-AGRUPADOS
44
Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com
a definição, procurar o valor que mais se repete
A série de dados : 7, 8, 9, 10, 10, 10, 11, 12, 13, 15, tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum
apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13, que não apresenta moda (amodal).
Em outros casos, ao contrario, pode haver dois ou mais valores de concentração. Dizemos, então, que
a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 5, 7, 7, 7, 8, 9, temos duas modas: 4 e 7
(bimodal).
DADOS AGRUPADOS
Sem intervalos de classe
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino.
Filhos do sexo masculino
(xi) Número de famílias (fi)
0 2
1 6
2 10
3 12
4 4
fi = 34
A freqüência máxima (12) corresponde o valor da variável 3.Logo, o número de filhos modal é3,Mo = 3.
Sendo:
f a freqüência simples da classe modal
fant a freqüência simples da classe anterior à classe modal
fant a freqüência simples da classe anterior à classe modal
É o valor dominante que está compreendido entre os limites da classe modal
Método para o cálculo da moda é dado pela fórmula de Czuber:
1
Mo Li .h
1 2
No qual:
Li é o limite inferior da classe modal
h é o intervalo de classe modal
1 = f - fant
2 = f - fpost
Exemplo: Calcular a moda usando a fórmula de Czuber.
i ESTATURAS (cm) fi
1 150 ├── 154 4
2 154 ├── 158 9
3 158 ├── 162 11
4 162 ├── 166 8
5 166 ├── 170 5
45
3 A MEDIANA
É outra medida de posição definida como o número que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem.
Série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, o primeiro passo a ser dado é o de ordenação dos
valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Em seguida, tomamos aquele número central que apresenta o mesmo
número à direita e à esquerda. Temos, então: Md = 10.
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos
números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.
Assim, a série de valores ordenados: 2, 6, 7, 10, 12, 13, 18, 21, tem para mediana a média aritmética
entre 10 e 12. Logo:
10 12 22
Md = = = 11
2 2
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino.
Filhos do sexo masculino Número de famílias
(xi) (fi) fac
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
34
Sendo: 34/ 2 = 17
A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor de 2 da variável,
sendo este o valor mediano. Logo,
Md = 2 meninos.
(fi)
5 3 3
6 5 8
7 4 12
8 3 15
9 1 16
16
16 67
Sendo, = 8 = fac2 , a mediana é Md = = 6,5.
2 2
A nota mediana desta turma é 6,5.
n 40
Temos : = = 20
2 2
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20.º lugar, a partir do início da série, vemos que este deve estar localizado na
terceira classe (i = 3).
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4 (162 – 158), devemos tomar, a
partir do limite inferior, a distância.
Sendo:
n
f ant .h
Md = Li + 2
f md
No qual:
Li é o limite inferior da classe mediana;
fant é a freqüência acumulada da classe anterior à classe mediana;
fmd é a freqüência simples da classe mediana;
h é a amplitude do intervalo da classe mediana;
Temos:
20 13
Md = 158 + 4 = 158 + 2,54 = 160,54
11
Isto é:
Md = 160,5 cm
Exercícios
Notas na disciplina de
Estatística Aplicada
Notas fi
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02
800 ⌐ 900 1
900 ⌐ 1000 1
Σ = 40
7) Um diâmetro foi medido 30 vezes, tendo sido obtidos os seguintes resultados (em milímetros):
Construa uma tabela sem intervalo de classe e determine a média aritmética, a moda e a mediana (Nota.
A tabela já foi montada no capítulo anterior):
8) Uma pesquisa sobre os gastos semanais com refeições re alizados pelos funcionários de determinada
empresa está consolidada na tabela de distribuição abaixo:
Gastos semanais fi
(R$)
10,00 a 19,99 6
20,00 a 29,99 8
30,00 a 39,99 12
40,00 a 49,99 9
50,00 a 59,99 5
60,00 a 69,99 3
Determine:
a) a média aritmética;
b) a moda;
c) a mediana.
4 Medidas de Separatrizes
São números que dividem a seqüência ordenada de dados em partes que contêm a mesma quantidade
de elementos da série.
Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50%
dos valores da seqüência, é também uma medida de separatriz. Além da mediana, as outras medidas de
separatrizes que destacaremos são: quartis, decis e percentis.
Quartis
Se dividirmos a série ordenada em quatro partes, cada uma ficará com seus 25% de seus elementos.
Os elementos que separam estes grupos são chamados de quartis.
O primeiro quartil, que indicaremos por Q1, separa a seqüência ordenada deixando 25% de seus
valores à esquerda e 75% de seus valores à direita.
O segundo quartil, que indicaremos por Q2, separa a seqüência ordenada deixando 50% de seus
valores à esquerda e 50% de seus valores à direita. Portanto, o Q 2 é a Mediana da série.
49
O terceiro quartil, que indicaremos por Q3, separa a seqüência ordenada deixando 75% de seus
valores à esquerda e 25% de seus valores à direita.
Decis
Se dividirmos a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos. Os
elementos que separam estes grupos são chamados de decis.
O primeiro decil, que indicaremos por D1, separa a seqüência ordenada deixando 10% de seus valores
à esquerda e 90% de seus valores à direita.
De modo análogo são definidos os outros decis.
Percentcis
Se dividirmos a série ordenada em cem partes, cada uma ficará com 1% de seus elementos. Os
elementos que separam estes grupos são chamados de centis ou percentis.
O primeiro percentil, que indicaremos por P1, separa a seqüência ordenada deixando 1% de seus
valores à esquerda e 99% de seus valores à direita.
De modo análogo são definidos os outros percentis.
Observamos que os quartis e decis são múltiplos dos percentis, então basta estabelecer uma relação entre
eles, ou seja, todas as medidas podem ser identificadas como percentis:
D1 = P10
D2 = P20
Q1 = P25 D3 = P30
D4 = P40
Q2 = P50 D5 = P50
D6 = P60
Q3 = P75 D7 = P70
D8 = P80
D9 = P90
Para obtermos a fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula de mediana:
i .n
f ant
Pi = . L + 100
h
f
Sendo:
Pi – Percentil i (1, 2, 3, ..., 99);
50
75 . n 75 40
Temos, = =30
100 100
75 n
F(ant) 30 24 4
Q3 = P25 = . ℓ* + 100 = 162 + = 165 cm
h* 8
f*
Exercício
9) O salário de 40 funcionários de um escritório está distribuído segundo o quadro. Calcule a Q1, Q2 e Q3.
Salários (R$) fi
400 ⌐ 500 12
500 ⌐ 600 15
600 ⌐ 700 8
700 ⌐ 800 3
800 ⌐ 900 1
900 ⌐ 1000 1
Σ = 40
10) Utilizando-se do enunciado abaixo, determine os valores do Primeiro Quartil, Terceiro Quartil, Primeiro
Decil e Nono Decil:
Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de
natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A
coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa
acumulada. Não existem observações coincidentes com os extremos das classes.
51
Classes P (%)
70 – 90 5
90 – 110 15
110 – 130 40
130 – 150 70
150 – 170 85
170 – 190 95
190 – 210 100
52
CAPÍTULO 6
MEDIDAS DE DISPERSÃO
1. Dispersão ou Variabilidade
Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável
em torno de um valor de tendência central tomado como ponto de comparação.
y
y i y = 350 = 70
n 5
z
z i z = 350 = 70
n 5
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os
valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre
cada um de seus valores e a média representativa.
Podemos dizer então que o conjunto X apresenta dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou
de variabilidade.
2. Amplitude Total
É a diferença entre o maior e o menor dos valores da série. A utilização da amplitude total como
medida de dispersão é muito limitada, pois sendo uma medida que depende apenas dos valores externos, é
instável, não sendo afetada pela dispersão dos valores internos.
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de
sua concentração. É evidente que, quanto maior a amplitude total, maior é a dispersão ou variabilidade dos
valores da variável.
Relativamente aos três conjuntos de valores mencionados no início:
AT = x(max.) – x(mín.)
Temos:
AT = 4 – 0 = 4 AT = 4
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite
inferior da primeira classe:
AT = L(max.) – ℓ(mín.)
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado.
Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no
controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais
importante que a exatidão e a estabilidade.
3. Variância e Desvio Padrão
54
3.1 Introdução
Como já vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são,
na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a
totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por
isso mesmo, os mais geralmente empregados.
Variância (s2)
A variância leva em consideração os valores extremos e os valores intermediários, isto é, expressa
melhor os resultados obtidos. A variância relaciona os desvios em torno da média, ou, mais especificamente, é
a média aritmética dos quadrados dos desvios*.
x x 2 (da população)**
2 i
n
n 1
s2
1 x 2
x i2 i (forma prática)
ou
n 1 n
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente; por isso,
tem pouca utilidade na estatística descritiva, mas é extremamente importante na inferência estatística e em
combinações de amostras.
s
x i x
2
n 1
1
x i2
x i 2
ou s (forma prática)
n 1 n
Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade.
O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em
combinações de amostras.
* Nota: Lembremos que di = (xi – x ) = 0, por esse motivo usamos o quadrado dos desvios para definirmos a variância.
* *Nota: Não trabalharemos com dados populacionais neste curso.
Propriedades do desvio padrão
1ª) Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável, o desvio
padrão não se altera:
yi = xi c sy = sx
2ª) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio
padrão fica multiplicado por essa constante:
yi = c . xi sy = c . sx
Essas propriedades nos permitem introduzir, no cálculo do desvio padrão, simplificações úteis.
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para
xi e outra para xi2. Assim:
xi xi2
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
= 371 = 20.293
1
x i
xi
2
=
1 3712
s = 10,25
2
20293
n 1 n 7 1 7
Como, neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando a
fórmula:
x i x fi
2
s 2 1
f i x i
2
fi xi
2
s 2
ou
n 1 n 1 n
1
f i x i
fi xi
2
(forma prática)
s 2
n 1 n
xi 0 1 2 3 4
fi 2 6 12 7 3
O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os
produtos fixi e outra para fixi2, lembrando que para obter fixi2 basta multiplicar cada fixi pelo seu respectivo xi.
Assim:
xi fi fixi fixi2
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
= 30 = 63 = 165
O desvio padrão é:
1
f i x i
fixi
2
=
1 63
2
= 1,13
s 2
165
n 1 n 30 1 30
3.3.2 Com intervalos de classe
Comecemos por abrir as colunas para xi (ponto médio), para fixi e para fixi2. Assim:
57
1 f x 2
f i x i2 i i =
1 6440
2
= 5,64
s 1038080
n 1 n 40 1 40
Portanto,
s = 5,64 cm
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode
ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a
20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos
dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão dos dados em
termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV).
s
CV 100
x
Exemplo 8:
Para uma distribuição em que a média é 161 cm e s = 5,57 cm, temos o seguinte coeficiente de
variação:
5,57
CV = 100 = 3,5%
161
Exemplo 9: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivíduos, calcular os respectivos coeficientes de variação e compará-los, para saber qual obteve a maior
dispersão relativa.
x s
ESTATURA 175 cm 5,0 cm
PESO 68 kg 2,0 kg
Exercício
1) Calcule a amplitude total e o desvio padrão dos conjuntos de dados:
a. 1, 3, 5, 9
b. 20, 14, 15, 19, 21, 22, 20
c. –10, –6, 2, 3, 7, 9, 10
2) O número de carros vendidos por cada um dos vendedores de um negócio de automóveis durante um mês
particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Determinar (a) a média, (b) a mediana, (c) a
moda, (d) o desvio padrão.
3) A distribuição a seguir mostra como varia a idade de um grupo de jovens que participam de uma colônia de
férias. Determine (a) A amplitude total e (b) O desvio padrão.
58
5) Uma pesquisa sobre os gastos semanais com refeições realizados pelos funcionários de determinada empresa
está consolidada na tabela de distribuição abaixo:
6) Para duas emissões de ações ordinárias da indústria eletrônica, o preço médio diário, no fechamento dos
negócios, durante um período de um mês, para as ações A, foi de R$ 150,00 com um desvio padrão de R$
5,00. Para as ações B, o preço médio foi de R$ 50,00 com um desvio padrão de R$ 3,00. Em relação ao nível
do preço, qual dos tipos de ações é mais variável?
Exercício Complementar
7) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma
certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140,
140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a média, (b) a
mediana, (c) a moda, (d) o desvio padrão, (e) o coeficiente de variação, para este grupo de salários.
8) Considerando que foi extraída uma amostra aleatória simples de 10 alunos de uma grande escola, cuja variável
em estudo é a nota obtida em Matemática, obteve-se: 5, 7, 8, 6, 5, 4, 8, 9, 10 e 6. Determine a média da
amostra, a variância da amostra e o desvio padrão da amostra.
10) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para
realizar a auditoria de 50 balanços contábeis. Calcular (a) a média, (b) o desvio padrão, para o tempo de
auditoria necessário para esta amostra de registro.
Tempo necessário para a auditoria de balanços contábeis.
Tempo de auditoria. Nº de balanços.
(min.) (fi)
10 |-- 20 3
20 |-- 30 5
30 |-- 40 10
40 |-- 50 12
50 |-- 60 20
Total 50
11) Considerando que as três distribuições hipotéticas apresentam os valores indicados abaixo:
DISTRIBUIÇÃO
A B
N = 200 N = 50
fx = 4000 fx = 500
fx2 = 85000 fx2 = 5450
12) A distribuição das alturas de um grupo de pessoas apresentou uma altura média de 182 cm e um desvio padrão
de 15 cm, enquanto que a distribuição dos pesos, apresentou um peso médio de 78 kg, com um desvio padrão
de 8 kg. Qual das duas distribuições apresentou maior dispersão? Por quê?
CAPÍTULO 7
MEDIDAS DE ASSIMETRIA E CURTOSE
1. MEDIDAS DE ASSIMETRIA
Estas medidas referem-se à forma da curva de uma distribuição de freqüência, mais especificamente do
polígono de freqüência ou do histograma. Denomina-se assimetria o grau de afastamento de uma distribuição
da unidade de simetria.
Simetria
Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda.
x = Md = Mo
Assimetria
Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na cauda
esquerda ou na direita da curva de freqüências.
Mo Md x
x Md Mo
61
Observar que a Média “puxa” a cauda da Distribuição para seu lado, em função de ser a média uma medida
não resistente, ou seja, ser altamente sensível aos valores extremos da série de dados.
Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são:
3 ( x Md )
As
s
O valor em módulo do Coeficiente de Pearson indica a intensidade da assimetria, e o seu sinal indica a direção
da assimetria.
Para uma distribuição de freqüências, o Coeficiente percentílico de curtose pode ser calculado conforme a
fórmula abaixo:
Q 3 Q1
C
2(P90 P10 )
Denominamos Curtose o grau de achatamento de uma distribuição em relação à Distribuição Normal. A
distribuição de referência (Distribuição Normal) é denominada MESOCÚRTICA (Meso = Meio, Central, etc).
Quando a distribuição apresenta uma curva de freqüência mais fechada (mais aguda em sua parte superior),
ela é denominada LEPTOCÚRTICA (Lepto = Delgado, Alongado, Magro, etc). Quando a distribuição apresenta
uma curva de freqüência mais aberta (mais achatada em sua parte superior), ela é denominada PLATICÚRTICA
(Plato = Chato, Plano, Largo, etc).
Exercício
1. Uma distribuição de freqüência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2,12. Calcule
o coeficiente de assimetria.
Distribuição B
Peso (kg) fi
2 ├─ 6 6
6 ├─ 10 12
10 ├─ 14 24
14 ├─ 18 30
18 ├─ 22 6
78
x = ......
Md = .......
Mo = .......
s = .......
As = .......
Distribuição C
Peso (kg) fi
2 ├─ 6 6
6 ├─ 10 30
10 ├─ 14 24
14 ├─ 18 12
18 ├─ 22 6
78
x = ......
Md = .......
Mo = .......
s = .......
As = .......
5. (FISCAL DE TRIBUTOS DE MG-96) Um candidato obteve, nas diversas provas de um concurso, as seguintes
notas com os respectivos pesos:
Matéria Nota Peso
Português 66 3
Contabilidade 63 3
Estatística X 2
Direito 79 2
A média aritmética ponderada, obtida pelo candidato foi de 69,3. A nota que o candidato obteve em Estatística
foi de:
a) 66
b) 68
c) 70
d) 72
e) 74
6. Dentre as medidas de posição, aquela que apresenta sempre a mesma quantidade de elementos, à sua
esquerda e à sua direita é:
a) A moda
b) A mediana
c) A média aritmética
d) A variância
e) N.D.A.
9. (Controladoria de arrecadação RJ 2004 FJG) Os valores de uma amostra de cinco elementos são: 4, 3, 3,
5, 5. A variância dessa amostra é de:
a) 4,00
b) 3,00
c) 2,33
d) 1,00
e) N.D.A.
10.
11. Sabe-se que uma distribuição apresentou as seguintes medidas:
Q1 = 24,4cm Q3 = 41,2cm P10=20,2cm P90 = 49.5cm,
com tais medidas a curtose é :
a) Leptocúrtica
b) Platicúrtica
c) Mesocúrtica
d) Assimétrica.
e) N.D.A.
65
CAPÍTULO 8
CAPÍTULO 9
PROBABILIDADE
1 Histórico
Os primeiros estudos matemáticos sobre probabilidades foram feitos pelos italianos Cardano (1501 - 1576)
e Galileu Galilei (1564 - 1642) e tratavam dos jogos de dados.
Em 1654, o francês Pascal (1612 -1668) foi procurado por Chevalier de Méré amigo seu e jogador
profissional, que lhe apresentou questões do tipo: “Em oito lances de um dado, um jogador deve tentar o
número 1, mas, depois de três tentativas fracassadas, o jogo é interrompido por seu oponente. Como ele
poderia ser indenizado?”. Resolvido os problemas de Méré, Pascal escreveu a seu amigo Fermat (1601 -
1665) expondo-lhe vários problemas. Essa correspondência entre os dois, onde encontram-se inúmeros
problemas de probabilidade resolvidos, foi o ponto de partida para a moderna teoria das Probabilidades. As
idéias centenárias de Cardano foram esquecidas. Pascal e Fermat nada publicaram a respeito, mas o
holandês Huygins (1629 - 1695), tendo conhecimento desses estudos, passou a interessar-se e, em 1657,
publicou “Sobre o raciocínio em jogo de dados”, o primeiro livro sobre a Teoria das Probabilidades. Dentre os
matemáticos que contribuíram para a evolução dessa teoria destacam-se: o suíço Bernoulli (1654-1705), o
francês Moivre (1667 - 1754), o francês Laplace (1749 - 1827) e os Russos Tchebycheff (1821 - 1894) e
Markov (1856 - 1922).
Atualmente, a Teoria das Probabilidades tem muita importância e várias aplicações em estatística,
economia, engenharia, física, química, sociologia, biologia e vários outros campos do conhecimento.
Definição
Um experimento probabilístico é uma ação ou um ensaio por meio do qual resultado específico
(contagem, medidas e respostas) são obtidos. A conseqüência de um único ensaio em um experimento
probabilístico é um resultado (ponto amostral). O conjunto de todos os resultados possíveis de um experimento
probabilístico é o espaço amostral. Um evento consiste em um ou mais resultados e é um subconjunto do
espaço amostral.
2.2. Eventos
Um evento de um experimento aleatório é qualquer subconjunto do espaço amostral desse
experimento. O número de elementos de um evento E será representado por n(E).
Exemplo: No lançamento de um dado e a observação da face voltada para cima, temos os eventos:
67
Evento Mutuamente Exclusivo: Caracteriza-se quando dois ou mais eventos não podem ocorrer simultaneamente, ou
seja, a ocorrência de um exclui a possibilidade de ocorrência do outro e vice-versa.
Exemplos:
1. Se a carta é de copas, então ela não é de ouro;
2. Se o tempo está nublado, então não há sol.
Eventualmente poderão esgotar todos os resultados possíveis, nesse caso serão chamados de
mutuamente excludentes e exaustivos.
Evento Independente: Dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas,
comportando-se cada um de maneira que lhe é própria sem influenciar os demais.
Caracteriza-se, portanto, quando a ocorrência de um evento não for afetada pela ocorrência do outro, sendo a recíproca
verdadeira.
Evento Condicionado: Quando associados dois ou mais eventos a um experimento aleatório qualquer, dizemos que eles
são condicionados a outro evento A do mesmo experimento.
Caracteriza-se quando a ocorrência de um evento B qualquer dependa da ocorrência de outro evento A.
1. Selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do baralho (B).
Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes.
2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B).
Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes.
69
Importante!
Um evento certo é o próprio espaço amostral;
Um evento impossível é o subconjunto vazio do espaço amostral.
3 Tipos de Probabilidade
Definição
A probabilidade clássica (ou teórica) é usada quando cada resultado no espaço amostral tem a mesma
probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por
ou
Exemplos:
a. No lançamento de uma moeda qual a probabilidade de obter cara:
S = { ca, co } , n(S) = 2
P(A) = = 0,5 = 50%
A = {ca} , n(A) = 1
b. No lançamento de um dado qual a probabilidade de obter um número par:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
P(A) = = 0,5 = 50%
A = { 2, 4, 6 }, n(A) = 3
c. No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
P(A) = = 1,0 = 100%
A = { 1, 2, 3, 4, 5, 6 }, n(A) = 6
d. No lançamento de um dado qual a probabilidade de obter um número maior que 6:
S = { 1, 2, 3, 4, 5, 6 }, n(S) = 6
A = { }, n(A) = 0
P(A) = = 0 = 0%
Exercícios:
1. No lançamento de um dado e a observação da face voltada para cima, determine a probabilidade de se
obter:
A) Um número ímpar.
B) Um número múltiplo de 3.
C) Um número menor que 7.
D) Um número maior que 6.
2. No lançamento simultâneo de dois dados e a observação das faces voltadas para cima, determine a
probabilidade de se obter:
A) Números iguais.
B) A soma dos números igual a 9.
Definição
A probabilidade empírica (ou estatística) baseia-se em observações obtidas em experimentos
probabilísticos. A probabilidade empírica de um evento E é a freqüência relativa desse evento.
frequência do evento E
P E
frequência total
Exemplo: Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré:
Tipo de peixe Quantidade
Matrinxã 13
Tambaqui 17
Tucunaré 10
Total 40
Qual a probabilidade de se pescar um Tambaqui?
17
P(Tambaqui) = = 0,425 = 42,5%
40
Exemplo: Como exemplo dessa lei, suponha que você queira determinar a probabilidade de obter
cara com uma moeda normal.
O mapa de dispersão abaixo mostra o resultado de similar jogada da moeda 500 vezes. Observe que, à
medida que o número de jogadas cresce, a probabilidade de obter cara fica mais perto da probabilidade
teórica, que é de 0,5.
3.3. Probabilidade subjetiva
4 Propriedades da probabilidade
Uma probabilidade não pode ser negativa ou maior que 1. Assim, a probabilidade de um evento
E está entre 0 e 1.
0 P(E) 1
A soma das probabilidades de todos os resultados de um espaço amostral é de 1 (100%). Uma
conseqüência importante desse fato é que, se souber a probabilidade de um evento E, poderá
obter a probabilidade do complemento do evento E.
Sabemos que um evento A pode ocorrer ou não. Sendo P(A) a probabilidade de que ele ocorra
(sucesso) e P(Ā) a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a
relação:
P(A) + P(Ā) = 1
Exemplo: Sabemos que a probabilidade de tirar o nº 4 no lançamento de um dado é igual 1/6. Logo, a
probabilidade de não tirar o nº 4 no lançamento de um dado:
P(Ā) = 1− P(A)
1 5
P(Ā) = 1 − = .
6 6
Exercícios
1) Uma caixa contém bolas numeradas de 1 a 15. Retira-se uma bola ao acaso, qual a probabilidade de se
obter uma bola cujo número seja múltiplo de 4?
2) Qual é a probabilidade de um eleitor amazonense escolhido ao acaso não ter votado em Amazonino
Mendes na eleição de 2008?
Cerca de 1.050.230 votaram em outro candidato ou em outra opção.
Cerca de 1250.000 votaram em Amazonino Mendes.
3) Determine a probabilidade, considerando uma companhia que seleciona funcionários ao acaso para um
teste de drogas. A companhia usa um computador para selecionar aleatoriamente números de
funcionários em um intervalo que vai de 1 a 6.296.
a) Obtenha a probabilidade de selecionar um número menor do que mil.
b) Obtenha a probabilidade de selecionar um número maior do que mil.
c) Obtenha a probabilidade de selecionar um número divisível por mil.
d) Obtenha a probabilidade de selecionar um número não divisível por mil.
4) Dada a distribuição de freqüência dos números de eleitores brasileiros (em milhões) de acordo com a idade.
Idade dos eleitores em anos frequência (em milhões)
18 a 20 10,8
21 a 24 13,9
25 a 34 40,1
35 a 44 43,3
45 a 64 53,7
65 ou mais 31,9
6) O diagrama mostra o número de trabalhadores (em milhares) por setor numa certa cidade. Calcule a
probabilidade de: a) Um trabalhador escolhido ao acaso estar empregado no setor de serviços. b) Um
trabalhador escolhido ao acaso não estar empregado no setor de serviços.
Uma probabilidade condicional é a probabilidade de ocorrer um evento, dado que outro evento já
ocorreu. A probabilidade condicional de o evento B ocorrer, dado que o evento A já ocorreu, é denotada
por P(B|A) – lida como “probabilidade de B, dado A”.
Exemplos:
1. Duas cartas são selecionadas em seqüência em um baralho comum (52 duas cartas). Determine a
probabilidade de a segunda ser uma dama, dado que a primeira foi um rei. Assuma que o rei não seja
recolocado.
Solução: Uma vez que a primeira carta foi um rei e não foi recolocada, restou no baralho 51 cartas, quatro
delas damas. Assim,
4
P(B|A) = 0,078.
51
2. A tabela abaixo mostra os resultados de um estudo no qual pesquisadores examinaram o QI de 102 crianças
e a presença de um gene específico nelas. (a) Obtenha a probabilidade de determinada criança ter um QI alto, dado que
ela tem o gene.
Gene Gene não Total
presente presente
QI alto 33 19 52
QI normal 39 11 50
Total 72 30 102
Solução: Existem 72 crianças com o gene. O espaço amostral, portanto, consiste de 72 crianças. Delas, 33
têm QI alto. Assim,
33
P(B|A) = 0,458.
72
Exemplos:
1. Qual a probabilidade de selecionar um rei de um baralho comum (A), não o recolocando, e então selecionar uma dama do
baralho (B).
Solução: A ocorrência de A modifica a probabilidade da ocorrência de B; portanto, os eventos são dependentes (ou condicionados.
4
Probabilidade de selecionar um rei: P(A) =
52
4
Probabilidade de selecionar uma dama(de ocorre B após ter ocorrido A): P(B|A) = .
51
2. Jogar uma moeda, obter cara (A) e então jogar um dado de seis faces e obter um 6 (B).
Solução: A ocorrência de A não modifica a probabilidade da ocorrência de B; portanto, os eventos são independentes.
1
Probabilidade de ocorrer cara: P(A) =
2
1
Probabiliade de obter a face 6 (de ocorrer B após ter ocorrido A): P(B|A) = P(B) = .
6
Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do
outro e vice-versa.
P (A e B) = P (A ∩ B) = P (A) . P (B)
6 Regra da Adição
Definição
Dois eventos A e B serão mutuamente exclusivos se A e B não puderem ocorrer ao mesmo tempo.
P (A ou B) = P (A U B) = P (A) + P (B)
P (A ou B) = P (A U B) = P (A) + P (B) – P (A ∩ B)
Exemplos:
1. No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4:
Solução: Os dois eventos são mutuamente exclusivos então:
1 1 2 1
P(nº 3 ou nº 4) = + = =
6 6 6 3
2. No lançamento de um dado qual a probabilidade de se tirar um número menor que 3 ou um número
ímpar.
2 3 1 4 2
P(nº menor do que ou nº ímpar) = + – = = ≈ 0,667.
6 6 6 6 3
Exercícios
1. Joga-se um dado duas vezes. Qual a probabilidade de se obter a face 5 em ambas as jogadas?
Resposta: 1/36
2. Uma caixa contém 100 peças das quais 5 são defeituosas. Seleciona-se ao acaso uma peça, que não é
recolocada e, seleciona-se outra peça. Qual a probabilidade de que ambas as peças retiradas sejam
defeituosas? Resposta: 0,2%
3. Em um pequeno açude contém três tipos de peixes: Matrinxã, Tambaqui e Tucunaré:
Tipo de peixe Quantidade
Matrinxã 13
Tambaqui 17
Tucunaré 10
Total 40
a) Qual a probabilidade de se pescar um Tucunaré?
b) Em uma captura, qual a probabilidade de se pescar ou a Matrinxã ou um Tucunaré?
c) Em duas capturas (sem reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré?
d) Em duas capturas (com reposição), qual a probabilidade de se pescar uma matrinxã e um Tucunaré?
5. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas,
1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual
é a probabilidade de as três bolas retiradas da 1ª: 2ª e 3ª urnas serem, respectivamente, branca, preta e
verde.
6. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas.
Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. R: 30%
7. Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas.
Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta. Resposta: 24%
8. Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5
bolas verdes. Qual a probabilidade de que ambas sejam da cor branca?.
9. Uma caixa contém 3 bolas brancas, 4 pretas e 5 vermelhas. Retirando-se uma bola, qual a probabilidade
de ela ser branca ou vermelha?
10. Um júri consiste de nove pessoas naturais do local e três naturais de outros estados, Se dois dos jurados
são selecionados aleatoriamente para uma entrevista, qual a probabilidade de serem ambos naturais de
outro estado? Resposta: 4,55%
11. Em uma caixa há sete lâmpadas, sendo quatro boas e três queimadas. Retirando três lâmpadas ao
acaso, sem reposição, qual a probabilidade de que:
a) Todas sejam boas; R: 24/210
b) Todas sejam queimadas. R: 6/210
14. Ao selecionar uma carta de um baralho, obtenha a probabilidade de tirar um 4 ou um naipe de ouro.
15. Um banco de sangue registra o tipo sanguíneo e o fator Rh de doadores durante os últimos cinco dias
conforme a tabela a seguir:
Questões objetivas
16. (UERJ) - Um instituto de pesquisa colheu informações para saber as intenções de voto no segundo turno
das eleições para governador do estado. Os dados estão indicados no quadro abaixo:
Intenção de Voto Percentual
Candidato A 26%
Candidato B 40%
Votos nulos 14%
Votos Brancos 20%
Escolhendo aleatoriamente um dos entrevistados, verificou-se que ele não vota no candidato B. A
probabilidade de que esse eleitor vote em branco é
(A) 1/6 (B) 1/5 (C) 1/4 (D) 1/3 (E) 2/5
17. (UF São Carlos) - Uma urna tem 10 bolas idênticas numeradas de 1 a 10. Se retirarmos uma bola da
urna, a probabilidade de não obtermos a bola número 7 é igual a
(A) 2/2 (B) 9/10 (C) 1/10 (D) 9/11 (E) 1/5
18. (FUVEST) - Escolhem-se ao acaso dois números distintos de 1 a 20. Qual a probabilidade de que o
produto dos números escolhidos seja ímpar?
(A) 9/38 (B) 1/2 (C) 9/20 (D) 1/4 (E) 8/25
19. (UniRio) - As probabilidades de três jogadores marcarem um gol cobrando um pênalti são,
respectivamente, 1/2, 2/5 e 5/6. Se cada um bater um único pênalti, a probabilidade de todos errarem é
igual a
(A) 3% (B) 5% (C) 17% (D) 20% (E) 25%
21. (UNESP) - Dois dados perfeitos e distinguíveis são lançados ao acaso. A probabilidade de que a soma
dos resultados obtidos seja 3 ou 6 é
(A) 7/18.
(B) 1/18.
(C) 7/36.
(D) 7/12.
(E) 4/9.
22. (Santa Casa-SP) - Num grupo de 60 pessoas, 10 são torcedores do São Paulo, 5 são torcedoras do
Palmeiras e as demais são torcedoras do Corínthians. Escolhido ao acaso um elemento do grupo, a
probabilidade de ele ser torcedora do São Paulo ou do Palmeiras é
(A) 40%.
(B) 25%.
(C) 50%.
(D) 30%.
(E) n.d.a.
23. (CESGRANRIO) - Em uma amostra de 500 peças, existem exatamente quatro defeituosas, Retirando-se,
ao acaso, uma peça dessa amostra, a probabilidade de ela ser perfeita é de
(A) 99,0%.
(B) 99,1%.
(C) 99,2%.
(D) 99,3%.
(E) 99,4%.
24. (CESGRANRIO) - Uma urna contém 4 bolas brancas e 5 bolas pretas. Duas bolas, escolhidas ao acaso,
são sacadas dessa urna, sucessivamente e sem reposição. A probabilidade de que ambas sejam brancas
vale
(A) 1/6.
(B) 4/9.
(C) 20/81.
(D) 2/9.
(E) 16/81.
25. (CESGRANRIO) - Uma urna contém 4 bolas vermelhas, 3 bolas azuis e 3 bolas brancas. Qual é a
probabilidade de retirarmos uma bola vermelha e, sem reposição desta, uma branca?
(A) 1/15.
(B) 2/15.
(C) 3/15.
(D) 4/15.
(E) 10/15.
26. (FEI-SP) - Numa moeda viciada, a probabilidade de ocorrer face cara num lançamento é igual a 4 vezes
mais a probabilidade de ocorrer coroa. A probabilidade de ocorrer cara num lançamento dessa moeda
é:
(A) 40%.
(B) 80%.
(C) 25%.
(D) 20%.
(E) 50%.
7 Análise Combinatória
Quando a contagem direta do número de possibilidades é muito trabalhosa, podemos nos valer da
análise combinatória para determinar os números de casos favoráveis e/ou possíveis dos experimentos
estudados. Para tanto, é necessário primeiro classificar adequadamente o grupamento e depois aplicar a
fórmula correta.
P3 = 3!= 6
Exercícios resolvidos
1) Encontre o anagrama de cada palavra abaixo:
a) AMOR:
P4 = 4! = 4.3.2.1 = 24
b) CASTELO:
P7 =7! = 5040
c) ARARA:
5! 120
P53,2 = =10
3! 2! 6.2
2) Em cada uma das dez bolas de uma urna está impressa uma letra da frase FELIZ NATAL. Sorteadas as
bolas uma a uma, qual a chance de surgir a tal mensagem?
1 4
P = 2 ,2 = = 0,0001%
P10 10!
7.3 Arranjo
Quando a permutação é feita com apenas uma parte dos elementos do espaço amostral, ou seja, por
arranjo se entende o número total de permutações possíveis nos subconjuntos de ‘r’ elementos de um
conjunto composto por ‘n’ elementos.
Permutar sem reposição significa extrair o elemento, avalia-lo e descarta-lo, quando o item
selecionado é devolvido ao conjunto de origem antes do próximo sorteio, fala-se em permutação com
reposição.
Exercícios resolvidos
Exercício de aplicação
1) Qual o número máximo formado pela empresa de Telefonia celular que você usa com em Manaus?
n!
An,r =
n r !
Exercícios resolvidos
a) A9,3 = 9 x 8 x 7 = 504
b) A9,2 = 9 x 8 = 72
2) Um grupo de Cinco pessoas, deseja montar uma chapa eleitoral composta por um presidente, um vice e
um tesoureiro. Calcule quantas chapas podem ser formadas.
5! 5! 5.4.3.2!
A5,3 = = = = 60
5 3 ! 2! 2!
Observe que se utiliza um arranjo quando se quer formar grupos a partir de um conjunto maior em
que a ordem é importante.
7.4 Combinação
Quando as escolhas se distinguem só pela qualidade e não pela ordem dos elementos. Para se
calcular o número de combinações possíveis de ‘n’ elementos, tomando-se ‘r’ de cada vez, usa-se a
expressão:
n!
Cn,r=
r! n r !
Exercícios resolvidos
1) Calcule a seguinte combinação:
15! 15.14.13.12! 15.14.13
C15,3 = = = = 455
3!15 3! 3!.12! 3.2.1
3) De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B. Qual a probabilidade
de, escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham sangue tipo B:
C15,3
P (3 sangue B) = = 0,399
C 20,3
Observe que se utiliza uma combinações quando se quer formar grupos a partir de um conjunto maior
em que a ordem não é importante.
2) Diretoria. Uma diretoria deve ser escolhida a partir de 15 candidatos. Os cargos são de presidente,
vice-presidente, secretário e tesoureiro. De quantas maneiras os cargos podem ser preenchidos?
3) Letras. De quantas letras distinguíveis as letras da palavra estatística podem ser escritas?
CAPÍTULO 10
Bibliografia
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. 2005.
MEDEIROS, Ermes da Silva Et al. Estatística 1 - Para Os Cursos De: Economia, Administração E Ciências Contábeis . São Paulo:
Atlas, 2006
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª edição. Editora Saraiva, 2002.
TRIOLA, Mário. Introdução a Estatística. Editora LTC. 9ª edição. 2005.
LARSON, Ron e FARBER, Betsy. Estatística Aplicada. 2ª edição, Ed. Pearson-Prentice hall, São Paulo, 2007.
FREUND, John e SIMON, Freund. Estatística Aplicada - Economia, Administração e Contabilidade . Editora Bookman. 9ª edição.
2002.
LEVIN Jack, e FOX, James A. Estatística para Ciências Sociais, 9ª Edição. São Paulo. Pearson Prentice Hall, 2008.
Laponi, J. C. , Estatística Usando Excel, 4ª Edição, Editora Campus, RJ, 2005.
.