Você está na página 1de 101

1

FUNDAÇÃO DE ESTUDOS SOCIAIS DO


PARANÁ

ESTATÍSTICA
APLICADA

ALUNO:__________________________________________________________________

Marco Antônio Santoro Bara


2

Nota sobre o autor

Marco Antônio Santoro Bara é Bacharel em Administração de


Empresas pela FESP (Fundação de Estudos Sociais do PR), é Licenciado em
Matemática pela UFPR (Universidade Federal do PR) é pós-graduado em
Matemática Superior pela FUSVE-RJ, é pós-graduado em EaD pela FESP, é
mestre em Administração na área de Finanças pela UFRGS e doctor of
Philosophy in Business Administration pela Flórida Christian University.
Certificou-se junto a Case Western Reserve University em parceria com a
UNINDUS (Universidade da Indústria da FIEP) no curso de Investigação
Apreciativa (I.A.), metodologia utilizada no Fórum Paraná Futuro 10.
É professor universitário das disciplinas: Matemática Financeira,
Cálculo Diferencial e Integral, Lógica Matemática e Estatística na FESP
(Fundação de Estudos Sociais do PR); lecionou ainda: Geometria Analítica,
Matemática Financeira na Escola Técnica da UFPR (Universidade Federal do
PR) nos cursos presenciais e lecionou ainda em parceria com o ITDE a disciplina
de estatística no módulo à distância; lecionou por mais de 10 anos: Matemática
Financeira, Pesquisa Operacional no UNICENP (Centro Universitário Positivo).
Além da experiência em sala de aula como professor, atuou também
na indústria, durante 5 anos na Nestlé Industrial e Comercial na área
Administrativa – Financeira e atualmente é sócio proprietário da Mbara
Empreendimentos Imobiliários LTDA, sócio proprietário da ENZE Curitiba –
Distribuidora de Cosméticos e ainda é funcionário do Banco do Brasil.
Dedico este material didático aos meus filhos Ana Paula e Rodrigo
Augusto.

Marco Antônio Santoro Bara


3

ESTATÍSTICA
1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA
Etimologicamente a palavra estatística vem de “status” expressão latina que
significa: ”sensu lato”, o estudo do estado. Os primeiros a empregarem esse
termo foram os Alemães seguidos pela Itália, França, Inglaterra e ainda por
outros países.
Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule
define estatística como: “Dados quantitativos afetados marcadamente por uma
multiplicidade de causas”.
Uma definição mais usual nos dias de hoje seria: “Um método científico que
permite a análise, em base probabilística, de dados coligados e condensados”.
Ou ainda podemos dizer que Estatística é um conjunto de métodos quantitativos,
que servem para a coleta, organização, redução e apresentação de dados,
análise dos mesmos e a obtenção de conclusões válidas e tomadas de decisões
a partir de tais análises.
Estatística pode ser entendida como sendo a ciência de aprendizagem a partir
de dados.
No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas.
Assim podemos dizer que a Estatística fornece métodos que auxiliam o processo
de tomada de decisão.

1.1 POR QUE ESTUDAR ESTATÍSTICA?


O raciocínio estatístico é largamente utilizado no governo e na administração;
assim, é possível que, no futuro, um empregador venha a contratar ou promover
um profissional por causa do seu conhecimento de estatística. Essa é uma razão,
esperamos que ao final deste trabalho o leitor encontre suas próprias razões.

1.2 A NATUREZA DOS DADOS


Os dados estatísticos constituem a matéria prima das pesquisas estatísticas,
eles surgem quando se fazem mensurações ou se restringem observações.
Estatística descritiva: Trata-se da descrição e resumo dos dados.
Probabilidade: É um estudo que envolve o acaso.
Inferência: É a análise e interpretação de dados amostrais (Amostragem).
Modelos: São versões simplificadas (abstrações) de algum problema ou
situação real.

Marco Antônio Santoro Bara


4

1.3 TIPOS DE DADOS


Quantitativos Contínuos
Discretos
Qualitativos Nominais
Por postos

As variáveis contínuas podem assumir qualquer valor num intervalo contínuo.


Os dados referentes a tais variáveis dizem-se dados contínuos. Ex.: peso,
comprimento, espessura onde se usa a mensuração.
As variáveis discretas assumem valores inteiros de dados discretos são os
resultados da contagem de números de itens. Ex.: alunos da sala de aula,
número de defeitos num carro novo, acidentes de uma fábrica.
Os dados nominais surgem quando se definem categorias e se conta o número
de observações pertencentes a cada categoria. Atuam dentro das variáveis
“Qualitativas”, às quais devemos associar a valores numéricos para que
possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes,
castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrível,
mau), etc.
Os dados por postos consistem de valores relativos atribuídos para denotar
ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se
classificam em 1ª, 2ª, 3ª colocadas.

TABELA 1: A mesma população pode originar diferentes tipos


de dados.
TIPOS DE DADOS
POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR
POSTO

Alunos de idade/peso N. de Homens/Mulheres 3º grau


administração classes

Marco Antônio Santoro Bara


5

1.4 TIPOS DE LEVANTAMENTOS


Os levantamentos podem ser classificados em contínuos, periódicos e
ocasionais:
CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem.
Exemplos os registros civis dos fatos vitais (nascimento, óbitos e casamentos).
PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenseamento, feito no
Brasil a cada dez anos. A realização de um Censo Demográfico representa o
desafio mais importante para um instituto de estatística, sobretudo em um país
de dimensões continentais como o Brasil, com 8 514 215,3 km2, composto por
27 Estados e 5 507 municípios existentes na data de referência da pesquisa,
abrangendo um total de 54 265 618 de domicílios pesquisados (dados do IBGE
sobre o Censo de 2000).
OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou
periodicidade preestabelecidas, exemplos a maioria dos trabalhos de
investigação cientifica.
Os dados ainda podem ser classificados em: primários e secundários.
DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados
adequados ao seu estudo, parte para a realização de um inquérito, isto é, os
dados são levantados diretamente na população no momento da investigação.
DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas
hipóteses de trabalho utiliza-se de dados já existentes, arquivados, registrados
ou publicados. Podem ser, até mesmo, dados gerados pelo Departamento de
Estatística de Populações da Fundação Instituto Brasileiro de Geografia e
Estatística (IBGE).

1.5 PLANEJAMENTO DE EXPERIMENTOS


1- Definição do problema: Um Estudo ou Uma Análise
2- Formular plano adequado para coleta de dados
3- Organizar os dados
4- Analisar e interpretar os dados
5- Relatar as conclusões

Marco Antônio Santoro Bara


6

EXERCÍCIOS
1- Identifique os seguintes exemplos em termos de tipos de dados:
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe
e- tamanho de camisa
f- Km/litro
g- O mais aprazível
h- O mais lento
i- 5 acidentes no mês de maio

2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo
de uma parcela dos itens de uma população, enquanto que o censo requer o
estudo de todos os itens.
Restrições ao Censo:
- Custo
- Populações infinitas
- Dificuldade nos critérios (Precisão)
- Produtos de testes Destrutivos (fósforos, munições)
- Tempo despendido (atualização)
- Tipos de informações mais restritivas
Casos de exceção:
- Populações pequenas
- Amostras grandes em relação à população
- Se exige precisão completa
- Se já são disponíveis informações completas

Marco Antônio Santoro Bara


7

2.1 DEFINIÇÕES:
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma
variável comum observável. População é a totalidade dos elementos de um
conjunto com uma dada característica, no qual se deseja fazer um determinado
estudo.
AMOSTRA: é qualquer subconjunto da população extraída para se realizar
estudos estatísticos.

A estatística indutiva é a ciência que busca tirar conclusões probabilísticas


sobre a população, com base em resultados verificados em amostras retiradas
dessa população.
Entretanto não basta que saibamos descrever convenientemente os dados da
amostra para que possamos executar, com êxito, um trabalho estatístico
completo. Antes de tudo é preciso garantir que a amostra ou amostras que serão
utilizadas sejam obtidas por processos adequados.
- O que é necessário garantir, em suma, é que a amostra seja “Representativa”
da população.
Dois aspectos nas amostras são fundamentais, e que dão a sua
representatividade em termos:
- Qualitativos: Amostras que representem todas as subpopulações, quando for
o caso.
- Quantitativos: Que possua quantidade de dados suficientes para representar
a população.
Na indústria onde amostras são frequentemente retiradas para efeito de Controle
da Qualidade dos produtos e materiais, em geral os problemas de amostragem
são mais simples de resolver.
Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexidade
dos problemas de amostragem são normalmente bastante grandes.

Marco Antônio Santoro Bara


8

Inferência estatística envolve a formulação de certos julgamentos sobre um


todo após examinar apenas uma parte, ou a amostra, dele.
A probabilidade e a amostragem estão estreitamente correlacionadas e juntas
formam o fundamento da teoria de inferência.
- Amostragem é o ato de retirar amostra, isto é, a ação.
- Amostra é a quantidade de dados especificados para representar a população.
Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer
“quão próxima” está a amostra da população, em termos de representatividade.
Amostragem não aleatória não apresenta esta característica.
Há vários métodos para extrair uma amostra, talvez o mais importante seja a
amostragem aleatória. De modo geral, a amostragem aleatória exige que cada
elemento tenha a mesma oportunidade de ser incluído na amostra.
Nas Populações discretas uma amostra aleatória é aquela em que cada item
da população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a
probabilidade de incluir na amostra qualquer intervalo de valores é igual à
percentagem da população que está naquele intervalo.
Populações finitas: é quando, temos constituído por números finitos, ou fixos
de elementos, medidas ou observações.
Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção.
Populações infinitas: são aquelas que contém, pelo menos hipoteticamente,
um número infinito de elementos.
Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos
(universo volkswagem), processo probabilístico.

2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS


(RANDÔMICOS)
As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,......,9.
Esses números podem ser lidos isoladamente ou em grupos; podem ser lidos
em qualquer ordem.
A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10.
Portanto todas as combinações são igualmente prováveis.
Conceitualmente, poderíamos construir uma tabela de números aleatórios
numerando dez bolinhas com os algarismos de 0 a 9, colocando-as numa urna,

Marco Antônio Santoro Bara


9

misturando bem e extraindo uma de cada vez, com reposição, anotando os


valores obtidos.
A título de ilustração poderíamos querer selecionar aleatoriamente 15 clientes
de uma lista de 830 de um grande magazine, a finalidade poderia ser:

Estimar a frequência de compras;


Determinar o valor médio de cada compra;
Registrar as queixas contra o sistema.

2.3 OUTROS PLANOS DE AMOSTRAGEM


Amostragem probabilística versus Amostragem não probabilística.
Os planos de amostragem probabilística são delineados de tal modo que se
conhece a probabilidade de todas as combinações amostrais possíveis. Em
razão disso, pode-se determinar a quantidade de variável amostral numa
amostra aleatória e uma estimativa do erro amostral. A amostragem aleatória é
um exemplo da amostragem probabilística.
A amostragem não probabilística é a amostragem subjetiva, ou por julgamento,
onde a variabilidade amostral não pode ser estabelecida com precisão,
consequentemente, não é possível nenhuma estimativa do erro amostral.
A verdade é que, sempre que possível, deve-se usar a amostragem
probabilística.

Marco Antônio Santoro Bara


10

2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)


Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a
amostragem aleatória pode dar resultados totalmente não representativos, ao
passo que uma pessoa familiarizada com a população pode especificar quais os
itens mais representativos da população.

Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem
como voluntários para testar um novo medicamento. Nenhum desses grupos
podem ser considerados como uma amostra aleatória do público em geral, e
seria perigoso tentar tirar conclusões gerais com base em tal estudo. Todavia,
os resultados poderiam proporcionar uma base para a elaboração de um plano
de amostragem aleatório para validar os resultados básicos. Os perigos
inerentes à pesquisa médica, bem como outro tipo de pesquisa, frequentemente
obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntários.

Exemplo: A aplicação de hormônios em mulheres na menopausa, após um


período de tempo notou-se o aumento das chances de adquirirem câncer de
mama, doenças cardíacas etc.

2.5 AMOSTRAGEM PROBABILÍSTICA


SISTEMÁTICA
ESTRATIFICADA
CONGLOMERADO

AMOSTRAGEM SISTEMÁTICA
É muito parecida com a amostragem aleatória simples. Podemos ter uma
amostragem realmente aleatória, escolhendo-se cada K-ésima amostra, onde K
obtém-se dividindo o tamanho da população pelo tamanho da amostra.

K= N /n
onde: N= Tamanho da População

n= Tamanho da Amostra

Marco Antônio Santoro Bara


11

EX. N= 200 e n=10 então K=200/10 = 20


Significa que será escolhido um item a cada sequência de 20 de uma lista. Para
iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os
grupos. Por exemplo se der o 9, escolhemos o 9º, 29º, 49º, 69º .., etc.

AMOSTRAGEM ESTRATIFICADA
Pressupõe a divisão da população em subgrupos Homogêneos (Estratos),
procedendo então a amostragem de cada subgrupo. Ex.: Para se fazer o
inventário do estoque, é comum termos 10% dos itens representarem cerca de
60% do valor total enquanto que os 90% restantes representam só 40% do valor
total (Curva A,B,C; Pareto; regra 80/20).

AMOSTRAGEM POR CONGLOMERADO


Pressupõe a disposição dos itens de uma população em subgrupos
heterogêneos (subpopulações) representativos da população global. Neste caso
cada conglomerado pode ser encarado como uma mini população.
Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Subgrupos:
sexo, educação, faixa etária, poder aquisitivo, região da habitação, etc.)

RESUMO
A finalidade da amostra é permitir fazer inferência sobre a população após
inspeção de apenas parte dela. Fatores como custo, ensaios destrutivos e
populações infinitas, tornam a amostragem preferível a um estudo completo
(Censo) da população.
Naturalmente espera-se que a amostra seja representativa da população da qual
foi extraída.
Potencialmente, este objetivo é atingido quando a amostragem é aleatória.
Para populações discretas o termo “Aleatório” significa que cada item da
população tem a mesma chance de participar na amostra.
No caso de populações contínuas, significa que a probabilidade de incluir
qualquer valor de um dado intervalo de valores é igual à proporção de valores
naquele intervalo.

Marco Antônio Santoro Bara


12

As amostras aleatórias podem ser obtidas:


- Através de um processo de mistura, como o embaralhamento de cartas;
- Pela utilização de um processo mecânico (Misturadores);
- Utilizando-se uma tabela de números aleatórios para proceder à seleção de
uma lista.
Em certas condições, podem ser mais eficientes variantes da amostragem
aleatória simples, tais como amostragem sistemática (periódica), estratificada
(subgrupos Homogêneos), ou amostragem por aglomerados (subgrupos
convenientes e heterogêneos).
A principal vantagem da amostragem aleatória é que se pode determinar o grau
de variabilidade amostral, o que é essencial na inferência estatística. Para a
amostragem não probabilística falta esta característica.

3.0 ANÁLISE EXPLORATÓRIA DE DADOS


Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema
de analisar e entender uma massa de dados, relevantes ao seu particular objeto
de estudos.
De modo geral, podemos dizer que a essência da ciência é a observação e que
seu objetivo básico é a inferência. Esta é a parte da metodologia da ciência que
tem por objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir
do que, finalmente, faz-se a inferência para uma população, da qual os dados
(amostras) foram obtidos.

4.0 DISTRIBUIÇÃO DE FREQUÊNCIA


Para cada tipo de variável existem técnicas mais apropriadas para resumir as
informações.
Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para
outros.
Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a
distribuição dessa variável através das possíveis realizações (valores) da
mesma.

Marco Antônio Santoro Bara


13

Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população


de 2000 funcionários da empresa XYZ. Ver resultados anotados na tabela
abaixo.

TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma


população de 2000 funcionários da empresa XYZ.

Nº ESTADO GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE


CIVIL INSTRUÇÃO FILHOS (X SAL. MIN) ANOS MESES PROCEDÊNCIA

1 solteiro 1º grau --- 4 26 03 interior


2 casado 1º grau 1 4,56 32 10 capital
3 casado 1º grau 2 5,25 36 05 capital
4 solteiro 2º grau - -- 5,73 20 10 outro
5 solteiro 1º grau --- 6,26 40 07 outro
6 casado 1º grau 0 6,66 28 00 interior
7 solteiro 1º grau --- 6,86 41 00 interior
8 solteiro 1º grau --- 7,39 43 04 capital
9 casado 2º grau 1 7,59 34 10 capital
10 solteiro 2º grau - -- 7,44 23 06 outro
11 casado 2º grau 2 8,12 33 06 interior
12 solteiro 1º grau --- 8,46 27 11 capital
13 solteiro 2º grau - -- 8,74 37 05 outro
14 casado 1º grau 3 8,95 44 02 outro
15 casado 2º grau 0 9,13 30 05 interior
16 solteiro 2º grau - -- 9,35 38 08 outro
17 casado 2º grau 1 9,77 31 07 capital
18 casado 1º grau 2 9,8 39 07 outro
19 solteiro superior --- 10,53 25 08 interior
20 solteiro 2º grau - -- 10,76 37 04 interior
21 casado 2º grau 1 11,06 30 09 outro
22 solteiro 2º grau - -- 11,59 34 02 capital
23 solteiro 1º grau --- 12,00 41 00 outro
24 casado superior 0 12,79 26 01 outro
25 casado 2º grau 2 13,23 32 05 interior
26 casado 2º grau 2 13,6 35 00 outro
27 solteiro 1º grau --- 13,85 46 07 outro
28 casado 2º grau 0 14,69 29 08 interior
29 casado 2º grau 5 14,71 40 06 interior
30 casado 2º grau 2 15,99 35 10 capital
31 solteiro superior --- 16,22 31 05 outro
32 casado 2º grau 1 16,61 36 04 interior
33 casado superior 3 17,26 43 07 capital
34 solteiro superior --- 18,75 33 07 capital
35 casado 2º grau 2 19,40 48 11 capital
36 casado superior 3 23,30 42 02 interior

Marco Antônio Santoro Bara


14

TABELA 2: Frequência e porcentagem da amostra de 36 empregados da


empresa XYZ, segundo o grau de instrução.

GRAU DE TABULAÇÃO FREQUÊNCIA FREQ. RELATIVA


INSTRUÇÃO f fR (%)
1º grau IIIIIIIIIIII 12 33,33
2º grau IIIIIIIIIIIIIIIIII 18 50,00
superior IIIIII 6 16,67
TOTAL 36 100

TABELA 3: Frequência e porcentagem dos 2000 empregados (População) da


empresa XYZ (Censo x Probabilidade)

GRAU DE FREQUÊNCIA FREQ. RELATIVA FREQ. RELATIVA


INSTRUÇÃO f fR % CENSO fR % PROVÁVEL
1º grau 650 32,50 33,33
2º grau 1020 51,00 50,00
superior 330 16,50 16,67
TOTAL 2000 100 100

TABELA 4: Frequência e porcentagens dos 36 empregados (Amostra) da


empresa XYZ.

CLASSES DE FREQUÊNCIA FREQ. RELATIVA


SALÁRIOS f fR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100

TABELA 5: Frequências e porcentagem dos empregados da empresa XYZ,


segundo Nº de filhos.

Nº DE FILHOS FREQÜÊNCIA FREQ. RELATIVA


f fR (%)
0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
TOTAL 20 100

Marco Antônio Santoro Bara


15

5.0 APRESENTAÇÃO GRÁFICA


A apresentação gráfica dos dados e respectivos resultados de sua análise pode
também ser feita sob forma de figuras, em geral gráficos ou diagramas.

Gráficos devem ser autoexplicativos e de fácil compreensão, de preferência


sem comentários inseridos. Os gráficos devem ser simples, atrair a atenção do
leitor e inspirar confiança.

5.1 DIAGRAMA DE ORDENADAS


Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir
de pontos equidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam
proporcionais às frequências.

Ex. Considerando a tabela abaixo:

CLASSES DE FREQUÊNCIA FREQ. RELATIVA


SALÁRIOS f fR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100

Frequências

12

10

0
4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24

Salários

Marco Antônio Santoro Bara


16

5.2 DIAGRAMA DE BARRAS/COLUNAS

A mesma distribuição acima poderia ser representada por meio de diagrama que
levasse em conta a magnitude da área da figura geométrica, já que a vista
repousa melhor sobre uma superfície do que sobre uma linha.

Ex. Considerando a tabela abaixo:

CLASSES DE FREQUÊNCIA FREQ. RELATIVA


SALÁRIOS f fR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100

SALÁRIOS
14

12

10

0
4 |----- 8 8 |----- 12 12 |----- 16 16 |----- 20 20 |----- 24

Marco Antônio Santoro Bara


17

5.4 DIAGRAMA DE SETORES CIRCULARES


Outra opção seria através de setores circulares, na qual se divide a área total
de um círculo em subáreas (setores) proporcionais as frequências.

Ex. Considerando a tabela abaixo:

CLASSES DE FREQUÊNCIA FREQ. RELATIVA


SALÁRIOS f fR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100

Salários
2.78

13.89
27.78

22.22

33.33

1 2 3 4 5

5.5 DIAGRAMA LINEAR


No diagrama linear deve-se plotar os pontos nos eixos como foi feito no
diagrama de barras e em seguida unir esses pontos por semi-retas constituindo-
se desta forma o diagrama linear.

Ex. Considerando a tabela abaixo:

CLASSES DE FREQUÊNCIA FREQ. RELATIVA


SALÁRIOS f fR (%)
4 |----- 8 10 27,78
8 |----- 12 12 33,33
12 |----- 16 8 22,22
16 |----- 20 5 13,89
20 |----- 24 1 2,78
TOTAL 36 100

Marco Antônio Santoro Bara


18

Salários
14

12

10

0
4 |----- 8 8 |----- 12 12 |----- 16 16 |----- 20 20 |----- 24

6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS


A análise estatística de dados relativos a uma amostra de uma população,
requer uma aglutinação organizada de informações, conforme regras cuja
prática demonstrou serem eficientes.

O agrupamento destes dados em subgrupos é feito com base nos seguintes


conceitos:

Amplitude total (AT): é a diferença entre a medida máxima e a medida mínima.

Número de classes (d): é o número de divisões que estipulamos para a


Amplitude Total.

Normalmente pode-se usar d ≈ √ n onde n é o número de itens na amostra.

(Classe: é o intervalo de variação das medidas.)

Amplitude do intervalo de classe (AI): é a diferença entre os valores máximos


e mínimos de cada classe.

Amplitude do intervalo de cada classe AI = AT / d

OBS.: Normalmente, usa-se um número mínimo de 5 e no máximo 20 classes,


de preferência de mesma amplitude.

Marco Antônio Santoro Bara


19

As classes devem ser mutuamente exclusivas, para que não haja dúvida na
localização dos valores das variáveis, podemos daí utilizar as seguintes
simbologias para os intervalos:

0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende
os valores da variável maiores do que 0 (exclusive) e até 10 (inclusive);

0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores
da variável a partir de 0 (inclusive) e até 10 (exclusive);

0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores
maiores do que 0 e menores do que 10.

0 I----I 10 intervalo fechado & fechado, para significar que compreende os


valores da variável a partir de 0 (inclusive) e até 10 (inclusive).

TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS


Para a facilidade e metodização do processo de análise estatística, monta-se
uma tabela que agrupe as informações obtidas, da forma de Tabela de
Frequências.

Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de


uma amostra de 100 pacotes extraídos parcialmente de um processo
automático de empacotamento.

TABELA 6
AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO
1 207 21 220 41 210 61 210 81 217
2 213 22 204 42 214 62 220 82 211
3 210 23 213 43 219 63 213 83 213
4 215 24 211 44 215 64 217 84 218
5 201 25 214 45 217 65 214 85 213
6 210 26 217 46 213 66 219 86 213
7 212 27 224 47 218 67 214 87 218
8 204 28 211 48 214 68 215 88 216
9 209 29 220 49 215 69 223 89 206
10 212 30 209 50 212 70 217 90 212
11 215 31 214 51 221 71 213 91 207
12 216 32 208 52 211 72 218 92 213
13 221 33 217 53 218 73 207 93 215
14 219 34 214 54 205 74 210 94 212
15 222 35 209 55 220 75 208 95 223
16 225 36 212 56 203 76 214 96 210
17 215 37 208 57 216 77 211 97 226
18 218 38 215 58 222 78 205 98 224
19 213 39 211 59 206 79 215 99 214
20 216 40 216 60 221 80 207 100 215

Marco Antônio Santoro Bara


20

No caso da amostra de pacotes de manteiga acima, temos:

AT = 226 – 201 = 25 gramas

Temos d √100 10 classes, porém deve-se utilizar sempre que possível número
ímpar de classes, no caso podemos usar 9 classes.

Amplitude do intervalo de cada classe 2,78 (aprox. 3)


Isto é: AI = 25/9 = 2,78

AI adotado = 3 e AT adotado = 27 (começa um antes do menor e termina


um depois do maior valor)

TABELA 7

FREQ FREQ. FREQ. FREQ. ACUM.


RELATIVA % ACUMULADA REL. %
CLASSE TABULAÇÃO f fR F FR
1 200 I--- 203 I 1 1 1 1
2 203 I--- 206 IIII 4 4 5 5
3 206 I--- 209 IIIIIIIIII 10 10 15 15
4 209 I--- 212 IIIIIIIIIIIIIII 15 15 30 30
5 212 I--- 215 IIIIIIIIIIIIIIIIIIIIIIIII 25 25 55 55
6 215 I--- 218 IIIIIIIIIIIIIIIIIIIII 21 21 76 76
7 218 I--- 221 IIIIIIIIIIIII 13 13 89 89
8 221 I--- 224 IIIIIII 7 7 96 96
9 224 I--- 227 IIII 4 4 100 100
Σ 100 100%

Onde:

Frequência (f) = número de vezes que as medidas ocorrem no intervalo de


classes

Frequência Relativa (fR) = porcentagem da frequência de cada classe em


relação ao total de elementos.
fR = (f / n).100

Frequência acumulada (F) = soma das frequências até o intervalo de classe


considerado.
Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55

Frequência acumulada relativa (FR) = soma das frequências relativas até o


intervalo considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15

Marco Antônio Santoro Bara


21

7.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL

Como o próprio nome indica, a medida de tendência central visa a determinar o


centro da distribuição. Esta determinação, porém, não é bem definida daí parece
razoável chamarmos de “tendência central”.

São medidas de tendência central:

· MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( x̅ );


· MEDIANA (md);
· MODA (mo).

7.1 MÉDIA ARITMÉTICA SIMPLES

7.1.1 PARA UMA LISTA

Esta é a situação mais simples: para se calcular a média, basta somarmos todos
os elementos da lista e dividirmos o resultado pelo número de elementos.

x̅ = Σ xi / n
Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10.

x̅ = 8+3+5+12+10 = 38 = 7,6
5 5

7.1.2 PARA DADOS TABULADOS

Outra possibilidade é calcular a média quando os dados vêm dispostos em uma


tabela na qual é informada a frequência absoluta simples fi de cada elemento xi.
O total de elementos n é obtido somando todas as frequências absolutas simples
fi.

x̅ = Σ (xi . fi) / n

Marco Antônio Santoro Bara


22

Exemplo: Calcular a média aritmética do conjunto descrito a seguir:

xi fi
1 2
2 3
3 1

x̅ = (1 . 2 + 2. 3 + 3 . 1) / (2+3+1)
x̅ = 11 / 6
x̅ = 1,83

7.1.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA

Neste caso, os dados estão agrupados em classes e devemos calcular a média


a partir da distribuição de frequência correspondente, apresentada em forma de
tabela. Cada classe tem um ponto médio PM que é igual à metade da soma de
seus limites inferior e superior.

x̅ = Σ (PMi . fi) / n

Exemplo: Calcular a média do conjunto descrito pela distribuição de frequência


a seguir:

xi fi
0 |----- 3 2
3 |----- 6 5
6 |----- 9 7
9 |----- 12 4
12 |----- 15 3

x̅ = (1,5 . 2 + 4,5 . 5 + 7,5 . 7 + 10,5 . 4 + 13,5 . 3) / (2+5+7+4+3)


x̅ = 160,5 / 21
x̅ = 7,64

7.2 MÉDIA ARITMÉTICA PONDERADA

x̅ = Σ(xi .fi ) / Σ fi

onde: fi = frequência dos dados xi

Marco Antônio Santoro Bara


23

Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem


com as frequências 3, 2, 4 e 1, respectivamente.

Números x = 5, 8, 6, 2
Frequências f = 3, 2, 4, 1

x̅ = 5.3+8.2+6.4+2.1 = 57 = 5,7
3+2+4+1 10

7.3 MEDIANA (md)

7.3.1 PARA UMA LISTA

Esta é a situação mais simples: para se calcular a mediana, basta ordenar os


elementos da lista e localizar o elemento que está ao centro da lista, isto é, para
o qual há o mesmo número de ocorrências antes e depois.

Obs.: se o número de elementos for par, basta localizar os dois elementos


medianos e calcular média aritmética entre eles.

Exemplo-1: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 ,6}

Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,10}


md = 5

Exemplo-2: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 , 6, 9 }

Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,9,10}


md = (5+6) / 2
md = 5,5

7.3.2 PARA DADOS TABULADOS

No caso de cálculo da mediana quando estamos trabalhando com dados


tabulados determinamos o valor mais provável dessa distribuição a partir de:

Posição da md = (Frequência acumulada total + 1) = FA + 1


2 2

Marco Antônio Santoro Bara


24

Exemplo: Qual a mediana do conjunto descrito pela tabela abaixo:

xi fi FA
10 3 3
13 4 7
16 6 13
17 5 18
25 1 19

Como n = 19 , a posição central é (n+1) / 2, logo 20 /2 , isto é 10° posição.


Portanto a mediana é md = 16

{10,10,10,13,13,13,13,16,16,16,16,16,16,17,17,17,17,17,25}

Ou seja, a posição da MEDIANA é definida por n+1 -ésimo elemento


2
quando ”n” é ímpar e temos um número inteiro que dá a posição da mediana.
Quando temos o meio do caminho entre dois números inteiros, isto é, ”n” é par,
a mediana será a média deles.

Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88.

(a) n+1 = 15+1 = 8 , e a mediana é o valor do 8° elemento;


2 2
(b) n+1 = 45+1 = 23 , e a mediana é o valor do 23° elemento;
2 2
(c) n+1 = 88+1 = 44,5 , e a mediana é a média do valor do 44° e o
2 2 45°elemento.

Ou seja, quando n é par procuramos duas posições: n e n +1


2 2

7.3.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA

Neste caso, os dados estão agrupados em classes e devemos calcular a


mediana a partir da distribuição de frequência correspondente, apresentada em
forma de tabela. Ao contrário dos itens anteriores, não precisamos nos preocupar
se há um número ímpar ou par de elementos. Basta encontrar a classe mediana
e aplicar a fórmula para o cálculo da mediana para distribuição de frequências.

No caso do exercício da distribuição dos 100 valores de peso de pacotes de


manteiga temos:

Posição da md = (Frequência acumulada total ) = FA


2 2

Marco Antônio Santoro Bara


25

md = FA = 100 = 50, e a mediana é o valor do 50° elemento


2 2

50° valor

F 0 1 5 15 30 55 76 89 96 100

X 200 203 206 209 212 215 218 221 224 227

(55 – 30) (215 – 212) ou (55 – 30) (215 – 212)


(55 – 50) Δ (50 – 30) Δ

Δ = 5 x 3 = 0,6 Δ = 20 x 3 = 2,4
25 25
portanto a mediana será 215 - Δ portanto a mediana será 212 + Δ
logo, md = 215 - 0,6 = 214,4. logo, md = 212 + 2,4 = 214,4.

Assim, para encontrarmos a mediana para dados agrupados em classes


podemos formalizar os passos anteriores na seguinte equação:

Md = linf + h. n/2 - Fant


fmed

onde: n/2 = metade da quantidade de dados


h = amplitude da classe mediana
linf = limite inferior da classe da mediana
fmed = frequência absoluta da classe da mediana
Fant = frequência acumulada da classe anterior a da
mediana

Voltando ao exemplo, temos:

1º Passo: da tabela 7 - página 18, temos as frequências acumuladas já


calculadas;

2º Passo: n = 100 => n/2 = 100/2 = 50 => localização da classe mediana: 5ª


classe, isto é, classe 212 I--- 215;

3º Passo: encontrar na tabela: linf , fmed e Fant :

linf = 212
fmed = 25
Fant = 30

Marco Antônio Santoro Bara


26

4º Passo: substituir os dados na equação:

md = linf + h. n/2 - Fant


fmed

md = 212+ 3. 50 –
30 = 212 + 3. 0,8 = 212 + 2,4 = 214,4
25

md = 214,4

7.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS)

Como extensão do conceito de mediana, podemos dividir os valores em quatro,


dez e cem partes iguais. Essas divisões são chamadas de quartis, decis e centis,
respectivamente.
O cálculo dessas divisões é semelhante ao da mediana, isto é:

Quartis:

Qi = linf + h. i.n/4 - FQi-1 onde i = 1,2,3


fQi

Decis:

Di = linf + h. i.n/10 - FDi-1 onde i = 1,2,3, ..., 8,9.


fDi

Centis:

Ci = linf + h. i.n/100 - FCi-1 onde i = 1,2,3,...,98,99.


fCi

Marco Antônio Santoro Bara


27

Onde:
h = amplitude da classe

linf = limite inferior da classe da quartílica, decílica ou


percentílica

fQi , fDi , fCi = frequências das classes quartílica, decílica e


percentílica, respectivamente

FQi-1 , FDi-1 , FCi-1 = frequências acumuladas da classe


anterior à classe quartílica, decílica ou percentílica.

Voltando ao exemplo anterior, temos:

i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados:

Q1 = linf + h. 1.n/4 - FQi-1 = 209 + 3. 100/4 – 15 =


fQi 15

209 + 3 . 0,67 = 211

ii) Para o 3º Quartil:

Q3 = linf + h. 3.n/4 - FQi-1 = 215 + 3 . 3.100/4 – 55


fQi 21

215 + 3. 0,95 = 217,85

iii) Para o 8º Decil:

D8 = linf + h. 8.n/10 - FDi-1 = 218 + 3. 8.100/10 - 76


fDi 13

218 +3. 0,31 = 218,93

Marco Antônio Santoro Bara


28

iv) Para o 15º Centil:

C15 = linf + h. 15.n/100 - FCi-1


fCi

= 206 + 3. 15.100/100 - 5
10

= 209

OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a
sequência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será:

Posição: 3.n/4 = 3.13/4 = 9,75

A posição 9,75ª será aproximada pela inteira imediatamente posterior a ela, ou


seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para encontrar os
decis e centis de uma série de dados não agrupados em classes.

7.4 MODA ( mo )

7.4.1 PARA UMA LISTA

Em um conjunto de números a moda é o valor que ocorre com maior frequência,


isto é, o valor mais comum.

Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8

2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
moda = Ф (não existe moda)

3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9
moda = 4 e 8

Marco Antônio Santoro Bara


29

7.4.2 PARA DADOS TABULADOS

Para se determinar a moda quando os dados vêm dispostos em uma tabela,


deve-se procurar qual elemento tem a maior frequência absoluta simples.

Exemplo: Qual a moda do conjunto descrito abaixo?

xi fi
10 3
13 4
16 5
17 7
25 2

mo = 17 , pois aparece 7 vezes.

7.4.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIAS

Na verdade, o cálculo da moda para uma distribuição de frequências é apenas


aproximado, haja vista não sabermos exatamente como os dados estão
distribuídos dentro de cada classe.

Para o exemplo do exercício das distribuições de frequências dos pacotes de


manteiga (onde os dados são tabulados agrupados em classes) uma forma de
estimar o valor da moda é pela Estimativa de Pearson (para dados tabulados
agrupados em classes):

mo = 3. md – 2. x̅

Voltando ao exemplo, temos:

mo = 3.214,4 – 2. 214,49 => mo = 214,22

onde a média foi calculada da forma:

x̅ = 201,5 . 1 + 204,5 .4 + 207,5 .10 + 210,5 .15 + 213,5 .25 + 216,5 .21 + 219,5 . 13 + 222,5. 7 + 225,5. 4
1 + 4 + 10 + 15 + 25 + 21 + 13 + 7 + 4

x̅ = 214,49

Marco Antônio Santoro Bara


30

O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma
indicação de que os três parâmetros de tendência central (média, mediana e
moda) estejam muito próximos.

Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na


maioria dos casos:

mo = linf + h. a .
a + p

onde:

linf = limite inferior da classe modal.

a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos


como classe anterior aquela que precede à classe modal.

p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que


vem logo após a classe modal).

h = amplitude da classe modal.

O primeiro passo é a determinação da classe modal, aquela com maior f i.

No nosso exemplo é 212 I--- 215 pois temos 25 elementos nesta classe.

mo = 212 + 3. ( 25 - 15 ) .
(25-15) + (25-21)

mo = 212 + 3 . 10 .
10 + 4
mo = 212 + 3 . 0,7143
mo = 212 + 2,14
mo = 214,14

Marco Antônio Santoro Bara


31

EXERCÍCIOS

1-) Qual a média aritmética dos números ímpares menores do que 10?
R: 5
2-) Calcule a média aritmética do conjunto descrito a seguir:
xi fi
1 3
2 4
3 1
4 2
R: 2,2
3-) Calcular a média do conjunto descrito pela distribuição de frequências a
seguir:
xi fi
0,0 |----- 2,0 15
2,0 |----- 4,0 25
4,0 |----- 6,0 13
6,0 |-----8,0 37
8,0 |-----10,0 10
R: 5,04
4-) Calcular a mediana do conjunto {5,3,7,1,9}

R: 5
5-) Calcular a mediana do conjunto {1,1,3,5,6,9,23,24}

R: 5,5
6-) Calcular a mediana do conjunto descrito pela tabela a seguir:
xi fi
100 3
135 6
160 5
175 7
250 2
R: 160
7-) Calcular a mediana do conjunto descrito pela tabela a seguir:

xi fi
10 3
15 6
16 5
21 7
23 3
R: 16

Marco Antônio Santoro Bara


32

8-) Calcular a mediana do conjunto descrito pela distribuição de frequência a


seguir:

xi fi
0,0 |----- 2,0 15
2,0 |----- 4,0 25
4,0 |----- 6,0 16
6,0 |-----8,0 34
8,0 |-----10,0 10
R: 5,25

9-) Calcular a moda do conjunto { 5,3,7,1,5,2,9}

R: 5

10-) Calcular a moda do conjunto descrito pela tabela a seguir


xi fi
100 3
135 6
160 5
175 7
250 2
R: 175
11-) Calcular a moda, pelo método de Czuber, do conjunto descrito pela
distribuição de frequência a seguir:

xi fi
0,0 |----- 2,0 15
2,0 |----- 4,0 25
4,0 |----- 6,0 16
6,0 |-----8,0 34
8,0 |-----10,0 28
R: 7,5

12-) Calcule os quartis da tabela abaixo:

Classes fi
50 |----- 54 10
54 |----- 58 23
58 |----- 62 28
62 |----- 66 20
66 |----- 70 12
70 |----- 74 7
Total 100
Decil: 3, 7 e 9
R: Q1 = 56,61 , Q2 = 60,43 , Q3 = 64,8
Centil: 13, 33 e 80

Marco Antônio Santoro Bara


33

8.0 TIPOS DE DISTRIBUIÇÃO

As distribuições de frequência podem se apresentar de diversas formas


conforme as figuras a seguir:

8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO

A distribuição é simétrica quando os valores se distribuem igualmente em torno


da média

A) Normal

B) Alongada

C) Achatada

Marco Antônio Santoro Bara


34

Distribuições simétricas

A distribuição das frequências faz-se de forma aproximadamente simétrica,


relativamente a uma classe média

Caso especial de uma distribuição simétrica


Quando dizemos que os dados obedecem a uma distribuição normal, estamos
tratando de dados que distribuem-se em forma de sino.

Marco Antônio Santoro Bara


35

Distribuições Assimétricas

A distribuição das frequências apresenta valores menores num dos lados:

CURVA ASSIMÉTRICA À DIREITA (ASSIMETRIA POSITIVA)

CURVA ASSIMÉTRICA À ESQUERDA (ASSIMETRIA NEGATIVA)

Marco Antônio Santoro Bara


36

8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL

Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que


corresponde à frequência máxima. Sob o critério da moda as distribuições
classificam-se em:

A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem frequência


máxima ela é denominada modal.

mo

B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda

C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas.

mo mo

Marco Antônio Santoro Bara


37

D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas


modas

mo mo mo

9.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO)

As medidas de dispersão indicam se os valores estão relativamente próximos


uns dos outros, ou separados. Podemos dizer que dispersão é o grau com o
qual os valores numéricos de uma distribuição tendem a se distanciar em torno
de um valor médio.
Em todos os casos, o valor zero indica ausência de dispersão; a dispersão
aumenta à proporção que aumenta o valor da medida (amplitude, desvio-
padrão, variância).

9.1 AMPLITUDE TOTAL (AT)

É a medida mais simples de dispersão. É a diferença entre o maior e o menor


valor das observações.
AT = Xmax – Xmin

Embora exista simplicidade de cálculo, existem duas restrições ao seu uso


generalizado:

1- Utiliza apenas uma parcela das informações contidas nas observações.


O seu valor não se modifica mesmo que os valores das observações
variem, desde que conservem os seus valores máximo e mínimo. Ou
seja, depende apenas dos valores externos (max e min), não sendo
afetada pelos valores internos.

2- Depende do número de observações na amostra. Em geral o valor da


amplitude cresce quando cresce o tamanho da amostra.

Marco Antônio Santoro Bara


38

9.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di)

O desvio di em relação à média de um conjunto de dados é a diferença do valor


xi e a média aritmética x̅ do conjunto, isto é:

di = (xi - x̅ )

Exemplos :

1-) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7

Onde x̅ = 3+4+5+6+7 = 5
5

xi di
3 -2
4 -1
5 0
6 1
7 2
∑ di =0
2-) Calcular os desvios di para a seguinte distribuição :

xi fi di
82 5 -4,6
85 10 -1,6
87 15 0,4
89 8 2,4
90 4 3,4
∑ fi = 42 ∑ di =0

Onde x̅ = 82 .5.+ 85. 10 + 87. 15 + 89 . 8 + 90. 4


5 + 10 + 15 + 8 + 4

x̅ = 86,6

Marco Antônio Santoro Bara


39

(3) Calcular os desvios di para a seguinte distribuição :

Classes xi (PM) fi di di . fi
35 |----- 45 40 2 -22,91 -45,82
45 |----- 55 50 13 -12,91 -167,83
55 |----- 65 60 20 -2,91 -58,20
65 |----- 75 70 10 7,09 70,90
75 |----- 85 80 7 17,09 119,63
85 |----- 95 90 3 27,09 81,27
∑ fi = 55 ∑ di = 12,55 ∑ di. fi = 0

Onde x̅ = 40 .2 + 50 .13 + 60 .20 + 70 .10 + 80 .7 + 90 .3


2 + 13 + 20 + 10 + 7 + 3

x̅ = 3460 / 55
x̅ = 62,91

9.3 DESVIO MÉDIO ( d̅ )

O desvio médio d̅ é a média aritmética dos módulos dos desvios, isto é:

d̅ = ∑ di = ∑ xi - x̅
n n

Para uma distribuição de frequências (simples ou por classes), teremos:

d̅ = ∑ di . fi = ∑ xi - x̅ .fi
n n

Exercício

13-) Calcular o desvio médio para os exemplos (1), (2) e (3) anteriores.

9.4 VARIÂNCIA ( ou s2)


Variância da população é a soma dos quadrados dos desvios de cada
observação em relação à média de “x” e divide-se por N. Indica-se a Variância
da População por σ².
Podemos fazer a mesma analogia com a Variância da Amostra dada por S².

Marco Antônio Santoro Bara


40

Variância para uma população: σ² = ∑ (xi - µ)2 . fi


N

onde é a média populacional e N é o tamanho da população.

Variância para uma amostra:


s2 = ∑ (xi - x̅)2 .fi
n-1

Onde x̅ é a média amostral e n é o tamanho da amostra.

As equações anteriores para e s2 representam uma maneira de cálculo


dessas medidas.

Podemos também utilizar as seguintes equações:

σ² = ∑ fi(xi)2 – N. µ2 s2 = ∑ fi(xi)2 – n. x̅2


N n-1

Como medida de dispersão, a Variância tem a desvantagem de apresentar como


unidade de medida o quadrado da unidade de medida dos dados. Se os dados
estão em metros, a Variância fica em metros quadrados. O desvio padrão por
sua vez, fica com valor na mesma da unidade da variável.

Obs: A variância sendo uma média de uma soma de quadrados é sempre maior
ou igual a 0. Ela será nula se os valores dos dados são constantes.

9.5 DESVIO PADRÃO ( ou s)

É a medida que determina a variação dos valores observados em torno da média


da distribuição, e representa a distância do ponto de inflexão da curva até a linha
da média.

A partir da variância podemos calcular o desvio padrão como segue:

Desvio padrão da população: =√


Desvio padrão da amostra: s = √s2

Marco Antônio Santoro Bara


41

9.6 COEFICIENTE DE VARIAÇÃO (cv)

O coeficiente de variação cv é a razão entre o desvio padrão e a média


aritmética. Esta medida é adimensional e geralmente é expressa em
porcentagens. A equação para o seu cálculo é:

cv =
Para população

Para amostra cv = s

Exercícios

14-) (ICMS/MG) As alturas do jogadores de basquete da seleção brasileira são:


1,98m; 2,04m; 2,06m; 2,02m e 2,05m. A média de altura dessa seleção e m, é
de:

a) 2,01 b) 2,02 c) 2,03 d) 2,04 e) 2,05

15-) (TTN) Assinale a alternativa correta, considerando a série: 8,5,14,10,8 e15.

a) A média aritmética é 10 e a mediana é 12.


b) A amplitude total é 7 e a moda é 8.
c) A mediana é 9 e a amplitude total é 10.
d) A média aritmética é 1 e a amplitude total é 7.
e) A mediana é 12 e a amplitude total é 7.

16-) (ICMS/MG) Na série composta de notas de Estatística: 4,5,7,8,5,5,6,8,6. A


média aritmética simples, a mediana e a moda são, respectivamente:

a) 6,5 e 4
b) 6,6 e 5
c) 6,6 e 6
d) 6,5 e 5
e) 7,6 e 5

Marco Antônio Santoro Bara


42

17-) (ICMS/MG) Dados os conjuntos de valores:


A = {1,1,2,3,4,5,5,8,8,8,9,10}
B = {6,7,8,9,10,11,12}
C = {1,2,4,4,4,4,5,8,9,9,9,9,10}
Em relação a moda, afirmamos que:
I- A é unimodal, e a moda é 8
II- B é unimodal, e a moda é 9
III- C é bimodal, e as modas são 4 e 9.
Então, em relação as afirmativas, é correto dizer que:
a) Todas são verdadeiras
b) Todas são falsas
c) Somente I e II são verdadeiras
d) Somente I e III são verdadeiras
e) Somente II e III são verdadeiras

18-) (AFRF/05) Para dados agrupados representados por uma curva de


frequências, as diferenças entre os valores da média, da mediana e da moda
são indicadores da assimetria da curva. Indique a relação entre essas medidas
de posição para uma distribuição negativamente assimétrica.
a) A média apresenta o maior valor e a mediana se encontra abaixo da
moda.
b) A moda apresenta o maior valor e a média se encontra abaixo da
mediana.
c) A média apresenta o menor valor e a mediana se encontra abaixo da
moda.
d) A média, a mediana e a moda são coincidentes.
e) A moda apresenta o menor valor e a mediana se encontra abaixo da
média.

19-) (TRF/06) Considere a seguinte distribuição das frequências absolutas dos


salários mensais em R$, referente a 200 trabalhadores de uma indústria (os
intervalos são fechados à esquerda e abertos à direita).
Classes de Salários Frequências
Absolutas
De R$ 400 até R$ 500 50
De R$ 500 até R$ 600 70
De R$ 600 até R$ 700 40
De R$ 700 até R$ 800 30
De R$ 800 até R$ 900 10

Sobre essa distribuição de salários é correto afirmar que:


a) O salário modal encontra-se na classe de R$800 até R$900
b) O salário mediano encontra-se na classe de R$600 até R$700
c) O salário modal encontra-se na classe de R$600 até R$700
d) O salário modal encontra-se na classe de R$700 até R$800
e) O salário mediano encontra-se na classe de R$500 até R$600.

Marco Antônio Santoro Bara


43

20-) (ICMS/MG) O quadro abaixo nos mostra a distribuição dos erros cometidos
por 20 alunos numa prova de português. O valor do desvio médio dessa
distribuição é:

N0 DE ERROS N0 DE ALUNOS
(xi) (fi)
1 2
2 6
3 5
4 4
5 3

a) 1,0
b) 1,5
c) 2,0
d) 2,5
e) 3,0

Gabarito
14 -- C
15 -- C
16 -- B
17 -- D
18 – B e C
19 -- E
20 – A

Marco Antônio Santoro Bara


44

21-) (TRF) Considere os seguintes conjuntos de observações referentes a cinco


diferentes variáveis:
T: 10;10;10;10;10;8
V: 10;10;10;10;8;8
X: 10;10;10;8;8;8
Y: 10;10;8;8;8;8
Z: 10;8;8;8;8;8

O conjunto de observações que apresenta a maior variabilidade, medida pelo


desvio padrão, é o referente à variável:

a) Y
b) T
c) V
d) X
e) Z

22-) (AFRF/02) Numa amostra de tamanho 100 obtida de uma população de


1000 indivíduos, produziu a tabela de frequências abaixo:

Classes Frequência (f)


29,5 |----- 39,5 4
39,5 |----- 49,5 8
49,5 |----- 59,5 14
59,5 |----- 69,5 20
69,5 |----- 79,5 26
79,5 |----- 89,5 18
89,5 |----- 99,5 10

Assinale a opção que corresponde ao desvio absoluto médio.


a) 16,0
b) 17,0
c) 16,6
d) 18,1
e) 13,0

23-) (AFRF/09) Considere a seguinte amostra aleatória das idades em anos


completos dos alunos em um curso preparatório. Com relação a essa amostra,
marque a única opção correta:
29,27,25,39,29,27,41,31,25,33,27,25,25,23,27,27,32,26,24,36,32,26,28,24,28,
27,24,26,30,26,35,26,28,34,29,23,28.

a) A média e a mediana das idades são iguais a 27.


b) A moda e a média das idades são iguais a 27.
c) A mediana das idades é 27 e a média é 26,08.
d) A média das idades é 27 e o desvio padrão é 1,074.
e) A moda e a mediana das idades são iguais a 27.

Marco Antônio Santoro Bara


45

24-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 2
4 |----- 6 6
6 |----- 8 5
8 |----- 10 4
10 |----- 12 3

25-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 11
4 |----- 6 10
6 |----- 8 11
8 |----- 10 4
10 |----- 12 4

26-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
4 |----- 6 8
6 |----- 8 10
8 |----- 10 20
10 |----- 12 30
12 |----- 14 20

27-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 7
4 |----- 6 9
6 |----- 8 18
8 |----- 10 10
10 |----- 12 6

Marco Antônio Santoro Bara


46

28-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 9
4 |----- 6 12
6 |----- 8 6
8 |----- 10 2
10 |----- 12 1

29-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
4 |----- 6 6
6 |----- 8 8
8 |----- 10 12
10 |----- 12 10
12 |----- 14 4

30-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
45 |----- 55 3
55 |----- 65 7
65 |----- 75 4
75 |----- 85 5
85 |----- 95 1

31-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
9 |----- 19 10
19 |----- 29 20
29 |----- 39 40
39 |----- 49 20
49 |----- 59 10

Marco Antônio Santoro Bara


47

32-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
50 |----- 60 15
60 |----- 70 20
70 |----- 80 30
80 |----- 90 20
90 |----- 100 15

33-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
20 |----- 30 10
30 |----- 40 20
40 |----- 50 25
50 |----- 60 20
60 |----- 70 10

34-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
50 |----- 58 10
58 |----- 66 15
66 |----- 74 25
74 |----- 82 24
82 |----- 90 16
90 |----- 98 10

35-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 6
4 |----- 6 10
6 |----- 8 14
8 |----- 10 6
10 |----- 12 4

Marco Antônio Santoro Bara


48

36-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 20
4 |----- 6 15
6 |----- 8 35
8 |----- 10 20
10 |----- 12 10

37-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio


padrão, desvio médio absoluto, coeficiente de variação e variância relativa:

Classe f
2 |----- 4 5
4 |----- 6 5
6 |----- 8 10
8 |----- 10 30
10 |----- 12 20
12 |----- 14 25
14 |----- 16 5

38-) (PUC-SP) O histograma abaixo apresenta a distribuição de frequência das


faixas salariais numa pequena empresa.

Marco Antônio Santoro Bara


49

Com os dados disponíveis, pode-se concluir que a média desses salários é ,


aproximadamente:

a) R$ 420,00
b) R$ 536,00
c) R$ 562,00
d) R$ 640,00
e) R$ 708,00

39-) Numa escola, o professor de educação física mediu as alturas de 100 alunos
do sexo masculino e construiu a seguinte distribuição de frequências:

Alturas Número de
(em cm) estudantes
150 |----- 158 5
158 |----- 166 15
166 |----- 174 48
174 |----- 182 25
182 |----- 190 7

Pede-se:
a) Variância
b) Desvio padrão
c) Histograma

40-) Qual a Variância e o Desvio Padrão para a distribuição da seguinte tabela?

Número de Idade
pessoas
5 22
3 14
6 18
1 28
4 21
8 20

a) 7,85 e 3 respectivamente
b) 8,15 e 2,9 respectivamente
c) 8,5 e 3,1 respectivamente
d) 8,75 e 2,5 respectivamente
e) 8,06 e 2,8 respectivamente

Marco Antônio Santoro Bara


50

GABARITO

21 D
22 E
23 E
24 Média = 7
Moda = 5,6
Mediana = 6,8
Q1 = 5
Q3 = 9
D1 = 4
D9 = 10,66
Variância = 6
Desvio padrão = 2,45
Desvio médio = 2
Coeficiente de variação = 0,3499
Variância relativa = 0,1224

25 Média = 6
Moda = 3,83 e 6,25
Mediana = 5,8
Q1 = 3,82
Q3 = 7,63
D1 = 2,72
D9 = 10
Variância = 6,4
Desvio padrão = 2,53
Desvio médio = 2,15
Coeficiente de variação = 0,4216
Variância relativa = 0,1778

26 Média = 10
Moda = 11
Mediana = 10,4
Q1 = 8,4
Q3 = 11,87
D1 = 6,16
D9 = 13,12
Variância = 5,91
Desvio padrão = 2,43
Desvio médio = 2,05
Coeficiente de variação = 0,2431
Variância relativa = 0,0591

Marco Antônio Santoro Bara


51

27 Média = 6,96
Moda = 7,06
Mediana = 7
Q1 = 5,22
Q3 = 8,7
D1 = 3,42
D9 = 10,33
Variância = 5,68
Desvio padrão = 2,38
Desvio médio = 1,81
Coeficiente de variação = 0,3424
Variância relativa = 0,1172

28 Média = 5,27
Moda = 4,67
Mediana = 5
Q1 = 3,64
Q3 = 6,5
D1 = 2,66
D9 = 8
Variância = 4,2
Desvio padrão = 2,05
Desvio médio = 1,57
Coeficiente de variação = 0,3889
Variância relativa = 0,1513

29 Média = 8,9
Moda = 9,33
Mediana = 9
Q1 = 7
Q3 = 10,8
D1 = 5,33
D9 = 12
Variância = 5,79
Desvio padrão = 2,41
Desvio médio = 1,93
Coeficiente de variação = 0,2704
Variância relativa = 0,0731
30 Média = 67
Moda = 60,71
Mediana = 65
Q1 = 57,85
Q3 = 77
D1 = 51,66
D9 = 83
Variância = 131
Desvio padrão = 11,45
Desvio médio = 10
Coeficiente de variação = 0,1708
Variância relativa = 0,0292

Marco Antônio Santoro Bara


52

31 Média = 34
Moda = 34
Mediana = 34
Q1 = 27
Q3 = 42
D1 = 19,5
D9 = 49,5
Variância = 120
Desvio padrão = 10,95
Desvio médio = 8
Coeficiente de variação = 0,3175
Variância relativa = 0,1008

32 Média = 75
Moda = 75
Mediana = 75
Q1 = 65
Q3 = 85
D1 = 56,66
D9 = 93,33
Variância = 160
Desvio padrão = 12,65
Desvio médio = 10
Coeficiente de variação = 0,1680
Variância relativa = 0,0284

33 Média = 45
Moda = 45
Mediana = 45
Q1 = 35,625
Q3 = 54,375
D1 = 28,5
D9 = 61,5
Variância = 141,18
Desvio padrão = 11,88
Desvio médio = 9,41
Coeficiente de variação = 0,2640
Variância relativa = 0,0697
34 Média = 74,08
Moda = 73,27
Mediana = 74
Q1 = 66
Q3 = 82,5
D1 = 58
D9 = 90
Variância = 132,47
Desvio padrão = 11,51
Desvio médio = 9,68
Coeficiente de variação = 0,1554
Variância relativa = 0,0241

Marco Antônio Santoro Bara


53

35 Média = 6,6
Moda = 6,66
Mediana = 6,57
Q1 = 4,8
Q3 = 8
D1 = 3,33
D9 = 10
Variância = 5,44
Desvio padrão = 2,33
Desvio médio = 1,88
Coeficiente de variação = 0,3534
Variância relativa = 0,1249

36 Média = 6,7
Moda = 7,14
Mediana = 6,85
Q1 = 4,66
Q3 = 8,5
D1 = 3
D9 = 10
Variância = 6,11
Desvio padrão = 2,47
Desvio médio = 1,99
Coeficiente de variação = 0,3689
Variância relativa = 0,1361

37 Média = 10
Moda = 9,33
Mediana = 10
Q1 = 8,33
Q3 = 12,4
D1 = 6
D9 = 13,6
Variância = 8,6
Desvio padrão = 2,93
Desvio médio = 2,4
Coeficiente de variação = 0,2933
Variância relativa = 0,0860

38 E
39 Variância = 55,07 Desvio Padrão = 7,42
40 E

Marco Antônio Santoro Bara


54

10.0 PROBABILIDADE

O problema fundamental da estatística consiste em trabalhar com o acaso e a


incerteza.

Chama-se probabilidade de um acontecimento a razão entre o número de casos


favoráveis ao mesmo e o número total de acontecimentos possíveis.
As leis da hereditariedade foram a primeira grande aplicação das probabilidades
na área de biociências. Hoje conhecemos muitas aplicações: ocorrência de
mutações, risco de doenças, chance de sobrevivência, distribuição e interação
de espécies, etc.

A aplicação mais importante, entretanto, é feita na estatística. Nenhuma


observação e nenhuma experiência podem ser precisamente planejadas e
analisadas sem algum método estatístico. Mesmo se mantivermos as condições
experimentais mais constantes possíveis, a repetição de uma observação ou
uma experiência dificilmente resulta sempre exatamente igual. Sempre existem
flutuações.

Portanto, todas as conclusões baseadas em dados empíricos (baseado apenas


na experiência, e não no estudo) são necessariamente encaradas com incerteza.
Tentamos expressar o grau de incerteza em termos de probabilidades. Então,
um pesquisador afirma “significância ao nível de cinco por cento”, ele admite a
possibilidade de uma afirmativa errônea. Antes da compreensão de alguns
métodos estatísticos é necessário um conhecimento básico sobre
probabilidades.

Quando se considera uma população limitada de P indivíduos, a probabilidade


de cada um ser escolhido, ao acaso, é de 1/P.

Laplace definiu probabilidade como: “O quociente do número de casos


favoráveis sobre o número de casos igualmente possíveis”. Por exemplo, se
jogarmos uma moeda “não viciada” para o ar, de modo geral não podemos
afirmar se vai dar cara ou coroa.

Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C).
Nesse exemplo existe um caso favorável a esse evento em dois casos possíveis.
A P (K) = ½ ou 50%.

Considerando-se “cara” como sucesso e “coroa” como fracasso e


representando-se o acontecimento favorável como “P” e o não favorável como
“Q”, temos as razões:

P= ½ e Q = ½

Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P)

Marco Antônio Santoro Bara


55

A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que


indica a chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A),
maior é a chance de ocorrência do evento A, e quanto mais próxima de Zero,
menor é a chance de ocorrência do evento A.

A um evento impossível atribui-se a probabilidade Zero. Um evento certo tem


probabilidade 1.

As probabilidades podem ser expressas, inclusive por valores decimais, frações


e porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5.

Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade


mediante determinada combinação de julgamento, experiência ou dados
históricos, para predizer Quão Provável é a ocorrência de determinado evento
futuro.

Há numerosos exemplos de tais situações no campo dos Negócios e do


Governo. A previsão da aceitação de um novo produto, o cálculo dos custos de
produção, a contratação de um novo empregado, o preparo do orçamento, a
avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso
contém algum elemento de acaso.

10.1 ESPAÇO AMOSTRAL E EVENTOS

Consideremos o experimento que consiste em “extrair uma carta de um baralho


de 52 cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos
eventos podemos classificá-los em:

ESPAÇO AMOSTRAL

COMPLEMENTO A Cartas vermelhas e cartas pretas

Não se interceptam cartas de


MUTUAMENTE A B copas e cartas de paus
EXCLUSIVOS

NAO SÃO
MUTUAMENTE Cartas de copas e figuras, tem
EXCLUSIVOS A B elementos em comum.

Marco Antônio Santoro Bara


56

Cartas de paus, ouro, copas e


COLETIVAMENTE A B C D espadas
EXAUSTIVOS

10.2 TRÊS ORIGENS DA PROBABILIDADE

Há três maneiras diferentes de calcular ou estimar probabilidades, O método


Clássico, quando o espaço amostral tem resultados igualmente prováveis. O
método Empírico, que se baseia na frequência relativa de ocorrência de um
evento num grande número de provas repetidas; e o método Subjetivo, que
utiliza estimativas pessoais baseadas num certo grau de crença.

OBJETIVO SUBJETIVO

CLÁSSICO EMPÍRICO Opinião Pessoal


(resultados igualmente prováveis) (dados históricos)

O Método Clássico

Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas)


usualmente apresentam resultados igualmente prováveis.

Nestes casos temos: P (cada resultado) = 1 .


N° de resultados possíveis

Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida,


então a probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou
1,92%.

Da mesma forma a probabilidade de termos uma cara no lançamento de uma


moeda é ½ ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%.

No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4,


5 ou 6 de 1/6 ou de 16,66%.

De forma geral vale também a expressão:

P(A) = Número de resultados associados ao evento A


Número total de resultados possíveis

Marco Antônio Santoro Bara


57

Por exemplo, a probabilidade de extração de uma dama, de acordo com esta


definição, é:

P (dama) = 4 damas = 4 .= 1 . = 7,69%


52 cartas 52 13

Analogamente, a probabilidade de obter número ímpar no lance de um dado é:

P(ímpar) = 3 faces .= 3 . ou 50%


6 faces possíveis 6

A MATEMÁTICA DA PROBABILIDADE

Muitas aplicações de estatística exigem a determinação da probabilidade de


combinações de eventos. Há duas categorias de eventos de interesse, A e B,
no espaço amostral.

Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência


de ambos os eventos.

Em outras situações, podemos querer a probabilidade de ocorrência de A ou B,


P(A ou B).

Cálculo da Probabilidade da ocorrência de dois eventos “independentes”


P(A e B)
Se dois eventos são independentes, então a probabilidade da ocorrência de
ambos é igual ao produto de suas probabilidades individuais:

P(A e B) = P(A) . P(B)


Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas
as faces serem cara?

É razoável admitir que os resultados das duas moedas sejam independentes um


do outro. Além disso, para moedas equilibradas, P(cara)= ½ .

Logo P(cara e cara) será:

1ª moeda 2ªmoeda
½ x ½ = ¼ ou 25%

Marco Antônio Santoro Bara


58

Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente


exclusivos”
P(A ou B ocorrerá)

Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de


qualquer um deles é a soma de suas probabilidades individuais. Para dois
eventos A e B temos:
P(A ou B) = P(A) + P(B)
Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um
dado equilibrado?

P(cinco) ou P(seis) = P (5) + P(6) = 1 .+ 1 .= 2 . = 33,33%


6 6 6

Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente


exclusivos”
P(A ou B ou ambos ocorrerão)
Suponhamos a probabilidade de extração de uma carta de paus ou um dez de
um baralho de 52 cartas. Como é possível que uma carta seja simultaneamente
de “paus” e um “dez”, os eventos não são mutuamente exclusivos. Assim
devemos excluir a probabilidade de intersecção. Então temos:

P(paus) = 13 . , P(dez)= 4 ., P( dez de paus) = 1 .,


52 52 52

P(paus ou dez, ou ambos) = P(paus) + P(dez) - P(dez de paus)


= 13 . + 4 .- 1 . = 16 . = 30,77%
52 52 52 52

NAIPE
PAUS OUROS COPAS ESPADA
PRETA VERMELHA VERMELHA PRETA
♣♣KK ♦K ♥K ♠K
♣♣QQ ♦Q ♥Q ♠Q
♣♣JJ ♦J ♥J ♠J
♣♣♦10
10
J ♦♦ 10
10 ♥ 10
♥ 10 ♠♠10
10
♣♣99 ♦9 ♥9 ♠9
♣♣88 ♦8 ♥8 ♠8
♣♣77 ♦7 ♥7 ♠7
♣♣66 ♦6 ♥6 ♠6
♣♣55 ♦5 ♥5 ♠5
♣♣44 ♦4 ♥4 ♠4
♣♣33 ♦3 ♥3 ♠3
♣♣22 ♦2 ♥2 ♠2
♣♣AA ♦A ♥A ♠A

Marco Antônio Santoro Bara


59

Resumindo:
P (A e B), para eventos independentes (Multiplicação) P(A) x P(B)

P (A ou B), para eventos mutuamente exclusivos (Soma) P(A) + P(B)

P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos


P(A) + P(B) - P(A interseção B)

10.3 ALGUMAS PROPRIEDADES

Como foi visto no final do item anterior, existem algumas regras de probabilidade.
Neste item detalharemos tais regras, conhecidas como propriedades da
probabilidade.

Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou


seja:
0 P(A) 1

Se considerarmos o espaço amostral, S, e o conjunto vazio, , como eventos,


temos:
P(S) = 1 (evento certo)
P( ) = 0 (evento impossível)

Arranjo com Repetição


Todos os elementos podem aparecer repetidos em cada grupo de
p elementos.

Fórmula: Ar(m,p) = mp.

Exemplo: Seja C={A,B,C,D}, m=4 e p=2. Os arranjos com


repetição desses 4 elementos tomados 2 a 2 são 16 grupos que
onde aparecem elementos repetidos em cada grupo. Todos os
agrupamentos estão no conjunto:

Ar={AA,AB,AC,AD,BA,BB,BC,BD,CA,CB,CC,CD,DA,DB,DC,DD}

Marco Antônio Santoro Bara


60

Permutação com Repetição


Se em um dado conjunto um elemento é repetido a vezes, outro elemento é repetido b vezes
e assim sucessivamente, o número total de permutações que podemos obter é dada por:

A resolução do exemplo com o uso da fórmula é:

Exemplos
Quantos anagramas podemos obter a partir das letras da palavra PARAR?
Como a palavra PARAR possui 5 letras, mas duas delas são repetidas duas vezes cada, na
solução do exemplo vamos calcular P5(2, 2):

Portanto:
O número de anagramas que podemos formar a partir das letras da palavra PARAR
é igual 30.

Possuo 4 bolas amarelas, 3 bolas vermelhas, 2 bolas azuis e 1 bola verde. Pretendo
colocá-las em um tubo acrílico translúcido e incolor, onde elas ficarão umas sobre as
outras na vertical. De quantas maneiras distintas eu poderei formar esta coluna de
bolas?
Neste caso de permutação com elementos repetidos temos um total de 10 bolas de quatro
cores diferentes. Segundo a repetição das cores, devemos calcular P10(4, 3, 2):

Então:
Eu poderei formar esta coluna de bolas de 12600 maneiras diferentes.

Combinação com Repetição


Todos os elementos podem aparecer repetidos em cada grupo até
p vezes.

Fórmula: Cr(m,p)=C(m+p-1,p)

Marco Antônio Santoro Bara


61

Exemplos:

1) De quantos modos podemos comprar 4 salgadinhos em uma lanchonete que


oferece 7 opções de escolha de salgadinhos?

R: 210

2) Podendo escolher entre 5 tipos de queijo e 4 marcas de vinho, de quantos


modos é possível fazer um pedido num restaurante, com dois queijos e 3
garrafas de vinho? R = 300

Exercícios

41-) Joga-se uma vez: um dado equilibrado, determine a probabilidade de obter:


a) Um 6
b) 5 ou 6 ou 7
c) Um número par
d) Um número menor que quatro

Marco Antônio Santoro Bara


62

42-) Há 50 bolas numa urna, distribuídas da seguinte maneira: 20 azuis, 15


vermelhas, 10 laranjas e 5 verdes. Misturaram-se as bolas e escolhe-se uma.
Determine a probabilidade de a bola escolhida ser:
a) Verde
b) Azul
c) Azul ou verde
d) Não vermelha
e) Vermelha ou verde
f) Amarela
g) Não amarela

43-) Um baralho tem 52 cartas divididas igualmente entre 4 naipes: ouros, copas,
paus e espadas. Os naipes paus e espadas são de cor preta. Os naipes de ouros
e copas de cor vermelha. Cada naipe possui 13 cartas: A (ás),2,3,4,5,6,7,8,9,10,
J (valete),Q(dama) e K(rei).
Extrai-se uma só carta de um baralho de 52 cartas. Determine a
probabilidade de obter:
a) Um valete
b) Uma figura
c) Uma carta vermelha
d) Uma carta de ouros
e) Um dez de paus
f) Um nove vermelho ou um oito preto
g) Um nove ou um valete
h) Uma carta de ouros ou uma dama

44-) (BRDE/01) Observa-se que 10% dos projetos que chegam a uma agência
de financiamento apresentam informações incorretas. Qual a probabilidade de
que, de três projetos escolhidos aleatoriamente, nenhum deles apresente
informação incorreta?
a) Zero
b) 0,001
c) 0,270
d) 0,300
e) 0,729

45-) (TCE-RS/12) Segundo o controle de qualidade de uma empresa, a


probabilidade do seu produto apresentar falha é de 0,10. Três pessoas compram
o produto. A probabilidade de somente duas dessas pessoas terem comprado o
produto com falha é:
a) 0,001
b) 0,009
c) 0,027
d) 0,243
e) 0,810

Marco Antônio Santoro Bara


63

46-) Lança-se uma moeda 5 vezes, qual a probabilidade de ocorrer 3 caras e


duas coroas?
a) 31,25%
b) 25%
c) 40%
d) 37,50%
e) 50%

47-) Dentre doze candidatos que participaram de um teste, quatro reprovaram.


Se três dos candidatos fossem selecionados, aleatoriamente, um após o outro,
qual a probabilidade de que todos esses alunos tivessem sido aprovados?
a) 14/55
b) 8/55
c) 8/27
d) 27/55
e) 16/27

48-) Um juiz deve analisar 12 processos de reclamações trabalhistas, sendo 4


de médicos, 5 de professores e 3 de bancários. Considere que inicialmente, o
juiz selecione aleatoriamente um grupo de 3 processos para serem analisados.
Com base nessas informações, assinale a alternativa do valor mais próximo da
probabilidade de que, nesse grupo:
I- Todos os processos sejam de bancários
a) 1,25%
b) 0,45%
c) 25%
d) 7,5%
e) 12,5%
II- Pelo menos um dos processos seja de professor
a) 16%
b) 54%
c) 84%
d) 75%
e) 44%

49-) (UFRJ) Para testar a eficácia de uma campanha de anúncio do lançamento


de um novo sabão S, uma agência de propaganda realizou uma pesquisa com
2000 pessoas. Por uma falha da equipe, a agência omitiu os dados dos campos
x,y,z e w no seu relatório sobre a pesquisa, conforme mostra a tabela abaixo:

Número de pessoas Adquiriram Não adquiriram Total


que: S S
Viram o anúncio x y 1500
Não viram o anúncio 200 z 500
Total 600 w 2000

Suponha que uma dessas 2000 pessoas entrevistadas seja escolhida ao acaso
e que todas as pessoas tenham a mesma probabilidade de serem escolhidas.

Marco Antônio Santoro Bara


64

Determine a probabilidade de que essa pessoa tenha visto o anúncio da


campanha e adquirido o sabão S.

50-) No lançamento simultâneo de dois dados, qual a probabilidade de:


a) Se obter soma 8? b) Ocorrer soma 12? c) Ocorrer soma 1?

GABARITO
41) a) 1/6 b) 1/3 c) 1 /2 d) 1 /2
42) a) 1/10 b) 2/5 c) 1 /2 d) 7/10 e) 2/5 f) 0 g) 1
43) a) 1/13 b) 3/13 c) 1 /2 d) 1 /4 e) 1/52 f) 1/13 g) 2/13 h) 4/13
44) E
45) C
46) A
47) A
48) I: B II: C
49) 1/5
50) a) 5/36 b) 1/36 c) 0

10.4 PROBABILIDADE CONDICIONAL (TEOREMA DE BAYES)

Seja E um espaço amostral finito e não-vazio e A um evento não-vazio de E.


Suponhamos que o evento A tenho ocorrido e que queiramos saber qual a
probabilidade de ocorrer um outro evento B não-vazio de E.

Essa nova probabilidade é indicada por P(B│A) e dizemos que ela é “a


probabilidade de B condicionada ao fato de que A já ocorreu”, ou simplesmente,
que é a probabilidade condicional de B em relação a A.

Temos, nesse caso, uma mudança do espaço amostral.

A probabilidade de B será em relação ao espaço amostral A e o elemento


procurado de B deverá pertencer a B∩A; portanto, a nova probabilidade é:

P(B│A) = P(B∩A)
P(A)

Por outro lado, P(B│A) = P(B∩A) P(B∩A) = P(A) . P(B│A)


P(A)

Marco Antônio Santoro Bara


65

Como B∩A = A∩B, então P(A∩B) = P(B) . P(A│B)

Podemos escrever então:

P(A∩B) = P(B) . P(A│B) = P(A) . P(B│A)

Exemplos:
1-) Uma urna contém 8 bolas amarelas e 6 bolas verdes. Qual é a probabilidade
de retirarmos 2 bolas sucessivamente, sem reposição, sendo a primeira verde e
a segunda amarela?

P(V) = 6/14 = 3/7


P(A│V) = 8/13
Logo, P(V∩A) = P(V) . P(A│V) = (3/7) . (8/13) = 24/91

2-) Retira-se, ao acaso, um valete de um baralho comum, de 52 cartas. Sem


reposição da carta extraída, qual é a probabilidade de, numa segunda retirada,
sair outro valete?

P(A)= 4/52 = 1/13


P(B│A) = 3/51 = 1/17
Logo, P(A∩B) = P(A) . P(B│A) = (1/13) . (1/17) = 1/221

Exercícios:
51-) (TCE-RS/12) Dois professores corrigem a prova de redação de um concurso
público. O professor A corrige o dobro de provas do que o professor B. Sabe-se
que 60% das provas corrigidas pelo professor A tiveram nota superior a 7,
enquanto apenas 20% das provas corrigidas pelo professor B tiveram nota
superior a 7. Se um candidato teve conceito não superior a 7, a probabilidade de
sua prova ter sido corrigida pelo professor A é:
a) 0,85571
b) 0,75000
c) 0,33333
d) 0,50000
e) 0,25000

Marco Antônio Santoro Bara


66

52-) Os arquivos levantados pelo censo da cidade A em 1998 revelaram que,


apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150,
enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a
porcentagem dos homens nessa população. Um pesquisador do censo, acaba
de se encontrar com uma pessoa com QI acima de 150. Calcule a probabilidade
desta pessoa ser do sexo feminino.
a) 70%
b) 18%
c) 28%
d) 46%
e) 72%
53-) Os arquivos levantados pelo censo da cidade A em 1998 revelaram que,
apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150,
enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a
porcentagem dos homens nessa população. Calcule a probabilidade de sortear
uma pessoa do sexo feminino com QI acima de 150.
a) 70%
b) 18%
c) 28%
d) 46%
e) 72%
54-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico
que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves,
enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto
de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o
cinto. A polícia acaba de ser chamada para investigar um acidente em que houve
um indivíduo gravemente ferido. Calcule a probabilidade de ela estar usando o
cinto no momento do acidente.
a) 18%
b) 14%
c) 56,25%
d) 43,75%
e) 72%
55-) A probabilidade de Márcio chegar em casa tarde para jantar é 25%. Por
outro lado, a probabilidade do jantar atrasar é 10%. Se não há qualquer
relacionamento entre os atrasos de Márcio e os atrasos do jantar, qual a
probabilidade de ocorrerem ambos os atrasos?
a) 25%
b) 10%
c) 3%
d) 5%
e) 2,50%

Marco Antônio Santoro Bara


67

56-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico


que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves,
enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto
de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o
cinto. Calcule a probabilidade de um indivíduo estar usando o cinto no momento
do acidente e ficar gravemente ferido.
a) 18%
b) 14%
c) 56,25%
d) 43,75%
e) 72%
57-) Uma grande empresa possui dois departamentos: um de artigos femininos
e outro de artigos masculinos. Para o corrente ano fiscal, o diretor da empresa
estima que as probabilidades de os departamentos de artigos femininos e
masculinos obterem uma margem de lucro de 10% são iguais a 30% e 20%
respectivamente. Além disso, ele estima em 5,1% a probabilidade de ambos os
departamentos obterem uma margem de lucro de 10%. No final do ano fiscal, o
diretor verificou que o departamento de artigos femininos obteve uma margem
de lucro de 10%. Desse modo, a probabilidade de o departamento de artigos
masculinos ter atingido a margem de lucro de 10% é igual a:
a) 17%
b) 20%
c) 25%
d) 24%
e) 30%

58-) Uma companhia preocupada coma sua produtividade costuma oferecer


cursos de treinamento a seus operários. A partir da experiência, verificou-se que
um operário, recentemente admitido, que tenha frequentado o curso de
treinamento te 82% de probabilidade de cumprir sua quota de produção. Por
outro lado, um operário, também recentemente admitido, que não tenha
frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade
de cumprir com sua quota de produção. Dos operários recentemente admitidos,
80% frequentaram o curso de treinamento. Selecionando-se, aleatoriamente, um
operário recentemente admitido na companhia, a probabilidade de que ele não
cumpra sua quota de produção é:
a) 11,70%
b) 27,40%
c) 35%
d) 83%
e) 85%

Marco Antônio Santoro Bara


68

59-) Uma companhia preocupada coma sua produtividade costuma oferecer


cursos de treinamento a seus operários. A partir da experiência, verificou-se que
um operário, recentemente admitido, que tenha frequentado o curso de
treinamento te 82% de probabilidade de cumprir sua quota de produção. Por
outro lado, um operário, também recentemente admitido, que não tenha
frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade
de cumprir com sua quota de produção. Dos operários recentemente admitidos,
80% frequentaram o curso de treinamento. O presidente da companhia acaba
de se encontrar com um operário recentemente admitido que cumpriu sua cota
de produção. Calcule a probabilidade de que ele não tenha frequentado o curso
de treinamento.
a) 9,64%
b) 65,60%
c) 7,50%
d) 73,70%
e) 85,70%
60-) Os arquivos levantados pelo censo da cidade de São Paulo em 1998
revelaram que, apenas 40% das mulheres possuem casa própria, enquanto que
essa incidência nos homens é de 80%. Estima-se em 70% a porcentagem das
mulheres nessa população. Um pesquisador do censo de 1998 de São Paulo,
acaba de se encontrar com uma pessoa que possui casa própria. Calcule a
probabilidade aproximadamente desta pessoa ser do sexo feminino.
a) 18,4%
b) 24%
c) 28%
d) 52%
e) 53,8%

GABARITO
51) D 52) C 53) A 54) E 55) E 56) A 57) A 58) B 59) A
60) E

Marco Antônio Santoro Bara


69

Distribuição
As distribuições são modelos matemáticos que tem por objetivo resolver
certos problemas probabilísticos.
As principais distribuições são as seguintes:
1) Distribuição Binomial
2) Distribuição Multinomial variáveis descontínuas
3) Distribuição Hipergeométrica (no ponto)
4) Distribuição de Poisson
5) Distribuição Normal variável contínua
(no intervalo)

1. Distribuição Binomial
Se p é a probabilidade de um evento acontecer em uma tentativa única
(denominada probabilidade de um sucesso) e q = 1 – p é a de que o evento não
ocorra em qualquer tentativa única (denominada probabilidade de insucesso),
então a probabilidade do evento ocorrer exatamente X vezes, em N tentativas
(isto é, de que haja X sucessos e N – X insucessos), é dada por:

P(X) = ∁ N,X .pX . qN-X ∁ N,X = ____N!____


X! . (N-X)!

Exemplo: A probabilidade de obter exatamente 2 caras em 6 lances de


moeda não viciada é:
Solução: n = 2

P(2) = ∁ 6,2 .(1/2)2. (1/2)6-2

P(2) = 6! . . (1/4).(1/16) P(2) = 15/64 P(2) = 23,44%


2! . 4!
Exercícios de sala:
1) Jogando-se um dado 3 vezes, qual a probabilidade de se obter a face
5, apenas uma vez? 34,72%

2) A probabilidade de obter ao menos 4 caras em 6 lances de uma


moeda não viciada é: 34,38%

Marco Antônio Santoro Bara


70

3) A probabilidade de que um presumível cliente aleatoriamente


escolhido faça uma compra é de 20%. Se um vendedor visita 6
presumíveis clientes, a probabilidade de que ele fará exatamente 4
vendas será igual a: 1,54%

4) Devido as altas taxas de juros, uma firma informa que 30% de suas
contas a receber encontram-se vencidas. Se um contador escolhe
aleatoriamente uma amostra de 5 contas, determinar a probabilidade
de cada um dos dos seguintes eventos:

a) Nenhuma das contas está vencida. 16,81%


b) Exatamente 2 contas estão vencidas. 30,8%
c) A maioria das contas estão vencidas. 16,31%
d) Exatamente 20% das contas estão vencidas. 36,01%

Exercícios do trabalho.
1) Sorteando-se uma família com 5 crianças. Determinar a probabilidade de
que ela esteja composta por:
a) Exatamente um menino. 15,63%
b) No máximo 1 menino. 18,75%
c) No mínimo 1 menino. 96,88%
d) Ao menos duas meninas. 81,25%

Marco Antônio Santoro Bara


71

2) Na venda de um certo produto tem-se 2 opções:


a) Cobrar R$ 1,00 por peça, sem inspeção;
b) Classificar o lote em produto de primeira e de segunda, mediante a
seguinte inspeção: retiramos 5 peças do lote e se não encontrarmos
mais que uma defeituosa, o lote será de primeira qualidade; sendo de
segunda qualidade o lote que não satisfizer tal condição.

O preço de venda é R$ 1,20 por peça do lote de primeira e R$ 0,80


por peça do lote de segunda.
Sabendo-se que cerca de 10% das peças produzidas são defeituosas,
analisar qual das duas opções é a mais vantajosa para o vendedor.
R: segunda opção é mais vantajosa para o vendedor.

3) Em uma prova de múltipla escolha, com 5 opções das quais só uma é


verdadeira. Calcule a chance de um aluno acertar 3 das 25 questões,
sabendo-se que o mesmo nada sabe do assunto. 13,57%

Marco Antônio Santoro Bara


72

Algumas Propriedades da Distribuição Binomial


MÉDIA µ = N.p
VARIÂNCIA N.p.q
DESVIO PADRÃO √N.p.q

No problema anterior, provavelmente quantas questões o referido aluno vai


acertar?
µ = N.p µ = 25.1/5 µ = 5 questões
Calcular o desvio padrão, do número de questões certas:

√N.p.q √25.1/5.4/5

2. Distribuição Multinomial (Polinomial)


É uma generalização da Distribuição Binomial, para mais do que dois
eventos.
Se os eventos E1, E2,......,EK podem ocorrer com as probabilidades
P1, P2,......,PK respectivamente, então a probabilidade de E 1, E2,......,EK
ocorrerem X1, X2, .....,XK vezes, respectivamente é:
P(X1, X2,...,Xk) = N! . . P1X1 . P2X2 ......PKXK
X1! . X2! ......XK!
Onde: X1 + X2 + .....+ XK = N
Exemplo: Se um dado honesto é lançado 12 vezes, a probabilidade de serem
obtidos os pontos 1, 2, 3, 4, 5 e 6, exatamente 2 vezes cada um, é:
P(X1=2, X2=2,...,X6=2) = 12! . (1/6)2. (1/6)2.(1/6)2. (1/6)2. (1/6)2.(1/6)2
2! . 2! . 2! . 2! . 2! . 2!
= 1925 / 559872
= 0,344%

Exercício de sala: Em uma caixa há 3 peças azuis, 4 brancas e 5 cinzas. Retira-


se ao acaso e com reposição 3 peças. Determinar a probabilidade de que:
a) Uma seja azul e 2 brancas. 8%
b) Uma azul 42%

Marco Antônio Santoro Bara


73

Exercícios do trabalho:
4) Uma fábrica produz lâmpadas nas cores azul, branca e vermelha. Sabe-
se que as proporções de cada cor são 20%, 50% e 30% respectivamente.
Sorteando-se 5 lâmpadas ao acaso com reposição, qual é a probabilidade
de que 2 sejam azuis, 2 brancas e 1 vermelha? 9%

5) O sangue humano foi classificado em: A, O, B e AB. Sabendo-se que a


proporção de cada tipo em Curitiba é : 40%, 45%, 10% e 5%
respectivamente. Sorteando-se 6 pessoas ao acaso desta população,
qual será a probabilidade de que eles sejam:
a) Dois do tipo A, 3 do tipo O e 1 do tipo B? 8,74%
b) Três do tipo A e 3 do tipo O? 11,66%
c) Todos do tipo O? 0,83%
d) Pelo menos 4 sejam do tipo O? 25,53%

Marco Antônio Santoro Bara


74

3. Distribuição Hipergeométrica.

Esta distribuição somente é aplicada nos eventos dependentes, isto é,


condicionados.
Vimos que a distribuição binomial e multinomial eram aplicados apenas
nos eventos independentes, tal como ocorre nas extrações de peças de uma
urna, quando esta extração é feita com reposição. Portanto agora, para
aplicarmos a hipergeométrica, estas extrações terão que ser feitas sem
reposição.
Se quizermos saber qual a probabilidade de que em n extrações sem
reposição, aconteçam x1 sucessos da primeira espécie, x2 sucessos da segunda
espécie e assim por diante, até uma ordem xk qualquer, bastará aplicar a
seguinte fórmula:

P(A1 = X1 , A2 = X2 ,......., AK = XK) = CN1 , n1 . CN2 . n2 .........CNK . nk


CN , n

N: é o total de peças na urna;


n: é o total de peças retiradas da urna;
A1: é o total de peças existentes na urna, da primeira espécie;
A2: é o total de peças existentes na urna, da segunda espécie;
.
Onde .
Ak: é o total de peças existentes na urna, da k-ésima espécie;
n1: é o número de sucessos pedidos de primeira espécie;
n2: é o número de sucessos pedidos de segunda espécie;
.
.
nk: é o número de sucessos pedidos da k-ésima espécie.

Exemplo: Em uma urna há 3 peças azuis, 4 brancas e 5 vermelhas.


Retira-se ao acaso e sem reposição 3 peças. Determinar a probabilidade de que
elas sejam:
a) 2 brancas e 1 vermelha.
Solução: P(A=0,B=2,V=1) = C3,0 . C4,2 . C5,1 = 1 . 6 . 5 = 13,6%
C12,3 220

b) 1 de cada cor.
Solução: P(A=1,B=1,V=1) = C3,1 . C4,1 . C5,1 = 3 . 4 . 5 = 27,3%
C12,3 220

c) 1 branca.
Solução: P(B=1,~B=2) = C4,1 . C8,2 = 4 . 28 = 50,9%
C12,3 220

Marco Antônio Santoro Bara


75

d) Todas da mesma cor.


Solução:
P(A=3,B=0,V=0) + P(A=0,B=3,V=0) + P(A=0,B=0,V=3)
C3,3 . C4,0 . C5,0 + C3,0 . C4,3 .C5,0 + C3,0 . C4,0 . C5,3 = 6,8%
C12,3 C12,3 C12,3

Exercícios do trabalho

6) Pequenos motores elétricos são expedidos em lotes de 50 unidades.


Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses
motores e os inspeciona. Se nenhum dos motores inspecionados for
defeituoso, o lote é aprovado, caso contrário todos deverão ser
inspecionados. Supondo que existam realmente 3 motores defeituosos no
lote, qual a probabilidade de que a inspeção total seja necessária?
27,6%

7) De seis empregados, três estão na CIA há cinco anos ou mais. Se quatro


empregados são aleatoriamente escolhidos deste grupo de seis, a
probabilidade de que exatamente dois estejam na CIA há cinco ou mais
anos é: 60%

8) O grupo de um departamento é composto por 5 engenheiros e 9 técnicos.


Se 5 indivíduos forem escolhidos aleatoriamente e se lhes atribui um
projeto, qual a probabilidade de que o grupo do projeto inclua exatamente
2 engenheiros? 41,9%

Marco Antônio Santoro Bara


76

DISTRIBUIÇÃO DE POISSON
A distribuição de Poisson pode ser usada para determinar a probabilidade de um
dado número de sucessos quando os eventos ocorrem em uma continuidade de
tempo no espaço ao invés de ocorrerem em tentativas ou observações fixadas
(Binomial).
A distribuição de Poisson foi definida como sendo o limite da distribuição
binomial, para N→∞ e p→0. Passando-se o limite, nesta distribuição binomial,
encontrou-se a mesma com a notação:

P(X=x) = (N.p)x. e-(N.p)


x!
Na prática poderemos utilizar esta distribuição, para resolver os problemas
binomiais com a condição de que N.p ≤ 5.
Exemplo: Suponhamos que 3% das peças produzidas por uma fábrica sejam
defeituosas. Comprando-se uma centena delas, qual é a probabilidade de que
apenas 4 estão defeituosas?
Solução: Método Binomial: P(X=x) = Cn,x . px . qn-x
P(X=4) = C100,4 . (0,03)4.(0,97)96 = 16,8%
Método Poisson: N.p = 100. 3% = 3 < 5 ok
P(X=4)= 34 . e-3 P(X=4)= 81 . 0,049787
4! 24
P(X=4)= 4,032747 P(X=4)= 16,8%
24
Trabalho:
9. Suponhamos que 3% das peças produzidas por uma fábrica sejam
defeituosas. Comprando-se 150 peças, qual é a probabilidade de que no máximo
2 defeituosas?
17,35%

Marco Antônio Santoro Bara


77

10. Sabe-se que 2,5% das peças produzidas por uma fábrica, são defeituosas.
Comprando-se 120 peças desta fábrica, determinar as seguintes probabilidades:
a) de que 4 estejam defeituosas. 16,8%
b) de que no máximo 3 estejam defeituosas. 64,72%
c) de que no mínimo 3 estejam defeituosas. 57,68%

11. Sabe-se que 1,25% das peças produzidas por uma fábrica, são defeituosas.
Comprando-se 200 peças desta fábrica, determinar as seguintes probabilidades:
a) de que 2 estejam defeituosas. 25,65%
b) de que no máximo 2 estejam defeituosas. 54,38%
c) de que no mínimo 2 estejam defeituosas. 71,27%

Marco Antônio Santoro Bara


78

VARIÁVEIS CONTÍNUAS
Seja x uma variável aleatória que pode assumir infinitos valores num
intervalo finito. Consideremos que haja uma função contínua f: R→R tal que
P(a ≤ x ≤ b) , seja igual a área sob a curva da função t entre x = a e x = b.
Tem-se então, que a probabilidade acusada é:

P(a ≤ x ≤ b) = área sombreada

Representação gráfica:

xi a b

Gráfico-1 : Sendo F(xi) = ∫ 𝑓(𝑥 )𝑑𝑥 é numericamente igual a área à


esquerda de xi no gráfico.
Gráfico-2: A área total sob a curva do gráfico é igual a unidade, isto é:

∫ 𝑓(𝑥 )𝑑𝑥
Gráfico-3: A probabilidade de x estar compreendido entre a e b é
numericamente igual a área compreendida entre as retas verticais de abscissas
a e b, o eixo x e a curva.

∫ 𝑓(𝑥 )𝑑𝑥

Uma variável contínua, terá distribuição normal se a sua função


densidade de probabilidade for dada pela seguinte fórmula:

Marco Antônio Santoro Bara


79

A variação natural de muitos processos industriais é realmente aleatória.


Embora as distribuições de muitos processos possam assumir uma variedade
de formas, muitas variáveis observadas possuem uma distribuição de
frequências que é, aproximadamente, uma distribuição de probabilidade Normal.
Probabilidade é a chance real de ocorrer um determinado evento, isto é,
a chance de ocorrer uma medida em um determinado intervalo. Por exemplo, a
frequência relativa deste intervalo, observada à partir de uma amostra de
medidas, é a aproximação da probabilidade. E a distribuição de frequências é a
aproximação da distribuição de probabilidades.
A distribuição é normal quando tem a forma de "sino":

Para achar a área sob a curva normal devemos conhecer dois valores
numéricos, a média e o desvio padrão . A Figura a seguir mostra algumas
áreas importantes:

Marco Antônio Santoro Bara


80

Para cada valor de e/ou temos uma curva de distribuição de


probabilidade. Porém, para se calcular áreas específicas, faz-se uso de uma
distribuição particular: a "distribuição normal padronizada", também chamada
de Standartizada ou reduzida, o qual é a distribuição normal com e .
Para obter tal distribuição, isto é, quando se tem uma variável com distribuição
normal com média diferente de (zero) e/ou desvio padrão diferente
de (um), devemos reduzi-la a uma variável , efetuando o seguinte cálculo

Assim, a distribuição passa a ter média e desvio padrão .


Pelo fato da distribuição ser simétrica em relação à média , a área à direita
é igual a área à esquerda de . Por ser uma distribuição muito usada, existem
tabelas a qual encontramos a resolução de suas integrais. Assim, a tabela
fornece áreas acima de valores não negativos que vão desde até . Veja
o gráfico da curva Normal padronizada na Figura abaixo.

Distribuição Normal Padrão e a função de densidade de probabilidade reduz-


se a,

A área em azul escuro está a menos de um desvio padrão (σ) da média. Em


uma distribuição normal, isto representa cerca de 68% do conjunto, enquanto
dois desvios padrões desde a média (azul médio e escuro) representam cerca
de 95%, e três desvios padrões (azul claro, médio e escuro) cobrem cerca de
99.7%.

Marco Antônio Santoro Bara


81

Tabela da Distribuição Normal Padrão

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

Marco Antônio Santoro Bara


82

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183

Marco Antônio Santoro Bara


83

-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Exemplo:
1. Suponhamos que as alturas dos estudantes da FESP distribuem-se
normalmente, com média µ = 172cm e desvio-padrão σ = 5cm. Sorteando-
se 1 aluno ao acaso, determinar as seguintes probabilidades:
a) De que a altura seja maior do que 170cm.....................65,54%
b) De que a altura seja menor do que 170cm....................34,46%
c) De que a altura esteja entre 170cm e 182cm................63,26%

Marco Antônio Santoro Bara


84

Trabalho:
12. Um processo de fabricação produz peças com comprimento médio de
500mm e desvio-padrão de 10mm. Qual a porcentagem de peças que
se situam:
a) Acima de 510mm.......................................................15,87%
b) Entre 490mm e 510mm..............................................68,26%
c) Entre 480mm e 520mm..............................................95,44%
d) Entre 470mm e 530mm..............................................99,72%
e) Abaixo de 495mm......................................................30,85%
f) Abaixo de 525,8mm...................................................99,51%
g) Entre 470mm e 480mm..............................................2,15%
h) Entre 480mm e 510mm..............................................81,85%
i) Acima de 500mm........................................................50%
j) Acima de 560mm........................................................0%
k) Entre 487,8mm e 513,4mm........................................79,87%

13. Uma fábrica de chocolates comercializa barras que pesa em média


200g. Os pesos são normalmente distribuídos. Sabe-se que o desvio-
padrão é igual a 40g. Calcule a probabilidade de uma barra de
chocolate escolhida ao acaso pesar:
a) Entre 200g e 250g....................................................39,44%
b) Entre 170g e 200g....................................................27,34%
c) Pesar mais que 230g................................................22,66%
d) Pesar menos que 150g.............................................10,56%

14. Uma indústria verificou que as lâmpadas que produz apresentam uma
vida útil normalmente distribuída, com média igual a 750 dias e desvio-
padrão igual a 40 dias. Calcule a probabilidade de uma lâmpada
escolhida ao acaso durar:
a) Entre 600 e 900 dias...............................................aprox. 100%
b) Mais que 700 dias...................................................89,44%
c) Menos que 650 dias................................................0,62%

15. Sabe-se que as vendas diárias de uma lanchonete são normalmente


distribuídas, com média igual a R$ 1.800,00 e desvio-padrão de
R$200,00. Calcule as probabilidades de, em determinado dia, as
vendas: a) serem maiores do que R$ 2.300,00.................0,62%
b) serem inferiores a R$ 1.750,00.......................40,13%
c) ficarem entre R$ 1.650,00 e R$ 1.750,00........17,47%
d) ficarem entre R$ 1.550,00 e R$ 1.900,00........58,59%

Marco Antônio Santoro Bara


85

Trabalho – diversificado
16. Uma empresa comercial calcula que 5% de suas vendas não são recebidas,
em função do recebimento de cheques sem fundos. Ao se analisar uma amostra
formada por oito vendas, qual a probabilidade de:
a) todos serem pagos normalmente?.......................................... 66,34%
b) uma ou duas vendas, apenas, serem pagas?........................ 0%
c) pelo menos três vendas serem pagas normalmente?............. 100%
d) todas as vendas não serem pagas?....................................... 0%
17. A probabilidade de uma determinada construtora vencer licitações é
aproximadamente igual a 54%. Em seis licitações, qual a probabilidade de essa
empresa:
a) perder todas........................................................................... 0,95%
b) vencer apenas uma............................................................... 6,67%
c) vencer pelo menos uma........................................................ 99,05%
d) perder três licitações............................................................. 30,65%

18. Uma indústria de refrigerantes recebe pedidos de seus vendedores por meio
de fax, telefone e internet. O número de pedidos que chegam por qualquer meio
no horário comercial é uma variável aleatória discreta com taxa igual a cinco
pedidos por hora. Calcule a probabilidade de:
a) a indústria receber apenas dois pedidos em uma hora.........8,42%
b) receber oito pedidos em uma hora...................................... 6,49%
c) receber sete pedidos em uma hora......................................10,39%
d) receber seis, sete ou oito pedidos em uma hora.................31,42%
19. As vendas mensais do mercadinho Pague Bem seguem, aproximadamente,
uma distribuição normal, com média igual a R$ 5.000,00 e desvio padrão igual a
R$ 2.000,00. Calcule a probabilidade de que, em um determinado mês, as
vendas:
a) sejam superiores a R$ 3.500,00........................................... 77,34%
b) sejam inferiores a R$ 3.000,00............................................. 15,87%
c) estejam entre R$ 3.800,00 e R$ 5.300,00............................ 28,53%
d) estejam entre R$ 2.100,00 e R$ 7.800,00........................... 84,57%

Marco Antônio Santoro Bara


86

20. A olaria João de Barro fabrica e comercializa dois produtos principais:


telhas e tijolos. A relação da produção do mês de agosto do ano passado pode
ser vista na tabela seguinte. Calcule:
a) em uma amostra composta por oito telhas, qual a probabilidade de pelo
menos duas serem defeituosas?...................................................18,69%
b) em uma amostra composta por sete tijolos, qual a probabilidade de pelo
menos seis serem defeituosos?....................................................0%
c) em uma amostra formada por quatro produtos, qual a probabilidade de
existirem dois defeituosos?...........................................................2,89%
Produto Com defeito Sem defeito Total
Tijolo 6.000 84.000 90.000
Telha 3.000 27.000 30.000
Total 9.000 111.000 120.000

21. A probabilidade de um funcionário das Metalúrgicas Bigorna LTDA, ser


promovido a gerente com menos de 5 anos de trabalho na empresa é igual a
7,5%. Calcule a probabilidade de, em grupo de seis funcionários novos:
a) nenhum ser promovido a gerente..............................................62,64%
b) pelo menos um ser promovido a gerente..................................37,36%
c) todos serem promovidos a gerente...........................................0%

22. A central de atendimentos de uma operadora de cartões de crédito recebe


denúncia de roubo de cartões à razão de quatro ligações por hora, no período
matutino, em dias úteis. O número de ligações recebidas pode ser aproximado
por uma distribuição de Poisson. Pede-se:
a) quantas chamadas são esperadas num período de 30 minutos?..Duas
b) qual a probabilidade de nenhuma chamada ocorrer num período de 30
minutos?.......................................................................................13,53%
c) qual a probabilidade de ocorrerem ao menos duas chamadas no mesmo
período?.......................................................................................59,40%

Marco Antônio Santoro Bara


87

23. Para ser aprovado em um exame seletivo um candidato deve obter nota
superior a 8,2 em Matemática e superior a 9,5 em Português. Sabendo-se que
as notas seguem uma distribuição normal, com média e desvio padrão,
apresentados na tabela seguinte, calcule quantos alunos de um grupo de 950
devem ser aprovados neste processo seletivo....................................≈24 alunos
Prova Média Desvio Padrão
Português 7,3 2,7
Matemática 6,1 1,8

24. Estudos meteorológicos indicam que a precipitação pluviométrica mensal


em períodos de seca numa certa região do Nordeste do Brasil, pode ser
considerada como seguindo a distribuição norma com média igual a 40 mm e
variância 16 mm2. Pede-se:
a) qual a probabilidade de que a precipitação pluviométrica mensal no
período de seca esteja entre 34 mm e 38 mm?.............................24,17%
b) qual seria o valor da precipitação pluviométrica de modo que exista
apenas 20% de chance de haver uma precipitação inferior a esse valor?
36,64mm
c) construa um intervalo central em torno da média que contenha 90% dos
possíveis valores de precipitação pluviométrica...........33,44 ≤ µ ≤ 46,56

25. Um pesquisador verificou que em uma cidade do interior do PR o peso dos


homens tem distribuição normal com média de 85kg e desvio padrão de 20kg,
enquanto o das mulheres também apresenta-se normalmente distribuído, com
média de 60kg e desvio padrão de 8kg. Pede-se:
a) sorteando-se um homem, qual é a probabilidade de ele ter peso acima
de 75kg ?....................................................................................69,15%
b) sorteando-se uma mulher, qual a probabilidade de ela ter peso acima
de 65kg?....................................................................................26,43%

Marco Antônio Santoro Bara


88

REGRESSÃO LINEAR
O diagrama de dispersão fornece uma representação visual da relação
existente entre duas variáveis, consiste em uma nuvem de pontos.

Podemos traçar uma reta, um modelo matemático da associação entre essas


variáveis, chamado Reta de Regressão.

Suponha uma empresa que deseja avaliar se o dinheiro empregado em


propaganda resulta em maior número de vendas. Para tal, é necessário que se
colete os dados de investimento gasto em propaganda e os dados referentes às
vendas:

Inicialmente, colocaremos os dados na planilha, dispostos em duas colunas,


uma representando a variável investimento em propaganda (X) e a outra a
variável vendas (Y).

Marco Antônio Santoro Bara


89

y y = ax + b
600

500

400

300

200

100

0
0 5 10 15 20 25 30 35 40 45

Onde a = coeficiente angular a = tgα


b = coeficiente linear

Um dos métodos mais simples para o cálculo das estimativas dos parâmetros a
e b é o Método dos Mínimos Quadrados.

Método dos Mínimos Quadrados


Para estabelecermos uma equação de regressão entre duas variáveis,
o primeiro passo é colher uma amostra de observações (xi,yi) que constituem os
pontos do diagrama de dispersão.
O método dos mínimos quadrados visa estimar os parâmetros da
equação de regressão, de forma que a soma dos quadrados dos desvios (d i)
sejam a menor possível.

𝒏 (𝜮 𝒙.𝒚) 𝜮𝒙 .𝜮𝒚
b = y – a.x a= y = ax + b
𝒏(𝜮𝒙𝟐) (𝜮𝒙)𝟐

Marco Antônio Santoro Bara


90

x y x.y X2
30 430 12900 900
21 335 7035 441
35 520 18200 1225
42 490 20580 1764
37 470 17390 1369
2 210 420 4
8 195 1560 64
17 270 4590 289
35 400 14000 1225
25 480 12000 625
252 3800 108675 7906

y= x= (Σx)2 = 2522 = 63504

y = x = y = 380 x = 25,2
𝟏𝟎 . 𝟏𝟎𝟖𝟔𝟕𝟓 𝟐𝟓𝟐 . 𝟑𝟖𝟎𝟎 𝟏𝟐𝟗𝟏𝟓𝟎
a= a= a = 8,3
𝟏𝟎 . 𝟕𝟗𝟎𝟔 𝟔𝟑𝟓𝟎𝟒 𝟏𝟓𝟓𝟓𝟔

b = 380 – 8,3 . 25,2 b = 170,84 y = 8,3 x + 170,84

y
X Y
600
30 419,84
500 21 345,14
35 461,34
400 42 519,44
300 37 477,94
2 187,44
200 8 237,24
100 17 311,94
35 461,34
0 25 378,34
0 10 20 30 40 50

Marco Antônio Santoro Bara


91

No excel, temos:

O intervalo Y ocupa as células B2 a B11 e deve ser representado por


$B$2:$B$11 no espaço reservado para "Intervalo Y de entrada". O intervalo X é
preenchido de maneira análoga, sendo no nosso exemplo representado pelas
células A2 a A11 ($A$2:$A$11).

Uma vez preenchido os intervalos X e Y, devemos escolher as opções "NOVA


PLANILHA" e "PLOTAGEM COM AJUSTE DE LINHA" ainda na mesma caixa de
diálogo. Para isto use o apontador do mouse dando um "clique" em cada função.

Para que o Excel efetue os cálculos, pressione "OK".

Os resultados numéricos, juntamente com o diagrama de dispersão, são


armazenados em uma nova planilha. O diagrama de dispersão obtido deverá ser
semelhante ao gráfico abaixo:

Marco Antônio Santoro Bara


92

EXEMPLO: Dada a tabela:

Quantidade 10 11 12 13 14 15
custo 100 112 119 130 139 142

a) Construa o diagrama de dispersão


b) Ajuste a reta no diagrama
c) Trace a reta no diagrama
d) Qual é o custo para 18 unidades do artigo? ................................171,12

Marco Antônio Santoro Bara


93

Trabalho:

26. Os dados referem-se ao volume de precipitação pluviométrica em mm e a


produção de leite tipo-C (milhões de litros) em determinada região do país.

a) construa o diagrama de dispersão

b) ajuste uma reta aos dados

c) trace a reta no diagrama

d) admitindo-se em 2013 o índice pluviométrico de 24mm qual deverá ser o


volume esperado da produção de leite tipo-C? ....................................... 27,88

Anos Produção Índice


de Leite Pluviométrico
2003 26 23
2004 25 21
2005 31 28
2006 29 27
2007 27 23
2008 31 28
2009 32 27
2010 28 22
2011 30 26
2012 30 25

27. Durante o ano de 2012, as ações da empresa A tiveram as cotações médias


mensais, na bolsa de valores, abaixo indicadas. Sabendo-se que o valor nominal
da ação é de R$ 100,00, prever seu valor para março de 2013.............. 124,88

jan fev mar abr mai jun jul ago set out nov dez
3% 2% 2,5% -1,5% 3,5% 5% -2% -1,5% 2% 2,5% 3% 1,5%

Marco Antônio Santoro Bara


94

CORRELAÇÃO SIMPLES
Quando se estuda o inter-relacionamento de duas variáveis apenas, a
correlação é denominada simples.
Se os pontos do diagrama de dispersão estiverem em torno de uma reta
ajustada, a correlação entre as variáveis é chamada linear. Se os pontos derem
a imagem de uma curva, a correlação é não linear. O diagrama que apresenta
os pontos espalhados, indica que não há inter-relação entre as variáveis, neste
caso, a correlação é nula.
A correlação é a medida padronizada da relação entre duas variáveis
indica a força e a direção do relacionamento linear entre duas variáveis
aleatórias.
A correlação nunca pode ser maior do que 1 ou menor do que menos 1.
Uma correlação próxima a zero indica que as duas variáveis não estão
relacionadas.
Uma correlação positiva indica que as duas variáveis movem juntas, e a
relação é forte quanto mais a correlação se aproxima 1.
Uma correlação negativa indica que as duas variáveis movem-se em
direções opostas,
A relação fica mais forte quanto mais próxima a correlação de -1.
Duas variáveis que estão perfeitamente correlacionadas positivamente
(r=1) movem-se essencialmente em perfeita proporção na mesma direção,
Dois conjuntos que estão perfeitamente correlacionados negativamente
movem-se em perfeita proporção em direções opostas.
A relação entre as variáveis é evidenciada pela formação de um padrão
no diagrama de Dispersão

TIPOS DE CORRELAÇÃO
A correlação entre 02 variáveis pode ser:
1. Correlação Positiva : O aumento de uma variável corresponde, ao aumento
da outra.
2. Correlação Negativa: O aumento de uma variável corresponde a diminuição
da outra.
3. Correlação Linear: Quando é possível ajustar uma reta, ode ser forte (quanto
mais próximas da reta) ou fraca (quanto mais próximas da reta).
4. Correlação não-linear: Quando não é possível ajustar uma reta.

Marco Antônio Santoro Bara


95

DIAGRAMA DE DISPERSÃO
O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são
usados para representar simultaneamente os valores de duas variáveis
quantitativas medidas em cada elemento do conjunto de dados. Ele é muito útil
para comparar dados, como antes e depois. De acordo com a correlação das
variáveis o diagrama pode ser:

Marco Antônio Santoro Bara


96

COEFICIENTE DE CORRELAÇÃO
Coeficiente de correlação indica a força e a direção do relacionamento linear
entre as duas variáveis a ser estudada, sendo denotada por r. Vários
coeficientes são utilizados para situações diferentes, tais como o coeficiente de
correlação de Pearson e o coeficiente Linear.

COEFICIENTE DE CORRELAÇÃO LINEAR


Esse coeficiente serve para detectar padrões de lineares. (não vale para os
padrões não lineares).

O valor de r estar sempre entre 1 e -1, ou seja −1 ≤ r ≤ 1


Se r está próximo de 1, há uma forte correlação positiva.
Se r está próximo a –1, há uma forte correlação negativa.
Se r está próximo de 0, não há correlação linear.

Obs.: O quadrado do coeficiente de correlação é denominado coeficiente de


determinação. Se, por exemplo, r=0,8 então o coeficiente de determinação r 2 é
0,64. Esse coeficiente indica que 64% da variabilidade dos yi podem ser
explicados pela relação entre yi e xi .

Marco Antônio Santoro Bara


97

Exemplo: A tabela abaixo mostra o resultado de uma pesquisa com 10 famílias


de determinada região.

Famílias Renda (R$) Poupança (R$) Nº de Média de Anos de


Filhos Estudo da família

A 10 4 8 3

B 15 7 6 4

C 12 5 5 5

D 70 20 1 12

E 80 20 2 16

F 100 30 2 18

G 20 8 3 8

H 30 8 2 8

I 10 3 6 4

J 60 15 1 8

1. a) Construa o diagrama de dispersão entre a renda familiar e a


poupança.
b) Ajuste uma reta aos dados.
c) Trace a reta no diagrama.
d) Calcular ao coeficiente de correlação linear entre a renda familiar
e a poupança.

TRABALHO
28.a) Construa o diagrama de dispersão entre a renda familiar e o
número de filhos para as dez famílias.
b) Ajuste uma reta aos dados.
c) Trace a reta no diagrama.
d) Calcular o coeficiente de correlação linear entre renda e números
de filhos para as dez famílias.

Marco Antônio Santoro Bara


98

REGRESSÃO POLINOMIAL
Quando a curva que se ajusta aos pontos do diagrama de dispersão
constitui uma função polinomial, a regressão é denominada polinomial.
Se, por exemplo, a curva é dada pelo polinômio:

y = bpxp +....+ b2x2 + b1x + b0

A função ajustada é estimada através do sistema:

n Σx Σx2 ....... Σxp b0 Σy


Σx Σx2 Σx3 ....... Σxp+1 b1 Σx.y
Σx2 Σx3 Σx4 ....... Σxp+2 b2 Σx2.y
. . . ....... . . . = .
. . . ....... . . .
Σxp Σxp+1 Σxp+2...... Σx2p bp Σxp.y

Exemplo: Uma empresa, analisando o custo total para execução de um


projeto em função do tempo, obteve os seguintes resultados:
Tempo em meses Custo Total em R$(milhões)
(x) (y)
1,0 108,0
1,5 104,3
2,0 102,4
2,5 101,2
3,0 102,7
3,5 103,8
4,0 105,0
4,5 107,2
5,0 111,1
5,5 117,2
a) Estabelecer a equação de regressão de y sobre x.
b) Determinar o custo para x=2,68

Marco Antônio Santoro Bara


99

Trabalho
29. Dados os 5 pontos experimentais para as variáveis x e y, pede-se:
a) ajustar uma parábola aos dados
b) estimar o valor de y para x = 5............................................-12
x y
-1 0
0 3
1 4
2 3
3 0

30. Dados os 7 pontos experimentais para as variáveis x e y, pede-se:


a) ajustar uma parábola aos dados
b) estimar o valor de y para x = 4,5............................................3,28
x y
1 10
2 5
3,5 4
5 4
6 5,5
6,5 7
7 9,5

31. Dados os 13 pontos experimentais para as variáveis x e y, pede-se:


a) ajustar um polinômio do terceiro grau aos dados
b) estimar o valor de y para x = 10....................................... -10,64
x y
-6 -2
-5 0
-4 3
-3 4
-2 5
-1 4,5
0 4
1 3
2 0
3 -2
4 -2
5 0
6 1

Marco Antônio Santoro Bara


100

REGRESSÃO MÚLTIPLA
Se uma variável y é dependente de duas ou mais variáveis, a análise de
regressão é chamada múltipla.
A relação entre essas variáveis é expressa sob a forma ajustada:

y = b0 + b1x1 + b2x2 + .....+ bpxp

Analogamente à regressão polinomial, os parâmetros dessa função são


estimados através do sistema:

n Σx1 Σx2 ...... Σxp b0 Σy


Σx1 Σx12 Σx2x1 ...... Σxpx1 b1 Σx1y
Σx2 Σx1x2 Σx22 ...... Σxpx2 b2 Σx2y
. . . ...... . . . = .
. . . ...... . . .
Σxp Σx1xp Σx2xp ...... Σxp2 bp Σxpy

Exemplo: A tabela abaixo, apresenta os dados correspondentes às idades (x1),


alturas (x2) e pesos (y) de 10 meninos. Estabelecer a equação de regressão de
y sobre x1 e x2 , estimar o peso de um menino com 8 anos de idade e 130 cm de
altura. .................................................................................................28,07kg

x1 7 8 10 9 6 8 7 9 10 6
y 26 25 35 31 24 28 26 30 36 23
x2 127 129 140 144 124 132 130 143 144 121

Marco Antônio Santoro Bara


101

Trabalho
32. Uma empresa, estudando a influência da variação do preço de seu produto
e dos gastos em publicidade sobre as vendas, obteve as seguintes informações:
Vendas Preço Gastos em publicidade
(y) (x1) (x2)
100 10 2
120 10 3
105 12 3
110 15 4
95 18 4
104 20 6
100 20 5
108 15 5

a) Estabelecer uma equação de regressão de y sobre x1 e x2


b) Estimar as vendas para o preço 16 e gastos em publicidade de 6.
117,78

33. Uma indústria fabrica um produto em 2 tamanhos (pequeno e grande).


Conhecendo-se o consumo total da matéria-prima (y) em kg, dessa indústria,
durante 5 meses, e as respectivas produções mensais do tipo pequeno (x1) e do
tipo grande (x2) , pede-se:
Estimar o consumo de matéria-prima quando x1 = 5 e x2 = 3.
27,14kg

y x1 x2
145 151 70
210 221 91
193 215 92
229 247 122
195 243 79

Marco Antônio Santoro Bara