Escolar Documentos
Profissional Documentos
Cultura Documentos
APOSTILA DE ESTATÍSTICA
CURSO: PROCESSAMENTO DE DADOS
12.0 PROBABILIDADE............................................................................................ 56
12.1 ESPAÇO AMOSTRAL E EVENTOS......................................................... 57
12.2 TRÊS ORIGENS DA PROBABILIDADE................................................... 58
12.3 A MATEMÁTICA DA PROBABILIDADE ................................................... 59
EXERCÍCIOS: E-4.................................................................................................... 62
Yule define estatística como: “Dados quantitativos afetados marcadamente por uma
multiplicidade de causas”.
Uma definição mais usual nos dias de hoje seria: “Um método cientifico que permite
a análise, em bases probabilística, de dados coligados e condensados”
1
Probabilidade: É um estudo que envolve o acaso.
Quantitativos Contínuos
Discretos
Qualitativos Nominais
Por postos
Os dados por postos consistem de valores relativos atribuídos para denotar ordem:
primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em
1ª,2ª,3ª colocadas.
2
TABELA: 1 A mesma população pode originar diferentes tipos de dados.
TIPOS DE DADOS
3
1.5 PLANEJAMENTO DE EXPERIMENTOS
3. Coligir os dados
5. Relatar as conclusões
4
EXERCÍCIOS: E-1
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe
e- tamanho de camisa
f- Km/litro
g- O mais aprazível
h- O mais lento
2- Responder as perguntas:
5
2.0 AMOSTRAGEM
Casos de excessão:
- Populações pequenas
- Amostras grandes em relação a população
- Se exige precisão completa
- Se já são disponíveis informações completas
2.1 DEFINIÇÕES
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma
variável comum observável.
AMOSTRA: é qualquer sub-conjunto da população extraída para se realizar estudos
estatísticos
.
POPULAÇÃO
AMOSTRA
6
A estatística indutiva é a ciência que busca tirar conclusões probabilísticas
sobre a população, com base em resultados verificados em amostras retiradas
dessa população.
Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade
em termos:
7
- Amostra é a quantidade de dados especificado para representar a população.
Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer “quão
próxima” está à amostra da população, em termos de representatividade.
Nas Populações discretas uma amostra aleatória é aquela em que cada item da
população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a
probabilidade de incluir na amostra qualquer intervalo de valores é igual à
percentagem da população que está naquele intervalo.
8
Conceitualmente, poderíamos construir uma tabela de números aleatórios
numerando dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna,
misturando bem e extraindo uma de cada vez, com reposição, anotando os valores
obtidos.
9
Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem
com voluntários para testar um novo medicamento. Nenhum desses grupos podem
ser considerados como uma amostra aleatória do público em geral, e seria
perigoso tentar tirar conclusões gerais com base em tal estudo. Todavia, os
resultados poderiam proporcionar uma base para a elaboração de um plano de
amostragem aleatório para validar os resultados básicos. Os perigos inerentes à
pesquisa médica , bem como outro tipo de pesquisa, freqüentemente obrigam a
limitar a pesquisa inicial a um pequeno grupo de voluntários.
SISTEMÁTICA
ESTRATIFICADA
CONGLOMERADO
Significa que será escolhido um item a cada seqüência de 20 de uma lista. Para
iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os
grupos. Por exemplo se der o 9, escolhemos o 9º, 29º, 39º ,49º , etc.
10
2.5.2 AMOSTRAGEM ESTRATIFICADA
RESUMO
11
As amostras aleatórias podem ser obtidas:
12
EXERCICIOS: E-2
a. contínua b. Discreta
13
3.0 ANÁLISE EXPLORATÓRIA DE DADOS
De modo geral, podemos dizer que a essência da ciência é a observação e que seu
objetivo básico é a interferência. Esta é à parte da metodologia da ciência que tem
por objetivos a coleta, redução, análise e modelagem dos dados, a partir do que,
finalmente, faz-se a interferência para uma população, da qual os dados
(amostras) foram obtidos.
14
4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA
Para cada tipo de variável existem técnicas mais apropriadas para resumir as
informações. Porem podemos usar algumas técnicas empregadas num caso,
podemos adaptá-las para outros.
15
TABELA 1
Nº ESTADO GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE
CIVIL INSTRUÇÃO FILHOS (X SAL. MIN) ANOS MESES PROCEDÊNCIA
1 solteiro 1º grau --- 4 26 03 interior
2 casado 1º grau 1 4,56 32 10 capital
3 casado 1º grau 2 5,25 36 05 capital
4 solteiro 2º grau --- 5,73 20 10 outro
5 solteiro 1º grau --- 6,26 40 07 outro
6 casado 1º grau 0 6,66 28 00 interior
7 solteiro 1º grau --- 6,86 41 00 interior
8 solteiro 1º grau --- 7,39 43 04 capital
9 casado 2º grau 1 7,59 34 10 capital
10 solteiro 2º grau --- 7,44 23 06 outro
11 casado 2º grau 2 8,12 33 06 interior
12 solteiro 1º grau --- 8,46 27 11 capital
13 solteiro 2º grau --- 8,74 37 05 outro
14 casado 1º grau 3 8,95 44 02 outro
15 casado 2º grau 0 9,13 30 05 interior
16 solteiro 2º grau --- 9,35 38 08 outro
17 casado 2º grau 1 9,77 31 07 capital
18 casado 1º grau 2 9,8 39 07 outro
19 solteiro superior --- 10,53 25 08 interior
20 solteiro 2º grau --- 10,76 37 04 interior
21 casado 2º grau 1 11,06 30 09 outro
22 solteiro 2º grau --- 11,59 34 02 capital
23 solteiro 1º grau --- 12,OO 41 00 outro
24 casado superior 0 12,79 26 01 outro
25 casado 2º grau 2 13,23 32 05 interior
26 casado 2º grau 2 13,6 35 00 outro
27 solteiro 1º grau --- 13,85 46 07 outro
28 casado 2º grau 0 14,69 29 08 interior
29 casado 2º grau 5 14,71 40 06 interior
30 casado 2º grau 2 15,99 35 10 capital
31 solteiro superior --- 16,22 31 05 outro
32 casado 2º grau 1 16,61 36 04 interior
33 casado superior 3 17,26 43 07 capital
34 solteiro superior --- 18,75 33 07 capital
35 casado 2º grau 2 19,4O 48 11 capital
36 casado superior 3 23,3O 42 02 interior
16
Exemplo 2: Freqüência e percentagem da amostra de 36 empregados da
empresa Milsa segundo o grau de instrução.
TABELA 2
superior I I I I I I 6 16,67
TOTAL 36 100
TABELA 3
17
TABELA 4
CLASSE DE SALÁRIOS FRQÜÊNCIA FREQ. RELATIVA
F FR %
4 I------- 8 10 27,78
8 I------- 12 12 33,33
12 I------- 16 8 22.22
16 I------- 20 5 13,89
20 I------- 24 1 2,78
TOTAL 36 100
TABELA 5
NÚMERO DE FILHOS FREQÜÊNCIA FREQ. RELATIVA
Xi F FR %
0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
TOTAL 20 100
18
5.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS
QUANTITATIVAS
19
6.0 APRESENTAÇÃO GRÁFICA
Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a
partir de pontos eqüidistantes na reta, traça-se perpendiculares cujos
comprimentos sejam proporcionais às freqüências.
freqüências
12
10
0
4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24
Salários
20
6.2 DIAGRAMA DE BARRAS
A mesma distribuição acima poderia ser representada por meio de diagrama que
levasse em conta a magnitude da área da figura geométrica, já que a vista
repousa melhor sobre uma superfície do que sobre uma linha.
freqüências
12
10
0
4 I-------8 8 I-------12 12 I-------16 16 I------- 20 20 I-------24
Salários
21
6.3 DIAGRAMA DE CÍRCULOS
(3,1416) pelo quadrado do raio (r), isto é, C= π.r ² , e desde que as áreas dos
diversos círculos devem ser proporcionais às magnitudes das freqüências, isto é, C
portanto, os raios dos círculos devem ser proporcionais a raiz quadrada das
freqüências das modalidades da variável.
Assim se quisermos representar graficamente a distribuição da tabela 1.4, os raios
do círculo deverão ser:
13,89 33,33
22,22 27,78
2,7 % %
% % %
22
6.4 DIAGRAMA DE SETORES CIRCULARES
Outra opção seria através de setores circulares, na qual se divide a área total de um
círculo em subáreas (setores) proporcionais as freqüências.
Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r)
pelo tamanho do arco (a), isto é, S = r.a, e com S deve ser proporcional a freqüência
f, tem-se S= α.f , onde α é o fator de proporcionalidade; então:
α .f = r. a
a = α.f
r
Se chamarmos α de α`, tem-se S = α`. f , isto é, os arcos e os respectivos
r
ângulos centrais de um círculo é igual a 360°, e sendo F a freqüência total, tem-se
360° = α`. F
F F
23
Diagrama de Setores Circular
120°
50°
10°
100° 80°
.
33%
22%
28% 14%
3%
24
6.5 DIAGRAMA LINEAR
No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de
barras e em seguida unir esses pontos por semi-retas contituindo-se desta forma o
diagrama linear.
freqüências
12 x
10 x
x
8
0
4 I-------8 8 I-------12 2 12 I-------16 16 I-------20 20 I-------24
salários
25
6.6 O PICTOGRAMA
1920
1930
1940
1950
1960
1970
1980
1990
26
7.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
A análise estatística de dados relativos a uma amostra de uma população, requer uma
aglutinação organizada de informações, conforme regras cuja prática demonstrou serem
eficientes.
Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma
amostra de 100 pacotes extraídos parcialmente de um processo automático de
empacotamento.
A especificação de fabricação é 215 ±15 gramas (200 a 230 gramas)
TABELA 6
AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO
1 207 21 220 41 210 61 210 81 217
2 213 22 204 42 214 62 220 82 211
3 210 23 213 43 219 63 213 83 213
4 215 24 211 44 215 64 217 84 218
5 201 25 214 45 217 65 214 85 213
6 210 26 217 46 213 66 219 86 216
7 212 27 224 47 218 67 214 87 218
8 204 28 211 48 214 68 215 88 216
9 209 29 220 49 215 69 223 89 206
10 212 30 209 50 212 70 217 90 212
11 215 31 214 51 221 71 213 91 207
12 216 32 208 52 211 72 218 92 213
13 221 33 217 53 218 73 207 93 215
14 219 34 214 54 205 74 210 94 212
15 222 35 209 55 220 75 208 95 223
16 225 36 212 56 203 76 214 96 210
17 215 37 208 57 216 77 211 97 226
18 218 38 215 58 222 78 205 98 224
19 213 39 211 59 206 79 215 99 214
20 216 40 216 60 221 80 207 100 215
O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos:
27
Amplitude total (R.T.): é a diferença entre a medida máxima e a medida mínima. No
caso da amostra de pacotes de manteiga acima, temos:
R.T. = 226 – 201 = 25 gramas
Número de classes (d) : é o número de divisões que estipulamos para a Amplitude Total.
Normalmente pode-se usar d =̃ √ n onde n= número de itens na amostra para o
exercício temos d =̃ √ 100 → 10 classes, porem deve-se utilizar sempre que possível
número impar de classes no caso 9 classes.
As classes devem ser mutuamente exclusivas, para que não haja duvida na localização
dos valores das variáveis, podemos dai utilizar as seguintes simbologias para os
intervalos:
0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os
valores da variável maiores do que 0 (excluído) e até 10 (inclusive);
0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (exclusive);
0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do
que 0 e menores do que 10.
28
0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da
variável a partir de 0 (inclusive) e até 10 (inclusive).
TABELA 7
∑ 100 100%
29
Onde:
30
7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS
freqüências
28
POLIGONO DE
FREQÜÊNCIAS
21
14
1 2 3 4 5 6 7 8 9 CLASSES
31
7.2 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS RELATIVAS
%
28%
POLIGONO DE
FREQÜÊNCIA
RELATIVA
21%
14%
7%
0
1 2 3 4 5 6 7 8 9 CLASSES
32
7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA
F.AC.
100
POLIGONO DE
FREQÜÊNCIAS
ACUMULADA
80
60
40
20
01 2 3 4 5 6 7 8 9 CLASSES
33
7.4 POLIGONO DA FREQÜÊNCIA ACUMULADA RELATIVA
% F.AC
REL.
100 %
POLIGONO DE
FREQÜÊNCIAS
ACUMULADA
RELATIVA
80 %
60 %
40 %
20 %
0 %1 2 3 4 5 6 7 8 9 CLASSES
34
8.0 TIPOS DE DISTRIBUIÇÃO
A) Normal
B) Alongada
35
C) Achatada
A) Assimétrica Positiva
36
B) Assimétrica Negativa
mo
37
C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas.
mo mo
mo mo mo
38
61 52 64 84 35 57 58 95 82 64
50 53 103 40 62 77 78 66 60 41
58 92 51 64 71 75 89 37 54 67
59 79 80 73 49 71 97 62 68 53
43 80 75 70 45 91 50 64 56 86
SOLUÇÃO:
F F.A.
3 5 7 2 2
4 0 1 3 5 9 5 7
5 0 0 1 2 3 3 4 6 7 8 8 9 12 19
6 0 1 2 2 4 4 4 4 6 7 8 11 30
7 0 1 1 3 5 5 7 8 9 9 39
8 0 0 2 4 6 9 6 45
9 1 2 5 7 4 49
10 3 1 50
39
9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL
Como o próprio nome indica, a medida de tendência central visa a determinar o centro da
distribuição. Esta determinação, porem, não é bem definida daí parece razoável
chamarmos de “tendência central”.
MEDIANA;
MODA.
= Σx
n
n
Sendo: Σx
i= 1
= 8 + 3 + 5 + 12 + 10 = 38 = 7,6
5 5
40
9.2 MÉDIA ARITMÉTICA PONDERADA
K
Σ xi .fi
i= 1
=
K
Σx fi
i= 1
Números x = 5, 8, 6, 2
Freqüências f = 3, 4, 2, 1
2 2
41
Ou ainda A posição DA MEDIANA é definida por { n+1 } -ésimo elemento quando ”n”
é 2
é í̃mpar temos um número inteiro e dá a posiçã́o da mediana;
50°
valor
FA 0 2 8 18 36 64 82 92 98 100
X 200 203 206 209 212 215 218 221 224 227
50°
36 64
212 215
42
Δ= 14 x 3 = 1,5
28
portanto a mediana será 212 + Δ logo, X = 212 + 1,5 = 213,5
9.4 MODA ( x̂ )
Em um conjunto de números a moda é o valor que ocorre com maior freqüência, isto é, o
valor mais comum.
Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8
2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
43
10.0 MEDIDAS DE VARIABILIDADE (DISPERSÃO)
xx x x x x xxx xxx xx x x
a) pequena dispersão
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx
b) grande dispersão
1- Utiliza apenas uma parcela das informações contidas nas observações. O seu
valor não se modifica mesmo que os valores das observações variem, desde que
conservem os seus valores Máximo e mínimo.
X min. I I X max.
R.T. = Grande
45
Onde: Xi = Medidas individuais
S= Σ ( Xi - )²
n n = Número de elementos ou
valores
σ= Σ ( Xi - )²
n-1
+σ
46
10.2.4 SISTEMATIZAÇÃO PARA O CÁLCULO
observações Xi Xi - (Xi - )²
medidas
1 X1 X1 - (X1 - )²
2 X2 X2 - (X2 - )²
3 X3 X3 - (X3 - )²
. . . .
. . . .
. . . .
n Xn Xn - ( Xn - )²
Σ (Xi- )²
3-Aplicam-se as fórmulas:
S= Σ ( Xi - )²
n
σ= Σ ( Xi - )²
n-1
47
10.3 VARIÂNCIA
Σ ( Xi - )²
S²= i=1
Σ ( Xi - )²
σ²= i=1 onde n – 1 = número de graus de liberdade
n-1
48
11.0 DISTRIBUIÇÃO NORMAL
(ou de GAUSS, ou de LAPLACE, ou ainda, dos ERROS DAS OBSERVAÇÕES)
F (x)
x- 3σ x- 2σ x- 1σ x +1σ x+ 2σ x+ 3σ
µ → Média da População
Determinam o formato da curva
σ → Desvio padrão da população
49
- a variável x obedecerá a uma Distribuição Normal, se a probabilidade de que um valor
x seja menor ou igual a outro xo for:
- ( x - µ )²
x0 2 σ²
P( x < x0 ) = f(x0) = 1 e dx
σ√ 2π -∞
F (x)
-∞ + ∞
X0
Portanto:
os valores - ∞ e xo” .
50
b- O desvio Padrão σ, é a distância entre a média e o ponto de inflexão da curva.
c- A área total sob a curva normal é igual a 1, pela própria equação da probabilidade.
Z= X - µ
σ
o que significa adotar como origem dos z o ponto em que x = µ e como unidade de
escalados z e o desvio padrão σ, teremos transformado a expressão da função das
probabilidades na distribuição normal reduzida:
- z²
2
f(z)= 1 e
σ√ 2π
dz = 1
dx σ
dx = σ. dz
51
- z²
z 2
f(z)= 1 e dz
σ√ 2π -∞
As áreas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em
função dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tábua das áreas
para os valores I(z), na tábua 1.
Por exemplo, a área desde Z=0, até Z= 1,0 é I(1,0) = 0,3413 ou 34,13% da área total da
curva; conseqüentemente, dentro do intervalo ± 1 σ temos 68,26% da área total da curva.
52
F (x)
x- 3σ x- 2σ x- 1σ x +1σ x+ 2σ x+ 3σ
-3 -2 -1 0 1 2 3 Z
Transformação de X em Z
Zo
Xo Z= X - µ
σ
µ µ-µ 0
σ
µ + 1σ µ + 1σ- µ 1
σ
µ + 2σ µ + 2σ- µ 2
σ
µ + 3σ µ + 3σ- µ 3
σ
µ - 1σ µ -σ- µ -1
σ
µ - 2σ µ - 2σ - µ -2
σ
µ - 3σ µ - 3σ - µ -3
σ
53
I Zo
0 Zo
54
EXERCÍCIOS: E-3
1- Trace uma curva normal e sombreie a área desejada a partir das informações:
a- P ( x ≤ 60)
b- P ( 35 ≤ x ≤ 62)
c- P ( 55 ≤ x ≤ 65)
d- P ( x > 55)
e- P ( 35 ≤ x ≤ 45)
4- Suponha uma renda média de uma grande comunidade possa ser razoavelmente
aproximada por uma distribuição normal com media anual de R$ 10.000,00 e
desvio padrão de R$ 2.000,00.
Porém existem apenas dois eventos possíveis: sair “cara” ou “coroa” Nesse exemplo
existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou 50%.
P= ½ e Q=½
Sendo P+Q = 1
Então P= (1 - Q) e Q = (1 - P)
ESPAÇO AMOSTRAL
57
12.2 TRÊS ORIGENS DA PROBABILIDADE
OBJETIVO SUBJETIVO
O Método Clássico
P(cada resultado) = 1
Número de resultados possíveis
58
P(A) = Número de resultados associados ao evento A
Número total de resultados possíveis
Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é
Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos
os eventos.
59
1° moeda 2°moeda
½ x ½ =¼ ou 25%
= 13 + 4 - 1 = 16
52 52 52 52
60
NAIPE
♣ J ♦ J ♥ J ♠ J
♣ 10 ♦ 10 ♥ 10 ♠ 10
♣ 9 ♦ 9 ♥ 9 ♠ 9 a carta é um dez
♣ 8 ♦ 8 ♥ 8 ♠ 8
♣ 7 ♦ 7 ♥ 7 ♠ 7
♣ 6 ♦ 6 ♥ 6 ♠ 6
♣ 5 ♦ 5 ♥ 5 ♠ 5
♣ 4 ♦ 4 ♥ 4 ♠ 4
♣ 3 ♦ 3 ♥ 3 ♠ 3
♣ 2 ♦ 2 ♥ 2 ♠ 2
♣ A ♦ A ♥ A ♠ A
Carta de paus
Os eventos “paus” e “dez” se interceptam.
Regra de probabilidade
61
EXERCÍCIOS: E-4
62
13.0 TECNICAS DE CONTAGEM
Uma das possibilidades é o uso das árvores de decisão, mas quando o numero de
resultados é grande, essa lista se torna muito trabalhosa; é necessário então recorrer a
formulas matemáticas para determinar o numero total de resultados possíveis.
Em segundo lugar devemos explorar suas diversas versões. Imaginemos que o teste
consista de apenas:
Conclue-se:
Numero de questões : 1 2 3 4
Numero de resultados : 2 4 8 16
Nota-se que se, o numero de itens for grande, a listagem se tornara praticamente
impossível.
63
QUESTÃO N°1 N°2 N°3 RESULTADOS
V V VVV
V F VVF
F V VFV
. F VFF
V V FVV
F F FVF
F V FFV
F FFF
O diagrama mostra que cada questão dobra o numero total de resultados possíveis.(com
duas alternativas V ou F) temos:
NUMERO DE QUESTOES TOTAL DE RESULTADOS
1 2=2
2 2 x 2 =4
3 2x2x2=8
4 2 x 2 x 2 x 2 = 16
64
2x2x2x2x2x.......x2 = 220 = 1.048.576 ou 1 .
1 2 3 4 5 . . . . . . . . . . 20 1.048.576
De um modo geral, se ha “n” decisões seqüenciais, cada uma com “m” escolhas, o
numero total de resultados é m n.
Outros exemplos:
5! = 5 x 4 x 3 x 2 x 1 = 120
12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600
5! = 5x4x3x2x1 = 5! 1 = 1
7! 7x6x5x4x3x2x1 7 x 6 x 5! 7x6 42
4! = 4 x 3 x 2 x 1 = 4 x 3 x 2! = 4 x 3 = 12
2! 2x1 2!
5! = 5 x 4 x 3! = 5 x 4 = 20 = 10
2! 3! 2 x 1 x 3! 2x1 2
65
( 5 - 3 )! = 2! e não ( 5! - 3! )
( 9 - 2 )! = 7!
( 3 + 1)! = 4!
8! = 8! = 8 x 7 x 6 x 5! = 8 x 7 x 6 = 56
3 ( 8 – 3 )! 3! . 5! 3 x 2 x 5! 3x2
ARRANJOS
São agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se
consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos
“eneários” que se podem formar com esses n elementos, dispomos de todas as formas
possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos
elementos.
Assim, os arranjos possíveis com as letras A, B e C são A 3,2 (3 elementos dois a dois)
A 3,2 = AB; BA; AC; CA, BC; CB.
Outro exemplo: Se ha sete cavalos num páreo, quantos arranjos ha considerando 1°,2° e
3° lugares?
A n,x = n!
( n – x )!
PERMUTAÇÃO
66
Denomina-se permutação aos arranjos de objetos tomados n a n. Neste caso cada
objeto entra só uma vez em todos os grupos.
Solução
Ha 8 letras : 4Rs 3Us 1N dai:
4, 3, 1
P8 = 8! = 280
(4!) (3!) (1!)
COMBINAÇÃO
C n,x = n! n
x! (n - x )! x
67
Quantos comitês distintos, de 3 pessoas cada um, podemos formar com um grupo de 10
pessoas?
de 4 mulheres e 6 homens.
Mulheres Homens = 4! 6! = 4 x 15 = 60
( C 4,1 ) ( 6,2 ) 3! 1! 4! 2!
A n,x = n!
( n – x )!
C n,x = n! n
x! (n - x )! x
68
EXERCÍCIOS: E-5
1- Calcule:
a- 2! b- 3! c- 10! d- 1! e- 0!
2- Calcule:
a- 3 b- 4 c- 5 d- 9
2 4 1 6
69
14.0 DISTRIBUIÇÃO DE PROBABILIDADES
CK 1
KC 1
KK 2
1 . 1 1
CC = 0 0,25
2 2 4
1 . 1 1
CK = 1 0,25
2 2 4
0,50
1 . 1 1
KC = 1 0,25
2 2 4
1 . 1 1
KK = 2 0,25
2 2 4
70
Assim, pois, a distribuição de probabilidades para o numero de caras em duas jogadas
de uma moeda são:
0 0,25
1 0,50
2 0,25
1,00
0 0,25
1 0,75
2 1,00
71
Graficamente, as distribuições de probabilidade e acumulada se apresentam:
P
1,00 R 1,00
O 1,OO
B
A
P B
R 0,75 I 0,75
O L 0,75
B I
A D
B A
I 0,5 D 0,5
L 0,5 E
I
D A
A C
D 0,25 U 0,25
E 0,25 0,25 M 0,25
U
L
A
0 D 0
0 1 2 A 0 1 2
NUMERO DE CARAS NUMERO DE CARAS
72
POSSIBILIDADE MOEDA N° EVENTO VALOR DE X
N° 1, 2, 3, 4 ( N° DE VEZ QUE SAI CARA)
1 CCCC 0K e 4C 0
2a CCCK 1K e 3C 1
2b CCKC
2c CKCC
2d KCCC
3a CCKK 2K e 2C 2
3b CKKC
3c KKCC
3d CKCK
3e KCKC
3f KCCK
4a KKKC 3K e 1C 3
4b KKCK
4c KCKK
4d CKKK
5 KKKK 4K e 0C 4
73
X EVENTO P(X = x)
0 4 0 4
0 0K e 4C O,0625 = 1 X 0,5 X 0,5 = 1p q
1 3 1 3
1 1K e 3C O,2500 = 4 X 0,5 X 0,5 = 4p q
2 2 2 2
2 2K e 2C O,3750 = 6 X 0,5 X 0,5 = 6p q
3 1 3 1
3 3K e 1C O,0625 = 4 X 0,5 X 0,5 = 1p q
4 0 4 0
4 4K e 0C O,0625 = 1 X 0,5 X 0,5 = 1p q
TOTAL 1,00
n = numero de moedas
p = probabilidade de K = P(K) = 0,5
q = 1 – p = probabilidade de C = P(C) = 0,5
Generalizando temos;
x n-x
P(x) = n! p . q
x! (n – x)!
74
Distribuição binomial de x (numero de coroas) para n = 10
10 p(10) = 10!
10! (10 – 10)! 1 1/1024 = 0,000976
9 p(9) = 10!
9! (10 – 9) ! 10 1/1024 = 0,009760
8 p(8) = 10!
8! (10 – 8) ! 45 1/1024 = 0,043940
7 p(7) = 10!
7! (10 – 7) ! 120 1/1024 = 0,117180
6 p(6) = 10!
6! (10 – 6) ! 210 1/1024 = 0,205070
5 p(5) = 10!
5! (10 – 5) ! 252 1/1024 = 0,246090
4 p(4) = 10!
4! (10 – 4) ! 210 1/1024 = 0,205070
3 p(3) = 10!
3! (10 – 3) ! 120 1/1024 = 0,117180
2 p(2) = 10!
2! (10 – 2) ! 45 1/1024 = 0,043940
1 p(1) = 10!
1! (10 – 1) ! 10 1/1024 = 0,009760
0 p(0) = 10!
0! (10 – 0) ! 1 1/1024 = 0,000976
10
TOTAL = 2 = 1024
75
EXERCICIOS: E-6
3- Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao
embarque. O avião comporta 15 passageiros.
a- determine a probabilidade de que todos os 15 que reservaram lugar
compareçam ao embarque
b- Se houve 16 pedidos de reserva, determine a probabilidade de uma pessoa
ficar de fora.
4- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são
devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos
primeiros 25 dias apos a venda. De 11 carros vendidos num período de 5 dias, qual
é a probabilidade de que:
a- Todos voltem dentro de 25 dias para reparo.
b- Só um não volte
76
14.2 DISTRIBUIÇÃO DE POISSON
n = Elementos da População
p = Probabilidade
x - n.p
f (x) = (n.p) . e para x = 1, 2, 3, .......
x!
e= 2,718
Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam
defeitos de encadernação. Utilize a aproximação de Poisson da distribuição Binomial para
achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam
algum defeito de encadernação.
77
temos então:
x - n.p 5 -8
0 -1,2
1 -1,2
78
EXERCICIOS: E-7
3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente
de carro em um ano. Com o auxilio da aproximação de Poisson para a distribuição
Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos
aleatoriamente nessa cidade.
79
15.0 CORRELAÇÃO
15.1 INTRODUÇÃO
Até agora nossa preocupação era descrever a distribuição de valores de uma única
variável. Com esse objetivo, aprendemos a calcular medidas de tendência central e
variabilidade.
Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso
do cigarro e incidência do câncer, a potencia gasta e a temperatura da água no
chuveiro,
Procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares
e qual o grau dessa relação.
80
Atribuindo-se, então, um valor qualquer de L, é possível determinar exatamente o valor
do perímetro.
Quando duas variáveis estão ligadas por uma Relação Estatística, dizemos que existe
uma correlação entre elas.
Consideremos uma amostra aleatória, formada por 98 alunos de uma classe da Uniso e
pelas notas obtidas por eles em Matemática e Estatística:
NOTAS
Nº MATEMATICA ESTATISTICA
(xi) (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
81
Representando, em um sistema de coordenadas cartesiano ortogonal, os parâmetros
(xi ; yi), obtemos uma nuvem de pontos que denominamos DIAGRAMA DE
DISPERSAO. Esse diagrama nos fornece uma idéia grosseira, porem útil, da correlação
existente:
yi
10 . o
.
o
8 . o o
. o
6 . o o
. o
4 . o
2 . o
. . . . . . . . . .
2 4 6 8 10 xi
Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximará de uma
reta.
Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo,
por isso denominada de Correlação Linear.
82
É possível verificar que cada correlação esta associada como “imagem“ uma relação
funcional. Por esse motivo, as relações funcionais são chamadas Relações Perfeitas.
yi
10 . RETA IMAGEM o
.
o
8 . o o
. o
6 . o o
. o
4 . o
2 . o
. . . . . . . . . .
2 4 6 8 10 xi
Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada
de Correlação Linear Positiva.
o
oo
ooo
oo
ooooo correlação linear positiva
ooo
ooooo
oo
o
oo
X
Y
o
oo
ooo
oo
ooooo correlação linear negativa
ooo
ooooo
oo
o
oo
Y X
o
o oo
oo oooo
ooo oo
oo ooo
ooooo o correlação não-linear
ooo oooo
ooooo ooo
oo oo
o oooo
oo ooo
Y X
oo
o o o o
o o o oooo ooo o ooo
oo ooo oooo oooo oooo o não há correlação
o oo ooo ooooo o
o ooo oo o
ooooo
X
84
15.5 COEFICIENTE DE CORRELAÇÃO LINEAR
r= n Σ xi yi – (Σxi ) (Σyi)
Onde:
n = número de observações
Os valores limites de r são -1 e +1, isto é, o valor de r pertence ao intervalo [ -1 e +1].
Assim:
NOTAS
- Para que uma relação possa ser descrita por meio do Coeficiente de
Correlação de Person é imprescindível que ela se aproxime de uma função
Linear. Uma maneira pratica de verificarmos a linearidade da relação é a
inspeção do Diagrama de Dispersão: se a elipse apresenta saliências ou
reentrâncias muito acentuadas, provavelmente trata-se de uma relação
curvilínea.
- Para podermos tirar algumas conclusões significativas sobre o comportamento
simultâneo das variáveis analisadas, é necessário que:
0,6 ≤ | r | ≤ 1
Se 0,3 ≤ | r | < 0,6, há uma correlação relativamente fraca entre as variáveis.
85
Se 0 < | r | < 0,3, a correlação é muito fraca e, praticamente, nada podemos
concluir sobre a relação entre as variáveis em estudo.
-81-
Em seguida vamos calcular o coeficiente de correlação relativos ao exercício anterior.
O modo mais pratico para obtermos r é abrir, na tabela, colunas correspondentes aos
valores de xi yi, x²i e y²i. Assim:
MATEMATICA ESTATISTICA
(xi) (yi) xi yi x²i y²i
5,0 6,0 30 25 36
8,0 9,0 72 64 81
7,0 8,0 56 49 64
10,0 10,0 100 100 100
6,0 5,0 30 36 25
7,0 7,0 49 49 49
9,0 8,0 72 81 64
3,0 4,0 12 09 16
8,0 6,0 48 64 36
2,0 2,0 04 04 04
Logo:
Dai: r = 0,91 Resultado que indica uma correlação linear positiva altamente significativa
entre as duas variáveis.
86
15.6 CUDADOS COM OS ERROS COM A INTERPLETAÇÃO DE CORRELAÇÃO
87
EXERCICIOS: E-8
xi 4 6 8 10 12
yi 12 10 8 12 14
Temos:
4,0 12,0
……. …….
……. ……
..….. ……
12,0 14,0
Σ= Σ= Σ= Σ= Σ=
Logo:
ONDE: r =
88
2- Padronize cada conjunto de escores e calcule o coeficiente de correlação.
A-
Σ= Σ= Σ= Σ= Σ=
B-
3,9 46
4,6 46
6,0 52
2,8 50
3,1 48
3,4 40
4,2 42
4,0 44
Σ= Σ= Σ= Σ= Σ=
89
3- Determine o coeficiente de correlação para os dois conjuntos de valores abaixo:
1ª AVALIAÇÃO 2ª AVALIAÇÃO
estudante (xi) (yi) xi yi x²i y²i
1 82 92
2 84 91
3 86 90
4 83 92
5 88 87
6 87 86
7 85 89
8 83 90
9 86 92
10 85 90
11 87 91
Σ= Σ= Σ= Σ= Σ=
4- Com os dados abaixo, sobre crimes violentos e a temperatura média entre 21 e 2 horas
das noites de sábado numa grande comunidade, monte o gráfico para os dados e calcule
o coeficiente de correlação.
90
16.0 REGRESSÃO LINEAR
Podemos dizer que a analise de regressão tem por objetivo descrever, através de um
modelo matemático, a relação entre duas variáveis, partindo de n observações das
mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora
não perfeita, como, por exemplo, as do exercício já apresentado:
MATEMATICA ESTATISTICA
(xi) (yi)
5,0 6,0
8,0 9,0
7,0 8,0
10,0 10,0
6,0 5,0
7,0 7,0
9,0 8,0
3,0 4,0
8,0 6,0
2,0 2,0
91
Cujo Diagrama de Dispersão é dado por:
yi
10 . RETA IMAGEM o
.
o
8 . o o
. o
6 . o o
. o
4 . o
2 . o
. . . . . . . . . .
2 4 6 8 10 xi
Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de
modo a permitir o ajustamento de uma reta, imagem da função definida por:
Y = ax+ b
Vamos então, calcular os valores dos parâmetros a e b com a ajuda das fórmulas:
a = n Σ Xi Yi - Σxi . Σyi
n ΣXi² - (Σxi)²
e
b = Y - a X
92
Onde : n é o número de observações
Onde Y^ é o Y estimado
A tabela de valores:
MATEMÁTICA ESTATÍSTICA
(xi) (yi) xi yi x²i
5,0 6,0 30 25
8,0 9,0 72 64
7,0 8,0 56 49
10,0 10,0 100 100
6,0 5,0 30 36
7,0 7,0 49 49
9,0 8,0 72 81
3,0 4,0 12 09
8,0 6,0 48 64
2,0 2,0 04 04
Temos assim
a = 10 x 473 – 65 x 65 = 4730 - 4225 = 505 = 0,8632
10 x 481 – (65)² 4810 - 4225 585
93
Como:
X = 65 = 6,5 e Y = 56 = 6,5
10 10
Vem:
b = 6,5 – 0,8632 x 6,5 = 6,5 - 5,6108 = 0,8892,
Donde:
a = 0,86 e b = 0,89
Logo:
Ŷ = 0,86 X + 0,89
Assim temos:
yi
10 . o
Y^ = 0,86 X + 0,89
. o
8 . o o
. o
6 . o o
5,19 . o
4 . o
2 . o
.
0,89
. . . . . . . . . .
2 4 6 8 10 xi
94
16.3 ANÁLISE DE REGRESSÃO
95
EXERCICIOS: E-9
a- y = 10 - ½ x
b- y = 8 - 1/3 x
2 13
7 21
9 23
1 14
5 15
12 21
b- Com o auxilio da parte a, estime quantos carros uma pessoa que venha
trabalhando no posto de inspeção ha 8 semanas poderá inspecionar?
96
3- Os dados abaixo se referem ao resíduo de cloro em uma piscina em vários
momentos, após ter sido tratada com produtos químicos:
X Y
Número de Horas Resíduo de cloro
(P.P.M.)
0 2,2
2 1,8
4 1,5
6 1,4
8 1,1
10 1,1
12 0,9
A leitura de zero horas foi feita imediatamente após completado o tratamento químico.
a- Ajuste uma reta de mínimos quadrados que nos permita predizer o resíduo de cloro
em termos do número de horas após a piscina ter sido tratada com produtos
químicos.
97
BIBLIOGRAFIA
BIBLIOGRAFIA BÁSICA
BIBLIOGRAFIA COMPLEMENTAR
98