Você está na página 1de 14

REVISÃO P1 ESTATÍSTICA

1. INTRODUÇÃO

População: conjunto total de medidas

Amostra: subconjunto da população que será isolado para análise

2. TÉCNICAS DE AMOSTRAGEM

Aleatória simples (AAS): Todos os elementos da população têm igual probabilidade de


pertencer à amostra e todas as possíveis amostras têm igual probabilidade de ocorrer. É
aplicada em populações que tem pouca variação em relação a alguma característica.

Como fazer? sorteio, funções randômicas da calculadora, tabela de números aleatórios,


papel numerado e etc.

Sorteio: n SHIFT Ran# (.) =

n = população

* Repete o processo de acordo com as amostras pedidas

Exemplo 1. Os 15 alunos de uma determinada turma participarão do sorteio de 5 livros.


Utilize um sorteio para selecionar 5 nomes, sem reposição, entre os listados a seguir:

1- Gabriela 13- Leandro

2- Jean 14- Sara

3- Maria 15- Laura

4- Adriano

5- Gustavo

6- Alice

7- Bruno

8- Pedro

9- Natália

10- Renan

11- Ana

12- Josi
Amostragem Estratificada (AE): Realizada quando oe elementos não são semelhantes
uns aos outros e são divididos em subpopulações ou estratos homogêneos.

Exemplo 1. Uma sala de Estatística tem as turmas 30A, 30B, 30C e 30D. Cada uma seria
um estrato então para retirar uma amostra dessa sala devemos levar em consideração a
quantidade total de alunos de cada turma, ou seja, o total de medidas em cada
subpopulação.

Para realizar uma amostragem estratificada deve-se especificar quantas amostras de cada
estrato serão retiradas, e aplicar a expressão:

ni = (n) x (Ni / N)

ni: tamanho da amostra no estrato selecionado

Ni: tamanho da população no estrato selecionado

N: tamanho da população

n: tamanho da amostra desejada

Observação 1: Quanto maior o tamanho da população de um estrato (Ni), maior será o


tamanho da sua amostra (ni) - sua proporcionalidade em relação aos demais.

Observação 2: Se um estrato corresponde a tantos % de sua população (ni x Ni), ele


representará a mesma porcentagem em relação a população total (Ni x N)

Observação 3: Se um exemplo de AE fosse realizado em AAS a amostra não representaria


todas as classes

Exemplo 2. Considere que de uma população com 3.000 habitantes, divididos em 5 classes
(A,B,C,D,E), desejamos coletar uma amostra de 150 indivíduos usando AE. A distribuição
dessa população encontra-se na tabela abaixo:

Classes A B C D E

Ni 135 575 1245 735 310

* Descobrir porcentagem representativa

Ni - 100%

ni - x%
Amostragem por conglomerado (AC): Essa amostra consiste em selecionar grupos ou
conglomerados da população com características mais semelhantes possíveis e dentro de
cada conglomerado as características devem ser heterogêneas. Ou seja, uma população total
com conglomerados parecidos e conglomerados com populações diferentes.

Exemplo 1. Selecionar uma amostra de 150 pessoas adultas de um bairro a fim de analisar
o grau de escolaridade. O bairro possui 300 residências e nestas, existe em média 5
moradores adultos por domicílio. A população é heterogênea e, por isso, divide-se o
bairro em quarteirões (conglomerados) de aproximadamente 10 casas cada um e
sortearmos 3 deles por AAS.

População = 300 casas

1 Quarteirão = 10 casas

1 casa = 5 pessoas

Logo existem 30 quarteirões com 1500 moradores no total e em cada quarteirão tem 50
pessoas. Para a amostra de 150 pessoas deve-se sortear po AAS 3 quarteirões numerados de
1 a 10.

População destes quarteirões foram selecionadas para o estudo

n SHIFT Ran# (.) = 1°:

2°:

3°:

Amostragem Sistemática (AS): Nessa amostra a coleta dos elementos da amostra se dá


através de intervalos, elementos em uma certa ordem.

Como? Sortear o primeiro elemento da amostra dentre os K primeiros da população usando


AAS, em que K = N/n. Depois os próximos elementos da amostra são retirados saltando-se
K elementos, até completar o tamanho da amostra

* N é o tamanho da população

* n é o tamanho da amostra

Exemplo 5. Selecionar por meio de uma AS uma amostra de 20 peças de um lote de 500
peças.
3. TABELA DE DISTRIBUIÇÃO DE FREQUENCIA (TDF)

3.1 PARA VARIÁVEIS QUALITATIVAS: Nominais (sexo, cabelo, olhos) e Cordinais


(escolaridade, classe social)

Frequência absoluta (fa): n° de observações ocorridas naquela classe

Frequência relativa (fr): é obtida pela divisão da frequência absoluta pelo número total de
dados

Frequência percentual (fp): é calculada multiplicando-se o valor da frequência relativa


(fr) por 100

Variáveis/ classes fa fr fp

Total 15

3.2 PARA VARIÁVEIS QUANTITATIVAS: Discretas (n° de acidentes e peças) e


Contínuas (temperatura, pressão, etc.)

1- Dividir a tabela em classes

n° de classes: K = raiz quadrada de n (n = tamanho da amostra)

2- Amplitude total (A): Maior valor - menor valor (de cada classe)

3- Amplitude da classe: h = A / K -1

4- Limite inferior (LI): menor variável da classe - h/2

5- Limite superior (LS): Li + h

6- Notação de classes: {25;30} - incluí o 25 até 29,9

7- Frequência acumulada: soma das frequências que estiver pedindo

* frequência acumulada relativa = soma de todas fr

8- Fa, Fr e Fp: Soma das classes gradualmente

9- Viscosidade: intervalo entre valores de cada classe

Variáveis/ classes fa fr fp Fa Fr Fp

Total 15
4. MEDIDAS DE POSIÇÃO E DISPÉRSÃO

4.1 MEDIDAS DE POSIÇÃO: Média, Moda, Mediana e Quantis

1- MÉDIA

u: média da população

x: média da amostra

x = {x1, x2,...,xn} --> x1 + x2 +...+ xn / n

*Se os dados da amostra estiverem em uma TDF podemos encontrar a média da


seguinte forma: x = fi . x (somatório) /n

--> MÉDIA PONDERADA (PESOS= FREQUENCIAS)

fi: frequência absoluta da classe i;

xi: elemento da classe i;

n: soma das frequências

Exemplo 1. Suponha que um engenheiro esteja projetando um conector de náilon para ser
usado em uma aplicação automotiva. Para isso, oito unidades do protótipo são produzidas e
suas forças de remoção são medidas resultando nos seguintes dados (em libras): x1 = 12, 6;
x2 = 12, 9; x3 = 13, 4; x4 = 12, 3; x5 = 13, 6; x6 = 13, 5; x7 = 12, 6; x8 = 13, 1. A média da
amostra é:

Exemplo 2. O número de ovos danificados por dúzia e as frequências obtidas em uma


inspeção feita em 30 embalagens de uma dúzia cada estão representados na Tabela. Calcule
a média ponderada.

Número de ovos quebrados Frequências (fi)

0 13

1 9

2 3

3 3

4 1

5 1
2- MEDIANA (md): Valor central de um conjunto dado

*colocar em ordem crescente

conjunto ímpar: md = n° central

conjunto par: md= n+n/2

Exemplo 1. Considere outro conjunto de dados dado por X = 1, 3, 3, 5, 7, 9, 11, 15 e


calcule a mediana.

Para dados contínuos a mediana é dada por: md = LImd + (0,5 - Fc /f md) x h

Posição de mediana: n+1/2 (n = frequência total)

LImd: Limite inferior da classe mediana;

Fc: Frequência acumulada das classes anteriores à classe mediana. Se a primeira classe for
a classe

mediana,Fc será igual a 0;

fmd: Frequência absoluta da classe mediana;

h: Amplitude da classe mediana (LS - LI)

3- QUANTIS: São intervalos regulares em um conjunto de dados. Os quantis mais


empregados são os quartis, que dividem a amostra em quatro partes iguais:

q(0, 25) = Q1: 1º quartil

q(0, 50) = Q2: 2º quartil = mediana (quantil do meio)

q(0, 75) = Q3: 3º quartil

0 % ------------0,25---------------- 0,50--------------------0,75----------------100%

O boxplot ou diagrama de caixa é uma ferramenta gráfica que permite visualizar a


distribuição e valores discrepantes dos dados

 A haste vertical começa (de baixo para cima) indica o mínimo e, onde a haste
termina indica o máximo
 O retângulo no meio dessa haste possui três linhas horizontais: a linha de baixo que
é o primeiro quartil; A de cima que é o terceiro quartil; A linha interna indica o
segundo quartil ou mediana.

Passos para construção do boxplot:

• Passo 1: Encontre o 1º, 2º e 3º quartil (Q1, Q2 e


Q3).

• Passo 2: Encontre o intervalo interquartil

(I = Q3 − Q1)

• Passo 3: Encontre o intervalo aceitável


(detectando outliers):

LI = Q1 − 1, 5I LS = Q3 + 1, 5I

• Passo 4: Encontre o máximo e mínimo do gráfico:

Mínimo = maior LI máximo = menor LS

• Passo 5: Encontre os outliers - pontos fora no intervalo (maximo, mínimo).

• Passo 6: Desenhe o gráfico

4 – MODA (mo): O valor mais frequente na amostra.

Exemplo 1. No seguinte conjunto de dados X = {0, 8, 11, 0, 1, 1, 3, 5, 9, 7, 1, 7, 5, 5, 1}

A moda para dados agrupados em Tabelas de distribuição de frequências pode ser


encontrada da seguinte forma:
LImo: limite inferior da classe modal;
Passo 1. Encontrar a classe modal (classe com
maior fa) △1: diferença entre as frequências da classe
modal e da imediatamente inferior (de cima);
Passo 2. Encontrar a moda, mo, através da
seguinte expressão: mo = LImo + (△1 /△1 + △2: diferença entre as frequências da classe
△2) × c modal e da imediatamente posterior (de baixo);

c: amplitude da classe modal. (LS – LI)


Exemplo 2. Considere os dados a seguir que apresentam os pesos de peças (em gramas)
usadas em construção civil.

A tabela de distribuição de frequências é dada por

Pesos fa

[59.5980; 68.7372) 6

[68.7372; 77.8763) 3

[77.8763; 87.0155) 5

[87.0155; 96.1547) 4

[96.1547; 105.294) 4

[105.294; 114.433) 6

Total 28

Passo 1. De acordo com a Tabela temos duas classes modais, a primeira e a última, pois
ambas possuem frequência absoluta igual a 6 que é maior entre todas as frequências
absolutas. Assim, nosso conjunto de dados terá duas modas.

Passo 2. Para a primeira classe modal temos: (Faça a mo da sexta classe)

LImo = 59.5980

△1 = 6 − 0 = 6

△2 = 6 − 3 = 3

C = 68.7372 − 59.5980 = 9.1392

mo = 59.5980 + (6/9) × 9.1392  mo = ≃ 65.6908


4.2 MEDIDAS DE DISPERSÃO

1- Variância da amostra: Se x1, x2, ..., xn for uma amostra de n observações, então a
variância da amostra, denotada por s², será:

S² = Somatório xi² − (Somatório xi) ² /n

n–1

Exemplo 1. Podemos calcular as variâncias dos conjuntos A e B apresentados

GRUPO A: {3, 4, 5, 6, 7}

GRUPO B: {1, 3, 5, 7, 9}

S²a = 3² + 4² + 5² + 6² + 7² - (25)² /5  135 – 125 = 2,5

4 4

S²b= 1² + 3² + 5² + 7² + 9² - 125  10

 Para dados contínuos organizados em uma TDF a variância amostral é definida por:

S² = Fi x Xi² - (Fi x Xi) ² /n

n -1

 Fi é a frequência absoluta da classe i;

 Xi é o ponto médio da classe i

Exemplo 2. Considere os dados que apresentam a distribuição de frequências dos pesos de


peças usadas na construção civil. A tabela de distribuição de frequências é dada por:

S² = 221366.1 − 2445.57²/28 / 28 − 1 ≃ 287.62


2- Variância da População: σ² = Somatório (xi − µ) ²

3- Desvio Padrão: É a raiz quadrada da variância da amostra s². Da mesma forma, o desvio
padrão da população, σ, é a raiz quadrada da variância da população σ².

√ σ² e √ s²

 Quanto menor o desvio padrão, mais homogênea é a amostra

 Desvio padrão é sempre positivo ou nulo

 Se os dados são adicionados ou subtraídos de uma constante, o novo desvio padrão


não se altera

 Quando os dados são multiplicados ou divididos por uma constante, o novo desvio
padrão fica multiplicado ou dividido pela constante

4- Amplitude de um conjunto: Maior termo – Menor termo

Exemplo 1. No conjunto de dados X = {8, 12, 23, 1, 4, 11, 9, 7, 3, 10} a amplitude é:

5- Coeficiente de variação: usado para analisar a dispersão quando dois ou mais


conjuntos de valores apresentam unidades de medidas diferentes ou, se mesmo
apresentando medidas iguais, ainda possuírem médias diferentes

CV = (s/x) × 100%

 s é o desvio padrão amostral e x é a média amostral.

 Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os


dados, ou seja, menor será a dispersão em torno da média.

Exemplo 1. Em um grupo de moradores de determinada região foram analisadas a idade


(em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão dos dois
conjuntos de dados, a fim de verificar qual deles é mais homogêneo. Na coleta dos dados
verificou-se que:

Idade das pessoas: x¯ = 41.6 s = 0.82

Altura das pessoas: x¯ = 1.67 s = 0.2

Qual conjunto de dados apresenta menor dispersão relativa em torno da média? (Duas
variáveis)
5. PROBABILIDADE

Na realização de um determinado experimento, o conjunto de possíveis resultados chama


espaço amostral (Ω)

Espaço amostral discreto: consiste em um conjunto finito ou infinito contável de resultados


 Ω = {baixo, médio, alto}

 Neste caso a probabilidade de um evento E, denotada por P(E), é igual à


soma das probabilidades dos resultados em E.

Exemplo 1. Um experimento aleatório pode resultar em um dos resultados {a, b, c, d} com


probabilidades
0.1; 0.3; 0.5 e 0.1, respectivamente. Seja A o evento {a, b} então,
P (A) = 0.1 + 0.3 = 0.4

Espaço amostral contínuo: se ele contém um intervalo (tanto finito como infinito) de
números reais  Ω = {x|1, 5 < x < 5}

Um evento, E, é qualquer subconjunto do espaço amostral de um experimento aleatório (x)

Ou n nCR x

N = número total de eventos (quantidade de itens)

X = número de vezes que o evento ocorreu (lançamentos/ ocorrências)

Exemplo 2. Qual a probabilidade de sair 3 caras no lançamento de 4 moedas?

Exemplo 3. Considerando uma moeda honesta em que a probabilidade de ser cara é 0,5.
Calcule a probabilidade de sair 30 caras no lançamento de 100 moedas.

Exemplo 4. Um fabricante de peças de automóveis garante que uma caixa tem, no mínimo,
2 defeituosos. Se a caixa contém 12 peças e a experiencia tem mostrado que esse processo
de fabricação produz 5% de peças defeituosas, qual a probabilidade de que uma caixa
satisfaça a garantia do fabricante?

5. DISTRIBUIÇÃO BINOMIAL

6. DISTRIBUIÇÃO DE POISSON

X = N° de eventos no intervalo

µ = E[x] = média por tempo (λ)

Variância:

São exemplos da distribuição de Poisson:


a) Número de formigueiros por unidade de área em uma região;
b) Número de bactérias por unidade de área em uma lâmina;
c) Chamadas telefônicas por unidade de tempo;
d) Defeitos por unidade de área;
e) Acidentes por unidade de tempo.

Exemplo 1. Mensagens chegam a um servidor de computador de acordo com a distribuição


de Poisson com uma taxa média de 12 por hora. Calcule a probabilidade de 3 mensagens
chegarem em 5 minutos.

Exemplo 2. Seja x a variável aleatória que conta o número de falhas de um comprimento


de fio e segue distribuição Poisson com uma média de 2,3 falhas por milímetro. Qual a
probabilidade de encontrar:
a) 2 falhas em 1 milímetro de fio?

b) 10 falhas em 5 milímetros de fio?

Exemplo 3. Inclusões são defeitos em um metal causados por contaminantes. O número de


contaminantes segue distribuição Poisson com um a média de 25 por m³. Qual a
probabilidade de encontrar nenhum contaminante em 1m³?

7. DISTRIBUIÇÃO CONTÍNUAS / NORMAL

 Cálculo de probabilidade

X = Variável pedida

Z = Probabilidade

Média e variância

 Achar valor na Tabela Z


 1 – Valor na tabela Z = Probabilidade

Ou...

Exemplo 1. Suponha que as medidas de corrente em um pedaço de fio sigam a distribuição


normal, com média
μ = 10 miliamperes e variância σ2 = 4 (miliamperes)². Qual é a probabilidade de a medida
ser maior que 13
miliamperes?

Exemplo 2. O tempo de recarga, sob condições normais, de uma bateria de um laptop é


distribuído normal-
mente, com uma média de 260 minutos e um desvio padrão de 50 minutos.
Qual é a probabilidade de a bateria durar mais de quatro horas (240 minutos)?
Exemplo 3. A vida de um semicondutor a laser, a uma potência constante, é normalmente
distribuída, com
uma média de 7000 horas e desvio padrão de 600 horas. Qual a probabilidade de o laser
falhar antes de 6.000
horas?

Exemplo 4. Suponha que X tenha uma distribuição contínua uniforme no intervalo [1,5;
5,5].
a. Determine a média, a variância e o desvio padrão de X.
Temos a = 1, 5 e b = 5, 5

b. Calcule P (X < 2, 5)

Você também pode gostar