0% acharam este documento útil (0 voto)
38 visualizações35 páginas

Conceitos Fundamentais de Estatística

O documento aborda conceitos fundamentais de estatística, incluindo estatística descritiva e inferencial, além de discutir a importância de amostras e cuidados ao interpretá-las. Ele também explora variáveis discretas e contínuas, medidas de tendência central como média, mediana e moda, e medidas de dispersão como variância e desvio-padrão. Por fim, apresenta a distribuição binomial e suas aplicações em probabilidade.

Enviado por

engmecjonas20
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
38 visualizações35 páginas

Conceitos Fundamentais de Estatística

O documento aborda conceitos fundamentais de estatística, incluindo estatística descritiva e inferencial, além de discutir a importância de amostras e cuidados ao interpretá-las. Ele também explora variáveis discretas e contínuas, medidas de tendência central como média, mediana e moda, e medidas de dispersão como variância e desvio-padrão. Por fim, apresenta a distribuição binomial e suas aplicações em probabilidade.

Enviado por

engmecjonas20
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Aula 2

Conceitos de Estatística

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Frases sobre Estatística


“Sem dados você é apenas mais uma pessoa com uma opinião.”
William Deming

“A pessoa que tem um pé no forno, e a cabeça no freezer, tem excelente temperatura média.”
atribuído a Delfim Neto

“A Estatística é como o biquini, mostra muito, mas esconde o essencial.”


atribuído a Mário Henrique Simonsen

“Estatística é a arte de torturar os números até que eles confessem o que queremos.”
anônimo

“Alguns usam a Estatística como os bêbados usam os postes de iluminação: mais como apoio do que para
iluminar.”
Andrew Lang, escritor escocês

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Cuidados com amostras


Pesquisas eleitorais não valem nada...não conheço ninguém que tenha sido pesquisado...

Você precisa tirar todo seu


sangue para avaliar seu
colesterol, triglicerídeos,
Porém, cuidado com as amostras.... leucócitos?

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Desdobramento da Estatística
Estatística Descritiva

A estatística descritiva é um ramo da estatística que aplica várias técnicas para descrever e sumarizar um
conjunto de dados. Diferencia-se da estatística inferencial, ou estatística indutiva, pelo objetivo: organizar,
sumarizar dados.

Estatística Inferencial

Na estatística inferencial estamos sempre interessados em utilizar as informações de uma amostra para
chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Nesse sentido, uma ferramenta muito
utilizada na estatística inferencial é a probabilidade.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Dados e Informação
Dados

Dado é qualquer registro (físico ou mental) que pode ser associado a um objeto, pessoa ou evento.

Informação

O resultado do processamento de dados são as informações. As informações tem significado, podem ser
tomadas decisões ou fazer afirmações considerando as informações.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Variáveis discretas e contínuas


Variável Discreta:

Uma variável aleatória é discreta se o número de resultados possíveis é finito ou pode ser contado.
Variáveis aleatórias discretas são determinadas por uma contagem.

Idades dos alunos em uma turma; quantidade de filhos homens em uma família com 4 filhos; número de
vezes que vai ao escritório em uma semana.

Variável Contínua:

Uma variável aleatória é contínua se pode assumir qualquer valor dentro de determinado intervalo. O número
de resultados possíveis não pode ser listado.

Tempo que a pessoa leva de casa ao escritório; peso dos alunos de uma determinada turma; temperatura
corporal ao longo de um período.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Moda, média e mediana em uma distribuição discreta


Considere a distribuição discreta representada na tabela a seguir, onde a variável é x, e a frequência com
que esta variável aparece na distribuição é f.

x f ∑ 𝑥! . 𝑓! 3.4 + 4.8 + 5.9 + 6.12 + 7.8 + 8.2


3 4 𝑀é𝑑𝑖𝑎 = = = 5,4186
𝑛 43
4 8
5 9
A Moda é o valor mais frequente da distribuição. Logo, a Moda é 6.
6 12
7 8
8 2
Total 43

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Moda, média e mediana em uma distribuição discreta


A mediana é o valor central da distribuição, portanto teremos que ver a frequência acumulada:

x f facumulada
Como há um valor ímpar de variáveis, o valor central é dado por
3 4 4 (n+1)/2;
4 8 12 No caso, o valor central é (43 + 1)/2 = 22.
O valor central é o 22º, portanto a Mediana é 6.
5 9 21
6 12 33 22º Se o número de variáveis for par, haverá dois valores centrais,
7 8 41 n/2 e n/2 + 1; neste caso a Mediana será a média entre os dois
valores centrais.
8 2 43
Total 43

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Medidas de Dispersão em uma distribuição discreta


Uma turma de alunos (A), tem as seguintes notas: 3, 4, 5, 6, 7. Portanto, a média é (3+4+5+6+7)/5=5
Outra turma (B) tem as seguintes notas: 1, 3, 5, 7, 9. Logo a média será (1+3+5+7+9)/5=5

As médias são iguais, porém percebe-se que na turma B há maior DISPERSÃO de notas.

Uma medida de dispersão é a AMPLITUDE, que é diferença entre os valores extremos:


Amplitude (A) = 7 – 3 = 4
Amplitude (B) = 9 – 1 = 8

Em Estatística, o mais usado é a Variância e o Desvio-padrão:


" " " " "
(# $#) &(#"$#) &(##$#) & ⋯&(#$ $#) ∑$
! (#% $#)
Variância = s2 = ! = (para amostras)
($) ($)

E o desvio-padrão s = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎

+ ∑$
! (#% $,)
"
Para população: Variância = 𝜎 =
-

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Medidas de Dispersão em uma distribuição discreta


No exemplo dado:
Um grupo de alunos (A), tem as seguintes notas: 3, 4, 5, 6, 7. Portanto, a média é (3+4+5+6+7)/5=5
Outro grupo (B) tem as seguintes notas: 1, 3, 5, 7, 9. Logo a média será (1+3+5+7+9)/5=5

Em A:
(.$/)"& (0$/)"&(/$/)"&(1$/)"&(2$/)" 0&)&3&)&0
Variância = s2 = /$)
= 0
= 2,5

E o desvio-padrão s = 2,5 = 1,58

Em B:
()$/)"& (0$/)"&(/$/)"&(1$/)"&(4$/)" )1&)&3&)&)1
Variância = s2 = = = 8,5
/$) 0

E o desvio-padrão s = 8,5 = 2,92

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Variância e desvio-padrão
O desvio-padrão tem a mesma unidade dos dados fornecidos. Em uma distribuição das alturas de uma turma
alunos, em cm de altura, o desvio-padrão também estará em cm. Em uma distribuição de custos em reais, o
desvio-padrão também estará em reais.

Portanto, o desvio-padrão tem uma característica próxima dos dados que representa. Porém a Variância é
muito utilizada pela propriedade que se segue:

Desvio-padrão(A+B+...N) ≠ Desvio-padrão(A) + Desvio-padrão(B)+..... ....+ Desvio-padrão(N)

Porém:

Var(A+B+..+N) = Var(A) + Var(B) + ... ....+ Var(N)

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Variância e desvio-padrão
Um projeto é constituído de três componentes A, B e C, com custos respectivamente de 300 kR$, 500 kR$ e
400 kR$, com desvios-padrão estimados em 30 kR$, 40 kR$ e 20 kR$. Qual o custo esperado para o projeto,
e o desvio-padrão?

Custo Total = 300 + 500 + 400 = 1.200 kR$

Desvios-padrão: 30, 40 e 20

Variâncias: 900, 1600 e 400

Variância total = 900 + 1600 + 400 = 2900

Desvio-padrão = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑡𝑜𝑡𝑎𝑙= 2900= 53,85

Custo total = 1.200 kR$, com desvio-padrão de 53,85 kR$

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Importância do desvio-padrão em comparações


Uma turma de alunos tem as seguintes notas em Português e Matemática:

Avaliando esta tabela, poderíamos dizer que Roberto é melhor em Português do que em Matemática, certo?

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Importância do desvio-padrão em comparações


No entanto, se calcularmos as médias das turmas em cada matéria, teríamos:

Portanto, observe que Roberto ficou ABAIXO da média em Português, e ACIMA da média em Matemática.
Logo, Roberto é melhor em Matemática do que em Português.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Importância do desvio-padrão em comparações


Se estas notas estivessem valendo para algum concurso, poderíamos classificar os alunos pela soma das
notas:

Edson, Marcos, Paulo, Sérgio e Victor seriam os melhores classificados. Esta avaliação é justa?

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Importância do desvio-padrão em comparações


Calculando o desvio-padrão de cada conjunto de notas:

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Importância do desvio-padrão em comparações


Notas padronizadas: vamos unificar as médias em 5, e atribuir ao desvio-padrão o valor 1,5.
A Nota padronizada é:
(𝑥 − 𝜇)
𝑁𝑃 = 5 + ×1,5
𝜎

Agora, o melhor colocado é Victor, seguido de Edson, Paulo e Sérgio, e depois Marcos.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
A distribuição binomial tem as seguintes características:

• Espaço amostral finito;


• Apenas dois resultados possíveis (sucesso ou fracasso) para cada tentativa;
• Todos os elementos devem possuir possibilidades iguais de ocorrência;
• Eventos devem ser independentes uns dos outros.

Exemplos:

Probabilidade de filhos homens e mulheres em uma família;


Probabilidade de k defeitos em um lote de n componentes;

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
A probabilidade de ter um filho homem (ou mulher) em um casal é ½.

Probabilidade de filho homem: p= ½


Probabilidade de filha mulher: q = ½

p+q = 1

Qual a probabilidade de ter um filho homem e uma filha mulher, em um casal com dois filhos?

Distribuição das probabilidades: (p+q)2 = 1


p2 +2pq + q2 = 1. Distribuição das probabilidades

(1/2)2 +2.(1/2).(1/2) + (1/2)2 = 1


¼+½ + ¼=1

2 filhos homens. 1 homem,1 mulher. 2 filhas mulheres.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
Qual a probabilidade de ter três filhos homens e duas filhas mulheres, em um casal com cinco filhos?

Distribuição das probabilidades: (p+q)5 = 1

p5 + 5p4q1 +10p3q2 + 10p2q3 + 5p1q4 + q5 = 1 Distribuição das probabilidades

Na realidade, estes coeficientes são obtidos assim:

C5,0p5 + C5,1p4q1 +C5,2p3q2 + C5,3p2q3 + C5,4p1q4 + C5,5q5 = 1 (combinações de 5)

Os valores podem ser obtidos através do cálculo das combinações Cn,p = n!/p!(n-p)!, ou através do Triângulo
de Pascal, mostrado abaixo, onde cada elemento é a soma dos dois elementos acima, anteriores, como
destacado:

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
Qual a probabilidade de ter três filhos homens e duas filhas mulheres, em um casal com cinco filhos?

Distribuição das probabilidades: (p+q)5 = 1

p5 + 5p4q1 +10p3q2 + 10p2q3 + 5p1q4 + q5 = 1 Distribuição das probabilidades

Probabilidade de 3 homens e 2 mulheres: 10p3q2 = 10(0,5)3(0,5)2 = 0,3125 = 31,25%

Obviamente não é necessário desenvolver a linha toda. Um termo qualquer no desenvolvimento de (p+q)n é:

Tk+1 = Cn,[Link]-k

Observe que nestes exemplos as probabilidades são iguais e p e q somam 1, porém p e q podem ser
diferentes (desde que somem 1).

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
Uma empresa adquiriu 800 equipamentos. O fabricante sabe que, historicamente, 10% dos equipamentos
apresentam defeito. O Controle da Qualidade da compradora estabelece como critério que o lote será aceito
se em uma amostra de 20 unidades, houver no máximo um defeituoso. Qual a probabilidade do lote ser
aceito?

Probabilidade de defeito: p=10% (0,1) Obviamente, probabilidade de não haver defeito: q=90%=0,9

No máximo, um defeito: zero defeitos, ou um defeito.

C20,0p0q20 + C20,1p1q19 = 1.(0,1)0(0,9)20 + 20(0,1)1(0,9)19 = 0,1216 + 0,2702 = 0,3918 = 39,18%

C20,0 = 20!/0!20! = 1 C20,1 = 20!/1!19! = 20

Mas.... E se fosse no máximo 4 defeitos em um lote de 100 unidades?

Nenhum defeito. um defeito, ou dois defeitos, três defeitos, 4 defeitos... ...em 100 unidades!!!

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Binomial
n=10 p=0,5 n=15 p=0,5
0,35 n=5 p=0,5 0,3 0,25
0,3
0,25 0,2
0,25
0,2
0,2 0,15
0,15
0,15
0,1
0,1 0,1

0,05 0,05
0,05
0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

n=50 p=0,5
n=100 p=0,5
0,12
0,09

0,1 0,08
0,07
0,08
0,06

0,06 0,05
0,04
0,04 0,03
0,02
0,02
0,01
0 0

13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
1 3 5 7 9 111315171921232527293133353739414345474951

1
5
9

101
Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]
Conceitos de Estatística

Distribuição Binomial
n=5 p=0,2 n=10 p=0,2 n=15 p=0,2
0,5
0,35 0,3
0,4 0,3 0,25
0,25
0,3 0,2
0,2
0,15
0,2 0,15
0,1
0,1
0,1
0,05 0,05
0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

n=50 p=0,2 n=100 p=0,2


0,16
0,12
0,14
0,1
0,12
0,1 0,08

0,08 0,06
0,06
0,04
0,04
0,02 0,02

0 0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51

13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
1
5
9

101
Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]
Conceitos de Estatística

Distribuição Normal (ou Gaussiana)


A distribuição normal, também conhecida como distribuição gaussiana, é uma curva simétrica em torno do seu ponto
médio, apresentando assim seu famoso formato de sino.

A distribuição normal é uma função que define uma curva, em função da média e do desvio-padrão, e a área sob essa
curva determina a probabilidade de ocorrer o evento por ela correlacionado.

Onde 𝜇 é a média, e 𝜎 é o desvio-padrão. Nesta distribuição, simétrica, a média, moda e mediana são iguais.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística
Distribuição Normal (ou Gaussiana)

Média 3 DP = 1

Média 4 DP = 1,5

Média 2 DP = 0,5

1 DP = distância da
média ao ponto de
inflexão

2 3 4
Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]
Conceitos de Estatística

Distribuição Normal (ou Gaussiana)

pdf: Probability density function

(função densidade de probabilidade)

cdf: Cumulative distribution function

(função cumulativa da distribuição)

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Normal (ou Gaussiana)

Vale notar que a integral da função densidade de probabilidade normal, não possui solução analítica, sendo
assim, seu cálculo deve ser realizado através de um método numérico.

Para sanar tal dificuldade a função pode ser padronizada com a substituição dos parâmetros por μ=0 e σ²=1.
Essa abordagem é dada pela definição de uma nova variável aleatória Z, chamada de variável aleatória normal
padronizada.

Se x for uma variável aleatória normal com média E(x)=μ e variância V(x)=σ², a variável aleatória Z=(x−μ)/σ
será uma variável aleatória normal, com E(Z)=0 e V(Z)=1. Ou seja, Z é uma variável aleatória normal padrão.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – curva padrão

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística
Distribuição Normal (ou Gaussiana) - tabela
Esta tabela fornece o valor
da área (=probabilidade) da
extremidade esquerda do
gráfico até o valor de z.

Portanto, para z=0,0, temos a


probabilidade igual a 0,5000
(50%). Portanto, 0,0 é a
mediana (divide a curva em
duas regiões de mesma área,
portanto, equiprováveis), é a
média, e é também a moda.

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – probabilidades pela tabela


Probabilidade de um valor x, tal que x1 < x < x2:

P(x2) – P(x1) = diferença entre as áreas

Probabilidade de um valor x < x1:

P(x1) (área da extremidade esquerda até x1)

x1
Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]
Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – probabilidades pela tabela


Determinado equipamento eletrônico tem vida útil média de 4.500 horas, e um desvio-padrão de 600 h. Qual a
probabilidade de este equipamento operar sem falhas por 5.000 horas?

5000 – 4500 = 500 horas acima da média à 500/600 ≅ 0,83

Probabilidade de FALHAR até z=0,83: 0,7967

Probabilidade de NÃO FALHAR após z=0,83: 1 – 0,7967 = 0,2033 ≅ 20%

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – probabilidades pela tabela


O equipamento eletrônico de marca A tem vida útil média de 5.000 horas, e um desvio padrão de 900 horas; o
equipamento similar, de marca B, tem vida útil média de 5.400 horas, com desvio padrão de 500 horas. Se desejamos
um equipamento que opere por 6.000 horas, qual opção devemos escolher?

Equipamento A:

6.000- 5.000 = 1.000 horas; em termos de desvio padrão z = 1000/900 = 1,11

Probabilidade de falhar até z = 1,11 (da tabela) = 0,8665 = 86,65%


Probabilidade de NÃO FALHAR até z=1,11: 1 – 0,8665 = 13,35%

Equipamento B:

6.000- 5.400 = 600 horas; em termos de desvio padrão z = 600/500 = 1,2

Probabilidade de falhar até z = 1,2 (da tabela) = 0,8849 = 88,49%


Probabilidade de NÃO FALHAR até z=1,2: 1 – 0,8849 = 11,51%

O equipamento A deve ser escolhido.


Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]
Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – probabilidades pela tabela


Uma fábrica de automóveis sabe que os motores de sua fabricação tem duração com distribuição normal com média de
180.000km e desvio padrão de 6.000km. Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual
deve ser esta garantia, para que a percentagem de motores substituídos seja inferior a 0,2%?

Para que o percentual de substituição seja inferior a 0,2%, devemos ter (da tabela):

Portanto, z = -2,88

(x – 180.000)/6.000 = -2,88

x = 162.720 km

Em termos práticos, poderíamos estabelecer um limite de


160.000 km

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]


Conceitos de Estatística

Distribuição Normal (ou Gaussiana) – probabilidades pela tabela


Uma frota de caminhões tem um consumo médio de 2,4 km/l de diesel, com um desvio-padrão de 0,3 km/l. Que
porcentagem desta frota tem um consumo entre 2 km/l e 2,7 km/l?

Obtendo o percentual da tabela: z=(2-2,4)/0,3 = -1,33 e z=(2,7-2,4)/0,3 = 1,00

Acumulado até z=-1,33 (2 km/l) à 0,0918 Acumulado até z = 1,00 à 0,8413

0,8413 – 0,0918 = 0,7495 à ≈ 75%

Jonas Pereira de Andrade - engmecjonas20@[Link] - IP: [Link]

Você também pode gostar