Você está na página 1de 49

Estatística

Engenharia Mecânica

Prof. Nádia Giaretta Biase


Conceitos Básicos e Fases do Método Estatístico

1
ESTATÍSTICA ?

PRA QUÊ ?

2
É importante saber estatística?
 Queira ou não, estamos expostos a certas
formas de estatística grande parte de nossas
vidas.
 Ex: Pesquisas de opiniões;
 Taxas de desemprego;
 Taxa de juros;
 Porcentagem de alimentos contaminados;
 Taxa de mortalidade em função do Covid;
 Nos esportes e noticiários de tempo estamos
familiarizados com conceitos de médias,
porcentagens e probabilidades;
 nas diversas áreas do conhecimento como a
medicina, biologia, agronomia, engenharia, ciências
sociais, etc.
A IMPORTÂNCIA DA ESTATÍSTICA

 A Estatística é aplicada como auxílio nas


tomadas de decisão diante de incertezas para
justificar cientificamente as decisões.

◦ Onde utilizar a estatística???

5
ESTATÍSTICA

desempenha um papel crucial nas diversas fases da


pesquisa científica e trabalho

Relatório

Delineamento do
estudo Apresentação
Análise de
Planejamento dados Publicação
Cálculo da
Interpretação dos
amostra
resultados
Protocolo de
pesquisa Artigo científico
Monografia
Tese de mestrado
e doutorado...

6
Definição de Estatística
 “Estatística é a ciência de obter conclusões a
partir de dados”.
 A Estatística permitirá:
 garantir que os dados coletados para testar as
hipóteses sejam válidos;
 verificar se as eventuais discrepâncias entre os
resultados previstos e os dados coletados são
suficientes para justificar uma modificação nas
hipóteses.
 Sem Métodos Estatísticos, sem validade
científica! 7
Amostra e População

O foco da Estatística é tirar conclusões de populações.


Amostra = conjunto de observações extraída de uma
população.

População (universo) = conjunto de todos os possíveis


valores de uma variável ou característica.

Finita: Ex: número de alunos matriculados na disciplina de


Estatística.

Infinita: Ex: número de microorganismos presentes em uma


sala.

8
Variável
 é o conjunto de resultados possíveis de um fenômeno.
 é a característica ou propriedade da população que está sendo
medida.
 Ex.:
População: Pessoas atendidas no setor do Recursos Humanos da
Prefeitura;
Variável: tempo de espera
 População: alunos da graduação em Estatística
Variável: sexo
 As hipóteses de pesquisa são formuladas para as variáveis:
Definem-se os valores que as variáveis podem assumir.
 Definem-se os relacionamentos que as variáveis devem
apresentar entre si.
9
 Classificação por nível de mensuração: quantidade
de informação que a variável apresenta.

Sexo Classe social Número de filhos Temperatura


Naturalidade Classificação produto Número de acidentes Velocidade
10
Variáveis qualitativas:
 Você tem diabetes? (Sim ou Não)
 Você é fumante? (Sim, Não, Já fui, Pretendo ser)
 Qual sua escolaridade (Ensino médio, graduação ou
pós graduação)
 Qual é o seu tipo sanguíneo? (A, B, AB, O, Não sei)
 Qual seu índice de satisfação(Ruim, Regular, Bom,
Excelente)
Variáveis quantitativas: contagens ou
medidas
 Discretas
 Número de batimentos cardíacos;
 Número de moradores de uma residência;
 Número de cigarros fumados por dia;
 Contínuas
 Altura;
 Peso;
 Tempo para realização de uma tarefa;
Classifique cada uma das variáveis abaixo em qualitativa
(nominal/ordinal) ou quantitativa (discreta/contínua).

 intenção de voto para presidente (possíveis respostas são


nomes dos candidatos, além de não sei);
 perda de peso de maratonistas na corrida de São Silvestre,
em quilos;
 intensidade de perda de peso de maratonistas na corrida de
São Silvestre (leve, moderada, forte);
 ocorrência de hipertensão pré-natal em grávidas com mais de
35 anos (sim ou não são possíveis respostas para esta
variável);
 Grau de satisfação da população brasileira com relação ao
trabalho de seu presidente (valores de 0 a 5, com 0 indicando
totalmente insatisfeito e 5 totalmente satisfeito);

 Número de litros de água numa máquina de lavar roupa;

 Número de livros em uma estante de biblioteca;

 Soma de pontos obtidos ao lançar um par de dados;

 Países da Europa.
Distribuição de Freqüências:
Arranjo dos dados numa planilha eletrônica
Nome Idade Sexo Peso (kg)

Raquel 26 F 55

Paulo 37 M 71

Afonso 28 M 94

Mirian 38 F 66

Luciano 38 M 78

Adriana 39 F 70

Lais 24 F 53

Gabriela 18 F 61

Maria Clara 32 F 75

 Apresentação dos dados: A organização, a


sumarização dos dados podem ser feitas
por meio dos métodos tabulares e gráficos 15
Distribuição de Freqüências:

 É um sumário tabular dos dados


que mostra o número
(frequência) de itens em cada
uma das categorias ou classes
não sobrepostas.

16
Distribuições de Frequências
 Coleta e organização dos dados
 Dados brutos
 Dados elaborados => ordenação
 Frequência absoluta => = número de vezes que o
indivíduo aparece na amostra

 Frequência relativa =>

 Frequência percentual =>


17
Variáveis qualitativas
Exemplo: Uma pesquisa sobre a preferência
dos trabalhadores de uma indústria em relação
a atividade física apresentou os seguintes
resultados:
Natação Musculação Alongamento Caminhada Musculação
Alongamento Caminhada Alongamento Alongamento Alongamento
Natação Alongamento Caminhada Musculação Caminhada

Vamos construir a distribuição de frequências para


esses dados.

18
Tabela 1. Distribuição de frequências absoluta, relativa e
percentual da preferência dos trabalhadores de uma indústria
em relação a atividade física.

Atividade Freq. absoluta (fa) Freq. Relativa (fr) Freq. percentual (fp)
Musculação 3 0,2 20
Alongamento 6 0,4 40
Caminhada 4 0,27 27
Natação 2 0,13 13
Total 15 1 100

19
Representação Gráfica
Setores Circulares (Pizza)

Preferencia Feminina

20
Distribuição de freqüências - variáveis
quantitativas
 Nível de mensuração da variável quantitativa:

 DISCRETA: semelhante às variáveis qualitativas.

 CONTÍNUA: necessário agrupar os dados para


possibilitar o resumo do conjunto e melhor
visualização.

21
Distribuição de Freqüências
A distribuições de freqüências de dados
resultantes de variáveis discretas, quando não
houver grande quantidade de diferentes valores
observados, consiste em organizar e agrupar os
dados numa tabela. Para uma melhor
compreensão vamos tomar um exemplo.

Exemplo: Vamos construir uma tabela de


freqüências para os dados da variável número de
pacientes internados com pneumonia,
considerando uma amostra de 40 hospitais do
Triângulo Mineiro.
22
DADOS Tabela de freqüências do número de pacientes
internados com pneumonia, considerando uma amostra de
40 hospitais do Triângulo Mineiro.
4 4 4
Nº de pacientes Freqüência Freqüência Freqüência
5 4 1 internados de hospitais percentual acumulada
2 3 6
1
4 6 4
2
4 6 3
5 3 4 3

4 4 4
5 5 5 5
4 8 4 6
5 3 4 7
5 5 2
8
5 2 6
Total
8 3 5
5 3 Frequência acumulada (Fi): indica o número de dados que possuem valores
menores ou maiores, ou então iguais ao limite superior de cada classe. 23
Representação Gráfica

Se as colunas estiverem justapostas o gráfico recebe o nome


de Histograma .
24
Representação Gráfica
Polígono de frequências

25
Tabela de frequências para
dados agrupados
 Recomendável para grande conjuntos de variáveis
QUANTITATIVAS.
 Na realidade trata-se de uma recodificação: os
valores das variáveis são registrados agora em
classes mutuamente exclusivas: ao invés de
registrar renda igual a 4,35 salários mínimos,
registra-se renda na faixa entre 3 e 5 salários
mínimos.
 PERDE-SE informação sobre o conjunto original
para obter sua compactação.

26
Construção de uma distribuição de frequências
 Organizar a amostra de tamanho n em ordem crescente;
 Calcular a amplitude total (A = diferença entre o maior e menor
valor da amostra)
 Determinar o número de classes k (aproximar inteiro mais próximo)

 Calcular amplitude das classes


A
c
k 1
 Calcular o limite inferior da primeira classe

Li1 = menor valor – c/2

 Montar as classes e frequências


27
Variáveis quantitativas
Tabela 2. Dados de espessuras de rolamentos, em mm,
produzidos por uma indústria.

41 46 51 57
41 46 51 58
42 50 52 58
44 50 52 60
45 50 54 60

28
Construção de uma distribuição de
frequências
 Organizar os dados
 Calcular a amplitude total
 Determinar o número de classes (aproximar inteiro mais próximo)

 Calcular amplitude das classes


A
c
 k inferior
Calcular o limite 1 da primeira classe

Li1 = menor valor – c/2

 Montar as classes e frequências

29
Distribuição de frequências de espessuras de
rolamentos, em mm, produzidos por uma indústria.

30
Exercício:
Durante o período de um mês, observou-se o preço, em reais,
pago nas refeições por quilo de 25 pessoas nos restaurantes
próximos a UFU. Os resultados desse estudo são apresentados
a seguir:

a) Construir a distribuição de frequências;


b) Construir o histrograma e o polígono de frequencias;

31
Outros tipos de gráficos
Distribuição de frequências do tempo gasto
(segundos) para realizar uma determinada
operação.

32
Histogramas
12
10
10 9
8 7
6
4
2
2 1 1
0
340 360 380 400 420 440 460

Figura 1- Figura 1- Histograma do tempo gasto (segundos) para


realizar uma determinada operação

33
Polígono de frequência

Figura 2: Polígono de Freqüências do tempo gasto


(segundos) para realizar uma determinada operação.

34
Ogivas

Figura 3: Ogiva crescente e ogiva


decrescente tempo gasto (segundos) para
realizar uma determinada operação. 35
Pictogramas

36
Ramos e Folhas

Idade, em anos, de um conjunto de indivíduos que


vivem na zona rural.
Box Plot

38
C o n s u m o d e e n e r g i a e l é tr i c a ( E m G W h )

0 5000 10000 15000

Sudeste
Nordeste
Sul

Regiões
Box-Plot

Centro-oeste
Norte

39
Linhas
INTERPRETAÇÃO GRÁFICA

a) Falso

b) Verd.

c) Falso

d) Falso

e) Verd.

b)
c)
a)
e) A
d) O maior
menor
frangoquantidade
O fígado
fígado quantidade
tem maisde
menos
possui
possui 218mg de gordura
colesterol
colesterol
colesterol
de éque
queno
éano
colesterol afígado.
acarne
mais de
carne que
camarão.
Porco.
adelula
porco.
. 41
Num tanque, as variações na população de
População
2000 espécies de peixes A , B e C são descritas,
a) Falso
1800 no período de 10 meses, pelo gráfico:
b) Falso
1600

1400 c) Falso
1200 A
d) Falso
1000 B

800 C e) Verd.
600

400

200
M eses
0 1 2 3 4 5 6 7 8 9 10

d)
e)
b)
a)
c) No
No
A população
período
quinto
períodomês,
de
de
C30
atingiu
0havia
aa 7
52 meses,
meses,
menos
o seu máximo
a
de
as
a população
população
populações
3500nopeixes
BB B e
manteve-se
C
nesse
manteve-se
terceiro
mantiveram-se
tanque.
mêsmaior
menor
. crescentes.
que
queaaAC . 42
Natureza da Distribuição
 
a) Simétrica
 
b) Assimétrica à direita
 
c)  Assimétrica à esquerda
 
d) Multimodal

43
ASSIMETRIA E CURTOSE
O coeficiente de assimetria mostra o afastamento da variável em
relação a um valor central, ou seja, na distribuição simétrica tem-
se 50% dos valores observados acima da observação central e
50% abaixo. Se a distribuição é assimétrica, esta relação não é
observada.

O coeficiente de curtose mostra a dispersão (achatamento) da


distribuição em relação a um padrão, geralmente a curva normal.

Estes dois coeficientes são utilizados para inferências sobre a


normalidade da variável em estudo.
44
ASSIMETRIA
Assimetria: significa desvio ou afastamento da simetria, (grau de
deformação de uma curva).
# Simétrica, se a média e a moda coincidem.
# Assimétrica à esquerda ou negativa, se a média é menor
que a moda.
# Assimétrica à direita ou positiva, se a média é maior que a
moda.

45
Coeficiente do momento de assimetria

46
CURTOSE
Mede o grau de achatamento ou afilamento de uma distribuição em
relação a uma distribuição padrão, denominada curva normal.

Classificação da distribuição de acordo com a curtose

• mesocúrtica, se a curva de freqüências apresentar um grau de


achatamento equivalente ao da curva normal.
• leptocúrtica, se a curva de freqüências apresenta-se mais
fechada (ou mais afilada na parte superior) que a curva normal.
• platicúrtica, se a curva de freqüências apresenta-se mais aberta
(ou mais achatada na parte superior) que a curva normal.

47
Leptocúrtica

mesocúrtica

Platicúrtica

48
Coeficiente de curtose

Mais utilizado na maioria dos softwares estatísticos

Observação:
Em alguns programas computacionais como o Excel, Statistica e
GS+ existe uma padronização do valor de k e o valor de
comparação é o zero, portanto, se k = 0  mesocúrtica, se k < 0
 platicúrtica e se k > 0  leptocúrtica.

49

Você também pode gostar