Você está na página 1de 57

ESTATÍSTICA

É um conjunto de métodos especialmente


apropriados à coleta, à apresentação, à análise e a
interpretação de dados de observação, tendo como
objetivo a compreensão de uma realidade
específica para a tomada de decisões.
O PROBLEMA

Nos últimos anos, houve aumento significativo no número de indústrias


brasileiras de médio porte que utilizam tecnologias digitais, ainda que em
estágio inicial. Uma empresa especializada em pesquisa, deseja obter o valor
dos Gastos com Treinamento, onde se espera que os gastos máximos por
empresa seja no máximo de 200 mil. Foram escolhidas aleatoriamente 10
empresas e determinaram os valores dos gastos em reais, que são:

175 190 215 198 184


207 210 193 196 180

Os dados indicam motivo de preocupação?


Dados

X - Gastos com treinamento

x: 175 190 215 198 184


207 210 193 196 180

3
Média

(mr)

4
Variância
=

= =172,6
==381024

Desvio Padrão – Raiz da variância


S= 13,14

5
Solução do Problema

A média de gastos por empresa é de 194,8 mil reais.


Desvio-padrão é de 13,14 mil reais.

194,8 - 13,14=181,6 e 194,8+13,14= 207,94

Intervalo: (181,6 a 207,94)

Os dados indicam motivos de preocupação.

6
Estatística Descritiva

• Trata-se da organização e sintetização dos


dados.
Formas de apresentação dos dados

Gráficos e Tabelas
Principais Tipos de Gráficos
Gráfico de linha Apresenta os dados por meio de uma linha
poligonal. Usa as coordenadas cartesianas para
definir todos os pontos da série que serão ligados,
dois a dois, por segmentos de reta.
Principais Tipos de Gráficos
Gráfico de Colunas
Representa os dados por meio de retângulos,
dispostos verticalmente (em colunas) ou
horizontalmente (em barras).

Gráfico de colunas simples:


Os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados

Distribuição do consumo médio per capita de


carne vermelha (kg/ano) segundo país
24%
Distribuição do consumo médio per capita de 22%
carne vermelha (kg/ano) segundo país
20%
Consumo
anual Percentagem 18%
(Kg/ano) 16%
Bélgica 13,5 16,7% 14%
Espanha 7,1 8,8% 12%
França 18,0 22,3% 10%
Grécia 10,2 12,6%
8%
itália 9,0 11,1%
Polônia 6,9 8,5% 6%
Portugal 6,2 7,7% 4%
Suécia 9,9 12,3% 2%
Total 80,8 100,0% 0%
Bélgica Espanha França Grécia itália Polônia Portugal Suécia
Principais Tipos de Gráficos
Gráfico de Barras
Representa os dados por meio de retângulos,
dispostos verticalmente (em colunas) ou
horizontalmente (em barras).

Gráfico de barras simples:


Os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados
Internações em estabelecimentos de saúde, por
Internações em estabelecimentos de saúde, por
espécie de clínica - 1992 espécie de clínica - 1992
Freqüência
Freqüência
Espécie de Clínica Relativa Clínica médica
Clínica médica 6.457.923 32,51%
Ginecologia e obstetrícia 3.918.308 19,73% Ginecologia e
Espécie de Clínica

Cirurgia 3.031.075 15,26% obstetrícia


Pediatria 2.943.939 14,82%
Outras 3.513.186 17,69% Cirurgia
Total 19.864.431 100%

Pediatria

Outras

0% 5% 10% 15% 20% 25% 30% 35%


Percentagem
Principais Tipos de Gráficos
Gráfico de setores O total dos dados é representado por um
círculo, que fica dividido em setores proporcionais
aos dados da série.

Consumo de carne na Nova Zelândia (1997)


Consumo de carne na Nova Zelândia (1997)
Animais Percentual
Cordeiro 8%
Carneiro 10% Cordeiro
Porco 16%
Carneiro
Frango 25%
Boi 41% Porco
Total 100% Frango
Adaptado de Churata, B.G.M. (20007) Boi
Principais Tipos de Gráficos
Gráficos de Pareto Tipo especial de gráfico de colunas, no qual as
respostas categóricas estão em ordem de
classificação decrescente em relação a sua
frequência ou percentagem.

Distribuição do consumo médio per capita de


carne vermelha (kg/ano) segundo país
Podem ser combinados
com um polígono acumulado
no mesmo gráfico.
24% 100,0%
Distribuição do consumo médio per capita de carne 92,3% 100%
22%
vermelha (kg/ano) segundo país 83,8% 90%
20%
75,0% 80%
Consumo 18%

Percentagem Acumulada
Percentagem
anual Percentagem 63,9% 70%
acumulada 16%
(Kg/ano)
Percentagem

14% 51,6% 60%


França 18,0 22,3% 22,3%
Bélgica 13,5 16,7% 39,0% 12%
50%
10% 39,0%
Grécia 10,2 12,6% 51,6%
40%
Suécia 9,9 12,3% 63,9% 8%
Itália 9,0 11,1% 75,0% 6% 22,3% 30%
Espanha 7,1 8,8% 83,8% 20%
4%
Polônia 6,9 8,5% 92,3%
Portugal 6,2 7,7% 100,0% 2% 10%
Total 80,8 100,0% 0% 0%
França Bélgica Grécia Suécia Itália Espanha Polônia Portugal

País
Principais Tipos de Gráficos
Histograma O histograma é formado por um conjunto de
retângulos justapostos, cujas bases se localizam sobre o
eixo horizontal, de tal modo que seus pontos médios
coincidam com os pontos médios dos intervalos de classes.

Histograma das estaturas de 40 alunos do


colégio A em 2006

Distribuição de freqüência da estaturas de 40


alunos do colégio A em 2006
Xi fi fri Fi Fri

150 |— 154 152 4 0,100 4 0,100


Freqüência
154 |— 158 156 9 0,225 13 0,325
158 |— 162 160 11 0,275 24 0,600
162 |— 166 164 8 0,200 32 0,800
166 |— 170 168 5 0,125 37 0,925
170 |— 174 172 3 0,075 40 1,000
Total 40 1,000

148 176
Estaturas (cm)
Principais Tipos de Gráficos
Gráfico de caixa (Box plot)

1.214,9

1.090,2
Taxa para 100.000 habitantes

933,3 3º Quartil (Q3)


Distância Interquartil (DI)
872,0 Mediana DI= Q3 – Q1
DI= 933,3 – 772,0= 161,3
772,0 1º Quartil (Q1)

539,5

391,8

Box plot*: taxas brutas de mortalidade para os Estados Unidos, 1992

*Adaptado de Pagano M. & Gauvreau K. (2004)

OBS: existem outras variações na


construção de gráficos de caixa
Tabelas
Título

Coluna
Produção de café – Brasil
Coluna (1991 – 1995) numérica
indicadora Produção
Anos
(1000 t) Cabeçalho
1991 2535

Corpo da 1992 2666

tabela 1993 2122

1994 3750 Linhas

1995 2007

Fonte: IBGE

Rodapé
Tabela de contigência

Estado nutricional de 1226 crianças brasileiras de 2 anos de idade, segundo sexo

Estado Masculino Feminino Total


Nutricional

Freqüência Percentual (%) Freqüência Percentual (%) Freqüência Percentual (%)

Desnutridas 29 5,0% 20 3,2% 49 4,0%

Normais 574 95,0% 603 96,8% 1177 96,0%

Total 603 100% 623 100% 1226 100%


Tabela de distribuição de
Frequência
Nascidos vivos segundo o peso ao nascer, em quilogramas
Freqüência
Ponto Freqüência Freqüência
Freqüência Relativa
classes médio Acumulada Relativa
(fi) Acumulada
(xi) (Fi) (fri)
(Fri)

1,5 2,0 1,75 3 3 3% 3%

2,0 2,5 2,25 16 19 16% 19%


Este símbolo indica que o
intervalo é fechado a
esquerda e aberto a direita.
Isto é, compreende valores 2,5 3,0 2,75 31 50 31% 50%
maiores ou iguais a 1,5 e
menores que 2,0.
3,0 3,5 3,25 34 84 34% 84%

3,5 4,0 3,75 11 95 11% 95%

4,0 4,5 4,25 4 99 4% 99%

4,5 5,0 4,75 1 100 1% 100%

Total 100 100%


VARIÁVEIS
• É o conjunto de resultados possíveis de um
fenômeno.

DISCRETA
QUANTITATIVA
CONTÍNUA
NOMINAL
QUALITATIVA
ORDINAL
VARIÁVEIS
Variáveis

Qualitativas Quantitativas
Representam atributos ou qualidades Natureza numérica

Ordinal: Nominal: Discretas


Contínuas
Possui uma ordenação Não é possível Assume valores
Assume valores infinitos
natura, indicando estabelecer uma ordem associados aos
em um dado intervalo
intensidade crescente natural. números naturais
Ex: peso corporal
ou de realização. Ex: Sexo (masculino e (1,2,3 ...)

EX: tamanho (pequeno, feminino) e Fuma (sim e Ex: número de cigarros

médio e grande) e não). fumados por dia

Classe social (baixa


média e alta)
DISTRIBUIÇÃO DE FREQUÊNCIA

• O objetivo é obter uma significativa redução na


quantidade de dados.
DISTRIBUIÇÃO DE FREQUÊNCIA
Variável Discreta
A sequência abaixo representa a observação do
número de importações por mês de uma empresa do
PIM.
1 0 1 2 0 1 2 1 2 0 0 1 1
0 1 1 1 0 1 2 0 1 0 2 0 1
2 0 3 1 1 4 1 2 0 1 0 0 0
3 0 0 3 0 2 0 0 2 0 3 2 0
1 2 0 0 0 3 1 0 1
DISTRIBUIÇÃO DE FREQUÊNCIA
• frequência simples: número de vezes que este elemento se
repete no conjunto de dados.
• Frequência Relativa: É a razão da frequência simples do
elemento pela frequência total. 𝒇 𝒊
𝒇 𝒓𝒊= ⋅𝟏𝟎𝟎
𝒏
• Frequência Acumulada: soma da frequência simples deste
elemento com as frequências simples dos elementos que o
antecedem.
• Frequência Relativa Acumulada: divisão da frequência
acumulada deste elemento pelo número total de
elementos da série. 𝑭𝒊
𝑭 𝑹𝒊 = ⋅𝟏𝟎𝟎
DISTRIBUIÇÃO DE FREQUÊNCIA
• Para o exemplo estabelecido, a distribuição de
frequência do número de importações por mês:
xi fi fr % Fi Fri %
0 25 41 25 41
1 19 31 44 72
2 11 18 55 90
3 05 08 60 98
4 01 02 61 100
Total 61 100 - -
DISTRIBUIÇÃO DE FREQUÊNCIA
Variável Contínua
• Uma amostra de 70 empresas mostrou a movimentação dos
custos logísticos no Brasil (estimada em milhões de dólares):

111 90 121 105 122 60 128 112 128 93 108 138 88 110

112 112 97 128 102 125 87 119 104 116 96 114 107 113

80 113 123 95 115 70 115 101 114 127 92 103 78 118

100 115 116 98 119 72 125 109 79 139 75 109 123 124

108 125 116 83 94 106 117 82 122 99 124 84 91 130


DISTRIBUIÇÃO DE FREQUÊNCIA
Amplitude Total: diferença entre o maior e o menor elemento
de uma sequência.
At = Xmáx – Xmin
Intervalo de Classe: subdivisão da amplitude total de uma
série estatística.
1. Semi aberto à esquerda: |---
2. Semi aberto à direita: ---|
3. fechado: |---|
4. aberto: ---
DISTRIBUIÇÃO DE FREQUÊNCIA
Limite de Classe
• São os valores extremos de cada intervalo de
classe. LI |--- LS

• Amplitude do Intervalo de Classe: diferença entre


o limite superior e o limite inferior da classe.
DISTRIBUIÇÃO DE FREQUÊNCIA
Número de Classes
• Há duas formas de se obter o número de classes.

• Critério da Raiz: O número de classes será a raiz


quadrada do número de elementos.

𝑲 = √𝒏
• Fórmula de Sturges: É dada pela seguinte equação.

𝑲=𝟏+𝟑,𝟑 𝐥𝐨𝐠 𝒏
DISTRIBUIÇÃO DE FREQUÊNCIA

• Pelo critério da raiz, temos

• Amplitude total

60|--- 139 = 69 0bservações

60|--- 140 = 70 0bservações

• Amplitude do intervalo de classe é:


𝑨𝒕
𝟖𝟎
𝒉= = =𝟏𝟎 𝒄𝒍𝒂𝒔𝒔𝒆𝒔
𝒄𝒏

𝒌 𝟖
DISTRIBUIÇÃO DE FREQUÊNCIA
• Assim, a distribuição de frequência do custo
logístico de 70 empresas:
(US$ milhões) fi fr % Fi Fri %
60 |---- 70 1 01,43 1 1,43
70 |---- 80 5 07,14 6 8,57
80 |---- 90 6 08,57 12 17,14
90 |---- 100 10 14,29 22 31,43
100 |---- 110 12 17,14 34 48,57
110 |---- 120 19 27,14 53 75,71
120 |---- 130 14 20,00 67 95,71
130 |---- 140 3 04,29 70 100
Total 70 100 - -
DISTRIBUIÇÃO DE FREQUÊNCIA

• Exemplo: considere a distribuição de


frequência anterior, o histograma é:
DISTRIBUIÇÃO DE FREQUÊNCIA – Variável Qualitativa

Tabela 1: Grau de instrução de 40 chefes de famílias de uma comunidade.

Grau de instrução fi fri % Fi Fri %


Nenhum 6 15,0 6 15
Primeiro 11 27,5 17 42,5
Segundo 23 57,5 40 100
Total 40 100,0
Aplicações

14 19 17 16 16 16 18 18 18

16 18 18 17 19 16 17 18 17

15 17 17 15 17 19 17 18 17

17 15 16 18 16 16 17 15 17

18 18 19 16 17 17 16 16 19
Aplicações

59 79 87 93 98 103 108 111 113 115 118 122 125 128

70 80 88 95 99 104 108 112 114 116 119 123 125 128

72 82 90 95 100 105 109 112 114 116 119 123 125 130

75 83 91 96 101 106 109 112 115 116 121 124 127 138

78 84 92 97 102 107 110 113 115 117 122 124 128 138
MEDIDAS ESTATÍSTICAS

• São medidas que possibilitam representar um


conjunto de dados relativos à observação de
determinado fenômeno de forma resumida.

• Existem dois tipos fundamentais de medidas


estatísticas: medidas de posição e medidas de
dispersão.
Medidas Estatísticas
MEDIDAS DE POSIÇÃO:
Dados não agrupados
As três medidas mais usadas são a Média,
Mediana e a Moda.

• Exemplo: Em sete meses de monitoramento,


foram verificadas por mês o número de
empresas que receberam multas.

x= 10 14 13 15 16 18 12
Média

A média aritmética é igual ao quociente entre a


soma dos valores do conjunto e o número total dos
valores.
𝒏

∑ 𝒙𝒊 𝟏𝟎+𝟏𝟒+𝟏𝟑+𝟏𝟓+𝟏𝟔+𝟏𝟖+𝟏𝟐
𝒊=𝟏
𝒙¯ = = =𝟏𝟒 𝒆𝒎𝒑 𝒓𝒆𝒔𝒂𝒔
𝒏 𝟕
Mediana

Ex.1: Número de reprovações por período.


x= 1; 3; 5; 7; 9; 9; 9
Mediana = 7 reprovações

Ex.2: Coeficiente de rendimento de quatro alunos


finalistas.
x= 6,0; 7,0; 8,0; 9,4
Mediana = 7,5 pontos
Mediana

• Exemplo: Seja o conjunto de dados, o


número de salários mínimos(sm)
x= 8; 8; 9; 9; 9; 10; 12; 200.

• Média é 33,12 sm
• Mediana é 9 sm
Moda
Ex.: Seja o número de faltas em um período
X= 7; 8; 9; 10; 10; 10; 11; 12
Moda = 10 faltas

Ex. O número de artigos publicados por período


x=: 2; 2;3; 2; 4; 3; 3; 6; 7
Moda: 2 e 3 (artigos).
Medidas de Dispersão

Apresentam a característica de avaliar a


dispersão dos dados em torno dos valores
centrais.
As medidas de dispersão são a amplitude total, a
variância, o desvio-padrão e o coeficiente de
variação.
Amplitude
Ex.: Número de adolescentes grávidas por mês
em um hospital

20,23,23,28,33,37,37,37,40,44

At = 44 – 20 = 24 adolescentes
Variância

A variância da amostra é indicada por 𝒔 𝟐

e a variância da população é indicada por 𝝈𝟐(sigma ao


quadrado), que na prática é desconhecida.

∑ ( 𝒙 𝒊 − ¯𝒙 ) 𝟐

𝟐 𝒊=𝟏
𝒔 =
𝒏 −𝟏
Variância
Ex.: Número de multas por dia numa avenida.
X= 10,11,9,10,10,9,11

[ (∑ ) ]
𝑛 2

𝑛
𝑥𝑖
1

2 2 𝑖 =1
𝑠 = 𝑥𝑖 −
𝑛 −1 𝑖 =1 𝑛

== ===1,33
Desvio-Padrão

1,15 multas

Média = 10

Limite inferior = 10 - 1,15= 8,85

Limite superior = 10 + 1,15= 11,15


Coeficiente de Variação (CV)
Trata-se de uma medida relativa de dispersão, útil para a
comparação em termos relativos do grau de concentração
em torno da média de séries distintas. O resultado é uma
porcentagem(%).É dado por:

𝒔
𝑪𝑽 = × 𝟏𝟎𝟎
𝒙¯
MEDIDAS DE POSIÇÃO: Dados agrupados

• Medidas de posição: Média, moda e


mediana.
• Medidas de dispersão: Amplitude, Variância,
Desvio e Coeficiente de Variação.
Exemplo : Determinar as medidas estatísticas para os dados
discretos

Idade Nº de alunos (fi)

15 5
16 11
17 13
18 11
19 5
Total 45
Exemplo : Determinar as medidas estatísticas para os dados
discretos

Idade(xi) Nº de alunos (fi) Fi


xi fi xi2 fi

15 5 5 75 1125
16 11 16 176 2816
17 13 29 221 3757
18 11 40 198 3564
19 5 45 95 1805
Total 45 765 13067
Medidas estatísticas
Moda é elemento que mais se repete no conjunto de dados.

Mediana é o elemento central do conjunto de dados.

Se n ímpar: valor central posições

Se n par: média dos valores centrais posições +1

[ (∑ ) ]
𝑛 2

𝑛
𝑥 𝑖 𝑓𝑖
1
∑𝑥
2 2 𝑖=1
𝑠 = 𝑖 𝑓𝑖 −
𝑛 −1 𝑖 =1 𝑛

√ [ (∑ )
]
𝑛 2

𝑛
𝑥 𝑖 𝑓𝑖
1
∑ 2 𝑖 =1
𝑠= 𝑥 𝑖 𝑓𝑖 −
𝑛− 1 𝑖 =1 𝑛
Média e Variância
mo: 17 anos

Mediana:

Como n é ímpar posições = =23 posição (ver na frequência acumulada.

Mediana = 17 anos

Amplitude= Maior valor – menor valor= 19-15= 4 anos


Exemplo

Como parte de uma avaliação médica na Escola de


Enfermagem da UFAM, foi medida a frequência
cardíaca dos 330 alunos matriculados no curso de
enfermagem. Os dados estatísticos estão na tabela de
distribuição de frequência:
Tabela de distribuição

Frequência Cardíaca Nº de alunos (fi)


(bpm)

60 |--- 65 2
65 |--- 70 15
70 |--- 75 32
75 |--- 80 47
80 |--- 85 50
85 |--- 90 80
90 |--- 95 82
95 |--- 100 24
332
Tabela de distribuição

Frequência Cardíaca Nº de alunos (fi) xi x i fi x i 2 fi


(bpm) Fi

60 |--- 65 2 62,5 2 125 7812,5

65 |--- 70 15 67,5 17 1012,5 68343,75

70 |--- 75 32 72,5 49 2320 168200

75 |--- 80 47 77,5 96 3642,5 282293,75

80 |--- 85 50 82,5 146 4125 340315,5

85 |--- 90 80 87,5 226 7000 612500

90 |--- 95 82 92,5 308 7585 701612,5

95 |--- 100 24 97,5 332 2340 228150

332 28150 2409228


Cálculo da Medina
Classe mediana:
1) n/2= 332/2= 166 (posição do elemento mediano)
2) Verifique na frequência acumulada o elemento mais próximo que o contém;
3) Identifique o intervalo: 85 |--- 90

Cálculo
4) = = 86,25 bpm

𝐿𝐼 ~𝑥 =¿ limite inferior da classe mediana.


𝑛=¿ número de elementos.
𝐹 𝑎𝑛𝑡 =¿ frequência acumulada da classe anterior à classe
mediana.

𝑓 ~𝑥=¿frequência simples da classe mediana.

h=¿ amplitude do intervalo de classe.


Cálculo da Moda: Fórmula de Czuber
Classe modal: maior frequência do intervalo - 90 |--- 95

= 91,17 bpm

𝐿 𝐼 𝑚 =¿ limite inferior da classe modal.


𝑜

𝑓 𝑚 =¿ frequência simples da classe modal.


𝑜

𝑛=¿frequência simples da classe anterior à classe modal.


𝑓 𝑝𝑜𝑠 =¿ frequência simples da classe posterior à classe modal.
h=¿ amplitude do intervalo de classe.

Você também pode gostar