Escolar Documentos
Profissional Documentos
Cultura Documentos
1. INTRODUÇÃO
SEC. XVIII: a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As
tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos de
probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se
tornar "O estudo de como se chegar a conclusão sobre uma população, partindo da
observação de partes dessa população (amostra)".
MÉTODO ESTATÍSTICO
A ESTATÍSTICA
è É uma parte da matemática aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões.
2º - PLANEJAMENTO : Como levantar informações ? Que dados deverão ser obtidos ? Qual
levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades ? Os
custos envolvidos ? etc.
Dados secundários: quando são publicados por outra organização. Ex: quando
determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o
grande risco de erros de transcrição.
Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma
pesquisa para saber a preferência dos consumidores pela sua marca.
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta
direta, por analogia, por avaliação,indícios ou proporcionalização.
FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja
possível a aplicação do método estatístico. São divididos em três grupos:
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma
simples observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade na
Grande Vitória, O preço médio da cerveja no Espírito Santo, etc.
PARÂMETROS: São valores singulares que existem na população e que servem para
caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os
alunos do 2º ano da FACEV têm em média 1,70 metros de estatura.
VARIÁVEL QUALITATIVA: Quando seu valores são expressos por atributos: sexo, cor da
pele,etc.
VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamente quantitativo, e o
conjunto dos resultados possui uma estrutura numérica, trata-se portanto da estatística de
variável e se dividem em :
Exemplos -
AMOSTRAGEM
MÉTODOS PROBABILÍSTICOS
§ É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o
acaso na escolha.
Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90
alunos de uma escola:
OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se
muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de
modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas.
Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior,
supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois
estratos (sexo masculino e sexo feminino). Logo, temos:
MASC. 54 5,4 5
FEMIN. 36 3,6 4
Total 90 9,0 9
AMOSTRAGEM SISTEMÁTICA:
Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada
por 50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte
procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o
qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam
periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4
a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.
è São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é
possível generalizar os resultados das pesquisas para a população, pois as amostras não-
probabilísticas não garantem a representatividade da população.
AMOSTRAGEM ACIDENTAL
è Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são
possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada
em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.
AMOSTRAGEM INTENCIONAL
Ex: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a
um grande salão de beleza e entrevista as pessoas que ali se encontram.
SÉRIES ESTATÍSTICAS
· De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos
colocar :
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..
JAN/96 20000
FEV/96 10000
TOTAL 30000
TOTAL 30000
FIAT 18000
GM 12000
TOTAL 30000
GRÁFICOS ESTATÍSTICOSG
è São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas.
1 - DIAGRAMAS:
· Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para
representar comparativamente dois ou mais atributos.
· Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido
em tantos setores quantas são as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser
empregado quando há, no máximo, sete dados.
· Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.
2 - ESTEREOGRAMAS:
è São gráficos geométricos dispostos em três dimensões, pois representam volume. São
usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de
gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.
3 - PICTOGRAMAS:
4- CARTOGRAMAS:
è São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
DISTRIBUIÇÃO DE FREQÜÊNCIA
Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram
numericamente organizados. É difícil formarmos uma idéia exata do comportamento do
grupo como um todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Dados Freqüência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Classes Freqüências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de
classe ( li ) e o maior número, limite superior de classe ( Li ). Ex: em 49 |------- 53,... l3 = 49
e L3 = 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à
direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |-------
57.
AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior
e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela anterior hi = 53 - 49 = 4. Obs:
Na distribuição de freqüência c/ classe o hi será igual em todas as classes.
AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo
da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19.
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes
iguais. .......Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.
§ No nosso exmplo: AA = 60 - 41 = 19
I
n
nº de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
Obs: Qualquer regra para determinação do nº de classes da tabela não nos levam a uma
decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado
à natureza dos dados.
No nosso exemplo: AA/i = 19/5 = 3,8 . Obs: Como h > AA/i um valor ligeiramente superior para
haver folga na última classe. Utilizaremos então h = 4
O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da
classe anterior.
.
Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os
pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das
freqüências simples ou absolutas.
Freqüências relativas: são os valores das razões entre as freqüência absolutas de cada classe
e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %).
Total 40 1,000
3. MEDIDAS DE POSIÇÃO
Introdução
· As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e
biquadrática.
MÉDIA ARITMÉTICA =
è É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
......
Ex: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13,
15, 16, 18 e 12 kilos, temos, para venda média diária na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
. di = Xi -
No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , d3 = 13 -
14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = - 2.
Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou
Y= .+ 2 = 14 +2 = 16 kilos
Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y= x 3 = 14 x 3 = 42 kilos
.
Dados agrupados:
Nº de meninos freqüência = fi
0 2
1 6
2 10
3 12
4 4
total 34
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78
Com intervalos de classe è Neste caso, convencionamos que todos os valores incluídos em
um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a
média aritmética ponderada por meio da fórmula:
..
50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440
MÉDIA GEOMÉTRICA = g
ou ..
...xi... ...fi...
1 2
3 4
9 2
27 1
Total 9
MÉDIA HARMÔNICA - h
.. ou
..
total 20 4,03
OBS: A média harmônica não aceita valores iguais a zero como dados de uma série.
· A igualdade g= h.= ....só ocorrerá quando todos os valores da série forem iguais.
g=( .+ h ) /.2
MODA - Mo
· Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa fábrica.
.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
.Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.
Temperaturas Freqüência
0º C 3
1º C 9
2º C 12
3º C 6
Resp: 2º C é a temperatura modal, pois é a de maior freqüência.
b) Com intervalos de classe: A classe que apresenta a maior freqüência é denominada classe
modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que
está compreendido entre os limites da classe modal. O método mais simples para o cálculo da
moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação
de moda bruta.
Mo = ( l* + L* ) / 2
54 |------------ 58 9
58 |------------ 62 11
62 |------------ 66 8
66 |------------ 70 5
Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda).
Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média
aritmética é a medida de posição que possui a maior estabilidade.
MEDIANA - Md
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
è Se a série dada tiver número ímpar de termos: O valor mediano será o termo de
ordem dado pela fórmula :
.( n + 1 ) / 2
Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a
mediana
Se a série dada tiver número par de termos: O valor mediano será o termo de ordem
dado pela fórmula :....
Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor
correspondente.
1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
5º termo = 2
6º termo = 3
A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética
do 5º e 6º termos da série.
Notas:
Quando o número de elementos da série estatística for par, nunca haverá coincidência
da mediana com um dos elementos da série. A mediana será sempre a média
aritmética dos 2 elementos centrais da série.
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
total 35
· Quando o somatório das freqüências for ímpar o valor mediano será o termo de ordem
dado pela fórmula :
.
· Como o somatório das freqüências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3..
· Quando o somatório das freqüências for par o valor mediano será o termo de ordem
dado pela fórmula:
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
total 8
2º) Calculamos ;
3º) Marcamos a classe correspondente à
Ex:
50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40
Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
SEPARATRIZES
QUARTIS - Q
- O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será =
Q2 = 9
- Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais
proporcionados pela mediana ( quartil 2 ). Para o cálculo do quartil 1 e 3 basta calcular as
medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2).
Q1 = (2+3)/2 = 2,5
Q3 = (9+9)/2 = 9
Assim, temos:
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40
- O quartil 2 = Md , logo:
- O quartil 3 : 3.E fi / 4 = 30
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3
DECIS - D
è A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da
porcentagem de valores que ficam aquém e além do decil que se pretende calcular. A fórmula
básica será : k .E fi / 10 onde k é o número de ordem do decil a ser calculado. Indicamos
os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma série em 10
partes iguais.
· De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais.
Assim sendo,o QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL, que por sua vez É IGUAL À
MEDIANA.
k= 3 onde 3 .E fi / 10 = 3 x 40 / 10 = 12.
Este resultado corresponde a 2ª classe.
PERCENTIL ou CENTIL
è Denominamos percentis ou centis como sendo os noventa e nove valores que separam
uma série em 100 partes iguais. Indicamos: P1, P2, ... , P99. É evidente que P50 = Md ; P25 =
Q1 e P75 = Q3.
· A média - ainda que considerada como um número que tem a faculdade de representar
uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto.
AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o ponto de
referência.
· Quando os dados não estão agrupados a amplitude total é a diferença entrE o maior e o
menor valor observado:
AT = X máximo - X mínimo.
AT = X máximo - X mínimo.
Ex:
xi fi
0 2
1 6
3 5
4 3
§ AT = 4 - 0 = 4
AT = L máximo - l mínimo
Ex:
Classes fi
4 |------------- 6 6
6 |------------- 8 2
8 |------------- 10 3
§ AT = 10 - 4 = 6
Observações:
1- O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e
de interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos,
sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que
não se consideram representativos.
3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1, entre Q1 e
Q3 e maiores que Q3.
Para dados brutos: É a média aritmética dos valores absolutos dos desvios tomados em
relação a uma das seguintes medidas de tendência central: média ou mediana.
· para a Média = Dm = E | Xi - | /n
· para a Mediana = Dm = E | Xi - Md | / n
· As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal
dos desvios.
= - 0, 2 e Md = - 2
Xi Xi - | Xi - | Xi - Md | Xi - Md |
E= 16,8 E= 15
Xi
E= 62,8
Obs: Quando nosso interesse não se restringe à descrição dos dados mas, partindo
da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então:
2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
(diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por essa constante.
Total 30 63 E= 32,70
- Se considerarmos os dados como sendo de uma amostra o desvio padrão seria : a raiz
quadrada de 32,7 / (30 -1) = 1,062
Obs: Nas tabelas de freqüências com intervalos de classe a fórmula a ser utilizada é a
mesma do exemplo anterior.
VARIÂNCIA - S2
è É o desvio padrão elevado ao quadrado. A variância é uma medida que tem pouca
utilidade como estatística descritiva, porém é extremamente importante na inferência
estatística e em combinações de amostras.
è Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o
seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão ou variabilidade, quando expressas em unidades diferentes.
CVP = (S / ) x 100
§ o resultado neste caso é expresso em percentual, entretanto pode ser expresso também
através de um fator decimal, desprezando assim o valor 100 da fórmula.
Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos:
PESOS 68 kg 2,0 kg
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor será o
de maior homogeneidade ( menor dispersão ou variabilidade).
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os
pesos.
CVT = ( S / Md ) x 100 %
5. MEDIDAS DE ASSIMETRIA
Introdução:
Escalas de assimetria:
MEDIDAS DE CURTOSE
Introdução:
è Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (ou
mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocúrtica.
è Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou
mais achatada em sua parte superior), ela recebe o nome de platicúrtica.
Coeficiente de curtose
C2 = 3 è curva mesocúrtica
Agradecimento: Este resumo só foi possível graças a “garimpagem” realizada na WEB, mais
especificamente na pagina do Prof. Paulo Cezar Ribeiro da Silva, ao qual eu externo meus
agradecimentos.
(1) Estatística Descritiva (tem por finalidade descrever certas propriedades relativas a
um conjunto de dados)
população)
Censo e Sondagem
Num Censo, o estudo estatístico
baseia-se em todos os
elementos da população.
Normalmente
enviesados, levando a
conclusões que não são
corretas.
Censo e Sondagem Num Censo, o estudo estatístico baseia-se em todos os elementos da
população. Normalmente realizam-se de 10 em 10 anos. Na sondagem, o estudo estatístico
baseia-se numa amostra da população, que deve ser representativa dessa população. Se a
amostra não for representativa, dizemos que os dados são enviesados, levando a conclusões
que não são corretas.
Seleção de Amostras
Existem técnicas científicas
para a seleção correta de
amostras. De entre essas
técnicas, as mais
conhecidas são a amostragem
aleatória simples, a amostragem
sistemática e a amostragem
estratificada.
(A) Amostragem Aleatória
Simples
Consideremos a população de
30 funcionários de uma
empresa, da qual se pretende
obter
uma amostra de 5 funcionários.
1) Listam-se todos os
funcionários.
2) Associa-se a cada
funcionário um número.
3) Gera-se uma sequência de 5
números
D07: Reconhecer que as imagens de uma figura construída por uma transformação
homotética são semelhantes, identificando propriedades e/ou medidas que se modificam ou
não se alteram.
01
(Saerjinho).
10
15
21
24
02
(Saerjinho).
25
23
32
52
03
(SAEPE).
12
15
04
(SAEP 2014).
Ao incidir um facho de luz sobre um anteparo na forma do retângulo ABCD, foi projetada em
uma parede uma silhueta na mesma forma, porém ampliada.
05
(Prova Brasil).
Ampliando-se o triângulo ABC, obtém-se um novo triângulo A’B’C’, em que cada lado é o
dobro do seu correspondente em ABC.
as áreas
os perímetros
os lados
os ângulos
06
(CEB).
A razão de semelhança é:
1.
2.
1,5.
3.
07
(Radix).
os ângulos.
os perímetros.
os lados.
as áreas.
08
(SEPR).
Claudia pretende fazer um pôster de uma foto para colocar em seu quarto. As medidas da
foto que pretende ampliar são 9 cm × 12 cm.
Como ficarão as medidas do lado do pôster, se a foto original for ampliada 4 vezes?
09
(SAEGO-2012 - Adaptado).
é dobro de A.
O lado A’ é a metade de A.
10
(SAERO).
10
11
Ampliando-se o losango ABCD, obtém-se um novo losango A’B’C’D’, em que cada lado é o
dobro do seu correspondente em ABCD.
Em figuras ampliadas ou reduzidas, os elementos que conservam a mesma medida são
as áreas
os ângulos
os lados
os perímetros
12
(WR).
2,0
2,1
2,2
D
2,5