Você está na página 1de 107

Introdução

Fundamentação Teórica
Referências

Estudo de estatı́stica

Profa Lêda Ferreira Cabral

Instituto Federal Do Maranhão - IFMA

06 de fevereiro de 2024

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Revisão

objetivo da estatı́stica
A estatı́stica tem como objetivo fornecer infomações(conhecimento)
utilizando quantidades númericas.

Obteção de dados. Descrição, classificação e apresentação dos


dados.(Estatı́stica Descritiva) Conclusões a tirar dos dados. (Estatı́stica
inferencial)

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Áreas da estatı́stica

Estatı́stica Descritiva: etapa inicial de qualquer análise. É um conjunto


de técnicas destinadas a descrever e resumir os dados, que auxiliam a
descrever caracterı́sticas de interesse. “Conheça seus dados”

Probabilidade: é a ferramenta matemática utilizada pela Estatı́stica


para se estudar a incerteza oriunda de fenômenos aleatórios. “Qual a
incerteza associada aos dados? ”

Estatı́stica Inferencial: é um conjunto de técnicas que possibilita tirar


conclusões sobre uma população, a partir de um subconjunto de valores
(amostra). “Quais conclusões podemos tirar a partir destes dados? ”

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Termos básicos da estatı́stica

•População:
Coleção de todas as observações potenciais sobre um determinado
fenômeno.
•Amostra: Conjunto de dados efetivamente observados ou extraı́dos de
uma população. Sobre os dados da amostra se desenvolvem os estudos,
visando a fazer inferências sobre a população.
•Dados: Respostas coletadas da variável em estudo.
•Censo: Conjunto de dados obtidos através de todos os elementos da
população.
•Variável:
Caracterı́stica de interesse no estudo.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Termos Básicos da Estatı́stica

Figura: Classificação das variáveis

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo
1.2: Vamos classificar as seguintes variáveis:
a) Número de peças defeituosas produzidas em uma linha de montagem.
b) Peso de pacientes.
c) Gosta de Música.
d) Tipo sanguı́neo.
e) Grau de satisfação do consumidor com determinado produto.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Resolução:
a) Variável quantitativa discreta: Pois as possı́veis respostas são 0, 1,
2, 3, etc. (as respostas assumem somente valores inteiros).
b) Variável quantitativa contı́nua: Pois as possı́veis respostas são 58,7;
89,8; etc. (as respostas podem assumir valores decimais).
c)Variável qualitativa nominal: Pois as possı́veis respostas são sim ou
não. (as possı́veis respostas são categóricas).
d) Variável qualitativa nominal: Pois as possı́veis respostas são A, AB,
B ou O (as possı́veis respostas são categóricas).
e) Variável qualitativa ordinal: Pois as possı́veis respostas são nada
satisfeito, pouco satisfeito, satisfeito, muito satisfeito (as possı́veis
respostas são categóricas e possuem uma ordenação natural, do menor
grau de satisfação para o

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Revisão

Figura: Ilustração do processo de amostragem

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

•Amostragem
. Processo de escolha da amostra;
. Parte inicial de qualquer estudo estatı́stico;
. Consiste na escolha criteriosa de elementos a serem submetidos ao
estudo, para que os resultados sejam representativos, toma-se o cuidado
de entrevistar um conjunto de pessoas com caracterı́sticas
sócio-econômicas, culturais, religiosas etc. tão próximas quanto possı́vel
da população.
A escolha da amostra, construção dos instrumentos, entrevistas,
codificação dos dados e apuração dos resultados são etapas deste tipo de
pesquisa.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Por que fazer amostragem?


Parâmetros populacionais desconhecidos
Impossibilidade de realização de um censo
Mais barato, mais rápido
Atenção
Não existe nenhuma técnica estatı́stica capaz de salvar uma amostra mal
coletada!
Em geral, uma amostra deve ser um subconjunto representativo da
população.
aleatória (de alguma forma).
Existem diversas maneiras para se retirar uma amostra de uma
população: Teoria da Amostragem

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Levantamentos amostrais

A amostra é obtida a partir de uma população bem definida, por meio de


processos bem definidos pelo pesquisador. Subdivide-se em dois grupos:
Probabilı́sticos: Cada elemento da população possui a mesma
probabilidade de ser selecionado para compor a amostra: mecanismos
aleatórios de seleção.
Não probabilı́sticos: A seleção da amostra depende do julgamento do
pesquisador. Há uma escolha deliberada dos elementos para compor a
amostra: mecanismos não aleatórios de seleção
atenção
Na amostragem não probabilı́stica, os elementos da população não tem a
mesma probabilidade de serem selecionados, portanto não há garantias
da representatividade da população!

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Métodos probabilı́sticos

Amostragem Aleatória Simples (AAS)


Todas as possı́veis amostras de tamanho n tem a mesma chance de
serem escolhidas (de uma população com N elementos)

Exemplos:
Selecionar 10 estudantes de uma sala por sorteio e perguntar a idade.
Gerar uma amostra aleatória de 1000 números de matrı́cula de
estudantes da UFPR (no computador!) e perguntar a idade

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Métodos probabilı́sticos

Amostragem Aleatória Simples (AAS)


É o método mais simples para selecionarmos uma amostra probabilı́stica
de uma população.
Serve de base para outros procedimentos amostrais, planejamento de
experimentos e estudos observacionais.
Utilizando-se um procedimento aleatório, sorteia-se um elemento da
população. Repete-se o processo até que sejam sorteadas as n unidades
na amostra.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Métodos probabilı́sticos

Amostragem sistemática
Utilizada quando os elementos estão dispostos de maneira organizada
(ex.: fila, lista) e aleatória. Escolhe um ponto de partida e seleciona-se
cada k-ésimo elemento da população (ex.: o 50◦ elemento)

Exemplo: Em uma fábrica de lâmpadas, a cada 100 peças produzidas,


uma é retirada para teste

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Métodos probabilı́sticos

Amostragem estratificada
Indicada quando a população está dividida em grupos distintos,
denominados estratos. Dentro de cada estrato é realizada uma
amostragem aleatória simples. O tamanho da amostra pode ou não ser
proporcional ao tamanho do estrato.

Exemplos: Uma comunidade universitária com 8000 indivı́duos está


estratificada da seguinte forma
Estrato População Amostra
Professores 800 80
Funcionários 1200 120
Estudantes 6000 600

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Métodos probabilı́sticos

Amostragem por conglomerado


A área da população é dividida em seções (ou conglomerados, ex.:
bairros, quarteirões). Os conglomerados são selecionados aleatoriamente.
Dentro de um conglomerado, todos os elementos são amostrados.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

TABELA PRIMITIVA E ROL

TABELA PRIMITIVA
Ao fazer a coleta de dados numéricos, eles com certeza virão
desorganizados (ou seja, não estarão em ordem crescente nem em ordem
decrescente); dados assim formam a TABELA PRIMITIVA.

No exemplo abaixo, temos as alturas de 40 alunos do colégio A.

Figura: 1

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Rol
Para facilitar a análise inicial dos dados é interessante dispô-los em ordem
crescente ou decrescente, gerando assim a tabela chamada ROL.
Pela natureza dos dados de nosso exemplo, é mais interessante
organizá-los em ordem crescente. Sendo assim, teremos:

Figura: 2

Nesta tabela, os dados estão organizados em ordem crescente; esta


tabela é chamada rol.
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

- Caso queira, já é possı́vel calcular aqui a AMPLITUDE


AMOSTRAL (algo como o tamanho da amostra que esta sendo
estudada). Basta fazer uma subtração entre o valor maior e o valor
menor.

-
No nosso exemplo, temos 173 – 150 = 23, e escrevemos AA = 23
cm, onde AA é Amplitude Amostral.
-
A partir do rol, fica mais fácil criar outra tabela simples, chamada
DISTRIBUIÇÃO DE FREQUÊNCIA,
-
Em uma tabela de distribuição de frequências cada linha contém um
valor seguido do número de vezes que este valor se repete.
- A primeira coluna é chamada coluna dos valores e a segunda
coluna das frequências.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

• Dados Tabelados não agrupados em classes


A grandeza que estamos estudando é alturas, que varia de 150 a 173 cm.
A frequência de cada uma dessas alturas é a quantidade de vezes que
cada idade se repete. Podemos então criar a seguinte tabela:

Figura: 3

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

OBSERVAÇÃO: Veja no exemplo anterior que os valores da variável


aparecem individualmente. Isso ocasiona um grande aumento na
quantidade de linhas da tabela, mesmo quando o número de valores da
variável ( n) é de tamanho razoável

Para contornar essa situação, construiremos uma nova tabela, em que


essa os valores serão agrupados em vários intervalos. Para essa tabela
daremos o nome de Distribuição de frequência com intervalos de
classe:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

• Dados Tabelados agrupados em classes


- os valores da variável não aparecem individualmente, mas agrupados em
classes.

Figura: 4
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Observação: Na estatı́stica, chamamos os intervalos o qual agrupamos


os valores da variável, de intervalos de classe.

Chamamos de frequência de uma classe o número de valores da


variável pertencente á classe.
Exemplos: Na 1o classe, a frequência é de 4 alunos.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Elementos de uma distribuição de frequência

Classe
Classe de frequência ou, simplesmente, classes são intervalos de variação
da variável.
As classe são representadas por i, sendo i=1,2,3,·,k (onde k é o número
total de classes da distribuição).

Assim em nosso exemplos, o intervalos 154 ` 158 define a segunda classe


(i=2). Como a distribuição é formada de seis classe, podemos afirmar
que k=6.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Limites de classes
Denominamos limite de classe os extremos de cada classe.
O menor número é o limites inferior da classe (li ), e o maior número e
o limite superior da classe (Li ).

Na segunda classe, por exemplo, temos. l2 = 154 e L2 = 158

Observação: O sı́mbolo ` indica inclusão de li e exclusão de Li . Assim


o individuo com estatura de 158 cm está na terceira classe (i=3), e não
na segunda. Resolução 886/66 IBGE.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Amplitude de um intervalo de classe


Amplitude de um intervalo de classe ou, simplesmente intervalo de
classe é a medida do intervalo que define a classe.

Ela e obtida pela diferença entre os limites superiores e inferiores dessa


classe e indicada por hi . Assim:

hi = Li − li

. Na distribuição do exemplo anterior, temos:

h2 = L2 − l2 ⇒ h2 = 158 − 154 ⇒ h2 = 4cm.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Amplitude total da distribuição


Amplitude total da distribuição (AT) é a diferença entre o limite superior
da última classe (limite superior máximo) e o limite inferior da primeira
classe (limite inferior mı́nimo).

AT = L(máx.) − l(min.).

Em nosso exemplo, temos: AT=174-150=24 ⇒ AT = 24cm

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Amplitude Amostral
Amplitude amostral (AA) é a diferença entre o valor máximo e o valor
mı́nimo da amostra.

AA = x(máx.) − x(min).

Em nosso exemplo, temos:

AA = 173 − 150 = 23 ⇒ AA = 23

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Ponto médio de uma classe


Ponto médio de uma classe (xi ) é, como o próprio nome indica, o ponto
em que divide o intervalo de classe em duas partes iguais.

Para obtemos o ponto médio de uma classe, calculamos a semi-soma doa


limites de classe (média aritmética):

li + Li
xi =
2

Assim, o ponto médio da segunda classe, em nosso exemplo, é


l2 + L2 154 + 158
x2 = ⇒ x2 = = 156 ⇒ x2 = 156cm
2 2
Obs: O ponto médio e bastante importante dentro de uma classe, pois
esse ponto é o valor que a representa.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Frequência simples ou absoluta


Frequência simples ou frequência absoluta ou, simplesmente,
frequência de uma classe ou de um valor individual é o número de
observações correspondentes a essa classe ou a esse valor.

Observação: Quando o resultado não é exato, devemos arrendondá-lo


para mais.
Na escolha dos limites dos intervalos, devemos, na medida do possivel,
procurar por números que facilite o cálculo dos pontos médio. o ideal
seria – números naturais.

Em nosso exemplo, temos: n=40, i=6.


Logo:
173 − 150 23
h= = = 3, 8 = 4,
6 6
Assim, temos seis classes de intervalos iguais a 4.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Tipos de frequências

Frequência relativa ou absoluta (fi )


São os valores que realmente representam o número de dados de cada
classe.
Observação: A soma das frequências simples é igual a número total de
dados: X
fi = n

Frequência relativa (fri )


São os valores das razões entre as frequências simples e a frequência
total:
fi
fri = P
fi

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplos

f3 = 11
11
fr3 = 40 = 0, 275 ⇒ fr3 = 0, 275

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Frequência acumulada (Fi )


É o total das frequência de todos os valores inferiores ao limite superior
do intervalo de uma classe:

Fk = f1 + f2 + · · · + fk
ou
X
Fk = f1
com i={1, 2, 3,. . . , k}

Exemplo: Na tabela anterior F3 = 4 + 9 + 11 = 24 ⇒ F3 = 24


O que significa que 24 alunos tem uma estatura inferior a 162 cm

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Frequência acumulada relativa


É a frequência acumulada da classe, dividida pela frequência total da
distribuição.

Fi
Fri = P
Fi

Exercı́cio de Fixação.
i Estatura(cm) fi xi fri Fi Fri
1 150 ` 150 4
2 154 ` 158 9
3 158 ` 162 11
4 162 ` 166 8
5 166 ` 170 5
6 170 ` 174 3

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Distribuição de frequência sem intervalos de classe


Quando se trata de variável discreta de variação relativamente pequena,
cada valor pode ser tomado com um intervalo de classe (intervalo
degenerado) e, nesse caso, a distribuição é chamada Distribuição sem
intervalos de classe. Observe o exemplo abaixo.

Figura: Tabela-1: Distribuição sem intervalos de classe

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exercı́cio de Fixação.

i xi fi fri Fi Fri
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 P1
= 20

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Representação gráfica de uma distribuição de frequência

Histograma
O histograma é formado por uma conjunto de retângulos justapostos,
cujas bases se localizam sobre o eixo horizontal, de tal modo que seus
pontos médios coincidam com os pontos médios dos intervalos de classe.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Polı́gono de frequência
O polı́gono de frequência é um gráfico em linha, sendo as frequência
marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos
pontos médios dos intervalos de classe.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo 2

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Polı́gono de frequência acumulada


O polı́gono de frequência acumulada é traçado marcando-se as
frequências acumuladas sobre perpendiculares no eixo horizontal,
levantadas nos pontos correspondentes aos limites superiores dos
intervalos de classe.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Distribuição de frequência sem intervalos de classe


Uma distribuição de frequência sem intervalos de classe é representada
graficamente por um diagrama onde cada valor da variável é representado
por um segmento de reta vertical e de comprimento porporcional á
resspectiva frequência. Assim, para nosso exemplo, temos:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Gráfico da frequência acumulada


Também podemos representar a distribuição pelo gráfico da frequência
acumulada, o qual se apresentará com pontos de descontinuidade nos
valores observados da variável:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

A Curva de frequência

Curva polida
Como, em geral, os dados coletados pertencem a uma amostra extraı́da
de uma população, podemos imaginar as amostras tornando-se cada vez
mais amplas e a amplitude das classes ficando cada vez menor, o que
permite concluir que a linha poligonal (contorno do polı́gono de
frequência) tende a se transformar numa curva – Curva de frequência
–, mostrando, de modo mais evidente, a verdadeira naturza da
distribuição da população.

Assim, após o traçado de um polı́gono de frequência, é desejavel, muitas


da vezes, que se lhe faça umpolimento, de modo a mostrar o que seria
tal polı́gono com um número maior de dados.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

O polimento, geometricamente, corresponde á eliminação dos vértices da


linha poligonal. Consegue-se isso com o emprego de uma fórmula
bastante simples, a qual, a partir das frequência reais, nos fornece novas
frequências –Frequências calculadas–(fci – que se localizarão, como no
polı́gono de frequência, nos pontos médios,

Fórmula
fi−1 + 2 f i + fi+1
fci =
4
fci é a frequência calculada da classe considerada;
fi é a frequência simples da classe considerada;
f1−i é a frequência simples da classe anterior á classe considerada;
f1+i é a frequência simples da classe posterior à classe considerada.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo de curva polida


Considerando nosso exemplo inicial temos:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

As formas das curvas de frequência

Curva em forma de sino


As curvas em forma de sino se caracterizam pelo fato de apresentarem
um valor máximo na região central.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Simétrica: Esta curva se caracteriza por apresentar o valor máximo


central e os pontos equidistantes desse ponto terem a mesma
frequência.
Assimétrica: Na pratica não obtemos uma distribuição
perfeitamente simétrica. As distribuições obtidas de medidas reais
são mais os menos assimétricas, em relação à frequência máxima.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Curvas em forma de Jota


As curvas em forma de jota são relativas a distribuição extremamente
assimétricas, caracterizadas por apresentar o ponto de ordenada máxima
em uma das extremidades.
São curvas comuns em fenômenos econômicos é financeiros: Distribuição
de renda pessoas ou de vencimentos.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Curvas em forma de U
As curvas em forma de U são caracterizadas por apresentarem ordenadas
máximas em ambas as extremidades.

A mortalidade por idade e um fenômeno que dá origem a uma curva


como essa.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Distribuição retangular
Essa distribuição, muito rara na verdade, apresenta todos as classes com
a mesma frequência.

Tal distribuição seria representada por um histograma em que todas as


colunas teriam a mesma altura, ou por um polı́gono de frequência
reduzido a um segmento de reta horizontal

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Elementos tı́picos da distribuição

medidas de posição.
medidas de variabilidade ou dispersão.
medidas de assimentria.
medidas de curtose.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de posição

As medidas de posição mais importante são as medidas de tendência


central, que recebem tal denominação pelo fato de os dados observados
tenderem, em geral, a se agrupar em torno dos valores centrais.

A média aritmética.
A mediana.
a moda
As outras medidas de posição são as separatrizes.
As própria meidana.
Os quartis.
Os decis.
Os percentis.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de posição

Média aritmética (x̄)


Média aritmética é o quociente da divisão da soma dos valores da
variável pelo número deles:

P
xi
(x̄) =
n
Sendo:
(x̄) a média aritmetrica.
xi os valores da variável.
n o número de valores.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de posição

Média aritmética (x̄) em dados não agrupados


Quando desejamos conhecer a média dos dados não agrupados,
determinamos a média aritmética simples.

Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante


uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para
produção média da semana:
10 + 14 + 13 + 15 + 16 + 18 + 12 98
(x̄) = = = 14
7 7
Logo: (x̄) = 14
Observação: Quando a média aritmética e diferente de todos os valores
da série de dados, dizemos que essa média não tem existência concreta.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de posição

Desvio em relação a média


Denominamos desvio em relação a média a diferença entre cada elemento
de um conjunto de valores e a média aritmética.

denotamos por di

di = xi − x̄
Exemplo: No exemplo amterior temos;
d1 = x1 − x̄ = 10 − 14 = −4
d2 = x2 − x̄ = 14 − 14 = 0
d3 = x3 − x̄ = 13 − 14 = −1
d4 = x4 − x̄ = 15 − 14 = 1
d5 = x5 − x̄ = 16 − 14 = 2
d6 = x6 − x̄ = 18 − 14 = 4
d7 = x7 − x̄ = 12 − 14 = −2

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Propriedades da média

propriedade 1:
A soma algébrica dos desvios tomados em relação a média é numa:

k
X
di = 0
i=1

propriedade 2:
Somando ou subtraindo uma constante (c) de todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuı́da)
dessa cosntante.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Propriedades da média

propriedade 3:
Multiplicando ou dividindo por uma constante (c) de todos os
valores de uma variável, a média do conjunto fica multiplicada, (ou
dividida), por essa cosntante.

yi = xi · c → ȳ = x̄ · c
xi x̄
yi = → ȳ =
c c

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados agrupados

Sem intervalos de classe


Nesse caso, como as frequência são números indicadores de intensidade
de cada valor da variável, elas funcionam como fatores de ponderação, o
que nos leva a calcular a média aritmética ponderada.

P
xi fi
x̄ = P
fi
Observação: O modo mais prático de obtenção da média aritmética
ponderada é abrir, na tabela, uma coluna correspondente oas podutos xi fi

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Temos, então:
78
x̄ = = 2, 29
34
Isto é:

x̄ = 2, 29 meninos

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados agrupados

Com intervalos de classe


Nesse caso, convencionamos que todos os valores incluidos em uma
determinada classe coincidem com o seu ponto média, e determinamos a
média aritmética ponderada por meio da fórmula:

P
xi fi
x̄ = P
fi
Onde xi é o ponto médio da classe.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados agrupado

Exemplo
Dada a tabela baixo temos.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados agrupado

Logo temos:
6440
x̄ = = 161
40

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Processo breve
Baseia-se em uma mudança de variável x por outra y, tal que
xi − x0
yi =
h
Onde x0 é uma constante arbitrária escolhida convenientemente dentre os
pontos médios da distribuição – de preferencia o de maior frequência.
Fazendo essa mudança de variável, pelos propriedades 2 e 3, vai ocorrer
uma mudança no resultado, basta agora, multiplicamos por h e somamos
por x0 donde obtemos a fórmula.
P
( yi f i ) · h
x̄ = x0 + P
fi
Assim, para o exemplo acima, escolhendo x0 como o ponto média da
maior frequência, temos:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Processo breve

Aplicando a fórmula, temos:


14 · 4
x̄ = 160 + = 161
40

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Processo breve

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Processo breve

Aplicando a fórmula, temos:


14 · 4
x̄ = 160 + = 161
40

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Moda (Mo)

Definição
Denominamos moda o valor que ocorre com maior frequência em uma
série de valores.

Dados não agrupados


Quando lidamos com valores não agrupado, a moda é facilmente
reconhecida, de acordo com a definição, procuramos o valor que mais se
repete.

Exemplo: A série de dados 7,8,9,10,10,10,11,12,13,15. tem moda igual


a 10.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Moda (Mo)

Dados agrupados sem intervalos de classe


Nesse caso, basta olhar para a classe e que a frequência mais se repete.

Dados agrupados com intervalos de classe


A classe que apresenta a maior frequência, e chamada classe modal,
nesse caso, basta calcular o ponto média da classe modal, a esse valor,
damos a denominação de moda bruta.

l∗ + L∗
Mo =
2
Onde: l∗ é o limite inferior da classe modal.
L∗ é o limite superior da classe modal.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo:

158 + 162
Mo = = 160
2
Logo temos: M o = 160 cm

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Observação
Há, para o cálculo da moda, outros métodos, mais elaborados, como por
exemplo, o uso da fórmula de Czuber.
D1
M o = l∗ + · h∗
D1 + D2
No qual:
l∗ e o limete inferior da classe modal.
h∗ e a amplitude da classe modal.
D1 = f∗ − f(ant).
D2 = f∗ − f(post).
f∗ e a frequência simples da classe modal f(ant) frequência simples
anterior a classe modal f(post) frequência simples posterior a classe modal

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Mediana (Me)

mediana
A mediana é uma medida de posição. É, também, uma separatriz, pois
divide o conjunto em duas partes iguais, com o mesmo número de
elementos.
O valor da mediana encontra-se no centro da série estatı́stica organizada,
de tal forma que o número de elementos situados antes desse valor
(mediana) é igual ao número de elementos que se encontram após esse
mesmo valor (mediana).

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados não tabelados:


n ı́mpar: Para uma série com número ı́mpar de itens: a mediana
corresponde ao valor central.
A mediana será o termo de ordem (n+1)/2.
Exemplo: Dada a série de valores abaixo.

5, 13, 10, 2, 18, 15, 6, 19, 9


O valor da mediana será 10, pois organizando esses dados em rol, o valor
centrar sera a mediana. Me=10.

n par: Para uma série com número par de itens: não há termo central
único, mas, sim, dois termos centrais. Logo;
A mediana será a média aritmética entre os termos centrais.
Exemplo: Dada a série de valores abaixo.

5, 13, 10, 2, 18, 15, 6, 19, 9, 3


Organizando em rol, temos que a mediana sera Me=9,5. Pois os valores
centrais são 9 e 10.
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Mediana em dados tabulados:

Neste caso, o problema consiste em determinar o ponto do intervalo em


que está compreendida a mediana.

Sem intervalo de classe: Devemos, primeiro, obter a localização da


mediana na série através do termo de ordem:
P
fi
Fi =
2
Para isso, devemos calcular a frequência acumulada, e observar a
frequência acumulada de menor valor que supera Fi , e observar seu valor.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo:

34
= 17
2
A menor frequência acumulada que supera esse valor é 18. Assim, temos
que a mediana e igual a 2.

Me = 2meninos

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

observação:
No caso de existir um frequência acumulada (Fi ), tal que:
P
fi
Fi =
2
A mediana será dada por
xi + xi+1
Md =
2
Isto é, a média aritmética entre o valor correspondente a essa frequência
acumulada e a posterior.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo:

Fi = 8/2 = 4 → F3
Veja que existe na tabela essa frequência. Assim:
15 + 16
Me = = 15, 5
2

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Com intervalos de classe

Neste caso, o problema consiste em determinar o ponto do intervalo em


que está compreendido a mediana.

Para isso, determinaremos a classe no qual se acha a mediana –Classe


mediana–. Tal classe será, evidentemente, aquelaP correspondente á
frequência cumulada imediatamente superior a 2fi .
Feito isso, um problema de interpolação resolve a questão, admitindo-se,
agora, que os valores se distribui uniformemente em todo o intervalo de
classe.
Interpolação: É a inserção de uma determinada quantidade de valores
entre dois números dados.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplo:

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Como há 24 valores incluı́dos nas três primeiras classes e queremos


determinar o valor que ocupa a 20 posição, a partir do inicio da série.
Como existe, 11 valores nessa classe, e o intervalo de classe e igual a 4,
devemos tomar, a partir do limite inferior, a distância.
20 − 13
·4
11
Assim a mediana será:
20 − 13
M d = 158 + · 4 = 158 + 2, 54 = 160, 54.
11
Assim temos, Me=160,54 cm.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Importante
observação: Usaremos sempre essa fórmula para a mediana em dados
agrupados
(n/2 − Fant )
Me = li + ·h
fi
Onde:
li é o limite inferior da classe mediana;
Fant é a frequência acumulada anteiror limite superior da classe anterior
a classe mediana;
fi é a frequência simples da classe mediana;
h amplitude da classe.

Essa mesma fórmula será usada para encontramos as outras medidas


separatrizes, quartil, decil e percentil, a única diferencia é que, para a
mediana, encontramos a classe mediana, dividindo por 2 o número de
dados, para as outras medidas, dividiremos por 4, 10 e 100
respectivamente.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Posição relativa da média, mediana e moda.

Quando uma distribuição é simétrica, as três medidas coincidem. Porém,


a assimétrica torna-se diferentes, e essa diferença é tanto maior quanto
maior sor a assimetria.
Assimm, para uma distribuição de frequência em forma de sino, temos

x̄ = M d = M o se a curva for simétrica

M o < M d < x̄ se a curva for assimétrica positiva


x̄ < M d < M o se a curva for assimétrica negativa

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Separatrizes

os quatis
Denominamos Quartis os valores de uma série que a dividem em quatro
partes iguais.

há, portanto, três quartis;


1o quartil (Q1 ) Valor situado de tal modo na série que uma quarta parte
(25%) dos dados é menor que ele e as três quartas partes restantes
75(%) são maiores.
2o quartil (Q2 ) Valor situado de tal modo na série que metade (50%)
dos dados é menor que ele e a outra metade restantes 50(%) são
maiores. coincide com a mediana.
3o quartil (Q3 ) Valor situado de tal modo na série que as três quartas
parte (75%) dos dados é menor que ele e uma quarta parte restantes
25(%) são maiores.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

observação: Quando os dados são agrupados, para determinar os quartis


usamos a mesma técnica
P do cálculo da mediana, bastando substituir, na
fórmula da mediana, 2fi por:
P
k fi
4
Sendo k o número de ordem do quartil,
Assim, temos:

(kn/4 − Fant )
Qk = li + ·h
fi
Onde:
li é o limite inferior da classe mediana;
lant é o limite superior da classe anterior a classe mediana;
fi é a frequência simples da classe mediana;
h amplitude da classe.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Exemplos

1◦ Quartil
40
Temos = 10
4
Assim a classe do 1◦ quatil será a segunda. Pois 13 e a primeira
frequência acumulada superior a 10.

(10 − 4)
Q1 = 154 + · 4 = 156, 66
9
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Continuação do exemplo:
3◦ Quartil
3 · 40
Temos = 30
4
Assim a classe do 3◦ quatil será a quarta. Pois 32 e a primeira frequência
acumulada superior a 30.

(30 − 24)
Q3 = 162 + · 4 = 165
8

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

percentis
Denominamos percentis os 99 valores que dividem a série em 100 partes
iguais.

Indicamos por Pi com i={1, 2, 3, · · · 99}


O cálculo dos percentis
P seguePa mesma técnica do cálculo da mediana,
fi k fi
basta substituir por onde k é o número da ordem do
2 100
percentil.

(kn/100 − Fant )
Pk = li + ·h
fi
Exemplo: Considerando o exemplo anterior calcule P8 .
8 · 40
Solução: Temos que = 3, 2

100
Assim, a classe do 8 será a primeira. Logo:
3, 2 − 0
P8 = 150 + · 4 = 153, 2
4
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Medidas de Dispersão ou de Variabilidade


Observe o seguinte exemplo:
Considere os seguintes conjuntos de valores das variáveis X, Y e Z.
X: 70,70,70,70,70
Y: 68,69,70,71,72
Z: 5,15,50,120,160,
Calculando a média aritmética de cada um desses conjuntos, obtemos

X̄ = Ȳ = Z̄ = 70

Veja, então, que os três conjuntos apresentam a mesma média aritmética


70.
Entretanto, é fácil perceber que o conjunto X é mais homogêneo que os
conjuntos Y e Z, já que todos os valores são iguais a média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há
menos diversificação entre cada um de seus valores e a média
representativa.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Definição
Chamamos de dispersão ou variabilidade a maior ou menor
diversificação dos valores de uma variável em torno de um valor de
tendência central tomado como ponto de comparação, podemos dizer
que o conjunto X apresenta Dispersão ou Variabilidade nula e que o
conjunto Y apresenta uma dispersão menor que o conjunto Z.

Portanto, para qualificar os valores de uma dada variável, ressaltando a


maior ou menor dispersão ou variabilidade entre esses valores e a sua
medida de posição, a estátistica recorre ás Medidas de dispersão ou de
Variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio
padrão e o coeficiente de variação.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade-Dados não


agrupados

A amplitude total
É a diferença entre o maior e o menor valor observado:
AT=x(máx.)-x(min.)

Exemplo: Para os valores:

40, 45, 48, 52, 54, 62, 70


temos:
AT= 70-40=30
Logo:
AT=30

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Quando dizemos que a amplitude total dos valores é 30, estamos


afirmando alguma coisa do grau de sua concentração. É evidente que,
quanto maior a amplitude total, maior a dispersão ou variabilidade dos
valores da variável.
Voltemos os conjuntos X,Y,Z, temos que a amplitude total de cada um
nos diz qual dos três conjuntos, os valores são mais homogêneos. Veja:
ATX =70-70=0 (Dispersão nula)
ATY =72-68=4
ATZ =160-5=155

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade-Dados agrupados

A amplitude total-Sem intervalos de classe


Neste caso, ainda temos:
AT=x(máx.)-x(min.)

Exemplo: Considere a tabela abaixo:


xi fi
0 2
1 6
2 12
3 7
4 3
temos:
AT= 4-0=4
Logo:
AT=4
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade-Dados agrupados

A amplitude total-Com intervalos de classe


Neste caso, a amplitude total é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe:
AT=L(máx.)-l(min.)

Exemplo: Considere a tabela abaixo:

temos:
AT= 174-150 = 24
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

A amplitude total tem o inconveniente de só levar em conta os dois


valores extremos da série, descuidado do conjunto de valores
intermediários, o que quase sempre invalida a idoneidade do resultado.
Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da

temperatura em um dia ou no ano, no controle de qualidade ou como


uma medida de cálculo rápido, e quando a compreensão popular é mais
importante que a exatidão e a estabilidade.

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade


Como vimos, a amplitude total é instável, por se deixar influenciar pelos
valores extremos, que são, na sua maioria, devidos ao acaso.

A variância e o desvio padrão são medidas que fogem a essa falha, pois
levam em consideração a totalidade dos valores da variável em estudo, o
que faz delas ı́ndices de variabilidade bastante estáveis e, por isso
mesmos, os mais geralmente empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém


determinamos a média aritmética dos quadrados dos desvios, assim,
representamos a variância por s2 , temos:

(xi − x̄)2
P
s2 = P
fi
P
Lembre que fi = n

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade


Observação: Quando nosso interesse não se restringe á descrição dos
dados, mas sim, partindo da amostrar tirar inferências válidas para a
respectiva população, convém efetuar uma modificação, que consiste me
trocar o denominar da fórmula anterior por n-1.
Assim

(xi − x̄)2
P
2
s =
n−1

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade

Desvio padrão
Definimos desvio padrão como a raiz quadrada da variância e
representamos por s:

Assim:
sP
(xi − x̄)2
s= P
fi

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Observação 1: Ambas as medidas, desvio padrão e variância são


importante no estudo da estatı́stica. A variância apesar de possuir pouca
utilidade na estatı́stica descritiva, e muito importante na inferência
estatı́stica e em combinações de amostrais.

Observação 2: Podemos também usar a fórmula abaixo para o cálculo do


desvio padrão.
sP  P 2
x2i xi
s= −
n n

Essa fórmula além de mais prática e ainda mais precisa, pois quando a
média não e exata e tem de ser arrendondada, cada desvio fica
ligeiramente afetado do erro, devido esse arrendondamento.

Observação 3: Se adicionamos (ou subtraı́mos) uma constante qualquer


a todos os valores de uma variável o desvio padrão não se altera. Mas se
multiplicamos todos os dados por uma contante (diferente de zero)
qualquer , o desvio padrão ficará também multiplicado por essa
constante.
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade

Exemplo: Cálculo do desvio padrão em dados não agrupados


Tomemos o conjunto de valores da variável x

40, 45, 48, 52, 54, 62, 70

Como n=7, temos


s 2 p
√ √

20293 371
s= − = 2899 − 532 = 2899 − 2809 = 90 = 9, 486
7 7

Logo:
s = 9, 49
Observação:
20293= 402 + 452 + 482 + 522 + 542 + 622 + 702

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade

Dados agrupados – sem intervalos de classe


Como, neste caso, temos a presença de frequência, devemos levá-la em
consideração, resultando a fórmula:

sP 2
fi x2i
P
fi xi
s= −
n n

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Dados agrupados – sem intervalos de classe


Exemplo:

Logo:
s  2
165 63 p p
s= − = 5, 5 − 4, 41 = 1, 09 = 1, 044
30 30
Assim:
s = 1, 04
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade

Dados agrupados – Com intervalos de classe


Nesse caso, usamos o ponto médio da classe como representante dessa, e
aplicamos a fórmula vista anterior.

Exemplo:

s 2
√ √

1.038.080 6.440
s= − = 25.952 − 25.921 = 31 = 5, 567 ∼
= 5, 57
40 40
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade


Processo breve

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Medidas de dispersão ou variabilidade


Exemplo:

Logo:
s  2
80 10
= 4 2 − 0, 0625 = 4 1, 9375 = 5, 5676 ∼
p p
s= − = 5, 57
40 40

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Referências

CRESPO, Antônio. Estatı́stica Fácil - 19a Ed. 2009

Profa Lêda Ferreira Cabral Estudo de estatı́stica


Introdução
Fundamentação Teórica
Referências

Bons Estudos
A todos.

Profa Lêda Ferreira Cabral Estudo de estatı́stica

Você também pode gostar