Você está na página 1de 38

TEMA V

Estatística
Introdução

O trabalho dos estatísticos consiste em extrair informação e identificar


padrões ou tendências que permitam compreender melhor a realidade.
Analisando os dados de uma forma sistemática e fundamentada, pode ser
extraído o máximo de informação fiável e imparcial.

Quando pretendemos estudar um determinado fenómeno, o primeiro passo é,


em geral, a realização de uma análise exploratória.

Esta consiste na utilização de um conjunto de técnicas de organização,


tratamento e apresentação de dados que facilita a interpretação da
informação neles contida.

Expoente10
Introdução
Esta informação permite-nos compreender melhor o mundo em que vivemos
e também nos pode ajudar a tomar decisões de uma forma mais
fundamentada.
OMS avisa que Portugal é dos países europeus com mais
excesso de peso infantil
CLÁUDIA BANCALEIRO 
25/02/2014 – Público

Na Europa, mais de 27% das crianças com 13 anos e 33%


com 11 anos têm excesso de peso. Portugal está entre os
países com piores indicadores:
aos 11 anos, 32% das crianças têm peso a mais.

Expoente10
Introdução
Quando, num estudo estatístico, utilizamos a totalidade dos elementos de
uma população, dizemos que se trata de um censo.

No entanto, em geral, não é possível ou é impraticável utilizar a totalidade dos


elementos de uma população e, neste caso, dizemos que se trata de uma
sondagem.

A escolha de uma amostra representativa é muito importante para ser possível


generalizar os resultados do estudo à população.

Ao conjunto de técnicas que permitem generalizar resultados provenientes de


uma amostra a toda a população chamamos estatística indutiva.

A estatística indutiva não será aqui explorada. Ao longo deste tema


abordaremos apenas conceitos relacionados com a estatística descritiva.

Expoente10
 
Somatório
Os somatórios são formas de representar somas e podem ser bastante úteis
na exploração de propriedades da estatística, de outros temas da matemática
ou de outras áreas do saber.

Exemplo:
Consideremos a sequência de números reais e representemos o seu termo de
ordem por .
A soma dos quatro termos da sequência pode ser representada por , ou seja,

Expoente10
 
Somatório
No exemplo anterior, considerámos a soma de todos os termos de uma
sequência. No entanto, este tipo de representação pode também ser utilizado
para representar outras somas.

Exemplo:
Consideremos a sequência de números reais e representemos o seu termo de
ordem por .
A soma dos três últimos termos da sequência pode ser representada por , ou
seja,

Expoente10
 
Somatório
As propriedades que apresentamos em seguida podem ser demonstradas
utilizando as propriedades da adição que tão bem conheces.

Exemplo:
Consideremos a sequência de números reais e representemos o seu termo de
ordem por .
A soma dos quatro termos da sequência pode ser representada por . Assim, .

Se multiplicarmos cada um dos termos da sequência anterior por 3, obtemos


uma nova sequência, (9, 27, 6, 12). Se representarmos o seu termo de ordem
por podemos representar a soma dos seus termos por . Tendo em conta que ,
esta propriedade permite-nos concluir que .

Expoente10
 
Somatório
A seguinte propriedade é referente à propriedade associativa da adição
aplicada à soma de p parcelas de uma sequência.

Exemplo:
Consideremos a sequência de números reais e representemos o seu termo de
ordem por .
Pela propriedade associativa da adição, sabemos que . Esta igualdade pode ser
representada através de somatórios por = .

Expoente10
 
Somatório
Por fim, apresentamos uma propriedade que resulta da aplicação das
propriedades comutativa e associativa da adição.

Exemplo:
Consideremos as sequências de números reais e e representemos os seus
termos de ordem por e , respetivamente.
Uma vez que e podemos concluir que a soma dos termos da sequência , cujo
termo de ordem é , é dada por .

Expoente10
Somatório
Para praticares o manuseamento de expressões com esta representação,
sugerimos que faças alguns exercícios.

Do manual (margem):
2 e 3 da página 155
4 e 5 da página 156

Do manual (“Aprende Fazendo”):


21 da página 192
38 da página 196

Calvin & Hobbes, Bill Watterson

Expoente10
Conceitos fundamentais
Recorda alguns conceitos fundamentais de estatística que aprendeste em anos
anteriores:

Exemplo:
Num estudo sobre as características do cavalo garrano, a população é o
conjunto de todos os cavalos garranos e cada um dos cavalos garranos é uma
unidade estatística.

Expoente10
Conceitos fundamentais

Exemplo:
O conjunto de cavalos garranos utilizados para a recolha dos dados constitui a
amostra, sendo a sua dimensão o número de cavalos utilizados.

Expoente10
Conceitos fundamentais

Exemplo:
Para se caracterizar esta raça de cavalos podem registar-se, por exemplo, a
“massa”, o “comprimento”, a “cor da pelagem”, o “tipo de alimentação”, entre
outras características. Cada uma destas características constitui uma variável
estatística que pode tomar valores diferentes para diferentes cavalos.

Expoente10
Conceitos fundamentais
A classificação das variáveis estatísticas deve ser utilizada na identificação das
formas mais adequadas de organizar, apresentar e interpretar a informação
contida numa amostra de valores.

Exemplo:
O “comprimento da cabeça” e a “idade” de um cavalo são variáveis
quantitativas ou numéricas, enquanto a “cor da pelagem” ou o “tipo de
alimentos” são variáveis qualitativas.

Expoente10
Conceitos fundamentais

Exemplo:
A “cor da pelagem” ou o “tipo de alimentos” são variáveis qualitativas
nominais. Se considerarmos a variável “temperamento”, que pode tomar os
valores “pouco dócil”, “dócil” ou “muito dócil”, estamos perante uma variável
qualitativa ordinal.

Expoente10
Conceitos fundamentais

Exemplo:
As variáveis “comprimento da cauda” ou “idade” são variáveis quantitativas
contínuas, enquanto as variáveis “número de descendentes” ou “número de
manchas” são variáveis quantitativas discretas.

Expoente10
 
Conceitos fundamentais
Uma amostra deve ser representada por uma sequência de valores.

Por exemplo, se considerarmos a variável “número de descendentes”,


podemos recolher a amostra . Se considerarmos a variável “serra onde vive”,
podemos recolher a amostra
.

Repara que, ao recolhermos informações sobre diversas variáveis referentes à


mesma unidade estatística, é importante que elas tenham a mesma ordem na
sequência. Podemos desta forma afirmar que o cavalo que vive na Serra
Amarela tem cinco descendentes.

Expoente10
 
Conceitos fundamentais
Em geral, uma variável estatística pode tomar valores iguais para diferentes
unidades estatísticas. No exemplo anterior, , podemos verificar que existem
três cavalos com o mesmo número de descendentes.

Assim, o conjunto de valores desta amostra é .

Expoente10
 
Conceitos fundamentais

Nota:
No que se segue, foram consideradas apenas variáveis numéricas.

Consideremos a variável “número de descendentes” e a seguinte amostra de


dimensão 20, .

Os conceitos que em seguida introduzimos permitem-nos apresentar a


informação contida numa amostra como esta, de uma forma mais organizada.

Expoente10
Conceitos fundamentais

O conceito de frequência absoluta permite-nos, por exemplo, construir uma


tabela de frequências como a seguinte:
Número de Ao agruparmos os dados, a informação
descendentes
fica mais organizada e a leitura da
0 6 informação torna-se muito mais
1 6 simples.

2 2 Podemos ver rapidamente que nesta


3 4 amostra existem quatro cavalos que
4 2 têm três descendentes.
Expoente10
Conceitos fundamentais

Nesta amostra, a frequência absoluta acumulada de 1 é 12, ou seja, existem


12 cavalos que têm no máximo um descendente.

Expoente10
Conceitos fundamentais

Podemos utilizar o conceito de frequência relativa para, por exemplo, construir


um gráfico circular.

Expoente10
Conceitos fundamentais

Nesta amostra, a frequência relativa acumulada de 2 é 70%. Podemos assim


afirmar que 70% dos cavalos desta amostra têm no máximo dois
descendentes.

Expoente10
 
Conceitos fundamentais
Quando trabalhamos com uma variável contínua ou com uma variável
discreta, que adquire muitos valores distintos, podemos agrupar os valores em
classes para os representar de uma forma muito mais simples.

Se considerarmos a variável “altura”, em metros, e a seguinte amostra


= (1,32; 1,35; 1,25; 1,17; 1,05; 1,14; 0,9; 1,16; 1,09; 1,11; 1,22), podemos
apresentar os dados através da seguinte tabela:

Altura Nº de cavalos Apesar de a leitura ficar mais


1 simples, devemos ter a noção que,
ao agrupar os dados em classes,
2 parte da informação perde-se na
4 representação dos dados.
Com esta tabela não somos
2
capazes de distinguir os valores
2 que pertencem a cada classe.

Expoente10
Medidas de localização
As medidas de localização são das formas mais utilizadas para caracterizar a
informação contida numa amostra. Estas medidas permitem identificar
algumas localizações num conjunto de dados numéricos. As medidas de
tendência central, por exemplo, dão a indicação do centro da distribuição dos
dados.

Nos casos em que os dados se encontram agrupados em classes, devemos


considerar a moda como sendo a classe com maior frequência absoluta.
A esta classe podemos chamar classe modal.

Expoente10
 
Medidas de localização
Quando pretendemos utilizar a média para indicar o centro dos valores de
uma amostra e os dados não estão agrupados, podemos utilizar a definição:

Se considerarmos a variável “número de descendentes” e a amostra


anteriormente apresentada,
, podemos calcular a média através da expressão:

Expoente10
 
Medidas de localização
Mas se os dados estiverem agrupados é mais rápido utilizar a seguinte
propriedade:

Número de
descendentes

Repara que com os dados agrupados podemos 0 6

calcular a média utilizando a expressão: 1 6


2 2
3 4
4 2

Expoente10
 
Medidas de localização
Quando trabalhamos com a variável “altura”, optamos por apresentar a
informação com os dados agrupados em classes, perdendo assim alguma
informação. Desta forma, utilizando os dados agrupados, não é possível
calcular o valor exato da média.

Nestas situações, mesmo quando apresentamos os dados agrupados em


classes, devemos, sempre que seja possível, utilizar os dados não agrupados
no cálculo da média.
Se tal não for possível, podemos calcular uma aproximação para o valor da
média, utilizar o ponto médio de cada classe j como valor de na fórmula da
média para dados agrupados: Altura Nº de cavalos
1
2
4
2
2

Expoente10
Medidas de localização
Uma outra medida estatística que pode ser utilizada para indicar o centro dos
valores da amostra é a mediana. Para determinarmos o seu valor, é necessário
considerar a amostra ordenada.

Expoente10
 
Medidas de localização

Se considerarmos a variável “número de descendentes”, podemos ordenar a


amostra anteriormente apresentada, obtendo a seguinte sequência .
Uma vez que a dimensão desta amostra é par, a mediana obtém-se através da
expressão:

Expoente10
 
Medidas de localização
Além das medidas de localização de tendência central, como a moda, a média
e a mediana, existem outras medidas de localização de tendência não central.

O valor de pode ser interpretado como:


• a percentagem de valores da amostra inferiores ou iguais a é pelo menos
• é o valor acima do qual estão, quando muito, (100 – k)% dos elementos da
amostra.

Expoente10
 
Medidas de localização
Se considerarmos novamente a variável “número de descendentes” de uma
amostra ordenada , podemos obter diferentes percentis.
Como exemplo, vamos determinar os percentis 1, 30 e 100.

. Como não é um número inteiro, .

. Como é um número inteiro, .

Neste caso específico, o percentil é o máximo da amostra. Assim, .

Expoente10
 
Medidas de localização
Alguns percentis são utilizados com maior frequência. Já falaste em anos
anteriores nas medidas de localização designadas por quartis. Estas medidas
podem ser definidas como casos particulares de percentis.

Considerando novamente a variável “número de descendentes” de uma


amostra ordenada , temos que
, e.

Expoente10
 
Medidas de localização
Tal como no caso da média, é possível determinar uma aproximação para o
valor de um percentil a partir de dados agrupados em classes.

Nas condições da definição, podemos também obter uma aproximação para o


valor do percentil através da condição:

Expoente10
 
Medidas de localização
A informação referente à variável “altura” foi agrupada Altura Nº de cavalos

em classes, tal como se apresenta na tabela. 1

Utilizando estes dados agrupados, podemos determinar 2

aproximações para o valor dos percentis. 4

Como exemplo, vamos determinar uma aproximação 2

para o percentil 75. 2

Recorda que pelo menos 75% dos valores da amostra devem ser inferiores ou
iguais a . Como a amostra tem dimensão 11, temos que .
Desta forma, existem pelo menos nove valores inferiores ou iguais a .

Repara que a frequência absoluta acumulada da classe é 7 e a frequência


absoluta acumulada da classe é 9. Sabemos então que o valor deste percentil
pertence à classe .
Como a classe é a 4ª classe, sabemos que o valor de na condição é 4.

Expoente10
 
Medidas de localização
Além disso , sabemos que a amplitude das classes é .
Assim, podemos determinar o valor do percentil 75 através da expressão:

Desta forma, temos que .


Repara que os três primeiros
termos do 1º membro podem ser
interpretados como a área das três
primeiras barras do histograma,
o 4º termo como a área a
sombreado da 4ª barra e o 2º
membro como 75% da área de
uma barra de base e altura
igual à dimensão da amostra (área
total do histograma).
O valor de é então o valor que
faz com que a área a sombreado
seja 75% da área total do histograma.

Expoente10
 
Medidas de localização
As medidas de localização devem ser utilizadas para, de uma forma muito
sucinta, transmitir informação sobre a amostra em causa. Devemos no entanto
ser cuidadosos na sua interpretação e conhecer as suas limitações.

Num exemplo anterior, verificamos que, no que diz respeito ao número de


descendentes, .

Não podemos, no entanto, afirmar que a percentagem de cavalos com um ou


menos descendentes é 50%. Tal como explicado anteriormente, o valor deste
percentil permite-nos afirmar que a percentagem de cavalos com um ou
menos descendentes é pelo menos 50%.

Repara que a percentagem exata de cavalos da amostra com um ou menos


descendentes é 60%.

Expoente10
Medidas de localização
Para consolidares os conceitos introduzidos, sugerimos que faças alguns
exercícios.

Do manual (margem):
9 da página 159
11 da página 161
16 da página 164
17 da página 165
19 da página 168

Do manual (“Aprende Fazendo”):


3 da página 188
16 da página 191
20 da página 192 Calvin & Hobbes, Bill Watterson

25 da página 193

Expoente10

Você também pode gostar