Você está na página 1de 62

Estatística

A Estatística estuda uma ou várias características ou


propriedades de uma população através da recolha,
classificação, apresentação e interpretação dos dados que se
pretendem estudar
Estatistica Descritiva:
Consiste na recolha, apresentação, análise e interpretação de
dados numéricos através da criação de instrumentos
adequados (quadros, gráficos, indicadores numéricos). O seu
objetivo é sumariar e descrever os aspetos relevantes num
conjunto de dado
Estatística Indutiva ou Inferência Estatística:
Permite retirar conclusões sobre um determinado grupo
(população ou universo) a partir da informação recolhida para
uma amostra A imagem Esta Fotografia de Autor Desconhecido está licenciada ao abrigo da CC BY-SA
Utilidade da
Estatística
• Descreve e compreende relações
entre variáveis.
• Permite a tomada de melhores e
mais rápidas decisões
• Facilita a tomada de decisões
para fazer face à mudança.

A imagem Esta Fotografia de Autor Desconhecido está licenciada ao abrigo da CC BY-SA


População e
População: conjunto de elementos com pelo menos uma
Amostra Unidade estatística: é cada um dos elementos da popula
Dimensão ou efetivo da população: é o número de elem
A estatística descritiva pretende medir
ou contar os dados obtidos na
tomada de observações de uma
determinada fonte.
Essa fonte de observação constitui a
população ou universo.
Na maior parte das vezes, é
impossível conhecer as características
de todos os elementos da população.
Assim, retira-se uma amostra ou
subconjunto dessa população, para a
qual serão então estudadas as
características.
Amostra: subconjunto finito da
população.
Recenseamento: estudo
estatístico que incide sobre
todos os elementos da
população.
Sondagem: estudo estatístico
que incide apenas em uma
amostra da população.
Tipos de variáveis/dados
A variável estatística é aquilo que se está a estudar, e esta pode ser:

- Variável estatística qualitativa: não podem ser expressas numericamente, pois relacionam
situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel,
preferência musical entre outras.

- Variável estatística quantitativa: são expressas numericamente, quer através de uma


contagem, quer através de uma medição; podem dividir-se em:

• variável estatística quantitativa discreta que só toma valores isolados, como por exemplo
o número de irmãos;
• variável estatística quantitativa continua que toma qualquer valor de um dado intervalo,
como por exemplo a altura, a temperatura, o peso.
Metodologia para a resolução de um
problema estatístico
Exercicios:
REPRESENTAÇÃO TABULAR
.
Tabela de distribuição de
frequências
Frequência Absoluta é o número de vezes que um determinado valor da variável é
observado (resulta de uma contagem).

A frequência relativa é o quociente entre cada frequência absoluta e o número


total de observações. Pode ser apresentado sob a forma de dizima, fração
irredutível pu percentagem

A frequência absoluta acumulada e frequência relativa acumulada resulta da


soma das frequências absolutas ou relativas anteriores, respetivamente.
A construção de uma tabela de frequências para dados
qualitativos ou quantitativos discretos depende da
definição das seguintes colunas:
•Dados quantitativos contínuos
Quando os dados são do tipo quantitativo contínuo então é necessário definir 𝐾 classes de valores,
que constituem as categorias dos dados em estudo.

REGRA DE STURGES
REPRESENTAÇÕES GRÁFICAS

DADOS UNIVARIADOS
Quando se estuda um grupo de dados, sente-se a necessidade de sintetizar a informação num
ou vários indicadores, de forma a condensar o conhecimento que se tem da distribuição, mas
também de comparar com outras distribuições.
REPRESENTAÇÕES GRÁFICAS

DADOS MULTIVARIADOS
Tabela de contingência para dados bivariados
MEDIDAS DE LOCALIZAÇÃO

Posicionam a distribuição de uma variável no conjunto de todos os valores


possíveis.
São particularmente importantes as medidas de tendência central (média, mediana
e ainda a moda e os quartis) pois localizam a parte central da distribuição.
É o centro de gravidade ou de equilíbrio dos dados de uma variável.
Calcula-se utilizando a expressão:

Chama-se desvio de uma observação relativamente à média a


A media aritmética, apesar se fácil e rápida de calcular, apresenta a desvantagem de ser
muito sensível a valores muito pequenos ou muito grandes no conjunto dos dados. Os
valores existentes numa amostra que se distinguem muito dos restantes por serem
demasiado grandes ou demasiado pequenos, são valores que se apresentam como
candidatos a outliers. Mais adiante daremos uma regra empírica que permitirá classificar um
valor como outlier
Uma medida robusta relativamente ao valor das observações extremas,
no sentido de não ser afetada por esse valor, é a mediana.
A mediana de um conjunto de n observações é o valor do meio, depois de
dispostos os dados por ordem crescente de grandeza. Trata-se portanto de
uma medida de posição; é costume representar-se por ou ainda me.
É o valor do eixo das abcissas tal que a ordenada levantada nesse ponto divide a área do
histograma em duas áreas iguais.
MEDIDAS DE DISPERSÃO

As medidas de localização não fornecem informação suficiente para caracterizar um conjunto de dados.

Para analisar a concentração ou dispersão dos dados observados são necessários outras medidas.
Assim, as medidas de dispersão identificam o modo como os valores observados se afastam das medidas
de tendência central.
As medidas de dispersão mais utilizadas são a amplitude total, a amplitude interquartis, a variância e o
desvio-padrão.
Uma outra medida análoga, mas mais informativa e menos afetada pelos valores extremos é a
Amplitude inter-quartil definida como

AIQ = Q3 − Q1.

Nas distribuições simétricas o intervalo ( − ASQ, + ASQ) contém 50% das observações, onde ASQ
= (Q3 − Q1)/2 se designa por amplitude semi-quartil.

Mas também ASQ ignora a informação contida na zona central e nas zonas extremas das observações.

Você também pode gostar