Você está na página 1de 19

Estatística - 2º Período

A estatística é uma ciência que estuda uma ou varias características ou propriedades de uma população
tendo por base a recolha, classificação, apresentação e interpretação dos dados sobre o fenómeno em
estudo.

 Noções básicas sobre estatística:


- População: sobre quem é o estudo
- Amostra: quem responde
- Variável estatística: sobre o que é o estudo
- Unidade estatística: cada elemento da população
- Efectivo da população: número de elementos da população
- Censo: estudo estatístico que incide sobre todos os elementos de uma população
- Sondagem: estudo estatístico em que se utiliza apenas uma amostra da população

 Variáveis estatísticas:
A variável estatística é aquilo que se está a estudar, e esta pode ser:
- Variável estatística qualitativa: não podem ser expressas numericamente, pois relacionam situações
como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical
entre outras.
- Variável estatística quantitativa: são expressas numericamente, quer traves de uma contagem, quer
através de uma medição; podem dividir-se em variável estatística quantitativa discreta que só toma
valores isolados, como por exemplo o número de irmãos; e em variável estatística quantitativa
continua que toma qualquer valor de um dado intervalo, como por exemplo a altura, a temperatura, o
peso.

 Planeamento e aquisição de dados:


Uma análise estatística envolve, geralmente, duas fases fundamentais e com objectivos distintos:
- Estatística Descritiva, que visa descrever o real de forma a permitir entendê-lo melhor; trata da
recolha, classificação e redução dos dados com vista a descrever e interpretar a realidade actual ou
factos passados relativos ao conjunto observado. O seu objectivo é informar, prevenir, esclarecer.
- Estatística Indutiva que, a partir de uma amostra da população, permite estender os resultados à
população inteira; trata de estabelecer conclusões relativas a um conjunto mais vasto de indivíduos
(população) a partir da observação de parte dela (amostra).
Ao seleccionar uma amostra:
- deve ser aleatório
- deve ter elementos suficientes
A amostra pode ser:
- Amostra representativa da população: estamos perante uma amostra bem recolhida, ou seja, significa
que representa bem a população
- Amostra enviesada: estamos perante uma amostra mal recolhida, ou seja, não representa bem a
população.

 Aplicação e concretização dos processos referidos:


1.º Fase - identificação do objecto do estudo estatístico: decide-se o objecto do estudo e a variável a
estudar
2.º Fase - recolha de dados: através de inquéritos, observações...
3.º Fase - organização e apresentação de dados: reduzir os dados obtidos e organiza-los em tabelas ou
gráficos
4.º Fase - análise e interpretação de resultados: fase em que se obtém as conclusões

1
 Construção de tabelas de frequência:
L1 L2 L3 L4 L5 L6
número de dias número de pessoas
(xi) (fi) Fi fri fri (%) Fri (%)
10 5 5 0,1 10 10
12 3 8 0,06 6 16
13 8 16 0,16 16 32
15 9 25 0,18 18 50
17 6 31 0,12 12 62
21 10 41 0,20 20 82
22 8 49 0,16 16 98
30 1 50 0,02 2 100
Total 50 1 100
xi - todas as opções referentes á variável estatística em estudo
fi - frequência absoluta, numero de efectivos de xi
Fi - frequência absoluta acumulada - soma-se sempre o que está para trás em fi
fri - frequência relativa - fi/total
fri (%) - frequência relativa em %
Fri - frequência relativa acumulada - soma-se o que está para trás em fri (%)
Na máquina:
ir á tabela: STAT + EDIT
xi - L1 -
fi - L2 -
Fi - L3 - cumsum (2ND + LIST + OPS) (L2)
fri - L4 - L2/TOTAL
fri (%) - L5 - L4 x 100
Fri - L6 - cumsum (2ND + LIST + OPS) (L5)

Importante:
1. Quando o estudo estatístico é sobre uma variável estatística qualitativa (no xi tem letras) a
tabela de frequência não tem as colunas de frequências acumuladas Fi e Fri.
2. Quando o total não dá 100 na frequência relativa: retira-se um ao mais pequeno, por
exemplo:
0,30769 = 0,31
0,07692 = 0,08 <- retira-se aqui, faz-se batota.

2
 Dados agrupados em classe:

Para descobri-mos o número de classes:


- n = 24 (efectivo da população/total)
- 2k ≥ n (sendo K o numero de classes): 21 = 2; 22 = 4; 23 = 8; 24 = 16; 25 = 32
- K = 5 classes
- xmax - xmin = 102 - 60 = 42

- = = 8,4 <- amplitude da classe


8,5 <- amplitude da classe definitiva

classes marca de classes contagem


(xi)
fi Fi fri fri (%) Fri
[60; 60,8[ 6 6 0,25 25 25 llllll
[68,5; 77[ 5 11 0,21 21 46 lllll
[77; 85,5[ 4 15 0,17 17 63 llll
[85,5; 94[ 5 20 0,21 21 84 lllll
[94; 102,5[ 4 24 0,16 16 100 llll
Total 24 1 100 24

classes -
xi - todas as opções referentes á variável estatística em estudo
fi - frequência absoluta, numero de efectivos de xi
Fi - frequência absoluta acumulada - soma-se sempre o que está para trás em fi
fri - frequência relativa - fi/total
fri (%) - frequência relativa em %
Fri - frequência relativa acumulada - soma-se o que está para trás em fri (%)
contagem -

3
 Representações gráficas:
- Diagrama de caule - e - folhas:
Idade dos pais dos alunos e da professora de MACS:

Pai -> 49 50 Mãe -> 50 43


46 46 40 38
31 39 41 41
48 61 44 40
45 39 45 40
46 39 40 56
40 59 47

8 3 999
7543110000 0 01566689
60 5 09
6 1

- Gráfico Circular:
Deve ter atenção que este tipo de gráficos, construídos, de um modo geral, para dados qualitativos:
- tem de ter legenda e a percentagem de cada sector;
- tem a área de cada sector igual à frequência;
- deve ter um titulo.
Este é um tipo de gráfico bastante atractivo e muito útil para estabelecer comparações entre as
frequências das diferentes categorias.
No entanto não deve ser usado quando a variável pode assumir muitas modalidades diferentes.
Para calcular a amplitude dos ângulos: fri × 360⁰

4
- Pictograma:
São gráficos onde se utilizam figuras ou símbolos alusivos á variável em estudo.
Deve ter em conta que no gráfico:
- tem de existir a legenda do símbolo;
- o símbolo deve de estar relacionado com a característica em estudo;
- o número de símbolos é proporcional á frequência;
- os símbolos podem ser desenhados em linhas ou em colunas;
- os símbolos devem poder dividir-se segundo eixos de simetria.
Os pictogramas são gráficos muito sugestivos e de fácil leitura.
No entanto são pouco precisos.

- Gráficos de Barras:
São gráficos formados por um conjunto de barras em que a altura é proporcional às frequências.
Num dos eixos marcam-se as frequências (absolutas ou relativas) e no outro os valores da variável. As
barras devem ficar igualmente distanciadas umas das outras.
Uma das vantagens é a sua fácil construção.

5
- Gráficos de linhas:
Este tipo de gráfico é utilizado para representar informação que varia ao longo do tempo.
Nota: só para variáveis estatísticas contínuas

- Histogramas:
Estes gráficos utilizam-se sempre que os dados estão agrupados em classes, na forma de intervalos,
devendo ter-se em conta que:
- no eixo horizontal representa-se os intervalos das classes;
- no eixo vertical representa-se as frequências;
- no histograma as barras são juntas.
Nota: só para variáveis estatísticas contínuas
Nota: Quando as amplitudes não são iguais, tem de se calcular a altura das barras = fi/amplitude

6
- Polígonos de frequências:
Nota: para frequências absolutas e relativas
O polígono parte do ponto médio de uma classe fictícia com frequência zero, passa pelos pontos médios
de cada uma das classes e termina no ponto médio de outra classe fictícia de frequência zero.

Nota: para frequências absolutas acumuladas e relativas acumuladas


No polígono de frequências acumuladas não se recorre à marca da classe. À esquerda do limite inferior
da primeira classe, a frequência acumulada é zero a á direita da última classe é 1 (ou o efectivo se for
frequência absoluta)

7
 Medidas de localização/medidas de tendência central:
- Média: ( ) é o quociente da soma de todos os lados pelo numero dos lados, ou seja:

No caso em que os dados são discretos e estão organizados em tabelas, podemos calcular a média
do seguinte modo:

A marca da classe obtém-se fazendo a média:

- Moda: (Mo) é o valor da variável ao qual corresponde uma maior frequência (absoluta ou relativa)
Quando existem dois valores com a mesma frequência diz-se que a amostra é bimodal.
Quando os valores têm todos a mesma frequência diz-se que a amostra é amodal.
Quando existem vários valores com a frequência mais alta diz-se que a amostra é plurimodal.
A moda pode ser calculada nos dois tipos de variáveis (qualitativas e quantitativas) e é a única que se
pode calcular para dados qualitativos.
Caso os dados estejam agrupados em classes, indicaremos a classe modal, e determinamos
graficamente um valor aproximado para esta medida através de um histograma.

8
- Mediana: ) é o valor que divide o conjunto de dados (ordenados por ordem crescente ou
decrescente) em duas partes com o mesmo numero de observações.
Se o número de dados é impar, a mediana é o valor central.
Se o número de dados é par, a mediana é a media aritmética dos valores centrais.
14 15 15 15 17 17 18

14 15 15 15 17 17 18 19
então: = = 16
Se o numero de dados for muito grande:

- se o número de dados n é impar, a ordem k da mediana é dada por

- se o número de dados n é par, a mediana é a media dos valores de ordens

Caso os dados estejam agrupados em classes, indicaremos a classe mediana e determinaremos


geometricamente um valor aproximado da mediana:

Podemos dizer que mediana é o valor que divide a amostra (organizada por ordem crescente) ao meio,
isto é, metade dos elementos do conjunto de dados são menores ou iguais á mediana, enquanto que
os restantes são superiores ou iguais.

9
 Medidas de localização:
- Quartis:

10
11
- Diagrama de extremos e quartis:
Exemplo 14:
As notas do Francisco nos primeiros testes do 2º período nas diferentes disciplinas foram as
seguintes:

12
8 12 14 15 15 17 17 19 20

Por observação dos dados, concluímos que Q1 = 13, = 15 e Q3 = 18, o valor máximo é 20 e o valor
mínimo é 8.

Q1 Q2/ Q3
Analise do diagrama:
Existe uma maior concentração dos dados entre o 1ºQ e o 2ºQ e também entre o 3ºQ e o valor
máximo (xmax.)
Como os dados estão mais concentrados à esquerda do 2ºQ então, existe enviesamento para a
direito.

Este diagrama pode informar quanto ao enviesamento de uma distribuição:


- Dados simétricos: os dados estão distribuídos de forma simétrica
- Enviesamento para a esquerda: os dados estão mais concentrados à direita de Q2
- Enviesamento para a direita: os dados estão mais concentrados à esquerda de Q2

- Percentis: dividem uma amostra ordenada em cem partes iguais.

13
Quando os dados estão agrupados em classes, os percentis podem ser calculados de forma
idêntica à dos quartis, ou seja, não se determina o valor exacto dos percentis mas, apenas, a
classe a que pertencem.

 Vantagens, desvantagens e limitações das medidas de tendência central:

14
 Medidas de dispersão:
15
- Amplitude: é a diferença entre o valor máximo e o valor mínimo da variável:
a = xmáx. - xmín.
- Amplitude Interquartil: é a diferença entre o 3º quartil e o 1º quartil:
Aq = Q3 - Q 1
# se o valor de Aq for grande, a dispersão entre os valores centrais é grande.
# se o valor de Aq for pequeno, a dispersão é pequena.

- Desvio Padrão:

= = 2,68 idas à biblioteca

L1 L2 L3 L4
idas à biblioteca nº de alunos (xi - )2
(xi - )2 x fi
0 1 7,1824 7,1824
1 3 2,8224 8,4672
2 7 0,4624 3,2368
3 8 0.1024 0,8192
4 4 1,7424 6,9696
5 2 5,3824 10,765
Total 25 37,44

= 1,2238 soma L4 (2ND + LIST + MAT)


L1 = xi
L2 = fi
L3 = (L1 - )2
L4 = (L1 - )2 x fi

16
 Introdução gráfica à análise de dados bivariados:
- Gráfico de correlação ou Diagrama de dispersão: é um gráfico de pontos em que as coordenadas
de cada ponto são os valores das duas variáveis em estudo.
O conjunto dos pontos num gráfico de correlação designa-se por nuvem de pontos.

X
Y

A correlação diz-se linear se a nuvem de pontos se distribuir ao longo de uma linha recta, a recta de
regressão.

Esta representação permite analisar de que forma se relacionam as duas variáveis:

Correlação positiva

17
Correlação negativa

A correlação é linear positiva, porque à medida que uma variável aumenta os valores correspondentes
à outra variável também aumentam.

Correlação nula
A correlação é linear negativa, porque à medida que uma variável aumenta os valores
correspondentes à outra variável diminuem.

18
 MÁQUINA GRÁFICA:
- Calcular média, moda, mediana, desvio padrão e quartis:
STAT + calc + 1-Var Stats
1-Var Stats L1, L2

- Fazer os gráficos:
1. STAT, EDIT, colocar os dados na tabela L1 e L2
2. 2ND + Y = + ENTER, colocar ACT e escolher o tipo
3. Em Xlist colocar L1 e em Ylist colocar L2 (escolher a marca, facultativo)
4. WINDOW escolher o xmin, o xmax, a escala em EscX; o ymin, o ymax e a escala em EscY
5. GRAPH

19

Você também pode gostar