Você está na página 1de 62

Estatística Aplicada a Pesca e Aquicultura

Prof. Dr. Ivan Furtado Júnior

2020
Estatística Aplicada a Pesca
e Aquicultura (68 h)

2
Bibliografia

 RIBEIRO JÚNIOR, José Ivo. Análises estatísticas no Excel: guia prático. 2.


ed. rev. e ampl. Viçosa, MG: UFV, 2013. 311 p. 
 Disponível na biblioteca central da UFRA (quando voltar o Normal é bom
fazer uma consulta, quem puder adquirir melhor ainda, ajuda muito no
TCC, e na pós-graduação)

3
Cronograma das aulas
Data Conteúdo Horário
10/09 Apresentação do plano de ensino da disciplina. Descrição e 14:30 – 18:30
organização de dados; Exercícios
11/09 Medidas de tendencia central e dispersão; Exercícios 14:30 – 18:30
14/09 Amostragem; Tipos de amostragem; Exercícios 14:30 – 18:30
15/09 Introdução aos testes de significancia estatística 14:30 – 18:30
16/09 Teste t; Estabelecimento de hipóteses; Exercícios 14:30 – 18:30
17/09 Teste t; Interpretação de resultados; Exercícios 14:30 – 18:30
18/09 Análise de variância; (NAP 1) 14:30 – 18:30
21/09 Análise de variância; Estabelecimento de hipóteses; 14:30 – 18:30
Exercícios
22/09 Análise de variância; Interpretação de resultados; 14:30 – 18:30
Exercícios
23/09 Análise de variância; Interpretação de resultados; 14:30 – 18:30
Exercícios

4
Cronograma das aulas

Data Conteúdo Horário


24/09 Teste do quiquadrado x²; Exercícios 14:30 – 18:30
25/09 Teste do quiquadrado x²; Estabelecimento de hipóteses; 14:30 – 18:30
Exercícios
28/09 Teste do quiquadrado x²; Interpretação de resultados; 14:30 – 18:30
Exercícios
29/09 Correlação e regressão; modelo linear; Exercícios 14:30 – 18:30
30/09 Correlação e regressão; modelo curvilíneo; (NAP 2) 14:30 – 18:30
01/10 Correlação e regressão; Comparação de regressões; 14:30 – 18:30
Exercícios; (PS)
02/10 Correlação e regressão; Comparação de regressões; 14:30 – 18:30
Exercícios; (NAF)

5
Medidas de tendência central e
dispersão

6
Medidas de tendência central

Nos dão uma ideia de onde se localiza o centro, o ponto


médio de um determinado conjunto de dados.
Medidas: Média, Moda e Mediana.
f

7
Uso das medidas de tendência central

MÉDIA: Dados Numéricos e Intervalares


É a medida mais utilizada.

MODA: Dados Nominais

MEDIANA: Dados Ordinais

8
Medidas de tendência central: Média
Valor do ponto em torno do qual os dados se distribuem
Média: Numa amostra de n observações, x1, x2, …, xn
n

x1  x2  ...  xn x x i
i
x   i 1
n n n
Se os dados estiverem agrupados (k valores distintos)
k

x1* f1  x2* f 2  ...  xn* f n  i fi


x *

 i fi
x *

x  i 1

n n n

onde fi designa a frequência absoluta de xi* (ou a frequência absoluta da


classe com marca xi* no caso de dados agrupados em classes)
9
Medidas de tendência central: Média
Valor do ponto em torno do qual os dados se distribuem

pescada-branca

10
Média: Cálculo para dados simples

x=Sx/n
S x = Soma dos valores
16 18 23 21 n = tamanho da amostra
17 16 19 20 x = (16+18+23+21+17+16+19+20)
8

x = 18,75

11
Média: Cálculo para valores distintos

x f fx
x = S fx / n
2 3 6 S fx = Soma dos produtos
3 3 9
4 4 16 dos valores distintos
5 9 45 com a frequência
6 6 36 n = tamanho da amostra
7 2 14
8 1 8 x = 134 x = 4,7857
Total 28 134 28

12
Média: Cálculo para valores agrupados em
classes
x = S fx / n
Classes f x fx S fx = Soma dos produtos
39 50 4 44,5 178 dos valores distintos
50 61 5 55,5 277,5
com a frequência
61 72 5 66,5 332,5
72 83 6 77,5 465 n = tamanho da amostra
83 94 5 88,5 442,5 x = 1695,5 x = 67,82
Total 25 - 1695,5 25

12
Média: Cálculo para valores agrupados em classes
 Média aritmética: Cálculo da média de dados em Tabela de Distribuição de
frequência
Classe Ponto Médio Frequência
1,5Ι— 2,0 1,75 3
2,0Ι— 2,5 2,25 16
2,5Ι— 3,0 2,75 31
3,0Ι— 3,5 3,25 34
3,5Ι— 4,0 3,75 11
4,0 Ι— 4,5 4,25 4
4,5Ι— 5,0 4,75 1
n=100
Média (X): ponto médio de cada classe x respectiva frequência dividido pelo n

X = 1,75x3 + 2,25x16 + ... + 4,25x4 + 4,75x1 = 300 = 3


100 100
14
Medidas de tendência central: Mediana

15
Medidas de tendência central: Mediana

16
Medidas de tendência central: Mediana

17
Medidas de tendência central: Mediana
A mediana á a observação central, depois de ordenada a
amostra.
 Se a amostra tiver dimensão ímpar, coincide com a
observação central. Exemplo:
 Na amostra 1,2; 1,7; 2,1; 2,2; 2,4 a mediana é 2,1.
 Se a amostra tiver dimensão par, a mediana toma o valor
da média das duas observações mais centrais.
 Exemplo:
 Na amostra 0,3; 0,7; 0,9; 1,1 a mediana é 0,8.
A mediana é mais robusta que a média a erros ou a
observações afastadas.
18
Mediana: Cálculo para dados simples

PMd = (n+1) / 2
2 3 4 5 6 PMd = (9+1) / 2
PMd = 5o Termo
7 8 9 10
Mediana (Md) = 6

19
Mediana: Cálculo para valores distintos

x f fa
2 3 3o
PMd = (n+1) / 2
3 3 6o
4 4 10o PMd = (28+1) / 2
5 9 19o PMd = 14,5
6 6 25o
7 2 27o x entre 14o e 15o Termo
8 1 28o
Total 28 - Mediana (Md) = 5

20
Mediana: Cálculo para dados agrupados em
classes

Classes f x fa PMd = (n+1) / 2


39 50 4 44,5 4o PMd = (25+1) / 2
50 61 5 55,5 9o
PMd = 13o Termo
61 72 5 66,5 14o
72 83 6 77,5 20o
Classe Mediana
83 94 5 88,5 25o
Total 25 - -
61 72
Mediana (Md) = 66,5 (estimativa)

21
Mediana: Cálculo para dados agrupados em
classes por interpolação

Md = Li + ((PMd - faa) / f ) . A
Li = limite inferior da classe mediana
Classe Mediana
PMd = posição da mediana
61 72 faa = frequência acumulada da classe
anterior
f = frequência da classe mediana
A = amplitude da classe mediana

20
Mediana: Cálculo para dados agrupados em
classes por interpolação

Md = Li + ((PMd - faa) / f ) . A

Classe Mediana Md = 61 + ((13 - 9) / 5) . 11


61 72 Mediana (Md) = 69,8

21
Medidas de tendência central: Moda

24
Moda: Cálculo para dados simples

1) Moda para dados simples


Exemplos:
2, 3, 4, 5, 6, 7, 8 AMODAL
2, 3, 3, 4, 5, 6 ,7 MODA = 3
2, 3, 3, 4, 5, 5, 6 BIMODAL (Mo = 3 e Mo = 5)

25
Moda: Cálculo para valores distintos

x f
2 3
3 3 O valor 5 tem o maior
número de ocorrências (9)
4 4
5 9
6 6 Mo = 5
7 2
8 1
Total 28

26
Moda: Cálculo para dados agrupados em
classes

Classes f x fa Moda Bruta


39 50 4 44,5 4o Ponto médio da classe de
50 61 5 55,5 9o maior frequência
61 72 5 66,5 14o
72 83 6 77,5 20o
83 94 5 88,5 25o Mo = 77,5
Total 25 - - É uma estimativa

27
Moda: Cálculo para dados agrupados em
classes – Moda de King

Moda de King
Mo = Li + (A . F2) / (f1 + f2)
Mo = 72 + (11 . 5)/(5 + 5)
Li = limite inferior da classe modal
A = amplitude do intervalo da classe modal Mo = 77,5
f1 = frequência da classe anterior a modal
f2 = frequência da classe posterior a modal

28
Dispersão ou variabilidade dos dados

É frequentemente chamada de variabilidade.


Medidas mais comuns: Variância, Desvio Padrão, Amplitude

f Dispersão dos dados


na amostra

Dispersão dos dados


na população

29
Variância e desvio padrão na população

Variância da população

s2 = S ( x - x )2 / N
Desvio Padrão da população = Raiz quadrada da variância

s = s2
Como a dispersão nas amostras é menor do que na população, se faz
um ajuste matemático.

30
Dispersão na população
É uma forma de se ver o quanto os dados se afastam da média.
Exemplo: Um viveiro com apenas 11 pirarucus

135 cm 152 cm Média = 149 cm


136 cm 152 cm Mediana e Moda = 152 cm
138 cm 157 cm Valor Máximo = 170 cm
141 cm 163 cm Valor Mínimo = 135 cm
143 cm 170 cm Amplitude = 35 cm
152 cm

Comprimento total de 11 pirarucus

31
Dispersão na população

Comprimento total (N=11) x - x(x - x) 2 s2 Variância


= 1314 / 11
135 cm 135-149 -14 196 = 119,454 cm2
136 cm 136-149 -13 169
138 cm 138-149 -11 121
141 cm 141-149 -8 64 s Desvio Padrão
143 cm 143-149 -6 36 = 119,454
152 cm 152-149 3 9
152 cm 152-149 3 9 = 10,92 cm
152 cm 152-149 3 9
157 cm 157-149 8 64
163 cm 163-149 14 196
170 cm 170-149 21 441
Soma dos desvios
Total 1314 quadráticos

32
Variância e desvio padrão na amostra

Variância da Amostra ( s2 ou v )

s2 = S ( x - x )2 / ( n -1 )

Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância

s = s2
A dispersão nas amostras é menor do que na população, por isso é
que se faz este ajuste matemático

33
Medidas de Variabilidade

34
Medidas de Variabilidade

35
Desvio padrão
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.

x
Média

36
Desvio padrão
A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio
padrão de A é maior do que o de B.

f f
Curva A Curva B

x
Média Média

37
Medidas de Variabilidade
Medida de dispersão: indicadores do grau de
variabilidade dos indivíduos em torno das
medidas de tendência central
Variância: Medir os desvios em relação a média
 Não há média dos desvios pois sua soma é igual a zero

Ex.: 0,4,6,8,7
X (média) : 0+4+6+8+7 = 25 = 5
5 5
X – X (desvio em relação a média)
0– 5=-5
4– 5 = -1 A soma dos desvios é igual a zero
6– 5= 1
8– 5= 3 (-5 + -1)+1+3+2= - 6 + 6 = 0
7– 5= 2

38
Medidas de Variabilidade
Variância: Soma dos quadrados dos desvios
Dados Desvios Quadrado dos desvios
X (X – X) (X – X) 2

0 -5 25
4 -1 1
6 1 1
8 3 9
7 2 4
x = 5  (x –x) = 0  (x – x) 2 = 40

A soma do quadrado dos desvios não é usada como medida de dispersão,


porque o seu valor cresce com o nº de dados

39
Medidas de Variabilidade
 Variância

Então, para medir a dispersão dos dados em relação à


média, usa-se a variância (S2) que leva em consideração
on

S2 = soma dos quadrados dos desvios


n–1

Para os dados: 0, 4, 6, 8 e 7 a S 2 = 40 = 40 = 10
5 –1 4

40
Medidas de Variabilidade
Desvio Padrão

Raiz quadrada da variância, sendo


representado por S; tem a mesma unidade de
medida dos dados

Ex.: 0,4,6,8,7. S2 (variância) = 10

s (desvio padrão): √10 = 3,16

41
Coeficiente de variação
O desvio padrão depende da unidade de medida usada, assim um
desvio medido em dias será maior do que um medido em meses.
O coeficiente de variação expressa o desvio-padrão como
porcentagem do valor da média.

COEF. VARIAÇÃO = 100 . DESVIO PADRÃO / MÉDIA

Quanto menor for este coeficiente mais homogênea é a amostra.

42
Coeficiente de variação

Classificação da proporção que o desvio padrão apresenta sobre a


média

- GRAU DE HOMOGENEIDADE DOS DADOS -

Cv até 10%  ÓTIMO


Cv de 10% a 20%  BOM
Cv de 20% a 30%  REGULAR
C acima de 30%  RUIM

43
Medidas de Variabilidade
Coeficiente de variação (CV)
Razão entre o desvio padrão e a média x 100
CV = s² / x . 100

Ex.:
Grupo I: 3,1,5 anos ( x = 3 anos; s² = 4; s = 2)
CV = 66,7%

Grupo II: 55,57,53 anos ( x = 55 anos; s² = 4; s = 2)


CV = 3,64%

Vejam à dispersão dos dados em ambos os grupos é a


mesma, mas os CV são diferentes (no grupo I a dispersão
relativa é ALTA)
CV - trata-se de uma medida relativa de dispersão e por
isso não tem unidades.
44
Coeficiente de assimetria
É uma medida que assume o valor zero quando a distribuição de
frequências da amostra é completamente simétrica e assume
valores diferentes de zero (positivos ou negativos) quando a
distribuição não é simétrica.

Atenção que numa amostra é quase impossível observar simetria


pura. Por isso o coeficiente de assimetria assume valores quase
sempre diferentes de zero. Para termos uma ideia se a assimetria
é relevante devemos comparar o valor do coeficiente com o erro
associado. Se o coeficiente não exceder 2 ou 3 vezes o erro, o seu
valor não será muito relevante, especialmente quando queremos
extrapolar para a população.

45
Assimetria
Uma distribuição possui assimetria positiva (alternativamente
negativa) quando existe uma concentração de valores na zona de
valores mais reduzidos (alternativamente elevados) da amostra.

Assimetria positiva Quase simetria Assimetria negativa


 Coef.ass. >0 Coef.ass. ~ 0 Coef.ass. <0

46
Curvas de frequência
Análise Horizontal: Análise Vertical:
Assimétrica Positiva (esquerda) Leptocúrtica (alta)
Simétrica Mesocúrtica
Assimétrica Negativa (direita) Platicúrtica (baixa)

Análise Conjunta:
Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica “Curva de Gauss”
“Curva Normal”

47
Curvas de frequência
Análise Horizontal:
Assimétrica Positiva (esquerda)

48
Curvas de frequência
Análise Horizontal:
Simétrica

49
Curvas de frequência
Análise Horizontal:
Assimétrica Negativa (direita)

50
Curvas de frequência
Análise Vertical:
Leptocúrtica (alta)

51
Curvas de frequência
Análise Vertical:
Mesocúrtica

52
Curvas de frequência
Análise Vertical:
Platicúrtica (baixa)

53
EXERCÍCIO Nº 1
Determine a média, a mediana e a moda
para o seguinte conjunto de dados

6 5 8 4 7 6 9 7 3

54
EXERCÍCIO Nº 2
Determine o menor valor, o maior valor, a
média, a mediana e a moda para o seguinte
conjunto de dados

12 32 54 17 82 99 51 11 44 22

22 33 44 52 76 41 37 10 5 87

55
EXERCÍCIO Nº 3
Dado o seguinte agrupamento em classes determine:

a) os pontos médios de cada classe


Classes f b) a classe modal
1,60 1,65 10 c) a moda bruta
1,65 1,70 15 d) a moda de King
1,70 1,75 22 e) a classe mediana
1,75 1,80 18 f) a mediana por agrupamento de classes
1,80 1,85 3 g) a média por agrupamento de classes

Total 68

56
EXERCÍCIO Nº 4
Determine a média, a moda e a mediana para a seguinte
distribuição por valores distintos?

Pesos (kg) f
64 4
65 10
66 12
67 12
68 15
69 14
70 9
71 5
72 2

57
EXERCÍCIO Nº 5

Determine a média, a amplitude, a variância, o desvio padrão e


o coeficiente de variação da seguinte amostra de dados:

4 5 5 6
6 7 7 8

58
EXERCÍCIO Nº 6
Determine o valor de n, a amplitude, a média, o desvio padrão e
o coeficiente de variação da seguinte amostra de dados:

22 32 45 22 46
76 24 21 78 43
21 58 92 11 16
28 33 73 11 29
22 47 28 24 21
53 36 88 99 18

59
EXERCÍCIO Nº 7

Com base nos coeficientes de variação calculados nos


dois exercícios anteriores classifique a dispersão
encontrada:

60
Links de vídeos
Estatística com Excel 2010 estatística descritiva no Excel
2010
https://www.youtube.com/watch?v=ebZjsfmF-5w
Estatística Descritiva no Excel para Comparação
https://www.youtube.com/watch?reload=9&v=mg-
xk0UOiKk
Estatística descritiva em Excel
https://www.youtube.com/watch?v=D9PKPV7Qhns

Profª Drª Maria Ivanilde Araujo- UFAM 61


Links de vídeos
Estatística Descritiva no Excel usando suplemento Análise
de Dados
https://www.youtube.com/watch?v=kiv9bQUDs1I

62

Você também pode gostar