Você está na página 1de 359
Su b-Pr o jecto M a tem á tica
Su
b-Pr o jecto
M
a tem á tica

Inovar na Formação

Manual de Estatística

Subprojecto de Matemática

Esta Publicação é propriedade do GICEA, Gabinete de Gestão de iniciativas comunitárias.

Este produto é protegido pelas leis em vigor e copyright, estando reservados todos os seus direitos. Não pode ser reproduzido nem transcrito por qualquer processo seja ele qual for sem autorização dos titulares do direito. Os infractores são passíveis de procedimento judicial.

Índice

Guia de exploração

1

Capítulo 1

3

Introdução histórica

4

Objecto da Estatística

5

População, Amostra e Unidade Estatística

5

Variáveis Estatísticas

7

Classificação da Estatística

9

Aplicações da Estatística

10

Capítulo2

12

Recolha e classificação de dados

13

Quadros de Frequências

15

Tabelas de Frequências para variáveis discretas

17

Tabela de Frequências para variáveis contínuas

18

Capítulo 3

20

Representação tabular de dados

21

Diagrama de caule e folhas

22

Representação gráfica de dados estatísticos e de frequências

24

Diagrama por pontos

25

Gráficos de Barras e Histogramas

26

Gráficos

de

Barras

26

Histograma

29

Polígonos de frequências (simples e acumuladas)

30

Função cumulativa

32

Variáveis

discretas

32

Variáveis

contínuas

33

Curvas de frequência e ogivas

35

Gráficos circulares

36

Pictogramas

39

Outros Tipos de Gráficos

40

Gráfico

de

rectângulo

40

Gráfico de linhas

41

Diagrama de quadrados

42

Pirâmide etária

43

Série regional ou geográfica

44

Gráficos mal construídos

46

Capítulo

4

47

Medidas de tendência central

Moda, média e mediana 48 Moda 48

48

Média

50

Mediana

51

Comparação entre a moda, a mediana e a média 53

Quantis

56

Diagrama de extremos e quartis

57

Medidas de dispersão

60

Amplitude, desvio e desvio

61

Variância e desvio padrão

62

Variância

62

Desvio padrão

62

Comparação entre as medidas de dispersão

63

Influência da alteração dos valores da variável na média e no desvio padrão

64

 

Capítulo 5

66

Distribuições bidimensionais

67

Diagrama de Dispersão

67

Coeficiente de correlação linear

72

Recta de Regressão

74

 

Capítulo 6

76

Apresentação

77

Problema 1 - Os Pacotes do Açúcar

77

Problema 2 - O Lançamento do Peso

78

Calculadoras Gráficas

79

Folha de Cálculo

102

 

Capítulo 7

126

Bibliografia

127

Anexo I

128

Cálculo de Classes

129

Anexo II

130

Sites

Nacionais

131

Sites

Internacionais

133

Índice de figuras

Figura 1 – Variáveis Estatísticas

8

Figura 2 – Classificação da Estatística

9

Figura 3 – Recolha e classificação de dados

14

Figura 4 – Caule e folhas (idades dos empregados de um escritório

-

versão 1)

22

Figura 5 – Caule e folhas (idades dos empregados de um escritório

-

versão 2)

23

Figura 6 – Caule e folhas (comparação das classificações de dois testes)

24

Figura 7 – Diferentes tipos de correlação

73

Figura 8 – Escala de correlação

73

Figura 9 – Menu estatístico

79

Figura 10 – Listas de dados 79

Figura 11 – Ordenação de dados 1

80

Figura 12 – Ordenação de dados 2

80

Figura 13 – Ordenação de dados 3

80

Figura 14 –Cálculo de medidas estatísticas 1

81

Figura 15 – Cálculo de medidas estatísticas 2

81

Figura 16 – Definição do tipo de gráfico 1

82

Figura 17 – Definição do tipo de gráfico 2

82

Figura 18 – Representação de Histograma 1

83

Figura 19 – Definição da janela 1

83

Figura 20 – Definição da janela 2

83

Figura 21 – Representação do Histograma 2

84

Figura

22

Estudo do Histograma

84

Figura 23 – Representação do diagrama de extremos e quartis

84

Figura 24 – Estudo do diagrama de extremos e quartis

85

Figura 25 – Representação da caixa de bigodes

85

Figura 26 – Estudo da caixa de bigodes

85

Figura 27 – Menu estatístico 86

Figura 28 – Lista de dados 1

Figura

56

Estudo do Histograma

86

Figura 29 – Lista de dado 2

86

Figura 30 – Definição do tipo de gráfico 1

87

Figura 31 – Definição do tipo de gráfico 2

87

Figura 32 – Representação da nuvem de pontos

88

Figura 33 – Diagnostic On

88

Figura 34 – Determinação da recta de regressão

89

Figura 35 – Cálculo do coeficiente de correlação linear

89

Figura 36 – Equação da recta de regressão

90

Figura 37 – Representação da recta de regressão

90

Figura 38 – Estudo do diagrama de dispersão

90

Figura 39 – Menu estatístico

91

Figura 40 – Introdução de dados 1

91

Figura 41 – Introdução de dados 2

91

Figura 42 – Ordenação de dados 1

92

Figura 43 – Ordenação de dados 2

92

Figura 44 – Cálculo de medidas estatísticas 1

92

Figura 45 – Cálculo de medidas estatísticas 2

93

Figura 46 – Leitura das medidas estatísticas

93

Figura 47 – Voltar à lista de dados

93

Figura 48 – Definição do tipo de gráfico

94

Figura 49 – Definição do Histograma

94

Figura 50 – Construção do Histograma 1

94

Figura 51 – Alteração manual da janela

95

Figura 52 – Construção do Histograma 2

95

Figura 53 – Construção do Histograma 3

96

Figura 54 – Alteração manual da janela 2

96

Figura 55 – Construção do Histograma 4 –

96

97

Figura 57 – Construção do diagrama de extremos e quartis

97

Figura 58 – Estudo do diagrama de extremos e quartis

97

Figura 59 – Menu estatístico

98

Figura 60 – Introdução dos dados

98

Figura 61 – Definição do tipo de gráfico

98

Figura 62 – Definição do diagrama de extremos e quartis

99

Figura 63 – Definição da frequência relativa

99

Figura 64 – Construção da nuvem de pontos 1

99

Figura 65 – Construção da nuvem de pontos 2

100

Figura 66 – Cálculo da equação da recta de regressão e do coeficiente de correlação

100

Figura 67 – Desenhar a recta de regressão 1

100

Figura 68 – Menu Graph

101

Figura 69 – Desenhar a recta de regressão 2

101

Figura 70 – Estudo da recta de regressão

101

Figura 71 – Introdução de dados na folha de cálculo

102

Figura 72 – Ordenação de dados

103

Figura 73 – Medidas estatísticas

103

Figura 74 – Assistente de funções 1

104

Figura 75 – Assistente de funções 2

104

Figura 76 – Assistente de funções 3

105

Figura 77 – Cálculo da média

105

Figura 78 – Cálculo do desvio padrão

106

Figura 79 – Assistente de funções 4

106

Figura 80 – Assistente de funções 5

107

Figura 81 – Assistente de funções 6

107

Figura 82 – Determinação dos quartis

107

Figura 83 – Tabela de frequências

108

Figura 84 – Assistente de gráficos 1

109

Figura 85 – Assistente de gráficos 2

109

Figura 86 – Assistente de gráficos 3

110

Figura 87 – Assistente de gráficos 4

110

Figura 88 – Assistente de gráficos 5

111

Figura 89 – Assistente de gráficos 6

111

Figura 90 – Histograma 1

112

Figura 91 – Histograma 2

112

Figura 92 – Assistente de gráficos 7

113

Figura 93 – Assistente de gráficos 8

113

Figura 94 – Histograma 3

114

Figura

95

Introdução de dados

115

Figura 96 – Assistente de gráficos 9

116

Figura 97 – Assistente de gráficos 10

117

Figura 98 – Assistente de gráficos 11

117

Figura 99 – Assistente de gráficos 12

118

Figura 100 – Assistente de gráficos 13

118

Figura 101 – Nuvem de pontos 1

119

Figura 102 – Nuvem de pontos 2

119

Figura 103 – Assistente de funções 7

120

Figura 104 – Assistente de funções 8

120

Figura 105 – Assistente de funções 9

121

Figura 106 – Assistente de funções 10

121

Figura 107 – Determinação do coeficiente de correlação linear

121

Figura 108 – Linha de tendência 1

122

Figura 109 – Linha de tendência 2

122

Figura 110 – Linha de tendência 3

123

Figura 111 – Recta de regressão 3

123

Figura 112 – Previsões 1

124

Figura 113 – Previsões 2

124

Índice de tabelas

Tabela 1 – População residente no Alentejo

16

Tabela 2 – Frequências (Número de irmãos)

17

Tabela 3 – Frequências (Alturas em cm dos alunos do 9º ano)

19

Tabela 4 – Dados (Número de medalhas ganhas por país em Sydney 2000)

21

Tabela 5 – Idades dos empregados de um escritório

22

Tabela 6 – Classificações de dois testes

23

Tabela 7 – Consumo interno de água engarrafada de 1987 a 1998

25

Tabela 8 – Número de alunos por sexo

26

Tabela 9 – Frequências acumuladas do número de irmãos

32

Tabela 10 – Alturas de alunos

34

Tabela 11 – Frequência relativa de alunos por sexo

37

Tabela 12 – Consumo de Vinho por regiões do país

40

Tabela 13 – Novos fogos construídos (versão 1)

42

Tabela 14 – Novos fogos construídos (versão 2)

43

Tabela 15 – Idades das empregadas

48

Tabela 16 – Preços de viagens

50

Tabela 17 – Resumo das características das medidas de tendência central

55

Tabela 18 – Localização do Q 1 e Q 3

56

Tabela 19 – Temperaturas máximas

57

Tabela 20 – Tempo de duração de lâmpadas

59

Tabela 21 – Salários da empresa A

60

Tabela 22 – Salários da empresa B

60

Tabela 23 – Calculo da média e do desvio padrão

64

Tabela 24 – Marcas do lançamento do peso nos Jogos Olímpicos

68

Tabela 25 – Comprimento do salto e peso do atleta

69

Tabela 26 – Pressão atmosférica e temperatura

70

Tabela 27 – Temperatura / Tempo de coagulação do sangue

71

Tabela 29 – Peso dos pacotes de açúcar

78

Tabela 30 – Lançamento do peso

78

Índice de gráficos

Gráfico 1 – Produção de vinho na região demarcada do Douro

24

Gráfico 2 – Consumo interno de água engarrafada de 1987 a 1998

26

Gráfico 3 – Construção de um gráfico de barras verticais

27

Gráfico 4 – Gráfico de barras horizontais

28

Gráfico 5 – Barras representadas por figuras

28

Gráfico 6 – Gráfico de barras verticais em profundidade

28

Gráfico 7 – Barras horizontais em profundidade

29

Gráfico 8 – Duas ou mais barras para cada variável

29

Gráfico 9 – Histograma da distribuição das alturas dos alunos de uma turma

30

Gráfico 10 – Polígono de frequências (Tempo de chegada ao Centro de Formação)

31

Gráfico 11 – Polígono de frequências acumuladas (Tempo de chegada ao Centro de Formação)

31

Gráfico 12 – Função cumulativa para varáveis discretas

33

Gráfico 13 – Função cumulativa para variáveis contínuas

34

Gráfico 14 – Curva de acumulação de frequências ou ogiva

35

Gráfico 15 – Gráfico circular

38

Gráfico 16 – Gráfico circular (Principais importadores de vinho do Porto – 1998)

38

Gráfico 17 – Pictograma (Venda de veículos ligeiros de passageiros)

39

Gráfico 18 – Gráfico de rectângulos 41

Gráfico 19 – Gráfico de linhas (evolução do número de óbitos por VHI)

41

Gráfico 20 – Gráfico de quadrados (Novos fogos construídos)

43

Gráfico

21

Pirâmide etária

44

Gráfico 22 – Série regional ou geográfica 1

44

Gráfico 23 – Série regional ou geográfica 2

45

Gráfico 24 – Série regional ou geográfica 3

45

Gráfico 25 – Pictograma mal construído

46

Gráfico 26 – Gráfico de barras mal construído

46

Gráfico 27 – Determinação geométrica da moda

50

Gráfico 28 – Determinação geométrica da mediana

52

Gráfico 29 – Diagrama de extremos e Quartis

58

Gráfico 30 – Diagrama de extremos e quartis partindo de um gráfico de frequências acumuladas

59

Gráfico 31 – Correlação ano /distância do lançamento do peso

68

Gráfico 32 – Correlação comprimento do salto /peso do atleta

70

Gráfico 33 – Correlação temperatura / pressão atmosférica

70

Gráfico 34 – Correlação temperatura / tempo de coagulação do sangue

71

Gráfico 35 – Recta de regressão

75

Índice de fórmulas

Fórmula 1 – Frequência absoluta acumulada Fórmula 2 – Frequência relativa Fórmula 3 – Frequência relativa acumulada Fórmula 4 – Função cumulativa para variáveis discretas Fórmula 5 – Localização da moda dentro da classe modal Fórmula 6 – Média aritmética Fórmula 7 – Determinação da mediana Fórmula 8 – Variância Fórmula 9 – Desvio padrão Fórmula 10 – Coeficiente de correlação linear Fórmula 11 – Coeficiente de regressão

15

16

16

32

49

50

53

62

62

72

75

Guia de exploração

O presente manual está estruturado com 5 capítulos iniciais onde são

introduzidos os conceitos teóricos para o estudo da Estatística assim

como alguns exemplos.

Sendo um dos principais objectivos deste trabalho a utilização de novas tecnologias no estudo da Estatística, é apresentado um sexto capítulo onde são resolvidos dois problemas com recurso à utilização de calculadoras gráficas assim como de computadores.

O formador deverá utilizar as indicações fornecidas no Capítulo 6 de

forma transversal, isto é, a utilização das calculadoras gráficas e dos computadores deve acompanhar todos os conteúdos apresentados nos 5

primeiros capítulos deste manual.

Os conteúdos estão adaptados, de um modo geral, aos diversos módulos de Estatística para o nível III da Formação Profissional.

Cada formador poderá utilizar como complemento deste manual, o Manual de Exercícios de Estatística e a Bateria de Acetatos de Estatística, dos mesmos autores, podendo a utilização adequada destes três produtos dar origem à elaboração de planos de sessão estruturados científica e pedagogicamente.

Este manual é ainda complementado com um anexo onde se podem encontrar uma lista comentada de sites da Internet, nacionais e internacionais, onde se podem encontrar informações de caracter científico e dados estatísticos para a elaboração de novas questões.

A utilização das calculadoras gráficas na formação em Estatística deve

ser considerada não só uma ferramenta facilitadora do cálculo mas também com uma forte componente pedagógica. Neste sentido, será útil que o formador disponha de um projector de dados apropriado à projecção da janela da sua calculadora gráfica, e que os formandos possam dispor também, individualmente ou em pequenos grupos, de calculadoras gráficas.

No presente manual, para facilitar a compreensão de alguns conceitos teóricos assim como cálculos, escolheram-se por vezes exemplos menos adaptados à realidade, porém com a utilização da calculadora gráfica podem ser tratados qualquer tipo de dados sem qualquer dificuldade, podendo assim ser tratados problemas relacionados com a vida real,

1

particularmente com a área de formação do formando, pelo que a maioria das questões apresentadas no Manual de Exercícios de Estatística são deste tipo.

Em sala de formação equipada com computadores, pode-se recorrer à folha de cálculo em alternativa às calculadoras gráficas. Nesta situação, são também apresentadas no Capítulo 6 um conjunto de indicações sobre a utilização da folha de cálculo no estudo da Estatística.

Dos mesmos autores está ainda disponível um CD ROM que além de integrar o presente Manual de Estatística, o Manual de Exercícios de Estatística e a Bateria de Acetatos de Estatística, referidos anteriormente, contém ainda referências a software de Estatísca, disponibilizando mesmo alguns programas.

Embora a avaliação dos formandos não seja objectivo deste manual, nem dos restantes produtos, a verificação e a consolidação dos conhecimentos adquiridos pode ser feita, de uma forma tradicional, com o apoio do Manual de Exercícios de Estatística, ou de uma forma lúdica, utilizando jogos didácticos. Para facilitar o trabalho do formador, a equipa que preparou estes produtos, criou e produziu dois jogos para serem utilizados pelos formandos, encontrando-se um disponível no CD ROM e o outro, denominado O Presidente, disponível em formato clássico de caixa com tabuleiro, e que pode ser utilizado por um máximo de 6 jogadores.

2

Capítulo 1

Iniciação à Estatística

Introdução histórica

Objecto da Estatística

População, Amostra e Unidade Estatística

Variáveis Estatísticas

Classificação da Estatística

Aplicações da Estatística

3

Capítulo 1: Iniciação à Estatística

Introdução histórica

A estatística tem evoluído muito nos últimos anos, mas desde sempre

que o homem tem sentido necessidade de recolher informação.

O recenseamento geral de uma população é uma prática que remonta à

antiga Roma e Egipto. O seu objectivo principal era obter informação para a colecta de impostos, chamada para o serviço militar e outros assuntos governamentais.

Durante a Idade Média, registaram-se alguns dados sobre epidemias e terramotos que podem ser considerados como uma espécie de levantamento estatístico.

Foi já no sec. XVIII que surgiu o primeiro levantamento de dados a nível nacional.

Foi também no sec XVIII que surgiu o termo “Staatenkunde” - traduzido para português como Estatística - pelo professor Achenwall, como “ciência das coisas do estado” visto que era o Estado que organizava e produzia esses estudos.

Começou-se assim a fazer tratamentos estatísticos de fenómenos sociais

e demográficos.

No sec XVIII, Bayes foi o primeiro matemático a aplicar a teoria das probabilidades no previsão de fenómenos, baseado em levantamentos estatísticos.

Na sua origem a estatística estava ligada ao Estado. Hoje, não só se mantém esta ligação, como todos os estados e a sociedade em geral dependem cada vez mais dela, tornando-se assim indispensável ao cidadão do sec XXI.

4

Capítulo 1: Iniciação à Estatística

Objecto da Estatística

Numa sociedade baseada na tecnologia e na comunicação, recolher, organizar, descrever, exibir e interpretar dados, tomar decisões ou fazer previsões com base nessa informação tem cada vez mais importância.

O estudo da estatística realça a importância de questionar, conjecturar e

procurar relações quando se formulam e resolvem problemas do mundo real.

O estudo estatístico incide fundamentalmente sobre situações que, por

estarem sujeitas a múltiplas influências raramente se podem representar por uma lei matemática simples ou por um modelo determinado.

A estatística é um ramo da matemática que estuda uma ou várias

características ou propriedades de uma população, e que permite estabelecer previsões que facilitem a tomada de decisões assim como interpretar e explicar a realidade.

A estatística aparece no mundo actual como resposta à complexidade

de problemas que não permitem uma solução através de um único modelo com uma resposta exacta. Para resolver estes problemas utiliza- -se um conjunto de técnicas e instrumentos que conjuntamente dão respostas aproximadas, com níveis de erro controlados.

População, Amostra e Unidade Estatística

A maior parte das situações em que é necessário utilizar técnicas

estatísticas , envolve a necessidade de tirar conclusões gerais acerca de

um grande número de indivíduos , recorrendo a num número restrito desses indivíduos. Surgem assim os conceitos de População e Amostra.

Exemplos:

1- Para se conhecerem as intenções de voto nas próximas eleições, pode-se fazer um inquérito. Este não pode ser feito a toda a população. Escolhe-se então um grupo significativo de pessoas que vão

5

Capítulo 1: Iniciação à Estatística

constituir a amostra, sendo a população formada por todos os indivíduos com direito a voto.

2- O departamento de controle de qualidade de uma fábrica de pilhas pretende analisar a duração de determinado tipo de pilhas. É claro que não é possível experimentar todas as pilhas que formam a população, assim escolhe-se um lote de pilhas que constituem a amostra.

População é o conjunto de indivíduos com qualquer característica em comum e com interesse para o estudo em causa.

Em estatística a palavra população não só se refere a pessoas, mas também a objectos e acontecimentos.

A cada um dos elementos de uma população chama-se unidade

estatística.

Amostra é um subconjunto finito da população que se supõe representativo desta.

Em muitas situações torna-se aconselhável, ou mesmo necessário recorrer a uma amostra em vez da população porque :

a população é em número infinito

a observação da população é muito dispendiosa ou leva muito tempo

para levar a efeito a observação haveria destruição generalizada dos elementos da população.

A generalização dos resultados obtidos através do estudo de uma

amostra comporta sempre um certo erro, todavia podemos considerar que a estimativa da característica populacional em estudo é útil se a amostra utilizada for representativa da população.

Quando uma amostra não é representativa da população, diz-se que é enviesada. A sua utilização para estimar características da população pode ter consequências graves, na medida em que a amostra tem propriedades que não reflectem as propriedades da população.

Por exemplo se considerarmos a amostra formada pelos jogadores da equipa de basquetebol de uma determinada escola para estudar as alturas dos alunos da escola, concluiríamos que os estudantes são mais altos do que na realidade o são.

Para escolher adequadamente uma amostra deve-se ter em conta alguns aspectos tais como:

6

Capítulo 1: Iniciação à Estatística

todos os indivíduos da população devem ter igual probabilidade de serem seleccionados;

deve conter em proporção tudo o que a população possui, qualitativa e quantitativamente;

deve ser suficientemente larga, de modo a que as características da

amostra se aproximem, tanto quanto possível, das características da população.

Existem algumas técnicas científicas para seleccionar uma amostra. Os tipos de amostras mais utilizadas são:

Amostra aleatória, onde qualquer elemento tem a mesma probabilidade de ser escolhido, a escolha é feita ao acaso.

Amostra estratificada, é utilizada quando a população apresenta grupos diferenciados. Assim, divide-se a população em grupos tão homogéneos quanto possível e selecciona-se em cada grupo uma parte proporcional à sua dimensão.

Variáveis Estatísticas

No estudo de uma população, podem-se encontrar muitas características, também designadas por carácteres ou atributos.

A cada característica estudada numa dada população chama-se variável estatística.

Por exemplo no conjunto dos alunos de uma determinada escola podemos estudar

a cor dos olhos

a altura

os desportos preferidos

a idade

Nas características anteriores encontram-se algumas que se podem traduzir na forma de um valor numérico e outras que não são quantificáveis, traduzindo-se por qualidades, categorias ou preferências.

7

Capítulo 1: Iniciação à Estatística

As variáveis estatísticas que exprimem uma qualidade, não se podendo traduzir numericamente são chamadas Variáveis Qualitativas . Como exemplos temos a cor dos olhos ou os desportos preferidos.

Uma variável qualitativa pode tomar diversas formas, às quais se

chamam modalidades. Azul, verde, castanho variável qualitativa “cor dos olhos”.

, são modalidades da

As variáveis qualitativas podem ser ou não ordenáveis. As que podem ser ordenáveis denominam-se ordinais. Por exemplo, o nível de instrução é uma variável ordinal, uma vez que os valores que esta variável toma são 1º ciclo, 2º ciclo, 3º ciclo, etc

As que não são ordenáveis, denominam-se nominais e é um exemplo deste tipo de variáveis, a profissão.

Quando uma variável estatística pode ser medida , sendo representada por um número, diz-se uma Variável Quantitativa .

As variáveis quantitativas podem ainda ser dividida em dois tipos :

Variável quantitativa discreta, é aquela que só pode tomar valores isolados, como por exemplo o número de irmãos ou o número de golos marcados num dado jogo.

Variável quantitativa contínua, é aquela que pode tomar qualquer

valor de um dado intervalo, [

exemplo a altura ou o peso de uma pessoa ou o tempo gasto por cada aluno no percurso casa – escola.

2

[

, de números reais, como por

x , x

1

Variáveis estatísticas Quantitativa Qualitativa Discreta Contínua
Variáveis estatísticas
Quantitativa
Qualitativa
Discreta
Contínua

Figura 1 – Variáveis Estatísticas

Por vezes, a classificação de uma variável quantitativa em discreta ou contínua levanta algumas dúvidas. Por exemplo a variável “idade”, na maior parte das vezes é considerada discreta, pois quando se pergunta a idade a alguém é normal que a resposta seja um número inteiro. No

8

Capítulo 1: Iniciação à Estatística

entanto trata-se de uma variável contínua pois a diferença de idades de duas pessoas pode ser tão pequena quanto se queira, um ano, um mês, uma semana, um dia

Classificação da Estatística

Para fazer o estudo estatístico de uma população consideram-se normalmente duas fases distintas.

Uma primeira fase consiste em recolher os dados, organizá-los em tabelas ou gráficos e condensar a informação em valores que traduzam satisfatoriamente as características da totalidade dos dados. Nesta fase utiliza-se a Estatística Descritiva, cuja finalidade é descrever certas propriedades de um conjunto de dados. A estatística descritiva pode ser aplicada tanto à amostra como à população.

Conhecidos os resultados de uma amostra, entra-se numa segunda fase, onde se procura tirar conclusões sobre a totalidade da população, generalizando os resultados obtidos através da amostra. Entra-se então no campo da Estatística Indutiva.

A Estatística Indutiva é um método de investigação muito importante, pois facilita a tomada de decisões, permitindo prever a evolução de determinados conhecimentos.

População

a evolução de determinados conhecimentos. População Amostra Características da população Estatística

Amostra

de determinados conhecimentos. População Amostra Características da população Estatística Indutiva

Características da população

Estatística

Indutiva

Estatística Descritiva Estudo da amostra
Estatística
Descritiva
Estudo da
amostra
Indutiva Estatística Descritiva Estudo da amostra Características da amostra Figura 2 – Classificação da

Características da amostra

Figura 2 – Classificação da Estatística

9

Capítulo 1: Iniciação à Estatística

Exemplos de situações nas quais se utiliza a Estatística Descritiva:

Consumo de leite na população portuguesa

Volume das exportações portuguesas nos últimos anos

Acidentes de viação nas estradas portuguesas

Exemplos de situações em que se utiliza a Estatística Indutiva

Previsão de resultados eleitorais

Previsão do crescimento económico

Previsões demográficas

Podemos ainda analisar os dados obtidos e procurar estabelecer relações entre os fenómenos em estudo. Este processo designa-se por Estatística Analítica.

A utilização da Estatística como um método científico ao serviço dos

diferentes ramos do saber, constitui a Estatística Aplicada, da qual é exemplo a Bioestatística.

Aplicações da Estatística

A estatística está presente no dia a dia da nossa sociedade, sendo

utilizada em diversas situações:

veicular informação nos diversos órgãos de comunicação (jornais,

revistas, televisão, rádio, internet,

);

sondar a opinião pública ( preferências , hábitos,

);

fundamentar previsões ( evolução da população, do mercado, de

recordes,

);

justificar tomadas de decisão (construção de escolas, incentivo ao

consumo,

).

Com o desenvolvimento das novas tecnologias, nomeadamente a informática, torna-se mais fácil tratar a informação, pelo que, até a mais

10

Capítulo 1: Iniciação à Estatística

simples decisão económica como a comercialização de um produto não é tomada sem ter em conta os resultados estatísticos.

A Estatística tem grande importância em determinadas áreas, tais como

a Economia, a Medicina, a Política, a Geografia, a Psicologia e muitas

outras. A procura do conhecimento tem sido uma das preocupações constantes das pessoas que se dedicam a investigar, e a estatística tem vindo a desempenhar um papel cada vez mais importante na seriedade dos processos utilizados na procura da “verdade”.

Exemplos de aplicação da estatística:

Na Economia, para determinar a comercialização de um produto, para calcular o prémio de um seguro ou para determinar a taxa de juro de um empréstimo bancário.

Na Medicina, para estudar o efeito de um novo medicamento ou para saber qual o tipo de sangue cuja necessidade é maior numa emergência.

Na Pedagogia, para o estudo de novos métodos de aprendizagem.

11

Capítulo2

Distribuição de Frequências

Recolha e classificação de dados

Quadro de Frequências

12

Capítulo 2: Distribuição de Frequências

Recolha e classificação de dados

Qualquer estudo estatístico tem como ponto de partida a recolha e posterior classificação dos dados.

Os dados a recolher podem ser de tipos diferentes e ter origens diversas.

Assim, os dados recolhidos directamente a partir da fonte originária denominam-se dados primários e aqueles que provêm já de uma recolha feita previamente chamam-se dados secundários.

Quanto à origem, os dados podem ser provenientes de uma fonte interna, se uma organização coloca dados seus à disposição dos seus órgãos de decisão, ou de uma fonte externa, se uma organização disponibiliza dados seus para outras organizações.

A recolha de dados pode ser feita de forma contínua (recolha de dados meteorológicos), periódica (censos populacionais) ou ocasional(sondagens).

Quanto aos métodos usados na recolha de dados, podem ser muito diversificados, como por exemplo, as entrevistas pelo telefone, o preenchimento de questionários escritos ou electrónicos, as entrevistas pessoais, etc

Na fase de classificação dos dados procede-se à identificação de unidades de informação com características comuns e posteriormente ao seu agrupamento.

No esquema da página seguinte (figura 3) podemos verificar de forma resumida o que ficou dito anteriormente quanto à fonte dos dados e ao seu tipo, bem como quanto à periodicidade, métodos de recolha e classificação dos dados.

13

recolha de

Métodos

Capítulo 2: Distribuição de Frequências

Fonte interna Fonte externa de dados de dados Dados primários Dados secundários Tipos Tipos de
Fonte interna
Fonte externa
de dados
de dados
Dados primários
Dados secundários
Tipos
Tipos de fontes
dados de
contínua periódica ocasional Periodicidade
contínua
periódica
ocasional
Periodicidade

!!!!

entrevistas

questionários

entrevistas

pelo telefone

pessoais

questionários entrevistas pelo telefone pessoais Identificação de unidades de informação com
Identificação de unidades de informação com características comuns e posterior agrupamento. Classificação dos
Identificação de unidades de informação com
características comuns e posterior
agrupamento.
Classificação
dos dados

Figura 3 – Recolha e classificação de dados

14

Capítulo 2: Distribuição de Frequências

Quadros de Frequências

Após a recolha e classificação dos dados, torna-se necessário organizá- -los em quadros e tabelas, de forma a que a sua leitura e interpretação se torne mais fácil.

Na construção destes quadros e tabelas é importante o conhecimento de noções como frequência absoluta, simples e acumulada e frequência relativa, simples e acumulada.

A partir do exemplo seguinte, iremos definir os diferentes tipos de

frequências.

iremos definir os diferentes tipos de frequências. No ano de 1991, a população residente no Alentejo

No ano de 1991, a população residente no Alentejo dividia- se da seguinte forma: 128 678 no Alto Alentejo, 173 216 no Alentejo Central, 98 519 no Alentejo Litoral e 143 020 no Baixo Alentejo.

Fonte: Instituto Nacional de Estatística

Neste exemplo, o número de residentes em cada sub-região do Alentejo designa-se por frequência absoluta.

Na organização de quadros e tabelas, as variáveis estatísticas são designadas por x, sendo x 1 a primeira concretização da variável, x 2 a segunda concretização da variável e x i a iézima concretização da variável, independentemente do tipo de variável.

A frequência absoluta de uma determinada variável x, é o número de

vezes que essa variável ocorre e representa-se habitualmente por f i.

A frequência absoluta acumulada de uma variável é a soma das

frequências absolutas anteriores com a frequência absoluta dessa variável, isto é

F

i

=

i

i = 1

f

i

Fórmula 1 – Frequência absoluta acumulada

15

Capítulo 2: Distribuição de Frequências

A frequência relativa de uma variável é o quociente entre a frequência

absoluta e o total de ocorrências N, isto é:

fr i =

f

i

N

(

fr

i

[0,1]).

Fórmula 2 – Frequência relativa

A frequência relativa acumulada de uma variável é a soma das

frequências relativas anteriores com a frequência relativa dessa variável,

isto é:

Fr

i

=

i

f

i

=

1

ri

.

Fórmula 3 – Frequência relativa acumulada

Os valores da frequência relativa e da frequência relativa acumulada podem ser apresentados na forma de percentagem.

A partir do exemplo dado, podemos agora elaborar os quadros de

frequência absoluta, de frequência absoluta acumulada, de frequência relativa e de frequência relativa acumulada.

Tabela 1 – População residente no Alentejo

 

f

i

F

i

f

ri

F

ri

(frequência

(freq. absoluta

(frequência

(freq. relativa

absoluta)

acumulada)

relativa)

acumulada)

Alto

       

Alentejo

128

687

128

687

0,237

0,237

Alentejo

173

216

301

894

0,319

0,556

Central

Alentejo

       

Litoral

98 519

400

413

0,181

0,737

Baixo

       

Alentejo

143

020

543

433

0,263

1

TOTAL (N)=

543433

     

16

Capítulo 2: Distribuição de Frequências

Na apresentação de um quadro de frequências devemos ter em atenção alguns aspectos relacionados com a sua construção, facilitadores da sua leitura e compreensão.

Título – relacionado com o conteúdo do quadro.

Núcleo do quadro – formado por linhas e colunas contendo os números e informações necessárias.

Total – apresenta-se entre traços horizontais e é facultativo em algumas tabelas.

Fonte – situa-se no rodapé e é obrigatória(excepto para dados hipotéticos).

Notas de rodapé – explicações escritas no rodapé e são facultativas.

Tabelas de Frequências para variáveis discretas

Exemplo:

Nas turmas A e B do 9º ano de uma escola, os alunos registaram o número de irmãos, obtendo-se o seguinte resultado:

2 1

1

6

0

5

0

0

1

1 2

1

1

2

1

1

1

1

1 1

1

1

1

Tabela 2 – Frequências (Número de irmãos)

 

Número de irmãos

 

Nº irmãos x i

f

i

F

i

fr i

Fr i

0

3

3

0,13

0,13

1

15

18

0,66

0,79

2

3

21

0,13

0,92

5

1

22

0,04

0,96

6

1

23

0,04

1,00

Total

23

-

1,00

-

17

Capítulo 2: Distribuição de Frequências

F 1 = f 1

Ex: F 1 = f 1 = 3

F 2 = f 1 + f 2

Ex: F 2 = 3 + 15=18

F 3 = f 1 + f 2 + f 3

…………………………

F n = f 1 + f 2 + f 3 +…+ f n

fr i =

f

i

N

Ex:

fr i =

3

23

0,13

Tabela de Frequências para variáveis contínuas

Requer atenção especial a organização de tabelas de frequência de variáveis contínuas.

Exemplo:

Consideremos as alturas, em centímetros, dos alunos do 9º ano de escolaridade de uma escola:

160

168

178

170

186

158

167

152

168

166

172

170

154

169

180

174

185

173

189

177

177

165

167

Como se trata de uma variável contínua o primeiro procedimento a efectuar consiste em organizar a distribuição, agrupando os dados em classes.

1. Determinar o limite superior (Ls) e o limite inferior (Li) das classes:

Limite superior: 160 cm Li = 160

Limite superior: 152 cm Ls = 152

2. Calcular a amplitude total (H):

Amplitude total (H) é a diferença entre o limite superior e o limite inferior:

H = Ls – Li H = 189 – 152 H = 37

18

Capítulo 2: Distribuição de Frequências

3. Determinar o número de classes 1 (n):

n = 5

4. Calcular a amplitude da classe(h):

h =

H

h =

37

h =

7,4

h

8

 
 

n

5

5. Determinar a frequência absoluta.

6. Organizar a tabela da distribuição:

Tabela 3 – Frequências (Alturas em cm dos alunos do 9º ano)

Classes

f

i

F

i

fr i

fr i (%)

Fr i

[152,160[

4

4

0.17

17

0.17

[160,168[

5

9

0.22

22

0.39

[168,176[

8

17

0.35

35

0.74

[176,184[

3

20

0.13

13

0.87

[184,192[

3

23

0.13

13

1

Total

23

-

1,00

100

 

1 Não existe uma fórmula universalmente aceite para calcular o número de classes, no entanto podemos levar em linha de conta as sugestões dadas por alguns autores – ver Apêndice I.

19

Capítulo 3

Representação gráfica e tabular de dados

Representação tabular de dados

Diagrama de caule e folhas

Representação gráfica de dados estatísticos e de frequências

20

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Representação tabular de dados

A tabela é um instrumento muito utilizado para representar dados estatísticos, por:

ser de fácil e rápida construção;

ser de fácil leitura;

permitir estabelecer rapidamente comparações.

Exemplo:

No último grande acontecimento desportivo de 2000, a distribuição de medalhas nos 13 países mais bem sucedidos, está expressa na seguinte tabela:

Tabela 4 – Dados (Número de medalhas ganhas por país em Sydney 2000)

Dados (Número de medalhas ganhas por país em Sydney 2000)   Nº medalhas   País %
 

Nº medalhas

 

País

%

ganhas

Estados Unidos

90

10.6

Rússia

77

9.1

China

59

6.9

Austrália

56

6.6

Alemanha

54

6.3

França

36

4.2

Itália

31

3.6

Coreia do Sul

28

3.3

Cuba

26

3.1

Grã-Bretanha

25

2.9

Roménia

24

2.8

Holanda

23

2.7

Ucrânia

20

2.4

TOTAL

850

100

21

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Diagrama de caule e folhas

O diagrama de caule e folhas é um método de organização de dados,

cuja representação se pode situar entre a tabela e o gráfico.

Num diagrama de caule e folhas são perfeitamente visíveis todos os dados observados e facilmente é visualizada a forma como eles se distribuem por diversas classes.

Para construir um diagrama de caule e folhas começamos por traçar uma linha vertical, registam-se à esquerda os valores correspondentes ao caule e à direita os valores correspondentes às folhas.

Considerando por exemplo, as idades dos empregados de um escritório

Tabela 5 – Idades dos empregados de um escritório

18

19

18

20

22

21

22

28

31

32

25

21

27

24

27

31

23

24

27

36

O respectivo diagrama de caule e folhas será então:

8

1 8

9

2 1

0 1

2

2

3

4

4

5

7

7

7

8

3 1

1 2

6

Folhas

Figura 4 – Caule e folhas (idades dos empregados de um escritório - versão 1)

No caule colocaram-se os algarismos das dezenas e as folhas são formadas pelos algarismos das unidades ordenados .

Quando a amostra é muito grande, por vezes os caules ficam muito compridos. Nesta situação podemos subdividir os caules. Para este exemplo podemos dividir cada caule ao meio.

22

Capítulo 3: Representação gráfica e tabular de dados estatísticos

1

 

1

8

8

9

2

0

1

1

2

2

3

4

4

2

5

7

7

7

8

3

1

1

2

3

6

Folhas

 

Figura 5 – Caule e folhas (idades dos empregados de um escritório - versão 2)

Este tipo de representação é muito útil para fazer a comparação de dois conjuntos de dados, relativos à mesma característica. Consideremos então o seguinte exemplo, em que são apresentadas as classificações (em pontos) de dois testes de Estatística.

Tabela 6 – Classificações de dois testes

1º teste

2º teste

75

158

112

145

42

122

94

111

73

135

125

132

112

138

134

112

126

72

145

95

128

78

82

163

92

75

122

143

97

128

163

185

95

153

164

124

153

142

124

123

Para fazer a comparação das classificações do dois testes faz-se um diagrama de caule e folhas, no qual se coloca à esquerda do caule as classificações do primeiro teste e à direita as do segundo.

Por observação do diagrama, representado pela figura 6, verifica-se, de imediato que os resultados do 2º teste foram superiores aos do primeiro.

O respectivo diagrama de caule e folhas será então:

23

Capítulo 3: Representação gráfica e tabular de dados estatísticos

 

2

4

 
 

5

8

5

5

3

2

6

 

7

8

2

 

7

5

2

9

4

5

 

10

 
 

2

11

1 2

2

 

8

8

6

2

12

2

3

4

4

5

 

8

5

13

2

4

 

2

14

3

5

5

 

8

3

3

15

 
 

16

3

3

4

17

 

18

5

Folhas

Caule

Folhas

Figura 6 – Caule e folhas (comparação das classificações de dois testes)

Representação gráfica de dados estatísticos e de frequências

Produção de Vinho na Região Demarcada do Douro

400 350 300 250 200 150 100 50 0 1994 1995 1996 1997 1998 pipas
400
350
300
250
200
150
100
50
0
1994
1995
1996
1997
1998
pipas de 550 litros

Vinho Não Beneficiadodo Douro 400 350 300 250 200 150 100 50 0 1994 1995 1996 1997 1998

Vinho do PortoDouro 400 350 300 250 200 150 100 50 0 1994 1995 1996 1997 1998 pipas

Gráfico 1 – Produção de vinho na região demarcada do Douro

24

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Observando o gráfico 1, que descreve em que anos houve maior produção de vinhos na Região Demarcada do Douro, qual a estimativa para o valor da produção total de Vinho Não Beneficiado, de 1994 a 1998? Qual das produções foi maior, a do vinho do Porto ou do Vinho Não Beneficiado?

Os dados estatísticos podem ser representados por tabelas, por quadros de distribuição por frequência e por gráficos. A função do gráfico é fornecer informações, por meio de efeito visual imediato, contidas numa tabela.

A estatística dispõe de vários tipos de gráficos, que, dependendo da

variável, procuramos a representação mais adequada ao fenómeno em estudo.

Para variáveis quantitativas é comum recorrer a gráficos de barras e de áreas.

Diagrama por pontos

O diagrama por pontos tem como referência o sistema cartesiano

ortogonal. A partir dos dados da tabela 7, podemos construir um diagrama por pontos, que nos permite ter uma visão simples e rápida da

evolução do consumo interno de água engarrafada desde 1987 até

1998.

Tabela 7 – Consumo interno de água engarrafada de 1987 a 1998

ANOS

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

Consumo

271

290

325

348

361

88

410

445

511

549

585

650

interno

                       

Regras para a sua construção:

1. Deve-se sempre dar um título que indique qual o estudo em causa;

2. Rótulos para ambos os eixos;

3. Escala bem definida. Quando uma das escalas não começa em zero, deve-se dar essa indicação no eixo respectivo, como acontece no exemplo anterior em relação ao eixo das abcissas, no qual apenas são registados anos a partir de 1987;

25

Capítulo 3: Representação gráfica e tabular de dados estatísticos

4. Quando se utilizarem linhas verticais e horizontais secundárias para fazer a correspondência entre os valores das variáveis, estas devem ser a tracejado;

5. Sempre que exista, deve-se indicar a fonte;

6. Sempre que se justifique poder-se-ão indicar outros elementos como a data, notas de rodapé, etc.

Consumo interno de Água Engarrafada de 1987 a 1998

700 600 500 400 300 200 100 0 1986 1987 1988 1989 1990 1991 1992
700
600
500
400
300
200
100
0
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
Consumo
(milhões de litros)

Anos

Gráfico 2 – Consumo interno de água engarrafada de 1987 a 1998

Gráficos de Barras e Histogramas

Gráficos de Barras

Como construir o gráfico de barras usando os dados contidos na tabela do número de alunos por sexo, de uma certa escola?

Tabela 8 – Número de alunos por sexo

Sexo

F. absoluta (f i )

F. relativa (f r %)

15 65,2

15

65,2

8 34,8

8

34,8

Total

23

100

26

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Passos a seguir:

Começamos por traçar o sistema cartesiano ortogonal, indicando a variável no eixo das abcissas e a frequência relativa (ou absoluta) no eixo das ordenadas.

Em seguida, traçamos barras com altura correspondente ao percentual da categoria (variável).

Alunos da escola X, segundo o sexo

Alunos da escola X, segundo o sexo

70 70 fr(%) fr(%) 60 60 50 50 40 40 30 30 20 20 10
70
70
fr(%)
fr(%)
60
60
50
50
40
40
30
30
20
20
10
10
0
0
1
2
1
2
Sexo
Sexo

Gráfico 3 – Construção de um gráfico de barras verticais

Observações:

1. As abcissas e ordenadas podem ser trocadas, colocando a variável na vertical e a frequência relativa (ou absoluta) na horizontal (ver exemplos adiante).

2. As bases dos rectângulos devem ter a mesma medida.

3. Os gráficos de barras também são usados para variáveis quantitativas.

27

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Alunos da escola X, segundo o sexo

Sexo 2 1 0 10 20 30 40 50 60 70 fr(%)
Sexo
2
1
0
10
20
30
40
50
60
70
fr(%)

Gráfico 4 – Gráfico de barras horizontais

Exemplos de gráficos de barras:

Consumo mensal de água engarrafada no Alentejo (milhões de m 3 )

15,03
15,03

Set/00

16 Out/00
16
Out/00
16,68 Nov/00
16,68
Nov/00
18,15 Dez/00
18,15
Dez/00

Gráfico 5 – Barras representadas por figuras

Quotas de mercado 200 160 120 80 40 0 Público Correio Record A Bola Diário
Quotas de mercado
200
160
120
80
40
0
Público
Correio
Record
A Bola
Diário de
A Capital
da Manhã
Notícias
Jornais diários
Nº de leitores

Gráfico 6 – Gráfico de barras verticais em profundidade

28

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Quotas de mercado

A Capital Diário de Notícias A Bola Record Correio da Manhã Público 0 20 40
A Capital
Diário de Notícias
A Bola
Record
Correio da Manhã
Público
0
20
40
60
80
100
120
140
160
180
200
Jornais diários

Nº de leitores

Gráfico 7 – Barras horizontais em profundidade

Dormidas na Hotelaria por NUTS II Janeiro a Dezembro

14000 12000 1997 10000 1998 8000 6000 4000 2000 0 Norte Centro LVT Alentejo Algarve
14000
12000
1997
10000
1998
8000
6000
4000
2000
0
Norte
Centro
LVT
Alentejo
Algarve
Açores
Madeira
NUTS II
Dormidas(milhares)

Gráfico 8 – Duas ou mais barras para cada variável

Histograma

É um gráfico utilizado para representar distribuições de frequências de variáveis contínuas, construído com rectângulos justapostos no plano cartesiano. Cada rectângulo tem como base a amplitude da classe e altura correspondente à frequência. As amplitudes representam-se

29

Capítulo 3: Representação gráfica e tabular de dados estatísticos

sempre no eixo das abcissas e as respectivas frequências no eixo das ordenadas.

A

área de cada rectângulo é proporcional à sua frequência e a área total

é

proporcional à soma total das frequências.

O

histograma seguinte representa a distribuição das alturas dos alunos

de uma turma.

9 8 7 6 5 4 3 2 1 0 192 Classes 152 160 168
9
8
7
6
5
4
3
2
1
0
192 Classes
152
160
168
176
184
frequência

Gráfico 9 – Histograma da distribuição das alturas dos alunos de uma turma

Polígonos de frequências (simples e acumuladas)

Polígonos de Frequências são gráficos de linhas que se obtêm unindo sucessivamente, com segmentos de recta, os pontos médios dos lados superiores dos rectângulos de um histograma.

Podemos ainda dizer, com a mesmo significado, que um Polígono de Frequências é um gráfico que se obtém unindo os pontos que têm por abcissa o ponto médio de uma classe e por ordenada a respectiva frequência.

Observando o gráfico 10, podemos verificar que, o polígono de frequências intersecta o eixo das abcissa em dois pontos que se obtêm considerando os pontos médios de duas classes, imediatamente antes e depois do histograma, de frequência nula.

30

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Tempo de chegada ao Centro de Formação 80 70 60 50 40 30 20 10
Tempo de chegada ao Centro de Formação
80
70
60
50
40
30
20
10
0
10
30
50
70
90
110
Nº formandos

Tempo(min)

Gráfico 10 – Polígono de frequências (Tempo de chegada ao Centro de Formação)

Se considerarmos um gráfico de área, constituído pela área compreendida entre o eixo das abcissas e a linha poligonal, essa área é igual à área do histograma respectivo.

Também para as frequências acumuladas podemos traçar o respectivo polígono de frequências, também designado, polígono integral. Supõe-se que a distribuição dos elementos se faz de forma uniforme dentro de cada classe, pelo que a representação gráfica é do tipo linear.

Tempo de chegada ao Centro de Formação

100 80 60 40 20 0 10 30 50 70 90 110 Nº formandos(%)
100
80
60
40
20
0
10
30
50
70
90
110
Nº formandos(%)

Tempo(min)

Gráfico 11 – Polígono de frequências acumuladas (Tempo de chegada ao Centro de Formação)

31

Capítulo 3: Representação gráfica e tabular de dados estatísticos

A construção da linha poligonal que traduz o polígono de frequências,

obtém-se, a partir do histograma das frequências acumuladas, unindo o vértice inferior esquerdo da primeira classe com o vértice superior direito da mesma classe e este, sucessivamente, com os vértice superior direito da classe seguinte, tal como se pode verificar no gráfico 11.

Função cumulativa

A função cumulativa indica, para cada valor de x, a frequência absoluta

ou relativa de observações com intensidade menor ou igual a x.

Variáveis discretas

De um modo geral , dada um variável estatística que toma os valores

x 1 , x 2 ,

são n 1 , n 2 ,

variável real assim definida:

, x k e cujas frequências acumuladas (absolutas ou relativas)

n k , chama-se função cumulativa F, à função real de

F x

(

)

1

2

n k

0

n

=  n

se x < x

se x

se x

1

1

2

xx <

xx <

se x

x

k

2

3

Fórmula 4 – Função cumulativa para variáveis discretas

A sua representação gráfica é a de uma função em escada.

Considerando o número de irmãos dos alunos de uma certa turma:

Tabela 9 – Frequências acumuladas do número de irmãos

Nº irmãos

Fi

 

0

5

1

9

2

12

F ( x

)

=

3

13

 

4

14

0

12

14

13

5

9

se x < 0

x

x

x

x

4

se 0

se 1

se 2

se 3

se x

<

<

<

<

1

2

3

4

32

Capítulo 3: Representação gráfica e tabular de dados estatísticos

A respectiva representação gráfica é a seguinte:

Fi
Fi

Nº de irmãos

Gráfico 12 – Função cumulativa para varáveis discretas

Variáveis contínuas

Para definir a função cumulativa para variáveis contínuas temos que :

Antes do limite inferior da 1ª classe, a frequência acumulada é 0, pelo que na representação gráfica se traça um segmento de recta sobre o eixo dos xx até esse valor.

No limite inferior da 2ª classe, a frequência acumulada é a frequência da classe anterior.

No limite inferior da 3ª classe, a frequência acumulada é a soma das frequências das duas classes anteriores e assim sucessivamente.

Chegando à ultima classe, temos a garantia que o limite superior será 1, 100% ou igual ao número total de observações, conforme se trabalhe com frequências relativas simples ou acumuladas ou frequências absolutas.

Depois de marcados estes pontos, supondo que a distribuição dentro de cada classe se faz de forma uniforme, unem-se estes pontos com segmentos de recta, obtendo-se assim o gráfico da função cumulativa.

33

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Para definir a função cumulativa é ainda necessário encontrar as equações dos segmentos de recta considerados em cada classe.

Considerando agora as alturas dos alunos da turma do 9º ano:

Tabela 10 – Alturas de alunos

Classes

Fi

[152,160[

4

[160,168[

9

[168,176[

17

[176,184[

20

[184,192[

23

Fi 152 160 168 176 184 192
Fi
152
160
168
176
184
192

Classes

Gráfico 13 – Função cumulativa para variáveis contínuas

A função cumulativa é dada por:

 0  1  x  2  5   x 8 
 0
1
x
2
5
x
8
F ( x
)
= 
x −
8
x
3
3
x
8
23

se x < 152

-

76

se 152

x

<

160

- 16

se 160

x

<

168

159

se 168

x

<

176

-

3

se 176

x

<

184

- 3

se 184

x

<

192

se x

192

34

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Curvas de frequência e ogivas

Quando o número de observações, para dados contínuos, é bastante elevado, podemos considerar classes com amplitudes muito pequenas, tendentes para zero, isto é, aumentar indefinidamente o número de classes, e desta forma o polígono de frequências aproxima-se de uma curva a que se chama curva de frequência.

Quando se trata de frequências acumuladas, a curva que se obtém designa-se normalmente por ogiva ou curva de acumulação de frequências.

100 90 80 70 60 50 40 30 20 10 0 X 1 X 2
100
90
80
70
60
50
40
30
20
10
0
X 1
X 2
X 3
X 4
X 5
X 6
X 7
X 8
Freq.(%)

Classes

Gráfico 14 – Curva de acumulação de frequências ou ogiva

Outros exemplos de curvas de frequência e ogivas:

Curva simétrica ou curva de gauss

de frequência e ogivas: Curva simétrica ou curva de gauss Curva assimétrica positiva ou curva desviada

Curva assimétrica positiva ou curva desviada para a direita

frequência e ogivas: Curva simétrica ou curva de gauss Curva assimétrica positiva ou curva desviada para

35

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Curva assimétrica negativa ou curva desviada para a esquerda

assimétrica negativa ou curva desviada para a esquerda Curva em J invertida Curva em J C

Curva em J invertida

ou curva desviada para a esquerda Curva em J invertida Curva em J C u r

Curva em J

desviada para a esquerda Curva em J invertida Curva em J C u r v a

Curva em U

Curva em J invertida Curva em J C u r v a e m U Ogiva
Ogiva ! ! ! ! ! !
Ogiva
!
!
!
!
!
!

Peso

Gráficos circulares

Os gráficos circulares são muito usuais para comparar frequências, e são de construção e leitura fácil.

Para construir um gráfico circular, considerando os dados contidos numa tabela, procede-se como se indica:

Desenha-se um círculo de raio qualquer a representar os 100% dos dados.

36

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Calcula-se a proporção do círculo que representará cada categoria, sabendo que 100% corresponderá a 360º do círculo, determinando a amplitude do ângulo ao centro correspondente às frequências relativas, já conhecidas.

Utilizando um transferidor, divide-se o círculo de acordo com as proporções.

Considerando o exemplo da tabela 11, o procedimento para a obtenção do gráfico circular, representado pelo gráfico 15, é o que se apresenta a seguir:

Tabela 11 – Frequência relativa de alunos por sexo

Sexo

F. relativa

 

65,2% 

 

34,8% 

Total

100%

Determinação da amplitude dos sectores circulares:

100% - 360º 65,2% - x

100% - 360º 34,8% - x

Divisão do circulo:

} x 235º

} x 125º

235º 125º
235º
125º

37

Capítulo 3: Representação gráfica e tabular de dados estatísticos

Alunos da escola X, por sexo 34,8º 65,2º
Alunos da escol