Você está na página 1de 116

Projeto

Mestrado em Educao e Tecnologia em Matemtica

ESTATSTICA
NO ENSINO BSICO E SECUNDRIO

Maria Alice da Silva Martins

Leiria, maio de 2012

Projeto
Mestrado em Educao e Tecnologia em Matemtica

ESTATSTICA
NO ENSINO BSICO E SECUNDRIO

Maria Alice da Silva Martins

Dissertao de Mestrado realizada sob a orientao da Doutora Helena


Ribeiro, Professora da Escola Superior de Tecnologia e Gesto do Instituto
Politcnico de Leiria, e co-orientao do Doutor Rui Santos, Professor da
Escola Superior de Tecnologia e Gesto do Instituto Politcnico de Leiria.

Leiria, maio de 2012

Agradecimentos
Ao meu marido e s minhas filhas, pela compreenso que tiveram comigo e pela fora que me
transmitiram ao longo desta caminhada.
Aos meus pais, pelo apoio dado, estando presentes sempre que foi necessrio.
Aos meus orientadores, Doutora Helena Ribeiro e Doutor Rui Santos, pelo tempo dispensado, pelas sugestes feitas e todo o apoio prestado, que possibilitaram a realizao deste
trabalho.
Aos meus colegas de mestrado, pela ajuda e fora dadas, mesmo quando a vontade de
continuar escasseava.
minha amiga Teresa, pelo estmulo dado ao longo deste percurso.
Aos meus colegas de trabalho, que direta ou indiretamente contriburam com as suas palavras de encorajamento.
A todos os meus sinceros agradecimentos.

Resumo

R ESUMO
A sociedade da informao exige que todos os cidados tenham conhecimentos de Estatstica para poderem intervir de forma crtica e fundamentada. Esta situao conduziu a
Estatstica a um lugar de relevo no currculo dos alunos, que exige um novo olhar sobre o seu
ensino, como preconizam os atuais programas.
neste contexto que surge o presente trabalho que, numa primeira parte, apresenta uma
reviso dos conceitos estatsticos lecionados no ensino bsico e secundrio, uma ferramenta
importante para o trabalho dos professores, permitindo-lhes uma clarificao desses conceitos,
num texto que se pretende cientificamente rigoroso.
De forma a alertar para incorrees, gralhas e/ou erros comuns, segue-se uma anlise
crtica a alguns materiais disponveis, nomeadamente manuais escolares atuais, onde o estudo
da regresso linear assume uma anlise mais detalhada.
Com o intuito de enriquecer os materiais existentes, numa perspetiva inovadora, capaz
de promover aprendizagens significativas, apresenta-se um conjunto de propostas de trabalho
para a sala de aula onde a tecnologia, nomeadamente o GeoGebra, adquire um papel de relevo
na compreenso dos conceitos. De forma a facilitar a utilizao deste software surge, no
incio da terceira etapa deste trabalho, uma explicao detalhada sobre o uso do GeoGebra na
estatstica descritiva.
Em suma, este trabalho pretende contribuir para a melhoria do ensino da Estatstica, quer
no que se refere preparao do corpo docente, quer atravs da incluso de propostas de
trabalho para utilizao em sala de aula.
Palavras chave: ensino de estatstica, estatstica descritiva, GeoGebra, regresso linear.

Estatstica no Ensino Bsico e Secundrio

iii

Abstract

A BSTRACT
The media industry requires that all citizens have a knowledge of Statistics in order to
play a critical and fundamented role in society. This situation has led Statistics to a prominent
place in the curriculum of students and demands a new look to education, as recommended
by current programs.
It is in this context that the present work has been elaborated. The first part presents a
review of statistical concepts taught at an elementary and secondary level, an important tool
for teachers work, and allows the clarification of these concepts in a text intended to be
scientifically rigorous.
In order to draw ones attention to mistakes, typos and/or common errors, the first part is
followed by a critical analysis of some available materials, which includes current textbooks
and where the study of linear regression assumes a more detailed analysis.
Having as main target the improval of the existing materials, with an innovative approach,
which can foster meaningful learning, a set of suggested tasks are presented to the classroom.
In this space, technology, namely GeoGebra, assumes a relevant role in the understanding of
concepts. In order to make the use of this software easier, a detailed explanation of GeoGebra
in descriptive statistics comes in the begining of the third stage of this work.
In summary, this paper aims to contribute to the improvement of Statistic teaching,
whether it concerns the preparation of mathematics teachers or by the inclusion of tasks applied in the classrooms context.
Keywords: Statistic teaching, descriptive statistics, GeoGebra, linear regression.

Estatstica no Ensino Bsico e Secundrio

Contedo

Agradecimentos

Resumo

iii

Abstract

Lista de Figuras

ix

Lista de Tabelas

xi

1 Introduo

2 Conceitos de Estatstica

2.1

Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2

Dados estatsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.3

Tabelas de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.3.1

Tabela de frequncias de uma varivel qualitativa . . . . . . . . . . .

15

2.3.2

Tabela de frequncias de uma varivel quantitativa discreta . . . . . .

16

2.3.3

Tabela de frequncias de uma varivel quantitativa contnua . . . . .

18

Representaes Grficas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

2.4.1

Pictograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

2.4.2

Grfico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

2.4.3

Grfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.4

vii

Contedo

2.5

2.6

2.7

2.8

2.9

viii

2.4.4

Grfico circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.4.5

Histograma e polgono de frequncias . . . . . . . . . . . . . . . . .

24

2.4.6

Representao grfica da funo cumulativa . . . . . . . . . . . . . .

24

2.4.7

Diagrama de caule e folhas . . . . . . . . . . . . . . . . . . . . . . .

26

Medidas de tendncia central . . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.5.1

Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.5.2

Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.5.3

Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

2.5.4

Comparao das medidas de tendncia central . . . . . . . . . . . . .

32

Medidas de tendncia no central . . . . . . . . . . . . . . . . . . . . . . . .

34

2.6.1

Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

2.6.2

Diagrama de extremos e quartis . . . . . . . . . . . . . . . . . . . .

37

2.6.3

Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.7.1

Amplitude total . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

39

2.7.2

Amplitude interquartis . . . . . . . . . . . . . . . . . . . . . . . . .

39

2.7.3

Desvio mdio absoluto, varincia e desvio padro . . . . . . . . . . .

40

Distribuies bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.8.1

Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . . . .

44

2.8.2

Coeficiente de correlao . . . . . . . . . . . . . . . . . . . . . . . .

45

Regresso linear simples . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

2.9.1

Regresso linear no Ensino Secundrio . . . . . . . . . . . . . . . .

48

2.9.2

O mtodo dos mnimos quadrados . . . . . . . . . . . . . . . . . . .

49

2.9.3

A regresso linear inversa . . . . . . . . . . . . . . . . . . . . . . .

51

2.9.4

Estimao de y condicionada a x = x0 . . . . . . . . . . . . . . . . .

53

Estatstica no Ensino Bsico e Secundrio

Contedo
3 Anlise crtica aos materiais disponveis

55

3.1

Erros nas escalas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

3.2

Confuso entre dados e frequncia . . . . . . . . . . . . . . . . . . . . . . .

57

3.3

Clculo da mdia quando a varivel contnua . . . . . . . . . . . . . . . .

58

3.4

Um erro comum na regresso linear . . . . . . . . . . . . . . . . . . . . . .

58

3.5

Definies pouco claras . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

3.6

Erros e/ou falta de clareza na notao . . . . . . . . . . . . . . . . . . . . .

60

4 Materiais e sugestes metodolgicas


4.1

4.2

63

O GeoGebra no ensino da Estatstica . . . . . . . . . . . . . . . . . . . . . .

63

4.1.1

Inserir dados no GeoGebra . . . . . . . . . . . . . . . . . . . . . . .

64

4.1.2

Construo de tabelas de frequncia . . . . . . . . . . . . . . . . . .

65

4.1.3

Representaes grficas . . . . . . . . . . . . . . . . . . . . . . . .

66

4.1.4

Clculo de medidas estatsticas . . . . . . . . . . . . . . . . . . . . .

69

4.1.5

Regresso linear . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

Propostas de trabalho para a sala de aula . . . . . . . . . . . . . . . . . . . .

72

4.2.1

Proposta 1 Quantas pessoas vivem em minha casa? . . . . . . . . .

73

4.2.2

Proposta 2 Classificaes obtidas num teste de Matemtica . . . .

74

4.2.3

Proposta 3 Meio de transporte utilizado para chegar escola . . . .

74

4.2.4

Proposta 4 Classificaes internas versus classificaes externas na


disciplina de Matemtica . . . . . . . . . . . . . . . . . . . . . . . .

75

4.2.5

Proposta 5 Salrios dos trabalhadores de uma empresa . . . . . . .

76

4.2.6

Proposta 6 Comparao de duas turmas . . . . . . . . . . . . . . .

76

4.2.7

Proposta 7 Peso e altura dos alunos de uma turma do 10.o ano . . .

77

5 Concluso

79

Referncias Bibliogrficas

81

Estatstica no Ensino Bsico e Secundrio

ix

Contedo
A Propostas de trabalho para a sala de aula

A.1 PROPOSTA 1 Quantas pessoas vivem em minha casa? . . . . . . . . . . .

II

A.2 PROPOSTA 2 Classificaes obtidas num teste de Matemtica . . . . . . .

III

A.3 PROPOSTA 3 Meio de transporte utilizado para chegar escola . . . . . .

A.4 PROPOSTA 4 Classificaes internas versus classificaes externas na disciplina de Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII
A.5 PROPOSTA 5 Salrios dos trabalhadores de uma empresa . . . . . . . . .

A.6 PROPOSTA 6 Comparao de duas turmas . . . . . . . . . . . . . . . . . XII


A.7 PROPOSTA 7 Peso e altura dos alunos de uma turma do 10.o ano . . . . . . XIV

Estatstica no Ensino Bsico e Secundrio

Lista de Figuras
2.1

Pictograma dos hbitos de leitura dos alunos . . . . . . . . . . . . . . . . . .

21

2.2

Grfico de pontos das idades dos alunos . . . . . . . . . . . . . . . . . . . .

22

2.3

Grfico de barras das idades dos alunos . . . . . . . . . . . . . . . . . . . .

23

2.4

Grfico circular das cores preferidas de 25 alunos . . . . . . . . . . . . . . .

23

2.5

Histograma da altura (em cm) de 25 alunos . . . . . . . . . . . . . . . . . .

24

2.6

Polgono de frequncias referente altura dos alunos . . . . . . . . . . . . .

25

2.7

Funo cumulativa relativa idade dos alunos . . . . . . . . . . . . . . . . .

25

2.8

Funo cumulativa relativa altura dos alunos . . . . . . . . . . . . . . . . .

26

2.9

Diagrama de caule e folhas relativo altura dos alunos . . . . . . . . . . . .

27

2.10 Tipos de assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.11 Distribuio simtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.12 Distribuies assimtricas . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

2.13 Esquema relativo aos extremos e quartis de uma distribuio . . . . . . . . .

36

2.14 Diagrama de extremos e quartis relativo idade dos 25 alunos . . . . . . . .

37

2.15 Diagrama de disperso das notas de Matemtica e de Cincias Fsico-Qumicas 44


2.16 Diagrama de disperso da idade dos pais e das mes . . . . . . . . . . . . . .

46

2.17 Diagramas de disperso com diferentes relaes entre as variveis . . . . . .

48

2.18 Definio dos erros na regresso linear . . . . . . . . . . . . . . . . . . . . .

52

2.19 Regresso de y condicionada a x versus de x condicionada a y . . . . . . . . .

53

3.1

56

Erros de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xi

Lista de Figuras

xii

3.2

Erros de escala horizontal . . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

3.3

Confuso entre dados e frequncia . . . . . . . . . . . . . . . . . . . . . . .

57

4.1

Janela principal do GeoGebra e folha de clculo . . . . . . . . . . . . . . . .

64

4.2

Tabela de frequncias absolutas da varivel cor preferida . . . . . . . . . . .

65

4.3

Tabela de frequncias absolutas da varivel idade . . . . . . . . . . . . . . .

66

4.4

Tabela de frequncias da varivel altura . . . . . . . . . . . . . . . . . . . .

66

4.5

Medidas estatsticas para a varivel idade . . . . . . . . . . . . . . . . . . .

70

4.6

Medidas estatsticas da idade, aps a alterao de um valor . . . . . . . . . .

70

4.7

Anlise univariada para a varivel idade . . . . . . . . . . . . . . . . . . . .

71

Estatstica no Ensino Bsico e Secundrio

Lista de Tabelas

2.1

Dados obtidos atravs de um questionrio a 25 alunos do 8.o ano . . . . . . .

13

2.2

Tabela de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

2.3

Tabela de frequncias da varivel cor preferida dos alunos . . . . . . . . . .

16

2.4

Tabela de frequncias da varivel idade dos alunos . . . . . . . . . . . . . .

17

2.5

Tabela de frequncias da altura dos alunos (como uma varivel discreta) . . .

18

2.6

Tabela de frequncias da varivel altura . . . . . . . . . . . . . . . . . . . .

19

2.7

Rendimentos agrupados em classes de igual amplitude . . . . . . . . . . . .

20

2.8

Nmero de faltas por doena . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.9

Tabela de frequncias do peso dos alunos . . . . . . . . . . . . . . . . . . .

30

2.10 Clculo do desvio mdio absoluto . . . . . . . . . . . . . . . . . . . . . . .

41

2.11 Exemplos de valores do coeficiente de correlao . . . . . . . . . . . . . . .

47

3.1

Sugesto de notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

4.1

Comandos para o clculo de medidas estatsticas com o GeoGebra . . . . . .

69

A.1 Classificaes obtidas num teste . . . . . . . . . . . . . . . . . . . . . . . .

III

A.2 Meio de transporte mais utilizado pelos alunos . . . . . . . . . . . . . . . . .

A.3 Classificaes internas versus classificaes externas . . . . . . . . . . . . . VIII


A.4 Salrios dos trabalhadores de uma empresa . . . . . . . . . . . . . . . . . .

A.5 Classificaes de Matemtica das turmas A e B do 7.o ano . . . . . . . . . . XII

xiii

Captulo 1
Introduo
Desde as primeiras grandes civilizaes que a Estatstica tem sido utilizada de forma profcua.
Em 3050 A.C. j os egpcios recorriam Estatstica para apurar os recursos humanos e materiais disponveis para a construo das pirmides. Outras civilizaes, tais como os Chineses, os
Gregos ou os Romanos, utilizaram a Estatstica para conhecerem os bens que o estado possua
bem como a sua distribuio pela populao. Desde ento, muitos foram os desenvolvimentos
das aplicaes da Estatstica, nomeadamente no que se refere recolha, organizao e anlise
de dados, quer esta seja restrita ao resumo da sua informao quer seja com o intuito de inferir ou efetuar previses. Atualmente, a Estatstica no s um instrumento indispensvel na
poltica de qualquer estado (no sculo XVII, em Inglaterra, a Estatstica era a Aritmtica do
Estado) como tambm um instrumento importante em muitas outras reas, tais como a Psicologia, a Sociologia, a Medicina, a Economia, o Desporto, a Biologia, a Fsica, a Educao,
a Meteorologia, entre muitas outras. Deste modo, presentemente a Estatstica desempenha
um papel fundamental na vida do cidado, no s pela utilidade das suas mltiplas aplicaes, mas igualmente por ser indispensvel para a anlise, interpretao e compreenso da
informao que os meios de comunicao social divulgam.
Como refere Fernandes a influncia da Estatstica na vida das pessoas e nas instituies
tem-se tornado cada vez mais visvel, o que implica que todos os cidados devam ter conhecimentos de Estatstica para se poderem integrar na sociedade actual (Fernandes, 2009, p.
1). Assim, tem havido um reconhecimento da importncia da Estatstica no currculo dos
alunos, de tal modo que esta tem vindo a ocupar, cada vez mais, um lugar de destaque no
ensino, desde o ensino bsico ao ensino secundrio, pois segundo Martins et al. a Estatstica
encarada como uma rea favorvel ao desenvolvimento de certas capacidades expressas
1

Introduo
nos currculos, tais como interpretar e intervir no real; formular e resolver problemas; comunicar; manifestar rigor e sentido crtico e ainda a aquisio de uma certa atitude positiva face
Cincia. Deste modo, ensinar estatstica no pode limitar-se ao ensino de tcnicas e frmulas
e aprender estatstica no pode ser aprender a aplicar rotineiramente procedimentos desinseridos de contextos, sem ter de interpretar, de analisar e de criticar (Martins et al., 1997, pp.
78). A coletnea de artigos Ensino e Aprendizagem da Estatstica (Loureiro et al. (2000))
um bom exemplo das reflexes sobre a importncia do Ensino da Estatstica no currculo do
ensino secundrio e ensino bsico, da utilidade da incluso da tecnologia na lecionao destes
contedos, bem como a partilha de experincias e materiais didticos no incio do sculo XXI.
No atual programa do ensino bsico o ensino da Estatstica inicia-se no primeiro ciclo assim como os aspetos elementares da Probabilidade, constituindo, em conjunto, desde 2007, o
tema Organizao e Tratamento de Dados (OTD)(1) , conforme as orientaes internacionais
presentes em NCTM(2) (2008). No ensino secundrio o tema aparece no 10.o ano com a designao Estatstica, onde se pretende ampliar os conhecimentos adquiridos anteriormente.
de referir que no objetivo deste projeto abordar conceitos relativos Probabilidade, pelo
que nos restringiremos anlise dos contedos referentes a Estatstica.
Nos ltimos anos tem havido um esforo por parte de alguns autores em fornecer suporte
terico e didtico que possa ajudar os professores nas suas aulas e que se encontram de acordo
com os programas atuais. Martins et al. (2007) elaboraram uma brochura direcionada aos professores do 1.o ciclo que surgiu no mbito do Programa Nacional de Formao Contnua em
Matemtica. Esta brochura, alm de conter os conceitos e procedimentos fundamentais para
um professor deste nvel de ensino, apresenta vrias propostas de tarefas a implementar na
sala de aula com a respetiva explorao. A brochura elaborada por Martins & Ponte (2010)
desenvolve as orientaes metodolgicas relativas OTD, apresentando quatro captulos reservados Estatstica, onde tambm so sugeridas tarefas a propor aos alunos na sala de aula.
Um site de referncia na rea da Estatstica o ALEA Aco Local Estatstica Aplicada, www.alea.pt (podemos encontrar mais informaes em INE (2009)). Este projeto
existe desde 1999 e tem-se mantido sempre em crescimento, apresentando vrias componentes, tais como entretenimento, cursos de estatstica e dados estatsticos. direcionado a

(1)

Consulte-se, por exemplo, Loura (2009) para uma anlise crtica ao novo programa.

(2)

NCTM National Council of Teachers of Mathematics.

Estatstica no Ensino Bsico e Secundrio

Introduo
alunos, professores e pblico em geral e pretende contribuir para melhorar a literacia estatstica(3) e fomentar situaes e experincias de aprendizagem recorrendo s Tecnologias da
Informao e Comunicao (TIC). de referir que aquando da comemorao do seu 10.o aniversrio foi editado um livro constitudo por 5 dossiers produzidos pelo ALEA e que mais
um documento til nesta temtica. H, contudo, diversos outros materiais para o ensino e
aprendizagem da Estatstica disponveis (cf. Nascimento (2009)).
Este projeto, intitulado Estatstica no Ensino Bsico e Secundrio, tem como principais
objetivos:
apresentar os conceitos mais elementares de Estatstica lecionados nestes ciclos de ensino, num texto cientificamente rigoroso, direcionado a professores, permitindo-lhes a
clarificao destes conceitos;
analisar alguns materiais disponveis para o ensino da Estatstica nestes ciclos, apresentando as incorrees, gralhas e/ou erros detetados, bem como materiais que consideremos insuficientes e/ou inadequados para os objetivos para os quais foram concebidos;
criar novos materiais bem como sugerir metodologias que possam ser utilizados no
ensino da Estatstica.
Neste sentido, o segundo captulo apresentar uma reviso dos conceitos de Estatstica
lecionados no ensino bsico e no ensino secundrio: tabelas de frequncias, representaes
grficas e principais medidas de estatstica descritiva, conforme definido no Programa de Matemtica do Ensino Bsico (Ponte et al., 2007) e no Programa de Matemtica A do Ensino
Secundrio (Silva et al., 2001). Este captulo ir basear-se em livros de autores especialistas
na rea, tais como Murteira (1993), Reis (1998), Batanero & Godino (2003), Pestana & Velosa
(2009) e Maria Eugnia Martins com os seus diversos trabalhos nesta rea (como por exemplo
Martins (2005), Martins & Cerveira (1999), Martins & Ponte (2010) ou Martins et al. (2007,
1997)). No se pretende que este captulo seja direcionado para os alunos, mas antes para
professores que podem procurar neste trabalho a clarificao de qualquer conceito, entre os
que so abordados no ensino bsico e secundrio. Sendo assim, a principal preocupao ser a
preciso e clareza dos conceitos, com um ou outro exemplo, mas sem a preocupao didtica
que um manual para alunos do ensino bsico ou secundrio deve conter. Por esta razo no
(3)

Para uma clarificao deste conceito podemos consultar, por exemplo, Branco & Martins (2002).

Estatstica no Ensino Bsico e Secundrio

Introduo
haver preocupao em colocar os conceitos por ordem de lecionao, mas antes pela ordem
que se considere mais adequada para obtermos uma clara exposio dos mesmos.
No terceiro captulo do projeto pretende-se fazer uma anlise crtica aos materiais disponveis para o ensino e compreenso dos conceitos mais elementares de Estatstica. Sero
analisados vrios manuais escolares, nomeadamente os adotados na escola onde a autora leciona, e apresentadas e fundamentadas as incorrees, gralhas ou erros detetados nos temas
OTD e Estatstica. Analisaremos deste modo a adequao dos materiais de forma a serem
identificadas lacunas nos materiais usualmente utilizados. Ser igualmente importante e pertinente a comunicao dos erros encontrados, via e-mail, s entidades responsveis. de
referir que este procedimento j teve incio no que diz respeito ao manual adotado na escola
da autora, para o 10.o ano, atravs da representante da editora. Salienta-se ainda que o objetivo desta anlise aos manuais no se restringe deteo de gralhas que, embora tenham de
ser corrigidas, por vezes podem at no comprometer o ensino dos contedos previstos nos
programas. Pretende-se igualmente identificar contedos cujas metodologias propostas nos
manuais nos paream insuficientes para a compreenso dos conceitos ensinados, dos quais
destacamos a regresso linear. de referir um estudo realizado por Martinho & Viseu (2009)
que consistiu na anlise de dois manuais do 7.o ano quanto s dimenses: interpretao, crtica
e produo. A primeira dimenso refere-se capacidade de ler e compreender a informao
(textos, tabelas, grficos). A segunda dimenso abrange a capacidade de avaliar criticamente
a informao estatstica. Por fim, a dimenso designada de produo contempla a capacidade
de argumentar, de comunicar a informao estatstica e de tomar decises. Estes autores concluram que a dimenso mais presente nos dois manuais a de interpretao. Concluiu-se
ainda que num manual as dimenses crtica e de produo so quase inexistentes e no outro,
apesar de mais expressivas, no promovem o desenvolvimento da atitude crtica no aluno.
de salientar a relevncia subjacente anlise de manuais escolares uma vez que a maioria dos
professores recorre, habitualmente, a eles quando prepara as suas aulas. Segundo o estudo
Matemtica 2001 realizado pela Associao de Professores de Matemtica (APM (1998)),
no que diz respeito s prticas profissionais dos professores e no item materiais usados na
preparao das aulas, concluiu-se que 87% dos professores utiliza sempre ou muitas vezes o
manual adotado na escola e 68% outros manuais.
Tendo em conta o trabalho desenvolvido no terceiro captulo do projeto, nomeadamente as
situaes analisadas e que, de alguma forma, exigem uma correo, uma explicao, exemplos
4

Estatstica no Ensino Bsico e Secundrio

Introduo
mais enriquecedores, entre outros, pretende-se no captulo quatro do projeto apresentar novos
materiais e propor metodologias que possam ser utilizados no ensino da Estatstica, de forma
a facilitar a compreenso e explorao dos principais conceitos por parte dos alunos. Uma
vez que uma das vertentes fundamentais para o sucesso do ensino da Estatstica termos
professores preparados para o seu ensino, pretendemos que estes materiais vo tambm ao
encontro das necessidades dos professores, como ilustrar o caso da regresso linear simples
(consultar seco 3.4 na pgina 58), pois trata-se de um erro encontrado em vrios manuais
consultados. Sendo um erro to generalizado s pode advir da falta de compreenso dos
conceitos, pelo que iremos elaborar propostas para a sua clarificao. Acrescente-se ainda que
dos materiais a elaborar podem constar: propostas de trabalho para realizar na sala de aula;
a explicao de como construir materiais interativos de forma a possibilitar a construo de
apresentaes a utilizar pelos professores; metodologias direcionadas ao ensino da estatstica,
sendo que o software utilizado na explorao destes materiais ser o GeoGebra.
De referir igualmente que a escolha deste projeto foi fortemente motivada pelo gosto da
autora pela Estatstica, o qual bem patente na contnua participao em diversos trabalhos
realizados dentro e fora da sala de aula com os seus alunos, nas suas orientaes a alunos para
a participao em concursos a nvel nacional para estudantes (como ilustra o Prmio Pedro
Matos organizado pelo IPL, o Prmio Estatstico Jnior organizado pela SPE e os Desafios
do ALEA promovidos pelo site www.alea.pt), bem como o seu olhar, sempre atento e crtico, aos manuais adotados para a lecionao dos contedos programticos da disciplina de
Matemtica, essencialmente do 7.o ano ao 12.o ano. Por outro lado, a autora considera um
desafio explorar as potencialidades do GeoGebra na Estatstica, uma vez que as experincias
que tinha deste software eram no mbito da Geometria e da lgebra. Acrescente-se ainda
que, a propsito do Plano da Matemtica e das sesses em que participa regularmente, tem
tido oportunidade de analisar o programa atual do ensino bsico com mais pormenor, estando
mais sensibilizada para as ideias a preconizadas.
Este projeto pretende contribuir para melhorar o ensino da Estatstica, uma vez que qualquer professor do ensino bsico ou secundrio poder encontrar neste trabalho esclarecimentos relativos a conceitos que tem de lecionar, chamadas de ateno para erros comuns na rea
da Estatstica e sugestes de materiais e metodologias para o ensino da Estatstica. Tambm
poder contribuir para que os manuais venham a ser cada vez melhores, uma vez que as incorrees, gralhas ou erros detetados sero comunicados aos seus autores.

Estatstica no Ensino Bsico e Secundrio

Captulo 2
Conceitos de Estatstica
A Estatstica uma cincia atual, com mltiplas funes e til humanidade. Desde sempre
que o homem procura o conhecimento e, para tal, recolhe dados com determinadas intenes,
nas mais diversas reas do saber. Todos os dias a comunicao social faz-nos chegar notcias
baseadas em estudos estatsticos, apresentando-nos as concluses mais relevantes. Para se
obter essas concluses h um caminho a percorrer, mais ou menos longo, consoante o estudo
realizado, mas bastante facilitado com o recurso tecnologia, Teoria das Probabilidades e
nomeadamente Inferncia Estatstica. Tendo em conta os programas do ensino bsico e do
ensino secundrio (Matemtica A) este projeto vai incidir sobre Estatstica Descritiva cuja finalidade descrever os dados recolhidos a partir de uma amostra ou populao, resumindo a
informao atravs de grficos, tabelas e algumas medidas estatsticas, sem esquecer as comparaes, por exemplo, entre dois conjuntos de dados. O desenvolvimento destes contedos
acompanhado de alguns exemplos ser objeto deste captulo. Relembramos ainda que no
programa do ensino bsico a Estatstica aparece desde o primeiro ciclo e designa-se por Organizao e Tratamento de Dados, desde 2007, data em que o Programa de Matemtica do
ensino bsico foi homologado. No programa de Matemtica A do ensino secundrio o tema
aparece no 10.o ano com a designao Estatstica onde se pretende ampliar os conhecimentos adquiridos anteriormente. Neste captulo os conceitos sero apresentados sem que se faa
referncia ao ano de escolaridade em que se lecionam, utilizando a ordem que nos parece mais
adequada para a sua exposio.
Tendo em conta que os dados que pretendemos resumir e interpretar devem, preferencialmente, estar associados a um contexto, vamos comear por enumerar as etapas de um estudo
estatstico. Deste modo, um estudo estatstico inclui as seguintes etapas:
7

Conceitos de Estatstica
1. definio do problema a estudar, formulando as questes s quais se pretende dar resposta;
2. planeamento da recolha de dados tendo em vista o estudo a realizar. nesta fase que
devemos decidir se recorremos populao ou amostra e definir as variveis com
rigor;
3. organizao e tratamento dos dados atravs de tabelas de frequncia, grficos e algumas
medidas estatsticas;
4. interpretao dos resultados obtidos e estabelecimento de concluses.

Exemplo 2.1. Exemplos de estudos estatsticos: hbitos alimentares dos alunos do 9.o ano;
a crise econmica na vida dos torrejanos; o peso e a altura dos alunos do 8.o ano da Escola
Artur Gonalves e a durabilidade (em quilmetros percorridos) dos pneus de uma determinada
marca.
Quando se faz um estudo estatstico pode obter-se informao de todos os elementos
(indivduos) do universo (populao) sobre o qual incide o estudo e, neste caso, faz-se um
censo; ou recorre-se a uma parte representativa da populao (amostra) e o estudo efetuado
denomina-se sondagem.
Definio 2.1. Uma populao uma coleo de unidades individuais, que podem ser pessoas, animais, objetos, acontecimentos ou resultados experimentais com uma ou mais caractersticas comuns que se pretendem estudar. A cada elemento da populao chama-se indivduo
ou unidade estatstica. O nmero de elementos da populao representado por N (caso esta
seja finita).
Definio 2.2. Uma amostra um subconjunto representativo da populao que se obtm
atravs de mtodos apropriados. A sua dimenso representada por n.
Nas situaes em que o estudo implica a destruio dos elementos a observar (por exemplo, quando pretendemos estudar a fiabilidade dos pneus ou a existncia de bactrias nos
iogurtes) recorre-se sempre a uma amostra. Tambm aconselhvel recorrer a uma amostra
por razes econmicas ou de tempo, pois observar todos os elementos da populao pode
implicar custos elevados ou a obteno tardia dos resultados.
8

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
A determinao dos elementos que constituem a amostra, com vista obteno dos dados para a realizao do estudo estatstico, tambm designado por processo de amostragem,
dever se objeto de especial cuidado. Sempre que pretendemos estender os resultados de um
estudo estatstico a toda a populao devemos observar o princpio da aleatoriedade. Quando,
para todo o elemento da populao existe uma probabilidade positiva de pertencer amostra,
dizemos que estamos perante uma amostra aleatria. Caso particular o processo de amostragem simples onde cada grupo de dimenso n tem igual probabilidade de ser selecionado

(com probabilidade igual a N1 , uma vez que existem Nn amostras distintas com igual pro(n)
babilidade de serem selecionadas). Neste caso prova-se que cada indivduo tem a mesma
probabilidade de ser selecionado, sendo esta probabilidade igual a

n
N.

Para mais informaes

consultar INE (2009, p. 43-71).


Quando existem elementos da populao que podem no ser selecionados para a amostra estamos perante um processo de amostragem no aleatria. Neste caso dizemos que o
processo de recolha da amostra inviesado e poder conduzir a interpretaes erradas.
Exemplo 2.2. Exemplos de situaes que originam amostras enviesadas: perguntar aos alunos do 9.o ano que almoam diariamente no refeitrio da escola os hbitos alimentares e
generalizar a todos os alunos do 9.o ano; perguntar aos torrejanos que trabalham numa empresa os efeitos da crise econmica e generalizar a todos os torrejanos; perguntar o clube
preferido porta do Estdio da Luz e generalizar a toda a populao e efetuar um inqurito,
num Hospital, sobre a sade dos portugueses.
No primeiro caso ilustrado no exemplo 2.2 no obteramos qualquer informao relativa
aos alunos que almoam no bar da escola, em casa ou nos arredores da escola. No segundo
caso, pelo facto de as pessoas questionadas trabalharem numa empresa, no estavam includos,
por exemplo, indivduos desempregados. No terceiro caso, os indivduos seriam todos ou
quase todos do Benfica e no ltimo caso as pessoas inquiridas estariam doentes (ou eram
acompanhantes dos doentes).
As situaes anteriores evidenciam fontes de enviesamento na recolha dos dados, pelo
que esses estudos no conduziriam a resultados eficientes, nem permitiriam efetuar generalizaes. No entanto h diversos estudos possveis de realizar ao nvel do ensino bsico e
secundrio em que, recorrendo a amostras no enviesadas, se pode generalizar os resultados
obtidos. Por exemplo, se selecionarmos aleatoriamente 5 alunos de cada turma de uma escola
(supondo que cada turma tem um nmero de alunos aproximado) e estudarmos o nmero de
Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
irmos, o nmero do sapato ou a altura, faz sentido generalizar para toda a escola. Neste caso
estamos a considerar que a populao, constituda pelos alunos da escola, est dividida em vrias subpopulaes (designadas de estratos) mais ou menos homogneas e em cada uma destas
subpopulaes recolhe-se uma amostra aleatria simples (amostra aleatria estratificada).
de salientar que os alunos mais novos, nomeadamente do 1.o ciclo, podero usar a sua turma
como populao em estudo de modo a facilitar os seus projetos nesta rea.
Em qualquer estudo estatstico, necessrio identificar e classificar as caractersticas em
anlise, de acordo com os objetivos traados.

2.1

Variveis

Tendo em conta a amostra sobre a qual recai o estudo estatstico e os objetivos fixados,
definem-se as caratersticas a analisar (variveis estatsticas), as quais devem ser comuns
a todos os elementos da populao.
Definio 2.3. Varivel estatstica (ou atributo) a propriedade ou caracterstica comum que
se observa em cada uma das unidades estatsticas. Representa-se, habitualmente, por uma das
ltimas letras do alfabeto, por exemplo, x ou y.
As variveis estatsticas podem classificar-se em quantitativas ou qualitativas. A varivel
quantitativa aquela que se refere a uma caracterstica mensurvel, isto , que se pode contar
ou medir. Por conseguinte, traduz-se por valores numricos.
Exemplo 2.3. Exemplos de variveis quantitativas: nmero de divises de uma habitao;
idade de um indivduo; nmero de alunos por turma e tempo necessrio para chegar de casa
escola.
Uma varivel quantitativa pode ser discreta ou contnua. Quando a caracterstica em estudo se pode apenas contar e no medir, a varivel discreta, como por exemplo o nmero de
alunos por turma. Por outro lado, uma varivel quantitativa que se pode medir uma varivel
contnua, como por exemplo o tempo necessrio para chegar de casa escola.
A varivel qualitativa aquela que se refere a uma caracterstica que no susceptvel de
medio ou contagem e, como tal, traduz-se por diferentes modalidades (possveis respostas
que a varivel pode assumir).
10

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Exemplo 2.4. Exemplos de variveis qualitativas: ano de escolaridade dos alunos; profisso
dos pais; meio de transporte utilizado para chegar de casa escola e cor preferida dos estudantes de uma turma.
As variveis qualitativas podem ser classificadas em nominais ou ordinais. Um varivel
estatstica nominal quando no se pode estabelecer uma relao de ordem entre as modalidades e ordinal no caso em que as modalidades apresentam uma ordem subjacente. Como
exemplo de uma varivel qualitativa ordinal podemos considerar as habilitaes literrias de
um indivduo. Um exemplo de uma varivel qualitativa nominal pode ser a cor preferida dos
estudantes.

2.2

Dados estatsticos

Sempre que se observa uma varivel estatstica, quantitativa ou qualitativa, obtemos determinados resultados que designamos por dados estatsticos.
Definio 2.4. Dado estatstico o resultado de cada observao da varivel numa unidade
estatstica.
Se a varivel em estudo for, por exemplo, o nmero de alunos por turma, os dados estatsticos podem ser:
22, 28, 24, 24, 28, 20, 28, ,
mas no caso da varivel ser o ano de escolaridade dos alunos, alguns dados estatsticos podem
ser:
5.o ano; 6.o ano; 6.o ano; 8.o ano; 7.o ano; 12.o ano,
Os dados estatsticos so muito mais do que nmeros ou modalidades. Eles esto sempre
associados a um contexto. Na primeira situao apresentada, em que a varivel o nmero
de alunos por turma, cada unidade estatstica uma turma. Para cada turma observou-se o
nmero de alunos, obtendo-se, assim, os dados estatsticos. Na segunda situao, em que a
varivel o ano de escolaridade, cada unidade estatstica um aluno. Para cada aluno registouse o seu ano de escolaridade. Deste modo, obtiveram-se os dados estatsticos que neste caso
so modalidades, pois a varivel qualitativa. Aproveitamos para reforar a importncia de,
Estatstica no Ensino Bsico e Secundrio

11

Conceitos de Estatstica
num estudo estatstico, saber quais os dados que queremos obter de modo a dar resposta s
questes levantadas, apresentando concluses pertinentes.
Neste captulo vamos recorrer, como exemplo, ao resultado de um inqurito efetuado a
25 alunos de uma escola, selecionados de entre as trs turmas do 8.o ano, relativamente sua
cor preferida; seus hbitos de leitura; idade (em anos); altura (em centmetros - cm); notas
do teste diagnstico de Matemtica (Mat.) e do teste diagnstico a Cincias Fsico-Qumicas
(C.F.Q.) numa escala de 0 a 100 valores. Os dados obtidos esto apresentados na Tabela 2.1.
Notemos que as variveis cor preferida e hbitos de leitura so variveis qualitativas, as
variveis nota a Matemtica, nota a Cincias Fsico-Qumicas e idade(1) so variveis quantitativas discretas e a varivel altura uma varivel quantitativa contnua.
Relativamente notao que utilizaremos ao longo deste trabalho, as observaes da
amostra sero representadas por
x1 , x2 , . . . , xn ,
onde xi representa a resposta do indivduo i relativamente varivel x. Para o tratamento estatstico usual agrupar os indivduos cujas respostas so iguais, sendo as diferentes respostas
presentes na amostra representadas por
x1 , x2 , . . . , xp
onde p representa o nmero de respostas distintas e, naturalmente, p n. Desta forma podemos construir as tabelas de frequncias.

2.3

Tabelas de frequncias

Aps a recolha de dados, outra fase muito importante a sua organizao em tabelas de
frequncias. Com este objetivo devemos atender s seguintes definies.
Definio 2.5. A frequncia absoluta o nmero de vezes que cada valor da varivel (ou
cada modalidade) aparece num conjunto de dados. Representa-se por ni que corresponde ao
nmero de vezes que se observou xi .
(1)

Apesar dos dados resultarem de uma medio, a forma como so apresentados (nmero inteiro de anos)

tm a aparncia de dados discretos. Contudo, por exemplo, o valor 14, refere-se a todas as idades maiores ou
iguais a 14 e menores que 15. Por esta razo podemos tambm considerar a varivel idade como uma varivel
contnua que foi discretizada.

12

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

Aluno

Cor

Hbitos

Idade

Altura

Nota a Nota a

preferida

de leitura

(anos)

(cm)

Mat.

C.F.Q.

azul

leio todos os dias

15

150

42

60

branco

no costumo ler

14

159

37

43

azul

leio todas as semanas

13

146

80

81

branco

leio todos os dias

14

157

78

80

azul

leio todas as semanas

14

163

79

85

amarelo

no costumo ler

13

158

63

60

azul

leio todos os dias

15

160

63

64

azul

leio todas as semanas

15

165

45

53

amarelo

leio todas as semanas

14

154

50

55

10

verde

s leio nas frias

13

149

32

35

11

branco

s leio nas frias

14

153

60

70

12

branco

leio todas as semanas

14

166

38

39

13

cor-de-rosa

leio todas as semanas

13

153

45

47

14

cor-de-rosa

s leio nas frias

13

152

60

62

15

azul

leio todos os dias

14

159

71

70

16

amarelo

leio todos os dias

14

155

25

27

17

amarelo

s leio nas frias

13

156

60

64

18

cor-de-rosa

leio todas as semanas

14

152

64

65

19

cor-de-rosa

leio todas as semanas

14

163

65

60

20

cor-de-rosa

s leio nas frias

14

157

37

38

21

verde

leio todos os dias

15

164

64

65

22

azul

leio todas as semanas

15

169

87

90

23

cor de rosa

leio todas as semanas

14

157

87

88

24

verde

no costumo ler

16

164

48

54

25

cor-de-rosa

s leio nas frias

14

155

50

55

Tabela 2.1: Dados obtidos atravs de um questionrio a 25 alunos do 8.o ano

A soma das frequncias absolutas igual dimenso da amostra, isto ,


p

ni = n.

(2.1)

i=1

Estatstica no Ensino Bsico e Secundrio

13

Conceitos de Estatstica
Definio 2.6. A frequncia relativa de cada modalidade xi a proporo de observaes
iguais a xi , isto , o quociente que se obtm dividindo a frequncia absoluta de um valor (ou
modalidade) pelo nmero total de dados. Representa-se por fi sendo
fi =

ni
,
n

(2.2)

onde n o nmero de elementos da amostra.


Uma propriedade importante das frequncias relativas a soma das frequncias relativas
ser igual a 1, isto ,

fi = 1.

(2.3)

i=1

Notemos que quando pretendemos efetuar comparaes devemos usar a frequncia relativa, pois muitas vezes as amostras tm dimenses diferentes e, nestes casos, no faz sentido
usar a frequncia absoluta. Por exemplo, quando se pretende comparar o nmero de aprovaes de duas turmas com dimenses distintas no se deve comparar as frequncias absolutas
mas antes as frequncias relativas.
Definio 2.7. A frequncia absoluta acumulada de cada valor xi da varivel o nmero
total de dados com valor menor ou igual a xi . Representa-se por Ni .
A frequncia absoluta acumulada obtm-se adicionando as frequncias absolutas desde o
primeiro at ao ltimo valor considerado da varivel, isto ,
i

Ni =

n j,

(2.4)

j=1

onde, naturalmente, N p = n.
Definio 2.8. A frequncia relativa acumulada de cada valor xi da varivel a soma das
frequncias relativas de todos os dados com valor menor ou igual a xi . Representa-se por Fi .
A frequncia relativa acumulada obtm-se adicionando as frequncias relativas desde o
primeiro at ao ltimo valor considerado da varivel, isto ,
i

Fi =

f j,

(2.5)

j=1

ou utilizando as frequncias absolutas acumuladas


Fi =
14

Ni
,
n

(2.6)

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
onde Fp = 1.
Uma das formas de organizarmos os dados estatsticos atravs da construo de tabelas
de frequncias, pois trazem-nos fortes vantagens na leitura dos dados. Agora que j definimos
os diferentes tipos de frequncia, apresentamos na Tabela 2.2 uma tabela de frequncias geral.
Na primeira coluna so apresentados os diferentes valores ou modalidades, da varivel estatstica, presentes na amostra e nas colunas seguintes as correspondentes frequncias absolutas,
relativas e acumuladas. Na ltima linha da tabela apresentada a soma da respetiva coluna,
sempre que tal tenha significado.
Varivel Frequncia

Frequncia

Frequncia

Frequncia

absoluta

absoluta

relativa

relativa

ni

acumulada Ni

fi

acumulada Fi

x1

n1

N1 = n1

f1

F1 = f1

x2

n2

N2 = n1 + n2

f2

F2 = f1 + f2

ni

Ni = n1 + + ni

Fi = fi

f1 + + fi

np

N p = n1 + + n p = n

fn

Fp = f1 + + f p = 1

xi

xp

Total

1
Tabela 2.2: Tabela de frequncias

comum designar a tabela de frequncias de acordo com as frequncias que a compem.


Por exemplo, uma tabela de frequncias absolutas simples apresenta apenas estas frequncias
para cada um dos valores ou modalidades.

2.3.1 Tabela de frequncias de uma varivel qualitativa


Quando a varivel em estudo qualitativa os dados estatsticos apresentam-se na forma de
modalidades. Como tal, deve proceder-se contagem das diferentes modalidades e organizar
os dados numa tabela de frequncias absolutas e relativas simples. Vamos ilustrar esta situao
com as cores preferidas dos alunos, dadas na Tabela 2.1 presente na pgina 13. Os dados
apresentam 5 modalidades diferentes (p = 5) e encontram-se organizados na Tabela 2.3.
Estatstica no Ensino Bsico e Secundrio

15

Conceitos de Estatstica

Cor

Frequncia

Frequncia

preferida

absoluta

relativa

dos alunos

ni

fi

branco

4:25 = 0,16 (16%)

amarelo

4:25 = 0,16 (16%)

cor-de-rosa

7:25 = 0,28 (28%)

azul

7:25 = 0,28 (28%)

verde

3:25 = 0,12 (12%)

Total

25

Tabela 2.3: Tabela de frequncias da varivel cor preferida dos alunos

Refira-se que, caso estivssemos perante uma varivel qualitativa ordinal, por exemplo,
habilitaes literrias, faria sentido o clculo das frequncias acumuladas, uma vez que neste
caso a ordem das modalidades tem significado.

2.3.2 Tabela de frequncias de uma varivel quantitativa discreta


Tratando-se de uma varivel quantitativa discreta deve proceder-se contagem dos diferentes
valores e organizao dos dados numa tabela de frequncias absolutas ou relativas, simples
ou acumuladas. Neste tipo de varivel os dados estatsticos apresentam-se na forma de valores
sendo, sempre possvel, a sua ordenao.
Para ilustrar esta situao consideremos agora as idades dos 25 alunos. Verificamos que
existem quatro valores diferentes da varivel (13, 14, 15 e 16), logo p = 4. Os dados podem
organizar-se numa tabela de frequncias conforme a apresentada como Tabela 2.4.

Funo cumulativa para dados discretos


Associada a cada uma das frequncias acumuladas podemos definir a funo cumulativa. No
caso das frequncias absolutas, associa a cada valor de x o nmero total de dados observados
com valor menor ou igual a x, isto ,
N(x) =

ni .

(2.7)

xi x

16

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

Idade

Frequncia

Frequncia

Frequncia

Frequncia

dos

absoluta

absoluta

relativa

relativa

alunos

ni

acumulada Ni

fi

acumulada Fi

13

6:25 = 0,24 (24%)

0,24 (24%)

14

13

19

13:25 = 0,52 (52%)

0,76 (76%)

15

24

5:25 = 0,2 (20%)

0,96 (96%)

16

25

1:25 = 0,04 (4%)

1 (100%)

Total

25

Tabela 2.4: Tabela de frequncias da varivel idade dos alunos

No caso das frequncias relativas, faz corresponder a cada valor de x a frequncia relativa do
total de dados observados com valor menor ou igual a x, isto ,
F(x) =

fi .

(2.8)

xi x

Como exemplo vamos definir, analiticamente, as funes cumulativas das frequncias absolutas e das frequncias relativas para a varivel idade dos alunos,

N(x) = 19

24

25

F(x) =

se x < 13
se 13 x < 14
se 14 x < 15 ,

(2.9)

se 15 x < 16
se x 16

0
se x < 13

0, 24 se 13 x < 14

0, 76 se 14 x < 15 .

0, 96 se 15 x < 16

1
se x 16

(2.10)

A representao grfica da funo (2.9) pode ver-se na seco 2.4.6 (pgina 24).
Estatstica no Ensino Bsico e Secundrio

17

Conceitos de Estatstica

2.3.3 Tabela de frequncias de uma varivel quantitativa contnua


Quando a varivel em estudo quantitativa contnua(2) , os dados estatsticos podem tomar
qualquer valor de um certo intervalo, surgindo poucas repeties. Por este motivo, no faz
sentido atribuir uma frequncia a cada valor diferente da varivel, pois a tabela assim obtida
no permitiria obter concluses importantes pelo facto de no conduzir a regularidades, como
ilustra o exemplo apresentado na Tabela 2.5. Neste exemplo consideramos a altura dos alunos
e tratamos a varivel altura como quantitativa discreta.
Altura dos alunos Frequncia absoluta ni
146

149

150

152

153

154

155

156

157

158

159

160

162

163

164

165

166

169

Tabela 2.5: Tabela de frequncias da altura dos alunos (como uma varivel discreta)

Uma vez que as regularidades so impercetveis nesta tabela, vamos agrupar os dados,
(2)

Este procedimento tambm deve ser aplicado em variveis quantitativas discretas que assumam muitos

valores distintos

18

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
relativos s alturas, em classes procedendo do seguinte modo:
calcular a diferena entre a altura mxima e a altura mnima (amplitude da amostra);
determinar o nmero de classes k a construir, utilizando a regra de Sturges, (onde k o
menor nmero inteiro tal que 2k n);

determinar a amplitude de cada classe que ser aproximadamente (por excesso) o quociente que se obtm dividindo a amplitude da amostra pelo nmero de classes.
Vamos assim obter os intervalos, habitualmente denominados por intervalos de classe,
[l0 , l1 [, [l1 , l2 [, , [lk2 , lk1 [, [lk1 , lk ],
onde l0 < l1 < l2 < < lk1 < lk . Os intervalos so disjuntos dois a dois e a sua unio contm
todos os valores. Notemos que l0 menor ou igual que o valor mnimo observado e lk maior
ou igual que o valor mximo observado (de forma a garantir que o intervalo [l0 , lk ] contenha
todas as observaes).
Tendo em conta os passos anteriores, relativamente altura dos 25 alunos, verifica-se que
a altura mxima 169, a altura mnima 146 e a amplitude 169 146 = 23. Como 25 25

(e 24 < 25), iremos considerar k = 5 classes. Dado que

23
5

= 4, 6, vamos construir 5 classes

todas de amplitude 5. Assim obtm-se a tabela de frequncias apresentada na Tabela 2.6.


Altura

Frequncia

Frequncia

Frequncia

Frequncia

dos

absoluta

absoluta

relativa

relativa

alunos

ni

acumulada Ni

fi

acumulada Fi

[145,150[

2:25 = 0,08 (8%)

0,08 (8%)

[150,155[

5:25 = 0,20 (20%)

0,28 (28%)

[155,160[

15

8:25 = 0,32 (32%)

0,60 (60%)

[160,165[

21

6:25 = 0,24 (24%)

0,84 (84%)

[165,170]

25

4:25 = 0,16 (16%)

1 (100%)

Tabela 2.6: Tabela de frequncias da varivel altura

Pode aplicar-se este processo (regra de Sturges) de modo idntico sempre que a varivel
seja quantitativa contnua. Saliente-se, contudo, que no mtodo nico e que nem sempre
Estatstica no Ensino Bsico e Secundrio

19

Conceitos de Estatstica
conduz a resultados aceitveis. A ttulo de exemplo, usando este mtodo, se analisarmos o
rendimento de 100 indivduos e um deles tiver um rendimento muito superior aos restantes
podemos obter 7 classes de igual amplitude, onde na primeira esto 99 indivduos e na ltima
apenas um, como se ilustra no exemplo 2.5.
Exemplo 2.5. De um grupo de 100 trabalhadores de um empresa, 99 auferem entre 475 euros
(rendimento mnimo) e 1100 euros e um indivduo aufere 5000 euros (rendimento mximo).
Tendo em conta os passos descritos previamente, a amplitude igual a 5000 475 = 4525 e o
nmero de classes a considerar igual a 7 (k = 7) uma vez que 27 100 (e 26 < 100). Dado

que

4525
7

646, 4, segundo a regra de Sturges vamos construir 7 classes todas de amplitude

647, de onde se obtm a tabela de frequncia apresentada como Tabela 2.7. Naturalmente,
num caso como este pertinente o uso de classes com diferentes amplitudes.
Rendimento

Frequncia

em

absoluta

euros

ni

[475,1122[

99

[1122,1769[

[1769,2416[

[2416,3063[

[3063,3710[

[3710,4357[

[4357,5004[

Total

100

Tabela 2.7: Rendimentos agrupados em classes de igual amplitude

2.4

Representaes Grficas

Para alm de se poder organizar os dados estatsticos em tabelas de frequncias, outra forma
de os apresentar recorrer a vrios tipos de representaes grficas, tais como pictogramas,
grficos de pontos, diagramas de barras, grficos circulares, diagramas de caule e folhas e
histogramas.
20

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Um grfico um instrumento de sntese apelativo e que nos d uma ideia geral da questo
abordada, sem no entanto deixar de destacar alguns aspetos particulares. Quando pretendemos
representar conjuntos de dados graficamente deveremos selecionar o grfico mais adequado
a cada situao. Por outro lado, deve ter-se em conta que a informao que nele existe
suficiente para que qualquer pessoa o compreenda.

2.4.1 Pictograma
O pictograma um tipo de representao grfica muito sugestivo, pois na sua construo so
utilizadas figuras representativas da informao. Apesar de se poder usar o mesmo smbolo,
variando a rea ou volume de forma a que sejam proporcionais frequncia absoluta, torna-se
mais simples usar uma figura que se repete sempre da mesma maneira. As figuras devem
estar igualmente espaadas e devem apresentar-se em linhas ou colunas. Apesar de nos dar
uma ideia geral da situao uma das desvantagens , por vezes, no ser possvel uma leitura
rigorosa das frequncias absolutas de cada valor ou modalidade. Um pictograma tem de incluir o significado do smbolo que pode ser a unidade ou no. Pode visualizar-se um exemplo
de pictograma na Figura 2.1, respeitante aos hbitos de leitura dos alunos (cujos dados esto
apresentados na Tabela 2.1, na pgina 13).

Figura 2.1: Pictograma dos hbitos de leitura dos alunos

2.4.2 Grfico de pontos


Um grfico de pontos uma representao grfica muito simples e que pode utilizar-se para
variveis qualitativas ou para variveis quantitativas. Para a sua elaborao comea-se por
desenhar um eixo horizontal onde se marcam os valores ou modalidades que a varivel assume
Estatstica no Ensino Bsico e Secundrio

21

Conceitos de Estatstica
em cada conjunto de dados. Por cima de cada valor ou modalidade marca-se um ponto sempre
que um elemento da amostra for igual a esse valor ou a essa modalidade.
Na Figura 2.2 utilizamos a idade dos alunos para ilustrar um grfico de pontos.

Figura 2.2: Grfico de pontos das idades dos alunos

2.4.3 Grfico de barras


Um grfico de barras um grfico muito comum para representar informao, pelo facto de ser
fcil de elaborar e interpretar. Pode ser usado quando a varivel qualitativa ou quantitativa
discreta. Serve para representar um conjunto de dados ou para comparar conjuntos de dados
relativamente a uma varivel. Tal como no grfico de pontos, no eixo horizontal indicam-se
as modalidades ou os valores da varivel. Para alm deste eixo necessrio um eixo vertical
onde se marcam as frequncias absolutas ou relativas. No deve haver quebra de escala no eixo
vertical pois os grficos tornam-se enganadores, mostrando aparentemente grandes variaes
quando na verdade no existem (ou ao contrrio). As barras devem ter a mesma largura,
devem estar igualmente espaadas e a sua altura deve ser proporcional s frequncias. Na
maioria das vezes a altura de cada barra coincide com a frequncia.
Na Figura 2.3 utilizamos a idade dos alunos para ilustrar um grfico de barras.

2.4.4 Grfico circular


Um grfico circular constitudo por um crculo no qual se definem setores de rea diretamente proporcional frequncia que representam. Cada um dos setores corresponde a uma
22

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

Figura 2.3: Grfico de barras das idades dos alunos


modalidade ou a um valor da varivel. Desta forma, deve ser utilizado quando a varivel
apresenta um nmero reduzido de valores ou modalidades e sempre que essas frequncias no
sejam prximas de 0.
Alguns programas constroem estes grficos a partir da tabela de frequncias, no entanto
se utizarmos o GeoGebra ou se os construirmos usando papel e lpis, necessrio determinar a amplitude de cada setor. Para isso habitual usar uma regra prtica que consiste em
multiplicar a frequncia relativa por 360 (graus). Outra alternativa utilizar regras de trs
simples considerando que o todo (total de elementos da amostra) corresponde a 360 . Para
facilitar a leitura e interpretao dos grficos devemos incluir as percentagens correspondentes a cada setor (como se mostra na Figura 2.4) e sempre que necessrio uma legenda. Este
grfico mostra-nos as cores preferidas dos alunos, cujos dados se encontram na Tabela 2.1.

Figura 2.4: Grfico circular das cores preferidas de 25 alunos

Estatstica no Ensino Bsico e Secundrio

23

Conceitos de Estatstica

2.4.5 Histograma e polgono de frequncias


O histograma uma representao grfica que se utiliza quando a varivel em estudo contnua. composto por uma sucesso de retngulos adjacentes que tm por base um intervalo
de classe e rea igual frequncia(3) (absoluta ou relativa). Desta forma a rea total do histograma n (dimenso da amostra) ou 1 (soma das frequncias relativas). Na primeira situao,
para determinar a altura de cada retngulo, deve usar-se
fi
hi ,

ni
hi ;

na segunda situao, deve usar-se

onde hi representa a amplitude da classe i, isto , hi = li li1 , i = 1, , k.


de referir que nos casos em que os intervalos de classe tm a mesma amplitude habitual

considerar as alturas dos retngulos iguais (ou proporcionais) s frequncias absolutas ou


relativas, como por exemplo, no grfico presente na Figura 2.5.

Figura 2.5: Histograma da altura (em cm) de 25 alunos


O polgono de frequncias um grfico de linhas associado ao histograma e que se obtm
unindo os pontos mdios da base superior de cada retngulo. Para que o polgono comece
e termine no eixo horizontal, imagina-se uma classe esquerda da primeira (com a mesma
amplitude da primeira) e outra direita da ltima (com a mesma amplitude da ltima), ambas
com frequncia igual a zero, como se ilustra no grfico presente na Figura 2.6. Notemos que,
deste modo, a rea do histograma ser igual rea entre o polgono e o eixo Ox.

2.4.6 Representao grfica da funo cumulativa


Tratando-se de dados discretos, o grfico da funo cumulativa, quer das frequncias relativas
acumuladas quer das frequncias absolutas acumuladas em escada. A ttulo de exemplo, na
(3)

24

No obrigatrio ser igual, pode ser proporcional. Contudo estes so os casos mais utilizados.

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

Figura 2.6: Polgono de frequncias referente altura dos alunos


Figura 2.7 apresentamos o grfico da funo cumulativa presente na pgina 17, referente
idade dos alunos.

Figura 2.7: Funo cumulativa relativa idade dos alunos

No caso da varivel ser contnua a representao grfica da funo cumulativa uma


linha poligonal que pode ser obtida a partir do histograma de frequncias acumuladas. Considerando as alturas dos 25 alunos, vamos representar a funo cumulativa a partir do histograma de frequncias relativas acumuladas. Assim, como podemos ver na Figura 2.8, antes da
frequncia da 1.a classe, a frequncia acumulada nula, pelo que se traa um segmento sobre
o eixo Ox at ao limite inferior da 1a classe (ficando sobreposto ao eixo Ox). A partir daqui, e
admitindo que as observaes se distribuem uniformemente em cada uma das classes, unimos
os pontos de coordenadas (li , Fi ), i = 0, 1, 2, 3, 4, 5, onde li o limite inferior da classe [li , li+1 [
e Fi a frequncia relativa acumulada da classe anterior com F0 = 0. Quando chegamos ltima
classe temos a garantia que a frequncia acumulada correspondente ao seu limite superior
Estatstica no Ensino Bsico e Secundrio

25

Conceitos de Estatstica
igual a 1, razo pela qual se desenha um segmento de reta paralelo ao eixo Ox, a partir desse
ponto.

Figura 2.8: Funo cumulativa relativa altura dos alunos

2.4.7 Diagrama de caule e folhas


O diagrama de caule e folhas uma forma de representar os dados de fcil construo. Pode
situar-se entre a tabela e o grfico, sendo uma das vantagens o facto de todos os dados observados estarem presentes e ordenados.
Para construir um diagrama de caule e folhas desenha-se uma linha vertical e coloca-se do
lado esquerdo o dgito ou dgitos de maior grandeza e do lado direito os restantes dgitos.
Por exemplo, no caso da altura dos alunos, 146, 149, 150, , registadas na Tabela 2.1, na
pgina 13, colocamos os dgitos das centenas e das dezenas esquerda e os algarismos das
unidades direita, ficando o incio do diagrama com este aspeto 14| 6 9 (conforme Figura 2.9).
Aos valores colocados esquerda do trao vertical chamamos caule e aos valores colocados
direita denominamos por folhas.
Notemos que o diagrama de caule e folhas tem uma representao grfica semelhante do
histograma, se fizermos uma rotao de 90 , no sentido contrrio ao dos ponteiros do relgio.
Deste modo, corresponderia a um histograma com trs classes, respetivamente [140, 150[,
[150, 160[ e [160, 170[. Uma das vantagens do histograma relativamente ao diagrama de caule
e folhas o facto de haver menos restries na construo das classes do que na construo dos
caules, no entanto ao construir as classes para a elaborao do histograma perde-se informao
26

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
existente na amostra.

Figura 2.9: Diagrama de caule e folhas relativo altura dos alunos

2.5

Medidas de tendncia central

Nas duas seces anteriores dedicmo-nos construo de tabelas de frequncias e representao grfica dos dados. As tabelas de frequncias permitem organizar e facilitam a leitura
dos dados. Os grficos, apesar de geralmente conterem menos informao que as tabelas de
frequncias, so de fcil leitura e tm um peso significativo na anlise descritiva dos dados,
no esquecendo que uma imagem vale mais do que mil palavras.
A partir daqui e at ao final deste captulo, vamos estudar um conjunto de medidas descritivas que permitem sumariar alguns dos aspetos mais importantes do conjunto de dados.
Nesta seco, em particular, vamos estudar as medidas de tendncia central: moda, mdia e
mediana.

2.5.1 Moda
A moda uma medida com especial interesse para resumir os dados no caso da varivel
ser qualitativa. Nesta situao nem a mdia nem a mediana podem ser calculadas ou so
desprovidas de significado.
Definio 2.9. A moda, representada por Mo, o valor ou modalidade que surge com maior
frequncia na amostra.
Se considerarmos o conjunto de dados constitudo pelas 25 cores preferidas dos alunos verificamos que h duas modalidades com a frequncia absoluta mais elevada (consultar Tabela
2.3 da pgina 16). Neste caso dizemos que h duas modas: cor-de-rosa e azul, e a distribuio
Estatstica no Ensino Bsico e Secundrio

27

Conceitos de Estatstica
bimodal. Se tivesse trs modas seria trimodal. No caso de ter mais do que trs modas
multimodal. Quando nenhum valor ou modalidade aparece com maior frequncia do que os
restantes diz-se que no h moda.
Quando a varivel quantitativa contnua e no se conhecem os dados reais podemos identificar a classe modal (classe com maior frequncia por unidade de amplitude). Por exemplo,
relativamente altura dos alunos, representada na Tabela 2.6 da pgina 19 a classe modal
[155, 160[, porque corresponde classe com maior frequncia absoluta por unidade de amplitude. Notemos que, quando as classes tm igual amplitude, bastar identificar a classe com
maior frequncia. Caso contrrio devemos utilizar a classe com maior

ni
hi ,

conforme ilustra o

exemplo 2.6.
Exemplo 2.6. Perguntou-se a 40 indivduos o nmero de dias que faltaram ao trabalho, por
doena, no ano anterior. Os dados encontram-se organizados na Tabela 2.8. Como podemos
verificar as classes no tm todas a mesma amplitude. Neste caso indicar a classe modal
implica encontrar a classe em que o quociente entre a frequncia absoluta e a respetiva amplitude, maior. Por observao da tabela conclumos que a classe modal a classe [4,8[ (e no
a classe [8,16[ que corresponde de maior frequncia).
ni
hi

N.o de faltas por doena Frequncia absoluta


[0,4[

[4,8[

10

[8,16[

12

[16,24[

[24,30]

total

40

4
4 =1
10
4 = 2, 5
12
8 = 1, 5
9
8 = 1, 125
5
6 = 0, 8(3)

Tabela 2.8: Nmero de faltas por doena

2.5.2 Mdia
De entre as medidas de localizao estudadas, a mdia(4) a mais usada.
(4)

Geralmente quando falamos em mdia estamos a referir-nos mdia aritmtica, como a definimos neste

trabalho. No entanto h outros tipos de mdias, como por exemplo a mdia geomtrica, a mdia harmnica

28

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Definio 2.10. A mdia, representada por x, obtm-se dividindo a soma de todos os valores
de uma varivel pelo nmero total de observaes,
x=

x1 + x2 + + xn 1 n
= xi ,
n
n i=1

(2.11)

onde x1 , x2 , , xn so os n valores da varivel quantitativa.


Em muitos casos os dados encontram-se organizados numa tabela como, por exemplo, na
Tabela 2.4 na pgina 17. Nestes casos, para calcular a mdia utilizamos a frequncia absoluta
de cada valor distinto da varivel, do seguinte modo:
x=

x1 n1 + x2 n2 + + xp n p 1 p
= xi ni ,
n
n i=1

(2.12)

onde p representa o nmero de valores diferentes da varivel.


Aplicando este raciocnio idade dos alunos (Tabela 2.4 na pgina 17) temos:
x=

13 6 + 14 13 + 15 5 + 16 1 351
=
= 14, 04 anos.
25
25

(2.13)

Por vezes, quando a varivel em estudo contnua, no conhecemos os seus valores reais.
Nestes casos partimos dos dados agrupados em classes e determinamos um valor aproximado
da mdia. Para ilustrar esta situao, vamos supor que o peso (em kg) dos 25 alunos esto
organizados em 5 classes, conforme Tabela 2.9. Determina-se a marca da classe, isto , o
ponto mdio de cada classe,
xi =

li1 + li
, i = 1, 2, , 5
2

(2.14)

e considera-se, para cada classe, que o peso de cada aluno igual marca da classe(5) . Depois
ou a mdia (aritmtica) aparada. A mdia geomtrica muito usada, por exemplo, em economia no clculo de
taxas de variao ou de crescimento (se colocarmos no banco um montante com uma taxa de juro igual a 2%
no primeiro ano e 3% no segundo ano, a taxa mdia de crescimento no ser exactamente igual a 2,5%). A
mdia harmnica utiliza-se quando estamos perante grandezas inversamente proporcionais, como o caso da
velocidade e do tempo (notemos que se fizermos um trajeto duas vezes, uma a 80 km/h e outra a 120 km/h, a
velocidade mdia no ser 100 km/h). Quando temos alguns valores muito distantes da mdia (outliers) comum
retirar as % de observaes menores e as % de observaes maiores, determinando-se a mdia aritmtica das
restantes (100 2 )% de observaes. A esta mdia denomina-se por mdia aparada a %, sendo uma medida
mais robusta que a mdia aritmtica quando estamos perante um conjunto de dados com outliers.
(5)

Se considerarmos que as observaes esto igualmente espaadas dentro de cada classe (uniformemente

distribudas) o resultado ser exatamente o mesmo, contudo a ideia ser mais difcil de transmitir aos nossos
alunos.

Estatstica no Ensino Bsico e Secundrio

29

Conceitos de Estatstica
procede-se como no caso anterior e obtemos, desta forma, um valor aproximado do peso
mdio dos alunos dado por:
x=

1452
= 58, 08 kg.
25

(2.15)

Peso

Frequncia

Marca

dos

absoluta

da classe

alunos (kg)

ni

xi

[40, 48[

44

44 5 = 220

[48, 56[

52

52 5 = 260

[56, 64[

60

60 9 = 540

[64, 72[

68

68 3 = 204

[72, 80]

76

76 3 = 228

Total

25

xi ni

1452

Tabela 2.9: Tabela de frequncias do peso dos alunos

A mdia goza de algumas propriedades importantes. De seguida apresentaremos duas


delas.
Com este propsito, consideremos que a idade dos 25 alunos foi registada no dia 1 de
setembro de 2010. Por (2.13) sabemos que, nesta data, a idade mdia dos alunos igual a
14,04 anos. Qual ser a mdia das idades destes alunos no dia 1 de setembro de 2011?
Facilmente respondemos que, como passou um ano completo para cada aluno, a mdia
aumenta uma unidade, passando de 14,04 para 15,04 anos.
Para generalizar este resultado, sejam x1 , x2 , , xn os n valores da varivel quantitativa x
com mdia x.
Propiedade 2.1. Se a cada valor da varivel x adicionarmos uma constante c 6= 0 obteremos
uma nova varivel, que representamos por y, cuja mdia :
y = x + c.
De facto,
y=
30

(2.16)

1 n
1 n
1 n
1 n
y
=
(x
+
c)
=
x
+
i n i
i n c = x + c.
n i=1
n i=1
i=1
i=1
Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Para ilustrar a segunda propriedade da mdia, suponhamos que todos os alunos comearam
a frequentar o ginsio que se situa junto escola no dia 1 de outubro de 2010. Suponhamos
ainda que ao fim de um ms cada aluno tinha perdido 2% do seu peso. Qual o peso mdio
dos alunos da turma no dia 1 de novembro do mesmo ano? A resposta, em kg, ser dada por
58, 08 0, 02 58, 08 = 0, 98 58, 08 56, 92 kg.
Cada peso registado no dia 1 de novembro corresponde a 98% do respetivo peso anterior.
Ento a mdia obtida ser 98% da mdia anterior. De um modo geral, temos a seguinte
propriedade.
Propiedade 2.2. Se multiplicarmos cada valor da varivel x por uma constante c obteremos
uma nova varivel w cuja mdia :
w = c x.
Efetivamente,
w=

(2.17)

1 n
1 n
1 n
w
=
cx
=
c
i
i

xi = cx.
n i=1
n i=1
n i=1

2.5.3 Mediana
Para determinar a mediana devemos previamente ordenar as observaes. Neste sentido sejam
x(1) , x(2) , , x(n) as observaes x1 , x2 , , xn ordenadas. Desta forma x(1) representa a menor
observao, x(2) a segunda menor observao, , x(i) a i-sima menor observao, e x(n)

ser a observao mxima, isto ,


x(1) x(2) x(n) .

(2.18)

Definio 2.11. A mediana, representada por Me, um valor que divide ao meio o conjunto
das observaes, isto , 50% dos valores so inferiores ou iguais mediana e 50% dos valores
so superiores ou iguais mediana.
Existe uma regra prtica para calcular a mediana. Depois de ordenar os valores por ordem
crescente consideram-se os seguintes dois casos.
1. Se n mpar a mediana o valor que ocupa a posio central. Ento, numa amostra de
dimenso n, teremos
Me = x( n+1 ) .
2

Estatstica no Ensino Bsico e Secundrio

(2.19)
31

Conceitos de Estatstica
2. Se n par a mediana a mdia dos dois valores que ocupam a posio central. Ento,
numa amostra de dimenso n, teremos
Me =

x( n ) + x( n +1)
2

(2.20)

Notemos que, neste ltimo caso, a mediana pode no coincidir com nenhuma das observaes
da amostra.
Exemplo 2.7. Consideremos os dados registados na Tabela 2.1 relativos idade dos 25 alunos
e ordenemo-los por ordem crescente,
13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 16.
Como o nmero de observaes mpar, n = 25, a mediana dada por
Me = x(13) = 14.

(2.21)

No caso de dados no agrupados, atravs da tabela de frequncias podemos determinar


facilmente o valor que ocupa a posio central (ou os dois valores que ocupam as posies
centrais) recorrendo s frequncias acumuladas (absolutas ou relativas). Caso haja uma mo

. Caso contrrio, a mediana


dalidade xi onde Fi = 0, 5 (ou Ni = 2n ), ento Me = 21 xi + xi+1

corresponder primeira modalidade xi tal que Fi > 0, 5 (ou Ni > 2n ).

Por outro lado, quando os dados esto agrupados em classes, podemos encontrar a classe
mediana de modo idntico. Assim, a classe mediana ([li1 , li [) ser aquela que corresponde
primeira classe com frequncia relativa acumulada superior ou igual a 50% (Fi 0.5) ou, o
que equivalente, primeira classe com frequncia absoluta acumulada superior ou igual a
n
2

(Ni 2n ). Por exemplo, relativamente altura dos 25 alunos, apresentada na Tabela 2.6, na

pgina 19, a classe mediana [155, 160[, pois esta classe acumula 60% dos valores e a anterior
acumula apenas 28%. No entanto, como neste caso se conhecem todos os valores da varivel,
deve calcular-se o valor da mediana, em vez da classe mediana.

2.5.4 Comparao das medidas de tendncia central


As medidas estatsticas mdia, moda e mediana so designadas por medidas de tendncia
central, pois so trs formas distintas de representar o centro dos dados. A utilizao de cada
uma destas medidas apresenta vantagens e desvantagens em relao s outras medidas.
32

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
A moda pode ser determinada quer a varivel seja qualitativa quer seja quantitativa. No
entanto, um conjunto de dados pode no ter moda. Alm disso, esta medida no influenciada
pelos valores extremos. Para ilustrar a relevncia desta medida podemos referir, a ttulo de
exemplo, a importncia que pode ter para uma empresa do setor do calado saber qual o
tamanho do sapato mais vendido, ou para uma empresa de laticnios saber o sabor dos iogurtes
preferido dos clientes.
A mdia uma medida estatstica muito utilizada e no seu clculo intervm todos os
dados. Se por um lado no h perda de informao, por outro lado qualquer alterao num
dos valores produz um valor diferente no resultado da mdia. A mdia pode ser enganadora
pois influenciada pelos valores extremos (nomeadamente se existirem valores muito baixos
ou muito altos), podendo em alguns casos deixar de ser representativa (isto , exigir um
cuidado particular na sua interpretao). Notemos que, por exemplo, duas turmas com a
mesma mdia na classificao da disciplina de Matemtica podem ter comportamentos muito
distintos. Neste caso, a determinao das medidas de disperso, que medem a variabilidade
dos dados, podem ser fulcrais para uma melhor interpretao dos dados. Salientemos ainda
que a mdia apenas se pode calcular quando a varivel quantitativa, podendo em alguns
casos, o seu valor no coincidir com nenhum dos possveis valores da varivel (por exemplo,
o nmero mdio de elementos de um agregado familiar em determinada cidade de Portugal
2,3, contudo no possvel haver um agregado familiar constitudo por 2,3 indivduos!).
A mediana divide as observaes em dois grupos com igual nmero de indivduos, mas
o seu valor nem sempre coincide com um dos dados. Uma vez que o seu valor depende do
nmero de observaes e no de todos os valores, uma medida estatstica mais robusta do
que a mdia no sentido em que no influenciada pelos valores muito altos nem pelos valores
muito baixos (outliers).
Estes valores muito elevados ou muito pequenos, comparativamente aos restantes, so
comuns em algumas distribuies que designamos por assimtricas (positivas ou negativas).
O tipo de assimetria decorre da comparao das medidas de tendncia central. Seguidamente
apresentamos trs distribuies tpicas, conforme se ilustra na Figura 2.10.
distribuio simtrica se x = Me = Mo.
distribuio assimtrica positiva se Mo Me x.
distribuio assimtrica negativa se x Me Mo.
Estatstica no Ensino Bsico e Secundrio

33

Conceitos de Estatstica

Simetria

Assimetria positiva

Assimetria negativa

x = Me = Mo

Mo Me x

x Me Mo

Figura 2.10: Tipos de assimetria


A ttulo de exemplo vamos apresentar os diagramas de barras referentes s classificaes
de Matemtica, obtidas no final do primeiro perodo, por trs turmas do 7.o ano. Por observao do grfico da Figura 2.11 podemos afirmar que a turma A apresenta uma distribuio
simtrica, pois os dados esto igualmente distribudos direita e esquerda do centro (valor
das medidas de tendncia central). De facto, a mdia, a moda e a mediana tm o mesmo valor,
x = Me = Mo = 3. Quanto s turmas B e C (ver grficos da Figura 2.12), verificamos que
na turma B, a distribuio assimtrica positiva ou enviesada direita, sendo a mdia igual
a 2,76 e a moda e a mediana iguais a 2, logo Mo Me x. Na turma C, a distribuio
assimtrica negativa ou enviesada esquerda, sendo a mdia 3,92, a mediana 4 e a moda 5,
logo x Me Mo.

Figura 2.11: Distribuio simtrica

2.6

Medidas de tendncia no central

Para alm das medidas de tendncia central existem outras medidas que nos informam relativamente localizao dos valores da varivel. Costumam designar-se por quantis e iremos
aqui abordar os quartis e os percentis, apesar dos percentis no estarem contemplados nos
34

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Assimetria positiva

Assimetria negativa

Figura 2.12: Distribuies assimtricas


programas do ensino bsico e secundrio (contudo so utilizados em diversas situaes do
nosso quotidiano).

2.6.1 Quartis
Os quartis so medidas estatsticas extremamente teis na caracterizao de uma amostra. A
partir deles podemos obter uma representao grfica designada por diagrama de extremos e
quartis (subseco 2.6.2) e calcular uma medida de disperso (seco 2.15).
Definio 2.12. Os quartis so os valores que dividem o conjunto das observaes, depois de
ordenado, em quatro partes iguais, cada uma contendo 25% das observaes. Os quartis so
3 e representam-se por Q1 , Q2 e Q3 , sendo Q2 = Me. Assim:
Q1 o 1.o quartil o valor que verifica a seguinte propriedade: 25% das observaes
so menores ou iguais a Q1 e 75% so superiores ou iguais a Q1 , conforme ilustrado na
Figura 2.13 (onde xmin e xmax representam o mnimo e o mximo da amostra).
Q2 o 2.o quartil igual mediana.
Q3 o 3.o quartil o valor que verifica a seguinte propriedade: 75% das observaes
so menores ou iguais a Q3 e 25% so superiores ou iguais a Q3 .
Para determinar o 1.o e o 3.o quartis de um conjunto ordenado de observaes comea-se
por determinar a mediana, Q2 , dividindo esse conjunto em duas partes iguais. O 1.o quartil
ser a mediana das observaes que se encontram esquerda de Q2 e o 3.o quartil ser a
mediana das observaes que se encontram direita de Q2 .
Estatstica no Ensino Bsico e Secundrio

35

Conceitos de Estatstica

Figura 2.13: Esquema relativo aos extremos e quartis de uma distribuio


Para exemplificar, consideremos as idades dos 25 alunos, da tabela 2.1 presente na pgina
13. J vimos que Me = x(13) = 14.
13,13,13,13,13,13,14,14,14,14,14,14, 14, 14,14,14,14,14,14,15,15,15,15,15,16

O 1.o quartil a mediana dos 12 primeiros valores, isto ,

Q1 =

x(6) + x(7) 13 + 14
=
= 13, 5.
2
2

(2.22)

O 3.o quartil a mediana dos 12 ltimos valores, isto ,

Q3 =

x(19) + x(20) 14 + 15
=
= 14, 5.
2
2

(2.23)

Por outro lado, quando a varivel contnua podemos determinar as classes s quais pertencem o 1.o e 3.o quartis, recorrendo frequncia relativa acumulada, como procedemos
com a mediana. Assim, a classe que contm o 1.o quartil ser aquela que corresponde primeira classe com frequncia relativa acumulada superior ou igual a 25% (Fi 0, 25) ou, o
que equivalente, primeira classe com frequncia absoluta acumulada superior ou igual a
n
4

(Ni 4n ). Analogamente, a classe que contm o 3.o quartil ser aquela com frequncia re-

lativa acumulada superior ou igual a 75% (Fi 0, 75) ou com frequncia absoluta acumulada

superior ou igual a 34 n (Ni 34 n).

Voltando de novo ao exemplo relativo s alturas dos 25 alunos apresentadas na Tabela


2.6, da pgina 19, j vimos que a classe mediana [155,160[, pois esta classe acumula 60%
dos valores e a anterior acumula apenas 28%. Conclui-se, igualmente, que a classe qual
pertence o 1.o quartil [150,155[, pois esta classe acumula 28% dos valores e a anterior
acumula apenas 8%. Do mesmo modo, a classe qual pertence o 3.o quartil [160,165[ pois
esta classe acumula 88% dos valores e a anterior acumula apenas 60%.
36

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

2.6.2 Diagrama de extremos e quartis


Um diagrama de extremos e quartis uma representao grfica que podemos utilizar quando
pretendemos representar esquematicamente um conjunto de dados numricos. A sua construo depende de 5 valores: valor mnimo, valor mximo, 1.o quartil, 2.o quartil e 3.o quartil. Comea-se por traar um eixo graduado, onde se assinalam os 5 valores. De seguida,
acima desse eixo, traa-se um segmento horizontal desde o mnimo at ao 1.o quartil. Depois
desenha-se um retngulo desde o 1.o quartil at ao 3.o quartil, divido pela mediana. Por fim,
faz-se novamente um segmento horizontal desde 3.o quartil at ao valor mximo. No incio
e no fim do diagrama desenha-se, ainda, um pequeno segmento vertical. Deste modo, ficam
definidas quatro zonas (contendo cada uma 25% dos dados), sendo duas delas centrais.
Este diagrama fornece informaes sobre a forma como os dados estatsticos se distribuem, nomeadamente sobre a concentrao/disperso. Quanto mais estreita for uma zona,
maior concentrao de dados existe nessa zona. Os diagramas de extremos e quartis podem
surgir na posio horizontal ou vertical. Na Figura 2.14 temos o diagrama de extremos e
quartis das idades dos alunos.

Figura 2.14: Diagrama de extremos e quartis relativo idade dos 25 alunos

2.6.3 Percentis
Como j foi referido, os percentis esto fora do mbito dos programas do ensino bsico e secundrio, no entanto optamos por fazer uma pequena abordagem pelo facto destas medidas se
utilizarem na vida real, nomeadamente, para informar sobre o desenvolvimento das crianas.
Definio 2.13. Os percentis so os valores que dividem o conjunto das observaes, depois
de ordenado, em cem partes iguais, cada uma contendo 1% das observaes. Os percentis
so 99 e representam-se por P1 , P2 , . . . , P99 , sendo P25 = Q1 , P50 = Me e P75 = Q3 . Deste
Estatstica no Ensino Bsico e Secundrio

37

Conceitos de Estatstica
modo, P = k significa que % das observaes so inferiores ou iguais a k e (100 )% das
observaes so iguais ou superiores a k.
Assim, por exemplo, se para um conjunto de dados tivermos:
P16 = 34, significa que 16% das observaes so inferiores ou iguais a 34 e 84% so
iguais ou superiores a 34.
P72 = 55, significa que 72% das observaes so inferiores ou iguais a 55 e 28% so
iguais ou superiores a 55.
Exemplo 2.8. Consideremos que numa consulta o pediatra, aps pesar e medir a criana,
afirma que esta est no percentil 80 no peso e no percentil 25 em relao altura (algumas
das medidas patentes na Caderneta de Sade da Criana so os percentis do peso, da altura
e do permetro ceflico por idade). Qual o significado destes valores referidos pelo pediatra?
Significam que, relativamente s crianas da mesma idade, existem 80% de criaas com um
peso menor ou igual e apenas 20% com um peso maior ou igual. No que se refere altura,
relativamente s crianas com a mesma idade, exitem 25% de crianas mais baixas e 75% de
crianas mais altas (a forma da evoluo de cada um destes percentis bem como a discrepncia
entre eles um dado importante na anlise do desenvolvimento da criana).

2.7

Medidas de disperso

Abordmos at agora vrias medidas estatsticas que permitem caracterizar uma amostra relativamente sua localizao (seja ela central ou no central). Contudo, quando se pretende
estabelecer comparaes, deparamo-nos com muitas situaes em que estas medidas no se
revelam suficientes. A ttulo ilustrativo consideremos as notas, numa escala de 0 a 20 valores,
obtidas por dois alunos do mesmo ano de escolaridade, em dez fichas de avaliao de uma
determinada disciplina.
Aluno A 9, 9, 11, 12, 8, 7, 13, 11, 9, 11
Aluno B 5, 15, 4, 4, 5, 17, 13, 17, 6, 14
Os dois alunos apresentam a mesma nota mdia, dez valores, mas da observao das suas
notas poderemos dizer que os dois alunos so muito diferentes no que respeita ao aproveitamento nessa disciplina, apesar de terem tido o mesmo nmero de fichas com nota positiva.
38

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Para alm deste exemplo podemos considerar muitos outros, tais como duas cidades com a
mesma temperatura mdia e a mesma temperatura mediana, apresentando amplitudes trmicas muito distintas ou duas turmas com a mesma mdia a Matemtica, em que uma delas
apresenta uma percentagem de negativas bastante superior outra.
Nestes casos h ento necessidade de calcular outras medidas estatsticas, medidas de
disperso, para conhecer de que forma os dados se encontram distribudos.

2.7.1 Amplitude total


Uma das medidas de disperso mais fcil de determinar a amplitude total. O seu clculo
depende apenas dos dois valores extremos da amostra.
Definio 2.14. A amplitude total ou amplitude a diferena entre o valor mximo e o valor
mnimo do conjunto das observaes. Representa-se por IT e tem-se
IT = x(n) x(1) .

(2.24)

A amplitude d-nos informao sobre a distncia entre os valores extremos. Em duas


turmas com a mesma mdia, a amplitude ser maior na que apresenta as classificaes mais
dispersas. No entanto, esta situao pode resultar apenas de uma s classificao muito baixa
ou muito alta. Pelo facto de a amplitude ser muito sensvel aos extremos, uma medida de
disperso pouco utilizada. Outra medida de disperso que podemos calcular, no sensvel aos
valores extremos, a amplitude interquartis.

2.7.2 Amplitude interquartis


Recorrendo definio de quartis de uma distribuio, podemos determinar a amplitude interquartis que uma medida de disperso que envolve no seu clculo o 1.o e o 3.o quartis.
A amplitude interquartis no s insensvel aos valores extremos observados (mximo e mnimo), como tambm s 25% de observaes de valores mais baixos e s 25% de valores mais
elevados.
Definio 2.15. A amplitude interquartis a diferena entre o 3.o e o 1.o quartis.
Representa-se por IQ e determina-se atravs de
IQ = Q3 Q1 .
Estatstica no Ensino Bsico e Secundrio

(2.25)
39

Conceitos de Estatstica
Esta medida indica-nos a amplitude do intervalo onde se situam as 50% das observaes
centrais, mostrando-nos a variabilidade dos dados em relao mediana. Assim, possvel
estabelecer comparaes entre dois conjuntos de observaes no que diz respeito disperso
ou concentrao dos valores em relao mediana. Quanto menor for a amplitude interquartis,
maior a concentrao dos valores em relao mediana.

2.7.3 Desvio mdio absoluto, varincia e desvio padro


J conhecemos uma medida estatstica que mede a variabilidade dos valores em relao
mediana, no entanto a medida de tendncia central mais utilizada a mdia e, por isso, faz
sentido que haja uma medida de disperso que nos d a variabilidade dos valores em relao
mdia. Neste mbito parece interessante que faamos o clculo dos desvios de cada observao em relao mdia. De seguida bastaria fazer a mdia dos desvios. Procedendo deste
modo, verifica-se, facilmente, que a soma dos desvios nula (conforme exemplo das idades
dos alunos apresentado na Tabela 2.10), uma vez que
1 n
1 n
1
1 n
(xi x) = xi x = x n x = 0.

n i=1
n i=1
n i=1
n
Para ultrapassar esta situao definiu-se o desvio mdio absoluto, no qual se considera os
valores absolutos dos desvios, impedindo que a soma dos desvios d zero e obtendo a mdia
das distncias entre as observaes e a mdia.
Definio 2.16. O desvio mdio absoluto, representado por dm , a mdia das distncias entre
as observaes e a mdia, isto ,
dm =

1 n
1 p
|x

x|
=
i
ni|xi x|.
n i=1
n i=1

(2.26)

Outra forma de contornar o facto de a soma dos desvios ser nula calcular a mdia dos
quadrados dos desvios. Surge assim outra medida de disperso, a varincia, que teve mais
aceitao.
Definio 2.17. A varincia a mdia(6) dos quadrados dos desvios de cada observao da
(6)

Efetivamente no a mdia(na sua conceo habitual) uma vez que no dividimos por n, mas antes por

n 1. Esta correo est ligada inferncia estatstica, nomeadamente utilizao da varincia da amostra como
estimador da varincia da populao.

40

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

Idade

Frequncia

Valores absolutos

Quadrados

dos

absoluta

Desvios

dos desvios

dos desvios

alunos

ni

ni (xi x)

ni |xi x|

ni (xi x)2

13

6(13 14, 04) = 6, 24

6,24

6,4896

14

13

13(14 14, 04) = 0, 52

0,52

0,0208

15

5(15 14, 04) = 4, 8

4,8

4,608

16

16 14, 04 = 1, 96

1,96

3,8416

Total

25

13,52

14,96

Tabela 2.10: Clculo do desvio mdio absoluto


amostra relativamente mdia. Representa-se por s2 ,
1 p
1 n
2
(xi x) =
ni (xi x)2 .
s =

n 1 i=1
n 1 i=1
2

(2.27)

Pegando na definio de varincia e aplicando propriedades dos somatrios podemos obter


uma frmula simplificada para o clculo da varincia, frmula de Kning,
#
#
"
"
p
n
1
1
2
s2 =
xi2 nx2 = n 1 nixi nx2
n 1 i=1
i=1

(2.28)

Notemos que apesar desta frmula simplificar os clculos, com o recurso a computadores ou
mquina de calcular a sua utilidade tornou-se reduzida (neste contexto).
A varincia pode ser utilizada para comparar dois conjuntos de observaes. Quanto maior
for a varincia, maior a disperso dos valores relativamente mdia(7) ; quanto menor a
varincia, maior a concentrao dos valores relativamente mdia. Contudo a varincia
apresenta uma desvantagem, uma vez que os quadrados dos desvios passam a ser de uma
ordem de grandeza superior aos desvios. Por exemplo, no caso da idade, passamos de anos
para anos ao quadrado; se noutra situao a varivel fosse a distncia em metros, passaramos
a metros quadrados. Para resolver este problema, permitindo que se volte ordem de grandeza
inicial, definiu-se outra medida de disperso que resulta da raiz quadrada da varincia e que
se designa por desvio padro.
(7)

Nesta observao consideramos que os dados comparados esto expressos na mesma unidade de medida

e que tm mdias prximas. Em rigor quando se pretende comparar a disperso de dois conjuntos de dados
deve-se utilizar o coeficiente de disperso de Pearson, CD = xs , com x 6= 0.

Estatstica no Ensino Bsico e Secundrio

41

Conceitos de Estatstica
Definio 2.18. O desvio padro a raiz quadrada da varincia, sendo representado por s e
determinado por
s=

s2 .

(2.29)

Por exemplo, se considerarmos a amostra dos 25 alunos e a varivel idade, temos:


v
r
u
u1 4
14, 96 p
0, 6233 0, 789.
s = t ni (xi x)2 =
24 i=1
24

(2.30)

O desvio padro mede a variabilidade dos valores em relao mdia e a sua interpretao
idntica da varincia. Quanto maior for o valor do desvio padro, maior o afastamento
dos valores em relao mdia. Um dos inconvenientes do desvio padro ser influenciado
por valores extremos, ou seja, valores muito maiores ou muito menores que os restantes.
O desvio padro goza de algumas propriedades importantes. Consideremos, sem perda
de generalidade, x1 , x2 , , xn os n valores de uma varivel quantitativa com mdia x e desvio
padro s.
Propiedade 2.3. O desvio padro sempre no negativo.
Esta propriedade consequncia imediata da definio de desvio padro.
Propiedade 2.4. Se o desvio padro igual a zero significa que no existe variabilidade.
Consequentemente as observaes so todas iguais.
De facto,
s = 0 s2 = 0

1 n
(xi x)2 = 0 xi = x, i,
n 1 i=1

isto , todos os valores observados tm de ser iguais mdia.


Propiedade 2.5. Se a cada valor da varivel x adicionarmos uma constante c obteremos um
conjunto de dados cujo desvio padro s = s (os valores das observaes so alterados, mas
a distncia entre eles no).
De facto, recorrendo propriedade 2.1 (pgina 30), a varincia para o novo conjunto de
dados determinada atravs de
2

s =

42

1 n
1 n
[(c + xi ) (c + x)]2 =

(xi x)2 = s2.


n 1 i=1
n 1 i=1
Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
Propiedade 2.6. Se multiplicarmos cada valor da varivel x por uma constante c obteremos
um conjunto de dados cuja desvio padro s = |c|s.
Neste caso, fazendo uso da propriedade 2.2 (pgina 31), obtem-se
2

s =

n
1 n
2
2 1
(cx

cx)
=
c
i
(xi x)2,
n 1 i=1
n 1 i=1

logo s = |c|s.

2.8

Distribuies bidimensionais

Em vrios estudos estatsticos assume, por vezes, maior importncia o estudo em simultneo
de duas variveis da mesma amostra, pretendendo-se estudar em que medida elas se relacionam, isto , de que forma a variao de uma influencia a variao da outra.
Exemplo 2.9. Exemplos de situaes em que se estuda a relao entre duas variveis:
relao entre as notas de Matemtica e de Cincias Fsico-Qumicas.
relao entre as classificaes da avaliao interna e as classificaes da avaliao externa, numa determinada disciplina;
relao entre o peso e a altura de um conjunto de adolescentes;
relao entre a idade do beb e o permetro ceflico;
relao entre a idade do pai e a idade da me de um conjunto de crianas.
Para estudarmos relaes deste tipo h necessidade de recolher uma amostra de dados
bivariados que pode ser representada na forma
(x1 , y1 ), (x2 , y2 ), , (xi , yi ), , (xn , yn ),
isto , (xi , yi ) com i = 1, 2, , n, onde cada indivduo contribui com um par de valores.
Definio 2.19. Distribuio bidimensional uma distribuio em que os dados so bivariados.
Estatstica no Ensino Bsico e Secundrio

43

Conceitos de Estatstica

2.8.1 Diagrama de disperso


A representao grfica de uma distribuio bidimensional difere bastante das representaes
j mencionadas anteriormente. Um conjunto de dados bivariados representa-se atravs de uma
nuvem de pontos ou diagrama de disperso, onde so representados os pontos (xi , yi ), num
sistema de eixos coordenados.
Exemplo 2.10. Estudo da relao entre as notas obtidas nos testes diagnsticos de Cincias
Fsico-Qumicas e de Matemtica, da amostra constituda pelos 25 alunos do 8.o ano. Se representarmos graficamente os pontos de coordenadas (xi , yi ), em que xi a nota de Matemtica
e yi a nota de Fisica-Qumica, obteremos a nuvem de pontos representada na Figura 2.15.

Figura 2.15: Diagrama de disperso das notas de Matemtica e de Cincias Fsico-Qumicas


O diagrama de disperso til pois permite visualizar se existe ou no relao (ou correlao) entre as variveis. Na situao apresentada, podemos observar que quanto melhor for
o resultado no teste diagnstico de Matemtica, melhor ser o resultado no teste diagnstico
de Cincias Fisico-Qumicas.
Definio 2.20. O ponto mdio ou centro de gravidade de uma nuvem de pontos o ponto
de coordenadas (x, y), em que x e y correspondem s mdias aritmticas dos valores das variveis x e y, respetivamente.
Se os pontos da nuvem se localizarem volta de uma reta, a correlao diz-se linear. Por
outro lado, a correlao ser positiva quando a maioria dos pontos se situa volta de uma reta
44

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
de declive positivo (ver Figura 2.16) e ser negativa quando a maioria dos pontos se situam
volta de uma reta de declive negativo. Para medir o grau de associao linear entre duas
variveis utiliza-se o coeficiente de correlao linear de Pearson, usualmente designado
apenas por coeficiente de correlao.

2.8.2 Coeficiente de correlao


Consideremos n observaes bivariadas, (x1 , y1 ), (x2 , y2 ), , (xn , yn ) relativas ao par de variveis quantitativas x e y.
Definio 2.21. O coeficiente de correlao linear, representado por rxy (ou simplesmente
r), o valor que mede o grau de associao linear entre duas variveis e calcula-se do seguinte
modo:
1
n1

rxy =

(xi x) (yi y)

i=1

sx sy

(xi x) (yi y)
i=1
r
=rn
,
n
2
2
(xi x)
(yi y)
i=1

(2.31)

i=1

onde sx representa o desvio padro da varivel x e sy representa o desvio padro da varivel y.


Notemos que no numerador da primeira frmula que permite calcular o coeficiente de
correlao, apresentada na definio anterior, encontra-se uma medida que se designa por
covarincia. A covarincia depende das unidades de medida que estamos a considerar e por
isso muito difcil de interpretar (se uma varivel for o peso e a outra a altura, a covarincia
ter como unidade o produto das duas).
sxy = cov(x, y) =

1 n
(xi x)(yi y).
n 1 i=1

(2.32)

Uma das vantagens do coeficiente de correlao relativamente covarincia o facto de no


ser influenciado pelas unidades de medida.
Propiedade 2.7. O coeficiente de correlao invariante para alteraes de unidade de medida.
Considerando que a + bxi corresponde mudana de unidade de medida de xi , temos ento
n

b (xi x)(yi y)
[(a + bxi ) (a + bx)](yi y)
b
i=1
r
r
r
= r ni=1
= rxy = rxy ,
n
n
n
|b|
[(a + bxi ) (a + bx)]2 (yi y)2 |b| (xi x)2 (yi y)2
i=1

i=1

Estatstica no Ensino Bsico e Secundrio

i=1

i=1

45

Conceitos de Estatstica
uma vez que nas mudanas de medida, temos b > 0. Podemos assim concluir que no h
alterao do coeficiente de correlao.
Embora se possa, por observao dos diagramas de disperso, dizer se h correlao entre as duas variveis e, caso exista, se positiva ou negativa, podemos compreender melhor
porqu se analisarmos o modo como se calcula o coeficiente de correlao. Para explicar esta
ideia consideremos a nuvem de pontos relativa s idades dos pais e das mes de 15 bebs de
uma creche. Marcou-se o ponto (x, y) e um novo sistema de eixos definido pelas retas de equao x = x e y = y. As coordenadas dos pontos que definem a distribuio sero (xi x, yi y).

Figura 2.16: Diagrama de disperso da idade dos pais e das mes


O sinal do coeficiente de correlao o sinal do produto (xi x)(yi y). Uma vez que nos
quadrantes mpares a abcissa e a ordenada tm o mesmo sinal, quando os pontos se concentram nestes quadrantes, o produto maioritariamente positivo. Assim ser de esperar que a
n

soma (xi x)(yi y) seja positiva e por consequncia o valor do coeficiente de correlao
i=1

ser positivo. isto que se verifica na Figura 2.16. Por outro lado, como nos quadrantes pares a abcissa e a ordenada dos pontos tm sinais contrrios, quando os pontos se concentram
nestes quadrantes, o produto maioritariamente negativo. Assim ser de esperar que a soma
n

(xi x)(yi y) seja negativa e por consequncia o valor do coeficiente de correlao ser

i=1

negativo, como por exemplo no Grfico V da Figura 2.17.


Em qualquer distribuio estatstica o valor do coeficiente de correlao pertence ao intervalo [1, 1], isto , 1 rxy 1 ou |rxy | 1. Quando a correlao perfeita e negativa o

coeficiente de correlao toma o valor 1. Quando a correlao perfeita positiva o coefici-

ente de correlao toma o valor 1. A valores prximos de zero corresponde uma correlao
46

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
quase nula

(8) .

Quanto maior for o valor absoluto de rxy mais forte ser a correlao linear

entre as variveis. O sinal do coeficiente d-nos o sentido da correlao.


Apresentamos de seguida na Figura 2.17 um conjunto de grficos que traduzem vrios
tipos de relaes entre duas variveis e na Tabela 2.11 os valores dos respetivos coeficientes
de correlao.
Grfico

Coeficiente
de correlao

0, 99

II

0, 47

III

0, 02

IV

0, 51

0, 9

VI

0, 13

Tabela 2.11: Exemplos de valores do coeficiente de correlao

2.9

Regresso linear simples

Aps a representao da nuvem de pontos ficamos com uma ideia da correlao que existe
entre as duas variveis. Existindo correlao linear o prximo passo traar a reta que melhor
se ajusta ao conjunto de pontos. Essa reta chama-se reta de regresso e passa pelo ponto
mdio ou centro de gravidade. A sua equao do tipo
y = ax + b.

(2.33)

Para obter esta reta recorre-se calculadora grfica ou ao computador. Ambos usam o
mtodo dos mnimos quadrados, isto , determinam a reta que melhor se aproxima dos valores
observados, de tal modo que seja mnima a soma dos quadrados dos desvios entre os valores
observados e os correspondentes na reta.
(8)

Refira-se que o facto de o coeficiente de correlao ser prximo de zero, rxy 0, no significa que no se

verifica outro tipo de dependncia entre as variveis (ver, por exemplo, o grfico VI da Figura 2.17). Este valor
indica-nos que no h uma dependncia linear das variveis.

Estatstica no Ensino Bsico e Secundrio

47

Conceitos de Estatstica
Relao linear

Relao linear

Ausncia de relao

positiva forte (I)

positiva fraca (II)

(III)

Relao linear

Relao linear

Relao

negativa fraca (IV)

negativa forte (V)

no linear (VI)

Figura 2.17: Diagramas de disperso com diferentes relaes entre as variveis


Uma das vantagens de conhecer a equao da reta a possibilidade de prever o comportamento da varivel dependente y, conhecendo o valor da varivel independente x. Como
veremos no prximo captulo, surge, frequentemente, nos manuais escolares um erro relacionado com a previso de um valor da varivel independente, conhecido um valor da varivel
dependente.

2.9.1 Regresso linear no Ensino Secundrio


No programa de Matemtica A do ensino secundrio, nomeadamente no 10.o ano, a terceira
unidade a ser lecionada a Estatstica. Nesta fase os alunos j possuem algumas noes que
adquiriram no 3.o ciclo e j realizaram pequenos trabalhos, no entanto a primeira vez que se
far referncia a distribuies bidimensionais, sendo uma abordagem grfica e intuitiva.
Desta forma, no 10.o ano de escolaridade transmitida uma ideia intuitiva de reta de regresso, tentando explorar a sua interpretao e as suas limitaes. Apesar de no ser objetivo
deste nvel de ensino explicar formalmente a reta obtida, transmitida a ideia pela qual ela
determinada corresponde reta que faz com que a soma dos quadrados das distncias de
cada ponto da nuvem reta seja mnima (mtodo dos mnimos quadrados), sendo esta reta
48

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
unicamente determinada recorrendo a uma calculadora.

2.9.2 O mtodo dos mnimos quadrados


Consideremos um conjunto de dados (xi , yi ), com i = 1, . . . , n para o qual se pretende ajustar
a reta
yi = 0 + 1 xi + i

(2.34)

onde yi representa a varivel dependente ou endgena (que o modelo pretende explicar o comportamento), xi a varivel independente ou exgena (que ser uma varivel explicativa para a
modelao de yi ), i a varivel erro (que uma varivel aleatria com algumas caractersticas
fundamentais para a fiabilidade da inferncia estatstica associada regresso) e 0 e 1 os
parmetros da regresso. A reta estimada ser da forma
ybi = b0 + b1 xi

(2.35)

onde ybi , b0 e b1 representam respetivamente os estimadores (ou estimativas(9) ) de yi , 0 e 1 .

Desta forma, os erros i correspondem diferena entre os valores observados para yi e os


valores estimados, i.e.

i = yi ybi = yi b0 b1 xi .

(2.36)

O mtodo habitualmente utilizado para estimar os parmetros da reta o mtodo dos mnimos
quadrados (consultar, por exemplo, Montgomery et al.(2006)que determina os estimadores b0
e b1 que minimizam a soma dos quadrados dos erros, isto , que minimizam
2
n 
n
f (b0 , b1 ) = i2 = yi b0 b1 xi .
i=1

(2.37)

i=1

Para determinar o mnimo teremos


b b 

f 0 , 1

b = y b1 x

= 0

b0
0

,
1 n


s
s
x
y

i
i
xy
y
b
b
i=1
n

= 2 = rxy
f 0 , 1 = 0
1 = 1 n 2
2
sx
sx
x

b
n i=1 i
1

(2.38)

(9)

Ao longo do presente trabalho no iremos efetuar distino entre estimador e estimativa no que se refere
notao utilizada. H, contudo, a referir que as estimativas agora representadas por b0 e b1 correspondem aos

parmetros anteriormente representados por a e b na equao (2.33).

Estatstica no Ensino Bsico e Secundrio

49

Conceitos de Estatstica
onde sxy representa a covarincia entre y e x; sx o desvio padro de x e rxy o coeficiente de
correlao entre x e y. O determinante da matriz Hessiana igual a
!2
n

4n xi2 4
i=1

xi

= 4n2 s2x ,

(2.39)

i=1

que positivo (desde que xi no assuma sempre o mesmo valor). Assim sendo, a matriz
Hessiana definida positiva e os valores determinados em (2.38) correspondem efectivamente
ao mnimo pretendido.
Desta forma, na equao (2.38) temos as frmulas dos estimadores dos mnimos quadrados de 0 e 1 com os quais podemos, recorrendo regresso (2.35), obter estimativas para y
conhecendo um valor especfico de x. As propriedades da inferncia estatstica resultante desta
aplicao dependem das caractersticas dos resduos (varivel ). Contudo, uma vez que esta
abordagem no efetuada no ensino no superior, sublinhamos apenas que os estimadores
assim obtidos gozam de excelentes propriedades (no enviesamento, eficincia e consistncia) caso a varivel satisfaa determinadas caractersticas, nomeadamente a normalidade,
independncia e homocedasticidade.
Algumas caractersticas da regresso so exploradas no ensino secundrio, como ilustram
as seguintes propriedades.
Propiedade 2.8. A soma dos erros nula, isto
n

i = 0.

(2.40)

i=1

De facto





b
b
b
b

x
,

=
n
y

0
1
i 0 1i
n

i=1

e, utilizando b0 = y b1 x, obtm-se o resultado pretendido.

Propiedade 2.9. A reta estimada pelo mtodo dos mnimos quadrados passa sempre pelo
centro de gravidade dos dados (x, y).
Efetivamente, utilizando (2.35) e (2.38), obtm-se
yb = b0 + b1 x = y b1 x + b1 x = y,

isto , o valor de yb quando x = x yb = y.

50

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica
A grande maioria dos docentes do ensino secundrio, a avaliar pelos manuais por ns
consultados, desconhece que a reta obtida pelo mtodo dos mnimos quadrados para estimar
y em funo de x e a reta obtida para estimar x em funo de y no so, em geral, idnticas.

2.9.3 A regresso linear inversa


Podemos utilizar frmulas anlogas s (2.38) para efetuarmos a regresso de x em funo de
y obtendo

b0 +
b1 yi ,
xbi =

(2.41)

b1 y e
b1 = sx rxy , (cf. equao2.38) Invertendo a reta (i.e. resolvendo em funo
b0 = x
onde
y

de yi e trocando os papis desempenhados pelas variveis) obtemos


yei = e0 + e1 xi .

(2.42)

Os estimadores de 0 e 1 assim obtidos, supondo rxy 6= 0 (pois caso rxy 0 a reta de regresso
no ter qualquer sentido), sero dados por:
sy
b0
b1 y
1
x

= y e1 x e e1 =
= rxy1 .
e0 = =
b1
b1
b1 sx

As retas (2.42) e (2.35) so coincidentes se e s se

b0 = e0
b1 = e1 rxy = 1 rxy = 1.
b
e
1 = 1

(2.43)

(2.44)

Assim sendo, ambas as retas passam pelo mesmo ponto (x,


y),
mas s se obtm a mesma recta
utilizando os dois mtodos se o mdulo da correlao for unitrio (sendo os erros, nestes casos, todos nulos uma vez que a reta passa precisamente por todos os pontos). Deste modo, a
reta de regresso de y em funo de x, determinando os parmetros da recta yb = b0 + b0 x que

minimizam t (yt ybt )2 , ser distinta (excepto se rxy = 1) da reta obtida quando efectuamos
b0 +
b1 yt que
uma regresso de x em funo de y, determinando os parmetros da reta xbt =

minimizam t (xt xbt )2 . Esta diferena resulta da forma como definimos os erros nas duas

regresses, pois enquanto na primeira os erros so medidos paralelamente ao eixo das ordenadas (o erro definido pela diferena entre o valor observado de y e o seu valor estimado

condicionalmente a x, t = yt ybt , cf. ilustra o primeiro grfico da Figura 2.18), na segunda


os erros so medidos paralelamente ao eixo das abcissas (o erro definido pela diferena en-

tre o valor observado x e o seu valor estimado pela regresso em funo de y, t = xt xbt ,

Estatstica no Ensino Bsico e Secundrio

51

Conceitos de Estatstica
cf. segundo grfico da Figura 2.18). Desta forma, ser errneo utilizar a regresso de y em
funo de x para efetuar previses para x quando conhecemos um determinado valor para y e,
apesar de em algumas aplicaes a diferena das duas retas poder ser diminuta, existem outras
situaes em que o erro pode assumir valores elevados. H, contudo, determinadas situaes
especficas para as quais se justifica a necessidade de utilizao de regresso inversa, como
ilustram alguns modelos de calibrao (cf. Brown (1993)).

ybi = b0 + b1xi

yei = e0 + e1xi

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

Figura 2.18: Definio dos erros na regresso linear

Os modelos de calibragem estatstica (ou, por vezes, denominados por previso inversa)
so muito usados em qumica, engenharia, bioestatstica e podem ser extremamente teis em
algumas aplicaes. Contudo, estas aplicaes so caracterizadas por contextos distintos dos
que previamente referimos. Consideremos, ento, que a varivel y medida atravs de processo complicado (muitas vezes fora do nosso alcance), dispendioso (em termos de tempo
e/ou monetariamente) mas que os seus resultados so extremamente precisos (sem erros ou
com erros negligenciveis em relao aos erros de medio da varivel x). A varivel x
medida por um processo simples, rpido, barato mas com pouca preciso (obtemos valores
aproximados). O objetivo estimar novos valores de y para alguns valores de x conhecidos.
Neste contexto, os erros a ter em conta no mtodo de regresso linear devero ser i = xbi xi
estimando-se a regresso yei = e0 + e1 xi utilizando (2.43). Com esta regresso podemos esti-

mar novos valores para y condicionados a valores conhecidos de x. Os estimadores assim obtidos, sob determinadas condies, gozam igualmente de boas propriedades. Osborne (1991)

faz uma apresentao histrica da evoluo destes mtodos, incluindo alguma discusso sobre
a problemtica inerente sua utilizao.
Contudo, estes contextos especficos nos quais a utilizao da calibrao frequentemente
utilizada, no so abordados no ensino secundrio.
52

Estatstica no Ensino Bsico e Secundrio

Conceitos de Estatstica

2.9.4 Estimao de y condicionada a x = x0


Consideremos que se pretende estimar o valor de y quando x assume o valor x0 . Recorrendo
equao (2.35), regresso de y em funo de x, obtemos
sy
sy
sy
yb = b0 + b1 x0 = y rxy x + rxy x0 = y + rxy (x0 x)
sx
sx
sx

(2.45)

e recorrendo equao (2.42), funo inversa da regresso de x em funo de y, obtemos


sy
sy
sy
ye = e0 + e1 x0 = y rxy1 x + rxy1 x0 = y + rxy1 (x0 x) ,
sx
sx
sx

sendo a distncia entre as duas estimativas dada por




sy


|b
y ye| = |x0 x| rxy rxy1
sx

(2.46)

(2.47)

que depende do quociente entre o desvio padro de y e o de x, da distncia entre x0 e x (o que


era espectvel uma vez que ambas as rectas passam no ponto (x, y)) e da distncia entre rxy e
rxy1 .
y

rxy = 0.95

yei = e0 + e1xi
b

ye0
yb0

yei = e0 + e1xi

ybi = b0 + b1xi

b
b

b b

b b

b b b
b

b b b
b

b b

b
b b

b b b b
b b
b
b
b

b b
b

b
b

b
b b
b

b b
b

b
b

b
b

b b

b
b b
b

b
b

b b

b b
b
b

b b

b b b

ye0
yb0
y

b b

b b

x0

b
b

b
b
b b

ybi = b0 + b1xi
b

b
b

b
b

b b

b
b b

b
b

b
b b

b b

b
b

b b

b b b
b
b b
b
b

b b

b
b

b
b

b
b

b b

b b

b
b

b b
b

b
b
b

b
b

b
b b

b b
b

b
b

b
b
b

b
b

b
b

b
b

x0

yei = e0 + e1xi
b

b
b

ybi = b0 + b1xi
b

b
b

b
b

b b

b
b b

b
b
b

b
b

b b
b

b
b

b
b

b
b

b
b

b
b

b b
b

b
b

b
b b
b b
b

b
b

b
b

b
b

b
b
b

b
b

b
b

b b b
b b b b
b b
b
b
b

b
b

b b

b b

b b

b
b

b
b

b
b

b b

b
b

b b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b b

x0

b b
b
b b
b b b
b
b

b b
b
b
b

b b
b

b
b

b b

b b

b b

b
b

b
b

b b

b b

b
b

b
b

b b b
b
b b b
b b b
b b
b b b
b
b
b
b

b b

b b

b b

b b

b b
b

b b

b b
b

rxy = 0.70

b b

b b
b b

b b
b
b

b b
b
b

b
b

b
b

b
b

b
b

b
b
b

b
b

b
b

b
b

b b

ye0
yb0
y

b
b

b
b

b
b

b b b b
b
b b b b
b b
b

b b
b

b b
b

b b

b b b

b
b

b
b

b b

b
b

b b
b

b
b

b
b

ye0
yb0
y

b
b

yei = e0 + e1xi

rxy = 0.80

b b

ybi = b0 + b1xi

b
b

b b
b

b b

b b
b

b
b

b
b
b

b b

b b
b b

b
b

b b
b

b b b b
b b b

b b
b b

b b

b
b

b b

b b
b

b b
b

b
b

b
b

b
b

b
b b

b
b
b
b

b b

rxy = 0.90

b
b

x0

Figura 2.19: Regresso de y condicionada a x versus de x condicionada a y


Conforme claramente ilustram os quatro exemplos retratados na Figura 2.19, onde so
apresentadas as duas retas obtidas utilizando conjuntos distintos de 200 observaes (recorrendo ao software GeoGebra), com coeficiente de correlao igual a 0.95, 0.90, 0.80 e 0.70,
Estatstica no Ensino Bsico e Secundrio

53

Conceitos de Estatstica
podemos constatar a distino entre as duas retas, a diferena entre o valor estimado de y obtido pelas duas rectas quando x assume o valor x0 , bem como o aumento desta distncia com a
diminuio da correlao entre x e y e/ou o afastamento de x0 relativamente a x.
Estes grficos
podem ser facilmente construdos em sala de aula (cf. ilustraremos na seco 4.1.5 na pgina
71), com a vantagem de serem dinmicos, isto , ao alterarmos um ponto (ou um conjunto de
pontos) visualizarmos imediatamente as consequentes alteraes no coeficiente de correlao
e nas retas estimadas, bem como ao mudarmos a coordenada x0 percebermos as consequentes
implicaes no valor de y estimado.

54

Estatstica no Ensino Bsico e Secundrio

Captulo 3
Anlise crtica aos materiais disponveis
Da anlise efetuada a um conjunto de materiais disponveis para o ensino da Estatstica no
ensino bsico e secundrio, sero apresentadas, neste captulo, vrias situaes encontradas
em manuais escolares, onde se detetaram erros e/ou gralhas relativos s representaes grficas, notao utilizada e explorao de alguns conceitos. Para cada situao detetada ser
apresentado um exemplo, mencionado o manual (ou manuais, se for o caso) e apresentada a
devida justificao.
Constatamos que nos manuais do ensino bsico h erros frequentes nas representaes
grficas, enquanto nos manuais do ensino secundrio, embora estes tambm apaream em
alguns casos, existe um erro comum no ensino da regresso linear e uso incorreto de notao.
Ilustramos, de seguida, algumas das concluses da anlise efetuada.

3.1

Erros nas escalas

Um tipo de erro que surge com alguma frequncia diz respeito s representaes grficas.
Magro et al. (2010, p. 112) apresentam um grfico de linhas em que a escala do eixo vertical
no comea no zero como devia (ver Figura 3.1). Esta situao induz o leitor em erro pois
parece que a temperatura aumentou muito mais do que na realidade. Uma situao muito
semelhante verifica-se em Neves et al. (2010b, p. 30) num grfico intitulado Evoluo
da temperatura das 6 s 12 horas. Ainda neste mbito, Negra & Martinho (2010, p. 144)
apresentam um grfico de barras de frequncia relativa acumulada em que a escala do eixo
vertical est errada, apesar de comear no zero (cf. Figura 3.1). Por outro lado, uma das barras
55

Anlise crtica aos materiais disponveis


est mal construda pois a sua altura no est de acordo com o respetivo rtulo.

Negra & Martinho (2010), p. 144

Magro et al. (2010), p.112

Figura 3.1: Erros de escala

Relativamente s escalas no eixo horizontal podemos ver que o grfico de barras intitulado
Carregamento de telemveis que Duarte & Filipe (2010, p. 131) apresentam, no est correto
pois a distncia entre as duas ltimas barras deveria ser o qudruplo daquela que aparece (cf.
Figura 3.2). Da forma como est parece que o maior valor da varivel 35 euros e no 50
euros. O grfico deveria tambm evidenciar que no h carregamentos mensais de 35, 40 e
45 euros, ficando no grfico o lugar dessas barras de frequncia nula. Uma situao idntica
surge no manual de 7.o ano de Costa & Rodrigues (2010b, p. 15) e ainda no manual de 8.o
ano de Neves et al. (2011, p. 21).

Duarte & Filipe (2010), p. 131

Figura 3.2: Erros de escala horizontal

de referir ainda o grfico de barras no manual do 10.o ano de Costa & Rodrigues (2010a,
p. 182). Este grfico no tem qualquer escala no eixo vertical, embora as barras contenham
rtulos e alm disso no apresenta as barras igualmente espaadas. No um bom exemplo
para os alunos.
56

Estatstica no Ensino Bsico e Secundrio

Anlise crtica aos materiais disponveis

3.2

Confuso entre dados e frequncia

Apresenta-se de seguida algumas situaes onde h confuso entre dados e frequncia e que
do origem a grficos que, embora tenham barras, no so grficos de barras segundo Martins
& Ponte (2010), uma vez que no eixo horizontal no aparecem nem valores da varivel nem
modalidades.

Um exemplo surge no manual do 7.o ano de Costa & Rodrigues (2010b). A varivel em
estudo o consumo de gua, logo os dados so numricos, no entanto os autores designam
por grfico de barras um grfico que em vez de ter no eixo horizontal os valores da varivel
tem os meses do ano. O mesmo acontece noutro manual do 7.o ano. Segundo Faria et al.
(2010) num estudo em que a varivel o nmero de pares de sapatos vendidos, o grfico que
foi considerado pelos autores como um grfico de barras apresenta no eixo horizontal os dias
da semana (cf. Figura 3.3). Trata-se de um grfico com barras! Aparece igualmente mais um
exemplo destes no manual de Passos & Correia (2010). Na pgina 36 os autores apresentam
um grfico em que a varivel em estudo o nmero de latas de alumnio usadas por 10 alunos
e que no eixo horizontal tem os nomes dos alunos em vez do nmero de latas (cf. Figura 3.3).
Mesmo assim os autores perguntam o nome do grfico, esperando que os discentes respondam
grfico de barras. Neste exemplo os valores da varivel so 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, isto ,
temos 10 dados estatsticos com os quais podemos fazer uma tabela de frequncias e construir
o respetivo grfico de barras. Por exemplo, a barra referente ao valor 2 ter altura 4.

Passos & Correia (2010), p. 36

Faria et al. (2010), p. 118

Figura 3.3: Confuso entre dados e frequncia

Estatstica no Ensino Bsico e Secundrio

57

Anlise crtica aos materiais disponveis

3.3

Clculo da mdia quando a varivel contnua

Quando estamos perante um conjunto de dados reais de uma varivel contnua e pretendemos
calcular a mdia devemos efetuar os clculos usando os dados reais. S deveremos recorrer s
marcas das classes quando no conhecemos os valores que pertencem a essas classes(1) . No
manual de Duarte & Filipe (2010, p. 141) aparece o clculo aproximado da mdia sem que
nada seja referido, quando os dados reais so conhecidos. Mesmo que fosse uma explicao
do procedimento a fazer noutras situaes, deve ser dito que a mdia calculada a partir das
marcas das classes um valor aproximado e que, neste caso particular, no deve ser calculada
deste modo.

3.4

Um erro comum na regresso linear

Nesta seco iremos focar a ateno no erro mais comum que detetamos nos manuais por ns
consultados, a de utilizao da mesma reta de regresso, obtida pelo mtodo dos mnimos
quadrados, para estimar um valor de x condicionado a um dado valor de y bem como para
estimar um valor de y condicionado a um valor de x quando, corretamente, dever-se-iam
utilizar duas retas distintas (exceto em alguns casos muito particulares onde as duas retas
so anlogas). Um exemplo ilustrativo o livro de Jorge et al. (2010) que na pgina 83,
apresenta um diagrama de disperso que relaciona o ndice de Desenvolvimento Humano
(IDH) de Portugal com o nmero de anos decorridos aps 1975 e usa a reta de regresso
y = 0, 004x + 0, 7926 para estimar o IDH para o ano 2008, mas tambm usa a mesma reta para
saber o ano em que Portugal atingiu um determinado ndice. Este erro ser exemplificado
utilizando um software (que freeware) frequentemente utilizado no ensino da geometria no
ensino bsico e secundrio, o GeoGebra, e que uma potencial ferramenta no ensino da
regresso linear (conforme salientaremos na seco 4.1.5, na pgina 71). Em muitos manuais
utilizados no ensino secundrio utilizada a mesma reta para estimar o valor de y quando
conhecemos um valor de x (condicionada a x = x0 ) e para estimar o valor de x em funo de
um valor especfico da varivel y (y = y0 ), o que no deveria ocorrer pelas razes previamente
(1)

Esta situao frequente quer por no termos acesso aos dados em algumas situaes, quer pelo facto

de, em alguns inquritos, as perguntas surgirem logo em classes. Um exemplo ilustrativo desta situao o
rendimento mensal (pois ningum responde o seu rendimento exato).

58

Estatstica no Ensino Bsico e Secundrio

Anlise crtica aos materiais disponveis


apontadas. Esta confuso deriva do desconhecimento por parte de muitos docentes, incluindo
autores de manuais, de que as retas obtidas so distintas. Sublinhemos que, dos manuais
por ns consultados, h um que apresenta corretamente este tema e, partindo de um exemplo
simples, explica aos alunos a razo pela qual no devem usar a mesma reta de regresso em
ambos os casos, referindo:

A recta de regresso, de equao y = 0, 797x + 121, 282, foi construda para,


dado o peso x, em kg, de um jogador prever a altura y, em cm, do mesmo (. . . ). Os
erros cometidos, relativamente aos valores de y medidos e os valores previstos so
os comprimentos dos segmentos de reta assinalados na figura (. . . ). A equao da
reta de regresso determinada, utilizando ferramentas matemticas, de forma
a minimizar a acumulao destes comprimentos (. . . ). Percebe-se assim, que
possvel utilizar a equao desta reta para prever valores da altura dado o valor
do peso, mas, no entanto no se pode utilizar esta equao para prever o valor
do peso dado o valor da altura
[Negra & Martinho, 2010, pp.181-182]

Pelo facto da maioria dos professores do ensino secundrio desconhecer a existncia das
referidas diferenas, importante divulg-las de forma a serem efetuadas as correes necessrias nos manuais, bem como alertar e clarificar o corpo docente para esta situao. A
explorao de exemplos dinmicos em GeoGebra, software torna bvia a diferena entre os
dois mtodos. O clculo das duas retas automtico e alterando os valores da nossa amostra (presentes na folha de clculo do GeoGebra) permite visualizar a consequente alterao
(sensibilidade) das retas bem como dos valores estimados pelos dois modelos, razo pela qual
nos parece uma ferramenta adequada para o ensino da regresso linear conforme os objetivos
estipulados no programa de matemtica do ensino secundrio.
Perante um erro to generalizado, pretendemos divulg-lo de forma a serem efetuadas as
correes necessrias nos manuais, bem como alertar e clarificar o corpo docente para esta
situao, razo pela qual apresentamos um poster acerca deste assunto no XIX Congresso da
Sociedade Portuguesa de Estatstica (SPE) que decorreu na Nazar em setembro de 2011 (cf.
Martins et al.(2011)).
Estatstica no Ensino Bsico e Secundrio

59

Anlise crtica aos materiais disponveis

3.5

Definies pouco claras

Qualquer definio ao dispor do aluno deve apresentar-se da forma mais clara possvel, pois
servir de base para o trabalho que o aluno ir desenvolver volta desse tpico e o aluno ter
mais segurana se souber que para relembrar, facilmente, qualquer conceito, dispe de textos
esclarecedores. Parece-nos pouco clara, quer para alunos quer para professores, a definio de
mediana dada por Negra & Martinho (2010) que apresenta A mediana o dado que ocupa a
posio central da distribuio, quando ordenada (Negra & Martinho, p. 149). Por um lado,
atendendo ao conceito de dado estatstico, a mediana pode no ser um dado. Esta situao s
garantida se o nmero de dados for mpar. Por outro lado, apenas com esta definio um
aluno no conseguiria calcular a mediana de um conjunto de dados par, como por exemplo:
8, 9, 9, 12, 12, 15, uma vez que no referido na definio que tem de calcular a mdia dos
dois valores centrais.

3.6

Erros e/ou falta de clareza na notao

Os erros relativos notao utilizada surgem com mais frequncia nos manuais do ensino
secundrio, pois no ensino bsico a linguagem simblica usada muito reduzida. Para analisarmos alguns deles podemos consultar, por exemplo, Duarte & Filipe (2010) na pgina 152,
onde na demonstrao de uma propriedade da mdia se l:
Sejam x1 , x2 , x3 , , xn os N valores da distribuio X, sendo

x=

x1 + x2 + x3 ... + xn
.
N

(3.1)

Quando observamos o que est escrito pode parecer-nos uma gralha e que basta trocar n
por N. No entanto poder fazer alguma confuso aos alunos pois na pgina anterior os autores
usam a letra n para designar o nmero de valores diferentes da varivel e usam N para designar
o nmero total de valores da distribuio.
Tambm podemos verificar uma situao semelhante em Neves et al. (2010a, p. 129),
onde aparece a seguinte frmula da varincia:
60

Estatstica no Ensino Bsico e Secundrio

Anlise crtica aos materiais disponveis


n

s2 =

(xi x)2 ni

i=1

n1

(3.2)

Os autores usam a letra n para designar o nmero de elementos da amostra e simultaneamente


usam-na para designar o nmero de valores distintos da varivel, quando deveriam ter usado
notaes diferentes.
Tambm em Costa & Rodrigues (2010b) surge confuso com as notaes utilizadas. Na
pgina 182 a letra k utilizada para representar o nmero de valores distintos da varivel. Duas
pginas frente k j representa a posio da mediana. Por outro lado, usada a letra N para
designar o total de dados quando esto agrupados e usada a letra n quando so dados simples.
Ainda no mesmo manual usam a letra N para designar o nmero de dados da amostra na pgina
178 e na definio de mediana referem-se a n dados (sem referir amostra ou populao).
Desta anlise e tendo em conta que existem mais situaes para alm das que foram aqui
apresentadas, conclui-se que difcil entender o que as letras representam neste captulo do
livro e que urgente que se realize uma correo numa prxima edio.
Deste modo, parece-nos que, porventura, seria mais fcil se os autores simplesmente utilizassem a notao internacional (deste modo a notao usada em cada manual seria consistente,
alm de ser consistente com os restantes manuais).
Na tabela 3.1 propomos uma notao, baseada na notao internacional e que corresponde
que utilizamos no captulo 2.

Estatstica no Ensino Bsico e Secundrio

61

Anlise crtica aos materiais disponveis

Notao

Descrio

dimenso da amosta

dimenso da populao

x1 , , xn

observaes da amostra

x(1) , , x(n)
x1 , , xp

observaes da amostra ordenadas


modalidades diferentes na amostra

nmero de modalidades distintas

ni

frequncia absoluta de xi

Ni

frequncia absoluta acumulada de xi

fi

frequncia relativa de xi

Fi

frequncia relativa acumulada de xi

mdia de uma amostra

mdia de uma populao

Mo

moda

Me

mediana

Q1

1.o quartil

Q3

3.o quartil

Percentil

nmero de classes

hi

amplitude da i-sima classe

IT

amplitude total

IQ

amplitude Interquartis

s2

varincia de uma amostra

varincia de uma populao

desvio padro de uma amostra

desvio padro de uma populao

coeficiente de correlao da populao

coeficiente de correlao da amostra


Tabela 3.1: Sugesto de notao

62

Estatstica no Ensino Bsico e Secundrio

Captulo 4
Materiais e sugestes metodolgicas
Neste captulo vamos apresentar algumas propostas de trabalho para a sala de aula com recurso ao software GeoGebra (ir ser utilizada a verso 4). Este programa gratuito (disponvel
em www.geogebra.org) e muito utilizado em Geometria por ser dinmico. Neste trabalho pretendemos explorar as suas potencialidades no ensino e aprendizagem da estatstica e, por isso,
apresentamos em primeiro lugar uma explicao mais detalhada sobre os vrios comandos
que sero utilizados nessas propostas de trabalho.

4.1

O GeoGebra no ensino da Estatstica

O GeoGebra uma potencial ferramenta que pode ser explorada no ensino da Estatstica.
Com este software podemos construir tabelas de frequncia, vrios tipos de grficos (grficos
de barras, grficos de pontos, histogramas, diagramas de caule e folhas, diagramas de extremos e quartis e diagramas de disperso), calcular quase todas as medidas estatsticas que so
lecionadas no ensino bsico e no ensino secundrio, e pelo facto de ser um software dinmico,
podemos alterar os dados e verificar os efeitos dessas alteraes quer nos grficos quer nas
medidas estatsticas, permitindo fazer vrias exploraes dos conceitos. Esta possibilidade de
usar a tecnologia nas aulas de Matemtica permitir melhorar as oportunidades de aprendizagem dos alunos se aproveitarmos aquilo que a tecnologia faz de forma correcta e eficiente
construo de grficos, visualizao e clculo. NCTM (2008, p. 27).
63

Materiais e sugestes metodolgicas

4.1.1 Inserir dados no GeoGebra


A janela principal do GeoGebra dispe de uma barra de menus, uma barra de ferramentas,
uma zona algbrica, uma zona grfica e uma entrada de comandos. Tambm podemos visualizar uma folha de clculo onde podemos introduzir os dados que constituem a amostra e a
partir da temos a possibilidade de construir tabelas e vrios grficos, como de seguida vamos
explicar. Para visualizar a folha de clculo deve-se selecionar na barra de ferramentas Exibir
e de seguida escolher Folha de Clculo. Surge, ento, do lado direito (cf. Figura 4.1) uma
folha de clculo, contendo vrias colunas A, B,C, . Numa delas introduzimos os dados no
classificados e, utilizando o boto do lado direito do rato, selecionarmos Criar lista. A lista
obtida aparece na folha algbrica (lado esquerdo) designada por lista1, havendo possibilidade
de alterar o seu nome. Para isso, com o cursor colocado em lista1, basta utilizar o boto do
lado direito do rato, clicar em propriedades dos objetos (tambm se pode obter o mesmo efeito
clicando em renomear) e escrever o nome que se pretende na janela nome (consideremos, por
exemplo, idade). Refira-se que os dados da Tabela 2.1 presente na pgina 13 podem ser introduzidos na folha de clculo, podendo primeira coluna chamar-se cor, segunda coluna
leitura, terceira coluna idade, quarta coluna altura, quinta Mat e, finalmente, sexta
coluna CFQ.
Na folha de clculo podemos igualmente colocar os dados classificados, usando a primeira coluna para colocar os diferentes valores da varivel (lista1) e a segunda coluna para
as respetivas frequncias (lista2). Este procedimento pode ser til na construo de grficos,
nomeadamente o diagrama de barras, como poderemos ver na seco 4.1.3. De seguida vamos
apresentar como se constroem tabelas de frequncia.

Figura 4.1: Janela principal do GeoGebra e folha de clculo

64

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas

4.1.2 Construo de tabelas de frequncia


Aps termos criado a lista de dados podemos contruir tabelas de frequncias colocando na
Entrada de comandos cada um dos comandos que a seguir apresentamos, clicando de seguida
em Enter.
TabelaFrequncias[<Lista de Dados>] Permite obter uma tabela de frequncias absolutas a partir dos dados no classificados.
TabelaFrequncias[True, <Lista dos Dados>] Permite obter uma tabela de frequncias
absolutas acumuladas a partir dos dados no classificados.
TabelaFrequncias[<Lista dos Limites das Classes>,<Lista dos Dados>] Permite obter
uma tabela de frequncias absolutas para uma varivel contnua.
TabelaFrequncias[True,<Lista dos Limites das Classes>,<Lista dos Dados>] Permite
obter uma tabela de frequncias absolutas acumuladas para uma varivel contnua.
Assim, se pretendermos uma tabela de frequncias absolutas da varivel idade, ver Tabela
2.4 com os mesmos dados (pgina 17), podemos usar o comando TabelaFrequncias[idade]
e obter uma tabela como a que se apresenta na Figura 4.3. Podemos proceder de modo idntico
no caso de uma varivel qualitativa. No caso da varivel cor preferida dos alunos, usamos a
lista cor e, atravs do comando TabelaFrequncias[cor] obtemos a tabela da Figura 4.2 cujos
dados constam na Tabela 2.3 da pgina 16.

Figura 4.2: Tabela de frequncias absolutas da varivel cor preferida


Se pretendermos uma tabela de frequncias acumuladas escrevemos na entrada TabelaFrequncias[True, idade]. Se, por outro lado, estamos interessados numa tabela com os
dados organizados em classes, nomeadamente as alturas dos 25 alunos, alm da lista das alturas, designada por altura, criamos outra lista com os limites das classes {145, 150, 155, 160,
Estatstica no Ensino Bsico e Secundrio

65

Materiais e sugestes metodolgicas

Figura 4.3: Tabela de frequncias absolutas da varivel idade


165 e 170} que se pode designar por limites e usa-se o comando TabelaFrequncias[limites,
altura] ou tambm pode ser escrita diretamente no comando do seguinte modo: TabelaFrequncias[{145, 150, 155, 160, 165 e 170}, altura]. Para obter a lista dos limites das
classes podemos recorrer Regra de Sturges. Na tabela obtida, as classes no aparecem escritas usando parnteses retos, no entanto a contagem feita corretamente, sendo cada classe
fechada esquerda e aberta direita. Apresentamos na Figura 4.4, a ttulo de exemplo, a tabela
de frequncias absolutas para a varivel altura construda com este software, e que j apresentamos de outra forma na pgina 19. Obteramos de modo semelhante a tabela de frequncias
absolutas acumuladas, introduzindo o comando TabelaFrequncias[True, limites, alturas]

Figura 4.4: Tabela de frequncias da varivel altura

4.1.3 Representaes grficas


A construo de vrios tipos de grficos est muito facilitada recorrendo ao GeoGebra. Assim
vamos apresentar de seguida os comandos utilizados para obter alguns grficos que aparecem
no captulo 2 deste trabalho.

GrficoPontos[<Lista de Dados No Classificados>] Permite obter um grfico de pontos a partir dos dados no classificados.
66

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas


DiagramaBarras[<Lista dos Dados no classificados>, <Largura das barras>] Permite
obter um grfico de barras de frequncias absolutas a partir dos dados no classificados.
DiagramaBarras[<Lista dos Dados classificados>, <Lista das frequncias>,<Largura
das barras>] Permite obter um grfico de barras a partir dos dados classificados.
DiagramaCauleFolhas[<Lista>] Permite obter um diagrama de caule e folhas a partir
da lista de dados no classificados.
DiagramaCauleFolhas[<Lista>, <Ajustamento (-1 | 0 | 1)>] Permite obter um diagrama de caule e folhas a partir da lista de dados no classificados e fazer o ajustamento,
em que o aumento de uma unidade corresponde a multiplicar por dez o valor do caule.
DiagramaExtremosQuartis[<Ordenada>, <Semialtura>, <Lista de Dados No Classificados>] Permite obter um diagrama de extremos e quartis a partir da lista de dados
no classificados. O valor da ordenada est relacionado com a distncia ao eixo das
abcissas e a semi-altura d-nos a largura do retngulo que contm os dados volta da
mediana.
DiagramaExtremosQuartis[<Ordenada>, <Semialtura>, <Mnimo>, <Quartil1>, <Mediana>, <Quartil3>, <Mximo>] Permite obter um diagrama de extremos e quartis a
partir dos valores dos extremos e dos quartis.
Histograma[<Lista dos Limites das Classes>, <Lista das Frequncias>] Permite obter
um histograma a partir da lista dos limites das classes e da lista das frequncias.
Histograma[<Lista dos Limites das Classes>, <Lista dos Dados>, <Densidade (true |
false)>, <Escala (opcional)>] Permite obter um histograma a partir da lista dos limites
das classes e da lista dos dados no classificados. Caso se pretenda um histograma de
frequncias relativas , na densidade seleciona-se true.
Histograma[<Acumulada (True | false)>, <Lista dos Limites das Classes>, <Lista dos
Dados>, <Densidade (true | false)>, <Escala (opcional)>] Permite obter, por exemplo, um histograma de frequncias absolutas acumuladas, selecionando primeiro true e
depois na densidade false ou um histograma de frequncias relativas acumuladas, selecionando true em Acumulada e tambm em Densidade.
Estatstica no Ensino Bsico e Secundrio

67

Materiais e sugestes metodolgicas


Para representar um grfico de pontos, como por exemplo, o grfico da Figura 2.2 presente
na pgina 22, podemos usar o comando GrficoPontos[idade], onde idade designa a lista de
todas as idades.
Para representar um grfico de barras, como por exemplo, o grfico da Figura 2.3 presente
na pgina 23, podemos usar o comando DiagramaBarras[idade, 0.5 ], onde idade designa
a lista de todas as idades. Para que as barras no sejam adjacentes, a largura das barras deve
ser inferior a 1. Outro processo para obter o mesmo grfico usar o comando DiagramaBarras[idade1, freq, 0.5], onde idade1 a lista das idades diferentes e freq a lista das
frequncias.
Para construir um diagrama de caule e folhas como o da Figura 2.9, que se pode
visualizar na pgina 27, usou-se o comando DiagramaCauleFolhas[idade], em que
idade designa a lista de todas as idades.

Tambm poderamos ter usado o comando

DiagramaCauleFolhas[idade,1], considerando o ajustamento igual a 1 ( define o valor


do caule).
Para construir um diagrama de extremos e quartis, como o da Figura 2.14 que se apresenta
na pgina 37, usou-se o comando DiagramaExtremosQuartis[8, 3, 13, 13.5, 14, 14.5, 16].
Tambm poderamos ter usado o comando DiagramaExtremosQuartis[8, 3, idade].
Para representar o histograma da Figura 2.5 (pgina 24) uma das alternativas usar o comando Histograma[limites , freq1], onde limites a lista dos limites das classes e freq1
a lista das frequncias. Se recorrermos lista da totalidade dos dados usamos o comando
Histograma[limites, altura, false]. Para obtermos o polgono de frequncias da Figura 2.6,
presente na pgina 25, recorremos tambm s potencialidades do GeoGebra no mbito da
Geometria, construindo segmentos de reta cujos extremos so pontos mdios de outros segmentos de reta. Para obter o grfico patente na Figura 2.8 (pgina 26) usamos o comando
Histograma[True, limites, altura, True] e mais uma vez as potencialidades do Geogebra na
Geometria.
J vimos algumas potencialidades do GeoGebra, nomeadamente, na elaborao de tabelas
de frequcia e grficos. Vamos passar de seguida ao clculo de medidas estatsticas, apresentando os comandos necessrios.
68

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas

4.1.4 Clculo de medidas estatsticas


Depois de inserirmos os dados na folha de clculo e de criarmos uma lista podemos calcular as
medidas de localizao e de disperso colocando na janela de entrada cada um dos comandos
que constam da Tabela 4.1.
Medidas
estatsticas

Comando

mdia

Mdia[ <Lista de Nmeros> ]

moda

Moda[ <Lista de Nmeros> ]

mediana

Mediana[ <Lista de Nmeros> ]

quartil 1

Q1[ <Lista de Nmeros> ]

quartil 3

Q3[ <Lista de Nmeros> ]

percentil

Percentil[ <Lista de Nmeros>, <Valor do Percentil> ]

varincia

VarinciaAmostra[ <Lista de Nmeros> ]

desvio padro

DesvioPadroAmostra[ <Lista de Nmeros> ]

Tabela 4.1: Comandos para o clculo de medidas estatsticas com o GeoGebra

Os valores das medidas estatsticas vo aparecendo na folha algbrica representados por


letras, assim como a lista dos dados. Cada uma dessas letras deve ser substituda por um
nome sugestivo de forma a no haver confuso. Como exemplo, apresentamos na Figura 4.5
as medidas estatsticas referentes s idades dos 25 alunos.
Uma das vantagens deste software no estudo da Estatstica o facto de ser dinmico o
que permite visualizar, de imediato, os efeitos, nas medidas estatsticas, da alterao de um
ou mais dados da amostra. Vamos supor que substituamos uma idade de treze anos por uma
de dezoito anos. Do mesmo modo que a folha de clculo foi alterada, tambm as medidas
estatsticas so imediatamente atualizadas, como se pode ver na Figura 4.6. Facilmente se
v que a moda e a mediana no se alteraram, mas a mdia e o desvio padro aumentaram o
que confirma uma maior disperso das idades e, por outro lado, que a moda e a mediana no
so influenciadas pelos valores extremos. Refira-se que este programa tambm indica o valor
mnimo e o valor mximo. Neste caso bastava escrever Mnimo[notas] e Mximo[notas],
respetivamente.
Outras situaes deste tipo iro ser exploradas neste trabalho, sendo possvel beneficiar de
Estatstica no Ensino Bsico e Secundrio

69

Materiais e sugestes metodolgicas

Figura 4.5: Medidas estatsticas para a varivel idade

Figura 4.6: Medidas estatsticas da idade, aps a alterao de um valor


outras potencialidades do GeoGebra tais como a anlise univariada e a anlise multivariada.
Depois de registar os dados na folha de clculo e de os selecionar, se clicarmos no icon da
barra de ferramentas que apresenta um grfico e escolhermos anlise univariada, aparece-nos
uma lista com medidas estatsticas e uma representao grfica, entre aquelas que o software
permite construir. Como exemplo, apresentamos na Figura 4.7 as estatsticas da varivel idade
e um diagrama de extremos e quartis semelhante ao diagrama j apresentado na pgina 37.
Se alterarmos a designao do grfico, passaremos de uns para os outros. Tudo isto feito
70

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas


automaticamente, sem qualquer comando. Mais uma vez podemos ver de uma forma simples
os efeitos nas medidas estatsticas ou nos grficos, de vrias alteraes que podem ser feitas na
lista de dados. Outra possibilidade que o GeoGebra nos d a construo de dois diagramas
de extremos e quartis empilhados, a partir de duas listas de dados, permitindo compar-las.
Para isso, selecionamos as duas listas inseridas na Folha de clculo e clicamos no icon da
barra de ferramentas que apresenta um grfico e escolhemos anlise multivariada. Para alm
dos diagramas de extremos e quartis tambm surge uma tabela com as medidas estatsticas
referentes aos dois conjuntos de dados.

Figura 4.7: Anlise univariada para a varivel idade

4.1.5 Regresso linear


Figuras anlogas s representadas na Figura 2.19 (pgina 53) podem ser construdas em sala
de aula com recurso ao software GeoGebra, tendo a vantagem de poderem ser dinmicas. Para
este fim, no GeoGebra, podemos exibir a Folha de Clculo e utilizar as duas primeiras colunas
(A e B) para definir as coordenadas dos pontos a utilizar para a regresso linear. Com os pontos
definidos podemos criar uma lista de pontos (bastar selecionar as coordenadas e, utilizando
o boto do lado direito do rato, selecionar Criar lista de pontos, que, neste caso, cada ponto
Estatstica no Ensino Bsico e Secundrio

71

Materiais e sugestes metodolgicas


ter duas coordenadas). Desta forma ser criada a lista1 que contm os n pontos que correspondem ao nosso conjunto de dados (xi , yi ). Podemos de seguida determinar o coeficiente de
correlao, atravs do comando CoeficienteDeCorrelao[lista1]; a reta de regresso de y
em funo de x de acordo com a equao (2.35), presente na pgina 49, recorrendo ao comando RegressoLinear[lista1] e, no mesmo grfico, representar a reta de regresso de x
em funo de y (cf. equao (2.41)) utilizando o comando RegressoLinearX[lista1]. As
duas retas podem ser representadas por cores diferenciadas de forma a podermos destingu-las
facilmente. Desta forma, ao ser alterado um ou mais pontos da lista1, quer o coeficiente de
correlao quer as retas sero automaticamente ajustadas nova nuvem de pontos, o que permitir visualizar facilmente a diferena entre as duas retas, bem como observar as alteraes
no coeficiente de correlao. Em sala de aula, pode-se explorar a sensibilidade do coeficiente
de correlao bem como da reta ajustada a alteraes de pontos, em particular existncia de
pontos mais afastados (outliers). Caso pretendamos analisar igualmente os valores estimados
para y para um dado valor de x, bastar definir um ponto A [de coordenadas (x0 , 0)] no eixo
das abcissas, os segmentos de reta paralelos ao eixo das ordenadas que liguem o ponto A a
cada uma das retas estimadas (sejam P1 e P2 os pontos das retas com abcissa x0 ). A ordenada
dos pontos P1 e P2 correspondem s estimativas obtidas com cada uma das retas (valores yb0

e ye0 representados nos grficos da Figura 2.19 da pgina 53). Para melhor visualizar o valor

das estimativas obtidas podemos criar segmentos de retas paralelos ao eixos das abcissas que
liguem P1 e P2 ao eixo das ordenadas (de forma anloga apresentada nos grficos da Figura

2.18). Com esta construo, caso alteremos a abcissa x0 do ponto A, as estimativas obtidas sero automaticamente ajustadas, permitindo, desta forma, observar as suas diferenas quando
utilizamos valores para x0 mais prximos ou mais afastados de x.

4.2

Propostas de trabalho para a sala de aula

Nesta seco vamos apresentar algumas propostas de trabalho para a sala de aula com recurso ao GeoGebra. Algumas destas propostas sero mais orientadas para o ensino bsico e
outras sero elaboradas para serem aplicadas no ensino secundrio. Procurou-se aliar o uso
do computador anlise de dados reais, conforme recomendado em vrios documentos tais
como NCTM (2007), Branco (2000), Ponte et al. (2007). Para cada proposta sero definidos
72

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas


objetivos que se pretendem alcanar, tendo em conta os programas atuais. Tendo em conta
que o professor necessitar de uma sala com computadores para a aplicao das propostas, na
impossibilidade de haver um computador para cada aluno, propomos a sua realizao a pares.

4.2.1 Proposta 1 Quantas pessoas vivem em minha casa?


Esta proposta (presente no anexo A.1) destina-se aos alunos do 1.o ciclo e tem como objetivos:
recolher dados registando-os atravs de tabelas de frequncias absolutas, grficos de
pontos e grficos de barras;
ler, explorar, interpretar e descrever tabelas e grficos;
identificar a moda num conjunto de dados.
Os alunos j devem ter o conceito de moda, saber o que uma tabela de frequncias absolutas
e conhecer grficos de pontos e de barras. Um dos aspetos a privilegiar nesta proposta o
facto dos dados serem significativos para os alunos. Os alunos, na prpria aula, devem responder questo Contando contigo, quantas pessoas vivem em tua casa?. O professor pode
usar uma lista dos alunos da turma que vai preenchendo no computador e depois projeta ou
simplesmente escreve os nomes no quadro e as respetivas respostas. Deve ser transmitido aos
alunos que antes de construrem um novo grfico podem guardar o trabalho anterior e abrir
um novo documento (havendo a possibilidade de copiar a lista de dados). Deve chamar-se
a ateno de que os grficos de pontos podem evoluir para grficos de barras. O item em
que se pede para o aluno formular questes revela-se importante para desenvolver a comunicao matemtica e deve haver um momento para a apresentao e discusso das questes
formuladas pelos alunos. Uma vez que o GeoGebra um software dinmico, o professor
pode propor a alterao dos dados iniciais, fazendo questes como por exemplo Suponham
que o pai da Maria (aluna da turma) vai trabalhar para o estrangeiro. Acham que a moda se
altera? Os alunos devem dar a sua opinio, mas depois devero confirmar, alterando a lista
de dados e construindo de novo a tabela, um dos grficos ou simplesmente usando o comando
Moda[lista1]. O professor deve ter a sensibilidade de propor alteraes que faam surgir
outro valor para a moda ou at mesmo duas modas. Tambm se deve discutir se ou no
razovel generalizar os resultados obtidos para todos os alunos da escola (de forma a comear
Estatstica no Ensino Bsico e Secundrio

73

Materiais e sugestes metodolgicas


a transmitir a ideia de amostra como representativa da populao, explorando situaes de
enviesamento).

4.2.2 Proposta 2 Classificaes obtidas num teste de Matemtica


Esta proposta (presente no anexo A.2) destina-se aos alunos do 2.o ciclo e tem como objetivos:
compreender e determinar a mdia aritmtica de um conjunto de dados;
compreender e determinar os extremos e a amplitude de um conjunto de dados;
construir e interpretar diagramas de caule e folhas.
Os alunos j devero ter construdo diagramas de caule e folhas com papel e lpis e j devem
ter os conceitos de mdia, extremos e amplitude. Com esta tarefa pretende-se que o aluno
explore estes conceitos, nomeadamente, compreenda como pequenas alteraes nos dados
influencia ou no a mdia, a moda e a amplitude. Por outro lado, ao trabalharem com dados quantitativos com estas caractersticas, devemos questionar relativamente ao grfico mais
adequado, de entre aqueles que os alunos conhecem, permitindo que desenvolvam o esprito
crtico. Uma vez que os alunos tambm j aprenderam a construir tabelas de frequncias, poder perguntar-se qual a tabela mais adequada para resumir estes dados. O diagrama de caule
e folhas pode sugerir classes para organizar os dados numa tabela. Refira-se tambm a importncia das alneas que permitem estabelecer conexes com o tema Nmeros e operaes.
Dependendo das caractersticas dos alunos, o professor poder ir mais alm perguntando, por
exemplo, quais seriam as alteraes na mdia, moda, extremos e amplitude se os alunos no
prximo teste subissem todos 2 valores relativamente ao anterior. Os alunos devem estabelecer as suas conjeturas e verific-las usando novamente a folha de clculo.

4.2.3 Proposta 3 Meio de transporte utilizado para chegar escola


Esta proposta (presente no anexo A.3) destina-se aos alunos do 2.o ciclo e tem como objetivos:
construir e interpretar tabelas de frequncias absolutas e relativas;
construir e interpretar um grfico circular.
74

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas


Nesta proposta de trabalho os alunos iro construir um grfico circular, utilizando as potencialidades do GeoGebra. A realizao desta atividade vai permitir estabelecer conexes entre os
temas Tratamento de Dados e Geometria. O aluno j deve ter construdo um grfico circular
usando papel e lpis e deve agora recordar como se determinam as amplitudes dos setores
que compem o grfico. Primeiro, os alunos constroem o grfico circular referente aos dados
fornecidos pelo professor numa tabela, mas depois devero recolher os dados na turma e fazer
o respetivo grfico. Caso os alunos ainda no tenham trabalhado com o GeoGebra em geometria, o professor dever comear por explicar-lhes os cones da barra de ferramentas que sero
utilizados.

4.2.4 Proposta 4 Classificaes internas versus classificaes externas


na disciplina de Matemtica
Esta proposta (presente no anexo A.4) destina-se aos alunos do 3.o ciclo e do 10.o ano e tem
como objetivos:
escolher as medidas de localizao mais adequadas para resumir a informao contida
nos dados;
compreender e determinar a mediana, os quartis e a amplitude interquartis de um conjunto de dados;
utilizar as medidas de localizao na interpretao de um conjunto de dados;
comparar distribuies e tirar concluses.
Os alunos devem conhecer os quartis, a amplitude interquartis e tambm j devem ter construdo com papel e lpis um diagrama de extremos e quartis. Pretende-se rentabilizar as potencialidades do GeoGebra ao nvel da folha de clculo, na determinao dos quartis e na
construo de diagramas de extremos e quartis, evitando assim clculos repetitivos e rotineiros. Os conjuntos de dados apresentados tm a mesma mediana, logo esta medida no ser a
mais indicada para comparar estas distribuies uma vez que no evidencia as diferenas. O
aluno usar as medidas de disperso (amplitude e amplitude interquartis) assim como a observao dos diagramas para estabelecer uma comparao das distribuies. Salienta-se o facto
deste tipo de questes permitir o desenvolvimento da comunicao matemtica. No caso da
Estatstica no Ensino Bsico e Secundrio

75

Materiais e sugestes metodolgicas


proposta ser desenvolvida por alunos do 10.o ano poder ser solicitado o clculo do desvio
padro. De modo a facilitar a realizao da tarefa, o professor poder fornecer os dados aos
alunos num ficheiro.

4.2.5 Proposta 5 Salrios dos trabalhadores de uma empresa


Esta proposta (presente no anexo A.5) destina-se aos alunos do 3.o ciclo e do 10.o ano e tem
como objetivos:
compreender e determinar a mdia de um conjunto de dados e indicar a adequao da
sua utilizao num dado contexto;
escolher as medidas de localizao mais adequadas para resumir a informao contida
nos dados.
Nesta proposta abordam-se as trs medidas de tendncia central, suas vantagens e desvantagens. Refira-se que a moda e a mediana dos salrios so iguais. A razo que nos levou a
elaborar muitas questes volta do conceito da mdia deve-se ao facto de esta medida ser
a mais utilizada e ser importante proporcionar momentos que levem os alunos a entender de
que forma esta medida influenciada pelos valores muito elevados ou muito baixos, ou simplesmente por um valor qualquer. Os alunos devero compreender que a escolha de uma das
medidas de tendncia central para representar os dados depende do contexto. De modo a facilitar a tarefa o professor poder fornecer aos alunos um ficheiro com os 72 dados. Caso isso
no acontea o professor deve alertar os alunos para a necessidade de fazer uma cpia dos
dados originais (copiar, por exemplo, para a lista B) uma vez que na ltima questo o aluno
dever recorrer lista inicial e no quela que j foi alterada na questo 7. De modo a facilitar
a realizao da tarefa, o professor poder fornecer os dados aos alunos num ficheiro. Algumas
questes desta proposta foram inspiradas em Zawojewski (1992).

4.2.6 Proposta 6 Comparao de duas turmas


Esta proposta (presente no anexo A.6) destina-se aos alunos do 10.o ano e tem como objetivo:
compreender e determinar o desvio padro de um conjunto de dados.
76

Estatstica no Ensino Bsico e Secundrio

Materiais e sugestes metodolgicas


Os alunos j devem conhecer o conceito de desvio padro. Nesta proposta pretende-se comparar duas turmas que apresentam a mesma mdia nas classificaes a Matemtica. Pretende-se
que, inicialmente, os alunos calculem a mdia sem recorrer ao GeoGebra uma vez que os
clculos so muito simples, no entanto, depois de introduzirem os dados na folha de clculo,
podero proceder confirmao. Os alunos devero compreender que as distribuies so
muito diferentes por apresentarem variabilidades diferentes relativamente mdia. O clculo
do desvio padro, uma das medidas de disperso mais utilizada, vem confirmar as diferenas.
Algumas questes desta proposta foram inspiradas em Zawojewski (1992)

4.2.7 Proposta 7 Peso e altura dos alunos de uma turma do 10.o ano
Esta proposta (presente no anexo A.7) destina-se aos alunos do 10.o ano e tem como objetivos:
construir diagramas de disperso;
interpretar a reta de regresso e conhecer as suas limitaes;
distinguir a regresso de x em ordem a y da regresso de y em ordem a x.
Esta proposta prev a recolha de dados na turma. Por vezes os alunos no gostam que o seu
peso seja conhecido. Caso o professor entenda poder levar os dados e ultrapassar essa situao. Chama-se especial ateno para o facto da maioria dos manuais escolares no explorar
a representao das duas retas de regresso (a reta de regresso de y em funo de x e a reta
de regresso de x em funo de y). Pretende-se que os alunos compreendam que so distintas, podendo ser feitas algumas experincias que consistem em alterar um ou mais pontos da
lista e verificar as alteraes nas retas e no coeficiente de correlao. habitual, em alguns
manuais, pedir-se estimativas de y em relao a x e de x em relao a y, usando a mesma
reta. Os alunos devero compreender que tal situao incorreta pois as retas so distintas.
Para o confirmarem bastar definir um ponto A [de coordenadas (x0 , 0)] no eixo das abcissas,
os segmentos de reta paralelos ao eixo das ordenadas que liguem o ponto A a cada uma das
retas estimadas definem os pontos P1 e P2 das retas com abcissa x0 . As ordenadas dos pontos
P1 e P2 correspondem s estimativas obtidas com cada uma das retas. Esta situao pode ser
explorada usando as alneas 8 e 9 da proposta.

Estatstica no Ensino Bsico e Secundrio

77

Captulo 5
Concluso
Atualmente fundamental que o cidado comum tenha a capacidade de compreender a informao estatstica que lhe chega diariamente de vrias formas. Os currculos tm-se alterado
no sentido de desenvolver nos alunos esta competncia. Assim, desde o reajustamento do Programa de Matemtica para o ensino bsico, o tema matemtico Organizao e Tratamento
de Dados percorre todo o ensino bsico, desde o 1.o ciclo at ao 3.o ciclo e para cada ciclo
foi definido um propsito principal de ensino que se assume como a orientao mais importante para o ensino deste tema. No caso particular do terceiro ciclo pode ler-se Desenvolver
nos alunos a capacidade de compreender e de produzir informao estatstica bem como de a
utilizar para resolver problemas e tomar decises informadas (...). (Ponte et al., 2007, p. 59).
Acrescente-se ainda que os tpicos estudados at ao 3.o ciclo so posteriormente desenvolvidos no 10.o ano no tema Estatstica, lecionado no terceiro perodo.
Dada a importncia desta rea no ensino, ao realizarmos este trabalho, consideramos til
a elaborao de um texto, direcionado aos professores, que aposta no rigor e apresenta os
conceitos fundamentais de Estatstica lecionados nestes ciclos de ensino; salientamos algumas
incorrees detetadas nos materiais disponveis para o ensino da Estatstica; apresentamos
uma seco onde se aprofunda a regresso linear, pois encontramos um erro comum neste
tema e, por fim, criamos propostas de trabalho para a sala de aula com recurso tecnologia,
permitindo a explorao dos conceitos de uma forma prtica, evitando deste modo que a
estatstica seja reduzida repetncia de clculos fastidiosos desprovidos de significado (cf.
Carvalho (2006)).
Sabendo que o nmero de recursos disponveis para o ensino da Estatstica que incluam
79

Concluso
a utilizao do GeoGebra escasso, situao que se confirmou aquando da anlise de um
conjunto de materiais disponveis, este projeto pretende ser um contributo importante para
o trabalho dos professores no ensino desta rea da matemtica, uma vez que nele se mostra
como operacionalizar as orientaes atuais e como implementar tarefas seguindo essas orientaes. Sabendo que a tecnologia crucial no tratamento de dados, recorremos ao GeoGebra um software inovador no ensino e aprendizagem da Estatstica que pode ser uma alternativa a
outros softwares/instrumentos, por ser gratuito e dinmico. Ao apresentarmos um conjunto de
propostas de trabalho tivemos a preocupao de incluir os objetivos e escrever alguns comentrios de modo a facilitar a sua aplicao na sala de aula. Refira-se que a maioria das propostas
explora o facto deste software ser dinmico, permitindo ao aluno alterar os dados escritos na
folha de clculo e verificar rapidamente os efeitos dessas alteraes quer nos grficos quer nas
medidas estatsticas. Como refere Zawojewski A folha de clculo recalcula todos os dados
de uma s vez e indica os resultados imediatamente. Assim, o professor pode concentrar-se
no efeito de introduzir certas alteraes que, de outro modo, poderiam perder-se no pntano
dos clculos individuais (Zawojewski, 1992, p. 33).
Uma vez que este tema apresentado nos manuais com algumas imprecises, torna-se
necessrio que investigadores e professores se debrucem sobre estas questes, desenvolvendo
um trabalho cada vez mais rigoroso ao nvel do ensino da Estatstica de modo a formar cidados cada vez mais ativos, interventivos e crticos.
Deste modo, espera-se que o presente trabalho possa dar um pequeno contributo para o
incremento da qualidade do ensino da Estatstica.

80

Estatstica no Ensino Bsico e Secundrio

Referncias Bibliogrficas

APM (1998). Matemtica 2001: Diagnstico e recomendaes para o ensino e aprendizagem da Matemtica. Lisboa: APM.
BATANERO , C. & G ODINO , J.D. (2003). Estocstica y su Didctica para Maestros,
Departamento de Didctica de la Matemtica, Facultad de Ciencias de la Educacin, Universidad de Granada (disponvel em http://www.ugr.es/~jgodino/
edumat-maestros).
B RANCO , J. & M ARTINS , M. (2002). Literacia Estatstica, Educao e Matemtica, n.o 69,
pp. 913.
B ROWN, P.J. (1993). Measurement, Regression, and Calibration, Oxford University Press.
C ARVALHO , C. (2006). Desafios educao estatstica, em Ensino e Aprendizagem da
Estatstica, Boletim da SPE, Outono, pp. 78.
C OSTA , B. & RODRIGUES , E. (2010a). Novo Espao-Parte 2 Matemtica A 10.o Ano, Porto
Editora, Porto.
C OSTA , B. & RODRIGUES , E. (2010b). Novo Espao-Parte 2 Matemtica 7.o Ano, Porto
Editora, Porto.
D UARTE , T.O. & F ILIPE , J.P. (2010). Matemtica Dez -Parte 2, Lisboa Editora, Lisboa.
FARIA , L.; G UERREIRO , L. & A LMEIDA , P.R. (2010). Matemtica Dinmica- Matemtica 7.o Ano Parte 2, Porto Editora, Porto.
F ERNANDES , J.A. (2009). Ensino e aprendizagem da estatstica - Realidades e Desafios,
Actas do XIX EIEM, Vila Real.
INE, I.P. (2009). Um mundo para conhecer os nmeros, INE-DREN-ESTP, Lisboa.
81

Referncias Bibliogrficas
J ORGE , A.M.B.; A LVES , C.B.; F ONSECA , C.C.G.; BARBEDO , J. & S IMES , M. (2010).
Matemtica A 10- Parte 3, Areal Editores, Lisboa.
L OURA , L. (2009). Organizao e Tratamento de Dados no Novo Programa de Matemtica
do Ensino Bsico, Educao e Matemtica, n.o 105, pp. 4649.
L OUREIRO , C.; O LIVEIRA , F. & B RUNHEIRA , L. EDS . (2000). Ensino e Aprendizagem da
Estatstica, SPE, APM e DEIOFCUL, Lisboa.
M AGRO , F.C.; F IDALGO , F. & L OUANO , P. (2010). 7 - Matemtica 7.o ano, ASA,
Lisboa.
M ARTINHO , M.H. & V ISEU , F. (2009). Desenvolvimento da literacia estatstica em dois
manuais escolares do 7.o ano de escolaridade, Actas do XIX EIEM, Vila Real.
M ARTINS , A., R IBEIRO , H. & S ANTOS , R. (2011). Estatstica no ensino secundrio um contributo para a clarificao do estudo da regresso linear simples, SPE 2011 Programa e Resumos, pp. 283-284.
M ARTINS , M.E.G.; M ONTEIRO , C.; V IANA , J.P. & T URKMAN , M.A.A. (1997). Estatstica, ME-DES, Lisboa.
M ARTINS , M.E.G. & C ERVEIRA , A. (1999). Introduo s Probabilidades e Estatstica,
Universidade Aberta.
M ARTINS , M.E.G. (2005). Introduo Probabilidade e Estatstica, Sociedade Portuguesa de Estatstica, Lisboa.
M ARTINS , M.E.G.; L OURA , L. & M ENDES , M. (2007). Anlise de Dados - texto de apoio
para os Professores do 1.o ciclo, ME-DGIDC, Lisboa.
M ARTINS , M.E.G & P ONTE , J. (2010). Organizao e Tratamento de Dados, MEDGIDC, Lisboa.
M ONTGOMERY, D.C., P ECK , E.A. & V INING , G.G. (2006). Introduction to Linear Regression Analysis, 4th Ed., Wiley Series in Probability and Statistics, John Wiley &
Sons.
M URTEIRA , B. (1993). Anlise exploratria de dados - Estatstica Descritiva, McGrawHill, Lisboa.
NASCIMENTO , M. (2009). Literacia Estatstica na Escola, Cidadania na Vida, Actas do II
Encontro de Probabilidades e Estatstica na Escola, Universidade do Minho, pp. 91
99.
82

Estatstica no Ensino Bsico e Secundrio

Referncias Bibliogrficas
N EGRA , C. & M ARTINHO , E. (2010). Matemtica A-10.o ano Volume 2, Santillana, Carnaxide.
NCTM (2008). Princpios e Normas para a Matemtica Escolar, 2.a ed., NCTM e APM,
Lisboa.
N EVES , M.A.F.; G UERREIRO , L.; L EITE , A. & S ILVA , J.N. (2010a). Matemtica A 10.o
Ano - Estatstica, Porto Editora, Porto.
N EVES , M.A.F.; FARIA , L. & S ILVA , J.N. (2010b). Matemtica 5.o Ano - Parte 3, Porto
Editora, Porto.
N EVES , M.A.F.; S ILVA , A. P.; R APOSO , M.J. & S ILVA , J.N. (2011). Matemtica 8.o
Ano - Parte 2, Porto Editora, Porto.
O SBORNE , C.(1991). Statistical Calibration: A Review, International Statistical Review 59,
n.o 3, pp. 309336.
PASSOS , I.C. & C ORREIA , O.F. (2010). Matemtica em aco 7 -Parte 2, Lisboa Editora,
Lisboa.
P ESTANA , D. D. & V ELOSA , S. F. (2009). Introduo Probabilidade e Estatstica, Vol.
1, 3.a ed., Fundao Calouste Gulbenkian, Lisboa.
P ONTE , J.P.; S ERRAZINA , L.; G UIMARES , H. M.; B RENDA , A.; G UIMARES , F.;
S OUSA , H.; M ENEZES , L.; M ARTINS , M.E. G. & O LIVEIRA , P. A. (2007). Programa de Matemtica do Ensino Bsico, ME-DGIDC, Lisboa.
R EIS , E. (1998). Estatstica Descritiva, Edies Slabo, Lisboa.
S ILVA , J.C.; F ONSECA , M.G.; M ARTINS , A.A.; F ONSECA , C.M.C. & L OPES , I.M.C.
(2001). Programa de Matemtica A - Ensino Secundrio, ME-DES, Lisboa.
Z AWOJEWSKI , J.S.; B ROOKS ,G.; D INKELKAMP, L.; G OLDBERG ,E.D.; G OLDBERG , H.;
H YDE , A.; JACKSON , T.; L ANDAU , M.; M ARTIN , H.; N OWAKOWSKI , J.; PAULL ,
S.; S HULTE , A.P.; WAGREICH , P. & W ILMOT, B. (1992). Dealing with data and
chance, The National Council of Teachers of Mathematics, Inc., Virginia (Traduo de
Snia Figueirinhas, Lidar com dados e probabilidades - Normas para o Currculo e a
Avaliao em Matemtica Escolar, Coleco de Adendas, Anos de Escolaridade 5-8,
APM).

Estatstica no Ensino Bsico e Secundrio

83

Referncias Bibliogrficas
Pginas da Internet
ALEA www.alea.pt

84

Estatstica no Ensino Bsico e Secundrio

Apndice A
Propostas de trabalho para a sala de aula

Propostas de trabalho para a sala de aula

A.1 PROPOSTA 1 Quantas pessoas vivem em minha


casa?
Para resolver esta atividade necessrio, em primeiro lugar, que cada aluno da turma responda questo: Contando contigo, quantas pessoas vivem em tua casa? Aps o registo dos
resultados no quadro, ficando visveis para todos, realiza as seguintes tarefas.
1. Na janela principal do Geogebra comea por selecionar na barra de ferramentas Exibir
e de seguida escolhe Folha de Clculo.
2. Na coluna A introduz o nmero de pessoas que vive em casa de cada aluno.
3. De seguida, seleciona todos os elementos da lista e utiliza o boto do lado direito do
rato para selecionar Criar lista. A lista obtida aparece na folha algbrica (lado esquerdo)
designada por lista1.
4. Constri uma tabela de frequncias absolutas introduzindo na entrada o comando Tabela
Frequncias[lista1].
5. Indica a moda deste conjunto de dados.
6. Com base na tabela formula duas questes. Pede ao teu colega para responder a essas
questes.
7. Constri um grfico de pontos introduzindo na entrada o comando GrficoPontos[lista1].
8. Constri agora um diagrama de barras para o mesmo conjunto de dados, usando o comando DiagramaBarras[lista1,0.5], sendo 0.5 a largura das barras.
9. Que semelhanas encontras entre as duas representaes grficas? E que diferenas?

II

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula

A.2 PROPOSTA 2 Classificaes obtidas num teste de


Matemtica
1. Comea por selecionar na barra de ferramentas Exibir e de seguida escolhe Folha de
Clculo.
2. Na coluna A introduz as notas obtidas num teste, na escala de 1 a 100, pelos alunos de
uma turma do 6.o ano, na disciplina de Matemtica.
90

50 48

44

92 41

68

82

53 62

38

81 62

43

73

44 63

88

53 73

64

42

70 75

49

59 52

53

Tabela A.1: Classificaes obtidas num teste

3. De seguida, seleciona todos os elementos da lista e utiliza o boto do lado direito do


rato para selecionar Criar lista. A lista obtida aparece na folha algbrica (lado esquerdo)
designada por lista1.
4. Altera o nome desta lista para notas procedendo do seguinte modo: com o cursor
colocado em lista1, basta utilizar o boto do lado direito do rato, clicar em propriedades
dos objetos e escrever o nome que se pretende na janela nome, neste caso notas.
5. Elabora um diagrama de caule e folhas. Para o obteres usa o comando DiagramaCauleFolhas[notas].
(a) Qual a nota mais alta? E a mais baixa? Como designas estes valores?
(b) Qual o valor da amplitude?
(c) Qual a nota mais frequente? Como designas este valor?
6. Determina a mdia das notas dos testes atravs do comando Mdia[notas].
7. Determina a percentagem de negativas. D a resposta arredondada s dcimas.
Estatstica no Ensino Bsico e Secundrio

III

Propostas de trabalho para a sala de aula


8. Sabendo que um aluno obtm a classificao qualitativa de Bom quando a sua nota
superior ou igual a 70 e inferior a 90, determina a percentagem de alunos que obtiveram
Bom neste teste.
9. Supe que, por lapso, o professor registou a nota da Ana (aluna desta turma) incorretamente. A nota real da Ana foi 84 e o professor escreveu 48. Responde s seguintes
questes, apresentando as justificaes necessrias.
(a) A amplitude mantm-se? Porqu?
(b) E a moda? Porqu?
(c) A mdia aumentou ou diminuiu? Calcula novamente a mdia alterando a lista dos
dados.
(d) Representa novamente o diagrama de caule e folhas.

IV

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula

A.3 PROPOSTA 3 Meio de transporte utilizado para chegar escola


Perguntou-se a 40 alunos de uma escola qual o meio de transporte mais utilizado para irem
para a escola. As respostas encontram-se na seguinte tabela:
Meio de

Frequncia

transporte

absoluta

mais utilizado
A p

17

Autocarro

12

Carro

Bicicleta

Total

40

Tabela A.2: Meio de transporte mais utilizado pelos alunos

1. Determina a frequncia relativa de cada meio de transporte.


2. Comenta a afirmao 92,5% dos alunos no selecionaram a bicicleta como meio de
transporte mais utilizado para ir para a escola.
3. Constri um grfico circular com recurso ao GeoGebra, seguindo os seguintes passos:
(a) Calcula a amplitude de cada um dos setores. Apresenta os clculos.
(b) Na janela grfica marca dois pontos A e B. Desenha a circunferncia de centro em
A e que passa em B.
(c) Traa o segmento de reta [AB].
(d) Usando o icon ngulo com uma dada amplitude, seleciona o ponto B, o vrtice do
ngulo e de seguida escreve a amplitude do ngulo referente ao setor a p. Une o
ponto obtido com o centro da circunferncia.
(e) Repete o mesmo procedimento para os restantes meios de transporte.
(f) Usa o icon ABC e seleciona inserir texto. Deste modo podes escrever em cada
setor o meio de transporte assim como a percentagem que lhe corresponde.
Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula


(g) Se pretendes colorir de forma distinta os diferentes meios de transporte utiliza
o comando Sector Circular(Centro, Dois pontos) para colorir cada um. Para
selecionar a cor que pretendes, coloca o cursor num setor e clica com o boto do
lado direito do rato. Depois seleciona Propriedades dos objetos e Cor.

VI

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula

A.4 PROPOSTA 4 Classificaes internas versus classificaes externas na disciplina de Matemtica


1. Considera as classificaes internas e as classificaes externas, ambas numa escala de
0 a 20, obtidas por 27 alunos do 12.o ano, na disciplina de Matemtica.
2. Comea por selecionar na barra de ferramentas Exibir e de seguida escolhe Folha de
Clculo.
3. Na coluna A da folha de clculo introduz as classificaes internas e na coluna B introduz as classificaes externas.
4. De seguida, seleciona a lista dos resultados da avaliao interna e utiliza o boto do
lado direito do rato para selecionar Criar lista. A lista obtida aparece na folha algbrica
(lado esquerdo) designada por lista1.
5. Altera o nome desta lista para interna procedendo do seguinte modo: com o cursor
colocado em lista1, basta utilizar o boto do lado direito do rato, clicar em propriedades
dos objetos e escrever o nome que se pretende na janela nome, neste caso interna.
6. Determina a mdia, a moda e a mediana.

Usa os comandos Mdia[interna],

Moda[interna] e Mediana[interna].
7. Determina a amplitude, o 1.o quartil, o 3.o quartil e a amplitude interquartis. Usa os
comandos Q1[interna] e Q3[interna].
8. Procede de modo idntico para os resultados da avaliao externa, criando uma lista que
podes designar por externa.
9. Compara as medidas de tendncia central obtidas nas duas variveis. O que podes
concluir?
10. Compara a amplitude e a amplitude interquartis obtidas. O que podes concluir?
11. Obtm, agora, os dois diagramas de extremos e quartis procedendo do seguinte modo:
seleciona as duas listas inseridas na folha de clculo e clica no icon da barra de ferramentas que apresenta um grfico e escolhe anlise multivariada. Para alm dos
Estatstica no Ensino Bsico e Secundrio

VII

Propostas de trabalho para a sala de aula

Aluno

Avaliao Avaliao
interna

externa

10

11

11

10

11

10

13

12

13

13

16

15

15

15

17

16

10

10

11

11

11

13

12

14

13

13

11

11

14

10

11

15

12

12

16

15

12

17

11

11

18

11

10

19

16

15

20

15

13

21

12

10

22

10

23

19

18

24

10

11

25

11

10

26

14

14

27

12

13

Tabela A.3: Classificaes internas versus classificaes externas

VIII

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula


diagramas de extremos e quartis tambm surge uma tabela com as medidas estatsticas
referentes aos dois conjuntos de dados.
12. Faz um comentrio aos diagramas obtidos fazendo referncia concentrao/disperso
das classificaes.

Estatstica no Ensino Bsico e Secundrio

IX

Propostas de trabalho para a sala de aula

A.5 PROPOSTA 5 Salrios dos trabalhadores de uma empresa


Na tabela A.4 encontram-se os salrios (em euros) dos trabalhadores de uma empresa.
Tipo

Nmero

Salrio

de emprego

de trabalhadores

(em euros)

Presidente

12000

Vice-presidente

6000

Gerente

2800

Supervisor

1100

Operrio

33

900

Funcionrio de Caixa

750

Tesoureiro

700

Vendedor

12

600

Guarda

500

Tabela A.4: Salrios dos trabalhadores de uma empresa

1. Comea por selecionar na barra de ferramentas Exibir e de seguida escolhe Folha de


Clculo.
2. Insere todos os ordenados na coluna A da folha de clculo.
3. De seguida, seleciona a lista dos ordenados e utiliza o boto do lado direito do rato
para selecionar Criar lista. A lista obtida aparece na folha algbrica (lado esquerdo)
designada por lista1.
4. Altera o nome desta lista para salario procedendo do seguinte modo: com o cursor
colocado em lista1, basta utilizar o boto do lado direito do rato, clicar em propriedades
dos objetos e escrever o nome que se pretende na janela nome, neste caso salario.
5. Calcula o ordenado mdio, usando o comando Mdia[salario]. Achas que este valor
representativo dos ordenados de todos os trabalhadores? Justifica.
X

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula


6. Determina a moda e a mediana dos ordenados. Usa os comandos Moda[salario] e Mediana[salario]. Qual das trs medidas representa melhor os ordenados dos trabalhadores?
Justifica.
7. Em qual das trs medidas de tendncia central se deve basear um trabalhador desta
empresa para pedir aumento de salrio? Justifica.
8. Se aumentarmos para 900 euros os ordenados dos 24 trabalhadores que ganham menos
que este valor, quais so os novos valores da mdia, moda e mediana? Altera os valores
na lista e compara as 3 medidas obtidas (as medidas surgem na janela algbrica) com as
j calculadas.
9. Quais foram as medidas de tendncia central que se mantiveram? E as que se alteraram?
Porqu?
10. Se alterasses apenas um dos 72 salrios, qual era a medida de tendncia central que se
alterava de certeza? Porqu?
11. E qual ou quais eram as que garantidamente se manteriam? Porqu?
12. Foram contratados dois novos empregados pela empresa: um gerente de fbrica e um
supervisor. Prev se a mdia de salrios vai aumentar, baixar, ou ficar na mesma. Explica a tua previso. Verifica a tua conjetura recorrendo folha de clculo.

Estatstica no Ensino Bsico e Secundrio

XI

Propostas de trabalho para a sala de aula

A.6 PROPOSTA 6 Comparao de duas turmas


1. A tabela A.5 apresenta as notas, na escala de 1 a 5, de duas turmas do 7.o ano no final
do 1.o perodo
Nveis Turma A Turma B
a Mat.
1

20

Tabela A.5: Classificaes de Matemtica das turmas A e B do 7.o ano

(a) Calcula a mdia para cada turma.


(b) Se fosses aluno do 7.o ano, a que turma gostarias de pertencer? Porqu?
(c) Comea por selecionar na barra de ferramentas Exibir e de seguida escolhe Folha
de Clculo.
(d) Insere todas as classificaes da turma A na coluna A da folha de clculo.
(e) De seguida, seleciona a lista das classificaes e utiliza o boto do lado direito do
rato para selecionar Criar lista. A lista obtida aparece na folha algbrica (lado
esquerdo) designada por lista1.
(f) Altera o nome desta lista para turmaA procedendo do seguinte modo: com o
cursor colocado em lista1, basta utilizar o boto do lado direito do rato, clicar em
propriedades dos objetos e escrever o nome que se pretende atribuir lista 1 ,
neste caso turmaA.
(g) Repete este procedimento para as classificaes da turma B e designa a lista por
turmaB.
(h) Confirma os clculos efetuados na determinao da mdia de cada turma, utilizando os comandos Mdia[turmaA] e Mdia[turmaB].
XII

Estatstica no Ensino Bsico e Secundrio

Propostas de trabalho para a sala de aula


(i) Um aluno calculou o desvio padro dos nveis a Matemtica da turma B e obteve
-0,2. O que podes concluir?
(j) Calcula o desvio padro para cada um dos conjuntos de dados.

Usa o co-

mando DesvioPadroAmostra[turmaA] e DesvioPadroAmostra[turmaB], respetivamente.


(k) Qual das turmas te parece mais homognea nesta disciplina? Porqu?
2. Encontra um conjunto de 10 nmeros com mdia 20 e desvio padro cerca de 5. Confirma com a folha de clculo do GeoGebra.
3. Encontra um conjunto de 10 nmeros com mdia 20 e desvio padro cerca de 10. Confirma com a folha de clculo do GeoGebra.

Estatstica no Ensino Bsico e Secundrio

XIII

Propostas de trabalho para a sala de aula

A.7 PROPOSTA 7 Peso e altura dos alunos de uma turma


do 10.o ano
Para resolver esta atividade o professor deve solicitar, antecipadamente, uma lista com os
pesos e as alturas dos alunos.
1. Comea por exibir a folha de clculo e utilizar as duas primeiras colunas (A e B) para
registar os pesos e as alturas dos alunos, respetivamente. Ficam assim conhecidas as
coordenadas dos pontos a utilizar para a regresso linear.
2. Com os pontos definidos, cria uma lista de pontos (bastar selecionar as coordenadas e,
utilizando o boto do lado direito do rato, selecionar Criar lista de pontos, pois, neste
caso, cada ponto ter duas coordenadas). Obtm-se assim a lista1.
3. Determina o coeficiente de correlao, atravs do comando CoeficienteDeCorrelao[lista1];
4. Obtm a reta de regresso da altura em funo do peso recorrendo ao comando RegressoLinear[lista1]
5. No mesmo grfico, representa a reta de regresso do peso em funo da altura utilizando
o comando RegressoLinearX[lista1].
6. As retas obtidas so iguais? Podes represent-las por cores diferentes de forma a poderes distingui-las facilmente.
7. Altera um ou mais pontos da lista1 e verifica a alterao quer no coeficiente de correlao quer nas retas.
8. Considera que o Manuel s preencheu o peso (63,450kg). Qual valor mais provvel
para a sua altura?
9. Considera que o Joo s preencheu a altura (1,68 m). Qual valor mais provvel para
o seu peso?

XIV

Estatstica no Ensino Bsico e Secundrio

Você também pode gostar