Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATSTICA
NO ENSINO BSICO E SECUNDRIO
Projeto
Mestrado em Educao e Tecnologia em Matemtica
ESTATSTICA
NO ENSINO BSICO E SECUNDRIO
Agradecimentos
Ao meu marido e s minhas filhas, pela compreenso que tiveram comigo e pela fora que me
transmitiram ao longo desta caminhada.
Aos meus pais, pelo apoio dado, estando presentes sempre que foi necessrio.
Aos meus orientadores, Doutora Helena Ribeiro e Doutor Rui Santos, pelo tempo dispensado, pelas sugestes feitas e todo o apoio prestado, que possibilitaram a realizao deste
trabalho.
Aos meus colegas de mestrado, pela ajuda e fora dadas, mesmo quando a vontade de
continuar escasseava.
minha amiga Teresa, pelo estmulo dado ao longo deste percurso.
Aos meus colegas de trabalho, que direta ou indiretamente contriburam com as suas palavras de encorajamento.
A todos os meus sinceros agradecimentos.
Resumo
R ESUMO
A sociedade da informao exige que todos os cidados tenham conhecimentos de Estatstica para poderem intervir de forma crtica e fundamentada. Esta situao conduziu a
Estatstica a um lugar de relevo no currculo dos alunos, que exige um novo olhar sobre o seu
ensino, como preconizam os atuais programas.
neste contexto que surge o presente trabalho que, numa primeira parte, apresenta uma
reviso dos conceitos estatsticos lecionados no ensino bsico e secundrio, uma ferramenta
importante para o trabalho dos professores, permitindo-lhes uma clarificao desses conceitos,
num texto que se pretende cientificamente rigoroso.
De forma a alertar para incorrees, gralhas e/ou erros comuns, segue-se uma anlise
crtica a alguns materiais disponveis, nomeadamente manuais escolares atuais, onde o estudo
da regresso linear assume uma anlise mais detalhada.
Com o intuito de enriquecer os materiais existentes, numa perspetiva inovadora, capaz
de promover aprendizagens significativas, apresenta-se um conjunto de propostas de trabalho
para a sala de aula onde a tecnologia, nomeadamente o GeoGebra, adquire um papel de relevo
na compreenso dos conceitos. De forma a facilitar a utilizao deste software surge, no
incio da terceira etapa deste trabalho, uma explicao detalhada sobre o uso do GeoGebra na
estatstica descritiva.
Em suma, este trabalho pretende contribuir para a melhoria do ensino da Estatstica, quer
no que se refere preparao do corpo docente, quer atravs da incluso de propostas de
trabalho para utilizao em sala de aula.
Palavras chave: ensino de estatstica, estatstica descritiva, GeoGebra, regresso linear.
iii
Abstract
A BSTRACT
The media industry requires that all citizens have a knowledge of Statistics in order to
play a critical and fundamented role in society. This situation has led Statistics to a prominent
place in the curriculum of students and demands a new look to education, as recommended
by current programs.
It is in this context that the present work has been elaborated. The first part presents a
review of statistical concepts taught at an elementary and secondary level, an important tool
for teachers work, and allows the clarification of these concepts in a text intended to be
scientifically rigorous.
In order to draw ones attention to mistakes, typos and/or common errors, the first part is
followed by a critical analysis of some available materials, which includes current textbooks
and where the study of linear regression assumes a more detailed analysis.
Having as main target the improval of the existing materials, with an innovative approach,
which can foster meaningful learning, a set of suggested tasks are presented to the classroom.
In this space, technology, namely GeoGebra, assumes a relevant role in the understanding of
concepts. In order to make the use of this software easier, a detailed explanation of GeoGebra
in descriptive statistics comes in the begining of the third stage of this work.
In summary, this paper aims to contribute to the improvement of Statistic teaching,
whether it concerns the preparation of mathematics teachers or by the inclusion of tasks applied in the classrooms context.
Keywords: Statistic teaching, descriptive statistics, GeoGebra, linear regression.
Contedo
Agradecimentos
Resumo
iii
Abstract
Lista de Figuras
ix
Lista de Tabelas
xi
1 Introduo
2 Conceitos de Estatstica
2.1
Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2
Dados estatsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.3
Tabelas de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.3.1
15
2.3.2
16
2.3.3
18
Representaes Grficas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.4.1
Pictograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
2.4.2
Grfico de pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
2.4.3
Grfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.4
vii
Contedo
2.5
2.6
2.7
2.8
2.9
viii
2.4.4
Grfico circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.4.5
24
2.4.6
24
2.4.7
26
27
2.5.1
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.5.2
Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.5.3
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.5.4
32
34
2.6.1
Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.6.2
37
2.6.3
Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.7.1
Amplitude total . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.7.2
Amplitude interquartis . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.7.3
40
Distribuies bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.8.1
Diagrama de disperso . . . . . . . . . . . . . . . . . . . . . . . . .
44
2.8.2
Coeficiente de correlao . . . . . . . . . . . . . . . . . . . . . . . .
45
47
2.9.1
48
2.9.2
49
2.9.3
51
2.9.4
Estimao de y condicionada a x = x0 . . . . . . . . . . . . . . . . .
53
Contedo
3 Anlise crtica aos materiais disponveis
55
3.1
55
3.2
57
3.3
58
3.4
58
3.5
60
3.6
60
4.2
63
63
4.1.1
64
4.1.2
65
4.1.3
Representaes grficas . . . . . . . . . . . . . . . . . . . . . . . .
66
4.1.4
69
4.1.5
Regresso linear . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
72
4.2.1
73
4.2.2
74
4.2.3
74
4.2.4
75
4.2.5
76
4.2.6
76
4.2.7
77
5 Concluso
79
Referncias Bibliogrficas
81
ix
Contedo
A Propostas de trabalho para a sala de aula
II
III
A.4 PROPOSTA 4 Classificaes internas versus classificaes externas na disciplina de Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII
A.5 PROPOSTA 5 Salrios dos trabalhadores de uma empresa . . . . . . . . .
Lista de Figuras
2.1
21
2.2
22
2.3
23
2.4
23
2.5
24
2.6
25
2.7
25
2.8
26
2.9
27
34
34
35
36
37
46
48
52
53
3.1
56
Erros de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xi
Lista de Figuras
xii
3.2
56
3.3
57
4.1
64
4.2
65
4.3
66
4.4
66
4.5
70
4.6
70
4.7
71
Lista de Tabelas
2.1
13
2.2
Tabela de frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.3
16
2.4
17
2.5
18
2.6
19
2.7
20
2.8
28
2.9
30
41
47
3.1
Sugesto de notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
4.1
69
III
xiii
Captulo 1
Introduo
Desde as primeiras grandes civilizaes que a Estatstica tem sido utilizada de forma profcua.
Em 3050 A.C. j os egpcios recorriam Estatstica para apurar os recursos humanos e materiais disponveis para a construo das pirmides. Outras civilizaes, tais como os Chineses, os
Gregos ou os Romanos, utilizaram a Estatstica para conhecerem os bens que o estado possua
bem como a sua distribuio pela populao. Desde ento, muitos foram os desenvolvimentos
das aplicaes da Estatstica, nomeadamente no que se refere recolha, organizao e anlise
de dados, quer esta seja restrita ao resumo da sua informao quer seja com o intuito de inferir ou efetuar previses. Atualmente, a Estatstica no s um instrumento indispensvel na
poltica de qualquer estado (no sculo XVII, em Inglaterra, a Estatstica era a Aritmtica do
Estado) como tambm um instrumento importante em muitas outras reas, tais como a Psicologia, a Sociologia, a Medicina, a Economia, o Desporto, a Biologia, a Fsica, a Educao,
a Meteorologia, entre muitas outras. Deste modo, presentemente a Estatstica desempenha
um papel fundamental na vida do cidado, no s pela utilidade das suas mltiplas aplicaes, mas igualmente por ser indispensvel para a anlise, interpretao e compreenso da
informao que os meios de comunicao social divulgam.
Como refere Fernandes a influncia da Estatstica na vida das pessoas e nas instituies
tem-se tornado cada vez mais visvel, o que implica que todos os cidados devam ter conhecimentos de Estatstica para se poderem integrar na sociedade actual (Fernandes, 2009, p.
1). Assim, tem havido um reconhecimento da importncia da Estatstica no currculo dos
alunos, de tal modo que esta tem vindo a ocupar, cada vez mais, um lugar de destaque no
ensino, desde o ensino bsico ao ensino secundrio, pois segundo Martins et al. a Estatstica
encarada como uma rea favorvel ao desenvolvimento de certas capacidades expressas
1
Introduo
nos currculos, tais como interpretar e intervir no real; formular e resolver problemas; comunicar; manifestar rigor e sentido crtico e ainda a aquisio de uma certa atitude positiva face
Cincia. Deste modo, ensinar estatstica no pode limitar-se ao ensino de tcnicas e frmulas
e aprender estatstica no pode ser aprender a aplicar rotineiramente procedimentos desinseridos de contextos, sem ter de interpretar, de analisar e de criticar (Martins et al., 1997, pp.
78). A coletnea de artigos Ensino e Aprendizagem da Estatstica (Loureiro et al. (2000))
um bom exemplo das reflexes sobre a importncia do Ensino da Estatstica no currculo do
ensino secundrio e ensino bsico, da utilidade da incluso da tecnologia na lecionao destes
contedos, bem como a partilha de experincias e materiais didticos no incio do sculo XXI.
No atual programa do ensino bsico o ensino da Estatstica inicia-se no primeiro ciclo assim como os aspetos elementares da Probabilidade, constituindo, em conjunto, desde 2007, o
tema Organizao e Tratamento de Dados (OTD)(1) , conforme as orientaes internacionais
presentes em NCTM(2) (2008). No ensino secundrio o tema aparece no 10.o ano com a designao Estatstica, onde se pretende ampliar os conhecimentos adquiridos anteriormente.
de referir que no objetivo deste projeto abordar conceitos relativos Probabilidade, pelo
que nos restringiremos anlise dos contedos referentes a Estatstica.
Nos ltimos anos tem havido um esforo por parte de alguns autores em fornecer suporte
terico e didtico que possa ajudar os professores nas suas aulas e que se encontram de acordo
com os programas atuais. Martins et al. (2007) elaboraram uma brochura direcionada aos professores do 1.o ciclo que surgiu no mbito do Programa Nacional de Formao Contnua em
Matemtica. Esta brochura, alm de conter os conceitos e procedimentos fundamentais para
um professor deste nvel de ensino, apresenta vrias propostas de tarefas a implementar na
sala de aula com a respetiva explorao. A brochura elaborada por Martins & Ponte (2010)
desenvolve as orientaes metodolgicas relativas OTD, apresentando quatro captulos reservados Estatstica, onde tambm so sugeridas tarefas a propor aos alunos na sala de aula.
Um site de referncia na rea da Estatstica o ALEA Aco Local Estatstica Aplicada, www.alea.pt (podemos encontrar mais informaes em INE (2009)). Este projeto
existe desde 1999 e tem-se mantido sempre em crescimento, apresentando vrias componentes, tais como entretenimento, cursos de estatstica e dados estatsticos. direcionado a
(1)
Consulte-se, por exemplo, Loura (2009) para uma anlise crtica ao novo programa.
(2)
Introduo
alunos, professores e pblico em geral e pretende contribuir para melhorar a literacia estatstica(3) e fomentar situaes e experincias de aprendizagem recorrendo s Tecnologias da
Informao e Comunicao (TIC). de referir que aquando da comemorao do seu 10.o aniversrio foi editado um livro constitudo por 5 dossiers produzidos pelo ALEA e que mais
um documento til nesta temtica. H, contudo, diversos outros materiais para o ensino e
aprendizagem da Estatstica disponveis (cf. Nascimento (2009)).
Este projeto, intitulado Estatstica no Ensino Bsico e Secundrio, tem como principais
objetivos:
apresentar os conceitos mais elementares de Estatstica lecionados nestes ciclos de ensino, num texto cientificamente rigoroso, direcionado a professores, permitindo-lhes a
clarificao destes conceitos;
analisar alguns materiais disponveis para o ensino da Estatstica nestes ciclos, apresentando as incorrees, gralhas e/ou erros detetados, bem como materiais que consideremos insuficientes e/ou inadequados para os objetivos para os quais foram concebidos;
criar novos materiais bem como sugerir metodologias que possam ser utilizados no
ensino da Estatstica.
Neste sentido, o segundo captulo apresentar uma reviso dos conceitos de Estatstica
lecionados no ensino bsico e no ensino secundrio: tabelas de frequncias, representaes
grficas e principais medidas de estatstica descritiva, conforme definido no Programa de Matemtica do Ensino Bsico (Ponte et al., 2007) e no Programa de Matemtica A do Ensino
Secundrio (Silva et al., 2001). Este captulo ir basear-se em livros de autores especialistas
na rea, tais como Murteira (1993), Reis (1998), Batanero & Godino (2003), Pestana & Velosa
(2009) e Maria Eugnia Martins com os seus diversos trabalhos nesta rea (como por exemplo
Martins (2005), Martins & Cerveira (1999), Martins & Ponte (2010) ou Martins et al. (2007,
1997)). No se pretende que este captulo seja direcionado para os alunos, mas antes para
professores que podem procurar neste trabalho a clarificao de qualquer conceito, entre os
que so abordados no ensino bsico e secundrio. Sendo assim, a principal preocupao ser a
preciso e clareza dos conceitos, com um ou outro exemplo, mas sem a preocupao didtica
que um manual para alunos do ensino bsico ou secundrio deve conter. Por esta razo no
(3)
Para uma clarificao deste conceito podemos consultar, por exemplo, Branco & Martins (2002).
Introduo
haver preocupao em colocar os conceitos por ordem de lecionao, mas antes pela ordem
que se considere mais adequada para obtermos uma clara exposio dos mesmos.
No terceiro captulo do projeto pretende-se fazer uma anlise crtica aos materiais disponveis para o ensino e compreenso dos conceitos mais elementares de Estatstica. Sero
analisados vrios manuais escolares, nomeadamente os adotados na escola onde a autora leciona, e apresentadas e fundamentadas as incorrees, gralhas ou erros detetados nos temas
OTD e Estatstica. Analisaremos deste modo a adequao dos materiais de forma a serem
identificadas lacunas nos materiais usualmente utilizados. Ser igualmente importante e pertinente a comunicao dos erros encontrados, via e-mail, s entidades responsveis. de
referir que este procedimento j teve incio no que diz respeito ao manual adotado na escola
da autora, para o 10.o ano, atravs da representante da editora. Salienta-se ainda que o objetivo desta anlise aos manuais no se restringe deteo de gralhas que, embora tenham de
ser corrigidas, por vezes podem at no comprometer o ensino dos contedos previstos nos
programas. Pretende-se igualmente identificar contedos cujas metodologias propostas nos
manuais nos paream insuficientes para a compreenso dos conceitos ensinados, dos quais
destacamos a regresso linear. de referir um estudo realizado por Martinho & Viseu (2009)
que consistiu na anlise de dois manuais do 7.o ano quanto s dimenses: interpretao, crtica
e produo. A primeira dimenso refere-se capacidade de ler e compreender a informao
(textos, tabelas, grficos). A segunda dimenso abrange a capacidade de avaliar criticamente
a informao estatstica. Por fim, a dimenso designada de produo contempla a capacidade
de argumentar, de comunicar a informao estatstica e de tomar decises. Estes autores concluram que a dimenso mais presente nos dois manuais a de interpretao. Concluiu-se
ainda que num manual as dimenses crtica e de produo so quase inexistentes e no outro,
apesar de mais expressivas, no promovem o desenvolvimento da atitude crtica no aluno.
de salientar a relevncia subjacente anlise de manuais escolares uma vez que a maioria dos
professores recorre, habitualmente, a eles quando prepara as suas aulas. Segundo o estudo
Matemtica 2001 realizado pela Associao de Professores de Matemtica (APM (1998)),
no que diz respeito s prticas profissionais dos professores e no item materiais usados na
preparao das aulas, concluiu-se que 87% dos professores utiliza sempre ou muitas vezes o
manual adotado na escola e 68% outros manuais.
Tendo em conta o trabalho desenvolvido no terceiro captulo do projeto, nomeadamente as
situaes analisadas e que, de alguma forma, exigem uma correo, uma explicao, exemplos
4
Introduo
mais enriquecedores, entre outros, pretende-se no captulo quatro do projeto apresentar novos
materiais e propor metodologias que possam ser utilizados no ensino da Estatstica, de forma
a facilitar a compreenso e explorao dos principais conceitos por parte dos alunos. Uma
vez que uma das vertentes fundamentais para o sucesso do ensino da Estatstica termos
professores preparados para o seu ensino, pretendemos que estes materiais vo tambm ao
encontro das necessidades dos professores, como ilustrar o caso da regresso linear simples
(consultar seco 3.4 na pgina 58), pois trata-se de um erro encontrado em vrios manuais
consultados. Sendo um erro to generalizado s pode advir da falta de compreenso dos
conceitos, pelo que iremos elaborar propostas para a sua clarificao. Acrescente-se ainda que
dos materiais a elaborar podem constar: propostas de trabalho para realizar na sala de aula;
a explicao de como construir materiais interativos de forma a possibilitar a construo de
apresentaes a utilizar pelos professores; metodologias direcionadas ao ensino da estatstica,
sendo que o software utilizado na explorao destes materiais ser o GeoGebra.
De referir igualmente que a escolha deste projeto foi fortemente motivada pelo gosto da
autora pela Estatstica, o qual bem patente na contnua participao em diversos trabalhos
realizados dentro e fora da sala de aula com os seus alunos, nas suas orientaes a alunos para
a participao em concursos a nvel nacional para estudantes (como ilustra o Prmio Pedro
Matos organizado pelo IPL, o Prmio Estatstico Jnior organizado pela SPE e os Desafios
do ALEA promovidos pelo site www.alea.pt), bem como o seu olhar, sempre atento e crtico, aos manuais adotados para a lecionao dos contedos programticos da disciplina de
Matemtica, essencialmente do 7.o ano ao 12.o ano. Por outro lado, a autora considera um
desafio explorar as potencialidades do GeoGebra na Estatstica, uma vez que as experincias
que tinha deste software eram no mbito da Geometria e da lgebra. Acrescente-se ainda
que, a propsito do Plano da Matemtica e das sesses em que participa regularmente, tem
tido oportunidade de analisar o programa atual do ensino bsico com mais pormenor, estando
mais sensibilizada para as ideias a preconizadas.
Este projeto pretende contribuir para melhorar o ensino da Estatstica, uma vez que qualquer professor do ensino bsico ou secundrio poder encontrar neste trabalho esclarecimentos relativos a conceitos que tem de lecionar, chamadas de ateno para erros comuns na rea
da Estatstica e sugestes de materiais e metodologias para o ensino da Estatstica. Tambm
poder contribuir para que os manuais venham a ser cada vez melhores, uma vez que as incorrees, gralhas ou erros detetados sero comunicados aos seus autores.
Captulo 2
Conceitos de Estatstica
A Estatstica uma cincia atual, com mltiplas funes e til humanidade. Desde sempre
que o homem procura o conhecimento e, para tal, recolhe dados com determinadas intenes,
nas mais diversas reas do saber. Todos os dias a comunicao social faz-nos chegar notcias
baseadas em estudos estatsticos, apresentando-nos as concluses mais relevantes. Para se
obter essas concluses h um caminho a percorrer, mais ou menos longo, consoante o estudo
realizado, mas bastante facilitado com o recurso tecnologia, Teoria das Probabilidades e
nomeadamente Inferncia Estatstica. Tendo em conta os programas do ensino bsico e do
ensino secundrio (Matemtica A) este projeto vai incidir sobre Estatstica Descritiva cuja finalidade descrever os dados recolhidos a partir de uma amostra ou populao, resumindo a
informao atravs de grficos, tabelas e algumas medidas estatsticas, sem esquecer as comparaes, por exemplo, entre dois conjuntos de dados. O desenvolvimento destes contedos
acompanhado de alguns exemplos ser objeto deste captulo. Relembramos ainda que no
programa do ensino bsico a Estatstica aparece desde o primeiro ciclo e designa-se por Organizao e Tratamento de Dados, desde 2007, data em que o Programa de Matemtica do
ensino bsico foi homologado. No programa de Matemtica A do ensino secundrio o tema
aparece no 10.o ano com a designao Estatstica onde se pretende ampliar os conhecimentos adquiridos anteriormente. Neste captulo os conceitos sero apresentados sem que se faa
referncia ao ano de escolaridade em que se lecionam, utilizando a ordem que nos parece mais
adequada para a sua exposio.
Tendo em conta que os dados que pretendemos resumir e interpretar devem, preferencialmente, estar associados a um contexto, vamos comear por enumerar as etapas de um estudo
estatstico. Deste modo, um estudo estatstico inclui as seguintes etapas:
7
Conceitos de Estatstica
1. definio do problema a estudar, formulando as questes s quais se pretende dar resposta;
2. planeamento da recolha de dados tendo em vista o estudo a realizar. nesta fase que
devemos decidir se recorremos populao ou amostra e definir as variveis com
rigor;
3. organizao e tratamento dos dados atravs de tabelas de frequncia, grficos e algumas
medidas estatsticas;
4. interpretao dos resultados obtidos e estabelecimento de concluses.
Exemplo 2.1. Exemplos de estudos estatsticos: hbitos alimentares dos alunos do 9.o ano;
a crise econmica na vida dos torrejanos; o peso e a altura dos alunos do 8.o ano da Escola
Artur Gonalves e a durabilidade (em quilmetros percorridos) dos pneus de uma determinada
marca.
Quando se faz um estudo estatstico pode obter-se informao de todos os elementos
(indivduos) do universo (populao) sobre o qual incide o estudo e, neste caso, faz-se um
censo; ou recorre-se a uma parte representativa da populao (amostra) e o estudo efetuado
denomina-se sondagem.
Definio 2.1. Uma populao uma coleo de unidades individuais, que podem ser pessoas, animais, objetos, acontecimentos ou resultados experimentais com uma ou mais caractersticas comuns que se pretendem estudar. A cada elemento da populao chama-se indivduo
ou unidade estatstica. O nmero de elementos da populao representado por N (caso esta
seja finita).
Definio 2.2. Uma amostra um subconjunto representativo da populao que se obtm
atravs de mtodos apropriados. A sua dimenso representada por n.
Nas situaes em que o estudo implica a destruio dos elementos a observar (por exemplo, quando pretendemos estudar a fiabilidade dos pneus ou a existncia de bactrias nos
iogurtes) recorre-se sempre a uma amostra. Tambm aconselhvel recorrer a uma amostra
por razes econmicas ou de tempo, pois observar todos os elementos da populao pode
implicar custos elevados ou a obteno tardia dos resultados.
8
Conceitos de Estatstica
A determinao dos elementos que constituem a amostra, com vista obteno dos dados para a realizao do estudo estatstico, tambm designado por processo de amostragem,
dever se objeto de especial cuidado. Sempre que pretendemos estender os resultados de um
estudo estatstico a toda a populao devemos observar o princpio da aleatoriedade. Quando,
para todo o elemento da populao existe uma probabilidade positiva de pertencer amostra,
dizemos que estamos perante uma amostra aleatria. Caso particular o processo de amostragem simples onde cada grupo de dimenso n tem igual probabilidade de ser selecionado
(com probabilidade igual a N1 , uma vez que existem Nn amostras distintas com igual pro(n)
babilidade de serem selecionadas). Neste caso prova-se que cada indivduo tem a mesma
probabilidade de ser selecionado, sendo esta probabilidade igual a
n
N.
Conceitos de Estatstica
irmos, o nmero do sapato ou a altura, faz sentido generalizar para toda a escola. Neste caso
estamos a considerar que a populao, constituda pelos alunos da escola, est dividida em vrias subpopulaes (designadas de estratos) mais ou menos homogneas e em cada uma destas
subpopulaes recolhe-se uma amostra aleatria simples (amostra aleatria estratificada).
de salientar que os alunos mais novos, nomeadamente do 1.o ciclo, podero usar a sua turma
como populao em estudo de modo a facilitar os seus projetos nesta rea.
Em qualquer estudo estatstico, necessrio identificar e classificar as caractersticas em
anlise, de acordo com os objetivos traados.
2.1
Variveis
Tendo em conta a amostra sobre a qual recai o estudo estatstico e os objetivos fixados,
definem-se as caratersticas a analisar (variveis estatsticas), as quais devem ser comuns
a todos os elementos da populao.
Definio 2.3. Varivel estatstica (ou atributo) a propriedade ou caracterstica comum que
se observa em cada uma das unidades estatsticas. Representa-se, habitualmente, por uma das
ltimas letras do alfabeto, por exemplo, x ou y.
As variveis estatsticas podem classificar-se em quantitativas ou qualitativas. A varivel
quantitativa aquela que se refere a uma caracterstica mensurvel, isto , que se pode contar
ou medir. Por conseguinte, traduz-se por valores numricos.
Exemplo 2.3. Exemplos de variveis quantitativas: nmero de divises de uma habitao;
idade de um indivduo; nmero de alunos por turma e tempo necessrio para chegar de casa
escola.
Uma varivel quantitativa pode ser discreta ou contnua. Quando a caracterstica em estudo se pode apenas contar e no medir, a varivel discreta, como por exemplo o nmero de
alunos por turma. Por outro lado, uma varivel quantitativa que se pode medir uma varivel
contnua, como por exemplo o tempo necessrio para chegar de casa escola.
A varivel qualitativa aquela que se refere a uma caracterstica que no susceptvel de
medio ou contagem e, como tal, traduz-se por diferentes modalidades (possveis respostas
que a varivel pode assumir).
10
Conceitos de Estatstica
Exemplo 2.4. Exemplos de variveis qualitativas: ano de escolaridade dos alunos; profisso
dos pais; meio de transporte utilizado para chegar de casa escola e cor preferida dos estudantes de uma turma.
As variveis qualitativas podem ser classificadas em nominais ou ordinais. Um varivel
estatstica nominal quando no se pode estabelecer uma relao de ordem entre as modalidades e ordinal no caso em que as modalidades apresentam uma ordem subjacente. Como
exemplo de uma varivel qualitativa ordinal podemos considerar as habilitaes literrias de
um indivduo. Um exemplo de uma varivel qualitativa nominal pode ser a cor preferida dos
estudantes.
2.2
Dados estatsticos
Sempre que se observa uma varivel estatstica, quantitativa ou qualitativa, obtemos determinados resultados que designamos por dados estatsticos.
Definio 2.4. Dado estatstico o resultado de cada observao da varivel numa unidade
estatstica.
Se a varivel em estudo for, por exemplo, o nmero de alunos por turma, os dados estatsticos podem ser:
22, 28, 24, 24, 28, 20, 28, ,
mas no caso da varivel ser o ano de escolaridade dos alunos, alguns dados estatsticos podem
ser:
5.o ano; 6.o ano; 6.o ano; 8.o ano; 7.o ano; 12.o ano,
Os dados estatsticos so muito mais do que nmeros ou modalidades. Eles esto sempre
associados a um contexto. Na primeira situao apresentada, em que a varivel o nmero
de alunos por turma, cada unidade estatstica uma turma. Para cada turma observou-se o
nmero de alunos, obtendo-se, assim, os dados estatsticos. Na segunda situao, em que a
varivel o ano de escolaridade, cada unidade estatstica um aluno. Para cada aluno registouse o seu ano de escolaridade. Deste modo, obtiveram-se os dados estatsticos que neste caso
so modalidades, pois a varivel qualitativa. Aproveitamos para reforar a importncia de,
Estatstica no Ensino Bsico e Secundrio
11
Conceitos de Estatstica
num estudo estatstico, saber quais os dados que queremos obter de modo a dar resposta s
questes levantadas, apresentando concluses pertinentes.
Neste captulo vamos recorrer, como exemplo, ao resultado de um inqurito efetuado a
25 alunos de uma escola, selecionados de entre as trs turmas do 8.o ano, relativamente sua
cor preferida; seus hbitos de leitura; idade (em anos); altura (em centmetros - cm); notas
do teste diagnstico de Matemtica (Mat.) e do teste diagnstico a Cincias Fsico-Qumicas
(C.F.Q.) numa escala de 0 a 100 valores. Os dados obtidos esto apresentados na Tabela 2.1.
Notemos que as variveis cor preferida e hbitos de leitura so variveis qualitativas, as
variveis nota a Matemtica, nota a Cincias Fsico-Qumicas e idade(1) so variveis quantitativas discretas e a varivel altura uma varivel quantitativa contnua.
Relativamente notao que utilizaremos ao longo deste trabalho, as observaes da
amostra sero representadas por
x1 , x2 , . . . , xn ,
onde xi representa a resposta do indivduo i relativamente varivel x. Para o tratamento estatstico usual agrupar os indivduos cujas respostas so iguais, sendo as diferentes respostas
presentes na amostra representadas por
x1 , x2 , . . . , xp
onde p representa o nmero de respostas distintas e, naturalmente, p n. Desta forma podemos construir as tabelas de frequncias.
2.3
Tabelas de frequncias
Aps a recolha de dados, outra fase muito importante a sua organizao em tabelas de
frequncias. Com este objetivo devemos atender s seguintes definies.
Definio 2.5. A frequncia absoluta o nmero de vezes que cada valor da varivel (ou
cada modalidade) aparece num conjunto de dados. Representa-se por ni que corresponde ao
nmero de vezes que se observou xi .
(1)
Apesar dos dados resultarem de uma medio, a forma como so apresentados (nmero inteiro de anos)
tm a aparncia de dados discretos. Contudo, por exemplo, o valor 14, refere-se a todas as idades maiores ou
iguais a 14 e menores que 15. Por esta razo podemos tambm considerar a varivel idade como uma varivel
contnua que foi discretizada.
12
Conceitos de Estatstica
Aluno
Cor
Hbitos
Idade
Altura
Nota a Nota a
preferida
de leitura
(anos)
(cm)
Mat.
C.F.Q.
azul
15
150
42
60
branco
no costumo ler
14
159
37
43
azul
13
146
80
81
branco
14
157
78
80
azul
14
163
79
85
amarelo
no costumo ler
13
158
63
60
azul
15
160
63
64
azul
15
165
45
53
amarelo
14
154
50
55
10
verde
13
149
32
35
11
branco
14
153
60
70
12
branco
14
166
38
39
13
cor-de-rosa
13
153
45
47
14
cor-de-rosa
13
152
60
62
15
azul
14
159
71
70
16
amarelo
14
155
25
27
17
amarelo
13
156
60
64
18
cor-de-rosa
14
152
64
65
19
cor-de-rosa
14
163
65
60
20
cor-de-rosa
14
157
37
38
21
verde
15
164
64
65
22
azul
15
169
87
90
23
cor de rosa
14
157
87
88
24
verde
no costumo ler
16
164
48
54
25
cor-de-rosa
14
155
50
55
ni = n.
(2.1)
i=1
13
Conceitos de Estatstica
Definio 2.6. A frequncia relativa de cada modalidade xi a proporo de observaes
iguais a xi , isto , o quociente que se obtm dividindo a frequncia absoluta de um valor (ou
modalidade) pelo nmero total de dados. Representa-se por fi sendo
fi =
ni
,
n
(2.2)
fi = 1.
(2.3)
i=1
Notemos que quando pretendemos efetuar comparaes devemos usar a frequncia relativa, pois muitas vezes as amostras tm dimenses diferentes e, nestes casos, no faz sentido
usar a frequncia absoluta. Por exemplo, quando se pretende comparar o nmero de aprovaes de duas turmas com dimenses distintas no se deve comparar as frequncias absolutas
mas antes as frequncias relativas.
Definio 2.7. A frequncia absoluta acumulada de cada valor xi da varivel o nmero
total de dados com valor menor ou igual a xi . Representa-se por Ni .
A frequncia absoluta acumulada obtm-se adicionando as frequncias absolutas desde o
primeiro at ao ltimo valor considerado da varivel, isto ,
i
Ni =
n j,
(2.4)
j=1
onde, naturalmente, N p = n.
Definio 2.8. A frequncia relativa acumulada de cada valor xi da varivel a soma das
frequncias relativas de todos os dados com valor menor ou igual a xi . Representa-se por Fi .
A frequncia relativa acumulada obtm-se adicionando as frequncias relativas desde o
primeiro at ao ltimo valor considerado da varivel, isto ,
i
Fi =
f j,
(2.5)
j=1
Ni
,
n
(2.6)
Conceitos de Estatstica
onde Fp = 1.
Uma das formas de organizarmos os dados estatsticos atravs da construo de tabelas
de frequncias, pois trazem-nos fortes vantagens na leitura dos dados. Agora que j definimos
os diferentes tipos de frequncia, apresentamos na Tabela 2.2 uma tabela de frequncias geral.
Na primeira coluna so apresentados os diferentes valores ou modalidades, da varivel estatstica, presentes na amostra e nas colunas seguintes as correspondentes frequncias absolutas,
relativas e acumuladas. Na ltima linha da tabela apresentada a soma da respetiva coluna,
sempre que tal tenha significado.
Varivel Frequncia
Frequncia
Frequncia
Frequncia
absoluta
absoluta
relativa
relativa
ni
acumulada Ni
fi
acumulada Fi
x1
n1
N1 = n1
f1
F1 = f1
x2
n2
N2 = n1 + n2
f2
F2 = f1 + f2
ni
Ni = n1 + + ni
Fi = fi
f1 + + fi
np
N p = n1 + + n p = n
fn
Fp = f1 + + f p = 1
xi
xp
Total
1
Tabela 2.2: Tabela de frequncias
15
Conceitos de Estatstica
Cor
Frequncia
Frequncia
preferida
absoluta
relativa
dos alunos
ni
fi
branco
amarelo
cor-de-rosa
azul
verde
Total
25
Refira-se que, caso estivssemos perante uma varivel qualitativa ordinal, por exemplo,
habilitaes literrias, faria sentido o clculo das frequncias acumuladas, uma vez que neste
caso a ordem das modalidades tem significado.
ni .
(2.7)
xi x
16
Conceitos de Estatstica
Idade
Frequncia
Frequncia
Frequncia
Frequncia
dos
absoluta
absoluta
relativa
relativa
alunos
ni
acumulada Ni
fi
acumulada Fi
13
0,24 (24%)
14
13
19
0,76 (76%)
15
24
0,96 (96%)
16
25
1 (100%)
Total
25
No caso das frequncias relativas, faz corresponder a cada valor de x a frequncia relativa do
total de dados observados com valor menor ou igual a x, isto ,
F(x) =
fi .
(2.8)
xi x
Como exemplo vamos definir, analiticamente, as funes cumulativas das frequncias absolutas e das frequncias relativas para a varivel idade dos alunos,
N(x) = 19
24
25
F(x) =
se x < 13
se 13 x < 14
se 14 x < 15 ,
(2.9)
se 15 x < 16
se x 16
0
se x < 13
0, 24 se 13 x < 14
0, 76 se 14 x < 15 .
0, 96 se 15 x < 16
1
se x 16
(2.10)
A representao grfica da funo (2.9) pode ver-se na seco 2.4.6 (pgina 24).
Estatstica no Ensino Bsico e Secundrio
17
Conceitos de Estatstica
149
150
152
153
154
155
156
157
158
159
160
162
163
164
165
166
169
Tabela 2.5: Tabela de frequncias da altura dos alunos (como uma varivel discreta)
Uma vez que as regularidades so impercetveis nesta tabela, vamos agrupar os dados,
(2)
Este procedimento tambm deve ser aplicado em variveis quantitativas discretas que assumam muitos
valores distintos
18
Conceitos de Estatstica
relativos s alturas, em classes procedendo do seguinte modo:
calcular a diferena entre a altura mxima e a altura mnima (amplitude da amostra);
determinar o nmero de classes k a construir, utilizando a regra de Sturges, (onde k o
menor nmero inteiro tal que 2k n);
determinar a amplitude de cada classe que ser aproximadamente (por excesso) o quociente que se obtm dividindo a amplitude da amostra pelo nmero de classes.
Vamos assim obter os intervalos, habitualmente denominados por intervalos de classe,
[l0 , l1 [, [l1 , l2 [, , [lk2 , lk1 [, [lk1 , lk ],
onde l0 < l1 < l2 < < lk1 < lk . Os intervalos so disjuntos dois a dois e a sua unio contm
todos os valores. Notemos que l0 menor ou igual que o valor mnimo observado e lk maior
ou igual que o valor mximo observado (de forma a garantir que o intervalo [l0 , lk ] contenha
todas as observaes).
Tendo em conta os passos anteriores, relativamente altura dos 25 alunos, verifica-se que
a altura mxima 169, a altura mnima 146 e a amplitude 169 146 = 23. Como 25 25
23
5
Frequncia
Frequncia
Frequncia
Frequncia
dos
absoluta
absoluta
relativa
relativa
alunos
ni
acumulada Ni
fi
acumulada Fi
[145,150[
0,08 (8%)
[150,155[
0,28 (28%)
[155,160[
15
0,60 (60%)
[160,165[
21
0,84 (84%)
[165,170]
25
1 (100%)
Pode aplicar-se este processo (regra de Sturges) de modo idntico sempre que a varivel
seja quantitativa contnua. Saliente-se, contudo, que no mtodo nico e que nem sempre
Estatstica no Ensino Bsico e Secundrio
19
Conceitos de Estatstica
conduz a resultados aceitveis. A ttulo de exemplo, usando este mtodo, se analisarmos o
rendimento de 100 indivduos e um deles tiver um rendimento muito superior aos restantes
podemos obter 7 classes de igual amplitude, onde na primeira esto 99 indivduos e na ltima
apenas um, como se ilustra no exemplo 2.5.
Exemplo 2.5. De um grupo de 100 trabalhadores de um empresa, 99 auferem entre 475 euros
(rendimento mnimo) e 1100 euros e um indivduo aufere 5000 euros (rendimento mximo).
Tendo em conta os passos descritos previamente, a amplitude igual a 5000 475 = 4525 e o
nmero de classes a considerar igual a 7 (k = 7) uma vez que 27 100 (e 26 < 100). Dado
que
4525
7
647, de onde se obtm a tabela de frequncia apresentada como Tabela 2.7. Naturalmente,
num caso como este pertinente o uso de classes com diferentes amplitudes.
Rendimento
Frequncia
em
absoluta
euros
ni
[475,1122[
99
[1122,1769[
[1769,2416[
[2416,3063[
[3063,3710[
[3710,4357[
[4357,5004[
Total
100
2.4
Representaes Grficas
Para alm de se poder organizar os dados estatsticos em tabelas de frequncias, outra forma
de os apresentar recorrer a vrios tipos de representaes grficas, tais como pictogramas,
grficos de pontos, diagramas de barras, grficos circulares, diagramas de caule e folhas e
histogramas.
20
Conceitos de Estatstica
Um grfico um instrumento de sntese apelativo e que nos d uma ideia geral da questo
abordada, sem no entanto deixar de destacar alguns aspetos particulares. Quando pretendemos
representar conjuntos de dados graficamente deveremos selecionar o grfico mais adequado
a cada situao. Por outro lado, deve ter-se em conta que a informao que nele existe
suficiente para que qualquer pessoa o compreenda.
2.4.1 Pictograma
O pictograma um tipo de representao grfica muito sugestivo, pois na sua construo so
utilizadas figuras representativas da informao. Apesar de se poder usar o mesmo smbolo,
variando a rea ou volume de forma a que sejam proporcionais frequncia absoluta, torna-se
mais simples usar uma figura que se repete sempre da mesma maneira. As figuras devem
estar igualmente espaadas e devem apresentar-se em linhas ou colunas. Apesar de nos dar
uma ideia geral da situao uma das desvantagens , por vezes, no ser possvel uma leitura
rigorosa das frequncias absolutas de cada valor ou modalidade. Um pictograma tem de incluir o significado do smbolo que pode ser a unidade ou no. Pode visualizar-se um exemplo
de pictograma na Figura 2.1, respeitante aos hbitos de leitura dos alunos (cujos dados esto
apresentados na Tabela 2.1, na pgina 13).
21
Conceitos de Estatstica
em cada conjunto de dados. Por cima de cada valor ou modalidade marca-se um ponto sempre
que um elemento da amostra for igual a esse valor ou a essa modalidade.
Na Figura 2.2 utilizamos a idade dos alunos para ilustrar um grfico de pontos.
Conceitos de Estatstica
23
Conceitos de Estatstica
ni
hi ;
24
No obrigatrio ser igual, pode ser proporcional. Contudo estes so os casos mais utilizados.
Conceitos de Estatstica
25
Conceitos de Estatstica
igual a 1, razo pela qual se desenha um segmento de reta paralelo ao eixo Ox, a partir desse
ponto.
Conceitos de Estatstica
existente na amostra.
2.5
Nas duas seces anteriores dedicmo-nos construo de tabelas de frequncias e representao grfica dos dados. As tabelas de frequncias permitem organizar e facilitam a leitura
dos dados. Os grficos, apesar de geralmente conterem menos informao que as tabelas de
frequncias, so de fcil leitura e tm um peso significativo na anlise descritiva dos dados,
no esquecendo que uma imagem vale mais do que mil palavras.
A partir daqui e at ao final deste captulo, vamos estudar um conjunto de medidas descritivas que permitem sumariar alguns dos aspetos mais importantes do conjunto de dados.
Nesta seco, em particular, vamos estudar as medidas de tendncia central: moda, mdia e
mediana.
2.5.1 Moda
A moda uma medida com especial interesse para resumir os dados no caso da varivel
ser qualitativa. Nesta situao nem a mdia nem a mediana podem ser calculadas ou so
desprovidas de significado.
Definio 2.9. A moda, representada por Mo, o valor ou modalidade que surge com maior
frequncia na amostra.
Se considerarmos o conjunto de dados constitudo pelas 25 cores preferidas dos alunos verificamos que h duas modalidades com a frequncia absoluta mais elevada (consultar Tabela
2.3 da pgina 16). Neste caso dizemos que h duas modas: cor-de-rosa e azul, e a distribuio
Estatstica no Ensino Bsico e Secundrio
27
Conceitos de Estatstica
bimodal. Se tivesse trs modas seria trimodal. No caso de ter mais do que trs modas
multimodal. Quando nenhum valor ou modalidade aparece com maior frequncia do que os
restantes diz-se que no h moda.
Quando a varivel quantitativa contnua e no se conhecem os dados reais podemos identificar a classe modal (classe com maior frequncia por unidade de amplitude). Por exemplo,
relativamente altura dos alunos, representada na Tabela 2.6 da pgina 19 a classe modal
[155, 160[, porque corresponde classe com maior frequncia absoluta por unidade de amplitude. Notemos que, quando as classes tm igual amplitude, bastar identificar a classe com
maior frequncia. Caso contrrio devemos utilizar a classe com maior
ni
hi ,
conforme ilustra o
exemplo 2.6.
Exemplo 2.6. Perguntou-se a 40 indivduos o nmero de dias que faltaram ao trabalho, por
doena, no ano anterior. Os dados encontram-se organizados na Tabela 2.8. Como podemos
verificar as classes no tm todas a mesma amplitude. Neste caso indicar a classe modal
implica encontrar a classe em que o quociente entre a frequncia absoluta e a respetiva amplitude, maior. Por observao da tabela conclumos que a classe modal a classe [4,8[ (e no
a classe [8,16[ que corresponde de maior frequncia).
ni
hi
[4,8[
10
[8,16[
12
[16,24[
[24,30]
total
40
4
4 =1
10
4 = 2, 5
12
8 = 1, 5
9
8 = 1, 125
5
6 = 0, 8(3)
2.5.2 Mdia
De entre as medidas de localizao estudadas, a mdia(4) a mais usada.
(4)
Geralmente quando falamos em mdia estamos a referir-nos mdia aritmtica, como a definimos neste
trabalho. No entanto h outros tipos de mdias, como por exemplo a mdia geomtrica, a mdia harmnica
28
Conceitos de Estatstica
Definio 2.10. A mdia, representada por x, obtm-se dividindo a soma de todos os valores
de uma varivel pelo nmero total de observaes,
x=
x1 + x2 + + xn 1 n
= xi ,
n
n i=1
(2.11)
x1 n1 + x2 n2 + + xp n p 1 p
= xi ni ,
n
n i=1
(2.12)
13 6 + 14 13 + 15 5 + 16 1 351
=
= 14, 04 anos.
25
25
(2.13)
Por vezes, quando a varivel em estudo contnua, no conhecemos os seus valores reais.
Nestes casos partimos dos dados agrupados em classes e determinamos um valor aproximado
da mdia. Para ilustrar esta situao, vamos supor que o peso (em kg) dos 25 alunos esto
organizados em 5 classes, conforme Tabela 2.9. Determina-se a marca da classe, isto , o
ponto mdio de cada classe,
xi =
li1 + li
, i = 1, 2, , 5
2
(2.14)
e considera-se, para cada classe, que o peso de cada aluno igual marca da classe(5) . Depois
ou a mdia (aritmtica) aparada. A mdia geomtrica muito usada, por exemplo, em economia no clculo de
taxas de variao ou de crescimento (se colocarmos no banco um montante com uma taxa de juro igual a 2%
no primeiro ano e 3% no segundo ano, a taxa mdia de crescimento no ser exactamente igual a 2,5%). A
mdia harmnica utiliza-se quando estamos perante grandezas inversamente proporcionais, como o caso da
velocidade e do tempo (notemos que se fizermos um trajeto duas vezes, uma a 80 km/h e outra a 120 km/h, a
velocidade mdia no ser 100 km/h). Quando temos alguns valores muito distantes da mdia (outliers) comum
retirar as % de observaes menores e as % de observaes maiores, determinando-se a mdia aritmtica das
restantes (100 2 )% de observaes. A esta mdia denomina-se por mdia aparada a %, sendo uma medida
mais robusta que a mdia aritmtica quando estamos perante um conjunto de dados com outliers.
(5)
Se considerarmos que as observaes esto igualmente espaadas dentro de cada classe (uniformemente
distribudas) o resultado ser exatamente o mesmo, contudo a ideia ser mais difcil de transmitir aos nossos
alunos.
29
Conceitos de Estatstica
procede-se como no caso anterior e obtemos, desta forma, um valor aproximado do peso
mdio dos alunos dado por:
x=
1452
= 58, 08 kg.
25
(2.15)
Peso
Frequncia
Marca
dos
absoluta
da classe
alunos (kg)
ni
xi
[40, 48[
44
44 5 = 220
[48, 56[
52
52 5 = 260
[56, 64[
60
60 9 = 540
[64, 72[
68
68 3 = 204
[72, 80]
76
76 3 = 228
Total
25
xi ni
1452
(2.16)
1 n
1 n
1 n
1 n
y
=
(x
+
c)
=
x
+
i n i
i n c = x + c.
n i=1
n i=1
i=1
i=1
Estatstica no Ensino Bsico e Secundrio
Conceitos de Estatstica
Para ilustrar a segunda propriedade da mdia, suponhamos que todos os alunos comearam
a frequentar o ginsio que se situa junto escola no dia 1 de outubro de 2010. Suponhamos
ainda que ao fim de um ms cada aluno tinha perdido 2% do seu peso. Qual o peso mdio
dos alunos da turma no dia 1 de novembro do mesmo ano? A resposta, em kg, ser dada por
58, 08 0, 02 58, 08 = 0, 98 58, 08 56, 92 kg.
Cada peso registado no dia 1 de novembro corresponde a 98% do respetivo peso anterior.
Ento a mdia obtida ser 98% da mdia anterior. De um modo geral, temos a seguinte
propriedade.
Propiedade 2.2. Se multiplicarmos cada valor da varivel x por uma constante c obteremos
uma nova varivel w cuja mdia :
w = c x.
Efetivamente,
w=
(2.17)
1 n
1 n
1 n
w
=
cx
=
c
i
i
xi = cx.
n i=1
n i=1
n i=1
2.5.3 Mediana
Para determinar a mediana devemos previamente ordenar as observaes. Neste sentido sejam
x(1) , x(2) , , x(n) as observaes x1 , x2 , , xn ordenadas. Desta forma x(1) representa a menor
observao, x(2) a segunda menor observao, , x(i) a i-sima menor observao, e x(n)
(2.18)
Definio 2.11. A mediana, representada por Me, um valor que divide ao meio o conjunto
das observaes, isto , 50% dos valores so inferiores ou iguais mediana e 50% dos valores
so superiores ou iguais mediana.
Existe uma regra prtica para calcular a mediana. Depois de ordenar os valores por ordem
crescente consideram-se os seguintes dois casos.
1. Se n mpar a mediana o valor que ocupa a posio central. Ento, numa amostra de
dimenso n, teremos
Me = x( n+1 ) .
2
(2.19)
31
Conceitos de Estatstica
2. Se n par a mediana a mdia dos dois valores que ocupam a posio central. Ento,
numa amostra de dimenso n, teremos
Me =
x( n ) + x( n +1)
2
(2.20)
Notemos que, neste ltimo caso, a mediana pode no coincidir com nenhuma das observaes
da amostra.
Exemplo 2.7. Consideremos os dados registados na Tabela 2.1 relativos idade dos 25 alunos
e ordenemo-los por ordem crescente,
13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 16.
Como o nmero de observaes mpar, n = 25, a mediana dada por
Me = x(13) = 14.
(2.21)
Por outro lado, quando os dados esto agrupados em classes, podemos encontrar a classe
mediana de modo idntico. Assim, a classe mediana ([li1 , li [) ser aquela que corresponde
primeira classe com frequncia relativa acumulada superior ou igual a 50% (Fi 0.5) ou, o
que equivalente, primeira classe com frequncia absoluta acumulada superior ou igual a
n
2
(Ni 2n ). Por exemplo, relativamente altura dos 25 alunos, apresentada na Tabela 2.6, na
pgina 19, a classe mediana [155, 160[, pois esta classe acumula 60% dos valores e a anterior
acumula apenas 28%. No entanto, como neste caso se conhecem todos os valores da varivel,
deve calcular-se o valor da mediana, em vez da classe mediana.
Conceitos de Estatstica
A moda pode ser determinada quer a varivel seja qualitativa quer seja quantitativa. No
entanto, um conjunto de dados pode no ter moda. Alm disso, esta medida no influenciada
pelos valores extremos. Para ilustrar a relevncia desta medida podemos referir, a ttulo de
exemplo, a importncia que pode ter para uma empresa do setor do calado saber qual o
tamanho do sapato mais vendido, ou para uma empresa de laticnios saber o sabor dos iogurtes
preferido dos clientes.
A mdia uma medida estatstica muito utilizada e no seu clculo intervm todos os
dados. Se por um lado no h perda de informao, por outro lado qualquer alterao num
dos valores produz um valor diferente no resultado da mdia. A mdia pode ser enganadora
pois influenciada pelos valores extremos (nomeadamente se existirem valores muito baixos
ou muito altos), podendo em alguns casos deixar de ser representativa (isto , exigir um
cuidado particular na sua interpretao). Notemos que, por exemplo, duas turmas com a
mesma mdia na classificao da disciplina de Matemtica podem ter comportamentos muito
distintos. Neste caso, a determinao das medidas de disperso, que medem a variabilidade
dos dados, podem ser fulcrais para uma melhor interpretao dos dados. Salientemos ainda
que a mdia apenas se pode calcular quando a varivel quantitativa, podendo em alguns
casos, o seu valor no coincidir com nenhum dos possveis valores da varivel (por exemplo,
o nmero mdio de elementos de um agregado familiar em determinada cidade de Portugal
2,3, contudo no possvel haver um agregado familiar constitudo por 2,3 indivduos!).
A mediana divide as observaes em dois grupos com igual nmero de indivduos, mas
o seu valor nem sempre coincide com um dos dados. Uma vez que o seu valor depende do
nmero de observaes e no de todos os valores, uma medida estatstica mais robusta do
que a mdia no sentido em que no influenciada pelos valores muito altos nem pelos valores
muito baixos (outliers).
Estes valores muito elevados ou muito pequenos, comparativamente aos restantes, so
comuns em algumas distribuies que designamos por assimtricas (positivas ou negativas).
O tipo de assimetria decorre da comparao das medidas de tendncia central. Seguidamente
apresentamos trs distribuies tpicas, conforme se ilustra na Figura 2.10.
distribuio simtrica se x = Me = Mo.
distribuio assimtrica positiva se Mo Me x.
distribuio assimtrica negativa se x Me Mo.
Estatstica no Ensino Bsico e Secundrio
33
Conceitos de Estatstica
Simetria
Assimetria positiva
Assimetria negativa
x = Me = Mo
Mo Me x
x Me Mo
2.6
Para alm das medidas de tendncia central existem outras medidas que nos informam relativamente localizao dos valores da varivel. Costumam designar-se por quantis e iremos
aqui abordar os quartis e os percentis, apesar dos percentis no estarem contemplados nos
34
Conceitos de Estatstica
Assimetria positiva
Assimetria negativa
2.6.1 Quartis
Os quartis so medidas estatsticas extremamente teis na caracterizao de uma amostra. A
partir deles podemos obter uma representao grfica designada por diagrama de extremos e
quartis (subseco 2.6.2) e calcular uma medida de disperso (seco 2.15).
Definio 2.12. Os quartis so os valores que dividem o conjunto das observaes, depois de
ordenado, em quatro partes iguais, cada uma contendo 25% das observaes. Os quartis so
3 e representam-se por Q1 , Q2 e Q3 , sendo Q2 = Me. Assim:
Q1 o 1.o quartil o valor que verifica a seguinte propriedade: 25% das observaes
so menores ou iguais a Q1 e 75% so superiores ou iguais a Q1 , conforme ilustrado na
Figura 2.13 (onde xmin e xmax representam o mnimo e o mximo da amostra).
Q2 o 2.o quartil igual mediana.
Q3 o 3.o quartil o valor que verifica a seguinte propriedade: 75% das observaes
so menores ou iguais a Q3 e 25% so superiores ou iguais a Q3 .
Para determinar o 1.o e o 3.o quartis de um conjunto ordenado de observaes comea-se
por determinar a mediana, Q2 , dividindo esse conjunto em duas partes iguais. O 1.o quartil
ser a mediana das observaes que se encontram esquerda de Q2 e o 3.o quartil ser a
mediana das observaes que se encontram direita de Q2 .
Estatstica no Ensino Bsico e Secundrio
35
Conceitos de Estatstica
Q1 =
x(6) + x(7) 13 + 14
=
= 13, 5.
2
2
(2.22)
Q3 =
x(19) + x(20) 14 + 15
=
= 14, 5.
2
2
(2.23)
Por outro lado, quando a varivel contnua podemos determinar as classes s quais pertencem o 1.o e 3.o quartis, recorrendo frequncia relativa acumulada, como procedemos
com a mediana. Assim, a classe que contm o 1.o quartil ser aquela que corresponde primeira classe com frequncia relativa acumulada superior ou igual a 25% (Fi 0, 25) ou, o
que equivalente, primeira classe com frequncia absoluta acumulada superior ou igual a
n
4
(Ni 4n ). Analogamente, a classe que contm o 3.o quartil ser aquela com frequncia re-
lativa acumulada superior ou igual a 75% (Fi 0, 75) ou com frequncia absoluta acumulada
Conceitos de Estatstica
2.6.3 Percentis
Como j foi referido, os percentis esto fora do mbito dos programas do ensino bsico e secundrio, no entanto optamos por fazer uma pequena abordagem pelo facto destas medidas se
utilizarem na vida real, nomeadamente, para informar sobre o desenvolvimento das crianas.
Definio 2.13. Os percentis so os valores que dividem o conjunto das observaes, depois
de ordenado, em cem partes iguais, cada uma contendo 1% das observaes. Os percentis
so 99 e representam-se por P1 , P2 , . . . , P99 , sendo P25 = Q1 , P50 = Me e P75 = Q3 . Deste
Estatstica no Ensino Bsico e Secundrio
37
Conceitos de Estatstica
modo, P = k significa que % das observaes so inferiores ou iguais a k e (100 )% das
observaes so iguais ou superiores a k.
Assim, por exemplo, se para um conjunto de dados tivermos:
P16 = 34, significa que 16% das observaes so inferiores ou iguais a 34 e 84% so
iguais ou superiores a 34.
P72 = 55, significa que 72% das observaes so inferiores ou iguais a 55 e 28% so
iguais ou superiores a 55.
Exemplo 2.8. Consideremos que numa consulta o pediatra, aps pesar e medir a criana,
afirma que esta est no percentil 80 no peso e no percentil 25 em relao altura (algumas
das medidas patentes na Caderneta de Sade da Criana so os percentis do peso, da altura
e do permetro ceflico por idade). Qual o significado destes valores referidos pelo pediatra?
Significam que, relativamente s crianas da mesma idade, existem 80% de criaas com um
peso menor ou igual e apenas 20% com um peso maior ou igual. No que se refere altura,
relativamente s crianas com a mesma idade, exitem 25% de crianas mais baixas e 75% de
crianas mais altas (a forma da evoluo de cada um destes percentis bem como a discrepncia
entre eles um dado importante na anlise do desenvolvimento da criana).
2.7
Medidas de disperso
Abordmos at agora vrias medidas estatsticas que permitem caracterizar uma amostra relativamente sua localizao (seja ela central ou no central). Contudo, quando se pretende
estabelecer comparaes, deparamo-nos com muitas situaes em que estas medidas no se
revelam suficientes. A ttulo ilustrativo consideremos as notas, numa escala de 0 a 20 valores,
obtidas por dois alunos do mesmo ano de escolaridade, em dez fichas de avaliao de uma
determinada disciplina.
Aluno A 9, 9, 11, 12, 8, 7, 13, 11, 9, 11
Aluno B 5, 15, 4, 4, 5, 17, 13, 17, 6, 14
Os dois alunos apresentam a mesma nota mdia, dez valores, mas da observao das suas
notas poderemos dizer que os dois alunos so muito diferentes no que respeita ao aproveitamento nessa disciplina, apesar de terem tido o mesmo nmero de fichas com nota positiva.
38
Conceitos de Estatstica
Para alm deste exemplo podemos considerar muitos outros, tais como duas cidades com a
mesma temperatura mdia e a mesma temperatura mediana, apresentando amplitudes trmicas muito distintas ou duas turmas com a mesma mdia a Matemtica, em que uma delas
apresenta uma percentagem de negativas bastante superior outra.
Nestes casos h ento necessidade de calcular outras medidas estatsticas, medidas de
disperso, para conhecer de que forma os dados se encontram distribudos.
(2.24)
(2.25)
39
Conceitos de Estatstica
Esta medida indica-nos a amplitude do intervalo onde se situam as 50% das observaes
centrais, mostrando-nos a variabilidade dos dados em relao mediana. Assim, possvel
estabelecer comparaes entre dois conjuntos de observaes no que diz respeito disperso
ou concentrao dos valores em relao mediana. Quanto menor for a amplitude interquartis,
maior a concentrao dos valores em relao mediana.
n i=1
n i=1
n i=1
n
Para ultrapassar esta situao definiu-se o desvio mdio absoluto, no qual se considera os
valores absolutos dos desvios, impedindo que a soma dos desvios d zero e obtendo a mdia
das distncias entre as observaes e a mdia.
Definio 2.16. O desvio mdio absoluto, representado por dm , a mdia das distncias entre
as observaes e a mdia, isto ,
dm =
1 n
1 p
|x
x|
=
i
ni|xi x|.
n i=1
n i=1
(2.26)
Outra forma de contornar o facto de a soma dos desvios ser nula calcular a mdia dos
quadrados dos desvios. Surge assim outra medida de disperso, a varincia, que teve mais
aceitao.
Definio 2.17. A varincia a mdia(6) dos quadrados dos desvios de cada observao da
(6)
Efetivamente no a mdia(na sua conceo habitual) uma vez que no dividimos por n, mas antes por
n 1. Esta correo est ligada inferncia estatstica, nomeadamente utilizao da varincia da amostra como
estimador da varincia da populao.
40
Conceitos de Estatstica
Idade
Frequncia
Valores absolutos
Quadrados
dos
absoluta
Desvios
dos desvios
dos desvios
alunos
ni
ni (xi x)
ni |xi x|
ni (xi x)2
13
6,24
6,4896
14
13
0,52
0,0208
15
4,8
4,608
16
16 14, 04 = 1, 96
1,96
3,8416
Total
25
13,52
14,96
n 1 i=1
n 1 i=1
2
(2.27)
(2.28)
Notemos que apesar desta frmula simplificar os clculos, com o recurso a computadores ou
mquina de calcular a sua utilidade tornou-se reduzida (neste contexto).
A varincia pode ser utilizada para comparar dois conjuntos de observaes. Quanto maior
for a varincia, maior a disperso dos valores relativamente mdia(7) ; quanto menor a
varincia, maior a concentrao dos valores relativamente mdia. Contudo a varincia
apresenta uma desvantagem, uma vez que os quadrados dos desvios passam a ser de uma
ordem de grandeza superior aos desvios. Por exemplo, no caso da idade, passamos de anos
para anos ao quadrado; se noutra situao a varivel fosse a distncia em metros, passaramos
a metros quadrados. Para resolver este problema, permitindo que se volte ordem de grandeza
inicial, definiu-se outra medida de disperso que resulta da raiz quadrada da varincia e que
se designa por desvio padro.
(7)
Nesta observao consideramos que os dados comparados esto expressos na mesma unidade de medida
e que tm mdias prximas. Em rigor quando se pretende comparar a disperso de dois conjuntos de dados
deve-se utilizar o coeficiente de disperso de Pearson, CD = xs , com x 6= 0.
41
Conceitos de Estatstica
Definio 2.18. O desvio padro a raiz quadrada da varincia, sendo representado por s e
determinado por
s=
s2 .
(2.29)
(2.30)
O desvio padro mede a variabilidade dos valores em relao mdia e a sua interpretao
idntica da varincia. Quanto maior for o valor do desvio padro, maior o afastamento
dos valores em relao mdia. Um dos inconvenientes do desvio padro ser influenciado
por valores extremos, ou seja, valores muito maiores ou muito menores que os restantes.
O desvio padro goza de algumas propriedades importantes. Consideremos, sem perda
de generalidade, x1 , x2 , , xn os n valores de uma varivel quantitativa com mdia x e desvio
padro s.
Propiedade 2.3. O desvio padro sempre no negativo.
Esta propriedade consequncia imediata da definio de desvio padro.
Propiedade 2.4. Se o desvio padro igual a zero significa que no existe variabilidade.
Consequentemente as observaes so todas iguais.
De facto,
s = 0 s2 = 0
1 n
(xi x)2 = 0 xi = x, i,
n 1 i=1
s =
42
1 n
1 n
[(c + xi ) (c + x)]2 =
Conceitos de Estatstica
Propiedade 2.6. Se multiplicarmos cada valor da varivel x por uma constante c obteremos
um conjunto de dados cuja desvio padro s = |c|s.
Neste caso, fazendo uso da propriedade 2.2 (pgina 31), obtem-se
2
s =
n
1 n
2
2 1
(cx
cx)
=
c
i
(xi x)2,
n 1 i=1
n 1 i=1
logo s = |c|s.
2.8
Distribuies bidimensionais
Em vrios estudos estatsticos assume, por vezes, maior importncia o estudo em simultneo
de duas variveis da mesma amostra, pretendendo-se estudar em que medida elas se relacionam, isto , de que forma a variao de uma influencia a variao da outra.
Exemplo 2.9. Exemplos de situaes em que se estuda a relao entre duas variveis:
relao entre as notas de Matemtica e de Cincias Fsico-Qumicas.
relao entre as classificaes da avaliao interna e as classificaes da avaliao externa, numa determinada disciplina;
relao entre o peso e a altura de um conjunto de adolescentes;
relao entre a idade do beb e o permetro ceflico;
relao entre a idade do pai e a idade da me de um conjunto de crianas.
Para estudarmos relaes deste tipo h necessidade de recolher uma amostra de dados
bivariados que pode ser representada na forma
(x1 , y1 ), (x2 , y2 ), , (xi , yi ), , (xn , yn ),
isto , (xi , yi ) com i = 1, 2, , n, onde cada indivduo contribui com um par de valores.
Definio 2.19. Distribuio bidimensional uma distribuio em que os dados so bivariados.
Estatstica no Ensino Bsico e Secundrio
43
Conceitos de Estatstica
Conceitos de Estatstica
de declive positivo (ver Figura 2.16) e ser negativa quando a maioria dos pontos se situam
volta de uma reta de declive negativo. Para medir o grau de associao linear entre duas
variveis utiliza-se o coeficiente de correlao linear de Pearson, usualmente designado
apenas por coeficiente de correlao.
rxy =
(xi x) (yi y)
i=1
sx sy
(xi x) (yi y)
i=1
r
=rn
,
n
2
2
(xi x)
(yi y)
i=1
(2.31)
i=1
1 n
(xi x)(yi y).
n 1 i=1
(2.32)
b (xi x)(yi y)
[(a + bxi ) (a + bx)](yi y)
b
i=1
r
r
r
= r ni=1
= rxy = rxy ,
n
n
n
|b|
[(a + bxi ) (a + bx)]2 (yi y)2 |b| (xi x)2 (yi y)2
i=1
i=1
i=1
i=1
45
Conceitos de Estatstica
uma vez que nas mudanas de medida, temos b > 0. Podemos assim concluir que no h
alterao do coeficiente de correlao.
Embora se possa, por observao dos diagramas de disperso, dizer se h correlao entre as duas variveis e, caso exista, se positiva ou negativa, podemos compreender melhor
porqu se analisarmos o modo como se calcula o coeficiente de correlao. Para explicar esta
ideia consideremos a nuvem de pontos relativa s idades dos pais e das mes de 15 bebs de
uma creche. Marcou-se o ponto (x, y) e um novo sistema de eixos definido pelas retas de equao x = x e y = y. As coordenadas dos pontos que definem a distribuio sero (xi x, yi y).
soma (xi x)(yi y) seja positiva e por consequncia o valor do coeficiente de correlao
i=1
ser positivo. isto que se verifica na Figura 2.16. Por outro lado, como nos quadrantes pares a abcissa e a ordenada dos pontos tm sinais contrrios, quando os pontos se concentram
nestes quadrantes, o produto maioritariamente negativo. Assim ser de esperar que a soma
n
(xi x)(yi y) seja negativa e por consequncia o valor do coeficiente de correlao ser
i=1
ente de correlao toma o valor 1. A valores prximos de zero corresponde uma correlao
46
Conceitos de Estatstica
quase nula
(8) .
Quanto maior for o valor absoluto de rxy mais forte ser a correlao linear
Coeficiente
de correlao
0, 99
II
0, 47
III
0, 02
IV
0, 51
0, 9
VI
0, 13
2.9
Aps a representao da nuvem de pontos ficamos com uma ideia da correlao que existe
entre as duas variveis. Existindo correlao linear o prximo passo traar a reta que melhor
se ajusta ao conjunto de pontos. Essa reta chama-se reta de regresso e passa pelo ponto
mdio ou centro de gravidade. A sua equao do tipo
y = ax + b.
(2.33)
Para obter esta reta recorre-se calculadora grfica ou ao computador. Ambos usam o
mtodo dos mnimos quadrados, isto , determinam a reta que melhor se aproxima dos valores
observados, de tal modo que seja mnima a soma dos quadrados dos desvios entre os valores
observados e os correspondentes na reta.
(8)
Refira-se que o facto de o coeficiente de correlao ser prximo de zero, rxy 0, no significa que no se
verifica outro tipo de dependncia entre as variveis (ver, por exemplo, o grfico VI da Figura 2.17). Este valor
indica-nos que no h uma dependncia linear das variveis.
47
Conceitos de Estatstica
Relao linear
Relao linear
Ausncia de relao
(III)
Relao linear
Relao linear
Relao
no linear (VI)
Conceitos de Estatstica
unicamente determinada recorrendo a uma calculadora.
(2.34)
onde yi representa a varivel dependente ou endgena (que o modelo pretende explicar o comportamento), xi a varivel independente ou exgena (que ser uma varivel explicativa para a
modelao de yi ), i a varivel erro (que uma varivel aleatria com algumas caractersticas
fundamentais para a fiabilidade da inferncia estatstica associada regresso) e 0 e 1 os
parmetros da regresso. A reta estimada ser da forma
ybi = b0 + b1 xi
(2.35)
i = yi ybi = yi b0 b1 xi .
(2.36)
O mtodo habitualmente utilizado para estimar os parmetros da reta o mtodo dos mnimos
quadrados (consultar, por exemplo, Montgomery et al.(2006)que determina os estimadores b0
e b1 que minimizam a soma dos quadrados dos erros, isto , que minimizam
2
n
n
f (b0 , b1 ) = i2 = yi b0 b1 xi .
i=1
(2.37)
i=1
f 0 , 1
b = y b1 x
= 0
b0
0
,
1 n
s
s
x
y
i
i
xy
y
b
b
i=1
n
= 2 = rxy
f 0 , 1 = 0
1 = 1 n 2
2
sx
sx
x
b
n i=1 i
1
(2.38)
(9)
Ao longo do presente trabalho no iremos efetuar distino entre estimador e estimativa no que se refere
notao utilizada. H, contudo, a referir que as estimativas agora representadas por b0 e b1 correspondem aos
49
Conceitos de Estatstica
onde sxy representa a covarincia entre y e x; sx o desvio padro de x e rxy o coeficiente de
correlao entre x e y. O determinante da matriz Hessiana igual a
!2
n
4n xi2 4
i=1
xi
= 4n2 s2x ,
(2.39)
i=1
que positivo (desde que xi no assuma sempre o mesmo valor). Assim sendo, a matriz
Hessiana definida positiva e os valores determinados em (2.38) correspondem efectivamente
ao mnimo pretendido.
Desta forma, na equao (2.38) temos as frmulas dos estimadores dos mnimos quadrados de 0 e 1 com os quais podemos, recorrendo regresso (2.35), obter estimativas para y
conhecendo um valor especfico de x. As propriedades da inferncia estatstica resultante desta
aplicao dependem das caractersticas dos resduos (varivel ). Contudo, uma vez que esta
abordagem no efetuada no ensino no superior, sublinhamos apenas que os estimadores
assim obtidos gozam de excelentes propriedades (no enviesamento, eficincia e consistncia) caso a varivel satisfaa determinadas caractersticas, nomeadamente a normalidade,
independncia e homocedasticidade.
Algumas caractersticas da regresso so exploradas no ensino secundrio, como ilustram
as seguintes propriedades.
Propiedade 2.8. A soma dos erros nula, isto
n
i = 0.
(2.40)
i=1
De facto
b
b
b
b
x
,
=
n
y
0
1
i 0 1i
n
i=1
Propiedade 2.9. A reta estimada pelo mtodo dos mnimos quadrados passa sempre pelo
centro de gravidade dos dados (x, y).
Efetivamente, utilizando (2.35) e (2.38), obtm-se
yb = b0 + b1 x = y b1 x + b1 x = y,
50
Conceitos de Estatstica
A grande maioria dos docentes do ensino secundrio, a avaliar pelos manuais por ns
consultados, desconhece que a reta obtida pelo mtodo dos mnimos quadrados para estimar
y em funo de x e a reta obtida para estimar x em funo de y no so, em geral, idnticas.
b0 +
b1 yi ,
xbi =
(2.41)
b1 y e
b1 = sx rxy , (cf. equao2.38) Invertendo a reta (i.e. resolvendo em funo
b0 = x
onde
y
(2.42)
Os estimadores de 0 e 1 assim obtidos, supondo rxy 6= 0 (pois caso rxy 0 a reta de regresso
no ter qualquer sentido), sero dados por:
sy
b0
b1 y
1
x
= y e1 x e e1 =
= rxy1 .
e0 = =
b1
b1
b1 sx
b0 = e0
b1 = e1 rxy = 1 rxy = 1.
b
e
1 = 1
(2.43)
(2.44)
minimizam t (xt xbt )2 . Esta diferena resulta da forma como definimos os erros nas duas
regresses, pois enquanto na primeira os erros so medidos paralelamente ao eixo das ordenadas (o erro definido pela diferena entre o valor observado de y e o seu valor estimado
tre o valor observado x e o seu valor estimado pela regresso em funo de y, t = xt xbt ,
51
Conceitos de Estatstica
cf. segundo grfico da Figura 2.18). Desta forma, ser errneo utilizar a regresso de y em
funo de x para efetuar previses para x quando conhecemos um determinado valor para y e,
apesar de em algumas aplicaes a diferena das duas retas poder ser diminuta, existem outras
situaes em que o erro pode assumir valores elevados. H, contudo, determinadas situaes
especficas para as quais se justifica a necessidade de utilizao de regresso inversa, como
ilustram alguns modelos de calibrao (cf. Brown (1993)).
ybi = b0 + b1xi
yei = e0 + e1xi
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
Os modelos de calibragem estatstica (ou, por vezes, denominados por previso inversa)
so muito usados em qumica, engenharia, bioestatstica e podem ser extremamente teis em
algumas aplicaes. Contudo, estas aplicaes so caracterizadas por contextos distintos dos
que previamente referimos. Consideremos, ento, que a varivel y medida atravs de processo complicado (muitas vezes fora do nosso alcance), dispendioso (em termos de tempo
e/ou monetariamente) mas que os seus resultados so extremamente precisos (sem erros ou
com erros negligenciveis em relao aos erros de medio da varivel x). A varivel x
medida por um processo simples, rpido, barato mas com pouca preciso (obtemos valores
aproximados). O objetivo estimar novos valores de y para alguns valores de x conhecidos.
Neste contexto, os erros a ter em conta no mtodo de regresso linear devero ser i = xbi xi
estimando-se a regresso yei = e0 + e1 xi utilizando (2.43). Com esta regresso podemos esti-
mar novos valores para y condicionados a valores conhecidos de x. Os estimadores assim obtidos, sob determinadas condies, gozam igualmente de boas propriedades. Osborne (1991)
faz uma apresentao histrica da evoluo destes mtodos, incluindo alguma discusso sobre
a problemtica inerente sua utilizao.
Contudo, estes contextos especficos nos quais a utilizao da calibrao frequentemente
utilizada, no so abordados no ensino secundrio.
52
Conceitos de Estatstica
(2.45)
(2.46)
(2.47)
rxy = 0.95
yei = e0 + e1xi
b
ye0
yb0
yei = e0 + e1xi
ybi = b0 + b1xi
b
b
b b
b b
b b b
b
b b b
b
b b
b
b b
b b b b
b b
b
b
b
b b
b
b
b
b
b b
b
b b
b
b
b
b
b
b b
b
b b
b
b
b
b b
b b
b
b
b b
b b b
ye0
yb0
y
b b
b b
x0
b
b
b
b
b b
ybi = b0 + b1xi
b
b
b
b
b
b b
b
b b
b
b
b
b b
b b
b
b
b b
b b b
b
b b
b
b
b b
b
b
b
b
b
b
b b
b b
b
b
b b
b
b
b
b
b
b
b
b b
b b
b
b
b
b
b
b
b
b
b
b
b
b
x0
yei = e0 + e1xi
b
b
b
ybi = b0 + b1xi
b
b
b
b
b
b b
b
b b
b
b
b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
b b
b
b
b
b
b b
b b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b b b
b b b b
b b
b
b
b
b
b
b b
b b
b b
b
b
b
b
b
b
b b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b b
x0
b b
b
b b
b b b
b
b
b b
b
b
b
b b
b
b
b
b b
b b
b b
b
b
b
b
b b
b b
b
b
b
b
b b b
b
b b b
b b b
b b
b b b
b
b
b
b
b b
b b
b b
b b
b b
b
b b
b b
b
rxy = 0.70
b b
b b
b b
b b
b
b
b b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b b
ye0
yb0
y
b
b
b
b
b
b
b b b b
b
b b b b
b b
b
b b
b
b b
b
b b
b b b
b
b
b
b
b b
b
b
b b
b
b
b
b
b
ye0
yb0
y
b
b
yei = e0 + e1xi
rxy = 0.80
b b
ybi = b0 + b1xi
b
b
b b
b
b b
b b
b
b
b
b
b
b
b b
b b
b b
b
b
b b
b
b b b b
b b b
b b
b b
b b
b
b
b b
b b
b
b b
b
b
b
b
b
b
b
b
b b
b
b
b
b
b b
rxy = 0.90
b
b
x0
53
Conceitos de Estatstica
podemos constatar a distino entre as duas retas, a diferena entre o valor estimado de y obtido pelas duas rectas quando x assume o valor x0 , bem como o aumento desta distncia com a
diminuio da correlao entre x e y e/ou o afastamento de x0 relativamente a x.
Estes grficos
podem ser facilmente construdos em sala de aula (cf. ilustraremos na seco 4.1.5 na pgina
71), com a vantagem de serem dinmicos, isto , ao alterarmos um ponto (ou um conjunto de
pontos) visualizarmos imediatamente as consequentes alteraes no coeficiente de correlao
e nas retas estimadas, bem como ao mudarmos a coordenada x0 percebermos as consequentes
implicaes no valor de y estimado.
54
Captulo 3
Anlise crtica aos materiais disponveis
Da anlise efetuada a um conjunto de materiais disponveis para o ensino da Estatstica no
ensino bsico e secundrio, sero apresentadas, neste captulo, vrias situaes encontradas
em manuais escolares, onde se detetaram erros e/ou gralhas relativos s representaes grficas, notao utilizada e explorao de alguns conceitos. Para cada situao detetada ser
apresentado um exemplo, mencionado o manual (ou manuais, se for o caso) e apresentada a
devida justificao.
Constatamos que nos manuais do ensino bsico h erros frequentes nas representaes
grficas, enquanto nos manuais do ensino secundrio, embora estes tambm apaream em
alguns casos, existe um erro comum no ensino da regresso linear e uso incorreto de notao.
Ilustramos, de seguida, algumas das concluses da anlise efetuada.
3.1
Um tipo de erro que surge com alguma frequncia diz respeito s representaes grficas.
Magro et al. (2010, p. 112) apresentam um grfico de linhas em que a escala do eixo vertical
no comea no zero como devia (ver Figura 3.1). Esta situao induz o leitor em erro pois
parece que a temperatura aumentou muito mais do que na realidade. Uma situao muito
semelhante verifica-se em Neves et al. (2010b, p. 30) num grfico intitulado Evoluo
da temperatura das 6 s 12 horas. Ainda neste mbito, Negra & Martinho (2010, p. 144)
apresentam um grfico de barras de frequncia relativa acumulada em que a escala do eixo
vertical est errada, apesar de comear no zero (cf. Figura 3.1). Por outro lado, uma das barras
55
Relativamente s escalas no eixo horizontal podemos ver que o grfico de barras intitulado
Carregamento de telemveis que Duarte & Filipe (2010, p. 131) apresentam, no est correto
pois a distncia entre as duas ltimas barras deveria ser o qudruplo daquela que aparece (cf.
Figura 3.2). Da forma como est parece que o maior valor da varivel 35 euros e no 50
euros. O grfico deveria tambm evidenciar que no h carregamentos mensais de 35, 40 e
45 euros, ficando no grfico o lugar dessas barras de frequncia nula. Uma situao idntica
surge no manual de 7.o ano de Costa & Rodrigues (2010b, p. 15) e ainda no manual de 8.o
ano de Neves et al. (2011, p. 21).
de referir ainda o grfico de barras no manual do 10.o ano de Costa & Rodrigues (2010a,
p. 182). Este grfico no tem qualquer escala no eixo vertical, embora as barras contenham
rtulos e alm disso no apresenta as barras igualmente espaadas. No um bom exemplo
para os alunos.
56
3.2
Apresenta-se de seguida algumas situaes onde h confuso entre dados e frequncia e que
do origem a grficos que, embora tenham barras, no so grficos de barras segundo Martins
& Ponte (2010), uma vez que no eixo horizontal no aparecem nem valores da varivel nem
modalidades.
Um exemplo surge no manual do 7.o ano de Costa & Rodrigues (2010b). A varivel em
estudo o consumo de gua, logo os dados so numricos, no entanto os autores designam
por grfico de barras um grfico que em vez de ter no eixo horizontal os valores da varivel
tem os meses do ano. O mesmo acontece noutro manual do 7.o ano. Segundo Faria et al.
(2010) num estudo em que a varivel o nmero de pares de sapatos vendidos, o grfico que
foi considerado pelos autores como um grfico de barras apresenta no eixo horizontal os dias
da semana (cf. Figura 3.3). Trata-se de um grfico com barras! Aparece igualmente mais um
exemplo destes no manual de Passos & Correia (2010). Na pgina 36 os autores apresentam
um grfico em que a varivel em estudo o nmero de latas de alumnio usadas por 10 alunos
e que no eixo horizontal tem os nomes dos alunos em vez do nmero de latas (cf. Figura 3.3).
Mesmo assim os autores perguntam o nome do grfico, esperando que os discentes respondam
grfico de barras. Neste exemplo os valores da varivel so 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, isto ,
temos 10 dados estatsticos com os quais podemos fazer uma tabela de frequncias e construir
o respetivo grfico de barras. Por exemplo, a barra referente ao valor 2 ter altura 4.
57
3.3
Quando estamos perante um conjunto de dados reais de uma varivel contnua e pretendemos
calcular a mdia devemos efetuar os clculos usando os dados reais. S deveremos recorrer s
marcas das classes quando no conhecemos os valores que pertencem a essas classes(1) . No
manual de Duarte & Filipe (2010, p. 141) aparece o clculo aproximado da mdia sem que
nada seja referido, quando os dados reais so conhecidos. Mesmo que fosse uma explicao
do procedimento a fazer noutras situaes, deve ser dito que a mdia calculada a partir das
marcas das classes um valor aproximado e que, neste caso particular, no deve ser calculada
deste modo.
3.4
Nesta seco iremos focar a ateno no erro mais comum que detetamos nos manuais por ns
consultados, a de utilizao da mesma reta de regresso, obtida pelo mtodo dos mnimos
quadrados, para estimar um valor de x condicionado a um dado valor de y bem como para
estimar um valor de y condicionado a um valor de x quando, corretamente, dever-se-iam
utilizar duas retas distintas (exceto em alguns casos muito particulares onde as duas retas
so anlogas). Um exemplo ilustrativo o livro de Jorge et al. (2010) que na pgina 83,
apresenta um diagrama de disperso que relaciona o ndice de Desenvolvimento Humano
(IDH) de Portugal com o nmero de anos decorridos aps 1975 e usa a reta de regresso
y = 0, 004x + 0, 7926 para estimar o IDH para o ano 2008, mas tambm usa a mesma reta para
saber o ano em que Portugal atingiu um determinado ndice. Este erro ser exemplificado
utilizando um software (que freeware) frequentemente utilizado no ensino da geometria no
ensino bsico e secundrio, o GeoGebra, e que uma potencial ferramenta no ensino da
regresso linear (conforme salientaremos na seco 4.1.5, na pgina 71). Em muitos manuais
utilizados no ensino secundrio utilizada a mesma reta para estimar o valor de y quando
conhecemos um valor de x (condicionada a x = x0 ) e para estimar o valor de x em funo de
um valor especfico da varivel y (y = y0 ), o que no deveria ocorrer pelas razes previamente
(1)
Esta situao frequente quer por no termos acesso aos dados em algumas situaes, quer pelo facto
de, em alguns inquritos, as perguntas surgirem logo em classes. Um exemplo ilustrativo desta situao o
rendimento mensal (pois ningum responde o seu rendimento exato).
58
Pelo facto da maioria dos professores do ensino secundrio desconhecer a existncia das
referidas diferenas, importante divulg-las de forma a serem efetuadas as correes necessrias nos manuais, bem como alertar e clarificar o corpo docente para esta situao. A
explorao de exemplos dinmicos em GeoGebra, software torna bvia a diferena entre os
dois mtodos. O clculo das duas retas automtico e alterando os valores da nossa amostra (presentes na folha de clculo do GeoGebra) permite visualizar a consequente alterao
(sensibilidade) das retas bem como dos valores estimados pelos dois modelos, razo pela qual
nos parece uma ferramenta adequada para o ensino da regresso linear conforme os objetivos
estipulados no programa de matemtica do ensino secundrio.
Perante um erro to generalizado, pretendemos divulg-lo de forma a serem efetuadas as
correes necessrias nos manuais, bem como alertar e clarificar o corpo docente para esta
situao, razo pela qual apresentamos um poster acerca deste assunto no XIX Congresso da
Sociedade Portuguesa de Estatstica (SPE) que decorreu na Nazar em setembro de 2011 (cf.
Martins et al.(2011)).
Estatstica no Ensino Bsico e Secundrio
59
3.5
Qualquer definio ao dispor do aluno deve apresentar-se da forma mais clara possvel, pois
servir de base para o trabalho que o aluno ir desenvolver volta desse tpico e o aluno ter
mais segurana se souber que para relembrar, facilmente, qualquer conceito, dispe de textos
esclarecedores. Parece-nos pouco clara, quer para alunos quer para professores, a definio de
mediana dada por Negra & Martinho (2010) que apresenta A mediana o dado que ocupa a
posio central da distribuio, quando ordenada (Negra & Martinho, p. 149). Por um lado,
atendendo ao conceito de dado estatstico, a mediana pode no ser um dado. Esta situao s
garantida se o nmero de dados for mpar. Por outro lado, apenas com esta definio um
aluno no conseguiria calcular a mediana de um conjunto de dados par, como por exemplo:
8, 9, 9, 12, 12, 15, uma vez que no referido na definio que tem de calcular a mdia dos
dois valores centrais.
3.6
Os erros relativos notao utilizada surgem com mais frequncia nos manuais do ensino
secundrio, pois no ensino bsico a linguagem simblica usada muito reduzida. Para analisarmos alguns deles podemos consultar, por exemplo, Duarte & Filipe (2010) na pgina 152,
onde na demonstrao de uma propriedade da mdia se l:
Sejam x1 , x2 , x3 , , xn os N valores da distribuio X, sendo
x=
x1 + x2 + x3 ... + xn
.
N
(3.1)
Quando observamos o que est escrito pode parecer-nos uma gralha e que basta trocar n
por N. No entanto poder fazer alguma confuso aos alunos pois na pgina anterior os autores
usam a letra n para designar o nmero de valores diferentes da varivel e usam N para designar
o nmero total de valores da distribuio.
Tambm podemos verificar uma situao semelhante em Neves et al. (2010a, p. 129),
onde aparece a seguinte frmula da varincia:
60
s2 =
(xi x)2 ni
i=1
n1
(3.2)
61
Notao
Descrio
dimenso da amosta
dimenso da populao
x1 , , xn
observaes da amostra
x(1) , , x(n)
x1 , , xp
ni
frequncia absoluta de xi
Ni
fi
frequncia relativa de xi
Fi
Mo
moda
Me
mediana
Q1
1.o quartil
Q3
3.o quartil
Percentil
nmero de classes
hi
IT
amplitude total
IQ
amplitude Interquartis
s2
62
Captulo 4
Materiais e sugestes metodolgicas
Neste captulo vamos apresentar algumas propostas de trabalho para a sala de aula com recurso ao software GeoGebra (ir ser utilizada a verso 4). Este programa gratuito (disponvel
em www.geogebra.org) e muito utilizado em Geometria por ser dinmico. Neste trabalho pretendemos explorar as suas potencialidades no ensino e aprendizagem da estatstica e, por isso,
apresentamos em primeiro lugar uma explicao mais detalhada sobre os vrios comandos
que sero utilizados nessas propostas de trabalho.
4.1
O GeoGebra uma potencial ferramenta que pode ser explorada no ensino da Estatstica.
Com este software podemos construir tabelas de frequncia, vrios tipos de grficos (grficos
de barras, grficos de pontos, histogramas, diagramas de caule e folhas, diagramas de extremos e quartis e diagramas de disperso), calcular quase todas as medidas estatsticas que so
lecionadas no ensino bsico e no ensino secundrio, e pelo facto de ser um software dinmico,
podemos alterar os dados e verificar os efeitos dessas alteraes quer nos grficos quer nas
medidas estatsticas, permitindo fazer vrias exploraes dos conceitos. Esta possibilidade de
usar a tecnologia nas aulas de Matemtica permitir melhorar as oportunidades de aprendizagem dos alunos se aproveitarmos aquilo que a tecnologia faz de forma correcta e eficiente
construo de grficos, visualizao e clculo. NCTM (2008, p. 27).
63
64
65
GrficoPontos[<Lista de Dados No Classificados>] Permite obter um grfico de pontos a partir dos dados no classificados.
66
67
Comando
mdia
moda
mediana
quartil 1
quartil 3
percentil
varincia
desvio padro
69
71
e ye0 representados nos grficos da Figura 2.19 da pgina 53). Para melhor visualizar o valor
das estimativas obtidas podemos criar segmentos de retas paralelos ao eixos das abcissas que
liguem P1 e P2 ao eixo das ordenadas (de forma anloga apresentada nos grficos da Figura
2.18). Com esta construo, caso alteremos a abcissa x0 do ponto A, as estimativas obtidas sero automaticamente ajustadas, permitindo, desta forma, observar as suas diferenas quando
utilizamos valores para x0 mais prximos ou mais afastados de x.
4.2
Nesta seco vamos apresentar algumas propostas de trabalho para a sala de aula com recurso ao GeoGebra. Algumas destas propostas sero mais orientadas para o ensino bsico e
outras sero elaboradas para serem aplicadas no ensino secundrio. Procurou-se aliar o uso
do computador anlise de dados reais, conforme recomendado em vrios documentos tais
como NCTM (2007), Branco (2000), Ponte et al. (2007). Para cada proposta sero definidos
72
73
75
4.2.7 Proposta 7 Peso e altura dos alunos de uma turma do 10.o ano
Esta proposta (presente no anexo A.7) destina-se aos alunos do 10.o ano e tem como objetivos:
construir diagramas de disperso;
interpretar a reta de regresso e conhecer as suas limitaes;
distinguir a regresso de x em ordem a y da regresso de y em ordem a x.
Esta proposta prev a recolha de dados na turma. Por vezes os alunos no gostam que o seu
peso seja conhecido. Caso o professor entenda poder levar os dados e ultrapassar essa situao. Chama-se especial ateno para o facto da maioria dos manuais escolares no explorar
a representao das duas retas de regresso (a reta de regresso de y em funo de x e a reta
de regresso de x em funo de y). Pretende-se que os alunos compreendam que so distintas, podendo ser feitas algumas experincias que consistem em alterar um ou mais pontos da
lista e verificar as alteraes nas retas e no coeficiente de correlao. habitual, em alguns
manuais, pedir-se estimativas de y em relao a x e de x em relao a y, usando a mesma
reta. Os alunos devero compreender que tal situao incorreta pois as retas so distintas.
Para o confirmarem bastar definir um ponto A [de coordenadas (x0 , 0)] no eixo das abcissas,
os segmentos de reta paralelos ao eixo das ordenadas que liguem o ponto A a cada uma das
retas estimadas definem os pontos P1 e P2 das retas com abcissa x0 . As ordenadas dos pontos
P1 e P2 correspondem s estimativas obtidas com cada uma das retas. Esta situao pode ser
explorada usando as alneas 8 e 9 da proposta.
77
Captulo 5
Concluso
Atualmente fundamental que o cidado comum tenha a capacidade de compreender a informao estatstica que lhe chega diariamente de vrias formas. Os currculos tm-se alterado
no sentido de desenvolver nos alunos esta competncia. Assim, desde o reajustamento do Programa de Matemtica para o ensino bsico, o tema matemtico Organizao e Tratamento
de Dados percorre todo o ensino bsico, desde o 1.o ciclo at ao 3.o ciclo e para cada ciclo
foi definido um propsito principal de ensino que se assume como a orientao mais importante para o ensino deste tema. No caso particular do terceiro ciclo pode ler-se Desenvolver
nos alunos a capacidade de compreender e de produzir informao estatstica bem como de a
utilizar para resolver problemas e tomar decises informadas (...). (Ponte et al., 2007, p. 59).
Acrescente-se ainda que os tpicos estudados at ao 3.o ciclo so posteriormente desenvolvidos no 10.o ano no tema Estatstica, lecionado no terceiro perodo.
Dada a importncia desta rea no ensino, ao realizarmos este trabalho, consideramos til
a elaborao de um texto, direcionado aos professores, que aposta no rigor e apresenta os
conceitos fundamentais de Estatstica lecionados nestes ciclos de ensino; salientamos algumas
incorrees detetadas nos materiais disponveis para o ensino da Estatstica; apresentamos
uma seco onde se aprofunda a regresso linear, pois encontramos um erro comum neste
tema e, por fim, criamos propostas de trabalho para a sala de aula com recurso tecnologia,
permitindo a explorao dos conceitos de uma forma prtica, evitando deste modo que a
estatstica seja reduzida repetncia de clculos fastidiosos desprovidos de significado (cf.
Carvalho (2006)).
Sabendo que o nmero de recursos disponveis para o ensino da Estatstica que incluam
79
Concluso
a utilizao do GeoGebra escasso, situao que se confirmou aquando da anlise de um
conjunto de materiais disponveis, este projeto pretende ser um contributo importante para
o trabalho dos professores no ensino desta rea da matemtica, uma vez que nele se mostra
como operacionalizar as orientaes atuais e como implementar tarefas seguindo essas orientaes. Sabendo que a tecnologia crucial no tratamento de dados, recorremos ao GeoGebra um software inovador no ensino e aprendizagem da Estatstica que pode ser uma alternativa a
outros softwares/instrumentos, por ser gratuito e dinmico. Ao apresentarmos um conjunto de
propostas de trabalho tivemos a preocupao de incluir os objetivos e escrever alguns comentrios de modo a facilitar a sua aplicao na sala de aula. Refira-se que a maioria das propostas
explora o facto deste software ser dinmico, permitindo ao aluno alterar os dados escritos na
folha de clculo e verificar rapidamente os efeitos dessas alteraes quer nos grficos quer nas
medidas estatsticas. Como refere Zawojewski A folha de clculo recalcula todos os dados
de uma s vez e indica os resultados imediatamente. Assim, o professor pode concentrar-se
no efeito de introduzir certas alteraes que, de outro modo, poderiam perder-se no pntano
dos clculos individuais (Zawojewski, 1992, p. 33).
Uma vez que este tema apresentado nos manuais com algumas imprecises, torna-se
necessrio que investigadores e professores se debrucem sobre estas questes, desenvolvendo
um trabalho cada vez mais rigoroso ao nvel do ensino da Estatstica de modo a formar cidados cada vez mais ativos, interventivos e crticos.
Deste modo, espera-se que o presente trabalho possa dar um pequeno contributo para o
incremento da qualidade do ensino da Estatstica.
80
Referncias Bibliogrficas
APM (1998). Matemtica 2001: Diagnstico e recomendaes para o ensino e aprendizagem da Matemtica. Lisboa: APM.
BATANERO , C. & G ODINO , J.D. (2003). Estocstica y su Didctica para Maestros,
Departamento de Didctica de la Matemtica, Facultad de Ciencias de la Educacin, Universidad de Granada (disponvel em http://www.ugr.es/~jgodino/
edumat-maestros).
B RANCO , J. & M ARTINS , M. (2002). Literacia Estatstica, Educao e Matemtica, n.o 69,
pp. 913.
B ROWN, P.J. (1993). Measurement, Regression, and Calibration, Oxford University Press.
C ARVALHO , C. (2006). Desafios educao estatstica, em Ensino e Aprendizagem da
Estatstica, Boletim da SPE, Outono, pp. 78.
C OSTA , B. & RODRIGUES , E. (2010a). Novo Espao-Parte 2 Matemtica A 10.o Ano, Porto
Editora, Porto.
C OSTA , B. & RODRIGUES , E. (2010b). Novo Espao-Parte 2 Matemtica 7.o Ano, Porto
Editora, Porto.
D UARTE , T.O. & F ILIPE , J.P. (2010). Matemtica Dez -Parte 2, Lisboa Editora, Lisboa.
FARIA , L.; G UERREIRO , L. & A LMEIDA , P.R. (2010). Matemtica Dinmica- Matemtica 7.o Ano Parte 2, Porto Editora, Porto.
F ERNANDES , J.A. (2009). Ensino e aprendizagem da estatstica - Realidades e Desafios,
Actas do XIX EIEM, Vila Real.
INE, I.P. (2009). Um mundo para conhecer os nmeros, INE-DREN-ESTP, Lisboa.
81
Referncias Bibliogrficas
J ORGE , A.M.B.; A LVES , C.B.; F ONSECA , C.C.G.; BARBEDO , J. & S IMES , M. (2010).
Matemtica A 10- Parte 3, Areal Editores, Lisboa.
L OURA , L. (2009). Organizao e Tratamento de Dados no Novo Programa de Matemtica
do Ensino Bsico, Educao e Matemtica, n.o 105, pp. 4649.
L OUREIRO , C.; O LIVEIRA , F. & B RUNHEIRA , L. EDS . (2000). Ensino e Aprendizagem da
Estatstica, SPE, APM e DEIOFCUL, Lisboa.
M AGRO , F.C.; F IDALGO , F. & L OUANO , P. (2010). 7 - Matemtica 7.o ano, ASA,
Lisboa.
M ARTINHO , M.H. & V ISEU , F. (2009). Desenvolvimento da literacia estatstica em dois
manuais escolares do 7.o ano de escolaridade, Actas do XIX EIEM, Vila Real.
M ARTINS , A., R IBEIRO , H. & S ANTOS , R. (2011). Estatstica no ensino secundrio um contributo para a clarificao do estudo da regresso linear simples, SPE 2011 Programa e Resumos, pp. 283-284.
M ARTINS , M.E.G.; M ONTEIRO , C.; V IANA , J.P. & T URKMAN , M.A.A. (1997). Estatstica, ME-DES, Lisboa.
M ARTINS , M.E.G. & C ERVEIRA , A. (1999). Introduo s Probabilidades e Estatstica,
Universidade Aberta.
M ARTINS , M.E.G. (2005). Introduo Probabilidade e Estatstica, Sociedade Portuguesa de Estatstica, Lisboa.
M ARTINS , M.E.G.; L OURA , L. & M ENDES , M. (2007). Anlise de Dados - texto de apoio
para os Professores do 1.o ciclo, ME-DGIDC, Lisboa.
M ARTINS , M.E.G & P ONTE , J. (2010). Organizao e Tratamento de Dados, MEDGIDC, Lisboa.
M ONTGOMERY, D.C., P ECK , E.A. & V INING , G.G. (2006). Introduction to Linear Regression Analysis, 4th Ed., Wiley Series in Probability and Statistics, John Wiley &
Sons.
M URTEIRA , B. (1993). Anlise exploratria de dados - Estatstica Descritiva, McGrawHill, Lisboa.
NASCIMENTO , M. (2009). Literacia Estatstica na Escola, Cidadania na Vida, Actas do II
Encontro de Probabilidades e Estatstica na Escola, Universidade do Minho, pp. 91
99.
82
Referncias Bibliogrficas
N EGRA , C. & M ARTINHO , E. (2010). Matemtica A-10.o ano Volume 2, Santillana, Carnaxide.
NCTM (2008). Princpios e Normas para a Matemtica Escolar, 2.a ed., NCTM e APM,
Lisboa.
N EVES , M.A.F.; G UERREIRO , L.; L EITE , A. & S ILVA , J.N. (2010a). Matemtica A 10.o
Ano - Estatstica, Porto Editora, Porto.
N EVES , M.A.F.; FARIA , L. & S ILVA , J.N. (2010b). Matemtica 5.o Ano - Parte 3, Porto
Editora, Porto.
N EVES , M.A.F.; S ILVA , A. P.; R APOSO , M.J. & S ILVA , J.N. (2011). Matemtica 8.o
Ano - Parte 2, Porto Editora, Porto.
O SBORNE , C.(1991). Statistical Calibration: A Review, International Statistical Review 59,
n.o 3, pp. 309336.
PASSOS , I.C. & C ORREIA , O.F. (2010). Matemtica em aco 7 -Parte 2, Lisboa Editora,
Lisboa.
P ESTANA , D. D. & V ELOSA , S. F. (2009). Introduo Probabilidade e Estatstica, Vol.
1, 3.a ed., Fundao Calouste Gulbenkian, Lisboa.
P ONTE , J.P.; S ERRAZINA , L.; G UIMARES , H. M.; B RENDA , A.; G UIMARES , F.;
S OUSA , H.; M ENEZES , L.; M ARTINS , M.E. G. & O LIVEIRA , P. A. (2007). Programa de Matemtica do Ensino Bsico, ME-DGIDC, Lisboa.
R EIS , E. (1998). Estatstica Descritiva, Edies Slabo, Lisboa.
S ILVA , J.C.; F ONSECA , M.G.; M ARTINS , A.A.; F ONSECA , C.M.C. & L OPES , I.M.C.
(2001). Programa de Matemtica A - Ensino Secundrio, ME-DES, Lisboa.
Z AWOJEWSKI , J.S.; B ROOKS ,G.; D INKELKAMP, L.; G OLDBERG ,E.D.; G OLDBERG , H.;
H YDE , A.; JACKSON , T.; L ANDAU , M.; M ARTIN , H.; N OWAKOWSKI , J.; PAULL ,
S.; S HULTE , A.P.; WAGREICH , P. & W ILMOT, B. (1992). Dealing with data and
chance, The National Council of Teachers of Mathematics, Inc., Virginia (Traduo de
Snia Figueirinhas, Lidar com dados e probabilidades - Normas para o Currculo e a
Avaliao em Matemtica Escolar, Coleco de Adendas, Anos de Escolaridade 5-8,
APM).
83
Referncias Bibliogrficas
Pginas da Internet
ALEA www.alea.pt
84
Apndice A
Propostas de trabalho para a sala de aula
II
50 48
44
92 41
68
82
53 62
38
81 62
43
73
44 63
88
53 73
64
42
70 75
49
59 52
53
III
IV
Frequncia
transporte
absoluta
mais utilizado
A p
17
Autocarro
12
Carro
Bicicleta
Total
40
VI
Moda[interna] e Mediana[interna].
7. Determina a amplitude, o 1.o quartil, o 3.o quartil e a amplitude interquartis. Usa os
comandos Q1[interna] e Q3[interna].
8. Procede de modo idntico para os resultados da avaliao externa, criando uma lista que
podes designar por externa.
9. Compara as medidas de tendncia central obtidas nas duas variveis. O que podes
concluir?
10. Compara a amplitude e a amplitude interquartis obtidas. O que podes concluir?
11. Obtm, agora, os dois diagramas de extremos e quartis procedendo do seguinte modo:
seleciona as duas listas inseridas na folha de clculo e clica no icon da barra de ferramentas que apresenta um grfico e escolhe anlise multivariada. Para alm dos
Estatstica no Ensino Bsico e Secundrio
VII
Aluno
Avaliao Avaliao
interna
externa
10
11
11
10
11
10
13
12
13
13
16
15
15
15
17
16
10
10
11
11
11
13
12
14
13
13
11
11
14
10
11
15
12
12
16
15
12
17
11
11
18
11
10
19
16
15
20
15
13
21
12
10
22
10
23
19
18
24
10
11
25
11
10
26
14
14
27
12
13
VIII
IX
Nmero
Salrio
de emprego
de trabalhadores
(em euros)
Presidente
12000
Vice-presidente
6000
Gerente
2800
Supervisor
1100
Operrio
33
900
Funcionrio de Caixa
750
Tesoureiro
700
Vendedor
12
600
Guarda
500
XI
20
Usa o co-
XIII
XIV