Escolar Documentos
Profissional Documentos
Cultura Documentos
Lori Viali
Departamento de Estatstica, PUCRS e UFRGS
RESUMO
A distribuio normal ou curva de Gauss-Moivre-Laplace o principal modelo
probabilstico contnuo, pois serve de base para a principal rea da Estatstica: a
Inferncia. A distribuio normal faz parte do currculo de praticamente todas as
disciplinas que envolvem Probabilidade, Estatstica ou Estocstica. Desta forma a
sua compreenso, alm da simples memorizao, fundamental para que o
processo de ensino-aprendizagem tenha sucesso. Neste estudo o ensino da
distribuio normal e do teorema do limite central feito com o recurso de trs
exemplos prticos. O primeiro explora a gerao de nmeros aleatrios e o
teorema do limite central; o segundo mostra a relao da mdia com o desvio
padro e o terceiro utiliza resultados de um concurso vestibular para ilustrar
clculos que envolvem a distribuio.
Palavras-chave: Educao Estatstica, distribuio Normal, curva de Gauss.
ABSTRACT
The normal distribution or Gauss-Moivre-Laplace model is the main continuous
model in the Probability theory, because it is the base to the Statistical Inference
area. The normal distribution is included in practically all disciplines involving
probability theory, statistics or randomness. In this way, it real understanding,
beyond simple memorization, is basic to a successful teach-learning process. In
this study the teaching of normal model and the central limit theorem are realized
using three practical examples as a resource. The first explores how to generate
random numbers in Excel and the central limit theorem; the second shows the
relation between mean and standard deviations in Normal distribution and the third
uses data from university entrance examinations to illustrate the calculation of
probabilities.
Keywords: Statistical Education, Normal distribution, Gaussian model.
1 Introduo
A distribuio normal ou curva de Gauss um modelo que descreve o
comportamento de vrios fenmenos aleatrios. Os contedos referentes a este
modelo geralmente esto inseridos em disciplinas de Probabilidade e/ou
Estatstica sob um tpico denominado variveis aleatrias contnuas.
Antes de prosseguir, faamos a distino entre Probabilidade e Estatstica.
Existe uma grande confuso entre estes dois termos, apresentados de maneira
equivocada numa grande quantidade de livros texto de Estatstica. Contrariando
muitos pensamentos, Probabilidade no uma rea da Estatstica, mas sim uma
rea da Matemtica que trata da modelagem de fenmenos aleatrios. Os
fenmenos ou a forma de trat-los podem ser divididos em dois tipos: os
determinsticos e os no-determinsticos ou probabilsticos. Os fenmenos
determinsticos so modelados pela matemtica atravs de equaes, equaes
diferenciais ou sistemas de equaes que fazem parte de grande quantidade de
disciplinas, como o clculo ou a lgebra, entre outras. Os fenmenos nodetermsticos
so
assuntos
da
teoria
da
probabilidade
que,
quase
2 Histrico
A distribuio normal foi introduzida inicialmente pelo matemtico francs
Abraham de Moivre (1667 1754) em um artigo que foi reimpresso na segunda
edio do seu livro A doutrina do acaso de 1738. Ele percebeu que medida
que nmero de eventos do lanamento de moedas aumentava a distribuio
binomial se aproximava de uma curva suave.
Seus resultados foram estendidos pelo francs Pierre Simon de Laplace
(1748 1827) em seu livro Teoria Analtica da Probabilidade de 1812, num
resultado que hoje conhecido como Teorema de Moivre-Laplace. Laplace
utilizou a distribuio na anlise de erros de experimentos. Ele tambm mostrou
que mesmo uma distribuio no sendo normal a mdia de repetidas amostras
dessa distribuio aproximadamente normal e que quanto maior for o tamanho
da amostra melhor ser essa aproximao.
O italiano Galileo Galilei (1564 - 1642) j havia notado que esses erros
eram simtricos e que os valores pequenos apresentavam uma freqncia de
ocorrncia maior do que os valores grandes.
A primeira pessoa a aplicar a distribuio normal na rea social foi o belga
Adolph Quetelet (1796-1874) que coletou dados sobre medidas do peito de
soldados escoceses e da altura de soldados franceses e verificou que elas
podiam ser modeladas pela distribuio.
De forma independente os matemticos alemes Robert Adrian (17751843) em 1808 e Carl Friedrich Gauss (1777 - 1855) em 1809 desenvolveram a
fenmenos
naturais
apresentam
uma
distribuio
normal
ou
1,0
N(0; 1)
N(0; 0,5)
N(0; 2)
0,8
N(2; 1)
0,6
0,4
0,2
0,0
-5,0
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
4,0
5,0
6,0
mesmo o da rea de exatas, acaba vendo esse tipo de contedo apenas como
um conjunto de regras com pouco ou nenhum significado deixando de perceber
assim a beleza subjacente e a riqueza de idias e conceitos envolvidos. Com esta
forma de abordagem um assunto normalmente aborrecido passa a ter vida e o
aluno verifica que o esforo empregado no estudo do Clculo agora
compensado em parte.
Como exerccio, o professor pode solicitar aos alunos que obtenham as
seguintes probabilidades a partir de uma tabela ou com o recurso de um software.
importante ressaltar que, independentemente dos valores de e , estas
probabilidades se mantm.
P( X + ) = P(1 Z 1) 68,26%
P( 2 X + 2 ) = P(2 Z 2) 95,45%
P( 3 X + 3 ) = P(3 Z 3) 99,73%
x ;
+ 2 + 3
f ( x )dx 2 =
1 x 2
exp
dx = ( x )
2
2
x
P(X<x) =
>0
f(z)=
x2
exp
, para
2
2
1
z ;
=0;
=1
P(Z<z) =
z2
exp dz = ( z ) (tabelada)
2
2
1
Xi
X = i =1
n
~ Normal ;
5 Atividades Prticas
Neste item so apresentadas trs atividades prticas que podem ser
apresentadas em disciplinas de Estatstica ministradas em cursos de graduao.
Atividade 1 O Teorema do Limite central na prtica
devido ao teorema do limite central (TLC) que a distribuio Normal tem grande
destaque na Estatstica. O TLC garante que o comportamento probabilstico de
vrios estimadores possa ser descrito com boa aproximao pela distribuio
normal. Alm disso, muitas variveis encontradas na natureza tendem a
apresentar comportamento normal como outra conseqncia visvel deste
teorema. Quando observamos variveis na natureza ou em qualquer outro
experimento observacional, um dado valor observado pode ser considerado como
a resultante de um grande nmero de variveis e suas interaes, o que est em
sintonia com o TLC.
Para exemplificar o teorema utilizado o gerador de nmeros pseudoaleatrios da planilha Excel e algumas de suas funes. A primeira atividade
consiste em gerar k = 10, 30, 120 e 250 colunas com 1000 observaes cada
uma utilizando a funo ALEATRIO(), conforme mostrado na Figura 2. Para
cada valor de k cria-se uma coluna adicional com a soma e/ou a mdia dos k
valores. O recomendvel e utilizar mdia para se poder comparar os diferentes
valores de k.
A funo ALEATRIO() gera valores no intervalo [0;1] segundo uma
distribuio uniforme. O valor esperado e a varincia da Uniforme, neste intervalo,
so iguais a 1/2 e 1/12, respectivamente. A mdia de k variveis uniformes
converge para uma normal de mdia 1/2 e varincia igual a 1/12k. O aluno, dessa
forma, pode comprovar que, de fato, os valores aleatrios gerados se comportam
de acordo com o modelo.
A Tabela 1 resume os resultados da mdia e do desvio-padro esperados
e observados para diferentes valores de k. Os resultados comprovam o teorema
que deixa assim de ser uma questo de f para se tornar uma experincia
10
Esperados
k
10
30
120
250
Esperana
0,5
0,5
0,5
0,5
Varincia
0,00833
0,00278
0,00069
0,00033
Observados
Mdia
0,497
0,500
0,500
0,500
Varincia
0,00739
0,00273
0,00069
0,00039
800
800
700
700
600
600
500
500
400
400
Nmero de amostras
Nmero de amostras
11
300
200
100
0
,20
,30
,40
,50
,60
300
200
100
0
,70
,20
,30
,40
,50
,60
,70
,50
,60
,70
800
800
700
600
600
500
400
Nmero de amostras
Nmero de amostras
400
300
200
100
0
,20
,30
,40
,50
,60
,70
200
0
,20
,30
,40
12
Tabela 2 Percentual de valores simulados no intervalo mdia mais ou menos um, dois e
trs desvios padro
k
10
30
120
250
Mdia
0,497
0,500
0,500
0,500
0,0860
mdia + 1 desvio
mdia + 2 desvios
mdia + 3 desvios
Esperado
(%)
68,27
95,44
99,74
Observado
(%)
671/1000 = 67,10
937/1000 = 93,70
997/1000 = 99,70
0,0523
mdia + 1 desvio
mdia + 2 desvios
mdia + 3 desvios
68,27
95,44
99,74
679/1000 = 67,90
951/1000 = 95,10
995/1000 = 99,50
0,0263
mdia + 1 desvio
mdia + 2 desvios
mdia + 3 desvios
68,27
95,44
99,74
681/1000 = 68,10
959/1000 = 95,90
998/1000 = 99,8
0,0198
mdia + 1 desvio
mdia + 2 desvios
mdia + 3 desvios
68,27
95,44
99,74
683/1000 = 68,30
950/1000 = 95,00
997/1000 = 99,70
Desvio-padro
Intervalo
13
Nmero de alunos
3500
3000
2500
2000
1500
1000
500
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Fo
nte: http://www.ufrgs.br/cvresultados/histogramas/
14
Nmero de
Alunos (fi)
5
5
32
111
275
650
1142
1588
2182
2772
3042
3222
3194
2876
2687
2231
1923
1492
1197
851
520
345
202
107
35
16
6
2
0
0
0
32710
% do nmero de
alunos (fri)
0,015
0,015
0,098
0,339
0,841
1,987
3,491
4,855
6,671
8,474
9,300
9,850
9,765
8,792
8,215
6,821
5,879
4,561
3,659
2,602
1,590
1,055
0,618
0,327
0,107
0,049
0,018
0,006
0,000
0,000
0,000
100,000
Acumulado do no % acumulado do
de alunos (Fi)
de alunos (Fri)
5
0,015
10
0,031
42
0,128
153
0,468
428
1,308
1078
3,296
2220
6,787
3808
11,642
5990
18,312
8762
26,787
11804
36,087
15026
45,937
18220
55,702
21096
64,494
23783
72,709
26014
79,529
27937
85,408
29429
89,969
30626
93,629
31477
96,231
31997
97,820
32342
98,875
32544
99,493
32651
99,820
32686
99,927
32702
99,976
32708
99,994
32710
100,000
32710
100,000
32710
100,000
32710
100,000
-
15
20 12 ,16
P( X > 20 ) = P Z >
= P( Z > 1,99 ) = 1 ( 1,99 ) 0,0233 = 2,33%
3,94
6 Consideraes Finais
A distribuio Normal lecionada nos cursos de graduao de todas as reas que
trabalham com investigao cientfica. Apesar de ser freqente a grande
quantidade de contedo para poucas horas-aula semanais, julgamos ser muito
difcil o ensino da distribuio normal se for ignorado os conceitos bsicos de
Probabilidade. Sem um conhecimento prvio de variveis aleatrias discretas e
contnuas, esperana e varincia, fica muito difcil conduzir aulas que realmente
colaborem para o verdadeiro aprendizado do aluno.
Neste artigo estimula-se que professores de Probabilidade e Estatstica
usufruam os recursos da planilha com atividades que ilustrem conceitos
probabilsticos e estatsticos, especialmente os recursos de simulao. A planilha
Excel permite a gerao de nmeros pseudo-aleatrios que seguem uma
distribuio Uniforme no intervalo [0;1]. A partir da Uniforme pode-se simular
quaisquer outras distribuies, ilustrando de uma forma concreta contedos de
outra forma ficariam apenas na memria de curto prazo e que poderiam ser
esquecidos to logo no fossem mais solicitados.
Com o recurso da planilha o aluno o agente da sua aprendizagem e
desta forma toma parte ativa na construo do seu conhecimento tornando dessa
forma indelvel.
16
Referncias
BATANERO, Carmen, TAUBER, L. SNCHEZ, M. V. Significado y compreensin
de la distribucin normal en un curso introductorio de anlisis de datos.
Quadrante. v. 10, n. 1, p. 59-92, 2001.
BATANERO, Carmen, TAUBER, L., MEYER, R. From Data Analysis to Inference:
A Research Project on Students' Understanding of The Normal Distribution. ISI 52
Session, Helsinki, Finland. 1999.
BATANERO, Carmen, TAUBER, L., SNCHEZ, M. V. Students reasoning about
the normal distribution. In D. Ben-Zvi y J.B. Garfield (Eds) The Challenge of
Developing Statistical Literacy, Reasoning, and Thinking. Dordrecht: Kluwer. p.
257-76, 2004.
BAYER, A.; ECHEVESTE, S.; BITTENCOURT, H. R. ; ROCHA, J. . Preparao
do formando em Matemtica-licenciatura plena para lecionar Estatstica no Ensino
Fundamental e Mdio. In: V Encontro Nacional de Pesquisa em Educao em
Cincias, 2005, Bauru, SP. Anais... , 2005. v.
DAW, R. H., PEARSON, E. S. Studies in the history of probability and statistics:
Abraham de Moivre's 1733 derivation of the normal curve: a bibliographical note,
Biometrika 59 (1972), 677-680.
DOANE D. P.