Você está na página 1de 95

ESTATÍSTICA BÁSICA

SUMÁRIO

INTRODUÇÃO ................................................................................... 03

1 O ENSINO DE ESTATÍSTICA E OS PCN ......................................... 04


1.1 ESTATÍSTICA: conceitos, fundamentos e epistemologia ................................... 05
1.2 A Estatística na escola ........................................................................................ 09
1.3 A Estatística na formação da cidadania .............................................................. 12
1.3.1 No Ensino Fundamental ................................................................................... 13
1.4 Os livros didáticos e a construção de conceitos .................................................. 15

2 O ENSINO DA ESTATÍSTICA NA EDUCAÇÃO BÁSICA:


IMPORTÂNCIA, ENTRAVES E PERSPECTIVAS.................................24
2.1 A didáticas do ensino de estatística .................................................................... 29
2.1.1 Sequências didáticas desenvolvidas ................................................................ 34

3 PRINCÍPIOS DE ESTATÍSTICA ........................................................ 37


3.1 População e Amostra .......................................................................................... 38
3.1.1 Recenseamento ............................................................................................... 39
3.1.2 Estatística descritiva e estatística indutiva ....................................................... 39
3.1.3 Não probabilística ............................................................................................ 40
3.1.4 Probabilística ................................................................................................... 41
3.2 Dimensionamento da amostra ............................................................................. 42
3.3 Tipos de dados .................................................................................................... 43
3.3.1 Agrupamento dos dados .................................................................................. 44
3.3.2 Algumas funções do Excel para descrição dos dados ..................................... 46
3.4 Frequência acumulada ........................................................................................ 51
3.5 Distribuição de frequências com dados agrupados ............................................. 54
3.6 Dados, tabelas e gráficos .................................................................................... 58
3.6.1 Distribuições simétricas ................................................................................... 60
3.6.2 Distribuições Assimétricas ...................................................................... 60
3.6.3 Distribuições com “caudas” longas .................................................................. 60
3.7 Medidas de tendência central .............................................................................. 60
3.8 Moda ................................................................................................................. 62
3.9 Mediana............................................................................................................. 62
3.10 Considerações a respeito de Média e Mediana ................................................ 62
3.11 Medidas de dispersão ....................................................................................... 63
3.11.1 Variância ........................................................................................................ 63
3.11.2 Desvio Padrão ................................................................................................ 64
3.11.3 Distribuição normal ......................................................................................... 65
REFERÊNCIAS UTILIZADAS E CONSULTADAS .............................. 67
ANEXOS ............................................................................................... 69
3

INTRODUÇÃO

Esta disciplina foi desenvolvida, objetivando analisar o ensino da estatística na


educação básica.

Para tanto, abordar-se-á a o ensino da estatística em consonância com os


Parâmetros Curriculares Nacionais, dentro do que é proposto para o ensino da
Matemática, principalmente, da Matemática Financeira e seus conceitos, juntamente
com os elementos básicos que constituem a estatística e sua didática, além de
analisar as operações elementares da mesma, objetivando contextualizá-la e analisá-
la do ponto de vista da didática e da pedagogia.

Por acreditarmos que a pesquisa é fundamental para o desenvolvimento de


uma educação de qualidade, enumeramos e analisamos diversas publicações
acadêmicas, sobre a temática do ensino e aprendizagem da Estatística, no âmbito do
Brasil, bem como, relatamos trabalhos que tratam das dificuldades, demonstradas
pelos alunos, nessa disciplina.

Dando continuidade à nossa proposta, esboçada no título dessa disciplina: O


Ensino da Estatística, buscamos analisá-la numa perspectiva dos Parâmetros
Curriculares Nacionais, bem como, as abordagens que são feitas em alguns dos
muitos livros didáticos utilizados nas escolas do país, culminando com algumas
sugestões e sequências didáticas para o ensino da mesma.

Por fim, achamos importante relacionar algumas fórmulas utilizadas na


estatística, bem como um glossário contendo os termos referentes à mesma e, não
obstante, algumas atividades são ofertadas para a prática da mesma.

Por tudo isso, esperamos que você desenvolva seus conhecimentos, acerca
do tema proposto e que faça, também, uma excelente leitura, obtendo o sucesso que
almejas.

Outras informações e aprofundamentos devem ser buscados através da leitura


da bibliografia utilizada e relacionada ao final desta. Coordenação pedagógica
4

1 O ENSINO DE ESTATÍSTICA E OS PCN

A problemática da educação de qualidade no Brasil vem sendo discutida a todo


o momento e, em diversos veículos de informação, visto que, os resultados obtidos,
pelo país, em testes e avaliações, internas e externas, no que tange à Matemática,
causam um grande impacto àqueles que se preocupam com o futuro do país e de
seus cidadãos, bem como, nos levam a refletir sobre, o que de fato, provoca ou
interfere nesses resultados.

Dentre os fatores causadores desses péssimos resultados, um deles reside nos


livros didáticos e na complexidade que os cerca, haja vista, o envolvimento de uma
série de fatores que dificultam a sua solução, tais como: a formação de professores;
as propostas curriculares (regionais) bastante distintas; as questões comerciais das
editoras e, ainda, as avaliações do Ministério de Educação e Cultura (MEC). Em
sendo, pensamos que um olhar cuidadoso sobre os livros didáticos recomendados
para o ensino fundamental, auxilia na percepção da concepção de ensino de
estatística que predomina em nossa escola básica.

Assim, de acordo com os Parâmetros Curriculares Nacionais elaborados e


publicados pela SEF/MEC, o tema estatística e probabilidade estão recomendados no
bloco de conteúdo “Tratamento da Informação” do currículo de Matemática. Nesse
bloco, além da probabilidade e da estatística inclui-se a combinatória, considerando
que tais assuntos possibilitam, de acordo com os Parâmetros Curriculares Nacionais,
“o desenvolvimento de formas particulares de pensamento e raciocínio, envolvendo
fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando
resultados por meio da linguagem estatística”.
(BRASIL,1998, p. 134).

Além dessa visão de ensino apontada pelos Parâmetros Curriculares


Nacionais, consideramos importante destacar os argumentos que têm sido
evidenciados nas recentes pesquisas sobre o ensino da Estocástica na Escola Básica,
como os destacados por Cardeñoso e Azcárate (2005), justificando a inclusão desse
tema:

 Seu interesse para a resolução de problemas relacionados com o


mundo real e com outras matérias do currículo.
5

 Sua influência na tomada de decisões das pessoas quando dispõem


somente de dados afetados pela incerteza.
 Seu domínio facilita a análise crítica da informação recebida através, por
exemplo, dos meios de comunicação.
 Sua compreensão proporciona uma filosofia do azar de grande
repercussão para a compreensão do mundo atual (CARDEÑOSO e
AZCÁRATE, 2005, p. 41).

Assim, procuramos ao longo de nossa análise perceber as divergências de


concepções de ensino de probabilidade e de estatística existentes entre a proposta
nacional e os livros didáticos, buscando evidenciar questões mais preocupantes que
levem os estudantes, desse nível de ensino, a adquirir conceitos errôneos a respeito
desses temas ou mesmo não acrescentar ao seu desenvolvimento mais do que
habilidades de cálculo.

Antes, porém, vejamos os conceitos e fundamentos da Estatística.

1.1 Estatística: conceitos, fundamentos e epistemologia

Estatística significa enumeração ou informação numérica habitualmente


contida em tabelas ou gráficos. Quando se fala em Estatística pensa-se em censos,
inventários, amostras ou médias. Em sentido restrito tudo isso se pode considerar uma
Estatística.

Num sentido mais amplo, Estatística é a ciência que se ocupa em recolher e


dar um tratamento adequado às informações, tendo como objetivo analisar os dados
recolhidos, descrevendo-os e organizando-os para posterior interpretação e eventual
utilização na previsão de acontecimentos futuros.

Epistemologicamente, a Estatística é um segmento da matemática aplicada


surgida nas questões de estado e governo. Daí o nome, Estatística, originado do termo
latino status. Situações ocasionais como número de habitantes, quantidade de óbitos
e nascimentos, quantidades produzidas e quantitativos das riquezas, formaram os
primórdios dos problemas que deram início ao pensamento estatístico.

A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores
atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado
6

pela primeira vez o termo statistik, do grego statizein; outros dizem ter origem na
palavra estado, do latim status, pelo aproveitamento que dela tiravam os políticos e o
Estado.

A partir do século XVIII são vários os nomes que se destacaram na história da


evolução da estatística, tais como Quételet (1796-1874), Galton (1822-1911), Karl
Pearson (1857-1936), Weldon (1860-1906), Ronald Fisher (1890-1962).

Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantém


esta ligação, como todos os Estados e a sociedade em geral, dependem cada vez
mais dela. Por isso, em todos os Estados existe um Departamento ou Instituto
Nacional de Estatística. No Brasil Chama-se: Instituto Brasileiro de Geografia e
Estatística (IBGE).

Para tanto, a Estatística divide-se em dois ramos distintos: a Estatística


Descritiva (vide anexo 01), responsável pelo estudo das características de uma dada
população; e a Estatística Indutiva (vide anexo 2), que generaliza um conjunto de
resultados, tendo por base uma amostra de uma dada população ou universo,
enunciando a(s) consequente(s) lei(s).

Inicialmente, no século XVI, pensada pelos ingleses como uma ciência política,
destinava-se a descrever características de um país, tais como população, área,
riquezas e recursos naturais. Deste papel histórico, origina-se a sua função de
caracterização numérica de uma série de informações populacionais. Com esta
abordagem, o termo é utilizado no plural, como as “estatísticas de saúde”, as
“estatísticas de mortalidade”, as “estatísticas do registro civil”, entre outras.

Assim, ao abrirmos uma revista ou um jornal é quase impossível não


encontrarmos alguma representação Estatística/matemática complementar aos
textos, ilustrando ou sintetizando a comunicação, tornando a leitura mais atrativa e
objetiva. Em muitos casos, os modelos estatísticos/matemáticos assumem a
importância maior, ficando o texto como complemento ou restrito a observações.

Outrossim, a Estatística, vista enquanto ciência só ocorreu a partir do século


XVIII, nos registros do alemão Godofredo Achenwall, ainda como catalogação não
regular de dado.
7

Mas, a sua evolução histórica é muito interessante, iniciando-se com as


primeiras sociedades primitivas, a partir das necessidades que exigiam o
conhecimento numérico dos recursos disponíveis. Por conta disso, os Estados, desde
tempos remotos, precisaram conhecer determinadas características da população,
efetuar a sua contagem e saber a sua composição ou os seus rendimentos.

Para que os governantes das grandes civilizações antigas tivessem


conhecimento dos bens que o Estado possuía e como estavam distribuídos pelos
habitantes, realizaram-se as primeiras estatísticas, nomeadamente, para
determinarem leis sobre impostos e números de homens disponíveis para combater.
Estas estatísticas eram frequentemente limitadas à população adulta masculina.

O primeiro dado disponível sobre um levantamento estatístico foi referido por


Heródoto, que afirmava ter-se efetuado, em 3050 a.C., um estudo das riquezas da
população do Egito com a finalidade de averiguar quais os recursos humanos e
econômicos disponíveis para a construção das pirâmides.

Há também notícia de que no ano 2238 a.C. realizou-se na China, um


levantamento estatístico com fins industriais e comerciais ordenado pelo imperador
chinês Yao.

Existem indícios, que constam da Bíblia, relativos a recenseamentos feitos por


Moisés (1490 a.C.).

Outra estatística referida pelos investigadores foi feita no ano 1400 a.C.,
quando Ramsés II mandou realizar um levantamento das terras do Egito.

Também os romanos faziam o recenseamento dos cidadãos e dos bens.


Eram os censores, magistrados romanos, que asseguravam o censo dos cidadãos.

Uma das convenções da História é ligar a datação (a.C. ou d.C.) ao


recenseamento populacional ordenado pelo imperador César Augusto.

As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762,


sobre as terras que eram de propriedade da Igreja, são algumas das estatísticas
importantes de que há referências desde a queda do império romano.

Guilherme, “O Conquistador”, que reinou entre 1066 e 1087, ordenou que se


fizesse um levantamento estatístico da Inglaterra. Este levantamento deveria incluir
8

informações sobre terras, proprietários, uso da terra, animais... e serviria de base,


também, para o cálculo de impostos.

Para responder ao desenvolvimento social surgiram estas primeiras técnicas


estatísticas: classificar, apresentar, interpretar os dados recolhidos foram para os
censos e são para a Estatística um aspecto essencial do método utilizado. Mas, um
longo caminho havia de ser percorrido até os dias de hoje.

Até o início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de


Estado”. Usada pelas autoridades políticas na inventariação ou arrolamento dos
recursos disponíveis, a Estatística limitava-se a uma simples técnica de contagem,
traduzindo, numericamente, fatos ou fenômenos observados – fase da Estatística
Descritiva.

No séc. XVII, com os “aritméticos políticos”, nomeadamente John Graunt (1620-


1674) e Sir William Petty (1623-1687), inicia-se em Inglaterra uma nova fase de
desenvolvimento da Estatística, virada para a análise dos fenômenos observados
– fase da Estatística Analítica.

John Graunt, comerciante londrino, “pessoa engenhosa e estudiosa, tinha o


hábito de se levantar cedo para estudar, antes da abertura da sua loja”, inspirado nas
tábuas de mortalidade que, semanalmente, eram publicadas na sua paróquia,
publicou, em 1660, um trabalho estatístico sobre a mortalidade dos habitantes de
Londres, procurando dar interpretações sociais às listas de tempos de vida. Sir William
Petty, baseado neste trabalho, escreveu um livro de enorme sucesso, divulgando a
nova ciência da “Aritmética Política”.

Em 1692, o astrônomo Edmund Halley (1658-1744), famoso pela descoberta


do cometa de órbita elíptica que se aproxima da Terra de 75 em 75 anos, baseando-
se também em listas de nascimento e falecimento, foi o precursor das atuais tabelas
de mortalidade, base das anuidades dos seguros de vida.

O desenvolvimento do Cálculo das Probabilidades surge também no século


XVII. A ligação das probabilidades com os conhecimentos estatísticos veio dar uma
nova dimensão à Estatística, que progressivamente se foi tornando um instrumento
científico poderoso e indispensável. Considera-se assim uma nova fase, a terceira,
em que se começa a fazer inferência estatística: quando a partir de observações se
9

procurou deduzir relações causais, entre variáveis, realizando-se previsões a partir


daquelas relações.

Atualmente, a Estatística já não se limita apenas ao estudo da Demografia e da


Economia. O seu campo de aplicação alargou-se à análise de dados em Biologia,
Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, Educação, etc., e ainda a
domínios aparentemente desligados, como estrutura de linguagem e estudo de formas
literárias.

Os modelos estatísticos, enquanto modelos matemáticos aplicados, reúnem


características de precisão na linguagem, adequados ao ambiente de informações
rápidas.

A necessidade de expressar o grau de incerteza, na ocorrência dos experimentos


e, de explicar o fato de duas experiências iguais poderem ter resultados diferentes, leva
ao reconhecimento da racionalidade probabilística em eventos da natureza. A pesquisa
em probabilidade no século XVIII culmina com o notável trabalho de Pierre-Simon de
Laplace, “Theorie Analitique de Probabilités”.

À luz da concepção do cientificismo, rapidamente amplia-se o domínio de


abrangência do cálculo probabilístico. Este se torna indispensável para lidar com dados
relativos a temas de interesse social e econômico, como administração das finanças
públicas, saúde coletiva, conduta de eleições e seguro de vida.

1.2 A Estatística na Escola

A inclusão da Estatística nos currículos da Educação Básica é uma realidade nas


escolas e redes escolares preocupadas com um ensino de qualidade, tendo em vista as
necessidades dos conhecimentos de Estatística em nosso cotidiano. Os principais livros
didáticos de Matemática já destinam capítulos aos conteúdos de Estatística, num
processo de adequação dessas obras às demandas por conhecimentos estatísticos.

Nos Parâmetros Curriculares Nacionais (PCN), o ensino da Probabilidade e da


Estatística, está inserido no contexto do bloco de conteúdos com nome de
“Tratamento das Informações”, conforme já dito anteriormente, tendo como
10

justificativa a demanda social e o frequente uso na sociedade contemporânea, pela


necessidade de o indivíduo compreender as informações divulgadas, tomar decisões e
fazer previsões que influenciam sua vida pessoal e em comunidade.

Em sendo, podemos afirmar que os PCN ressaltam a questão da utilização da


Estatística como possibilitadora do desenvolvimento de formas específicas de
pensamento e raciocínio, envolvendo fenômenos aleatórios, interpretando amostras,
fazendo inferências e comunicando resultados por meio da linguagem própria quantitativa.

Atualmente, quase todos os meios de comunicação, como jornais, revistas, rádio,


televisão e Internet lançam mão de modelos estatísticos como gráficos, diagramas,
pictogramas, tabelas e pesquisas para integrar e enriquecer seus conjuntos de
informações a serem divulgadas para a população. Grande parte desse público acaba não
decifrando essa nova linguagem.

E, sendo a Estatística, a ciência que permite, através de sua utilização, a descrição


e interpretação de dados específicos das várias áreas de conhecimento, essa se constitui
em uma poderosa ferramenta para a solução de problemas de fundamentação de
decisões. É interessante fornecer aos alunos elementos que, uma vez possuídos, levam
ao reconhecimento da importância de se dominar técnicas de análise de dados.

Esses elementos começam com o conhecimento da linguagem estatística. Nesse


sentido, vale destacar que a simbologia matemática foi, e ainda é, um fator de evolução
das ideias matemáticas que se desenvolveram lentamente ao longo de séculos. Essa
evolução tomou por base dois objetivos permanentes:

1. Tornar possível a comunicação matemática entre as pessoas, independentemente


das nacionalidades e culturas;
2. Simplificar a expressão das ideias e pensamentos matemáticos.

Assim, a matemática, como nenhuma outra ciência, conseguiu construir um


conjunto universal de signos, moldando uma linguagem com códigos que atravessam
idiomas e culturas. Dessa forma é possível, por exemplo, um matemático chinês escrever
equações ou proposições que um matemático brasileiro entenderá com facilidade. Essa
propriedade é utilizada pela Estatística e passa a ser apropriada largamente pela
informática, permeando as comunicações no mundo cibernético.
11

A evolução da matemática fez surgir aplicações específicas, com linguagens e


símbolos próprios, como foi o caso da matemática financeira, com sua constante
evolução, e também da Estatística.

Com o avanço tecnológico, as exigências de sofisticadas competências para o


mundo do trabalho e a facilidade oferecida pela informática, as pesquisas deixaram de
acontecer apenas em ocasiões para se tornarem parte integrante e inseparável de nossas
vidas em todos os instantes.

A partir dos anos 40, a pesquisa Estatística se volta para solucionar problemas
envolvendo variados aspectos da inferência, cada um tendo a sua aplicação a situações
específicas. Os testes de hipóteses para médias, variâncias e proporções, a teoria dos
testes uniformemente mais poderosos, o processo de inclusão (exclusão) de variáveis nos
modelos de regressão são algumas das formas de inferência de uso consagrado.

O mundo corporativo passou a adotar a linguagem Estatística em suas rotinas


operacionais exigindo dos profissionais conhecimentos e competências numéricas para o
correto entendimento e produção de relatórios, tabelas, gráficos, diagramas e
fluxogramas.

Na comunicação de massa, os programas de televisão com maior índice de


audiência, além de serem totalmente direcionados a institutos de pesquisa, passaram a
ter obrigatoriamente pesquisas interativas em suas pautas, na busca de uma permanente
aproximação com o público. Contudo, diante desse ambiente saturado de informações,
poucas pessoas questionam a forma como esses dados foram coletados, tratados e
trabalhados até chegarem ao formato “acabado” em que são apresentados. Isto é, o
público tem sido consumidor de resultados de pesquisas da forma como se apresentam,
sem a devida interpretação crítica e um entendimento do que se está “consumindo”.

Os meios de comunicação refletem também a facilidade que os modelos


estatísticos oferecem para sintetização de informações. Por exemplo: uma medida de
tendência central pode representar bem o perfil de uma população, ou um histograma
pode melhor apresentar um universo de dados. Existe um ditado em

matemática que diz: “Um gráfico bem construído equivale a mil palavras”. Essa nova
linguagem passa a demandar das pessoas o entendimento e o domínio de novos códigos
diferentes do “ler e escrever” tradicionais. É nessa perspectiva que o mundo moderno
12

caminha, com tecnologias voláteis, otimizando espaços, tempo, recursos, e fazendo uso
intenso dos argumentos estatísticos.

Nesse contexto, a escola não pode ignorar essas novas linguagens tão presentes
no mundo dos educandos.

Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com


a finalidade de que o estudante construa procedimentos para coletar, organizar,
comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja
capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos.

É fundamental que as práticas e os conteúdos ministrados em aula estejam em


sintonia com as novas exigências do mundo em que vivemos, para que a educação não
seja algo distante da vida dos alunos, mas, ao contrário, seja parte integrante de suas
experiências para uma existência melhor.

1.3 A Estatística na formação da cidadania

Desmistificar as pesquisas, estimulando a capacidade de leitura e interpretação dos


fatos, é função do trabalho escolar na busca da formação de um cidadão pleno. Assim, o
ensino e o uso dos modelos estatísticos/matemáticos, em sala de aula, devem estar em
consonância com as necessidades, os interesses e as experiências de vida dos alunos.
As ininteligíveis fórmulas prontas e os modelos acabados, com poucos atrativos para os
educandos, devem ceder lugar aos modelos construídos a partir de suas vivências, na
busca de soluções dos problemas que fazem parte de suas relações na sociedade.

Dessa maneira, o ensino de Estatística deve ser disseminado em toda a nossa


estrutura escolar, em todos os níveis de ensino, buscando levar aos jovens uma
compreensão mais completa de suas realidades.
As comunicações corporativas e as publicações científicas/tecnológicas optam pela
significativa objetividade que a utilidade desses modelos estatísticos e/ou matemáticos
proporcionam para implementar as informações, compactando textos e condensando
frases. Essa linguagem exata passa a demandar das pessoas o entendimento e o domínio
dos novos códigos mais refinados, exigindo habilidades e competências quantitativas.
Assim, o mundo do trabalho evolui, em sintonia com as necessidades das organizações
empresariais.
13

Antigamente, o cidadão completamente alfabetizado precisava apenas de saber ler


e escrever. Hoje, a alfabetização plena passa pela leitura e escrita, adicionada às noções
de informática e conhecimentos de Estatística.

1.3.1 No Ensino Fundamental

Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com


a finalidade de que o estudante construa procedimentos para coletar, organizar,
comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja
capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos.

Em relação à Probabilidade, consideram que esta pode promover a compreensão


de grande parte dos acontecimentos do cotidiano que são de natureza aleatória,
possibilitando a identificação de resultados possíveis desses acontecimentos. Destacam
o acaso e a incerteza que se manifestam intuitivamente, portanto cabendo à escola propor
situações em que as crianças possam realizar experimentos e fazer observações dos
eventos.

Quanto à Combinatória, o objetivo é possibilitar ao aluno lidar com situações-


problema que envolvam diferentes tipos de agrupamentos e possibilitem a compreensão
do princípio multiplicativo da contagem.

Com esses objetivos, os PCN elencam seus conteúdos, destacando-se:

 a leitura e interpretação de informações contidas em imagens;


 a coleta e organização de informações;
 a interpretação e elaboração de listas, tabelas simples, tabelas de dupla
entrada e gráficos para comunicar a informação obtida;
 a produção de textos escritos a partir da interpretação de gráficos e tabelas;
 a construção de gráficos e tabelas com base em informações contidas em
textos jornalísticos, científicos ou outros;
 a obtenção e interpretação de média aritmética;
 a exploração da ideia de probabilidade em situações-problema, identificando
sucessos possíveis, sucessos certos e as situações de
“sorte”;
14

 a utilização de informações dadas para avaliar probabilidades; a identificação


das possíveis maneiras de combinar elementos de uma coleção e de
contabilizá-las, usando estratégias pessoais.

Os Parâmetros indicam que a coleta, a organização e descrição de dados são


procedimentos utilizados com muita frequência na resolução de problemas e estimulam
as crianças a fazer perguntas, estabelecer relações, construir justificativas e desenvolver
o espírito de investigação.

Sugerem que, nos dois primeiros ciclos, desenvolvam-se atividades relacionadas a


assuntos de interesse dos estudantes, que se proponha observação de acontecimentos,
que se promovam situações para se fazer previsões, que algumas noções de
probabilidade sejam desenvolvidas.

Ressaltam que se desenvolva o raciocínio estatístico e probabilístico através da


exploração de situações de aprendizagem que levem o aluno a coletar, organizar e
analisar informações, formular argumentos e fazer inferências convincentes, tendo por
base a análise de dados organizados em representações matemáticas diversas.
Enfatizam, dessa forma, a realização de investigações, a resolução de problemas, a
criação de estratégias com argumentos e justificativas.

Dessa forma, os Parâmetros Curriculares Nacionais justificam o ensino da


probabilidade e da estatística acenando para a necessidade de o indivíduo compreender
as informações veiculadas, tomar decisões e fazer previsões que influenciam sua vida
pessoal e em comunidade. Porém, ao descreverem as noções de estatística,
probabilidade e combinatória, não o fazem de forma integrada, podendo deixar ao
professor a ideia de compartimentalização desses temas.
Ressaltam a necessidade de calcular medidas estatísticas, sem preocupar-se em
enfatizar que o mais importante é saber o que cada medida significa e não simplesmente
efetuar seus cálculos.

Destacamos essas questões dado o fato de que as atividades propostas nos livros
didáticos serem permeadas por uma concepção de ensino de estatística e probabilidade
bastante compartimentalizada, como se os conceitos probabilísticos e estatísticos não
se relacionassem. Essa forma de olhar o ensino desses temas se contrapõe ao trabalho
15

que recomenda o ensino da probabilidade inseparável da estatística, ou seja, da


Estocástica.

A Estocástica possibilita a ruptura com uma visão linear de currículo por sua
própria natureza interdisciplinar, pois ao explorarmos uma determinada situação-
problema, envolvemos diferentes conceitos matemáticos e estabelecemos distintas
relações, sem nos prendermos à limitação do conteúdo proposto para cada série
(LOPES, 1998).

Acreditamos que o trabalho com Estocástica deva ser baseado em processos de


investigações e na resolução de problemas, subsidiando o estudante para que ele
compreenda e lide bem com sua realidade (LOPES, 1998).

De acordo com essa visão de ensino de probabilidade e estatística, realizamos a


análise das atividades propostas.

1.4 Os Livros Didáticos e a Construção de Conceitos

Ao analisarmos o conteúdo dos livros didáticos para o ensino fundamental,


percebemos um descompasso entre os objetivos a serem alcançados pela inclusão do
ensino da estatística e probabilidade, no ensino fundamental, e a forma como o mesmo
se faz nos textos examinados.

Em uma primeira análise notamos a presença de uma super-simplificação de


conteúdo e o uso da estatística como fim em exercícios de matemática. A estatística não
aparece como estratégia da solução de problemas de pesquisa, como deveria ser
trabalhada em todos os níveis de ensino.

Em vista disso, podemos afirmar que esses objetivos não serão alcançados, haja
vista que, atingi-los passa por trabalhar situações-problema nas quais o conteúdo
estatístico compareça como estratégia, na obtenção de respostas a perguntas de
interesse dos alunos. O que observamos é que a concepção de estatística que permeia
os livros da 1ª à 8ª séries ou do 1º ao 9º anos, é de um fazer empobrecido, por não inserir
a construção dos conceitos estatísticos e probabilísticos na metodologia da resolução de
problemas.
16

No manual para o professor apresentado em algumas coleções, a estatística é


apresentada como um meio para organizar e interpretar informações numéricas, tabelas
e gráficos. Nas séries iniciais introduz-se algum fazer através das, inadequadamente
chamadas, pesquisas estatísticas, como se a estatística fornecesse o problema
substantivo de pesquisa, no qual ela apenas oferece estratégia de solução. Confunde-
se aí o problema com sua solução.

Em vista disso, a tal pesquisa, então, especializa-se em geral em pesquisa de


opinião, e as perguntas limitam-se, nas categorias observadas. Há uma preocupação em
nomear apenas o mais frequente, deixando-se de considerar a informação coletada,
como a 2ª ou 3ª preferência ou mesmo, o menos preferido. O que nos chama a atenção,
é que nesse ciclo existe a proposta de trabalhar os números ordinais e que, não há,
nesse sentido, o aproveitamento para integrar a aquisição desses conhecimentos.

Em relação às medidas estatísticas, o mais frequente não recebe o nome de moda


ou categoria modal, anunciando uma regularidade em evitar-se toda fidelidade à
linguagem própria deste domínio do conhecimento e, que será encontrada
independentemente do conteúdo, da matéria ou situação a que se aplicam. Embora isso
se justifique nas séries iniciais, do ensino fundamental, pensamos que nas séries finais
não haveria inconvenientes.

Ledo engano nosso, posto que, nas séries finais, usando a estatística como um
fazer que enseje a utilização de conteúdos matemáticos, encontramos menção às
possibilidades em abordagens lúdicas, sem nenhuma outra função que não seja a sua
listagem por si mesma. É preciso perceber que, ao listar possibilidades, estamos apenas
trabalhando conceitos matemáticos. Se avaliássemos essas possibilidades através de
experimentos, aí sim, estaríamos atribuindo um valor estatístico a essas atividades uma
vez que a construção das possibilidades deveria estar motivada por uma necessidade
de avaliação de chance.
Ao longo da aprendizagem com números, deveria ser trabalhado a organização
dos dados através do ramo-e-folhas, que é uma representação gráfica fácil, simples,
elegante e que requer menos conhecimentos anteriores. Esse tipo de representação
permite a ordenação de um conjunto de dados com maior facilidade, assim como a
introdução de moda e mediana.

Veja os exemplos:
17

Temos 35 ursos, fêmeas, observados, porém, somente 20 puderam ter sua idade
estimada. Para visualizar a distribuição dos valores de idade dessas fêmeas, usaremos
um diagrama de ramo-e-folhas, já que um histograma resumiria mais ainda algo que já
está resumido.

Os 20 valores de idade (em meses) disponíveis, já ordenados são:

8 9 11 17 17 19 20 44 45 53 57 57 57 58 70 81 82 83 100 104

Podemos organizar os dados, separando-os pelas dezenas, uma em cada linha:

8 9
11 17 17 19
20
44 45
53 57 57 57 58
70
81 82 83
100 104

Como muitos valores em cada linha têm as dezenas em comum, podemos colocar
as dezenas em evidência, separando-as das unidades por um traço. Ao dispor os dados
dessa maneira, estamos construindo um diagrama de ramo-e-folhas (Figura 1). O lado
com as dezenas é chamado de ramo, no qual estão dependuradas as unidades,
chamadas folhas.
18

Figura 1: Ramo-e-folhas da idade (meses) dos ursos fêmeas.

Os ramos e as folhas podem representar quaisquer unidades de grandeza


(dezenas e unidades, centenas e dezenas, milhares e centenas, etc.). Para sabermos o
que está sendo representado, um ramo-e-folhas deve ter sempre uma legenda, indicando
o que significam os ramos e as folhas.

Se a idade estivesse medida em dias, por exemplo, usando esse mesmo ramo-e-
folhas, poderíamos estabelecer que o ramo representaria as centenas e as folhas, as
dezenas. Assim, 0|8 seria igual a 80 dias e 10|4 seria igual a 1040 dias.

Analisando o ramo-e-folhas para a idade dos ursos fêmeas, percebemos a


existência de três grupos: fêmeas mais jovens (até 20 meses), fêmeas mais crescidas
(de 44 a 58 meses) e um grupo mais velho (mais de 70 meses), com destaque para duas
fêmeas bem mais velhas.

O ramo-e-folhas, também, pode ser usado para comparar duas distribuições de


valores, como mostra a Figura 2. Aproveitando o mesmo ramo do diagrama das fêmeas,
podemos fazer o diagrama dos machos, utilizando o lado esquerdo. Observe que as
folhas dos ursos machos são dependuradas de modo espelhado, assim como explica a
legenda, que agora deve ser dupla.
19

Figura 2: Ramo-e-folhas da idade (meses) dos ursos fêmeas.

Observando a Figura 2, notamos que os ursos machos são, em geral, mais jovens
do que os ursos fêmeas, embora possuam dois ursos bem idosos em comparação com
os demais.

Importante: No ramo-e-folhas, estamos trabalhando, implicitamente, com


frequências absolutas. Assim, ao comparar dois grupos de tamanhos diferentes,
devemos levar isso em conta. Caso os tamanhos dos grupos sejam muito diferentes, não
se deve adotar o ramo-e-folhas como gráfico para comparação de distribuições.

Dessa forma, o trabalho com o ramo-e-folhas deveria preceder o uso dos


histogramas, reproduzindo à semelhança com o diagrama de pontos e, portanto,
precedendo às distribuições de frequências e respectivas representações gráficas.

A questão acima é elucidada pela nossa preocupação com o erro mais frequente,
encontrado nos livros didáticos do ensino fundamental, que é a representação gráfica
por barras não adjacentes no tratamento das variáveis contínuas.

Outra questão é por que não chamarmos os acontecimentos, de eventos


elementares, que seria o termo mais adequado para referir-se a cada uma das
20

possibilidades, ou mesmo de evento, quando nos referirmos a qualquer subconjunto do


espaço amostral. Por exemplo, ao perguntar “como se mede a chance de um
acontecimento ocorrer?”, na linguagem estocástica, a pergunta estaria melhor
formulada “como obter a probabilidade de um evento ocorrer?”.

O uso de porcentagem e estimativa ocorre a partir das séries finais e percebem-


se atividades que podem possibilitar a aquisição de concepções equivocadas e difíceis
de serem alteradas, posteriormente, como temos observado em nossa experiência no
terceiro grau. A estimativa é encontrada como aproximação de magnitudes a serem lidas
em representações gráficas e falta da precisão numérica.

Como exemplo, podemos verificar que ao apresentar um gráfico de barras,


representando a população de diferentes municípios e solicitar a leitura da população de
um deles através desse gráfico, chamou-se esse resultado de estimativa. No sentido
matemático isso está correto, porém, no sentido estatístico, estimativa é o valor de um
estimador calculado a partir de uma amostra.

Trabalhar esse conceito demanda no mínimo uma problematização que recaia


sobre algum estimador e, então, que se observe sua variação na experimentação da
retirada de várias amostras.

Outro conceito que gostaríamos de destacar é a porcentagem, por ser uma


ferramenta matemática necessária à construção do conceito de probabilidade e às
experiências probabilísticas. Em nossa análise observamos que o trabalho com
porcentagem não apareceu em nenhum momento vinculado ao raciocínio estatístico. Por
exemplo, se fizermos uma proposta de “lançamentos de uma moeda” onze vezes e
ocorrer “Cara”, 4 vezes; e, “Coroa”, 7 vezes, é provável que ao transformarmos esses
resultados em porcentagem e compararmos com a definição clássica de probabilidade,
o estudante tenha uma percepção equivocada de que a probabilidade observada na
experimentação é suficiente para concluir que os eventos não são equiprováveis.

Trabalhar esse conceito com os estudantes não seria uma tarefa tão difícil se
deixarmos que os alunos experimentem e convivam com a variabilidade. Consideremos
que se tivermos em 100 bolas, 50 pretas e 50 brancas, e perguntarmos ao aluno, em
uma amostra de 10 bolas, quantas se teria de cada cor, muito provavelmente, no contexto
de aprendizagem de porcentagem, ele responderá que em 10 bolas amostradas
21

ocorreriam 5 de cada cor. Esse é um conceito que urge ser trabalhado, para que seja
aplicado, corretamente, na resolução de problemas estatísticos.

É necessário percebermos que o significado estatístico, muitas vezes, difere do


significado matemático, ou seja, a mesma razão observada entre número de ocorrência
de um evento e o número total de experimentos tem significado estatístico distinto
dependendo da magnitude desse número total. Por exemplo, ao observarmos o
lançamento de uma moeda 10 vezes, 100 vezes ou 1000 vezes, em cada caso, a
ocorrência de metade de caras tem significado distinto. Em 1000 vezes, a indicação de
que a moeda não é viciada é maior do que em 10 vezes. Isso desenvolve o espírito crítico
da grandeza dos denominadores que pode ser desenvolvida desde o início do ensino
fundamental, contribuindo para diferenciar determinismo de aleatoriedade.

No final das series finais, continua a ênfase em porcentagem como domínio


exclusivo do cálculo e também representações gráficas. Estas, apesar de paralelas ao
ensino das grandezas e medidas, incluindo o trabalho com áreas, têm pouca ligação com
as representações gráficas. Os diagramas de barras, setoriais, e histogramas são ricos
para explorar as relações com áreas. Observa-se mais uma vez a não integração entre
os conceitos estatísticos e matemáticos.

Nesse sentido, também poderíamos considerar o trabalho de geometria


envolvendo o estudo da simetria interligado a algumas das representações estatísticas.

Ainda nesse momento, encontramos a média quase como para checar habilidades
de soma, divisão, ou resolução de equações. Quando apresentada a partir de tabelas de
frequências, a média aparece, inadequadamente, chamada de ponderada. Se feita a
partir dos dados em rol bruto é média, se feita a partir dos dados agrupados então é
ponderada. Esse é outro problema comum de erro conceitual, pois a simples aplicação
da propriedade associativa da adição não muda o peso de cada valor correspondente a
cada indivíduo. No caso da média aritmética, cada indivíduo ou cada valor tem o mesmo
peso, enquanto que em média ponderada, esses pesos devem diferir e ser conhecidos
a priori.
Talvez a média chame mais a atenção do que a moda e a mediana devido ao
paradigma da distribuição gaussiana e de todos os enganos e mal-entendidos do
teorema central do limite que parece magicamente transformar tudo em normal, o sonho
de todo pesquisador para seus dados.
22

Assim, o ensino conjunto da média, mediana e moda, bem como explorar suas
posições relativas no ensino de formas gráficas deve ser utilizado sob pena de repetirmos
o erro de tratar tudo sob a perspectiva de distribuições de erros...

Chamou-nos a atenção que, ao introduzir o conceito de chance, a linguagem


estocástica mais uma vez esteve ausente por não se utilizar a palavra probabilidade. O
conceito de probabilidade vem em sua definição clássica, favoráveis sobre possíveis,
sem menção às restrições de equiprobabilidade, e conjunto finito dos possíveis. A
probabilidade de que um aluno tenha peso entre 50kg e 55kg não pode ser calculada,
pois o conjunto dos pesos possíveis é infinito e não enumerável. Assim como a
probabilidade de cada uma das faces de uma ficha telefônica seria obtida como ½ pela
aplicação do conceito clássico. A assimetria da ficha não cumpre a restrição de
equiprobabilidade.

A definição frequentista, número de ocorrências do evento sobre número total de


repetições, deveria ser dada, pois possibilitaria remover as duas restrições. Os eventos
não precisam ser equiprováveis e o espaço amostral não precisa ser finito.

Gostaríamos de ressaltar que não se sugere a definição axiomática, mas muita


experimentação e observação, evidenciando-se as ideias probabilísticas. Dessa forma,
os conceitos terão mais significados, e poderemos trabalhar os eventos: possível,
impossível, provável, muito provável, pouco provável e certo.

Os conceitos básicos de amostra probabilística e não probabilística, não são


abordados. Deveriam ser trabalhados, através de vivência, os conceitos de amostra
aleatória simples, no qual cada possível amostra de um determinado tamanho tem a
mesma chance de ser selecionada.

Nota-se que alguns autores utilizam-se de adjetivação para amostra como


“representativas” e “reprodução da população”, sem utilizar o termo amostra
probabilística, o que deveria ser evitado ou atribuído a essas qualidades uma chance.

A experiência com amostragem pode ser feita em população finita, por exemplo,
os alunos da classe e retiradas de amostras casuais simples, sua organização,
representação e análise. Neste processo, pode-se inserir operacionalizações que gerem
vícios por intencionalidade ou casualidade em sub- populações. Nesse contexto, a noção
23

de estimativa ganha sentido, pois ao trabalhar amostragem, o objeto de estudo é a


variação de estimativas.

Durante o processo de análise dessas atividades propostas por alguns livros


didáticos recomendados pelo MEC, para o ensino fundamental, destacamos a urgência
de se pensar cuidadosamente o ensino da estocástica em nossa escola básica, tanto no
que se refere à formação dos professores quanto à elaboração dos livros didáticos.

Necessitamos de que o cenário da pesquisa em ensino da estocástica, no Brasil,


seja ampliado rapidamente para que possamos alcançar os objetivos ressaltados pela
proposta curricular brasileira e, assim, possamos formar, de fato, cidadãos mais aptos a
tomadas de decisão, especialmente em situações envolvendo a presença do acaso.
Consideramos que não basta verificar as análises de avaliações realizadas, seja nos
cursos ou nos livros didáticos, pensamos que seja necessário o incentivo e apoio à
pesquisas que alterem o atual estado da arte desta área do conhecimento.

Nos anexos 3 e 4, relacionamos diversos conceitos acerca da estatística, através


de um glossário, bem como, relacionamos as fórmulas utilizadas.

2 O ENSINO DA ESTATÍSTICA NA EDUCAÇÃO BÁSICA: importância,


entraves e perspectivas

No Brasil, apesar da Estatística e as Probabilidades fazerem parte do currículo de


Matemática do Ensino Médio antes dos anos 80, raramente eram ensinados. Segundo
Ponte, Matos e Abrantes (1998) só depois dos anos 90 é que os alunos têm tido a
oportunidade de aprender estes tópicos e, talvez por isso no que “se refere à Estatística
e às Probabilidades, e conhecimentos, capacidades, dificuldades e estratégias de
raciocínio dos alunos está essencialmente por fazer” (p. 171).

Para Abrantes, Serrazina e Oliveira (1999), as competências que os alunos devem


desenvolver incluem a organização e representação de dados, a aptidão para ler e
interpretar tabelas e gráficos comunicando os resultados, sensibilidade para distinguir
fenômenos aleatórios e deterministas e interpretar situações concretas onde estes
fenômenos estejam presentes. Na literatura, é sugerido que as tarefas criadas traduzam
24

contextos próximos dos interesses dos alunos, mas que, simultaneamente, lhes
permitam desenvolver competências que os tomem cidadãos mais críticos e
participativos na sociedade do próximo milênio, o que também é realçado por autores de
outros países (PEREIRA MENDONZA E SWIFT, 1989).

E ainda sugerido que se evite o receituário, a computação excessiva e a não


utilização das novas tecnologias, como os computadores e, mais recentemente, a
Internet (BATANERO, 1998). Esta última apresenta-se como uma fonte preciosa de
possibilidades a explorar nas aulas de Estatística, sendo vários os sites com sugestões
para a sala de aula (NG E WONG, 1999).

Portanto, é necessário analisar os desempenhos estatísticos dos alunos nos


conceitos de média e mediana, identificando os conhecimentos instrumentais e os
conhecimentos relacionais que utilizam nas suas respostas. Para isso, é necessário
compreendermos como os alunos constroem o significado desses conceitos, discutindo
a influência dos fatores que podem, ou não, facilitar a atribuição desse mesmo
significado.

Apesar das diversas recomendações que têm sido feitas por investigadores e que
aparecem referidas nos documentos de política educativa, a literatura mostra que,
mesmo nos anos de escolaridade básica, a maioria dos alunos não aprende Estatística
de acordo com essas sugestões (SHAUGHNESSY, 1992). Verifica-se, ainda, que muitos
alunos revelam dificuldades na compreensão do significado matemático dos conceitos
estatísticos trabalhados durante este período (BATANERO ET AL., 1994; CARVALHO,
1996, 1998; HAWKINS, JOLLIFFE E GLICKMAN, 1991).

Uma outra limitação relacionada com o ensino da Estatística deve-se ao fato de a


maioria dos professores que trabalham com as series iniciais são professores de
Matemática com pouca ou nenhuma formação em Estatística, e menos ainda em Didática
da Estatística, podendo por isso sentir uma responsabilidade acrescida quando as
orientações para o ensino deste tópico são no sentido das simulações, do trabalho de
projeto, da discussão das várias estratégias de resolução utilizadas, do trabalho em
grupo e do recurso às novas tecnologias (SHAUGHNESSY E BERGMAN, 1993).

Skemp (1979) considera que se possui um conhecimento instrumental de um


conceito quando se domina uma coleção isolada de regras e algoritmos aprendidos
25

através da repetição e da rotina, que permite resolver um conjunto limitado de situações,


por oposição a um conhecimento relacional, onde o aluno construiu um esquema do
conceito que pode ir atualizando sempre que novas situações assim lho exijam.

As sugestões acima referidas apontam para que os objetivos a serem atingidos


com o estudo da Estatística devam proporcionar aos alunos um conhecimento relacional
e não, apenas, um conhecimento instrumental dos conceitos. Este fato não é, contudo,
um problema que apenas diz respeito à Estatística, uma vez que Sfard e Linchevski
(1994a) afirmam que “professores e investigadores queixam-se frequentemente de que
a compreensão que os alunos têm da álgebra é meramente instrumental: as crianças
são capazes de “avançar nos passos necessários”, mas não são capazes de explicar
aquilo que estão afazer” (p. 257).
Uma distinção mais subtil é introduzida por Sfard (1991) e Sfard e Linchevski
(1994a) quando diferenciam a noção de processo computacional e de objeto abstrato,
afirmando que “o que é concebido como processo num determinado nível toma-se
objeto num nível mais elevado” (p. 194), o que equivale considerar que as competências
computacionais precedem às formalizações mais elaboradas. Assim, para estas autoras,
“as mesmas representações, os mesmos conceitos matemáticos, podem às vezes ser
interpretados como processos e outras como objetos; ou, para usar a linguagem
introduzida num outro artigo (Sfard, 1991), podem ser concebidos operacionalmente ou
estruturalmente” (p. 193), sendo a concepção operacional associada à realização de
procedimentos computacionais e a estrutural à atribuição de significado aos símbolos.
Deste modo, a atribuição de significado, por parte do sujeito, influencia fortemente o
modo de abordagem que ele tem em relação a uma tarefa proposta na sala de aula. Esta
atribuição de significado não é independente do contrato didático estabelecido entre o
professor e os alunos, uma vez que é este que legitima as expectativas mútuas de cada
um dos atores da relação didática (CÉSAR, 1998; 2000; CÉSAR ET AL., 1999; 2000).

Uma distinção de inspiração vygotskiana é feita por Douady (1985) quando afirma
que um conceito matemático pode ser encarado como uma ferramenta, “quando o nosso
interesse se foca na sua utilização para resolver problemas” (p. 35) ou como um objeto,
quando o encaramos como “um objeto cultural que faz parte de um corpo científico de
conhecimentos”, o que implica também o ser socialmente reconhecido (p. 35). Neste
caso, considera-se um objeto qualquer definição matemática, bem como os exemplos,
26

contra-exemplos e descrições estruturais. Se pensarmos em termos de sala de aula, um


conceito é uma ferramenta se permite ao aluno resolver problemas. Mas, Douady (1985)
sublinha que estas ferramentas podem ser implícitas ou explícitas, ou seja, são explícitas
apenas se o aluno consegue justificar os procedimentos que usou. Assim, o objetivo
educacional a atingir seria que os alunos conseguissem fazer apelo a ferramentas
explícitas, pois são estas que podem favorecer a compreensão dos conceitos,
permitindo-lhes passar do nível computacional para a utilização dessas mesmas
ferramentas em determinadas situações que exigem uma utilização mais flexível (SFARD
E LINCHEVSKI, 1994b).

O modo como os alunos trabalham na sala de aula com a Estatística, com os


colegas e o professor, as tarefas e as instruções de trabalho influenciam o que aprendem,
como o aprendem e os seus desempenhos.
Quando se aceita que as interações sociais que se estabelecem na sala de aula
têm um papel determinante nas aprendizagens que os alunos fazem, admite-se também
que esta aprendizagem é ativa e influenciada pelas propostas de trabalho que ali
acontecem, valorizando-se as oportunidades dadas aos sujeitos para comunicarem os
seus conhecimentos e as suas estratégias de resolução. Assim, quando as crianças têm
a oportunidade de se confrontarem com tarefas e em situações de sala de aula onde são
encorajadas a trabalhar de forma não rotineira, encontra-se uma grande riqueza de
estratégias de resolução o que, na opinião de Yackel et al. (1990), mostra que cada
criança tem “de construir o seu próprio significado matemático”.

Ou seja, este conhecimento não pode ser dado à criança, pois é ela quem tem de
apreendê-lo, dar-lhe um sentido próprio, uma vez que ele já é partilhado por outros
sujeitos de uma mesma cultura.

Porém, como qualquer professor sabe, uma tarefa não é igualmente problemática
para todos os alunos, no sentido de desencadear uma variedade rica de conflitos
sociocognitivos. Cada um tem conhecimentos, experiências vivenciais, sentimentos e
expectativas diferentes quando é confrontado com uma mesma tarefa. Este fato pode
ser, de acordo com Yackel et al. (1990), uma limitação, pois o professor não pode
garantir, à partida, que todas as crianças se envolvam na tarefa da mesma maneira.
Porém, pode ser também uma vantagem, já que pode ser interpretado como uma forma
de valorizar a diversidade, de acordo com os objetivos da escola inclusiva e da
27

“Matemática para Todos”. Para estes autores, as diferenças que cada criança traz para
a sala de aula quanto aos conhecimentos e competências que possui permitem gerar
diferentes soluções e interpretações de uma mesma tarefa, o que pode ser visto, pelo
professor, como algo positivo e enriquecedor, ao contrário do que é tradicional fazer na
sala de aula e que aparece descrito por diversos autores que estudaram os
desempenhos matemáticos de alunos em diferentes contextos (CARRAHER,
CARRAHER E SCHLIEMANN, 1989; SAXE, 1989).

É neste sentido que qualquer aluno, quando tenta resolver uma tarefa, tem de lhe
atribuir um significado em função dos seus conhecimentos e, só depois, é que está pronto
para o fazer. “Na verdade, o aluno dá significado às coisas a partir daquilo que sabe, de
toda a sua experiência anterior, e não necessariamente a partir da lógica interna dos
conteúdos ou do sentido que o professor atribui às mesmas coisas” (ABRANTES,
SERRAZINA E OLIVEIRA, 1999, p. 24). Quando um aluno atribui significado a uma tarefa
não nos podemos esquecer se ela tem ou não marcação social (Doise e Mugny, 1981;
Mugny e Doise, 1983), ou seja, se o quotidiano em que o aluno vive lhe permite
interpretá-la mais facilmente, sendo capaz de lhe atribuir um significado, pelo que
consegue resolvê-la. Assim, o grau de dificuldade de uma tarefa não pode ser
determinado apenas pelo nível operatório a que faz apelo, tem de ser sempre visto de
uma forma contextualizada.

Yackel et al. (1990) sublinham que o professor não deve dar aos alunos tarefas
fechadas, como os tradicionais exercícios, mas antes atividades abertas, onde seja
possível o trabalho em díade ou em pequenos grupos, levando os dois alunos
cooperarem na co-construção de estratégias de resolução. No caso da Estatística, têm
sido vários os documentos e os autores a manifestarem que “estes conteúdos devem ser
trabalhados em pequenos grupos e em projetos” (Godino, Batanero, Cañizares, 1996, p.
54), o que realça a necessidade de os alunos conseguirem encontrar uma
intersubjetividade comum (Wertsch, 1991), pois sem ela o diálogo entre os pares não
seria possível.

Um dos objetivos da Educação Estatística é possibilitar aos alunos que


desenvolvam competências que lhes permitam descrever, julgar e inferir opiniões acerca
de dados, argumentando e interpretando-os usando para isso as várias ferramentas
estatísticas de forma a compreender que, em Estatística, o contexto motiva os
28

procedimentos, é fonte de significado e a base para interpretar as soluções, sendo estas


dificilmente certas ou erradas, pois os números têm de ser analisados como números
num contexto determinado, só assim adquirindo significado (MOORE, 1990, citado por
GAL E GARFIELD, 1997).

A atribuição de significado é um passo essencial para a resolução de uma tarefa


matemática e para que haja apropriação de conhecimento. Como salientou Vygotsky
(1962, 1978), os alunos necessitam de descontextualizar e recontextualizar o saber para
que este passe de exterior e social para interior e pessoal.

Assim, facilitar a atribuição de significado às tarefas é fundamental para se


conseguir promover o sucesso escolar, pelo que se deve ter em atenção à natureza das
tarefas que propomos aos alunos. Para além disso, as interações sociais,
nomeadamente as interações entre pares, jogam um papel muito relevante na facilitação
da atribuição de significados, pelo que a implementação de um contrato didático inovador
é também um elemento essencial a tomar em consideração.

Para promovermos o sucesso escolar em Matemática, nomeadamente no que se


refere aos conteúdos de Estatística, é necessário facilitarmos a possibilidade de os
alunos passarem de um conhecimento instrumental para um conhecimento relacional,
ou seja, ultrapassar o nível computacional e ser capaz de mobilizar os conceitos para os
utilizar na resolução de situações da vida real. Como diz Douady (1985), a atuação dos
professores, na sala de aula, deve estimular os alunos a utilizarem ferramentas explícitas
em vez das implícitas, permitindo-lhes chegar a níveis de conceituação mais elaborados,
atingindo os objetos científicos que integram o corpo de conhecimentos científicos que
pretendemos que os alunos apreendam.

Mas, para que tudo o que foi exposto seja uma realidade e não apenas uma
intenção, é necessário aprendermos a observar e analisar detalhadamente as estratégias
de resolução e os raciocínios dos alunos, para podermos situar-nos, enquanto
investigadores e professores, para além do nível das aparências que iludem.
29

2.1 A Didáticas do Ensino de Estatística

Aprender implica em assimilar um objeto a esquemas mentais baseados em


ensaio de erro, na pesquisa, investigação, solução de problemas e não em fórmulas e
definições. A aprendizagem verdadeira se dá no exercício operacional da inteligência.
Além disso, os alunos devem aprender a distinguir a observação feita no domínio da
realidade e a representação da mesma (domínio teórico). Como a criança ainda não
possui o conhecimento destas representações teóricas, é válido que se use sequências
didáticas para ensiná-las.

Todos os dias recebemos um volume muito grande de informações dos mais


variados meios e tipos de comunicações, com enorme rapidez e facilidade de acesso a
elas, há a necessidade dos indivíduos terem um espaço, que lhes permita selecionar,
qualificar, analisar e contextualizar tais informações.

Neste aspecto, os Parâmetros Curriculares Nacionais (BRASIL, 1997, p. 27),


orientam no sentido de que:
a compreensão e a tomada de decisões diante de questões políticas e sociais
dependem da leitura crítica e interpretação de informações complexas, muitas
vezes contraditórias, que incluem dados estatísticos e índices divulgados pelos
meios de comunicação. Ou seja, para exercer a cidadania é necessário saber
calcular, medir, raciocinar, argumentar e tratar informações estatisticamente.

Saber matemática é indispensável em qualquer área do conhecimento.

Aprendê-la bem transforma pessoas em profissionais confiantes e criativos. “O


bom treinamento em matemática é efetuado com ênfase no argumento lógico, oposto ao
autoritário (...)” (DRUCK, 2003, p. 02).

A utilização de instrumentos de medida para avaliar e acompanhar o


conhecimento adquirido pelos alunos cada vez mais se torna necessária e este fato tem
motivado pesquisadores da Educação Estatística a buscarem ferramentas mais
sofisticadas para serem utilizadas nos processos quantitativos de análise dessas
avaliações. Este tipo de avaliação “ganhou força nos anos noventa, apoiada em estudos
sobre desenvolvimento industrial, tecnologia e educação (...)” (Duran, 2003) e ainda é
um desafio afirmar qual maneira é a mais correta de se avaliar, pois, segundo essa
autora, “mais do que o direito social do acesso à escola, o desafio era o de fazer a
30

qualidade do cidadão, a qualidade do trabalhador, a qualidade do familiar, a qualidade


do indivíduo.”

A mídia impressa, em especial, utiliza, muitas vezes, gráficos para noticiar os mais
variados assuntos, usando-os como ferramenta para defender seus argumentos
jornalísticos, com isso, é possível entender a afirmação presente nos PCN (Brasil, 1997)
que afirma que “só está alfabetizado quem sabe ler e interpretar dados numéricos
dispostos de forma organizada”.

Com a inclusão de tópicos relacionados à Estatística nos PCN (Brasil, 1997),


evidencia-se a importância que tal ciência vem recebendo nos últimos anos por parte dos
educadores. Este fato, por sua vez, nos leva a refletir que muitos dos educadores hoje
em exercício, não tiveram uma base sobre o assunto em sua graduação e com isso,
surge a necessidade de pesquisas na área, que contemplem não só a formação dos
alunos, mas, também, forneçam fundamentos metodológicos para o professor.
Inserido no currículo de Matemática, temos o ensino da Probabilidade e da
Estatística complementando o cenário de formação global do aluno de Educação Básica.
Carvalho (2003, p. 35-36) enfatiza que:
cada vez mais se acentua a importância da Estatística, das Probabilidades e das
suas aplicações no mundo onde a criança vive, assistindo – se simultaneamente
a um ensino que procura o abandono da memorização de fórmulas e algoritmos
para se focar nas conexões entre a Estatística e o mundo. Ter a possibilidade de
resolver problemas que lhe estão próximos leva o aluno a ser mais persistente
no que está a fazer.

Com isso, propomos o uso de uma pedagogia que se utiliza de sequências


didáticas para construir um conhecimento significativo ao aluno, buscando desenvolver
instrumentos de indagação e problematização das situações, de descoberta, escolha e
integração das informações disponíveis.

Segundo Pannuti, (2004, p. 04),

A sequência didática é uma outra modalidade organizativa que se constitui numa


série de ações planejadas e orientadas com o objetivo de promover uma
aprendizagem específica e definida. Estas ações são sequenciais de forma a
oferecer desafios com o grau de complexidade crescente, para que as crianças
possam colocar em movimento suas habilidades, superando-as e atingindo
novos níveis de aprendizagem.
31

Deve-se buscar que o aluno compreenda que muitos dos acontecimentos do


cotidiano são aleatórios, podendo identificar possíveis resultados, entendendo o que é
previsível e aleatório e utilizando recursos probabilísticos para resolver situações-
problema.

Outro ponto importante está nas avaliações de ensino, pois os mecanismos de


avaliação da Educação Básica têm sido uma das principais causas da situação de
fracasso escolar que atinge uma parte considerável dos alunos. Nesse contexto, a
avaliação torna-se sinônimo de classificar, selecionar e julgar a aquisição de
conhecimentos e habilidades utilizando-se dos mesmos instrumentos para todos, o que,
muitas vezes, é um grande erro, pois,
Exigir que todos os alunos, independente das diferenças psicossociais,
apresentem o mesmo desempenho, é ignorar que cada pessoa tem o seu tempo
para a aprendizagem, é dotada de identidade própria, visões de mundo e padrões
culturais próprios, a serem considerados em práticas docentes e avaliativas,
tendo em vista uma apropriação efetiva e significativa do conhecimento.
(Diretrizes para Avaliação da Aprendizagem, 2006).

Mesmo para muitos professores de Matemática é de extrema dificuldade


compreender a linguagem estatística utilizada na apresentação e divulgação dos
resultados das avaliações educacionais, pois muitas vezes, isso é apresentado em
linguagem técnica altamente sofisticada e, até mesmo, incompreensível.

Para o aluno, uma avaliação deve representar seus ganhos e apontar onde estão
suas dificuldades a fim de melhorar seu conhecimento; para o professor, ela deve levá-
lo a perceber onde sua pedagogia é falha e, a partir dessa constatação, ele deve estar
pronto para modificá-la. É importante salientar que:
A avaliação é do interesse do aluno, dos pais e da comunidade, porque
tradicionalmente todo processo de aprendizagem pressupõe formas de aferição
para garantir a confirmação dos conhecimentos que o aluno aprendeu e daqueles
que não conseguiu compreender. A aprendizagem não é um processo individual
e isolado, mas um processo coletivo, social e cultural. Só que agora o maior
interesse na avaliação é dos governos no sentido de inserir a escola no mercado
(BASTOS, 2001, p.128).

No artigo „Diretrizes para Avaliação da Aprendizagem‟ (2006), fala-se de uma


avaliação formativa que foi construída por um grupo de professores de uma instituição
educacional e não por pessoas externas a ela. Essa parece ser uma grande ideia para
se avaliar e obter seus ganhos, pois ela apresenta as seguintes características:
32

• é conduzida pelo professor;


• destina-se a promover a aprendizagem;
• leva em conta diferentes linguagens e estilos de aprendizagem;
• dá tratamento didático aos “erros”, considerando-os como informações
diagnósticas;
• inclui todas as atividades realizadas;
• os alunos exercem papel central, devendo atuar ativamente em sua própria
aprendizagem. (Diretrizes para Avaliação da Aprendizagem, 2006).

Segundo Versieux (2005, p.3) “não existe uma maneira „correta‟ de definir
avaliação, uma maneira que, se encontrada poria fim à argumentação sobre como ela
deve proceder e quais são os seus propósitos”. Assim, podemos observar que cabe a
cada instituição desenvolver sua avaliação formativa, em sua Proposta Pedagógica.
Segundo a LDB, em seu artigo 26, conforme citado pelas Diretrizes para Avaliação da
Aprendizagem,
os currículos do Ensino Fundamental e do Ensino Médio devem ter uma Base
Nacional Comum, a ser completada, em cada sistema de ensino e
estabelecimento escolar, por uma Parte Diversificada, exigida pelas
características regionais e locais da sociedade, da cultura, da economia e da
clientela. (Diretrizes para Avaliação da Aprendizagem, 2006)

E esta parte diversificada pode ser inserida de forma interdisciplinar, tendo como
essência a reflexão das experiências vividas pelo aluno. Podem-se contextualizar
conceitos, existentes no currículo da Base Nacional Comum, preparando, assim, o aluno
para sua vida futura, trabalho e exercício da cidadania. Devem voltar-se, então, ao
controle para a qualidade e excelência, com parâmetros de eficiência, envolvendo custo
e benefício, metas e resultados quantitativos.

Para as universidades brasileiras, segundo Versieux (2005),

a avaliação é vista como tomada de consciência, visando melhorias na


universidade, com participação individual, coletiva, visando identificação de
critérios, procedimentos e avaliação de resultados (...) e (...) depende da visão
de cada um dos formuladores, já que a escola, inserida no modelo capitalista,
pode ser interpretada à partir de várias teorias educacionais.

A avaliação tem que ser exigida, mas, ainda, precisa ser melhorada na sua forma
de aplicar e divulgar resultados. É ela que mostra onde estão os problemas na educação
de nosso país e não podemos esquecer que,

A educação é bem social, direito de todos, obrigação do Estado e da família. Foi


este o princípio estabelecido na nossa constituição. Este é um pilar da concepção
de política pública(...). Os princípios básicos seriam uma consciência crítica
33

responsável, os princípios éticos e uma cidadania consolidada e atuante. Estes


são os princípios que norteiam uma concepção de política pública para avaliação
(VERSIEUX, 2005, p. 12).

Com essas diversas questões em mente, após realizar uma pesquisa bibliográfica
acerca de avaliações educacionais, para mapear o estado da arte de como estão sendo
analisados os dados e divulgados seus resultados especialmente no que se refere aos
conteúdos de Estatística nelas contidos, desenvolvemos algumas sequências didáticas
com temas geradores do cotidiano, buscando desenvolver o raciocínio combinatório e
probabilístico conforme as sugestões dos PCN e, também, apresentar a você professor
ou futuro professor de estatística, um material didático diferenciado que o auxilie no ensino
de combinatória e probabilidade.

2.1.1 Sequências Didáticas Desenvolvidas

1. Jogo da Memória - Objetivo: explorar situações que desenvolvam o raciocínio


combinatório e probabilístico
1. O que você pensa sobre os animais?
2. O que você pensa sobre as pessoas que abandonam animais? E as que maltratam?
3. Você possui animais? Quantos? Quais?
4. Qual seria a sua reação quando presenciasse uma cena de maus tratos de animais?
5. Considere um jogo da memória no qual existem 8 gatos idênticos, 6 cachorros
idênticos, 6 onças idênticas, 4 golfinhos idênticos, 2 bodes idênticos, 2 cavalos
idênticos e 2 macacos idênticos. Na sua opinião, existe algum animal que é mais fácil
de formar pares? Por quê?
O aluno pode jogar várias vezes para ter uma ideia melhor da probabilidade.
Complete a tabela abaixo indicando a probabilidade retirar cada um desses animais:
Animais Probabilidade

Gato

Cachorro
34

Onça

Macaco

Golfinho

Cavalo

Bode

Total

6. Agora calcule a probabilidade de:


a. Retirar a figura de um gato, sabendo que já foram retiradas todas as onças (todas as
outras figurinhas ainda estão no jogo).
b. Retirar a figura de um cachorro, sabendo que já foram retirados todos os cavalos.
c. Retirar a figura de um golfinho, sabendo que já foram retirados todos os gatos e todos
os cachorros.
7. Qual foi sua opinião para usar o jogo da memória e ao mesmo tempo começar a
aprender probabilidade?
8. Você teria alguma sugestão para um outro jogo que envolvesse probabilidade?
9. Você tem alguma pergunta ou alguma dúvida sobre esse jogo?

2. Brincando com Gráficos e Tabelas


Objetivo: Interpretar dados organizados em tabelas, calcular percentuais, organizar
dados em tabelas, discutir os dados apresentados e tomar possíveis decisões.
35

Atividade
Um centro de zoonose da região metropolitana de Campinas divulgou os dados da
Tabela 1.

Tabela 1: Castrações de animais no período de Dezembro de 2006 à Junho de 2007 por


um núcleo de zoonoses da região metropolitana de Campinas.

Período Cão Cão fêmea Gato Gato fêmea Total


macho macho

Dez./06 4 0 0 11
Jan./07 2 0 1 10
Fev./07 2 0 7 13 22
Mar./07 6 15 61
Abr./07 14 12 24 67
Mai./07 15 46 20 28
Jun./07 17 48 35 124
Total 75 117 86 129

1. Complete os dados que estão faltando na tabela, calcule as porcentagens referentes


a cada grupo de animais e organize uma nova tabela devidamente formatada.

2. Você seria capaz de avaliar o impacto que as castrações públicas trazem para sua
cidade? Compare e explicite o motivo das castrações serem realizadas em animais
machos e fêmeas.

3. Imagine que cada animal fêmea da tabela 1 não tenha sido castrado e gere 5
filhotes, dos quais 3 são fêmeas nos cães e 4 são fêmeas nos gatos. Quantos novos
animais existirão quando todos os animais tiverem dado cria? Quantos machos e
quantas fêmeas?
36

4. Imagine agora que o período de gestação de uma fêmea é de cerca de 3 meses e


que a fêmea pode pegar uma nova cria um mês após de ter dado a luz.Quantos filhotes
estas fêmeas terão gerado ao final de um ano?

5. Imagine ainda que cada filhote gerado entra no período de reprodução a partir do
sexto mês. Utilizando os dados dos exercícios 3 e 4, calcule o total de novos animais
gerados no decorrer de um ano pelas fêmeas da tabela 1.

Estas sequências apresentam-se de uma maneira simples e podem ser aplicadas


com alunos desde o início da escolaridade. Através da coleta de dados e da elaboração
de tabelas e gráficos, os estudantes podem observar que a utilização da Estatística
possibilita a resolução, compreensão e uma melhor visualização de diversificados
problemas que fazem parte do seu cotidiano e de outras pessoas.

Assim, podemos tornar a Matemática e seus diversos âmbitos de aplicabilidade,


do ponto de vista do aluno, um tanto mais prazerosa e com significância para ele, na
medida em que, oferecemos diferentes formas de aprender e de estudar, buscando
inovar sempre, a metodologia escolar, renovando, assim, o espírito da escola.

3 PRINCÍPIOS DE ESTATÍSTICA

Estatística é uma ciência exata que visa fornecer subsídios ao analista para
coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos
da população, tais como média ou desvio padrão.

A estatística fornece-nos as técnicas para extrair informação de dados, os quais


são muitas vezes incompletos, na medida em que nos dão informação útil sobre o
problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados
para obter uma melhor compreensão das situações que representam.

Quando se aborda uma problemática envolvendo métodos estatísticos, estes


devem ser utilizados mesmo antes de se recolher a amostra, isto é, deve-se planejar a
experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se
37

possa extrair o máximo de informação relevante para o problema em estudo, ou seja,


para a população de onde os dados provêm.

Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de


amostra, deixando de lado a aleatoriedade presente.

Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma


quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as
quais realçam toda a potencialidade da Estatística, na medida em que vão permitir tirar
conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos
ainda uma medida do erro cometido.

Exemplo:
Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de
saladas, de sobremesas e de carnes disponíveis, para conseguirmos chegar à conclusão
de que a comida é de boa qualidade. Basta que seja provado um tipo de cada opção
para concluirmos que estamos sendo bem servidos e que a comida está dentro dos
padrões.
3.1 População e Amostra

Qualquer estudo científico enfrenta o dilema de estudo da população ou da


amostra. Obviamente obter-se-ia uma precisão muito superior se fosse analisado o grupo
inteiro, a população, do que uma pequena parcela representativa, denominada amostra.
Observa-se que é impraticável na grande maioria dos casos, estudar a população por
completo, em virtude de distâncias, custo, tempo, logística, entre outros motivos.
A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se
a amostra é confiável e proporciona inferir sobre a população, chamamos de inferência
estatística. Para que a inferência seja válida, é necessária uma boa amostragem, livre
de erros, tais como falta de determinação correta da população, falta de aleatoriedade e
erro no dimensionamento da amostra.
Quando não é possível estudar, exaustivamente, todos os elementos da
população, estudam-se só alguns elementos, a que damos o nome de Amostra.

Exemplo:
38

Se o objetivo for estudar o desempenho escolar de um colégio, é indicado


estudar as notas dos alunos ao final do ano letivo. A partir daí poderemos facilmente
obter a percentagem de aprovações e reprovações.
Agora, se, entretanto, o interesse for aprofundar o estudo, saber se, por exemplo,
o sucesso no estudo pode ser atribuído para as alunas ou alunos, deveremos recolher
não somente a informação relativa a nota do aluno que aprovou ou não, mas também
para cada um, o sexo.
Aprovados

Masculino 28%

Feminino 13%

Total 41%

Quando a amostra não representa corretamente a população diz-se enviesada e


a sua utilização pode dar origem a interpretações erradas.

3.1.1 Recenseamento

Recenseamento é a contagem oficial e periódica dos indivíduos de um


País, ou parte de um País. Ele abrange, no entanto, um leque mais vasto de
situações.
Assim pode definir-se recenseamento do seguinte modo: Estudo científico
de um universo de pessoas, instituições ou objetos físicos com o propósito de
adquirir conhecimentos, observando todos os seus elementos, e fazer juízos
quantitativos acerca de características importantes desse universo.

3.1.2 Estatística descritiva e estatística indutiva

Sondagem
Por vezes não é viável nem desejável, principalmente quando o número de
elementos da população é muito elevado, inquirir todos os seus elementos sempre
que se quer estudar uma ou mais características particulares dessa população.
39

Assim surge o conceito de sondagem, que se pode tentar definir como:


Estudo científico de uma parte de uma população com o objetivo de estudar
atitudes, hábitos e preferências da população relativamente a acontecimentos,
circunstâncias e assuntos de interesse comum.

Amostragem
Amostragem é o processo que procura extrair da população elementos que
através de cálculos probabilísticos ou não, consigam prover dados inferenciais da
população-alvo.
Não Probabilística
Acidental ou conveniência
Intencional
Quotas ou proporcional
Desproporcional
Tipos de Amostragem
Probabilística
Aleatória Simples
Aleatória Estratificada
Conglomerado
3.1.3 Não Probabilística

A escolha de um método não probabilístico, via de regra, sempre


encontrará desvantagem frente ao método probabilístico. No entanto, em alguns
casos, se faz necessário a opção por este método. Fonseca (1996), alerta que não
há formas de se generalizar os resultados obtidos na amostra para o todo da
população quando se opta por este método de amostragem.

Acidental ou conveniência
Indicada para estudos exploratórios. Frequentemente utilizados em
supermercados para testar produtos.

Intencional
O entrevistador dirige-se a um grupo em específico para saber sua opinião.
Por exemplo, quando de um estudo sobre automóveis, o pesquisador procura
apenas oficinas.
40

Quotas ou proporcional
Na realidade, trata-se de uma variação da amostragem intencional.
Necessita-se ter um prévio conhecimento da população e sua proporcionalidade.
Por exemplo, deseja-se entrevistar apenas indivíduos da classe A, que representa
12% da população. Esta será a quota para o trabalho. Comumente também
substratifica-se uma quota obedecendo a uma segunda proporcionalidade.

Desproporcional
Muito utilizada quando a escolha da amostra for desproporcional à
população. Atribui-se pesos para os dados, e assim obtêm-se resultados
ponderados representativos para o estudo.

Exemplo:
Em um mercado de telefones celulares, considerando uma fatia de mercado
meramente ilustrativa, obteve-se os resultados conforme descritos a seguir:

Participação no Elementos da Amostra


Marcas mercado
n %

Nokia 60% 50 25%

Ericson 20% 50 25%

Gradiente 15% 50 25%

Philips 05% 50 25%

Total 100% 200 100%

Objetivando obtermos os pesos a serem atribuídos a cada marca de telefone


celular, para uma análise conjunta de todas as marcas no exemplo acima, obtemos os
seguintes coeficientes:

Marcas Pesos Número de elementos a serem entrevistados


41

Nokia 2,4 120

Ericson 0,8 40

Gradiente 0,6 30

Philips 0,2 10

Total 4,0 200

3.1.4 Probabilística

Para que se possam realizar inferências sobre a população, é necessário que se


trabalhe com amostragem probabilística. É o método que garante segurança quando se
investiga alguma hipótese. Normalmente os indivíduos investigados possuem a mesma
probabilidade de ser selecionado na amostra.

Aleatória Simples

É o mais utilizado processo de amostragem. Prático e eficaz, confere precisão


ao processo de amostragem. Normalmente utiliza-se uma tabela de números aleatórios
e nomeiam-se os indivíduos, sorteando-se um por um até completar a amostra calculada.
Uma variação deste tipo de amostragem é a sistemática. Em um grande número
de exemplos, o pesquisador depara-se com a população ordenada. Neste sentido, têm-
se os indivíduos dispostos em sequência o que dificulta a aplicação exata desta técnica.
Quando se trabalha com sorteio de quadras de casas, por exemplo, há uma regra
crescente para os números das casas. Em casos como este, divide-se a população pela
amostra e obtém-se um coeficiente (y). A primeira casa será a de número x, a segunda
será a de número x + y; a terceira será a de número x + 3. y.
Supondo que este coeficiente seja 6. O primeiro elemento será 3. O segundo
será 3 + 6. O terceiro será 3 + 2.6. O quarto será 3 + 3.6, e assim sucessivamente.
42

Aleatória Estratificada

Quando se deseja guardar uma proporcionalidade na população heterogênea.


Estratifica-se cada subpopulação por intermédio de critérios como classe social, renda,
idade, sexo, entre outros.

Conglomerado

Em corriqueiras situações, torna-se difícil coletar características da população.


Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o
conjunto. É exemplo de amostragem por conglomerado, famílias, organizações e
quarteirões.

3.2 Dimensionamento da amostra

Quando se deseja dimensionar o tamanho da amostra, o procedimento


desenvolve-se em três etapas distintas:
Avaliar a variável mais importante do grupo e a mais significativa;
Analisar se é ordinal, intervalar ou nominal;
Verificar se a população é finita ou infinita;

Variável intervalar e população infinita

Variável intervalar e população finita

Variável nominal ou ordinal e população


infinita

Variável nominal ou ordinal e população finita

Obs.: A proporção (p) será a estimativa da verdadeira proporção de um dos


níveis escolhidos para a variável adotada. Por exemplo, 60% dos telefones da
amostra é Nokia, então p será 0,60.
43

A proporção (q) será sempre 1 - p. Neste exemplo q, será 0,4. O erro é representado
por d.
Para casos em que não se tenha como identificar as proporções confere-se 0,5 para
p e q.

3.3 Tipos de dados

Basicamente os dados, dividem-se em contínuos e discretos. O primeiro


é definido como qualquer valor entre dois limites quaisquer, tal como um
diâmetro. Portanto trata-se de um valor que ser “quebrado”. São dados
contínuos, questões que envolvem idade, renda, gastos, vendas, faturamento,
entre muitas outras.
Quando se fala em valores discretos, aborda-se um valor exato, tal como
quantidade de peças defeituosas. Comumente utiliza-se este tipo de variáveis
para tratar de número de filhos, satisfação e escalas nominais no geral.
A tipologia dos dados determina a variável, ela será, portanto, contínua
ou discreta. Isto quer dizer que ao definir-se uma variável com contínua ou
discreta, futuramente já se definiu que tipo de tratamento se dará a ela.
De acordo com o que dissemos anteriormente, numa análise estatística
distinguem-se essencialmente duas fases:
Uma primeira fase em que se procura descrever e estudar a amostra:

Estatística Descritiva e uma segunda fase em que se procura tirar conclusões


para a população:

1ª Fase Estatística Descritiva


Procura-se descrever a amostra, pondo em evidência
as características principais e as propriedades.
44

2ª Fase Estatística Indutiva


Conhecidas certas propriedades (obtidas a partir de uma análise
descritiva da amostra), expressas por meio de proposições, imaginam-se
proposições mais gerais, que exprimam a existência de leis (na população).
No entanto, ao contrário das proposições deduzidas, não podemos dizer
que são falsas ou verdadeiras, já que foram verificadas sobre um conjunto
restrito de indivíduos, e, portanto, não são falsas, mas não foram verificadas
para todos os indivíduos da População, pelo que também não podemos afirmar
que são verdadeiras!
Existe, assim, um certo grau de incerteza (percentagem de erro) que é medido
em termos de Probabilidade.
Considerando o que foi dito anteriormente sobre a Estatística Indutiva,
precisamos aqui da noção de Probabilidade, para medir o grau de incerteza que
existe, quando tiramos uma conclusão para a população, a partir da observação
da amostra.

3.3.1 Agrupamento dos dados

Podemos pensar em agrupar os elementos:


Para isso, anotamos quantas vezes a nota aparece (frequência). No Excel,
chamamos a função estatística CONT.SE e mostramos o intervalo que queremos
analisar e a nota que queremos saber quantas vezes ela aparece:
45

Figura: Função Cont. Se

E fazendo este procedimento diversas vezes, obtemos:

Tabela: Notas dos alunos da escola Y- ano 2007

NOTAS FREQUÊNCIA

2 1

3 1

4 1

5 2

6 1

7 1

8 2

9 1

10 1

Podemos assim, fazer o gráfico:

Percebemos aqui que é preciso colocar título no gráfico e nome nos eixos.

nota 2 nota 3 nota 4 nota 5 nota 6 nota 7 nota 8 nota 9 nota 10 notas

Figura: Gráfico das notas dos alunos da série X

14

13

12

14
46

13

12

12

13

14

16

13

14

14

14

“ “

15

15

17

16

14

12

11

12

3.3.2 Algumas funções do Excel para descrição dos dados

Dada a amostra:

Teremos 4 funções mostradas aqui:

Tabela: Funções estatísticas

Função Intervalos de
Estatística células

Máximo 17

Mínimo 11

Cont. Números 22

Cont. Valores 23
47

Aqui temos a função Máximo = 17

A função Mínimo = 11

A função Cont. Números – que é relacionada à contagem de números apenas, não


importando com células vazias.

E a função Cont. Valores que é relacionada com o número de observações, mesmo sendo
células que estão vazias “ “.

Função frequência: A função estatística FREQUÊNCIA dá a distribuição de


frequências da matriz_dados de acordo com a matriz_bin definida:

Fig: Planilha do Excel com a tabela de funções estatísticas

Verifique que, a matriz_dados está nas células: A1; A23


48

E a Matriz_bin está na F15; F21

Selecione as células que estão na coluna posterior da matriz_bin

E digite a fórmula: =FREQUÊNCIA (A1:A3; F15:F21)

Pressione as teclas CTRL + SHIFT + ENTER

Onde obteremos os resultados acima.

Voltemos a analisar com um gráfico:

Fig: Como fazer gráfico

É preciso selecionar o Intervalo de dados na parte de cima desta caixa e, selecionar


a coluna da matriz_bin (F15: F21).

Após este procedimento, clicar em série (na parte superior desta caixa).
49

Fig: Passo-a-passo para fazer gráfico no Excel

Em Valores, selecione a matriz que tem os valores das frequências (G15:G21).

Em Rótulo dos eixos das categorias X, selecione Rótulos do eixo das categorias,
a matriz_bin: F15:F21.
50
51

Vamos fazer o gráfico das frequências relativas?

Figura: Gráfico com frequências relativas

E agora com frequências acumuladas:

Freqüências acumuladas (Fa)

25

20

15

10

0
11 12 13 14 15 16 17
valores das amostras

Figura: Gráfico com frequências acumuladas

É possível também, construir este gráfico combinado com as frequências:


relativa e acumulada:
52

Figura: Como construir Gráfico com frequências relativas e acumuladas

Como verificamos acima, existem as 2 frequências sendo analisadas no mesmo


gráfico. Conseguimos tal resultado fazendo o procedimento:

Assistente de gráfico;

Tipos personalizados;

Lins-Cols em 2 eixos;

Clicar em intervalos de dados, e selecionar os valores da frequência relativa, no


caso: H15:H21;

Em Série, clicar no eixo x, e colocar os valores da amostra, que estão nas


células: G15:G21;
Adicionar mais uma série: Clicar no botão Adicionar e colocar a coluna que estão
os valores da frequência acumulada: I15: I21;
53

3.5 Distribuição de frequências com dados agrupados

Os dados podem ser agrupados utilizando classes, mas para determiná-las


existem algumas maneiras, segundo Lapponi (2000):

k= arredondando para o valor inteiro menor ou maior;


k= 1+ 3,322* log n , arredondando para o valor inteiro menor ou maior;

Por exemplo, temos uma amostra de 21 dados:

50 34 65 59 58 45 67

56 54 43 78 49 56 54

76 67 67 67 60 56 45

Figura: Dados da amostra

Teremos então:

K = 21 = 4,58 = Podemos arredondar para 5.

Ou

K=1+ 3,322* log 21=5,39, podemos arredondar para 5

Assim, teremos que:

1) Determinar a amplitude de classe:

Descobrindo o Mínimo =34

Descobrindo o Máximo= 78

h= Máximo K Mínimo 78 5 34 8,8


54

Podemos trabalhar com o número 8,8 ou arredondá-lo para 9:


Fazendo o Histograma pelo Excel, teremos:

Ferramentas - Análise se dados – Histograma

Figura: Função Histograma do Excel

No Intervalo de entrada, colocamos os dados da amostra (A1:A21)

E no intervalo do bloco, colocamos os dados sem repetição (C1: C14):


55

Figura: Dados da amostra na coluna A e dados sem repetição na coluna C

Colocamos no intervalo de saída onde queremos que seja o resultado, e


obteremos:

Tabela: Resultado da Frequência e da Frequência relativa acumulada

%
Bloco Frequência cumulativo

5 0 0,00%

34 1 4,76%

43 1 9,52%

45 2 19,05%

49 1 23,81%

50 1 28,57%

54 2 38,10%

56 3 52,38%

59 2 61,90%
56

60 1 66,67%

65 1 71,43%

67 4 90,48%

76 1 95,24%

78 1 100,00%

Mais 0 100,00%

O que percebemos é que quando fazemos as classes e fazemos um gráfico via


assistente de gráfico, parece mais facilmente entendido;

Tabela: Dados agrupados por classes

Classes Frequência

34-43 1

43-52 5

52-61 8

61-70 5

70-79 2
57

Histograma

Figura: Histograma sem espaço intercolunas

Exemplo:

Uma empresa fabricante de um automóvel, pretende avaliar a potencialidade


do mercado, estimando através de um mercado teste.
Através de 1000 entrevistados, pretende-se verificar como se comportará a
fatia de intenção de votos para determinado candidato.
Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre
os inquiridos sobre a compra do novo produto, obter uma estimativa do número de
compradores na População.
58

3.6 Dados, tabelas e gráficos

Quando da análise de dados, é comum procurar conferir certa ordem aos


números tornando-os visualmente mais amigáveis. O procedimento mais comum
é o de divisão por classes ou categorias, verificando-se o número de indivíduos
pertencentes a cada classe:
1. Determina-se o menor e o maior valor para o conjunto:
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente
inferior ao menor valor das observações:
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente
superior ao maior valor das observações:

4. Definir o número de classes (K), que será calculado usando .


Obrigatoriamente deve estar compreendido entre 5 a 20.
5. Conhecido o número de classes define-se a amplitude de cada classe:
6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada
classe (inferior e superior)

Exemplo:

5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2

6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7

6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2

7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8

7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,4 8,5

8,5 8,6 8,7 8,8 8,9 8,9 9 9,1 9,2 9,4

9,4 9,5 9,5 9,6 9,8 9 9 10 10,2 10,2

10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9
59

Regras para elaboração de uma distribuição de frequências


1. Determina-se o menor e o maior valor para o conjunto:
Valor mínimo: 5,1
Valor máximo: 14,9
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente
inferior ao menor valor das observações: LI: 5,1
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente
superior ao maior valor das observações: LS:15

4. Definir o número de classes (K), que será calculado usando .


Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é igual
a 8,94, aproximadamente, 8.
5. Conhecido o número de classes define-se a amplitude de cada classe:

No exemplo, a será igual a: 1,23


6. Com o conhecimento da amplitude de cada classe, definem-se os limites para
cada classe (inferior e superior), onde limite inferior será 5,1 e o limite superior
será 15 + 1,23.

Intervalo de Frequência Frequência Frequência


Classe Absoluta Acumulada Relativa

05,10 a 06,33 13 13 16,25%

06,34 a 07,57 21 34 26,25%

07,58 a 08,81 22 56 27,50%

08,82 a 10,05 15 71 18,75%

10,06 a 11,29 4 75 5,00%

11,30 a 12,53 3 78 3,75%


60

12,54 a 13,77 1 79 1,25%

13,78 a 15,01 1 80 1,25%

80 100%

3.6.1 Distribuições simétricas

A distribuição das frequências faz-se de forma aproximadamente simétrica,


relativamente a uma classe média

Caso especial de uma distribuição simétrica:


Quando dizemos que os dados obedecem a uma distribuição normal,
estamos tratando de dados que distribuem-se em forma de sino.

3.6.2 Distribuições Assimétricas


A distribuição das frequências apresenta valores menores num dos lados:

3.6.3 Distribuições com “caudas” longas


Observamos que nas extremidades há uma grande concentração de dados
em relação aos concentrados na região central da distribuição.
61

3.7 Medidas de tendência Central

As mais importantes medidas de tendência central, são a média


aritmética, média aritmética para dados agrupados, média aritmética
ponderada, mediana, moda, média geométrica, média harmônica, quartis.
Quando se estuda variabilidade, as medidas mais importantes são: amplitude,
desvio padrão e variância.
Medidas
Média aritmética

Média aritmética
para dados
agrupados
Média aritmética
ponderada
1) Se n é impar, o valor é central, 2)
Mediana se n é par, o valor é a média dos
dois
valores centrais
Valor que ocorre com mais
Moda frequência.
Média geométrica
Média harmônica

Quartil

Sendo a média uma medida tão sensível aos dados, é preciso ter
cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados.
Pode-se mostrar, que quando a distribuição dos dados é “normal”, então a
melhor medida de localização do centro, é a média.
62

Sendo a Distribuição Normal uma das distribuições mais importantes e


que surge com mais frequência nas aplicações, (esse fato justifica a grande
utilização da média).
A média possui uma particularidade bastante interessante, que consiste
no seguinte: se calcularmos os desvios de todas as observações relativamente
à média e somarmos esses desvios o resultado obtido é igual a zero.
A média tem uma outra característica, que torna a sua utilização
vantajosa em certas aplicações: quando o que se pretende representar é a
quantidade total expressa pelos dados, utiliza-se a média.
Na realidade, ao multiplicar a média pelo número total de elementos,
obtemos a quantidade pretendida.

3.8 Moda

Define-se moda como sendo: o valor que surge com mais frequência se os
dados são discretos, ou, o intervalo de classe com maior frequência se os dados são
contínuos.
Assim, da representação gráfica dos dados, obtém-se imediatamente o valor
que representa a moda ou a classe modal
Esta medida é especialmente útil para reduzir a informação de um conjunto de
dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais
não se pode calcular a média e por vezes a mediana.

3.9 Mediana

A mediana é uma medida de localização do centro da distribuição dos dados,


definida do seguinte modo: ordenados os elementos da amostra, a mediana é o valor
(pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da
amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à
mediana.
63

Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a


amostra de n elementos:

Se n é ímpar, a mediana é o elemento médio.


Se n é par, a mediana é a semissoma dos dois elementos médios.

3.10 Considerações a respeito de Média e Mediana

Se representarmos os elementos da amostra ordenada com a seguinte


notação: X1:n , X2:n , ... , Xn:n então uma expressão para o cálculo da mediana será:
Como medida de localização, a mediana é mais robusta do que a média, pois não é
tão sensível aos dados.

1- Quando a distribuição é simétrica, a média e a mediana coincidem. 2- A


mediana não é tão sensível, como a média, às observações que são muito maiores ou
muito menores do que as restantes (outliers). Por outro lado, a média reflete o valor
de todas as observações.
Como já vimos, a média ao contrário da mediana, é uma medida muito
influenciada por valores “muito grandes” ou “muito pequenos”, mesmo que estes
valores surjam em pequeno número na amostra. Estes valores são os responsáveis
pela má utilização da média em muitas situações em que teria mais significado utilizar
a mediana.
A partir do exposto, deduzimos que se a distribuição dos dados:
1. for aproximadamente simétrica, a média aproxima-se da mediana;
2. for enviesada para a direita (alguns valores grandes como “outliers”), a média
tende a ser maior que a mediana;
3. for enviesada para a esquerda (alguns valores pequenos como “outliers”), a
média tende a ser inferior à mediana.
64

3.11 Medidas de dispersão

Já vimos algumas medidas de localização do centro de uma distribuição de


dados. Veremos agora como medir a variabilidade presente num conjunto de dados
através das seguintes medidas:
Um aspecto importante no estudo descritivo de um conjunto de dados, é o da
determinação da variabilidade ou dispersão desses dados, relativamente à medida de
localização do centro da amostra.
Supondo ser a média, a medida de localização mais importante, será
relativamente a ela que se define a principal medida de dispersão - a variância,
apresentada a seguir.

3.11.1 Variância

Define-se a variância, como sendo a medida que se obtém somando os


quadrados dos desvios das observações da amostra, relativamente à sua média, e
dividindo pelo número de observações da amostra menos
um.

3.11.2 Desvio-padrão

Uma vez que a variância envolve a soma de quadrados, a unidade em que se


exprime não é a mesma que a dos dados. Assim, para obter uma medida da
variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz
quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e
quanto maior for, maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que resultam imediatamente da definição,
são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.
65

Exemplo: em uma turma de aluno, verificou-se através da análise das notas de 15


alunos, os seguintes desempenhos:
Alunos Conceito na Prova

1 4,3

2 4,5

3 9

4 6

5 8

6 6,7

7 7,5

8 10

9 7,5

10 6,3

11 8

12 5,5

13 9,7

14 9,3

15 7,5

Total 109,8

Média 7,32

Desvio Padrão 1,77


66

Observamos no exemplo, que a média das provas, foi estimada em 7,32 com
desvio padrão em 1,77. Concluímos que a maioria das notas concentrou-se em 9,09
e 5,55.

3.11.3 Distribuição Normal

A distribuição normal é a, mas importante distribuição estatística,


considerando a questão prática e teórica. Já vimos que esse tipo de distribuição
apresenta-se em formato de sino, unimodal, simétrica em relação a sua média.
Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso
quer dizer que a probabilidade de uma observação assumir um valor entre dois pontos
quaisquer é igual à área compreendida entre esses dois pontos.

68,26% => 1 desvio


95,44% => 2 desvios
99,73% => 3 desvios

Na figura acima, tem as barras na cor marrom representando os desvios


padrões. Quanto mais afastado do centro da curva normal, mais área compreendida
abaixo da curva haverá. A um desvio padrão, temos 68,26% das observações
contidas. A dois desvios padrões, possuímos 95,44% dos dados compreendidos e
finalmente a três desvios, temos 99,73%. Podemos concluir que quanto maior a
variabilidade dos dados em relação à média, maior a probabilidade de encontrarmos
o valor que buscamos embaixo da normal.
Propriedade 1:
67

“f(x) é simétrica em relação à origem, x = média = 0; Propriedade


2:
“f(x) possui um máximo para z=0, e nesse caso sua ordenada vale 0,39; Propriedade3:
“f(x) tende a zero quando x tende para + infinito ou - infinito; Propriedade4:
“f(x) tem dois pontos de inflexão cujas abscissas valem média + DP e média - DP, ou
quando z tem dois pontos de inflexão cujas abscissas valem +1 e -1.

Exemplo:
As alturas de grupo de crianças são tidas como normais em sua distribuição,
com desvio padrão em 0,30m e média em 1,60. Qual a probabilidade de um aluno
medir (1) entre 1,50 e 1,80, (2) mais de 1,75 e menos de 1,48?
(1) z1= (1,50-
1,60)/0,30=-0,33 z2=
(1,80-1,60)/0,30= 0,67
Então, z1 (0,1293) + z2 (0,2486) = 37,79%
(2) z1= (1,75-
1,60)/0,30=0,30
0,500-0,1915 = 30,85%
(3)
Z1= (1,48-1,50)/0,30 =-0,4
0,500-0,1554 = 34,46%
68

REFERÊNCIAS UTILIZADAS E CONSULTADAS

BRASIL. MEC. Ministério da Educação e do Desporto/Secretaria de Educação Média


e Tecnológica. PCN+ - Ensino Médio. Brasília: MEC, 2002. Disponível em:
http://portal.mec.gov.br/seb/arquivos/pdf/CienciasNatureza.pdf>. Acesso em: 4 mar.
2011.

. SECRETARIA DE EDUCAÇÃO FUNDAMENTAL. Parâmetros Curriculares


Nacionais: Matemáticas (1o e 2o ciclos do Ensino Fundamental). Brasília: SEF/MEC,
1997a.

. SECRETARIA DE EDUCAÇÃO FUNDAMENTAL. Parâmetros Curriculares


Nacionais: Matemáticas (3o e 4o ciclos do Ensino Fundamental). Brasília: SEF/MEC,
1998b.

. PCN. Parâmetros Curriculares Nacionais (Ensino Médio): Texto Integral. 2002.


Disponível em: http://www.mec.gov.br/semtec/ensmed/pcn.shtm. Acesso em: 4 mar.
2011.

. PCN. Ciências da Natureza, Matemática e suas Tecnologias. 2002.


Disponível em: http://www.mec.gov.br/semtec/ensmed/ftp/CienciasNatureza.pdf.
Acesso em: 4 mar. 2011.

BUNCHAFT, Guenia; OLIVEIRA, Kellner Sheilah de. Estatística sem mistérios. 2 ed.
Petrópolis: Vozes, 1998. 4 vol.

BUSSAB, W. Estatística Básica. São Paulo: Saraiva, 2006.

CARDEÑOSO, J.M; AZCÁRATE, P. Tratamiento del conocimiento probabilístico en los


proyectos y materiales curriculares. Revista sobre La Enseñanza y Aprendizaje de
Las Matematicas (Revista SUMA), Zaragoza, v.20, p.41-51, nov/2005.

CARVALHO, C. Tarefas estatísticas e estratégias de resposta. Actas do VI


Encontro de Educação Matemática (pp. 127-134) Porto alegre: SPCE-SEM. 1998.

CRAMER, H. Mathemathical Methods of Statistics.USA: Princeton University Press,


1946.

CRESPO, Antônio Arnot. Estatística fácil. 15 ed. São Paulo: Saraiva. 1997.
69

GAL, I; GARFIEL, J. Curricular goals and assessment challenges in statistics


education. In: I. Gal. e J. Garfiel (Eds). The assessment challenge in statistics
education (pp.l-13). Amesterdão: 151. 1997.

GAL, I; GINSBURG, L. The role of beliefs and attitudes in learning statistics: towards
an assessment framework. Journal of Statistics Education. Disponível em:
www.archieve,jse.ncsu.edu. Acesso em: 5 mar. 2011.
HOEL, Paul Gerhard, et al. Estatística elementar. São Paulo: Atlas. 1981.

IBGE. Instituto Brasileiro de Geografia e Estatística. 2011. Disponível em:


<http://www.ence.ibge.gov.br/estatistica/aplicacoes.asp>. Acesso em: 4 mar. 2011.

LEVIN, Jakc. Estatística aplicada as ciências humanas. 2 ed. São Paulo: Harbra,
1985.

LOPES, C. A. E. A Probabilidade e a Estatística no Ensino Fundamental: uma


análise curricular. Campinas, SP: Faculdade de Educação da UNICAMP,1998. 125p.
(Dissertação, Mestrado em Educação).

LOPES, Celi Aparecida Espasandin; MORAN, Regina Célia Carvalho Pinto. A


estatística e a probabilidade através das atividades propostas em alguns livros
didáticos brasileiros recomendados para o ensino fundamental. In: CONFERÊNCIA
INTERNACIONAL, EXPERIÊNCIAS E PERSPECTIVAS DO ENSINO DA
ESTATÍSTICA : DESAFIOS PARA O SÉCULO XXI, 1, 1999, Florianópolis. anais...

MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. 4 ed.


São Paulo: Atlas. 1990.

MINAS GERAIS (ESTADO) Secretaria da Educação. Programa para o ensino


fundamental (1ª a 4ª série) – Matemática. vol. I, 1995a.

. SEE. Programa para o ensino fundamental (5ª a 8ª série) – Matemática. vol.I I,


1995b.

. Diretrizes curriculares de Matemática. 2004. SEE. Belo Horizonte, 2004. Disponível


em: www.educacao.mg.org.br. Acesso em: 5 mar. 2011.

NICK, Eva; KELLNER, Sheilah R. de O. Fundamentos de estatística para as


ciências do comportamento. 2 ed. Rio de Janeiro: Renes. 1971.

PEREIRA MENDOZA, L; SWIFT, J. Porquê ensinar estatística e probabilidades.


Educação e Matemática (9), 17-19. 1989.

PESTANA, D. D; VELOSA, S. F. Introdução à Probabilidade e à Estatística.


Fundação Calouste Gulbenkian, Lisboa, Volume I. 2002.
70

PONTE, J.P; MATOS, J.M; ABRANTES, P. Investigação em Educação


Matemática. Lisboa: IIE. 1998.

STUART, M. Changing the Teaching of Statistics. The Statistician, 44(1), 45-54. 1995.

TRIOLA, Mário F. Introdução à Estatística. LTC. 10 ed 2008.

WADA, R. S. Estatística e ensino: um estudo sobre representações de professores


do 3o grau. Tese de Doutorado. Universidade Estadual de Campinas, Campinas, São
Paulo. 1996.

ANEXOS

Anexo 01- Estatística Descritiva

1. Estatística Dedutiva ou Descritiva


Consiste na recolha, apresentação, análise e interpretação de dados numéricos, através da
criação de instrumentos adequados: quadros, gráficos e indicadores numéricos (Reis, 1996). Portanto,
a Estatística Descritiva visa somente descrever e analisar um certo grupo (amostra) sem daí retirar
conclusões ou inferências sobre a população da qual foi retirado esse grupo (Barreiros, 1984). Face aos
resultados de experiências e da observação dos processos naturais, a questão básica que se põe é
quase sempre, a seguinte: como resumir os aspectos essenciais dos dados? Será que existem
regularidades, tendências, ciclos, concentrações,. padrões, dignos de nota nos dados? Mas, por vezes,
dada a enorme quantidade de dados disponíveis, a questão central é: como resumir os dados de forma
que a informação neles contida possa ser facilmente comunicada e assimilada? É este o papel da
Estatística Descritiva (Vairinhos, 1996). Sin.: Análise de Dados (Vairinhos, 1996).

2. Tipos de dados

A interpretação das listas de números a olho é muito difícil. Ao invés disso, nós deveríamos
produzir um resumo verbal ou numérico e/ou usar métodos gráficos para descrever os pontos
principais dos dados.
O método mais apropriado dependerá da natureza dos dados, e aqui podemos distinguir
dois tipos principais:

1. Dados qualitativos ou categóricos que podem ser:


1. nominais, por exemplo
71

 sexo: masculino, feminino


 classificação de fósseis
2. ordinais, i.e. categorias ordenadas, tais como
 salinidade: baixa, média, alta
 abundância: dominante, abundante, frequente,
ocasional, raro
2. Dados quantitativos ou numéricos que podem ser:
1. discretos, i.e. contagens ou número inteiros, por exemplo
 número de ovos postos pela tartaruga marinha
 número de ataques de asma no ano passado
2. contínuos, i.e. medidas numa escala contínua, tais como
 volume, área, peso, massa
 velocidade de corrente

As distinções são menos rígidas do que a descrição acima insinua. Por exemplo, em geral nós
trataríamos idade como uma variável contínua, mas se a idade for registrada pelo ano mais próximo,
podemos trata-la como discreta, e se separarmos a amostra em ``crianças”, ``adultos jovens”, ``idade
média”, ``velhos”, por exemplo, então temos faixa etária como uma variável ordenada categórica. No
entanto, em geral é recomendado manter os dados em sua forma original, categorizando os dados
somente para propósitos de apresentação.
2.2 Dados qualitativos

Para sumarizar dados qualitativos numericamente, utiliza-se contagens, proporções,


percentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por
exemplo, se encontrarmos que 70 de 140 estudantes de geologia são homens, poderíamos relatar a
taxa como uma proporção (0.5) ou provavelmente ainda melhor como um percentual (50%). Se
encontrarmos que 7 de uma amostra de 5000 pessoas são portadores de uma doença rara poderíamos
expressar isto como uma proporção observada (0.0014) ou percentual (0.14%), mas melhor seria 1.4
casos por mil.
2.2.1 Tabulando dados

Frequentemente o primeiro passo da descrição de dados é criar uma tabela de


frequência. Por exemplo, as espécies de “woodlice” caindo numa armadilha foram:
72

Num relatório, a segunda coluna não seria mostrada, e os dados seriam sumarizados num
formato mais simples como mostrado abaixo. Se o maioria dos dados caem em poucas
categorias, então é conveniente colapssar algumas das categorias com somente uma ou
duas observações em outra categoria chamada “outros”.

Table showing the species of 27 woodlice that fell in a pit-fall trap:

Tabelas simples como esta são na maioria das vezes suficientes para descrever dados
qualitativos especialmente quando existem somente duas ou três categorias.

2.2.2 Resumindo numericamente

Considere o seguinte conjunto de dados que mostra os escores de abundância


médios DAFOR de ocorrência de Nardus stricta em 100 áreas investigadas em
Exmoor.

A moda de um conjunto de dados categóricos é a categoria que tem o maior


percentual de dados. Ela deve ser usada cuidadosamente como uma medida resumo
global porque é muito dependente da forma como os dados são categorizados. Para
os dados de “woodlice” a moda é Oniscus. Para os dados acima, a categoria modal é
“Abundante”, mas por muito pouco.
73

A mediana, bem como a moda, podem ser calculadas para dados ordenados. Este
é valor do “meio”, mais comumente usado para dados quantitativos. A mediana não
faz sentido para os dados “woodlice”. Para os dados de abundância, a categoria
mediana é “Frequente”, porque 50% dos dados estão em categorias superiores, e
menos do que 50% estão em categorias inferiores. A mediana é mais robusta do
que a moda pois é menos sensível à categorização adotada.
2.2.3 Gráficos de Barras

Dados qualitativos, particularmente quando as categorias são ordenadas, são


usualmente bem ilustrados num simples gráfico de barras onde a altura da barra é
igual à frequência.

2.2.4 Gráfico de setores

Gráfico de setores também podem ser úteis para apresentação de dados


categóricos ordenados. Os setores do gráfico são desenhados de tal forma que eles
tenham área proporcional à frequência. Então para os dados “woodlice”, os ângulos

seriam para Oniscus, etc.


74

2.3 Dados quantitativos

2.3.1 Histograma

De longe o método mais comum de apresentação de dados numéricos é o


histograma, relacionado com o gráfico de barras para dados categóricos. As áreas
dos retângulos resultantes devem ser proporcionais à frequência.
Algumas vezes é conveniente agregar classes de frequência nos extremos da
distribuição de forma que os intervalos têm larguras diferentes. Cuidado ao fazer
isso - um intervalo que é duas vezes a largura de um outro deve tem altura igual à
metade de sua frequência (para preservar a área contida dentro do intervalo) Da
mesma forma um intervalo que é três vezes a largura dos outros deve ter um terço
da altura de sua frequência observada.
Exemplo. 150 peixes mortos foram encontrados vítimas de contaminação do rio e
seus comprimentos foram medidos em milímetros. As medidas foram expressas na
forma de tabela de frequência.

O histograma construído desses dados é mostrado abaixo.


75

Gráfico de Ramos-e-Folhas
Um método gráfico que merece ser mais amplamente utilizado quando a quantidade
de dados não é muito grande é o gráfico de ramos-e-folhas como ilustrado a seguir.
Exemplo. Um estudo geoquímico realizado utilizando amostras compostas de
sedimentos de corrente com granulometria de 100-150 mesh e profundidade de
40cm, provenientes de riachos correndo sobre granulitos, revelou os seguintes
resultados em ppm de Cr

Uma vez que a escala tenha sido determinada, a qual define os “ramos” à esquerda
da linha vertical, podemos facilmente escrever os dados no gráfico de ramos-e-
folhas como no diagrama esquerdo; como um refinamento podemos então ordenar
as ``folhas” no diagrama à direita:

9 4

10 6 0

11 5 4 1 8
76

12 5 9 6 0

13 7 0 7 6 5

14 1 3 0 7

15 2 4 8 8

16 5 6 6

17 4 0

18 2 4

9 4
10 0 6

11 1 4 5 8

12 0 5 6 9

13 0 5 6 7 7

14 0 1 3 7

15 2 4 8 8

16 5 6 6

17 0 4

18 2 4

Acima os ramos são números inteiros e as folhas são valores depois do ponto
decimal, mas isto não é essencial em geral; por exemplo, os ramos podem
representar centenas e as folhas dezenas (com unidades arredondadas para o
77

decimal mais próximo; as folhas devem ter um único dígito). Nota: é importante
escrever as folhas em colunas igualmente espaçadas, caso contrário pode resultar
uma figura distorcida.
O gráfico de ramos-e-folhas fornece um resumo visual dos dados sem que haja de fato
a perda de qualquer informação.
Compare-o com um histograma para os mesmos dados:

2.3.2 Resumindo numericamente

Para resumir numericamente dados quantitativos o objetivo é escolher medidas


apropriadas de locação (“qual o tamanho dos números involvidos?”) e de dispersão
(“quanta variação existe?”) para os tipos de dados.
Existem três escolhas principais para a medida de locação, a chamada “3 Ms”, as quais
estão ligadas a certas medidas de dispersão como segue:

2.3.3 Média, variância e desvio padrão

Para resumir dados quantitativos aproximadamente simétricos, é usual calcular a


78

média aritmética como uma medida de locação. Se são os valores dos


dados, então podemos escrever a média como

onde `

ou até mesmo

' e frequentemente é simplificada para

que significa `adicione todos os valores de '.

A variância é definida como o „desvio quadrático médio da média' e é calculada de


uma amostra de dados como

A segunda versão é mais fácil de ser calculada, embora muitas calculadoras têm
funções prontas para o cálculo de variâncias, e é raro ter que realizar todos os
passos manualmente. Comumente as calculadoras fornecerão a raiz quadrada da
variância, o desvio padrão, i.e.

a qual é medida nas mesmas unidades dos dados originais.

Uma informação útil é que para qualquer conjunto de dados, pelo menos 75% deles

fica dentro de uma distância de 2 desvio padrão da média, i.e. entre e


.
Exemplo. Sete homens foram pesados, e os resultados em kg foram:
57.0, 62.9, 63.5, 64.1, 66.1, 67.1, 73.6.
79

A média ,
é

a variância é
.
e o desvio padrão é

2.3.4 A mediana e a amplitude inter-quartis

Uma outra forma de sumarizar dados é em termos dos quartis ou percentis. Essas
medidas são particularmente úteis para dados não simétricos. A mediana (ou
percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e.
metade dos dados têm valores maiores do que a mediana, a outra metade tem
valores menores do que a mediana. Adicionalmente, os quartis inferior e superior,
Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três
quartos, respectivamente, dos dados. Estes três valores são frequentemente usados
para resumir os dados juntamente com o mínimo e o máximo. Eles são obtidos
ordenando os dados do menor para o maior, e então conta-se o número apropriado

, e
de observações: ou seja é para o quartil inferior, mediana e
quartil superior, respectivamente. Para um número par de observações, a mediana é
a média dos valores do meio (e analogamente para os quartis inferior e superior).

A medida de dispersão é a amplitude inter-quartis, IQR Q 3 Q1, i.e. é a diferença


entre o quartil superior e o inferior.
Exemplo. O número de crianças em 19 famílias foi
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10

A mediana é o (19+1) / 2 = valor, i.e. 3 crianças.


O quartil inferior e superior são os valores e , i.e. 2 e 6 crianças, portanto
amplitude inter-quartil é de 4 crianças. Note que 50% dos dados estão entre os
quartis inferior e superior.

2.3.5 Box-and-Whisker Plots

Box-and-Whisker plots ou simplesmente box-plots são simples representações


diagramáticas dos cinco números sumários: (mínimo, quartil inferior, mediana, quartil
80

superior, máximo). Um box-plot para os dados geoquímicos fica como mostrado a


seguir.

2.3.6 A moda

Nem todos os conjuntos de dados são suficientemente balanceados para o cálculo


da média ou mediana. Algumas vezes, especialmente para dados de contagem, um
único valor domina a amostra. A medida de locação apropriada é então a moda, a
qual é o valor que ocorre com maior frequência. A proporção da amostra a qual toma
este valor modal deveria ser utilizada no lugar de uma medida formal de dispersão.
Algumas vezes, podemos distinguir claramente „picos' na frequência dos valores
registrados. Neste caso (chamado bimodal) deveríamos apresentar ambas as
localizações. Dados deste tipo são particularmente difíceis de resumir (e analisar).
Exemplo. Dez pessoas registraram o número de copos de cerveja que eles tomaram
num determinado sábado:
0, 0, 0, 0, 0, 1, 2, 3, 3, 6

A moda é 0 copos de cerveja, a qual foi obtida pela metade da amostra. Poderíamos
adicionar mais informação separando a amostra e dizendo que daqueles que
tomaram cerveja a mediana foi de 3 copos.

2.4 Dados múltiplos

Os resultados de um estudo tipicamente envolverão mais do que uma única amostra


de dados como discutido até aqui. Representações gráficas são úteis para comparar
grupos de dados ou para verificar se existem relações entre eles. Existem muitas
possibilidades, mas a mais adequada dependerá das peculiaridades de cada
conjunto de dados.
Além dos exemplos abaixo, podemos criar combinações de métodos já discutidos.
Por exemplo, se medirmos as alturas e pesos de uma amostra de pessoas, podemos
produzir box-plots de altura lado a lado para homens e mulheres, ou gráficos ramo-e-
folhas lado a lado (com as alturas dos homens à esquerda do ramo, e as alturas das
mulheres à direita), ou um histograma acima do outro (com a mesma escala no eixo
x de forma que eles possam ser facilmente comparados). Para um número diferente
de grupos, uma série de box-plots verticais funciona bem como um simples resumo
dos dados.
Para combinações de dados categóricos, uma série de gráficos de setores podem ser
produzidos, i.e. dois gráficos de setores, um para homens e um para mulheres.
2.4.1 Gráficos de pontos
Para avaliar se existe uma relação entre duas variáveis contínuas, podemos produzir
um gráfico de pontos. É importante que o eixo x faça sentido. Em geral faz pouco
sentido unir os pontos, exceto onde o eixo x representa tempo (veja abaixo).
Símbolos diferentes podem ser usados para diferentes grupos para adicionar uma
nova dimensão ao gráfico. O gráfico abaixo mostra alturas e pesos de estudantes do
sexo masculino e feminino.
81

Para mais do que duas variáveis, pode-se produzir gráficos entre todos os pares
possíveis para produzir uma matriz de gráficos de pontos.
2.4.2 Gráfico temporal
Um caso especial de um gráfico de pontos é um gráfico temporal onde „tempo' está
no eixo x. As medidas são feitas ao longo do tempo. Nestes casos é usual unir
pontos sucessivos por retas, e é em geral uma boa prática deixar o eixo x mais longo
do que o eixo y.
Abaixo mostramos as temperaturas diárias médias em Philadelphia, USA nos dois
primeiros meses de 1980.
82

2.4.3 Ladder plot


O ladder plot não é um gráfico do tipo padrão mas pode ser útil para visualizar dados
pareados. Considere o seguinte exemplo.
Um ornitologista deseja saber se um determinado local é usado por pássaros
migratórios de uma certa raça para engorda antes de migrar. Ele captura alguns
pássaros em Agosto e pesa-os, então em Setembro ele tenta re-capturar os
mesmos pássaros e faz novas medidas. Ele re-capturou 10 dos pássaros duas
vezes, ambos em Agosto e Setembro. A tabela abaixo mostra as massas desses
pássaros.

O ladder plot destes dados fica como segue:

É muito mais fácil ver do gráfico do que da tabela que os pássaros tendem a
engordar, e que aqueles que não engordaram tenderam a ser os maiores que
provavelmente não necessitam de uma engorda extra.
83

Disponível em: http://leg.ufpr.br/~paulojus/CE003/ce003/node2.html. Acesso em: 4


abr. 2011.

2.5 Exercícios 1

1. Descreva de forma concisa os seguintes dados usando suas palavras e algumas


estatísticas descritivas, apontando características principais observadas.
1. As notas (de um total de 100 e ordenadas por tamanho) de 20 estudantes de
estatística no primeiro exame do semestre:

30 35 37 40 40 49 51 54 54 55

57 58 60 60 62 62 65 67 74 89

2. O número de faltas de 20 trabalhadores num ano (ordenados por tamanho):

0 0 0 0 0 0 0 1 1 1

2 2 3 3 4 5 5 5 8 45

3. O número de exemplares de um jornal mensal em particular lidos por 20


pessoas num ano:

0 1 11 0 0 0 2 12 0 0

12 1 0 0 0 0 12 0 11 0

2. Produza um gráfico ramos-e-folhas para apresentação dos dados de altura (em


metros) de 20 mulheres sendo estudadas para uma certa condição médica.

1.52 1.60 1.57 1.52 1.60

1.75 1.73 1.63 1.55 1.63


84

1.65 1.55 1.65 1.60 1.68

2.50 1.52 1.65 1.60 1.65

3. Os dados a seguir fornecem a concentração de um determinado poluente (ppm) em


8 pontos de um afluente medidos antes e uma hora depois de um acidente
ambiental:

Faça um gráfico destes dados, e use o gráfico para ajudar a avaliar se o acidente
provocou um aumento significativo nos níveis do poluente no afluente.

4. A tabela abaixo fornece o número de grânulos de arenito por cm em 20 amostras


tomadas de uma certa localidade (A) e 20 amostras tomadas de uma outra
localidade (B).

1. Calcule as médias e desvios-padrão dessas duas amostras.


85

2. Faça histogramas dos dois conjuntos de dados, e compare-os.


3. Qual é o mínimo, máximo, mediana, quartil inferior e quartil superior de cada
grupo?
4. Usando sua resposta ao item (c), construa boxplots para os dois conjuntos
de dados - um diretamente acima do outro, ou lado a lado para facilitar a
comparação.
5. Para cada grupo, o dado é aproximadamente simétrico ou assimétrico? Se
assimétrico, em que direção?
6. Você acha que existe uma diferença real entre os números de grânulos de
arenito nas duas localidades, ou você acha que as diferenças observadas
poderiam ter simplesmente ocorrido como uma consequência dos grupos
consistirem de somente 20 amostras cada?
7. Descreva as principais características dos dados em uma ou duas
sentenças.
5. O percentual de açúcar e sal em 9 cereais matinais mais populares foram medidos,
com os seguintes resultados:

1. Faça um gráfico desses dados para investigar a relação entre o conteúdo de


açúcar e sal nos cereais matinais.
2. Comente brevemente qualquer padrão observado nos dados.

Anexo 02 – Estatística Indutiva (ou Inferencial), Estatística Matemática,


Inferência Estatística ou Estatística Analítica

É o conjunto de técnicas, assentes na teoria das probabilidades, que permitem construir


proposições de caráter probabilístico acerca da população, partindo da observação de alguns dos seus
elementos (amostra) (Vairinhos, 1996). A indução é, segundo a lógica filosófica, a operação mental
que parte de um certo número de observações ou experiências, para a proposição geral, a lei (Sobral
& Barreiros, 1980). Assim, os métodos de inferência estatística envolvem o cálculo de estatísticas, a
partir das quais se infere sobre os parâmetros da população, isto é, permitem com determinado grau
86

de probabilidade, generalizar à população certas conclusões, por comparação com os resultados


amostrais (Reis et al., 1997a).

Na Inferência Estatística ou Estatística Matemática a questão central é: como usar os dados


para tentar obter conclusões acerca do todo ou população de onde são originários os dados (Vairinhos,
1996). Pretende-se conhecer algo sobre a população U, não sendo, em geral, possível o seu estudo
exaustivo.

A informação pretendida sobre U é então obtida a partir de uma observação limitada a uma
amostra «conveniente». As amostras convenientes, permitindo inferências válidas para a totalidade
do universo, são amostras aleatórias (Mello, 1997). Ou seja, o problema básico da Inferência
Estatística é descobrir, face aos dados das observações, qual é a distribuição populacional, mais
precisamente: qual é a distribuição da variável aleatória que caracteriza (define) a população
(Vairinhos, 1995). Em suma, inferir significa, portanto, deduzir como consequência, conclusão ou
probabilidade.

Os processos de inferência estatística introduzem ordem em qualquer tentativa para tirar


conclusões da evidência fornecida por amostras. A lógica desses processos dita algumas das
condições que devem reger a recolha de dados e as provas estatísticas dizem-nos quão grandes
devem ser as diferenças (na amostra) para que possamos afirmar que elas representam realmente
diferenças no grupo (população) do qual se extraiu a amostra para estudo. A Estatística Inferencial
aborda dois tipos de problemas fundamentais: a) a estimação de parâmetros de uma população, e
b) o teste de hipóteses (Siegel, 1975).

Anexo 03 - Glossário de Termos da Estatística

Amostra - é um subconjunto finito da população que se supõe representativo desta.


Amostra Amodal - é uma amostra que não tem moda.
Amostra Bimodal - é uma amostra que tem duas modas.
Amostra Imparcial - é uma amostra em que todos os elementos tiveram igual
oportunidade de fazer parte da mesma.
Amostra Multimodal - é uma amostra que tem mais do que duas modas.
Amostra Representativa - é aquela que deve conter em proporção todas as
características qualitativas e quantitativas da população.
Amostragem Aleatória Simples - é aquela em que qualquer elemento da população
tem a mesma probabilidade de ser escolhido.
87

Amostragem Estratificada - é aquela em que a população está dividida em estratos


ou grupos diferenciados.
Amostragem Sistemática - é aquela em que os elementos são escolhidos a partir
de uma regra previamente estabelecida.
Amplitude de um Conjunto de Dados - é a diferença entre o maior valor e o
menor valor desse conjunto. Se os dados estiverem agrupados em classes, a
amplitude é a diferença entre o limite superior da última classe e o limite inferior da
primeira. Atributos Qualitativos - são atributos que estão relacionados com uma
qualidade e apresentam-se com várias modalidades.
Atributos Quantitativos - são atributos aos quais é possível atribuir uma medida e
apresentam-se com diferentes intensidades ou valores.
Censo - é um estudo estatístico que resulta da observação de todos os indivíduos da
população relativamente a diferentes atributos pré-definidos.

Classe Mediana ( ) - é a classe, para dados classificados, que contém a Mediana

(neste caso considera-se como Mediana o valor da variável estatística que


corresponde a n/2, quer n seja par, quer n seja ímpar).
Classe Modal - é a classe, para dados classificados, que aparece com maior
frequência.
Coeficiente de Correlação Linear (r)- medida estatística que permite calcular o
valor numérico correspondente ao grau de dependência entre duas variáveis, o qual
varia entre -1 e 1.
Correlação - é a relação ou dependência entre as duas variáveis de uma distribuição
bidimensional.
Correlação Fraca ou Nula - quando o Diagrama de Dispersão não permite o

ajustamento de nenhuma reta, o que significa que r Diz-se, então, que não
existe nenhuma relação entre as variáveis da Distribuição Bidimensional.
Correlação Negativa Forte - quando a reta de regressão, obtida a partir do
Diagrama de Dispersão, tem declive negativo. A correlação é negativa quando r

varia entre -1 e 0 e será tanto mais forte quanto r se aproxima de -1.


Correlação Negativa Perfeita ou Linear - quando a reta de regressão, obtida a partir
do Diagrama de Dispersão, tem declive negativo com r
88

Correlação Positiva Forte - quando a reta de regressão, obtida a partir do


Diagrama de Dispersão, tem declive positivo. A correlação é positiva quando r varia
entre 0 e 1 e será tanto mais forte quanto r se aproxima de 1.
Correlação Positiva Perfeita ou Linear - quando a reta de regressão, obtida a
partir do Diagrama de Dispersão, tem declive positivo com r
Dados Classificados - são valores que uma dada variável pode tomar dentro de
certo intervalo. Estes dados são classificados ou agrupados em classes.
Dado Estatístico - é o resultado da observação de um atributo/variável qualitativa ou
quantitativa.
Dados Simples - vão valores associados a uma dada variável e cuja representação
é feita através de uma tabela.
Definição do Problema - é a primeira fase do estudo estatístico e consiste na
definição e formulação correta do problema a ser estudado.
Desvio Médio ( d )- é a média aritmética do valor absoluto da diferença entre cada
valor e a média, no caso dos dados não classificados. No caso dos dados
classificados, tem que se entrar em conta com a frequência absoluta de cada
observação.
Desvio Padrão ( )- é a raiz quadrada positiva da variância.
Diagrama de Dispersão - é a representação num referencial ortonormado de um
conjunto de pares ordenados de valores (x , y), onde cada par ordenado
corresponde a uma observação.
Distribuição Bidimensional - é a representação de uma variável bidimensional (x i ,
xj), com 1 i n e xi e xj duas variáveis unidimensionais.
Diagrama de Caule-e-Folhas - o mesmo que Separador de Frequências.
Diagrama de Extremos e Quartis - é um diagrama que representa os valores
extremos e os quartis de uma variável estatística.
Distribuição de Frequências - o mesmo que Tabela de Frequências.
Estatística - é o método que ensina a recolher, classificar, apresentar e interpretar
um conjunto de dados numéricos.
Estatística Descritiva - ramo da Estatística que tem por finalidade descrever certas
propriedades relativas a um conjunto de dados.
89

Estatística Indutiva - ramo da Estatística que procura inferir propriedades da


população a partir de propriedades verificadas numa amostra da mesma.
Fenómenos Independentes - são fenômenos respeitantes à mesma variável que
não têm qualquer ligação um com o outro.
Frequência Absoluta ( fi ) - é o número de vezes que o valor de determinada variável
é observado.
Frequência Absoluta Acumulada ( Fi )- é a soma das frequências absolutas
anteriores com a frequência absoluta deste valor.
Frequência Relativa ( f ri ) - é o quociente entre a frequência absoluta do valor da
variável e o número total de observações.
Frequência Relativa Acumulada ( F ri )- é a soma das frequências relativas
anteriores com a frequência relativa desse valor.
Função Cumulativa - função que indica para cada valor real x a frequência
absoluta (ou relativa) de observações com intensidade menor ou igual a x. A
representação gráfica desta função é em forma de escada.
Gráfico Circular - é representado por um círculo que está dividido em
sectores cujas amplitudes são proporcionais à frequência que lhe
corresponde. Gráfico de Barras - é constituído por barras, horizontais ou
verticais, de comprimento proporcional à frequência.
Histograma - é um gráfico de barras em que a área destas é proporcional à
frequência, não havendo espaço entre as mesmas. Só se utiliza em variáveis
quantitativas contínuas.

Média Aritmética Simples ( ) - é o quociente da soma de todos os dados não


classificados pelo número desses dados.

Média Aritmética Ponderada ( ) - é o quociente entre o somatório do produto de


cada dado classificado pela sua frequência absoluta e o número desses dados.

Mediana ( ) - é o valor da variável, para dados não classificados, que ocupa a


posição central da distribuição.
Medidas de Dispersão - é um conjunto de medidas (Amplitude, Variância e Desvio
Padrão) utilizadas no estudo da variabilidade de uma determinada distribuição,
permitindo obter uma informação mais completa acerca da “forma” da mesma.
90

Medidas de Localização - é um conjunto de medidas (Média, Mediana, Moda e


Quartis) que representam de uma forma global um conjunto de dados.
Medidas de Tendência Central - o mesmo que Medidas de Localização.
Moda (m )- observação que ocorre com maior frequência numa amostra.
Nuvem de Pontos - o mesmo que Diagrama de Dispersão.
Organização dos Dados - consiste em “resumir” os dados através da sua contagem
e agrupamento.
Pictogramas - são gráficos onde se utilizam figuras ou símbolos alusivos ao
problema em estudo.
Planificação do Problema - consiste na determinação de um processo para
resolver o problema e, em especial, como obter informações sobra a variável em
estudo.
Polígono de Frequências - são gráficos com aspecto de linhas quebradas.
Constroem-se unindo por segmentos de reta os pontos médios das bases
superiores dos retângulos de um histograma.
População - é um conjunto de seres com uma dada característica em comum e com
interesse para o estudo.
Quartis (Q1 e Q3)- são os valores que dividem a distribuição em quatro partes iguais.
Recenseamento - o mesmo que Censo.
Recolha de Dados - é a primeira etapa depois de definido o problema em estudo.
Recta de Regressão - é a reta traçada sobre uma dada Nuvem de Pontos, sendo
um modelo matemático que pretende descrever a relação existente entre duas
variáveis unidimensionais de uma distribuição bidimensional.
Relações Estatísticas - são relações que se podem estabelecer entre determinadas
variáveis de um problema em estudo.

Separador de Frequências - é um tipo de tabela que permite ter uma percepção


imediata do aspecto global dos dados sem perda da informação contida na coleção
dos dados inicial.

Somatório ( - representa, de forma abreviada, uma soma.


Sondagem - é o estudo estatístico que se baseia numa parte da população, isto é,
em uma amostra que deve ser representativa dessa população.
91

Tabela de Frequências - são tabelas onde se apresentam os dados por classes e


as frequências respectivas.
Tamanho da Amostra - é o número de elementos que constituem uma dada
amostra.
Unidade Estatística ou Indivíduo - é cada um dos elementos da população.

Variância ( )- é a medida que permite avaliar o grau de dispersão dos valores da


variável em relação à média.
Variáveis Contínuas - são as variáveis que podem tomar qualquer valor de um
determinado intervalo.
Variáveis Discretas - são as variáveis que podem tomar um número finito ou uma
infinidade numerável de valores.
Variáveis Qualitativas - o mesmo que Atributos Qualitativos.
Variáveis Quantitativas - o mesmo que Atributos Quantitativos.
92

Anexo 04 - Fórmulas

Amplitude
Para um intervalo do conjunto de dados de [a,b], onde x1= a e xn= b

Coeficiente de Correlação Linear (com n = nº de observações da amostra)

Desvio Médio (com n = nº de observações da amostra)


Dados não classificados Dados classificados

Desvio Padrão (com n = nº de observações da amostra)


93

Frequência Absoluta Acumulada (com n = nº de observações da amostra)

Frequência Relativa (com n = nº de observações da amostra)

Frequência Relativa Acumulada (com n = nº de observações da amostra)

Média Aritmética Simples (com n = nº de observações da amostra)

Mediana (com n = nº de observações da amostra)


94

Quando o índice i dos x i não é um número inteiro, calculam-se como nos exemplos
seguintes:

Reta de Regressão (com n = nº de observações da amostra)

onde

Somatório

onde gi(x) representa uma expressão, cuja variável é x, que varia consoante o índice
i varia de 1 até n.
95

Variância (com n = nº de observações da amostra)

Você também pode gostar