Você está na página 1de 94

ESTATÍSTICA

2
SUMÁRIO

Palavra do Professor autor


Sobre o autor
Ambientação à disciplina
Trocando ideias com os autores
Problematizando

UNIDADE I: APRESENTANDO A ESTATÍSTICA

A estatística no dia-a-dia
A estatística e sua história
Definindo a estatística
Apresentando a estatística descritiva
Apresentando a estatística indutiva
Entendendo a escolha de amostras

UNIDADE II: ORGANIZAÇÃO DOS DADOS

Variáveis estatísticas
Dados da pesquisa
Tabelas estatísticas
Distribuições de frequências
Elaborando tabelas de frequência

UNIDADE III: APRESENTAÇÃO DOS DADOS

Apresentação gráfica
Histogramas
Polígono de frequências
Poligonal ogiva

3
UNIDADE IV: MEDIDAS DESCRITIVAS

Medidas das distribuições


Moda: mo
Mediana: md
Média: x
Desvio padrão: sx

Explicando melhor com a pesquisa


Leitura Obrigatória
Saiba mais
Pesquisando com a Internet
Vendo com os olhos de ver
Revisando
Auto avaliação
Bibliografia
Bibliografia Web
Vídeos

4
Palavra dos Professores autores
Olá, seja muito bem-vindo (a)!

Caro estudante.

A estatística está cada vez mais presente no cotidiano do povo


brasileiro. Os gráficos e os índices são formas comuns usadas nas notícias de
jornais e televisão. Deste modo, torna-se imprescindível um conhecimento
básico da estatística para que possamos interpretar corretamente tais notícias.

Este é o propósito de Estatística: um texto básico em linguagem simples


que leva esta ciência ao alcance de todos. Ele inicia mostrando que a
estatística é uma ciência que trata coletivamente de dados numéricos. Neste
capítulo apresento o que a estatística faz com os dados, deixando, portanto, o
como ela faz para os posteriores. Mas, ainda nele, o leitor verá que a
estatística está subdivida em duas grandes partes: a descritiva e a indutiva.
Concluída essa visão geral, o texto passa para a estatística descritiva que é
tratada do segundo ao último capítulo. São nestes textos que o leitor verá
como fazer tabelas e gráficos e como calcular média e desvio padrão.
Entretanto, para que os conceitos tratados sejam melhores interpretados
finaliza mostrando os testes de hipótese, dando assim uma introdução na
estatística indutiva.

Desejamos sucesso no seu estudo!

Os autores

5
Sobre os autores

Marcus Fabio Lima Ferreira possui Bacharelado em


Matemática pela Universidade de Fortaleza - UNIFOR
(1987), Especialização em Estatística Aplicada a
Meteorologia pela Universidade Federal da Paraíba-
UFPB (1988) e Mestrado em Educação Matemática pela
Universidade Estadual Paulista-UNESP (1995).
Atualmente sou Professor Assistente VII do Curso de Matemática da
Universidade Estadual Vale do Acaraú - UVA em Sobral. Coordenador
Regional da Olimpíada Brasileira de Matemática das Escolas Públicas -
OBMEP-CE. Coordenador do Curso de Especialização em Didática da
Matemática das Faculdades INTA, e Professor dos Cursos de Graduação:
Enfermagem, Fisioterapia, Engenharia Civil e Engenharia de Produção. Áreas
de atuação: História da Matemática, da Física e da Astronomia, Teoria dos
Números e Filosofia da Ciência e Biomatemática. Tenho o pseudônimo de
Fabius BONNET.

Maria da Conceição Erenice Farias Lima, possui


Bacharelado em Filosofia pela Universidade Estadual
Vale do Acaraú - UVA e Licenciatura em História pelas
Faculdades INTA. Especialização em Didática da
Matemática e também Especialização em História do
Brasil. Atualmente sou Professora do Curso de
Pedagogia: Presencial/EAD das Faculdades INTA. Atua principalmente nas
seguintes áreas: Didática e Filosofia da Matemática, Teoria e Filosofia da
História, Teoria do Conhecimento, Filosofia da Ciência, entre outros interesses.

6
Ambientação a disciplina

Caro estudante, convidamos você para conhecer a estatística. Aqui


mostraremos um pouco sobre a história dessa ciência, partindo também de
alguns conceitos fundamentais para uma melhor realização do estudo. Para
aprimorar o seu conhecimento no assunto, faço a seguinte indicação do livro:
Introdução à Bioestatística da autora Sonia Vieira, nele temos uma forma de
linguagem menos formal, mais adequada aos dias de hoje, como a própria
autora coloca.

Introdução a Bioestatística será sua ferramenta


para aprender o passo a passo desta disciplina.
Agora com mais exercícios propostos, todos
voltados para área da saúde, com respostas
comentadas na solução de problemas de
bioestatística.

VIEIRA, Sonia. Introdução à Bioestatística. 3ªed. Rio de Janeiro: Editora


Campus, 1980.

7
Trocando ideias com os autores

Agora, sinta-se convidado a se debruçar nessas duas sugestões de


leituras abaixo.

O autor Pedro Luiz de Oliveira Costa Neto é professor


de pós-graduação em Engenharia de Produção na
Escola Politécnica da USP, onde se aposentou mas
segue orientando teses, na Universidade Paulista e nas
Faculdades Tancredo Neves. Desde 1965 lecionou
Estatística em várias entidades, como a Escola de
Engenharia Mauá, a Universidade de Campinas, e
diversos outras. A experiência didática e de
conhecimento do autor neste campo do saber foi consolidada neste livro, cuja
primeira edição remonta a 1977, deste quando vem sendo utilizado em cursos
de graduação e pós-graduação em todo o Brasil. Esta segunda edição
incorpora aperfeiçoamentos que deverão aumentar a eficácia da obra na
apresentação dos principais conceitos e técnicas da Estatística aos estudantes
e pesquisadores nela interessados.

NETO, Pedro Luiz de Oliveira Costa. Estatística. Editora Edgard Blucher, 2º


Ed.,2007.

A estatística é uma ciência que trata de dados


numéricos. Entretanto a sociedade não é muito afeita
aos números. Então para resumir uma pesquisa
estatística, evitando os números foram criados os
gráficos como forma de apresentação são eles:
gráficos de barras, de colunas ou de pizzas.

8
CALLEGARI-JACQUES, Sidia M. Bioestatística: Princípios e aplicações. Artmed,
Porto Alegre, 2003.

Guia de Estudo

Analise os dois livros e faça uma síntese fazendo um paralelo nas duas
obras e relacionando com o assunto abordado nessa disciplina.

9
Problematizando

Estamos acostumados a vê em jornais, em revistas, na TV, ou na


internet gráficos e tabelas. É que esses meios de comunicação usam esses
recursos em suas reportagens, pois essas ilustrações tornam mais fáceis as
apresentações das notícias.

Vejamos como exemplo um gráfico que mostra a distribuição das


Instituições de Ensino Superior no Brasil.

Para que possamos compreender esse tipo de notícia e até dar nossa opinião
fundamentada é necessário entender e interpretar tais gráficos. O gráfico acima
mostra que no Brasil quase a metade das Instituições de Ensino Superior estão
na região sudeste. Isso é um exemplo da presença da estatística no nosso dia-
a-dia.

GUIA DE ESTUDO:

A partir do exposto acima, como você pode usar a estatística nas suas
atividades diárias?

10
Apresentando a Estatística

CONHECIMENTO

Conhecer o conceito da ciência estatística para desenvolver a compreensão da


disciplina.

HABILIDADES

Fornecer a compreensão da estatística como uma ciência que trata de dados


numéricos.

Reconhecer situação do dia a dia em que a estatística pode ser usada.

Diferenciar a estatística da matemática.

ATITUDES

Explicar o que a estatística faz com os dados numéricos da pesquisa.

11
A estatística no dia a dia

Estamos acostumados a vê em jornais, em revistas, na TV, ou na


internet gráficos e tabelas. É que esses meios de comunicação usam esses
recursos em suas reportagens, pois essas ilustrações tornam mais fáceis as
apresentações das notícias. Vejamos como exemplo um gráfico que mostra a
distribuição das Instituições de Ensino Superior no Brasil.

Figura 1.1

Para que possamos compreender esse tipo de notícia e até dar nossa
opinião fundamentada é necessário entender e interpretar tais gráficos. O
gráfico acima mostra que no Brasil quase a metade das Instituições de Ensino
Superior estão na região sudeste. Isso é um exemplo da presença da
estatística no nosso dia-a-dia. Outro exemplo é uma pesquisa que dá
informação sobre a distribuição dos brasileiros por regiões e tipo de domicílio.
Ela foi realizada pelo Instituto Brasileiro de Geografia e Estatística – IBGE o
qual pode constatar, no censo de 2000, que:

 A população urbana é maior que a rural em todas as regiões;


 A maioria da população está na Região Sudeste com 72,4 milhões de
habitantes;
 A população do Sudeste é seis vezes maior que a do Centro Oeste

12
O IBGE publicou a tabela a seguir que mostra também a distribuição por
sexo, onde os números representam milhões de habitantes.

Regiões Total Distribuição por Domicílio


sexo
Homens Mulheres Urbana Rural
Norte 12,9 6,5 6,4 9,0 3,9
Nordeste 47,7 23,4 24,3 33,0 14,8
C.Oeste 11,6 5,8 5,8 10,1 1,5
Sudeste 72,4 35,4 37,0 65,5 6,9
Sul 25,1 12,4 12,7 20,3 4,8

Estes exemplos mostram como a estatística faz parte da vida do


cidadão, mesmo que na maioria das vezes as pessoas não percebam isso. É
através de dados estatísticos que os governos passam a conhecer as
condições socioeconômicas de uma população. Portanto, é através de
institutos como IBGE e o IBOPE, que o governo brasileiro obtém dados para as
políticas públicas. Estes institutos podem informar:

 Quais estados apresentam maior carência no atendimento médico a


população?
 Qual a renda média da população que é menos assistida pelo Sistema
Único de Saúde - SUS?
 Qual o nível de escolaridade da população que trabalha e tem menos de
30 anos?

Estes dois exemplos mostram o uso de gráficos e tabelas, mas também


podem dar a falsa impressão de que a Estatística seria uma ciência usada
apenas por grandes especialistas, como estatísticos e matemáticos. Na
verdade, os métodos estatísticos básicos são simples, e podem ser usados por
qualquer pessoa e até pela maioria dos alunos do Ensino Fundamental.

13
Vejamos dois exemplos de uso simples da estatística, onde são usados os
conceitos de média e desvio padrão.

I) Avaliando o desempenho da turma


Se uma professora das séries iniciais desejasse avaliar o desempenho
de sua turma em língua portuguesa, ela poderia usar a nota de cada aluno e
calcular a média e o desvio padrão das notas. Isso lhe permitiria avaliar o
desempenho da turma como um todo. Além disso, é importante que a
professora saiba que suas conclusões, se feitas dentro dos padrões
estatísticos, são cientificamente credíveis.

II) Escolhendo o time de basquetebol


Se um professor de educação física precisa escolher entre dois
jogadores (A e B) qual deveria ser escalado no time de basquete para a
próxima partida, de modo que sua escolha tivesse chance de ser a melhor
tecnicamente, então ele poderia usar a estatística como sua auxiliar nesta
decisão.

Com este objetivo em mente ele poderia registrar os desempenhos de


cada jogador nos cinco últimos jogos, anotando os pontos feitos por cada
jogador numa tabela. Vamos supor que os pontos estão na tabela abaixo:

Jogador A Jogador B
Jogo Nºde pontos Jogo Nºde pontos
1 20 1 30
2 22 2 14
3 18 3 20
4 20 4 12
5 19 5 16

Agora, usando fórmulas que calculam a média e o desvio padrão dos


pontos feitos por cada jogador, o professor poderia escolher entre A e B, com a

14
maior chance de fazer a escolha certa. Além disso, poderia dizer que fez uma
escolha técnica com base científica.

A estatística e sua história

Atualmente quando se fala em Estatística, muitos ligam à matemática,


então se quisessem conhecer sua história buscariam num capítulo da história
da matemática. Apesar disso, a Estatística tem uma origem bem diferente, visto
que ela nasceu da necessidade de informações sobre o número de habitantes
ou tamanho das propriedades de terras. Essas informações eram usadas pelos
governantes para calcular o imposto cobrado ou fazer recrutamento de homens
para a guerra. Sobre isso encontramos bons exemplos.

Na Antiguidade o imperador romano Augusto (63 a.C-14d.C) ordenou


que fosse feito um censo em todo o império. O uso da palavra censo deixa
clara a intenção do imperador, visto que ela vem do latim censere que significa
taxar. Portanto, o objetivo era calcular o imposto a ser cobrado ao povo. Na
Idade Média encontramos registros de outro censo feito por Guilherme,

O Conquistador, (1028-1087) que ordenou um levantamento dos bens do


Estado na Inglaterra e que contivesse informações sobre: tamanho da
propriedade, forma do uso da terra, proprietários, serviçais e animais, as quais
seriam usadas no cálculo de imposto.

Esses exemplos históricos mostram o significado da palavra estatística:


tem a raiz latina estatus (Estado), mas deriva do neolatim statisticum collegium
que significa conselho de estado. Essa interpretação é reforçada quando
encontramos na Inglaterra matemáticos que estudavam uma Aritmética Política
como William Petty (1623–1687) e que estudou numericamente fenômenos
sociais e de saúde elaborando as Tábuas de Mortalidades. Entretanto, foi o
alemão Gottfried Achenwall quem introduziu em 1749 a palavra Statistik para
significar Ciência do Estado.

15
Portanto, originalmente a estatística era um estudo para coletar dados
numéricos sobre populações a serem usados pelos governos, e eram feitos por
matemáticos com a participação de órgãos públicos.

Definindo a estatística

É sempre difícil definir qualquer ciência, entretanto, podemos


resumidamente dizer que a estatística é uma ciência que trata com conjuntos
de dados numéricos de maneira coletiva. Portanto, ela estuda os conjuntos
numéricos como um todo. Com esses dados numéricos os métodos estatísticos
procedem assim:

 Os organiza em tabelas e gráficos;


 Os Descreve através de números;
 Analisa probabilisticamente os números obtidos;
 Interpreta na prática os resultados numéricos.

Nestas quatro fases os métodos estatísticos criam os conceitos e


elementos científicos que facilitam uma tomada de decisão a respeito de uma
pesquisa. Assim, de maneira resumida temos:

1. ORGANIZA
CONJUNTO TOMADA
2. DESCREVE
DE DE
3. ANALISA
DADOS NUMÉRICOS DECISÃO
4. INTERPRETA

Do exposto vemos que a estatística é a ferramenta científica que fornece


informações sobre uma coleção de dados numéricos para facilitar a tomada de
decisões. Ela é uma ciência auxiliar para profissionais de diversas áreas.

16
Costumamos dividir estas quatro fases de uma pesquisa estatística em
duas grandes partes: a estatística descritiva e a estatística indutiva, de modo
que podemos resumir esta ciência assim:

1. Organiza
Estatística
Descritiva 2. Descreve

ESTATÍSTICA

Estatística 3. Analisa
Indutiva 4. Interpreta

Hoje a estatística se expandiu para muito além de sua origem ligada aos
censos para informações do Estado. Seus métodos são hoje usados na
agronomia, na saúde pública, no controle de qualidade na indústria, nos índices
sociais, ou nos índices educacionais que formam a base da política
educacional.

Deve-se ressaltar que a estatística não é um ramo da matemática, mas


por dar um tratamento numérico aos dados, usa as teorias matemáticas, como
a probabilidade, para dar fundamentação científica aos seus métodos.

É necessário distinguir os significados de estatísticas e estatística.


Naturalmente a última é a ciência que acabamos de definir, entretanto, quando
usamos no plural, queremos nos referir a números que fornecem informações
sobre uma área. Por exemplo, as estatísticas educacionais se referem aos
números ou índices que informam como anda a educação de um Estado ou
País.

Com os dados numéricos a ciência estatística organiza,


descreve, analisa e interpreta.

17
Apresentando a estatística descritiva

A maioria das pessoas que algum dia estudou estatística lembra que fez
tabelas, gráficos de barras e cálculo de médias. Assim, elas estudaram a
Estatística Descritiva, pois é nesta parte da estatística que estas coisas são
estudadas. Vamos agora compreender melhor esta popular parte da
estatística.

Muitas vezes um pesquisador tem diante de si uma enorme quantidade


de dados numéricos sobre um estudo, e por isso mesmo se torna muito difícil
retirar as informações úteis para sua pesquisa. É necessário, portanto, que os
dados sejam resumidos para que ele possa tirar informações dos mesmos, isto
é, o pesquisador precisa “fazer os dados falarem”. A estatística

descritiva procura descrever coletivamente as características de um conjunto


de dados numéricos. Na verdade, os métodos estatísticos se iniciam com a
estatística descritiva, pois esta parte da estatística faz o seguinte:

1. Organiza os dados numéricos em tabelas;


2. Apresentação graficamente os dados tabelados;
3. Calcula números que descrevem os dados.

Esta será o nosso foco principal a estatística descritiva, mas agora


veremos mais detalhadamente a estatística indutiva.

A estatística descritiva organiza em tabelas, apresenta em


gráficos e calcula números que descrevem os dados.

18
Apresentando a estatística indutiva

Ao contrário da popular estatística descritiva, a estatística indutiva,


também chamada estatística inferencial, é pouco conhecida pelos estudantes.
Para compreender melhor este ramo da estatística, é preciso antes
compreender os conceitos de indução, população, amostra e probabilidade.

I) Indução

Em lógica chamamos de indução ao processo de obtenção do


conhecimento que parte dos casos particulares conhecidos e formula uma
conclusão geral. Por exemplo, suponhamos que foram mostrados a uma
criança 10 cachorros e todos eles tinham 4 patas. Então a criança conclui: todo
cachorro tem 4 patas. Esta, como sabemos, é uma conclusão correta, pois não
imaginamos que um cachorro venha a nascer com 3 ou 5 patas. Portanto, ter 4
patas é uma característica de todos os cachorros. Além disso, a conclusão da
criança é indutiva, pois ela formulou vendo casos particulares. Entretanto, às
vezes, esse processo de indução pode levar a conclusões erradas. Por
exemplo, suponha que todos aqueles 10 cachorros apresentados à criança
também tivessem um grande rabo. Deste modo, ela também poderia concluir:
todo cachorro tem um rabo. Mas, sabemos que há cachorros cujo rabo é quase
imperceptível ou eventualmente foram cortados.

Em resumo, as conclusões indutivas, isto é, feitas com base em casos


particulares, podem ser verdadeiras ou falsas.

II) População

Se um partido político quer conhecer a preferência do eleitor para dois


pré-candidatos a governador de um Estado, então o universo estatístico ou
população dessa pesquisa será o eleitorado daquele Estado. Assim, em um
estudo estatístico a população é formada por todos os indivíduos ou objetos
que fornecem dados da pesquisa.

19
III) Amostra

Algumas vezes é difícil, ou até mesmo impossível chegar a todos os


indivíduos ou objetos de uma população. Deste modo, devemos limitar o nosso
estudo a uma parte da população, que chamaremos de amostra. Assim,
dizemos que a amostra é qualquer subconjunto da população.

Agora já podemos compreender o que faz a estatística indutiva: ela tem


como objetivo formular conclusões sobre uma população, tendo como base um
estudo realizado numa amostra. O diagrama abaixo procura mostrar isso.

População

Amostra

Inferência estatística
Estudo
estatístico
na amostra

Sobre essa amostra aplicamos os métodos da estatística e chegamos a


uma conclusão. Essa conclusão que é retirada da amostra e levada para a
população é chamada de inferência estatística. Um dos principais objetivos de
uma pesquisa estatística é fazer inferência.

Nesta altura do desenrolar do conteúdo um leitor poderia concluir: então


a inferência estatística poderá ser verdadeira ou falsa, pois é uma conclusão
indutiva de casos particulares representados pela amostra, para o caso geral
que é a população. Então, como podemos confiar na estatística? É ai que entra
o importante conceito de probabilidade.

20
IV) Probabilidade

Em nosso cotidiano qualquer experimento a ser realizado pode ser


classificado em duas categorias: determinísticos ou aleatórios. Os
experimentos determinísticos são aqueles que antes de acontecer já dizemos o
que ocorrerá. Por exemplo: se uma pessoa fizer a experiência de tomar 20ml
do veneno cianureto já sabe antecipadamente o resultado: morrerá. Por outro
lado, os experimentos aleatórios são aqueles que não existem modos de
predizê-los, como este: se jogarmos um dado para o alto, não teremos como
saber antecipadamente qual será o resultado.

Como muitos experimentos em ciência são justamente do tipo


imprevisíveis, os cientistas procuram estimar a chance de um resultado num
experimento aleatório acontecer. Isto é feito através da probabilidade, então
definimos: a probabilidade é um número que mede a chance de um resultado
ocorrer num experimento aleatório. Por exemplo: ao jogarmos um dado e
apostarmos no número 5, qual é a chance que temos de acertar? Como todos
os possíveis resultados são os números 1, 2, 3, 4, 5 e 6, então a probabilidade
de sair o número 5 é: de 1 entre as 6 possibilidades, isto é, a probabilidade é
1/6. Escrevendo esta fração na forma percentual temos 16,6%. Portanto, temos
apenas 16,6% de chance de acertarmos.

Agora podemos dizer que a estatística indutiva usa métodos que são
capazes de tirar conclusões probabilísticas sobre uma população. Para isso,
usa resultados obtidos sobre uma amostra que foram feitos:

 pela estatística descritiva que calculou números como média e desvio


padrão que descrevem a amostra e;
 pela teoria da probabilidade aplicada sobre esses números descritivos,
mostrando a chances deles serem também obtidos na população.
O esquema abaixo procura mostrar os passos seguidos na pesquisa
estatística.

21
Técnicas Estatística Cálculo
de Descritiva de
Amostragem Probabilidade

População
Inferência estatística

Estatistica
Indutiva

A estatística indutiva busca fazer uma conclusão probabilística


sobre uma população a partir de uma amostra.

Entendendo a escolha de amostras

No diagrama anterior que resume a pesquisa estatística vimos que um dos


componentes é a amostra, e as técnicas de escolhê-las chamamos
amostragem. Mas por que razão um pesquisador usaria a amostra como fonte
de dados ao invés da própria população? Podemos elencar alguns motivos:

 O custo e tempo para fazer o recenseamento de populações grandes;


 A impossibilidade física de examinar toda a população, independente do
tamanho;
 A comprovada credibilidade científica das informações obtidas de
amostras.

Vejamos um exemplo do segundo caso: suponha que um gerente de


uma fábrica de palitos de fósforos desejasse mostrar a qualidade do produto.
Para tal ele deveria mostrar aos compradores a probabilidade de um fósforo
acender, se um palito fosse escolhido ao acaso. Neste estudo estatístico não
poderia ser usada toda a população de fósforo, pois ao testar todos eles

22
acabaria a produção da fábrica. Assim, neste experimento somos obrigados a
usar uma amostra.

I) Como obter uma amostra

Inicialmente é preciso definir os critérios que serão usados para


selecionar as unidades da amostra. De acordo com a técnica de escolha,
teremos o tipo de amostra:

 Amostra aleatória onde todos os elementos são obtidos por sorteio;


 Amostra estratificada onde os elementos são agrupados e estes
grupos são escolhidos por algum critério de diferentes estratos da
população;
 Amostra de conveniência onde os elementos são escolhidos porque é
fácil para o pesquisador.

A escolha da técnica varia com muitos fatores, mas o importante é que


as amostras sejam representativas da população para que as conclusões,
tiradas da amostra obtida pela estatística indutiva, possam ser levadas a
população.

II) Estatísticas e Parâmetros

Assim como há diferenças entre amostra e população é preciso também


diferenciar os números a elas associados, portanto definimos:
 Estatísticas são números que descrevem as características da
amostra.
 Parâmetros são números que descrevem as características da
população.

Por exemplo, quando ouvimos na TV que 37% dos brasileiros aprovam


um determinado candidato a presidente, a televisão está nos apresentando

23
uma estatística, pois esse resultado vem de uma pesquisa de uma amostra de
1500 a 2000 eleitores. Entretanto, esta estatística de 37% é uma estimativa do
parâmetro e este, será o valor verdadeiro da população. Não existe garantia
matemática de que as estatísticas amostrais sejam bem próximas dos
parâmetros populacionais, entretanto há uma grande probabilidade de que isso
ocorra.

III) Tamanho da amostra

Naturalmente a confiabilidade na estimativa de um parâmetro


populacional depende do tamanho da amostra. Amostras não devem ser nem
muito grandes, nem bem pequenas. Por outro lado, sabe-se que: se a
população for muito maior que a amostra, então a confiança na estatística
amostral não depende do tamanho da população.

Agora surge a pergunta: Como decidir o tamanho de uma amostra? A


primeira resposta é: pela experiência do pesquisador na área. Veremos que o
pesquisador influi na escolha do tamanho da amostra. Isto é tão presente na
prática que ocorre até mesmo quando são usadas fórmulas, pois o pesquisador
deve definir a margem de erro e o nível de confiança que ele deseja ter nos
parâmetros populacionais. Uma fórmula muita usada para o cálculo do
tamanho n de uma amostra é a seguinte:

Apesar da aparente independência da fórmula, os valores das variáveis


z, p e d são escolhidos pela experiência do pesquisador na área, como mostra
o quadro da página seguinte.
A autora Sônia Vieira, no seu livro Introdução a Bioestatística, cita um
interessante exemplo na determinação do tamanho da amostra onde é aplicada
a fórmula acima e o pesquisador influi decididamente no cálculo tamanho n da

24
amostra. É isso que veremos a seguir no artigo retirado do livro, onde um
antropólogo estuda a porcentagem de sangue tipo O dos habitantes de uma
ilha.

Imagine que um antropólogo está estudando os habitantes de uma


ilha isolada e que quer determinar a porcentagem de pessoas desta ilha
com sangue tipo O. Quantas pessoas devem ser examinadas? O tamanho
da amostra pode ser determinado por uma equação que, no entanto, não
pode ser resolvida sem respostas para algumas questões.
A primeira questão é: Qual é a margem de erro que o
antropólogo admite em seus resultados? Vamos imaginar que ele diz
ficar satisfeito com o erro de mais ou menos 5%, isto é, se 43% das
pessoas da amostra tiverem sangue tipo O, a verdadeira porcentagem de
pessoas com sangue desse tipo deverá está entre 38% e 48%, ou seja,
num intervalo 43% 5%.
Neste ponto convém avisar o antropólogo de que como ele está
trabalhando com uma só amostra existe a chance de que ele, por azar,
possa tomar uma amostra pouco representativa. O antropólogo então
concorda em admitir a probabilidade de uma amostra errada em cada 20.
Isto significa que ele terá probabilidade de 19/20 de obter a verdadeira
porcentagem de sangue tipo O dentro do intervalo calculado. Temos
então o nível de confiança: 95%
Mas é preciso saber ainda o valor que o antropólogo espera para
a porcentagem de pessoas da ilha com esse tipo de sangue. Ele diz que,
com base no que sabe de outras populações, é razoável esperar que essa
porcentagem esteja entre 30% e 60%. Ótimo. Admitiremos por
simplicidade, que essa porcentagem seja de 50%. Podemos agora aplicar
a fórmula:
𝑧 𝑝 𝑝
𝑛
𝑑
Em que z é um valor dado em tabelas de nível de confiança
aproximadamente z = 2, logo a porcentagem de pessoas com sangue tipo
O, segundo o antropólogo deve ser de 50%, logo p = 50. O valor de d é a
margem do erro. Em porcentagem 5%, então o tamanho da amostra
deverá ser igual a n = 400. Portanto, este exemplo mostra que não é
suficiente sabermos uma fórmula, é preciso um conhecimento prévio e
bom senso. (Citada por Sonia Vieira. Introdução a Bioestatística.
Elsevier,2008, p.11-12

1Citada
Organização de dados
por Sonia Vieira. Introdução a Bioestatística. Elsevier,2008, p.11-12

25
2

CONHECIMENTO

Conhecer as formas técnicas para se organizar e distribuir determinados dados


da pesquisa estatística.

HABILIDADES

Identificar e classificar os diversos tipos de variáveis.

Executar a distribuição dos dados em tabelas.

Interpretar dados estáticos apresentados por meio de tabelas.

ATITUDES

Analisar as informações a partir dos dados expostos nas tabelas.

26
Variáveis estatísticas

Em estatística chamamos de variável aquilo que destacamos de uma


população para ser estudada. Por exemplo, na população de estudantes
universitários de Sobral, se nós desejarmos conhecer a idade média dessa
população, então a idade média destes estudantes será a nossa variável
estatística. Vejamos mais exemplos:

a) população: estudantes universitários de Sobral


Variável: renda média

b) população: índios do Xingu


Variável: altura média

c) população: candidatos do último ENEM


Variável: sexo

d) população: sabonete de uma determinada marca


Variável: fragrâncias mais vendidas.

Em uma pesquisa estatística sobre pessoas as variáveis são de


diferentes naturezas como: cor da pele, sexo, altura, peso, idade, escolaridade
ou renda. Assim, devido aos métodos estatísticos usados, foi preciso dividir as
variáveis em duas grandes categorias:

 as variáveis quantitativas são aquelas que assumem números como


seus valores, por exemplo, a idade.
 as variáveis qualitativas são aquelas que assumem nomes como seus
valores, por exemplo, o sexo.
Além disso, cada um destes tipos ainda estão divididos como vemos no
esquema a seguir:

27
1. Discreta
2. Contínua
Quantitativas
Variáveis
Estatísticas
Qualitativas
3. Nominais
4. Ordinais

 Variável discreta: seus valores só podem ser números


inteiros. Por exemplo, o número de filhos (1,2,..)
 Variável contínua: seus valores são números, que podem ser inteiros ou
não. Por exemplo, o salário (657,35)
 Variável nominal: seus valores são nomes. Por exemplo, a cor dos olhos
(preto, castanho, verde, azul)
 Variável ordinal: quando seus valores são nomes e podem ser
distribuídos em categorias ordenadas. Por exemplo, o nível escolar
(fundamental, médio, superior)

A importância do tipo de variável está no fato de que isso definirá a


técnica de amostragem e os métodos que serão usados para estudar a
variável.

2.1.1 Dados da pesquisa

Chamamos de dados de uma pesquisa aos diferentes valores que uma


variável pode assumir, os quais podem ser números ou nomes. Por exemplo,
suponha que uma academia de ginástica desejando conhecer a satisfação dos
clientes, os pediu que dessem notas de 1 a 5 sobre os serviços prestados.
Portanto, a variável desta pesquisa será a satisfação dos clientes e os dados
serão todas as notas.

Suponha ainda que foram entrevistadas 20 clientes e que as notas estão


no quadro abaixo

28
Notas dadas pelos clientes
4 3 3 4 5
2 1 4 5 3
5 3 2 4 4
4 5 1 3 2

Estes números são conhecidos como dados brutos, isto é, não


trabalhados estatisticamente. Uma primeira organização de dados numéricos
brutos é coloca-los em ordem crescente. A isto chamamos Rol. Neste exemplo,
o rol das notas será:

Rol = 1,1,2,2,2,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5.

Naturalmente esta organização em rol só é prática quando temos uma


pequena quantidade de dados numéricos.

Tabelas estatísticas

Os dados coletados devem ser organizados em tabelas para serem


melhores entendidos. O IBGE definiu as normas técnicas da elaboração de
tabelas. Elas devem ser colocadas no texto logo depois de mencionadas,
formadas de colunas de dados e devem ter apenas linhas horizontais. As
tabelas devem conter: título, cabeçalho, corpo e rodapé.

 Título explica o conteúdo da tabela.


 Cabeçalho explica o conteúdo das colunas.
 Rodapé informa a fonte dos dados e notas.
 Corpo conteúdo dos dados.

Estas orientações gerais nem sempre são seguidas. Por exemplo, o


rodapé às vezes não aparece, pois as fontes muitas vezes são desconhecidas.

29
Vejamos a seguir duas tabelas diferentes que são utilizadas para organizar os
dados coletados, onde a primeira é usada para variáveis numéricas enquanto a
segunda para variáveis qualitativas.

Exemplo 1:

Um médico, para estudar o desempenho cardíaco de 7 mulheres que


foram submetidas a diálise renal, obteve valores para cinco variáveis de
interesse cardiológico. Por exemplo, tempo de duração da diálise, e pressão
máxima são duas variáveis. Na tabela estão os dados numéricos obtidos para
cada paciente.

Mulheres submetidas à diálise renal


Nº de Idade Tempo de Peso Pressão Pressão
paciente (anos) diálise/h (Kg) máxima mínima
1 45 14 62,0 140 85
2 62 54 52,5 100 70
3 38 34 67,8 140 100
4 26 18 48,2 165 105
5 35 71 46,0 170 105
6 44 39 40,4 150 100
7 32 25 58,3 127 90

Tabela 2.1

30
Ao olharmos para a tabela já notamos que as colunas identificam as variáveis
estudadas e as linhas os dados relativos a cada paciente. Por exemplo: a
terceira paciente tem 38 anos, passou 34 horas na diálise, pesa 67,8 kg e
apresentou a pressão 140 por 100 mmHg. Observe que todas as variáveis são
quantitativas, pois assumem valores numéricos. Portanto, uma tabela organiza
e facilita a leitura dos dados numéricos coletados em um estudo.

Exemplo 2:

Foram entrevistados 2000 brasileiros para saber a opinião deles sobre


desempenho de determinado técnico de futebol. As respostas foram as
seguintes: 1150 disseram que era um bom técnico; 450 que era regular; 280
que era ruim e 120 não sabiam opinar. Essa pesquisa pode ser organizada
numa tabela com apenas duas colunas, como a seguinte:

Tabela 2.2

Opinião de brasileiros sobre um técnico de futebol

Respostas Frequência
Bom 1150
Regular 450
Ruim 280
Não opinaram 120
Total 2000

31
Nesta pesquisa temos apenas uma variável: a qualidade do técnico. Na
coluna da esquerda estão os valores nominais que esta variável assume, isto
é, as respostas: bom, regular e ruim. A coluna da direita indica o número de
vezes que cada resposta se repetiu. Esta repetição de um mesmo dado é
chamada em estatística de frequência. É esse tipo de tabela que estudaremos
a seguir.

Distribuições de frequências

Uma importante tabela para organizar os dados coletados numa


pesquisa é aquela em que contamos a repetição de um dado que é chamada
de frequência. Como ela distribui em uma coluna as frequências é
naturalmente chamada de tabela de distribuições de frequências ou
simplesmente Distribuições de Frequências. De acordo com o tipo de variável
envolvida podemos ter três tipos: frequências absolutas, frequências relativas
ou frequências acumuladas. Vejamos nos exemplos a seguir como elaboremos
esses tipos de distribuições de frequências.

Exemplo 1:

A Secretaria de Ação Social de um município queria concentrar recursos


na área de maior interesse de uma favela com cerca de 2000 moradores.
Assim, fez uma pesquisa com uma amostra de 40 pessoas onde foi
perguntado: Em qual das três áreas: educação, saúde e segurança, você
considera que o problema é mais grave nessa comunidade? Para facilitar o
entrevistador registrava na folha de respostas o seguinte:

1: se a resposta fosse educação;

2: se a resposta fosse saúde;

3: se a resposta fosse segurança

No quadro abaixo temos as respostas fictícias desta pesquisa.

32
Respostas da pesquisa na favela

3 3 3 3 3 2 3 1
2 1 3 3 3 2 3 3
2 3 3 1 2 1 3 1
2 3 1 3 3 1 2 2
3 3 3 2 1 3 3 2

Com esses dados brutos vamos elaborar duas tabelas: a de frequências


absolutas e a de frequências relativas.

I) Tabela de frequências absolutas: f

Fazemos duas colunas: uma das respostas e a outra de frequências.


Para obtermos estas, simplesmente contamos o número de vezes que cada
resposta se repete usando aquela nossa maneira de contar votos formando
quadradinhos. Portanto, voltando ao quadro anterior contamos a quantidade de
um, de dois e de três e vamos registrando ao lado das palavras
correspondentes. Procedendo assim obteremos o seguinte:

Educação: □ □ tem frequência. 8

Saúde: □ □ || tem frequência. 10

Segurança: □ □ □ □ □|| tem frequência. 22

Tabela 2.3: frequências absolutas

33
Respostas dos moradores da favela informando o
problema da comunidade
Respostas Frequência
Educação 8
Saúde 10
Segurança 22
Total 40

Tabela de frequências relativas; fr

Quando dizemos que 8 pessoas entrevistadas citaram a falta de


educação como o principal problema da comunidade, nos deixa a dúvida se
isso é pouco ou muito. Isto por que: se considerarmos 8 respostas em 10
entrevistados foi a maioria, mas 8 entre 100 é uma minoria. Portanto, é
importante que comparemos as respostas dadas com o total de indivíduos
pesquisados. Ao fazermos isso obtemos uma fração entre a frequência
absoluta que representamos por f e o número total de dados N da pesquisa,
que chamamos de frequência relativa. Veja:

Em seguida escrevemos essa fração na forma de números percentuais,


que é mais prático para interpretarmos. Para isso basta multiplicar a fração f/N
por 100 que o resultado será em porcentagem.

34
Tabela 2.4: frequências relativas

Respostas dos moradores da favela informando o problema


da comunidade
Respostas Frequência
Educação 20%
Saúde 25%
Segurança 55%
Total 100%

Portanto, segundo a pesquisa, a segurança é o principal problema da favela.

Exemplo 2:

Para conhecer a intenção de votos dos funcionários de uma empresa


pública, foi feita uma pesquisa extraindo uma amostra aleatória de 25
funcionários da empresa. A pesquisa perguntava: Se a eleição para Presidente
da República fosse hoje você votaria em A, B, C ou D? Vamos supor que as
respostas foram as colocadas no quadro abaixo.

Resultado da pesquisa de votos


A A A A C
A D D A A
B A A D D
C C B C A
C A A C A

35
Fazendo a apuração dos votos pelo método habitual obteremos as
frequências absolutas.

Candidato A: □ □ □| com frequência 13

Candidato B:|| com frequência 2

Candidato C: □ || com frequência 6

Candidato D: □ com frequência 4

Mas agora formaremos uma única tabela que apresenta as frequências


absolutas e relativas, como é mostrada a seguir:

Tabela 2.5: frequência e frequência relativa

Respostas dos funcionários à intenção de votos


Candidatos Freq. Absoluta Freq. Relativa
A 13 52 %
B 2 8%
C 6 24 %
D 4 16 %
Total 25 100 %

Portanto, que o candidato A é o proferido na intenção de votos dos


funcionários, segundo a pesquisa.

36
Exemplo 3:

Um professor de Educação Física precisava saber quais eram as alturas


que mais prevaleciam entre um grupo de 40 alunos. Para isso, colocou todas
as alturas no quadro a seguir.

Altura de 40 alunos

1,65 1,73 1,87 1,79 1,72


1,72 1,94 1,79 1,88 1,81

1,81 1,73 1,74 1,76 1,79

1,60 1,84 1,81 1,62 1,76

1,58 1,65 1,58 1,73 1,76

1,71 1,81 1,77 1,92 1,52

Agora ele pediu uma ajuda ao professor de matemática. Esse professor


conhecendo estatística sugeriu formar grupos que tivessem alturas próximas.
Analisando o quadro anterior eles decidiram agrupar os alunos com alturas,
variando de 10 em 10 cm. Na primeira classe ficariam os alunos que tinham
altura variando de 1,50 até 1,59; na segunda os alunos de 1,60 até 1,69.
Assim, em 5 classes seriam distribuídas todas as alturas. Deste modo o
matemático pode determinar a classe que terá a maior quantidade de alunos,
isto é, a de maior frequência. Neste exemplo vamos determinar os três tipos de
frequências. Veja:

CLASSES CONTAGEM

Classe 1 de 1,50 ate 1,59 □

Classe 2 de 1,60 ate 1,69 □□

Classe 3 de 1,70 ate 1,79 □ □ □ □||

Classe 4 de 1,80 ate 1,89 □□

Classe 5 de 1,90 ate 1,99 ||

37
Simbologia usada na Estatística

Os estatísticos criaram uma maneira de representar esses intervalos de


classes: o que em matemática escrevemos ≤ 𝑥 < 7 em estatística
representamos assim: 5├───7 Portanto, esse intervalo inclui o 5 mas
exclui o 7. Desse modo, teremos:

De 1,50 até 1,59 assim 1,50 ├─── 1,60

Em estatística é muito útil o uso de letras com índice. Por exemplo, a


frequência absoluta do primeiro intervalo é indicada por f1. De um
modo geral escrevemos fi significando a frequência do i-ésimo intervalo
de classe.

a) Frequências absolutas: f

Como a contagem é a própria frequência absoluta, então usando a


notação anterior teremos:

b) Frequências relativas: fr

Tendo a frequências absolutas calculamos as relativas

38
c) Frequências acumuladas: F

Quando estamos fazendo a distribuição dos dados por suas classes é


importante sabermos quantos dados já foram distribuídos. Assim, surge a ideia
de frequência acumulada, como sendo a soma de todas as frequências
absolutas até a classe escolhida. Representando a frequência acumulada pela
letra maiúscula F teremos, por exemplo, as frequências acumuladas da
segunda e terceira classes assim:

Agora façamos uma tabela que apresenta as três frequências para usá-
la quando for conveniente e vamos representar os intervalos pelo símbolo
usado na estatística.

Altura dos alunos


Alturas F fr F
1,50 ├─── 4 10% 4
1,60
1,60 ├─── 8 20% 12
1,70
1,70 ├─── 18 45% 30
1,80
1,80 ├─── 8 20% 38
1,90
1,90 ├─── 2 5% 40
2,00
Total 40 100%

Tabela 2.6

39
Elaborando tabelas de frequências

As tabelas de distribuições de frequências, ou simplesmente


distribuições de frequências, são as mias importantes na pesquisa estatística,
preciso serão estudas mais detalhadamente. Aqui será mostrado um método
geral para elaborá-las. Vamos usar o mesmo exemplo das alturas dos alunos,
mas agora precisamos saber como é calculada o número de classes, a
amplitude e o representante da classe.

Altura de 40 alunos
1,65 1,73 1,87 1,79 1,72
1,72 1,94 1,79 1,88 1,81

1,81 1,73 1,74 1,76 1,79

1,60 1,84 1,81 1,62 1,76

1,58 1,65 1,58 1,73 1,76

I) Número de Classes: K

Chamamos de intervalos de classes ou simplesmente classes aos


grupos em os dados brutos são divididos. Nas classes os dados tem uma
propriedade comum. No caso das alturas dos alunos, a primeira classe era
formada por alturas que iam de 1,50 até 1,59 m. Devemos organizar os dados
em uma tabela de frequências sempre que o total deles seja maior ou igual a
20. Entretanto, o número de classes em que devemos reparti-los depende da
quantidade e da escolha do pesquisador. Os estatísticos sugerem que deva ser
escolhido de 5 a 20 classes. Se representarmos a quantidade de dados por N e
o número de classes por K então poderemos usar a fórmula abaixo que dá
uma sugestão teórica para os valores de K:

40
Vejamos como usá-la: numa calculadora científica colocamos o número
de dados N e apertamos na tecla LOG e ela nos dará o valor. Por ex.
. Esta fórmula produz um número quebrado para K. Devemos, como
sugestão, usar o inteiro mais próximo conveniente. Vejamos os exemplos:

Ex.1

Para N=20 podemos usar 5 classes, pois:

Ex.2

Para N=30 podemos usar 5 ou 6 classes, pois:

Ex.3

Para N=40 podemos usar 6 classes, pois:

II) Amplitude de Classes: A

Chamamos de amplitude total dos dados a diferença entre o valor


máximo e o valor mínimo. Para calcularmos a amplitude das classes devemos,
portanto, dividirmos a amplitude total pelo número de classes, isto é,

41
Para geramos uma fórmula prática, basta representarmos os conceitos
envolvidos por letras como se segue:

A: amplitude de classe Vmax: valor máximo

K: número de classes Vmin: valor mínimo

Portanto, para aplicá-la devemos conhecer o Vmax, o Vmin, e K. Então, usando


no exemplo da altura dos alunos devemos:

1º) Consultar o quadro de dados das alturas e vermos os valores


máximos e mínimos: Vmax=1,94 e Vmin=1,52

2º) Calcular o valor de K, porém como N=40 já fizemos na pagina


anterior e obtivemos K=6. Usando a fórmula temos:

Com essa amplitude por classe podemos repartir todos os 40 dados


relativos às alturas dos alunos em 5 classes. Mas 0,07 é apenas uma sugestão

42
teórica para a amplitude, pois o pesquisador pode e deve usar sua experiência
para escolher uma amplitude conveniente. No exemplo em estudo os
professores escolheram que os alunos fossem agrupados de 10 em 10 cm, isto
é, com amplitude de 0,10m. Deve-se ressaltar que as amplitudes das classes
podem ser diferentes, porém é mais prático tê-las iguais.

III) Elaboração das Classes: ├───

Para a melhor compreensão vamos definir que em um intervalo de


classe representado por a├───b teremos: a como o limite inferior da classe e
b como o limite superior. Devemos ainda considerar que nesta representação o
número a pertence a classe mas o número b não pertencerá. Como exemplos,
criaremos as classes considerando a sugestão teórica de amplitude 0,07 e
aquela que os professores optaram 0,10.

a) Sugestão teórica: A=0,07 e K=6

Neste caso devemos ter 6 classes e todas com amplitude de 0,07. Para
criarmos a primeira classe consideramos o valor mínimo dos dados (1,52)
como o seu limite inferior. Para obtermos o limite superior somamos a
amplitude 0,07 e obtemos 1,59. A segunda classe começa com o limite
superior da primeira (1,59) e somamos de novo a amplitude 0,07 e obtemos
seu limite superior (1,66). Esse processo se repete até a última classe que terá
seus limites fechados. Veja o processo a seguir:

Classe 1: 1,52 + 0,07=1,59 então 1,52├───1,59

Classe 2: 1,59 + 0,07=1,66 então 1,52├───1,66

43
Classe 3: 1,66 + 0,07=1,73 então 1,66├───1,73

Classe 4: 1,73 + 0,07=1,80 então 1,73├───1,80

Classe 5: 1,80 + 0,07=1,87 então 1,80├───1,87

Classe 6: 1,87 + 0,07=1,94 então 1,87├──┤1,94

Fazendo a contagem para obter as frequências das 6 classes teremos o


seguinte: f1=4; f2=5; f3=7; f4=14; f5=6 f6=4

b) Sugestão do pesquisador: A=0,10 e K=5

Neste caso devemos ter 5 classes e todas com amplitude de 0,10. Além
disso, os professores escolheram para os limites das classes números práticos
e que facilitassem a interpretação. Assim começou a primeira classe com 1,50
e somou a amplitude de 0,10, obtendo 1,60 para limite superior:

Classe 1: 1,50+ 0,10=1,60 então 1,50├───1,60

Classe 2: 1,60 + 0,10=1,70 então 1,60├───1,70

Classe 3: 1,70 + 0,10=1,80 então 1,70├───1,80

Classe 4: 1,80 + 0,10=1,80 então 1,80├───1,90

Classe 5: 1,90 + 0,10=2,00 então 1,90├──┤2,00

44
Fazendo a contagem para obter as frequências das 5 classes teremos o
seguinte: f1=4; f2=8; f3=18; f4=8; f5=2

IV) Representante da Classe

Elas são formadas por dados que têm uma característica comum
escolhida pelo pesquisador. Naturalmente, quando repartimos, por exemplo,
um grupo de pessoas em classes, perderemos a informação especifica sobre
cada pessoa. Por outro lado obtemos informação coletiva, pois os indivíduos de
uma classe são semelhantes em alguma característica. É isso que a estatística
deseja: conhecer o comportamento coletivo. Assim escolhemos o
representante da classe como sendo a média aritmética dos extremos da
classe, isto é, o ponto médio do intervalo de classe.

Classe de alturas Frequência Ponto médio


1,50 ├─── 1,60 4 1,55
1,60 ├─── 1,70 8 1,65
1,70 ├─── 1,80 18 1,75
1,80 ├─── 1,90 8 1,85
1,90 ├───|2,00 2 1,95

Interpretando essa tabela de pontos médios temos: na primeira classe tivemos


onde a frequência absoluta é 4, portanto, tivemos 4 alunos com altura variando
entre 1,50 até 1,60m. Como o ponto médio da classe é 1,55 então, o
representante desta classe é um aluno com altura de 1,55m.

45
Apresentação de Dados

CONHECIMENTO

Compreender a forma de apresentação e de uso de dados através de gráficos


e histograma.

HABILIDADES

Construir gráficos como o histograma e o polígono de frequência.

ATITUDES

Compreender as diversas formas de leitura dos gráficos e tabelas na pesquisa.

46
Apresentação gráfica

Como já foi dito, jornais, revistas e televisão usam os gráficos por que
facilitam a comunicação e interpretação de suas notícias. Mas, a principal
vantagem dos gráficos está no poder de resumir e apresentar uma pesquisa.
Eles são elaborados a partir de tabelas, e apesar da aparente variedade,
podem ser classificados em três tipos: setores, retângulos e linhas, como se vê
nos exemplos abaixo.

6
1º Tri
4 Série 1 2º Tri

2 Série 2 3º Tri
4º Tri
0

Gráfico de Coluna Gráfico de Setores

5
4
3 Série 1
2 Série 2

1
0

Gráfico de Linhas

O tipo de gráfico a ser usado na apresentação de uma pesquisa


depende da variável. Os gráficos de setores são muito empregados para
representar variáveis qualitativas, enquanto os gráficos de barras verticais
chamados histogramas, são usados para as variáveis quantitativas. Para que o
leitor perceba que um gráfico é uma outra forma de apresentar uma pesquisa,
vou elaborar os três tipos de gráficos para o exemplo da pesquisa a seguir.

47
Exemplo 1

Um médico desejando investigar se determinada enfermidade ocorria


com mais frequência em tipo sanguíneo, elaborou a tabela abaixo usando o
prontuário de 50 pacientes.

Tipo sanguíneo Frequência


A 15%
B 10%
O 25%
AB 50%
Tabela 3.1

I) Gráficos de Setores

Neste tipo, também chamado de pizza, um círculo representa o total de


dados estudados e é dividido em setores cujos ângulos são proporcionais as
frequências ou porcentagens das modalidades da variável.

Para construirmos o gráfico de setores que representa a tabela 3.1,


inicialmente calculamos os ângulos dos setores para os respectivos tipos
sanguíneos:

Tipo A

15% de 360° = 0,15 x 360° = 54°

Tipo B

10% de 360° = 0,10 x 360° = 36°

48
Tipo O

25% de 360° = 0,25 x 360° = 90°

Tipo AB

50% de 360° = 0,50 x 360° = 180°

Agora usamos um compasso para traçarmos o círculo e um transferidor


para medir os ângulos. Mas no Word basta entrar com as porcentagens que o
gráfico é feito. Devemos indicar com cores diferentes as modalidades da
variável. No exemplo, uma cor para cada tipo de sangue da tabela.

Tipo A:
15%
Tipo Tipo B:
AB: 10%
50% Tipo
O:
25%

II) Gráficos de Retângulos

Este tipo de gráfico é formado por retângulos que podem ser horizontais
ou verticais. Quando são horizontais chamamos de barras, e quando verticais,
de colunas. Nos gráficos de barras os comprimentos das barras são
proporcionais às frequências, enquanto que nos gráficos de colunas são as
alturas que são proporcionas as frequências. No Word esses gráficos são
também feitos apenas introduzindo as frequências. Entretanto, se desejarmos
desenhar o gráfico de colunas no papel, caderno ou planilha, deverá escolher

49
um comprimento padrão para representar 10%. Por exemplo, se 1 cm
representar 10%, a frequência de 25% teria uma coluna de 2,5cm de altura.

Vejamos a tabela 3.1 representada por esses dois tipos de gráficos.

Gráfico de colunas

Pesquisa do tipo sanguíneo


60% 50%

40%
25%
20% 15%
10%

0%
A B O AB

Perceba que a altura do retângulo que representa a frequência de 50% é


o dobro da que representa 25%. É isso que permite a rápida comunicação dos
gráficos.

Gráfico de barras

Pesquisa do tipo sanguíneo

Tipo AB
Tipo O
Tipo B
Tipo A

0% 20% 40% 60%

III) Gráficos de Linhas

São gráficos num sistema de eixos cartesianos onde no eixo horizontal


pomos as modalidades da variável e no eixo vertical as frequências. Eles são
formados por segmentos de retas que ligam pontos do tipo modalidade-

50
frequência. Por isso, esses gráficos são chamados de linhas poligonais. A
tabela 3.2 neles ficaria assim:

Pesquisa do tipo sanguíneo


60%
50%
40%
20% 25%
15% 10%
0%
A B O AB

Portanto, em qualquer dos três tipos - setores, retângulos ou linhas – os


gráficos dão a mesma informação das tabelas, porém com eles a comunicação
é mais imediata e mais atraente, pois busca um apelo visual.

Histogramas

Significado de Histograma:
Gráfico ou diagrama constituído por retângulos cuja altura representa uma
variável, e desenhados sobre uma linha que representa outra variável.

Chamamos de histograma a um particular o gráfico de colunas usado


para representar uma distribuição de frequências de uma variável numérica.
Nele os retângulos representam as classes, as quais são colocadas no eixo
horizontal e têm duas características:

 As bases são aos intervalos de classes;


 As alturas as frequências;

A grande diferença do histograma para os outros gráficos de colunas é


que nos histogramas os retângulos são colocados justapostos no eixo

51
horizontal, e por conveniência, um pouco deslocado da origem do sistema de
eixos. Isso é preciso por que nas tabelas de frequências de variável numérica o
fim de um intervalo de classe é o inicio do outro. Como exemplo mostro o
histograma das distribuições das alturas dos alunos, feitas no capítulo 2, tanto
para frequência absoluta como para relativa. Para isto retomemos tabela 2.6.

Altura dos alunos


Alturas fr F
1,5 ├─── 4 10% 4
1,6
1,6 ├─── 8 20% 12
1,7
1,7 ├─── 18 45% 30
1,8
1,8 ├─── 8 20% 38
1,9
1,9 ├─── 2 5% 40
2,0

Tabela 2.6

Histograma de frequencias absolutas


0%
0%
0%
0%
0%
1,5 a 1,6 1,6 a 1,7 1,7 a 1,8 1,8 a 1,9 1,9 a 2,0

52
Histogramas de frequência relativas
50%
40%
30%
20%
10%
0%
1,50 a 1,60 a 1,70 a 1,80 a 1,90 a
1,60 1,70 1,80 1,90 2,00

Polígono de frequências

O polígono de frequências é uma região limitada por um gráfico de


linhas e o eixo horizontal. A linha apresenta as variações das frequências. Essa
linha pode ser obtida unindo-se por segmentos de retas os pontos médios das
alturas do histograma. Mas, os seus pontos extremos estão sobre o eixo
horizontal e são os pontos médios dos intervalos que antecede ao primeiro e
sucede ao último.

Por isso, o histograma precisa está afastado da origem do sistema de


eixos de uma distância igual ao intervalo de classe. Isso permitirá que a linha
poligonal possa ser transformada no polígono de frequências. Às vezes é
conveniente traçarmos o polígono de frequência sobre o próprio histograma.

Polígono de frequências
20

15

10

0
0,7 1,5 1,6 1,7 1,8 1,9 2

53
Poligonal ogiva

A ogiva é um gráfico de linha que representa as frequências


acumuladas. É uma linha poligonal, formada por segmentos que une o fim de
uma classe ao inicio da classe seguinte indicando as frequências acumuladas.
Portanto, a ogiva vai mostrando quantos dados já foram distribuídos. Ela
começa sobre o eixo horizontal no limite inferior da primeira classe e termina no
limite superior da ultima classe. É um gráfico sempre crescente, na medida em
que vai acumulando as frequências. Como exemplo eu destaco da tabela 2.6
as classes e as frequências acumuladas das alturas dos alunos para construir
a ogiva.

Alturas F
1,5 ├─── 4
1,6
1,6 ├─── 12
1,7
1,7 ├─── 30
1,8
1,8 ├─── 38
1,9
1,9 ├─── 40
2,0

Consideramos que no início da primeira classe a frequência acumulada


é zero, pois ainda não foram distribuímos os alunos, mas no final desta classe
jê temos 4 alturas. Para representar esse crescimento temos um segmento de
reta que liga o zero ao 4. Logo depois um segmento que vai do 4 ao 12, pois
acumulam 8 alturas. Repetindo esse procedimento obtemos uma linha
crescente de segmentos que é a ogiva, mostrada a seguir.

54
Ogiva: as frequências acumuladas das
alturas dos alunos
50
40
30
20
10
0
1,5 1,6 1,7 1,8 1,9 2.00

55
Medidas Descritivas

CONHECIMENTO

Conhecer as medidas descritivas usadas na pesquisa estatística, isto é: a


Moda, a Mediana, a Média, o desvio padrão etc. Compreender a maneira pela
qual devemos encontrar através de cálculos e formulas determinados
resultados.

HABILIDADES

Reconhecer a média como uma medida estatística de tendência central.

Determinar a média aritmética.

ATITUDES

Reconhecer dentre as medidas descritivas, qual deve ser usada em


determinada situação do trabalho.

56
Medidas das distribuições

As tabelas e os gráficos são dois importantes recursos estatísticos que


permitem resumir e interpretar um conjunto de dados numéricos. Porém,
sabendo apenas a frequência de um dado ou de uma classe, não suficiente
para concluirmos as características do conjunto como um todo.

Assim, os estatísticos procuraram obter números que caracterizam a


distribuição de uma variável. Estes números são chamados de Medidas
Descritivas de Distribuições onde a famosa média aritmética é um exemplo
delas. Estas medidas, além de descrevem coletivamente o conjunto de dados,
resumem ainda mais os dados. Por exemplo: se um aluno fez cinco provas
valendo cada uma de 0 a 10 e obteve as notas: 1; 3; 5; 2; e 6, terá como média
3,4. Portanto, conhecendo apenas a média já podemos concluir que no
desempenho das provas o aluno foi mau.

Para caracterizar uma distribuição de frequências de uma variável temos


as seguintes medidas:

 Medidas de posição
 Medidas de dispersão
 Medidas de assimetria

Onde cada uma destas medidas são números que informam como os dados
numéricos estão distribuídos.

I) Medidas de posição

São números que informam a posição em torno do qual os dados se


distribuem. Estes números nos mostram a tendência dos dados se distribuem
em torno de um valor central. Estas medidas são: a moda, a mediana e a
média.

57
II) Medidas de dispersão

São números que informam a variabilidade dos dados, isto é, se os


dados estão bastante dispersos ou se concentrem em torno de um valor
central. Eles também informam o quanto os dados diferem do valor central.
Estas medidas são: a amplitude, o desvio médio, a variância, o desvio padrão e
o coeficiente de variação.

III) Medidas de assimetria

São números que procuram informar o quanto uma distribuição de


frequência se afasta de uma condição de simetria, isto é, informa se a maioria
dos dados está mais à direita ou à esquerda do valor central. Estas medidas
são: o coeficiente de assimetria e o coeficiente de Pearson.

Todas estas medidas podem ser calculadas a partir dos dados brutos
(Rol), mas a importância maior está na obtenção delas quando os dados já
estão tabelados numa distribuição de frequências. Para obtê-las usamos
algumas fórmulas. Portanto, conhecendo estes números temos uma
informação do comportamento coletivo dos dados.

Moda: mo

A moda de um conjunto de valores é o valor que mais se repete, isto é, o


de maior frequência. Às vezes ocorre que no conjunto temos dois dados com
frequências iguais. Neste caso a distribuição tem duas modas, e é chamada
bimodal.

58
EXEMPLO 1:

O quadro abaixo apresenta o sexo das pessoas que participaram de um


processo de seleção.

M F F M F

M M M F M

Assim, a variável sexo, admitindo apenas dois valores, teve frequência 19 para
o masculino e 5 para o feminino. Portanto, a moda neste processo de seleção
foi o sexo masculino.

I) Cálculo da moda em uma tabela

Numa tabela de frequência, mesmo sem conhecermos os dados reais,


podem estimar o valor mias frequente, isto é, calcular a moda (Mo).
Naturalmente a moda estará na classe que apresenta a maior frequência
chamada de classe modal. A fórmula usada é a seguinte:

𝐃𝟏
𝐌𝐨 𝐋𝐢 𝐀
𝐃𝟏 𝐃𝟐

Sendo:
Li: limite inferior da classe modal
D1: diferença entre a frequência da classe modal e da classe anterior.
D2: diferença entre a frequência da classe modal e da classe superior.
A: amplitude das classes.

59
EXEMPLO 2:

Calculemos a moda da distribuição das alturas dos alunos estudadas no


capítulo 2 dadas na tabela abaixo.

Alturas fi
1,50 ├─── 1,60 4
1,60 ├─── 1,70 8
1,70 ├─── 1,80 18
1,80 ├─── 1,90 8
1,90 ├───┤2,0 2
Total 40

Tabela 4.1
RESOLUÇÃO:

Como a maior frequência está no intervalo de classe 1,7 a 1,8, então a


classe modal será a 3ª classe. Agora vamos identificar os elementos da
fórmula:

Li = 1,7 D1 = 18 – 8 = 10
A = 0,1 D2 = 18 – 8 = 10

7
7

Usando a tabela das alturas concluímos que a altura mais frequente é


1,75m, isto é, a moda é 1,75m.

60
Mediana: Md

A mediana é o valor central quando os dados numéricos estão em


ordem crescente. Portanto, a mediana divide o conjunto em dois subconjuntos
com a mesma quantidade de dados, isto é:

 Metade dos dados tem valor abaixo da mediana e;


 Metade dos dados tem valor acima da mediana.

Em linguagem simples, diríamos: a mediana é um divisor de águas, pois divide


o grupo em dois grupos menores. Portanto, ela é uma referência no conjunto
de dados.

EXEMPLO 1:

As notas de 15 alunos colocadas em ordem alfabética são as seguintes:


2,1,7,9,7,3,6,8,7,9,4,1,4,2, e 9. Qual é a mediana?

RESOLUÇÃO:

Pondo as notas em ordem crescente de valores teremos:


1,1,2,2,3,4,4,6,7,7,7,8,9,9,9. Assim, as 15 notas serão divididas pela nota 6,0
que é a central. Logo a mediana é 6,0. Visualmente seria assim:

1,1, 2, 2, 3, 4, 4, 6, 7, 7, 7, 8, 9, 9,9

Portanto:

 Sete notas estão abaixo de 6,0


 Sete notas estão acima de 6,0

Entretanto, se fosse 14 notas, isto é, um número par, teria no centro


duas notas. Neste caso, define-se a mediana como o número obtido pela
média dos valores centrais. No exemplo abaixo, estes números são 4 e 6, logo

61
a mediana será 5,0. Portanto, se N for par, a mediana não estará entre os
dados, mesmo assim, ela será um número que divide o conjunto ao meio. Veja:

1,1, 2, 2, 3, 4, 4, 6, 7, 7, 7, 8, 9,9

I) Cálculo da mediana em tabela

Naturalmente obter o Rol, isto é, os dados em ordem crescente é


bastante trabalhoso. Por isso, o mais prático é usar uma fórmula que obtenha a
mediana para dados tabelados. Para começarmos, precisamos saber em qual
das classes, durante a distribuição dos dados, a mediana caiu. Assim,
dividimos o número de dados por 2, isto é, calculamos N/2 e vamos somando
as frequências até vermos onde cairá o termo central: esta será a classe da
mediana. Para calcularmos o valor da mediana , usamos a fórmula abaixo:

𝑵
𝑭𝒂
𝑴𝒅 𝑳𝒊 𝟐 𝑨
𝒇𝒅

Li: limite inferior da classe da mediana


: soma das frequências anteriores à classe da mediana.
: frequência da classe da mediana.
A: amplitude das classes.

EXEMPLO 2:

Calculemos a mediana das alturas usando a tabela 4.1.

RESOLUÇÃO:
Como N=40, teremos para a mediana um valor abstrato entre o 20º e o
21º termos quando colocados em ordem crescente. Ela estará na terceira

62
classe, pois até a 2ª temos apenas 12 alturas, mas ao terminarmos a 3ª já
teremos colocado 28. Vamos identificar os elementos da fórmula:

Li = 1,7 A = 0,1 = 18 = 4+8 =12

Logo, a mediana das alturas é 1,76m

Média: x

A média é o número que melhor representa um conjunto de números.


Ela é obtida somando todos os números e dividindo pela quantidade de
números somados.

EXEMPLO 1

Se as notas de um aluno foram 3,0 e 7,0 então a média será:


.

63
Portanto, 5,0 é a nota que melhor representa o desempenho do aluno.
Certamente diríamos que o aluno começou mau (3,0), avançou para bom (7,0),
mas na média foi regular (5,0)

EXEMPLO 2

Se os pesos de 4 crianças foram 7kg, 9kg, 6kg e 10kg, então a


média será:
7

Assim, 8kg é o peso que melhor representa o grupo de pesos das


crianças.

OBS: Nota-se que o valor médio:

 Está sempre entre o valor mínimo e o máximo. Por exemplo, a nota 5


está entre 3 e 7;
 Pode não está entre os valores dados. Por exemplo, o peso médio 8kg
não é um dos pesos dados;
 De um conjunto de números iguais é o próprio número. Por exemplo,
2,2,2 tem média 2.

Como a estatística trata de grandes conjuntos de números é importante


calcularmos o número que o representa, isto é, a média do conjunto. Vamos
agora ligar o conceito de média ao de variável estatística.

Vimos que uma variável estatística é todo aspecto de uma população a


ser estudada. Por exemplo: a renda da população de estudantes universitários
de Sobral é uma variável, e a renda de cada estudante é um valor dessa
variável. Suponhamos que ao entrevistar uma amostra de tais estudantes
obtivemos as seguintes rendas: R$781; R342; R$810;…;R$1360, onde 781 foi
a primeira renda citada. Se representarmos por r1 a primeira renda, então o
conjunto R das rendas será:

64
{ }

Agora vamos usar essa notação simbólica e generalizar a definição de média


de uma variável.

X: é a variável estatística
: são valores da variável
x : é a média dos valores

Seja X é uma variável e são seus N valores, então sua


média será

Como a estatística trabalha com muitos números é importante escrever


suas fórmulas de maneira resumida. Por exemplo, na fórmula da média temos
a soma: . Os matemáticos chamam isso de somatório e
representam pela letra (sigma) que é a letra inicial da palavra soma em grego
( OMA). Portanto, em matemática, representamos todas essas parcelas por
um o único símbolo, isto é, escrevemos assim:

E lemos os símbolos ∑ assim: somatório de x índice i, ou somatórios de xi.


Com essa simbologia, a fórmula da média ficará assim:

∑ 𝒙𝒊
𝒙
𝑵

65
EXEMPLO 1

O quadro abaixo apresenta as notas de uma turma de 25 alunos. Vamos


obter a média das notas da turma usando essa fórmula.

Notas dos alunos


3 8 8 6 5
5 6 2 1 7
1 5 7 9 7
7 5 4 6 8
8 4 6 3 4

RESOLUÇÃO:

Então a média será 5,4. Veja que é um número entre a nota mínima 1 e
a máxima 9. Note também que, apesar de não ter havido a nota 5,4 este
número será o representante do conjunto de notas.

I) Cálculo da média em tabelas

Como o número de dados é geralmente grande, é preciso inicialmente


organizá-los em uma tabela de distribuição de frequências. Portanto,
precisamos de uma fórmula que calcula a média para dados já tabelados. Essa
fórmula que usa as frequências e os pontos médios das classes é a seguinte:

∑ 𝒇 𝒊 𝒙𝒊
𝒙
𝑵

66
Nesta fórmula

fi: frequência do i-ésima classe


xi: ponto médio do i-ésima classe

Para facilitar os cálculos no uso desta fórmula elaboramos uma nova


tabela com quatro colunas: das classes, das frequências (fi), dos pontos
médios (xi) e dos produtos das duas últimas colunas )

Classes fi xi
a├── b f1
b├── c f2
c├── d f3
d├── e f4
e├──┤ f f5
Total ∑

EXEMPLO 2:

Vamos calcular a média das notas dos 25 alunos agora numa tabela.
Você verá que mesmo não dispondo das notas obteremos um valor bem
próximo daquele obtido diretamente delas.

Intervalos de notas fi
1,0├─── 2,6 3
2,6├─── 4,2 5
4,2├─── 5,8 4
5,8├─── 7,4 8
7,4├───┤ 9,0 5

67
RESOLUÇÃO:

Para obtermos a média das notas usando a tabela acima precisamos


elaborar uma nova tabela que apresente mais duas colunas: a dos pontos
médios e a do produto. Recordemos que os pontos médios são calculados
assim: x1=(1+3):2=2; x2=(3+5):2=4; x3=(5+7):2=6; x4=(7+8):2=8. Assim obtemos
a tabela:

Intervalos de notas fi
1,0 ├─── 2,6 3 1,8 5,4
2,6 ├─── 4,2 5 3,4 17,0
4,2 ├─── 5,8 4 5,0 20,0
5,8 ├─── 7,4 8 6,6 51,2
7,4 ├──┤9,0 5 8,2 41,0
Total 25 ∑

Portanto, obtivemos uma média próxima da que tínhamos calculado


diretamente das notas que foi 5,40.

Desvio padrão: sx

O desvio padrão de uma variável é a medida de dispersão mais usada


nos estudos estatísticos. Para entender o seu significado recordemos que:
 As medidas de posição procuram determinar números, em trono dos
quais os dados tendem a se agruparem. Estes números estão próximos
de um valor central.

68
 As medidas de dispersão informam se nesta tendência de centralidade,
os dados estão concentrados ou dispersos. Isto é, dizem se diferem
muito ou não do valor central.

Feito estes esclarecimentos podemos dizer que o desvio padrão é fiel ao


seu nome: é um número que informa se os dados desviam muito ou pouco da
média, que é o dado padrão do conjunto. Portanto, diríamos que ele informa se
os dados são muitos semelhantes ou não. Porém, como tudo tem seu preço,
para obter esta informação, precisamos calcular o desvio padrão por esta
complicada fórmula:

∑ 𝒇𝒊 𝒙𝒊 – 𝒙 ²
𝑺𝒙
𝑵

: desvio padrão da variável X


: frequências da classe
: ponto médio da classe
: média da variável

Para compreendermos esta fórmula vamos inicialmente analisar outras


medidas de dispersão: a amplitude, o desvio médio, e a variância. Na verdade
isto se constitui nos passos que esclarecem a fórmula do desvio padrão. No
final, veremos que todos são números que informam sobre variabilidade dos
dados, porém, o melhor deles é o desvio padrão.

I) Amplitude total: At

Já vimos que a amplitude total é a diferença entre maior e o menor dos


valores dados. Por ser fácil de calcular ela a primeira informação sobre a
dispersão. Em símbolos a amplitude total (At) de uma variável X é assim obtida:

69
𝑨𝒕 𝒙𝒎𝒂𝒙 𝒙𝒎𝒊𝒏

EXEMPLO 1:

As notas de 15 alunos em ordem alfabética são as seguintes:


1, 1, 2, 2, 3, 4, 4, 6, 7, 7, 7, 8, 9, 9, 9. Qual é a amplitude total?

RESOLUÇÃO:

=9
=1

Assim, são 8 pontos a diferença entre os extremos das notas. Mas


quando olhamos para as 15 notas vemos que a amplitude dá pouca
informação, pois usa apenas dois dados.

II) Desvio médio: Dm

Chamamos de desvio em relação a média, a diferença entre cada valor


dado ( ) e a média (x), isto é, . Agora se somarmos todos estes
desvios estamos levando em consideração todos os dados, e não apenas os
valores extremos. Para introduzir uma nova medida, o desvio médio, vamos
mostrar, através de exemplos, que a média e a amplitude não são suficientes
para dá às características dos conjuntos de dados. Isso que justifica a criação
dessa nova medida. Para tal, consideremos os conjuntos abaixo referentes às
notas de dois alunos A e B.

70
A = {4, 5, 5, 6} B = {3, 4, 6,7}

1º) Calculemos as média:

Isso mostra que a média de um conjunto por si só, não diz muito, pois
essas médias são iguais, mas os conjuntos que elas representam, são
diferentes.

2º) Calculemos as amplitudes:

Isto mostra que as notas de B são mais dispersas que as de A, porém,


não há outra informação que podemos tirar.

3º) Calculemos a soma dos desvios

A = {4, 5, 5, 6}
= 4 – 5 = -1 =5–5=0
=5–5=0 =6–5=1
A soma dos desvios de A = (-1)+0+0+1 = 0

B = {3, 4, 6,7}
=3–5=-2 = 4 – 5 = -1
=6–5=1 = 7 – 5 = -2
A soma dos desvios = (-2) + (-1) + 1 +2 =0

Vemos que nos dois casos a soma é zero. Isso não foi uma
coincidência, é uma propriedade dos conjuntos: a soma dos desvios em torno
da media é sempre zero. Portanto, conjuntos diferentes tem a mesma soma
dos desvios, logo ela não pode caracterizá-los. Mas, com um pouco de

71
matemática, a ideia inicial pode ser ainda aproveitada: basta considerarmos os
valores absolutos, isto é, os módulos de cada desvio antes de soma-los, pois
assim todos serão positivos. Agora se dividiremos esta soma pelo total de
dados teremos o desvio médio (Dm). Assim definimos:

∑ 𝒙𝒊 𝒙
𝑫𝒎
𝑵

Se essa ideia matemática estiver correta, então conjuntos diferentes


terão desvios médios diferentes. Vejamos no exemplo a seguir, se isso ocorre.

EXEMPLO 1

Consideremos os conjuntos de dados A, B e C, abaixo, e calculemos o


desvio médio de cada um deles.

A = {5, 5, 5, 5} B = {4, 5, 5, 6} C = {3, 4, 6,7}

RESOLUÇÃO:

1º) Cálculo de

= |5 - 5| = 0 = |5 - 5| = 0
= |5 - 5| = 0 = |5 - 5| = 0
∑ = 0 + 0 + 0 + 0 = 0

72
2º) Cálculo de

= |4 - 5| = 1 = |5 - 5| = 0
= |5 - 5| = 0 = |6 - 5| = 1
∑ = 1 + 0 + 0 + 1 =2

3º) Cálculo de

= |3 - 5| = 2 = |4 - 5| = 1
= |6 - 5| = 1 = |7 - 5| = 2
∑ = 2 + 1 + 1 + 2 = 6

Portanto, os desvios são diferentes, confirmando a intuição matemática


e ao analisarmos os conjuntos vemos que:

 Em A, como todos os elementos são iguais a média, não há desvio em


relação a ela, portanto o desvio médio é nulo.
 Em B, a metade dos elementos é igual a média e a outra metade desvia
no máximo apenas 1 ponto da média;
 Em C, todos os elementos são diferentes entre si, e o desvio máximo da
média são 2 pontos.

Esses três exemplos nos mostram que o desvio médio informa se os


dados são homogêneos ou não, e que quanto menor, mais homogêneos são

73
os dados. Logo, o desvio médio é uma boa medida para descrever um conjunto
de dados numéricos.

Apesar de este conceito satisfazer a necessidade estatística, tem o


inconveniente matemático do módulo: a função modular, devida suas
propriedades, dificulta os cálculos para obter o desvio médio em conjuntos com
grande número de elementos. Assim, os estatísticos usaram a estratégia de
substituir o módulo pelo quadrado e definiram a variância, pois os dois
produzem resultados positivos. No final, extraíram a raiz quadrada e voltaram à
ideia inicial.

Veja: onde o módulo representa o desvio médio, o quadrado a variância e a


raiz quadrada dela o desvio padrão. É isso que o leitor verá a seguir.

|7 - 3| = 4, (7-3)²=4², √

III) Variância: Var(x)

A variância de um conjunto de dados é a média dos quadrados dos


desvios. Para compreendê-la, recordemos que os desvios (d) são as
diferenças entre cada dado (xi) e a média do conjunto (x), que em símbolos
teremos: Como a variância,
representada por Var(x), substitui os módulos pelos quadrados, sua definição
leva a seguinte expressão:

74
Agora substituindo os desvios pelas diferenças de cada dado e a média
teremos:

Como temos uma soma de varias parcelas, para simplificar a expressão,


usamos o símbolo do somatório. Assim, temos a fórmula da variância quando
dispomos dos dados brutos;

∑ 𝒙𝒊 𝒙 𝟐
𝑽𝒂𝒓 𝒙
𝑵

Note que esta expressão da variância se parece com a da média porque


ela própria é uma média de quadrados, portanto, antes de somar, precisamos
calcular os quadrados.

IV) Desvio padrão: Sx

Ao introduzir os quadrados dos desvios, a variância facilitou os cálculos,


mas criou o inconveniente de elevar também ao quadrado a unidade da
variável. Por exemplo, se a variável estudada é o peso e medida em kg, então
a média é também em kg, mas a variância será em kg². Como kg² não tem
sentido prático, isso dificulta a interpretação dos resultados. Para contornar
esse problema os estatísticos extraíram a raiz quadrada da variância, pois
√ . Assim, foi definido o desvio padrão de uma variável X, como a raiz
quadrada da variância e representado por Sx, isto é,

75
𝑺𝑿 √𝑽𝒂𝒓 𝑿

EXEMPLO 1:

Obter o desvio padrão dos conjuntos B e C do exemplo anterior e


comparar com o desvio médio.
B = {4, 5, 5, 6} C = {3, 4, 6,7}

RESOLUÇÃO

Para obtermos Sx, primeiro calculamos a média, depois a variância e


finalmente extraímos a raiz dela para obter o desvio padrão.

1º) Cálculos para B.

√ 7

2º) Cálculos para C.

76
Assim vemos que os dois tipos de desvios foram próximos, pois em B
tivemos: 7 e em C tivemos: . Portanto, a
obtenção da fórmula do desvio padrão foi um bom artifício matemático.

V) Cálculo do desvio padrão em tabelas

No exemplo anterior os cálculos do desvio padrão foram rápidos, pois os


conjuntos tinham poucos elementos, mas esta é uma estratégia didática: para o
conceito de desvio padrão ser entendido, usamos conjuntos com poucos
dados, assim nos concentramos nas ideias e não nos cálculos. Entretanto, na
prática sempre teremos uma grande quantidade de dados que se tornam
inviáveis realizarmos os cálculos. Portanto, sempre começamos organizando
os dados em tabelas de frequências para em seguida calcularmos as duas
principais medidas descritivas: média e o desvio padrão. Suponha maneira
genérica, que a tabela seja a seguinte, e desejamos calcular o desvio padrão.

Classes fi
a├─── b f1
b├─── c f2
c├─── d f3
d├───┤e f4

1º) Elaboramos uma tabela para a média acrescentando mais duas


colunas. Assim vamos fazendo os cálculos para no final somarmos a última
coluna. Agora obtido o somatório, usamos a fórmula: dividimos o somatório por
N para obtermos a média.

77
Tabela para o cálculo da média

Classes fi xi
a ├─── b f1
b ├─── c f2
c ├─── d f3
d├─── e f4
Total ∑

Fórmula da média

∑ 𝒙𝒊
𝒙
𝑵

2º) Elaboramos uma nova tabela fazendo os caçulos intermediários até


também obtermos o somatório. No final extraímos a raiz quadrada do
somatório e obtemos o desvio padrão.

Tabela para o cálculo do desvio padrão

f –
f1
f2
f3
f4

Fórmula do desvio padrão

∑ 𝒇𝒊 𝒙𝒊 – 𝒙 ²
𝑺𝒙
EXEMPLO 1 𝑵

78
Calcular a média e o desvio padrão das alturas dos alunos que estão
distribuídos na tabela a seguir.

Classe de alturas f
1,5 ├─── 1,6 4
1,6 ├─── 1,7 8
1,7 ├─── 1,8 18
1,8 ├─── 1,9 8
1,9 ├───|2,0 2

RESOLUÇÃO

Parte 1: Cálculo da média

Devemos preencher a tabela abaixo em que duas colunas são dadas no


problema e as outras serão calculadas. Estes resultados devem ser feitos com
uma calculadora dando duas casas decimais de aproximação. Na medida em
que calculamos vamos preenchendo a tabela.

Classes fi xi
1,5├─── 1,6 4
1,6├─── 1,7 8
1,7├─── 1,8 18
1,8 ├─── 1,9 8
1,9 ├───|2,0 2
Total

79
1º) Cálculo dos pontos médios: xi

x1

2º) Cálculo dos produtos:

4x 1,55 = 6,20; … 2x1,95 = 3,90

3ª) Calcular o somatório: ∑

6,20 + 13,20 + … + 3,90 = 69,60

Classes fi xi
1,5├─── 1,6 4 1,55 6,2
1,6├─── 1,7 8 1,65 13,2
1,7├─── 1,8 18 1,75 31,5
1,8 ├─── 1,9 8 1,85 14,8
1,9 ├───|2,0 2 1,95 3,9
Total 69,6

4ª) Calcular a média usando a fórmula: dividimos o somatório por N e o


resultado é a média.


7

80
Parte 2: Cálculo do desvio padrão

Como já calculamos a média devemos preencher a tabela abaixo com o


cálculo que depende dela, dando duas casas decimais.

F –
4 1,55
8 1,65
18 1,75
8 1,85
2 1,95
Total

1º) Calcular os desvios

1,55 -1,74=-0,19; 1,65 -1,74=-0,09; … 1,95-1,74=0,21

2º) Calcular o quadrado dos desvios

0,19² = 0,04; 0,09² = 0,01; … 0,21² = 0,04

3º) Calcular os produtos

4x0,04=0,16; 8x0,01=0,08; …. 2x0,04=0,08

4º) Calcular o somatório

81
0,16 + 0,08 + … + 0,08 = 1,20

f –
4 1,55 - 0,19 0,04 0,16
8 1,65 - 0,09 0,01 0,08
18 1,75 0,01 0,00 0,00
8 1,85 0,11 0,01 0,88
2 1,95 0,21 0,04 0,08
Total 1,20

5º) Aplicamos a fórmula do desvio padrão: dividimos o somatório por N e


extraímos a raiz, o resultado é o desvio padrão.

∑ –
√ 7

Assim a média das alturas é 1,74m com um desvio padrão de 0,17

82
Leitura Obrigatória

Como ocorre com a maior parte das disciplinas,


o estudo da Estatística pressupõe uma
sequênciação que parta de uma introdução
geral à compreensão de suas finalidades e de
seus instrumentos básicos, chegando até a
avaliação crítica de suas limitações. Entre esses
extremos há todo um conjunto sistematizado de
proposições conceituais e de modelos de
aplicação, que traduzem as aquisições teóricas
e os resultados das pesquisas que
constantemente enriquecem o próprio conteúdo
das disciplinas. O título deste texto define sua posição, em relação ao conjunto
sistematizado do conhecimento da Estatística. Está voltado para a aplicação,
destinando-se assim aos que já possuem conhecimento de Estatística Básica.
Seu conteúdo aborda a correlação na amostra; análise de regressão;
regressão linear múltipla; séries temporais; e construção e usos de números-
índices. Dado o caráter didático do texto, há vários exercícios de aplicação
resolvidos. No final de cada capítulo propõem-se exercícios para solução,
destinados a sedimentar o conhecimento da matéria.

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo


Luciano. Estatística aplicada. 2. ed. São Paulo: Atlas, 2015.

Após a leitura do livro, faça uma autoanálise crítica sobre o material e em


seguida poste no ambiente virtual.

83
Pesquisando com a Internet

O estudante deverá analisar o tema da disciplina: Estatística, a partir


das ideias organizadas faça uma pesquisa na internet sobre o assunto
estudado.

GUIA DE ESTUDO:

Após sua pesquisa faça um texto argumentativo sobre o assunto


pesquisado, sempre comparando com o material estudado.

84
Vendo com os olhos de ver

Sugerimos que assista ao vídeo com o Professor Gustavo Reis: Média,


Moda e Mediana - C7 - Clube do Enem. Onde o professor discute o cálculo
da média aritmética entre outros assuntos como moda, mediana etc.

GUIA DE ESTUDO:

Após assisti ao vídeo faça uma resenha sobre o conteúdo abordado pelo
o professor. Depois disponibilize no ambiente virtual.

85
Saiba mais

Prezado aluno,

Sugiro que veja o slide: Medidas de tendência, nele você encontrará de


maneira resumida algumas destas medidas que trabalhamos neste capítulo.
Você pode acessar também através do qr code.

GUIA DE ESTUDO

Após a leitura do slide, faça um texto sobre o que você entendeu sempre
fazendo comparações com o material estudado. Ao concluir o texto
disponibilize na sala virtual.

86
REVISANDO

 Com os dados numéricos a ciência estatística organiza, descreve,


analisa e interpreta.

 A estatística indutiva é a parte da estatística que busca tirar conclusões


probabilísticas sobre uma população usando resultados obtidos na
amostra

 O trabalho estatístico começa com a coleta de dados. A fase seguinte é


a organização dos dados em tabelas.

 A mais importante tabela é a de frequência, onde os dados são


distribuídos em classe.

 Os gráficos estatísticos é uma forma prática de resumir e apresentar


uma pesquisa.

 Histograma é o gráfico usado para representar uma tabela de


frequência.

 As medidas que caracterizam uma distribuição de frequências são de


dois tipos: centralidade e de dispersão.

87
 A média e o desvio padrão são as duas medidas mais usadas para
caracterizar um conjunto de dados de uma variável estatística.

AUTOAVALIAÇÃO

01. Em qual das opções abaixo a ciência estatística está melhor definida:

a) é um ramo da matemática aplicada.

b) é uma ciência que trata com tabelas e gráficos.

c) é uma ciência que trata coletivamente de dados numéricos.

d) é uma ciência aplicada a pesquisa de dados numéricos.

02. Para cada uma das tabelas de frequências que se seguem o construir:

a) o histograma com o polígono de frequências; b) a poligonal ogiva

I. Os salários de 50 empregados de uma empresa foram distribuídos na tabela


abaixo.

Salário em reais f F
500 ├─── 700 6 6
700 ├─── 900 9 15
900 ├─── 1100 18 33
1100 ├─── 1300 12 45
1300 ├─── 1500 5 50
Total 50

88
II. As ligações telefônicas de uma empresa num período de 70 dias foram
distribuídas por semanas e estão na tabela abaixo.

Tempo em dias f

1 ├─── 7 9

7 ├───14 17
14├─── 21 28
21 ├─── 28 32
28 ├─── 35 15
35 ├─── 42 12
42 ├─── 49 17
49 ├─── 56 37
56 ├─── 62 12
62 ├─── 70 11
Total 190

III. Em um exame de vestibular foram medidos os tempos em minutos gastos


por 50 alunos para entregar a prova. Os tempos estão distribuídos na tabela de
frequências abaixo.

Tempo em minutos f
40 ├─── 45 3
45 ├─── 50 8
50 ├─── 55 16
55 ├─── 60 12

89
60 ├─── 65 7
65 ├─── 70 3
70 ├─── 75 1
Total 50

03. Para cada conjunto de dados que se seguem, o aluno deve:

a) elaborar uma tabela de distribuição de frequências que apresente:


frequências absolutas, relativas e acumuladas.

b) as frequências relativas e acumuladas da terceira classe.

c) o representante da segunda classe

01. O Instituto Brasileiro de Pesos e Medidas, fiscalizando uma indústria de


torrefação de café, constatou as seguintes massas em gramas, em 25 pacotes
de café, que deveriam ter um peso líquido de 250g.

249 255 250 241 233

251 247 259 249 241

257 250 230 245 247

238 235 258 232 250

243 250 260 251 250

90
02. O quadro abaixo mostra as notas de 20 alunos em uma prova de
estatística.

6,5 7,5 5,0 7,0 2,5

8,0 3,5 5,0 9,5 1,5

7,0 4,5 6,5 7,0 3,0

4,0 5,0 8,5 8,5 4,0

04- Em cada uma das tabelas de frequências abaixo, calcular a média e o


desvio padrão.

I) II)
Número de Alunos fi Idades fi

100├───200 15 0├───2 2

200 ├─── 300 25 2├─── 4 5

300 ├─── 400 40 4 ├─── 6 15

400 ├─── 500 32 6 ├─── 8 12

500 ├─── 600 8 8 ├───┤ 6


10

Salários fi
400├─── 600 13
600 ├─── 800 10
800 ├─── 1000 8
1000├───1200 5
1200├───1500 3
2

91
III) 1500├───┤200 Número de Escolas fi
0 100├───200 15
IV) 200 ├─── 300 25
300 ├─── 400 40
400 ├─── 500 32
500 ├─── 600 8

Bibliografia
BERQUÓ, Elza Salvatori; SOUZA, de Pacheco Maria José; GOTLIEB, Sabina
Léa Douvidson. Bioestatística, 2ª Ed. São Paulo: EPU, 2006.

CALLEGARI-JACQUES, Sidia M. Bioestatística: Princípios e aplicações.


Porto Alegre: Artmed, , 2003.

DIAZ, Francisca Rius, e López, Francisco Javier. Bioestatística. São Paulo:


Ed. Thomson Learning, 2007.

FONSECA, Jairo Simon. Estatística Aplicada. 5ªed. São Paulo: Editora Atlas,
2008.
HECTOR, Gustavo Arango. Bioestatística: Teoria e Computacional. 2º
edição, Ed. Guanabara Koogan, 2005.

HOEL, P.G. Estatística Elementar. Rio de Janeiro: Editora Atlas, 1989.

JUNIOR, Ayres Manuel; SANTOS Daniel lima. Bio Estat: Aplicações


estatísticas nas áreas das ciências biológicas e médicas. Editora imprensa
oficial do Estado do Pará, Belém, 2005.

92
MOORE, David S. e MCCABE, George P. Introdução à prática da
Estatística. 3ª ed. Rio de Janeiro: Livros Técnicos e Científicos Editora, 2002.

MORETTIN, Pedro A. e BUSSAB, Wilton. Estatística Básica. 5ª Ed. São


Paulo: Editora Saraiva, 2008.

NETO, Pedro Luiz de Oliveira Costa. Estatística. Editora Edgard Blucher, 2º


Ed.,2007.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1986.

VIEIRA, Sonia. Introdução à Bioestatística. 3ªed. Rio de Janeiro: Editora


Campus, 1980.

Bibliografia Web

Professor Gustavo Reis, Probabilidade Estatística: Média, Moda e Mediana.


Disponível em: https://www.youtube.com/watch?v=PgILSJiLyAg

Um Manual de Estatística. Disponível em:


http://www.bertolo.pro.br/AdminFin/StatFile/Manual_Estatistica.htm

93
94

Você também pode gostar