Você está na página 1de 18

Instituto Federal de Educação, Ciência e Tecnologia de Sergipe

Diretoria de Ensino
Gerência de Ensino Superior
Coordenadoria do Curso de Licenciatura em Matemática

ESTATÍSTICA

1.0. INTRODUÇÃO

É comum observarmos em jornais e revistas publicações de pesquisas estatísticas sejam através de tabelas ou
de gráficos. A palavra estatística significa “análise de dados”. Os dados consistem em informações provenientes de
observações, contagens, medidas ou respostas.
Historicamente, o crescimento e o desenvolvimento da estatística moderna estiveram relacionados a três
fenômenos isolados:

a) Necessidade do governo de coletar dados sobre seu povo

Na antiguidade as civilizações egípcia, grega e romana praticavam registros do nº de habitantes, nascimentos


e mortes visando recolhimento de impostos e recenseamento militar; na idade média, as instituições religiosas
também mantinham registros de nascimentos, mortes e casamentos. No século XVI surgem as primeiras análises
sistemáticas, as primeiras tabelas e os números relativos;

b) O desenvolvimento da teoria da probabilidade

A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar o estudo de como se
chegar a uma conclusão sobre uma população, partindo da observação de partes dessa população através do uso
da probabilidade. Esse caráter científico ocorreu já no século XVIII.

c) O advento da informática

Com o desenvolvimento da informática muitas das funções gráficas e métodos de cálculos estatísticos foram
incorporados em planilhas eletrônicas como o Microsoft Excel.
Através do uso da informática, a estatística tem sido fundamental, por exemplo, na avaliação de controles
de poluição na análise de problemas de tráfego, no estudo de efeito de vários remédios, na análise do
comportamento competitivo dos governos, etc.

1.1.DEFINIÇÃO

Estatística é a ciência que compreende um conjunto de técnicas e métodos de pesquisa destinados à coleta,
organização, descrição, análise e interpretação de dados a fim de tomar decisões. Esses conjuntos de dados são
chamados de populações e amostras.

1.2. FASES DO MÉTODO ESTATÍSTICO

a) Definição do problema - saber exatamente aquilo que se pretende pesquisar.

b) Planejamento – como levantar informações? que dados deverão ser obtidos? Quais os custos envolvidos?
Qual o cronograma de atividades?

c) Coleta de dados – registro sistemático de dados, com um objetivo determinado, pode ser desenvolvida de
forma direta (obtida diretamente da fonte) ou indireta (por deduções a partir de elementos da coleta direta,
por analogia, indícios). Os dados aqui coletados podem ser:

- Primários (quando são publicados pela própria pessoa ou organização que os haja colhido, por exemplo, o
censo demográfico do IBGE).

Prof. Ivonaldo Pacheco Santana 1


- Secundários (quando são publicados por outra organização, por exemplo, um jornal ou revista publica
estatísticas referentes ao censo demográfico extraídas da pesquisa do IBGE)
d) Crítica dos dados – os dados obtidos devem ser criticados, eliminando-se assim incoerências e má
interpretação às perguntas dirigidas ao informante.

e) Apuração dos dados – resumo dos dados através de sua contagem e agrupamento, também chamada
tabulação, pode ser manual ou eletrônica.

f) Apresentação dos dados – Há duas formas: através de tabelas que obedecem regras práticas fixadas pelo
Conselho Nacional de Estatística ou gráficos, que permitem de forma geométrica uma visão rápida e clara do
fenômeno.

g) Análise e Interpretação dos dados – está ligada essencialmente ao cálculo de medidas e coeficientes, cuja
finalidade é descrever o fenômeno (estatística descritiva) a interpretação dos dados fundamentada na teoria das
probabilidades pertence ao campo da (estatística inferencial).

1.3. POPULAÇÃO E AMOSTRA

População é o conjunto de todos os resultados, respostas, medidas ou contagens que possam fornecer dados ao
fenômeno em estudo;
Amostra é um subconjunto de uma população.

Se uma população for muito grande, a exemplo de todos os eleitores de uma cidade, o pesquisador poderá ter
um trabalho astronômico para estudá-la. Fatores como tempo, custo e acessibilidade faz o estatístico recorrer a uma
amostra, que, basicamente constitui uma redução da população a dimensões menores. A amostra deve manter as
características essenciais de toda população.

Exemplo. Num levantamento recente feito com apenas 50 alunos do curso Tecnólogo em Meio Ambiente do IFS-
Campus Aracaju perguntou-se: Você acessa a internet como fonte de estudo pelo menos uma vez por semana?
42 alunos responderam que “sim”. Identifique a população e a amostra e descreva o conjunto de dados.

Solução. A população consiste nas respostas de todos os alunos matriculados no curso Tecnólogo em Meio
Ambiente e a amostra consiste nas respostas dos 50 alunos do levantamento. A amostra é um subconjunto das
respostas de todos os alunos do curso. O conjunto de dados consiste em 42 respostas ‘sim’ e 8 respostas ‘não’.

Exemplo. Considere a afirmação: O Departamento de Energia dos EUA conduz levantamentos semanais em 800
postos de gasolina para determinar o preço médio por galão da gasolina comum. Em 14 de maio de 2001, o preço
médio era de US$ 1,713 por galão.

a) Identifique a população

b) Identifique a amostra

c) Em que consiste o conjunto de dados?

Exemplo. Identifique a amostra e a população. Determine, também, se é provável também que a amostra seja
representativa da população.
a) Um repórter da Veja se coloca em uma esquina e pergunta a 10 adultos se acham que o atual presidente está
fazendo um bom trabalho.

Exemplo. Em uma pesquisa sobre os 50 sabores de sorvete produzidos por uma sorveteria, para verificar a
qualidade dos sabores vendidos, foram testados 10 sabores. Nessa pesquisa, que porcentagem da população
representa a amostra pesquisada?

Prof. Ivonaldo Pacheco Santana 2


1.4. ESTATÍSTICA DESCRITIVA E INFERÊNCIA ESTATÍSTICA

Estatística descritiva é a parte da estatística que se preocupa somente com a coleta, descrição, apresentação e
análise sem tirar conclusões mais genéricas.

Inferência estatística ou estatística indutiva é a parte da estatística que, baseando-se em resultados obtidos de
uma amostra, procura inferir ou tirar conclusões a respeito do comportamento da população, dando a precisão dos
resultados e com que probabilidade se pode confiar neles.

n = tamanho da amostra; N = tamanho da população;


__
X  média da amostra;  = média da população;
S2 = variância da amostra;  2  variância da população;
S = desvio padrão da amostra;  = desvio padrão da população;
P = proporção estimada na amostra; p = proporção estimada na população.

1.4.1. DEFINIÇÕES:

 Parâmetro é uma descrição numérica de uma característica da população;

Exemplo. Em um estudo de todos os 2223 passageiros a bordo do Titanic, verificou-se que 706 sobreviveram
quando ele afundou. O dado 706 é um parâmetro, obtido de toda população do navio.
 Estatística ou Estimador estatístico é uma descrição numérica de uma característica da amostra;

Exemplo. Um recente levantamento numa amostra salarial de 50 técnicos recém egressos do IFS revelou que o
salário médio inicial no primeiro emprego é de R$ 1200,00. Esse salário médio é uma estatística.

Exemplo. Com base em uma amostra de 877 executivos pesquisados, achou-se que 45% deles não contratariam
alguém que cometesse um erro tipográfico em uma solicitação de emprego. Esse número de 45% é uma estatística.

 Estimação é o processo que usa resultados extraídos da amostra para produzir inferências sobre a população
da qual foi extraída.

1.5. VARIÁVEL

É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Classifica-se em:


 no min al
Qualitativ a 
 ordinal
VARIÁVEL 
Quantitivadiscreta
 
 contínua

Prof. Ivonaldo Pacheco Santana 3


Variável Qualitativa – quando seus dados (valores) são expressos por atributos ou qualidades. Subdivide-se em:

Qualitativa Nominal – ocorre quando os números são utilizados para nomear e/ou categorizar dados sobre as
unidades observacionais. Os dados nominais não gozam das propriedades dos números com que lidamos na
aritmética usual. Por exemplo, se registramos o estado civil como 1, 2, 3 ou 4 , não podemos escrever que 3 > 1 ou 2
< 4. Outros exemplos:
a) marca de veículos, ou seja: VW, Fiat, GM, Toyota.
b) sexo dos integrantes de uma amostra, ou seja: masculino, feminino.
c) cor dos olhos, ou seja: castanhos, azuis , verdes.

Qualitativa Ordinal – ocorre quando os números são utilizados para, além de identificar e/ou categorizar, ordenar as
unidades observacionais segundo um processo de comparação em relação a determinada variável. Por exemplo, em
economia, costuma-se determinar o nível sócio econômico observando qual ganha mais.
Se uma pessoa ganha mais que outra, recebe um número maior numa escala de 1 a 4, por exemplo. Com estes
números podemos escrever que 4 > 3. Por outro lado, não podemos escrever 4 – 3 = 2 – 1, por exemplo, porque a
diferença de nível entre as classes 4 e 3 é na verdade muito maior do que entre as classes 2 e 1. Quando só pudermos
estabelecer desigualdades, referimo-nos aos dados como dados ordinais. Outros exemplos:

a) grau de escolaridade, ou seja: ensino fundamental, ensino médio, superior, pós-graduado.


b) grau de satisfação por determinado serviço prestado: péssimo, ruim, bom, ótimo.

Variável Quantitativa – quando seus dados são de caráter numérico e subdivide-se em:

Quantitativa Discreta – variável que pode assumir um número finito de valores num intervalo finito, ou um número
infinito enumerável de valores, seus valores são expressos geralmente através de números inteiros não-negativos,
resulta normalmente de contagens. Por exemplo:

a) número de peças produzidas por uma máquina, ou seja: 0, 1, 2, ..., n.


b) número de estudantes de uma família, ou seja: 0, 1, 2, ..., n.
c) número de acidentes em um cruzamento, ou seja: 0, 1, 2, ... , n.

Quantitativa Contínua – variável que pode assumir, teoricamente, quaisquer valores num certo intervalo finito
(número infinito não-enumerável de valores ); resulta normalmente de uma mensuração e a escala numérica de seus
possíveis valores corresponde ao conjunto dos números reais. Por exemplo:

a) peso de um conjunto de crianças, ou seja: 10,5; 12,4; ...; 14,5.


b) índice de inflação, ou seja: 0,98; 1,22; ...; 2,33
c) diâmetro externo de uma peça produzida por uma máquina.

Exemplo. Ao se cadastrar em um site de comércio eletrônico, o usuário deve preencher um questionário com estas
oito perguntas:

a) Você tem computador em casa?


b) Quantas vezes por semana você acessa a internet?
c) Numa escala de zero a 10, qual seu índice de confiança na segurança do comércio eletrônico?
d) Quantos cartões de crédito você possui?
e) A residência em que você vive é própria ou alugada?
f) Qual é o provedor que você utiliza para acessar a internet?
g) Qual é o tempo médio de acesso à internet?
h) Já comprou algum produto via internet?

Cada uma das questões anteriores define uma variável. Classifique-as como qualitativas nominais, qualitativas
ordinais, quantitativas discretas ou quantitativas contínuas.

Prof. Ivonaldo Pacheco Santana 4


1.6. TÉCNICAS DE AMOSTRAGEM

Para coletar dados não tendenciosos, é importante que a amostra seja representativa da população. Vejamos
algumas técnicas de amostragem apropriadas para termos uma boa inferência sobre a população.

Amostragem Casual ou Aleatória Simples

É aquela na qual toda amostra possível de mesmo tamanho tem a mesma chance de ser selecionada, ou seja,
os elementos são escolhidos por sorteio. Para obter esta amostra podemos utilizar um meio mecânico (“tabela de
números aleatórios”) ou eletrônico.

Exemplo. Suponha uma população de 300 alunos matriculados no curso de Saneamento Ambiental do IFS. Obtenha
uma amostra de 10% desses alunos para pesquisa dos níveis de colesterol, usando amostragem casual.
Solução.

Amostragem Proporcional Estratificada

Quando a população se divide em estratos (subdivisões), convém que o sorteio dos elementos da amostra leve
em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses
estratos.

Exemplo. Em uma escola existem 500 alunos matriculados no nível superior sendo 128 do curso Tecnólogo em
Meio Ambiente, 182 em Licenciatura em Matemática, 98 em Engenharia de Produção e 92 em Licenciatura em
Química. Obtenha uma amostra de 20% dos alunos preenchendo o quadro abaixo

CURSO POPULAÇÃO CÁLCULO AMOSTRA


Tec. Meio Ambiente
Lic. em Matemática
Eng. de Produção
Lic. em Química
TOTAL 500

Amostragem Sistemática

Quando os elementos da amostra já se acham ordenados, não há necessidade de criar o sistema de referência.
São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos
elementos que contribuirão a amostra pode ser feita por um sistema imposto pelo pesquisador.

Seja N o tamanho da população e n o tamanho da amostra, então, calcula-se o intervalo de amostragem


I = N/n ou o inteiro mais próximo de I. sorteia-se, através de um dispositivo aleatório qualquer, um número “x” entre
1 e I, formando-se a amostra dos elementos correspondentes aos números: x; x + I; x + 2I; ... ; x + (n-1)I. Observa-se
que a sequência dos elementos sorteados forma uma progressão aritmética de razão r = I.

Uma das vantagens da amostra sistemática é a sua facilidade de uso. Entretanto, no caso de ocorrer
regularmente um padrão nos dados, esse tipo de amostragem deve ser evitado.

Exemplo. Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para
uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: Dividimos 900/50 = 18, escolhemos
por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 18 em 18.Assim, suponhamos que o nº sorteado fosse 4, a amostra
seria: 4ª casa, 22ª casa,40ª casa, 58ª casa, 76ª casa, etc.

Prof. Ivonaldo Pacheco Santana 5


1. 7. TABELA ESTATÍSTICA

É uma das formas de apresentação dos dados assumidos por uma ou mais variáveis, deve ter uma forma
objetiva e clara de se demonstrar o comportamento da variável em análise. É estruturada através de traços
horizontais que separam o título, o cabeçalho e o rodapé. Uma tabela compõe-se de:

Título – conjunto de informações no topo da tabela que respondem às perguntas: O quê? Quando? Onde?
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
Corpo – conjunto de linhas e colunas onde registramos dados numéricos e informações;
Rodapé – local onde se registra a fonte dos dados e observações da tabela.

Exemplo.
Arrecadação de Tributos da União – 1994
(em bilhões de R$)
____________________________________________________
Período IR COFINS IPI IMPORTAÇÃO
____________________________________________________
Trim. 1 5,91 2,64 3,13 0,62
Trim. 2 6,60 2,81 3,14 0,77
Trim. 3 5,40 3,76 3,21 0,83
Trim. 4 6,24 4,26 3,76 0,80
____________________________________________________
Fonte: IPEA/DIPES

De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar:
 um traço horizontal () quando o valor é zero, não só quanto à natureza das coisas, como quanto ao
resultado do inquérito;
 três pontos (...) quando não temos os dados;
 um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
 zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são
impressos em números decimais, precisamos acrescentar à parte decimal um número correspondente
de zeros (0,0; 0,00; 0,000; ...).

1. 8. SÉRIES ESTATÍSTICAS

Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do
local ou da espécie.

Séries Históricas ou Cronológicas

Os dados são observados segundo a época de ocorrência.

Preço do Acém no varejo


São Paulo (1989 – 1994)
Anos Preço médio
(US$)
1989 2,24
1990 2,73
1991 2,12
1992 1,89
1993 2,04
1994 2,62
Fonte: APA
Prof. Ivonaldo Pacheco Santana 6
Séries Geográficas ou Espaciais

Os dados são observados segundo a localização de ocorrência.

Duração média dos estudos


Superiores 1994
Países Nº de anos
Itália 7,5
Alemanha 7,0
França 7,0
Holanda 5,9
Inglaterra menos de 4
Fonte: Revista Veja

Séries Categóricas ou Específicas

São constituídas por dados obtidos nas diferentes categorias de uma mesma variável

Rebanhos Brasileiros
1992
Espécies Quantidade
(1000 cabeças)
Bovinos 154.440,8
Suínos 34.532,2
Ovinos 19.995,6
Caprinos 12.159,6
Fonte: IBGE

Séries Conjugadas

Conjugando duas séries em uma única tabela obtemos uma tabela de dupla entrada. Ficam assim criadas
duas ordens de classificação: uma horizontal e uma vertical.
A série conjugada abaixo se classifica como específica – temporal

Produção Brasileira de Aço Bruto


1991 – 1993
Quantidade (1000 t)
Processos
1991 1992 1993
Oxigênio Básico 17.934 18.849 19.698
Forno Elétrico 4274 4637 5065
EOF 409 448 444
Fonte: Instituto Brasileiro de Siderurgia

2.0. DISTRIBUIÇÕES DE FREQUÊNCIA

Uma vez coletados, os dados brutos ainda não se encontram prontos para análise, por não estarem
numericamente organizados. Para determinada variável em estudo, verificamos o número de vezes com que ocorre
cada um de seus valores, esse número chama-se frequência absoluta ou freqüência simples, normalmente
indicada por fi. Definimos a frequência relativa como a razão entre cada valor absoluto assumido pela variável e
f
o nº total de dados: f r  i
n

A organização de uma tabela de frequência pode se dá das seguintes formas:

Prof. Ivonaldo Pacheco Santana 7


2.1. Distribuição de Frequência - Variável Discreta

Devemos optar por uma variável discreta na representação de uma série de valores quando o número de
elementos distintos da série for pequeno.

Exemplo. Considere o conjunto de temperaturas (em °C) registradas durante vinte dias num determinado local:

23 24 25 20 20 18 25 23 20 19
19 23 25 20 20 25 24 19 19 25

A tabela de frequência correspondente é:

Temp. (ºC) fi f ri f ri (%)


( xi )

Total

2.2. Distribuição de Frequência - Variável Contínua

Devemos optar por uma variável contínua na representação de uma série de valores quando o número de
elementos distintos da série for grande. Isto ocorre quando os valores assumidos pela variável pertencem a um
determinado intervalo real, com pouca coincidência de valores. Neste caso, os dados serão agrupados em classes
ou intervalos, que podem ser do tipo aberto, semiaberto ou fechado.
Convencionaremos que cada intervalo construído será do tipo semiaberto (fechado à esquerda e aberto à
direita):
a ├ b significa [a, b[ = { x R│a  x < b }

Exemplo. Considere a série de valores das emissões de óxido de enxofre (em t) emitidas por uma indústria em 30
dias:

5 14 6 9 20 9 8 9 15 11 25 13 5 14 15 15 18 15 16 19

16 10 16 7 21 20 23 25 24 12

Para construção da Distribuição de Frequência - Variável Contínua introduziremos os seguintes conceitos:

a) Rol – consiste em descrever os valores da variável em ordem crescente:

5 5 6 7 8 9 9 9 10 11 12 13 14 14 15 15 15 15 16 16

16 18 19 20 20 21 23 24 25 25

b) Amplitude Total (A.T.) – diferença entre o maior e o menor valor da amostra, ou seja: A.T. = X máx  X mín .
Temos: A.T. = 25 – 5 = 20t

c) Nº de classes (k) – embora não exista um critério rígido, podendo o pesquisador adotar o número de intervalos
ou classes de sua preferência, os critérios mais usuais são:

Prof. Ivonaldo Pacheco Santana 8


- Critério da raiz: k = n
- Critério de Sturgers: k = 1 + 3,3. log n , onde n representa o total de elementos da amostra;

Adotando o critério de Sturgers, vem: k = 1 + 3,3.log n = 1+3,3.log30 = 5,8  6 classes.

d) Amplitude do intervalo de classe (h) – devemos adotar intervalos de mesma amplitude h, tal que h 
AT
.
k
20
Para os valores acima, temos: h   3,33... , adotaremos h  4 .
6
A tabela de frequência correspondente é:

i Emissões de fi Xi
Oxido de SO2
nº de dias
1 5 ├ 9 5 7
2 9 ├ 13 6 11
3 13 ├ 17 10 15
4 17 ├ 21 4 19
5 21 ├ 25 3 23
6 25 ├ 29 2 27
Total 30

A coluna X i indica o ponto médio da classe, cuja intenção é obter um valor representativo de classe. É obtido
ab
através da média aritmética entre os extremos do intervalo, ou seja, X i  . Dessa forma, xi  7 significa que as 5
2
(cinco) emissões do intervalo 5 ├ 9 podem ser consideradas como 7t.

2.3. Tipos de frequências

Obtidas a partir da frequência absoluta convém destacar as frequências relativa, acumulada e acumulada
relativa, cujo objetivo é ampliar as formas de interpretação da distribuição:
Frequência Relativa ( f ri ) – representa a razão entre a frequência absoluta da classe e a frequência total, pode
ser expressa no modo percentual como f ri (%); f ri  f i .100 %
n
Frequência Acumulada ( Fi ) – representa a soma ou acumulo da frequência absoluta desde a 1ª classe até
k
uma classe de ordem i , i  k ; Fi  f
i 1
i

Frequência Acumulada Relativa ( Fri ) - representa a razão entre frequência acumulada da classe a frequência
total
Fi
Fri  .100%
n

Emissões de Xi Fi ( Fri %)
fi f ri f ri (%)
i Oxido de SO2
nº de dias
1 5 ├ 9 5 7
2 9 ├ 13 6 11
3 13 ├ 17 10 15
4 17 ├ 21 4 19
5 21 ├ 25 3 23
6 25 ├ 29 2 27
Total 30 ---

Prof. Ivonaldo Pacheco Santana 9


2.4. Representações Gráficas

2.4.1. Gráficos para variável quantitativa

O histograma, o polígono de frequência e o polígono de frequência acumulada são os gráficos mais


adequados a representação das distribuições da variável quantitativa onde as frequências de observações são
relacionadas a cada valor ou conjunto de valores de uma variável.

Histograma

Gráfico usado para representar valores assumidos por uma variável quantitativa quando estes estão
agrupados em classes. Semelhante ao gráfico de barras, porém com retângulos justapostos; o comprimento da base
de cada retângulo coincide com a amplitude da classe e a altura corresponde a frequência da classe representada.
Dessa forma, a área do histograma fica proporcional à soma das frequências da distribuição.

Polígono de Frequência

Gráfico de linha poligonal obtido pela ligação dos pares ordenados  xi , f i  onde xi representa o ponto
médio da classe e f i a respectiva frequência absoluta. Para visualização do polígono admitimos uma classe anterior
à primeira e outra posterior à última, ambas de frequência nula. È possível traçá-lo conjuntamente ao histograma.

Polígono de Frequência Acumulada ou Ogiva de Galton

É um gráfico de linha poligonal obtido pela ligação dos pares ordenados bi , Fi  onde bi e Fi
representam respectivamente o limite superior e a frequência acumulada da classe i . O gráfico começa no limite
inferior da 1ª classe (frequência acumulada zero) e termina no limite superior da última classe (frequência acumulada
igual ao tamanho da amostra).

Exemplo. Construa o histograma, o polígono de frequência e o polígono de frequência acumulada da seguinte


distribuição:

Emissões fi Xi
i
de SO nº de dias
1 5 ├ 9 5 7
2 9 ├ 13 6 11
3 13 ├ 17 10 15
4 17 ├ 21 4 19
5 21 ├ 25 3 23
6 25 ├ 29 2 27

Prof. Ivonaldo Pacheco Santana 10


3.0. Curva de Frequência – Curva Polida

O contorno do polígono de freqüência (linha poligonal) pode tender a uma curva, denominada curva
de freqüência. Para isto empregamos o método do polimento. Assim, enquanto o polígono de freqüência
nos mostra a imagem real do fenômeno estudado, a curva de freqüência nos mostra a imagem
tendencional. Esse procedimento não nos dará certeza absoluta de que a curva obtida – curva polida – seja
tal qual a curva resultante para um grande número de dados ou classes de intervalos, no entanto, ela se
assemelha mais à curva de freqüência do que ao contorno do polígono de freqüência.

A curva polida corresponde a eliminação dos vértices da linha poligonal através da fórmula:

fi 1  2 fi  fi 1
f ci 
4
Onde:

f c i é a frequência calculada da classe considerada;


f i é a frequência absoluta da classe considerada;
f i 1 é a frequência absoluta da classe anterior a classe considerada;
f i 1 é a frequência absoluta da classe posterior a classe considerada;

Exemplo. Esboce a curva polida da seguinte distribuição:

Emissões fi f ci
i
de SO nº de dias
1 5 ├ 9 5 4
2 9 ├ 13 6 6,8
3 13 ├ 17 10 7,5
4 17 ├ 21 4 5,3
5 21 ├ 25 3 3
6 25 ├ 29 2 1,8
Total 30 ----

Prof. Ivonaldo Pacheco Santana 11


3.1. Formas das curvas de freqüência

 Curvas em forma de sino

As curvas em firma de sino caracterizam-se pelo fato de apresentarem um valor máximo na


região central. Fenômenos pesquisados como peso de adultos, inteligência medida em testes mentais
oferecem distribuições em forma de sino. Essas curvas podem ser simétricas ou assimétricas.

Curva simétrica

Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos
eqüidistantes desse ponto terem a mesma frequência.

Curvas assimétricas
Na prática, não se encontram distribuições perfeitamente simétricas. As distribuições obtidas de medidas
reais são mais ou menos assimétricas, em relação á freqüência máxima. Assim, as curvas correspondentes a tais
distribuições apresentam a cauda de um lado da ordenada máxima mais longa que a do outro. Se a cauda mais
longa fica a direita é chamada assimétrica positiva, se a cauda se alonga à esquerda, chama-se assimétrica
negativa.

Assimétrica Positiva Assimétrica Negativa

Prof. Ivonaldo Pacheco Santana 12


EXERCÍCIOS

01. Uma população encontra-se dividida em 5 estratos, com tamanhos respectivamente, n1= 40, n2 = 55, n3 = 34, n4 = 60
e n5 = 41. Sabendo-se que, ao ser realizada uma amostragem proporcional estratificada, o número
total da amostra foi 46 elementos, determine o tamanho de cada estrato.

02. Um hotel tem um fichário com o registro de 5250 clientes e pretende amostrar 250 fichas. Obtenha, por meio da
amostragem sistemática, os números dos registros das 5 primeiras fichas e o número da última ficha. Sabe-se que a
primeira ficha sorteada foi a de número 17 (x = 17).

03. A tabela seguinte refere-se aos resultados de uma pesquisa, realizada com 400 adolescentes, a respeito de seu
lazer preferido:
Lazer Frequência Frequência Porcentagem
absoluta relativa (%)
Instrumento Musical a 0,06 b
Internet 92 c d
Esporte e f 9%
Sair à noite 180 g h
Outros i j 1
Total 400 1,00 100%

Quais são os valores de a,b,c,d,e,f,g,h,i,j,l?

04. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na
linha de produção a anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados:

2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 0 0 3 0 0 0 2 0 0 1

1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 0

Elabore uma distribuição de frequência - variável discreta.

05. Na tabela seguinte, estão representados os resultados de um levantamento realizado com 180 pessoas, na praça
de alimentação de um Shopping Center, sobre seus gastos em uma refeição.

Gastos (R$) Nº de pessoas


5  10 63
10  15 x + 54
15  20 2x
20  25 x/2

a) Qual é o valor de x?
b) Que porcentagem do total de entrevistados gasta de R$ 20,00 a R$ 25,00 por refeição?
c) Que porcentagem do total de entrevistados gasta menos de R$ 15,00 por refeição?

06. A tabela a seguir mostra as quantidades (em toneladas) de óxidos de enxofre emitidas por uma indústria em 80
dias:
ÓXIDO DE SO FREQUÊNCIA
(Nº de dias)
5,0 → 9,0 3
9,0 → 13,0 10
13,0 → 17,0 14
17,0 → 21,0 25
21,0 → 25,0 17
25,0 → 29,0 9
29,0 → 32,0 2

Prof. Ivonaldo Pacheco Santana 13


Responda:

a) Em quantos dias foram emitidos óxidos de enxofre com valores maiores ou iguais 21t e menores que 25t ?
b) Que porcentagem de dias representa uma emissão desse óxido abaixo de 25t ?
c) Até que classe de emissão desse óxido estão incluídos 50% dos dias?
d) Que porcentagem de dias representa uma emissão igual ou superior à 13t ?

07. Foram testadas 30 lâmpadas. Os tempos de duração em horas foram:

300 600 750 1100 400 900 405 320 770 800 520 950
1050 390 670 450 430 530 480 800 280 700 312 800
1000 900 290 350 485 315.

Construa uma tabela de distribuição de frequências. Use o critério de Stugers para determinação do nº de classes e
adote classes de amplitudes constantes.

08. Vinte e cinco jovens de até 15 anos foram selecionados para participar de um programa desenvolvido pela
Secretaria e Esportes de uma cidade cujo objetivo consiste na formação de futuros jogadores de vôlei. As alturas dos
jovens (em metro) são dadas a seguir:

1,82 1,77 1,79 1,74 1,73 1,81 1,82 1,69 1,71 1,78 1,78 1,88 1,72 1,65 1,75 1,78 1,73
1,82 1,84 1,74 1,76 1,79 1,83 1,76 1,70

a) A partir da menor altura encontrada, agrupe os dados em classes pelo critério da raiz e faça a tabela de freqüência
correspondente.

b) Em visita ao centro de treinamento, um técnico estrangeiro sugeriu que pelo menos 48% dos jovens deveriam ter
estatura superior ou igual a 1,80 m. Quantos jovens nessas condições devem ser incorporados ao atual grupo, de
acordo com tal sugestão? Use os dados agrupados no item a.

09. Uma pesquisa feita com 336 adolescentes de um condomínio, sendo 50% de cada sexo, revela alguns problemas
de saúde. A soma dos dados percentuais ultrapassa 100%, pois cada adolescente entrevistado pôde apresentar mais de
um problema.

a) Quantos jovens são hipertensos?


b) Quantos jovens têm problemas cardíacos na família?
c) Com esses dados seria possível construir um gráfico de setores?

10. O gráfico seguinte mostra a evolução mensal da balança comercial brasileira de abril de 2014 a abril de 2015. a
balança comercial é a diferença (nesta ordem) entre as exportações e as importações de um país, em um
determinado período.

Prof. Ivonaldo Pacheco Santana 14


a) Em que meses as importações brasileiras superaram as exportações?
b) Se, em abril de 2015, as exportações totalizaram 15,156 bilhões de dólares, determine o total das importações
nesse mês.
c) Em qual data do período considerado a diferença entre as exportações e importações (nessa ordem) foi máxima?

11. Analisando o gráfico de barras abaixo, classifique em V ou F cada sentença seguinte, justificando:

a) Se esse conjunto de dados fosse representado em um


gráfico de setores, o ângulo correspondente a região sul
seria menor que 90°.

b) O nº de emissoras da região Sudeste supera a soma do nº


do nº de emissoras das regiões Nordeste, Centro-Oeste e
Norte.

c) Supondo que Goiás concentre 60% das emissoras de sua re


gião, o percentual de emissoras do país representado por
este estado é menor que 5%.

12. O gráfico abaixo mostra queda nas operações com cheques e o avanço nas operações com cartões de crédito. Os
valores referem-se às quantidades de transações efetuadas (em milhões).

Assinale V ou F nas afirmativas seguintes, justificando as falsas:

a) As transações efetuadas com cartões aumentaram a cada ano no período considerado.


b) De 1993 a 2002 registrou-se queda de aproximadamente 45% nas transações efetuadas com cheques.
c) O crescimento percentual das transações com cartões aumentou 560% no período de 1993 a 2002.

Prof. Ivonaldo Pacheco Santana 15


13. Uma pesquisa realizada com 800 pessoas às vésperas de um feriado prolongado tinha como pergunta principal: ‘
O que você pretende fazer nesses quatro dias?’ Os resultados são dados na tabela seguinte:

Intenção Número de pessoas


Descansar em casa 240
Viajar 360
Passear na própria cidade 160
Trabalhar 40

Faça um gráfico de setores para representar esses resultados.

14. Em uma cidade, o mercado de leite é disputado por quatro marcas: X,Y,Z e W. Os resultados de uma sondagem
a propósito da marca preferida, realizada com 400 consumidores, estão parcialmente apresentados na tabela e no
gráfico seguinte
Marca de Freqüência
preferência absoluta
X 230
Y 120
Z ∆
W ∆

Determine:
a) a diferença entre o número de consumidores que preferem Z a W;
b) a diferença entre os ângulos correspondentes a X e Y.

15. Considerando o gráfico, responda às perguntas a seguir.

a) Qual a medida aproximada do ângulo do setor que representa cada região?


b) Que número representa as empresas de software instaladas no Sudeste?
c) Qual a participação percentual de Santa Catarina e São Paulo na região em que cada Estado de situa?

16. No pictograma abaixo está representada a queda na área desmatada anualmente em uma floresta de certo país,
devido à maior fiscalização dos órgãos governamentais, no período de 2012 a 2016. Cada árvore do gráfico
representa 25 mil hectares de floresta desmatada.

Prof. Ivonaldo Pacheco Santana 16


Sabendo que 1 hectare equivale a 10000 m2 , determine a área, em Km2, correspondente à superfície de floresta
desmatada em 2013 e em 2015.

17. A altura de 40 alunos de uma escola de Ensino Médio está representada pelo histograma abaixo.

a) Quantos alunos possuem altura maior ou igual a 1,85m?

b) Quantos alunos pertencem a classe de maior frequência?

18. O histograma seguinte mostra as temperaturas máximas diárias registradas em 80 dias durante um verão na
cidade do RJ.

a) Em quantos dias a temperatura máxima manteve-se abaixo dos 38°C?


b) Em quantos dias a temperatura máxima variou de 36°C a 42°C?
c) O dono de uma barraca de praia disse que o carioca costuma tomar 1 litro de cerveja na praia por dia quando a
temperatura está abaixo de 32°C e que, para cada 2°C de aumento da temperatura, esse consumo sobe 10% (em
relação ao consumo anterior). Se um carioca foi à praia nesses 80 dias, quantos litros de cerveja consumiu ao
todo, de acordo com essa previsão?

Prof. Ivonaldo Pacheco Santana 17


GABARITO
a  24; b  6%; c  0,23; d  23%; e  36; f  0,09;
3.
g  0,45; h  45%; i  68; j  0,17; l  17%

4.
Número de Número de
peças caixas
defeituosas fi
por caixa
xi
0 28
1 12
2 5
3 2
4 1
Total 48
5. a) x = 18% b) 5% c) 75% 6 . a) 17 dias b) 86,25% c) até a 4ª classe ( 17  21) estão incluídos 40 dias d) 83,75%
7.
Tempo (h) fi fri (%) Fi
280  417 10 33,33 10
417  554 6 20 16
554  691 2 6,66 18
691  828 6 20 24
828  965 3 10 27
965  1102 3 10 30
 30 100

8. a) Distribuição: b) No mínimo 10 jovens

Altura (%)
(em metros) fi fr fr
1,65  1,70 2 0,08 8
1,70  1,75 7 0,28 28
1,75  1,80 9 0,36 36
1,80  1,85 60 0,24 24
1,85  1,90 1 0,04 4

9. a) 117 jovens; b) 54 jovens;


c) tabagismo, taxa de colesterol alta, diabetes, alimentação incorreta, estresse e histórico familiar.
d) não, pois cada adolescente pôde apresentar mais de um problema.

10. a) Set 2014, Out 2014, Nov 2014, Jan 2015, e Fev 2015. b) 14,666 bilhões de dólares. c) Jun 2014

11.a) F;  95º b) V; (Sudeste)1064 > (Nordeste + Centro-Oeste + Norte)1056 c) V; 4,72%

12. a) V b) V c) F, aumentou 460%


14. a) z – w = 30 consumidores b) X – Y = 99º
15. a) Sudeste (153º), Sul (114°), Nordeste (65°), Centro-Oeste (26°), Norte (2°)
b) 2300 c) São Paulo: 56,8%; Santa Catarina: 42,7%

16. 2013: 2500 km2 ; 2015: 625 km2 18. a) 62 dias; b) 48 dias; c) 103,65 litros

Prof. Ivonaldo Pacheco Santana 18

Você também pode gostar