Você está na página 1de 89

COORDENADORIA DE MATEMÁTICA

ESTATÍSTICA DESCRITIVA
Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
Vitória - ES
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
CAPÍTULO I
1-UM BREVE HISTÓRICO
Pesquisas arqueológicas indicam que há 3000 anos A.C. já se faziam censos na Babilônia,
China e Egito. Até mesmo o 4º livro do Velho Testamento faz referência a uma instrução dada
a Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para
guerrear. Outro registro bíblico, informa que o Imperador César Augusto, ordenou que se
fizesse o Censo de todo o Império Romano. Usualmente, estas informações eram utilizadas
para a taxação de impostos ou para o alistamento militar.
Contudo, mesmo que a prática de coletar dados sobre colheitas, composição da população
humana ou de animais, impostos, etc., fosse conhecida pelos egípcios, hebreus, caldeus e
gregos, e se atribuam a Aristóteles cento e oitenta descrições de Estados, apenas no século
XVII a Estatística passou a ser considerada disciplina autônoma, tendo como objetivo básico a
descrição dos BENS do Estado.
As palavras censo e estatística, que são comumente usadas no trato das analises de dados
estatísticos, tem origem no latin. Censo, que é derivado da palavra “censere”, significa taxar, e
estatística, derivada de “status”, significa estado.
Um fato histórico relevante do uso da estatística foi atribuído a Florence Nightingale (1820-
1910), conhecida por muitos como a fundadora da profissão de enfermeiro. Ela salvou
milhares de vidas utilizando a estatística. Ao encontrar um hospital em más condições
sanitárias e sem suprimentos, tratou de melhorar estas condições e passou a utilizar a
estatística para convencer as autoridades da necessidade de uma reforma médica mais ampla.
Ela elaborou gráficos para mostrar que durante a guerra da Criméia, morreram mais soldados
em conseqüência das más condições sanitárias do que em combate. Florence Nightingale é
considerada uma das pioneiras na estatística social e nas técnicas de utilização de gráficos
estatísticos.
JÁ no Brasil, só se pode falar realmente sobre
estatística a partir do império,quando foi realizado
o primeiro censo, em 1872, e mais precisamente
com a fundação do IBGE em 1936 em que os
levantamentos estatísticos ganharam regularidade
e mais apoio do estado. Antes disto, no período
colonial, a Coroa Portuguesa era quem
determinava os levantamentos populacionais,
2
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
realizados precariamente, com o objetivo maior de "conhecer a população livre e adulta apta a
ser usada na defesa do território".
Atualmente, a estatística está consolidada com um poderoso instrumento da pesquisa cientifica
através do desenvolvimento técnicas de coleta, organização e analise de dados, que estão se
tornando cada vez mais sofisticadas com surgimento de poderosos softwares de tratamento de
dados.
2–APLICAÇÕES
Você já parou para pensar no quanto a Estatística está presente em vários aspectos de nosso
cotidiano? Nas pesquisas que medem a popularidade dos políticos, na apuração de resultados
de pesquisas e censos, na medição da audiência de um programa de televisão ou na análise
dos indicadores econômicos. Em todas essas situações, a Estatística é necessária. Já nos
estudos acadêmicos ela tem importância capital para validar as pesquisas nas diversas áreas
do conhecimento, o que torna o seu estudo multidisciplinar: a mesma análise estatística de
dados de um físico poderia também ser usado por um economista, agrônomo, químico,
geólogo, matemático, biólogo, sociólogo psicólogo e cientista político. Mesmo que as
interpretações dessas análises sejam diferentes devido as diferenças entre as áreas do
conhecimento, os conceitos empregados, as limitações das técnicas e as conseqüências dessas
interpretações são essencialmente as mesmas.
3- RAMOS DA ESTATÍSITICA
De forma geral o estudo da Estatística se divide em três ramos: a Estatística Descritiva, que
incluem técnicas que dizem respeito à síntese e a descrição de dados; a probabilidade, que
incluem técnicas que analisam situações que envolvem o acaso e a inferência que incluem
técnicas que dizem respeito a analise e a interpretação de dados amostrais.
4- A PESQUISA E A ESTATÍSTICA
São inúmeros os conceitos sobre pesquisa. Vários estudiosos, nos diferentes campos do
conhecimento humano estabelecem o significado desta palavra de acordo com o objetivo de
seu estudo. Segundo o dicionário Aurélio, o conceito geral é: a investigação e estudo,
minudentes e sistemáticos, com o fim de descobrir ou estabelecer fatos ou princípios
relativos a um campo qualquer do conhecimento.
3
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
4.1. TIPOS DE PESQUISA
Os critérios para a classificação dos tipos de pesquisa variam de acordo com o enfoque dado
pelo autor, pois esta divisão obedece a interesses, condições, campos, metodologia, situações,
objetivos e objetos de estudo. Neste trabalho vamos definir os seguintes tipos de pesquisa:
1) Pesquisa pura ou fundamental. É aquela que procura o progresso científico, ampliação
de conhecimentos teóricos, sem a preocupação de utilizá-los na prática. Tem por meta o
conhecimento pelo conhecimento.
2) Pesquisa aplicada. Como o próprio nome indica, caracteriza-se por seu interesse prático,
isto é, que os resultados sejam aplicados ou utilizados, imediatamente, na solução de
problemas que ocorrem na realidade.
4.2. CARACTERÍSTICAS DE UMA PESQUISA
Para que uma pesquisa seja bem planejada e chegue a resultados satisfatórios é importante
que obedeça algumas características básicas:
- O procedimento deve ser sistematizado.
- Explorações deve ser técnica, sistemática e exata.
- Exploração deve ser lógica e objetiva.
- Organização quantitativa dos dados.
- Relato e registro meticuloso e detalhado da pesquisa.
4.3. FASES DA PESQUISA
1) Escolha do tema. Na escolha de um tema a ser pesquisado deve se levar em conta alguns
aspectos: consonância com as aptidões do pesquisador, mereça ser investigado
cientificamente e que tenha condições de ser formulado e delimitado em função da pesquisa.
2) Levantamento dos dados. Devem ser utilizados três procedimentos básicos: pesquisa
documental, pesquisa bibliográfica e contatos diretos.
3) Formulação do problema. Definir um problema significa especificá-lo em detalhes
precisos e exatos. Na formulação do problema deve haver clareza, concisão e objetividade.
4) Definição dos termos. Devem ser claros, compreensivos, objetivos e adequados.
5) Construção de hipóteses. A hipótese é uma proposição que se faz na tentativa de
verificar a validade de resposta existente para um problema. A sua função na pesquisa
científica é propor explicações para certos fatos e ao mesmo tempo orientar a busca de outras
informações.
4
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6) Indicações de variáveis. Ao se colocar o problema e a hipótese, deve ser feita também a
indicação das variáveis, que devem ser definidas com clareza e objetividade e de forma
operacional.
As variáveis (dados) estatísticas podem ser divididos me dois grupos:
a) Qualitativos: que se distinguem por características não numéricas, tais com sexo,
marca de um determinado produto, etc.
b) Quantitativos: consistem em números que representam contagens ou medidas. Estes
números podem ser divididos em dois grupos: os dados discretos, que resultam de
um conjunto finito de valores, ou um conjunto enumerável destes valores, e os dados
contínuos que resultam de um número infinito de valores possíveis, que podem ser
associados a pontos em uma escala continua de tal maneira que não haja lacunas ou
interrupções. Para facilitar o entendimento destes dois grupos de dados e só levar em
consideração que os dados que representam contagem são discretos, e os que
representam medida são contínuos. Assim, o número de alunos de uma determinada
faculdade constituem dados discretos, já o peso destes alunos constituem um dado
contínuo.
7) Delimitação da pesquisa. Após a escolha do assunto, o pesquisador pode decidir ou pelo
estudo de todo o universo da pesquisa ou sobre uma amostra.
Aqui vamos falar um pouco mais do que constitui um universo e uma amostra.
Uma população estatística ou universo estatístico é a denominação que se da a todos os
entes portadores de pelo menos uma característica comum.
Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo
menos uma característica comum: são todos que estudam.
Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais
características dos elementos de uma população, esta característica deve estar perfeitamente
definida. E isto se dá quando: considerado um elemento qualquer, podemos afirmar, sem
ambigüidades, se esse elemento pertence ou não à população. É necessário, portanto, existir
um critério de constituição da população, válido para qualquer pessoa, no tempo ou no espaço.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal,
limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da
população. A essa parte proveniente da população em estudo denominamos amostra. Assim
uma amostra é um subconjunto finito de uma população.
A estatística Indutiva tem por objetivos tirar conclusões sobre as populações, com base
em resultados verificados em amostras retiradas dessa população. Mas, para as inferências
serem corretas, é necessário garantir que a amostra seja representativa da população, ou
seja, ela deve possuir a mesma característica básica da população, no que diz respeito ao
fenômeno que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão
ser usadas sejam obtidas por processos adequados.
5
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Na coleta de uma amostra, o pesquisador deve ficar atento para as técnicas de amostragem,
que garanta quanto possível, o acaso na escolha. Desta forma, cada elemento da população
passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de
representatividade, pois nossas conclusões relativas à população vão ser baseadas nos
resultados obtidos nas amostras dessa população. A seguir vamos descrever os principais tipos
de amostragens;
a) Amostragem casual ou aleatória simples
Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem
casual ou aleatória simples, pode ser realizada numerando-se a população de um até n
e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer k números
dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.
b) Amostragem proporcional estratificada
Muitas vezes a população se divide em sub-populações – estratos. Como é provável
que a variável em estudo apresente, de estrato em estrato, um comportamento
heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o
sorteio de elementos da amostra leve em consideração tais estratos.
Assim, quando empregamos a amostragem proporcional estratificada, consideramos a
existência dos estratos e obtemos os elementos da amostra proporcional ao número de
elementos dos mesmos.
Exemplo:
Suponha que noventa alunos de uma turma, 54 sejam meninos e 36 sejam meninas. E
desejamos estudar a variável estatura dos alunos dessa turma.
Como a estatura é diferenciada para cada sexo, vamos então obter uma amostra
proporcional estratificada, colhendo uma amostra de 10% da população.
Sexo População 10% amostra
M 54
4 , 5
100
54 10
·
x
5
F 36
6 , 3
100
36 10
·
x
4
Total 90
0 , 9
100
90 10
·
x
9
Tomando as informações da tabela acima, sorteiam-se aleatoriamente 5 alunos do
sexo masculino e 4 alunos do sexo feminino, formando assim uma amostra proporcional
estratificada de 10% da população.
6
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
c) Amostra sistemática
Quando os elementos da população já estão ordenados não há necessidade de construir
o sistema de referência. São exemplos: os prontuários médicos de um hospital, os
prédios de uma rua, as linhas de produção etc. Nesses casos, a seleção dos elementos
que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A
esse tipo de amostragem denominamos sistemática.
Exemplo:
Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma
amostra formada de cinqüenta prédios. Podemos, neste caso, usar o seguinte
procedimento: como 18
50
900
· , escolhemos por sorteio casual um número de 1 a 18
(inclusive), que indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 18 em 18. Assim, se o número
sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4
0
prédio, o 22
0
, o 40
0
etc.,
até voltarmos ao início da rua pelo lado esquerdo.
8) Seleção métodos e técnicas. Os métodos e as técnicas a serem empregados em uma
pesquisa cientifica podem ser selecionados desde a proposição do problema, da formulação
das hipóteses de delimitação do universo ou amostra. A seleção instrumental metodológica
está, portanto, diretamente relacionada com o problema a ser estudado, e a escolha
dependerá dos fatores relacionados com a pesquisa.
Tanto os métodos quanto as técnicas devem adequar-se ao problema ser estudado, e
numa investigação em geral nunca se utiliza apenas um método e uma técnica, mas sim todos
aqueles que forem necessários ou apropriados para um determinado caso.
9) Organização instrumental da pesquisa. na organização do material de pesquisa, dois
aspectos tem que ser levados em consideração: Organização do material para a investigação e
a organização de fatos e documentos que o investigador vem acumulando no transcurso de
seus estudos.
10) Teste de instrumentos e procedimentos. Numa pesquisa, nem sempre é possível
prever todas as dificuldades e problemas que ocorreram e que envolva a coletas de dados,
muitas vezes questionários, procedimentos ou instrumentos utilizados podem não funcionar
bem, assim, a aplicação de um pré-teste poderá evidenciar possíveis erros e possibilitar a
reformulação de falhas na elaboração da pesquisa.
7
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
4.4. EXECUÇÃO DA PESQUISA
São as seguintes as fases de execução de uma pesquisa:
1) Coleta de dados. Etapa da pesquisa em que se inicia a aplicação dos instrumentos
elaborados e das técnicas selecionadas, a fim de se efetuar a coleta dos dados previstos.
2) Elaboração (tratamento) dos dados. Após a coleta os dados são elaborados e
classificados de forma sistemática, e devem seguir os seguintes passos:
a) Seleção: Um exame minucioso dos dados a fim de detectar falhas ou erros,
evitando informações confusas, distorcidas ou incompletas que podem prejudicar o
resultado da pesquisa.
b) Codificação: Técnica operacional utilizada para categorizar os dados que se
relacionam mediante a uma codificação para transformá-los em símbolos para
poderem ser tabelados e contados.
c) Tabulação: Dispor os dados em tabelas, possibilitando maior facilidade na
verificação das inter-relações entre eles.
3) Analise e interpretação dos dados. A analise de dados é uma tentativa de evidenciar as
relações existentes entre o fenômeno estudado e outros fatores, já a interpretação é uma
atividade intelectual que procura dar um significado mais amplo às respostas, vinculando-
as a outros conhecimentos.
4) Apresentação dos dados. A apresentação dos dados se da por meio de tabelas,
quadros, gráficos, etc.
5) Conclusões. É a última fase do planejamento e organização de uma pesquisa, que explica
os resultados finais considerados relevantes. As conclusões devem ser vinculadas à
hipótese de investigação, cujo conteúdo foi comprovado ou refutado. A exposição geral da
pesquisa, desde o planejamento às conclusões, incluindo os processos metodológicos
empregados, devem ser apresentados em um relatório final.
5-COMO ORGANIZAR OS DADOS ESTATÍSTICOS DE
UMA PESQUISA
Uma das formas de sintetizar os valores que uma ou mais variáveis podem assumir,
para que tenhamos uma visão global da variação dessa ou dessas variáveis, é apresentar
esses valores em tabelas ou gráficos.
8
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.1- TABELAS
COMPOSIÇÃO DE UMA TABELA

De acordo com a Resolução 886 da Fundação IBGE, nas células deve colocar:
• Um traço horizontal ( ÷ ) quando o valor é zero, não só quanto a natureza das coisas,
como quanto ao resultado do inquérito;
• Três pontos (…) quando não temos dados;
• Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado
valor;
• Zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se
os valores são expressos em numerais decimais, precisamos acrescentar à parte
decimal um número correspondente de zeros ( 0,0; 0,00; 0,000; ...).
Alguns Exemplos de Tabela
5.5.1-TABELA DE DUPLA ENTRADA
Excesso de tempo anual em congestionamento severo
Computando as vias transversais (passageiro x h)
CIDADE AUTOMÓVEL ÔNIBUS
Belo Horizonte 6.063.141 40.536.342
Brasília 498.842 2.407.701
Campinas 3.507.658 2.452.520
Curitiba 2.819.055 2.366.449
FONTE: Revista dos Transportes Públicos
9
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.5.2-DISTRIBUIÇÃO DE FREQUÊNCIA
Número de horas extras de 20 motoristas de uma
Empresa no período de 30 dias
HORAS EXTRAS NÚMERO DE MOTORISTAS
0 |---------- 10 2
10 |---------- 20 1
20 |---------- 30 5
30 |---------- 40 8
40 |---------- 50 4
Total 20
FONTE: Dados Fictícios
Orientações básicas para a construção de uma tabela de distribuição de freqüência
quando os dados são contínuos
1) Determinar o intervalo dos dados
2) Determinar o número K de classes, s observaçõe de número k ≈ ,em geral, tomar o
valor de k entre 5 e 15.
3) Calcular a amplitude de classe dividindo o intervalo por k (intervalo/k), fazendo o
arredondamento conveniente.
4) Certificar-se de que k vezes a amplitude é maior do que o intervalo, para evitar que
valores extremos sejam excluídos.
5) Estabelecer limites de classe, rever os limites, que devem tocar-se, mas não se
interceptar.
6) Distribuir os dados, determinando com que freqüência, eles aparecem dentro de cada
classe.
7) Rever a distribuição de forma a evitar que uma determinada classe tenha freqüência
zero.
Exemplo:
Os dados a seguir correspondem a estatura, em cm, de uma amostra de 40 alunos de
uma determinada escola:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Construindo uma tabela de distribuição de freqüência para estes dados temos:
10
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
1) Determinar o intervalo de dados, amplitude total:
AT=173 – 150 = 23
2) determinar o número de classe
k =
40
, considere o valor de k= 6 pois é o inteiro mais próximo.
3) Determinar a amplitude de classe

6
23
· ·
k
AT
h , considere h = 4 que é o inteiro mais próximo
4) Verificar se todos os dados estão incluídos
AT h k ≥ . , ou seja 23 4 . 6 ≥
5) Construir a tabela
i ESTATURAS
(cm)
FREQÜENCIA FREQUÊNCIA
RELATIVA
1 150|------154 4 0,100
2 154|------158 9 0,225
3 158|------162 11 0,275
4 162|------166 8 0,200
5 166|------170 5 0,125
6 170|------174 3 0,075
Total 40 1,000
5.2- GRÁFICO
É uma forma de apresentação de dados cujo objetivo é o de produzir no investigador ou
no publico em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os
gráficos falam mais rápido à compreensão que as séries.
Alguns exemplos;
11
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.2.1-GRÁFICO DE LINHAS
Fonte: Folha de São Paulo
5.2.2-GRÁFICO EM COLUNAS
12
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.2.3- GRÁFICO EM BARRAS MULTIPLAS
5.2.3-GRÁFICO DE SETORES
13
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.3.4-GRAFICO POLAR
5.3.5-PICTOGRAMA
14
PRECIPITAÇÃO
PLUVIOMÉTRICA(mm) EM
RECIFE -1993
20
70
120
170
220
270
320
janeiro
fevereiro
março
abril
maio
junho
julho
agosto
setembro
outubro
novembro
dezembro
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.3.6-HISTOGRAMA, POLIGONO DE FREQÜÊNCIA E CURVA DE
FREQÜÊNCIA.
Quando os dados estatísticos estão distribuídos em classe podemos utilizar três tipos de
gráficos para representar os dados:
1) HISTOGRAMA
É um gráfico de colunas que retrata a distribuição de freqüência. Ele relaciona as
classes com as suas respectivas freqüências.
i ESTATURAS
(cm)
FREQUÊNCIA Ponto médio de
classe (xi)
Freqüência
calculada(
i
fc
)
1 150|------154 4 152 4,25
2 154|------158 9 156 8,25
3 158|------162 11 160 9,75
4 162|------166 8 164 8
5 166|------170 5 168 5,25
6 170|------174 3 172 2,75
Total 40
15
150 154 158 162 170
166
174
Estatura
freqüência
4
9
11
8
5
3
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
2) POLIGONO DE FREQÜÊNCIA
É um gráfico que relaciona os pontos médio classe com as freqüências.
3) CURVA DE FREQÜÊNCIA
A curva de freqüência é uma curva suavizada do polígono de freqüência. Para eliminar
os “bicos“ do polígono de freqüência fazemos o cálculo de uma outra freqüência, chamada
freqüência calculada, que leva em consideração a influência das classes vizinhas, através do
cálculo da média ponderada.
4
2
post i ant
i
f f f
fc
+ +
·
16
152 156 160164 168
Estatura
freqüência
4
9
11
8
5
3
172
152 156 160 164168
Estatura
Freqüência
calculada
4,25
8,25
8
5,25
2,75
172
9,75
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Obs: O polígono de freqüência nos informa a situação real do fenômeno
estudado, enquanto a curva de freqüência informa a tendência do fenômeno.
6- MEDIDAS RELACIONADAS COM AS VARIÁVEIS
QUANTITATIVAS
6.1.SOMATÓRIO
Consideremos a seguinte soma indicada : 0 + 2 + 4 + 6 + 8 + 10 + 12 + 14 + ... +
100. Podemos observar que cada parcela é um número par e portanto pode ser representada
pela forma 2n, neste caso, com n variando de 0 a 50. Esta soma pode ser representada
abreviadamente por:

·
50
0
2
n
n
, que se lê: “somatório de 2n com n variando de 0 a 50”. A letra
grega

, que é o esse maiúsculo grego (sigma), é o sinal de somatório e é usada para
indicar uma soma de várias parcelas.
Em

·
n
i
a
1
1
a letra i é denominada índice do somatório (em seu lugar, pode figurar qualquer
outra letra) e os valores 1 e n, neste caso, são denominados, respectivamente, limites
inferior e superior.
6.1.1-Número de parcelas de um somatório
17
Seja
} , , , , {
3 2 1 n
a a a a 
um conjunto de n números reais, o símbolo

·
n
i
a
1
1
representa a sua soma, isto é
n
n
i
a a a a + + + ·

·

2 1
1
1
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.1.2-Propriedades de um somatório
1) Somatório de uma constante
2) Somatório do produto de uma constante por uma variável
3) Somatório de uma soma algébrica
4) Separação do último termo
5) Separação do primeiro termo
18
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6) Avanço dos limites
6.2 PRODUTÓRIO

i=1
n
X
i
=X
1
. X
2
. X
3
... X n
6.2.1 Propriedades do produtório
1)

i=1
n
b=b.b.b...b=b
NT
, sendo NT o número de termos do produtório
2)

i=1
n
cX
i
=cX
1
. cX
2
. cX
3
... cX n=c
˙

i=1
n
X
i
3)

i=1
n
X
i
˙
Y
i
=X
1
˙
Y 1. X
2
˙
Y
2
. X
3
˙
Y
3
... X n ˙ y
n
= X
1
. X
2
. X
3
... X
N

˙
Y
1
. Y
2
. Y
3
...Y
N
=

i=1
n
X
i
˙

i =1
n
Y
i
4)

i=1
n
i =1.2.3...n=n!
5) log
˙

i=1
n
X
i
=log X
1
. X
2
. X
3
... X n=log X
1
logX
2
log X
3
....log X
n
=

i=1
n
logX
i
∀X
i
0
19
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.3- MEDIDAS DE POSIÇÃO
As medidas de posição, também chamadas de tendência central, constituem um
procedimento para a redução de dados estatísticos expressados por valores que se encontram
situados entre os extremos de uma série ou distribuição. Normalmente estas medidas tendem
a se aproximar do centro da distribuição. As três medidas mais comuns são: a média, a
mediana e a moda.
6.3.1-A MÉDIA
A média é a medida estatística mais popular e, portanto, mais usada na interpretação
de dados. A média tem certas propriedades matemáticas interessantes e úteis, o que explica a
sua maior importância como medida de tendência central. Na figura a seguir ilustramos a
média, em um histograma, como o centro de conjunto de dados, no sentido de que é o ponto
de equilíbrio dos mesmos.
Os tipos de média mais utilizada são: a média aritmética, a média geométrica e a
média harmônica. Cada uma com especificidade para determinado tipo de dado.
1) Média aritmética
Dos tipos de média a aritmética é a mais utilizada, em todo o resto deste texto será
chamada simplesmente de média. A média de um conjunto de valores é o valor obtido
somando-se todos eles e dividindo-se o total pelo número de valores.
n
x
X
i ∑
· , onde xi representa o valor da variável i, e n é o número de vezes que ela aparece.
Exemplo: Calcular a média dos seguintes dados: 20, 80, 40, 60, 50
50
5
60 50 40 80 20
·
+ + + +
· X
20
Média
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Quando os dados estão tabulados, calcula-se a média utilizando a fórmula


·
i
i i
f
x f
X
, fi é freqüência da variável xi .
Criam-se as colunas, xi que representa o ponto médio de cada classe, que é o representante
de todos os valores dentro da classe, e
i i
x f
produto da freqüência pelo ponto médio de classe.
Exemplo:
A tabela abaixo corresponde a estatura de 40 alunos de uma determinada escola. Calcular a
estatura média destes alunos.
i ESTATURAS
(cm)
FREQUÊNCIA xi
i i
x f
1 150|------154 4 152 608
2 154|------158 9 156 1404
3 158|------162 11 160 1760
4 162|------166 8 164 1312
5 166|------170 5 168 840
6 170|------174 3 172 516
Total 40 6440
cm
f
x f
x
i
i i
161
40
6440
· · ·


Média Ponderada: Quando as observações têm importâncias diferentes.
i
1
1
x variável da peso o é onde ;
i
n
i
i
n
i
i i
w
w
x w
x


·
·
·
Exemplo: Um professor divide os 100 pontos da avaliação semestral de sua disciplina usando o
seguinte critério: uma avaliação individual valendo 40 pontos, um trabalho em grupo valendo
20 pontos , um seminário valendo 25 pontos e um trabalho individual valendo 15 pontos. Qual
a média final de um aluno que recebeu as seguintes notas: avaliação individual 85, trabalho
em grupo 75, seminário 70 e trabalho individual 65.
25 , 76
100
15 65 25 70 20 75 40 85
·
⋅ + ⋅ + ⋅ + ⋅
· x
21
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Propriedades da média aritmética
a) A média de um conjunto de números pode sempre ser calculada.
b) Para um conjunto de dados a média é única.
c) A média é sensível a todos os valores do conjunto. Assim, se um valor se modifica a média
também se modifica.
d) Somando-se ou subtraindo-se uma constante a cada valor de um conjunto de dados, a
média ficará aumentada ou subtraída desse valor.

i=1
n
 X
i
±k
n
=


i=1
n
X
i
±

i=1
n
K
n
=

i =1
n
X
i
n
±

i=1
n
K
n
=

X ±
nK
n
=

X ±K
e) Multiplicando-se ou dividindo-se uma constante a cada valor de um conjunto de dados, a
média fica multiplica ou dividida por essa constante.

i=1
n
KX
i
n
=K
˙

i=1
n
X
i
n
=K

X
f) A soma algébrica dos desvios em relação a média é nula
d
i
=X
i


X

i=1
n
d
i
=

i=1
n
 X
i


X =

i=1
n
X
i


i=1
n

X =n

X −n

X =0
g) A soma do quadro dos desvios em relação à media é minima, isto é SQD=

i =1
n
 X
i


X 
2
é
mínimo
seja f c=

i=1
n
 X
i
−c
2
=

i=1
n
X
i
2
−2c
˙

i =1
n
X
i


i =1
n
c
2
=nc
2
2
˙

i=1
n
X
i
 c

i=1
n
X
i
2
f(c) é uma função do segundo grau na variável “c” e com concavidade voltada para cima
pois n>0. Então essa função passa por um mínimo e a abscissa desse mínimo é:
c
min
=
−2
˙

i=1
n
X
i

−2n
=

i =1
n
X
i
n
=

X
como essa função está no seu ponto mínimo quando c=

X
temos que SQD=

i =1
n
 X
i


X 
2
é um mínimo.
22
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
2) Média Geométrica
A média geométrica deve ser usada para o cálculo da média de séries cujos elementos se
apesentam segundo uma progressão geométrica ( como exemplo a média de populações,
lindices de custo de vida, juros compostos etc.) ou que revelem elementos “muito grande”
comparativos com os demais, como por exemplo 18, 20 22, 24 e 850, onde a média
geométrica é aproximadamente igual a 43,8, resultado que não foi tão influenciado pelo valor
850.
A principal inconveniência da média geométrica, consiste no fato de ela ser
grandemente influenciada pelos elementos “pequenos” de uma série.
n
n
i
i G
X X

·
·
1
Quando os dados estão distribuídos em freqüência

X
G
=

i=1
n
f
i


i=1
n
X
i
f
i
Exemplo: Determine o fator de crescimento médio para uma aplicação, composta à taxas
anuais de juros de 10%, 8%, 9%, 12% e 7%.
O fator de crescimento para cada ano será: 1,10; 1,08; 1,09; 1,12 e 1,07
Fator de crescimento médio= 09 , 1 07 , 1 12 , 1 09 , 1 08 , 1 10 , 1
5
· ⋅ ⋅ ⋅ ⋅
3) Média Harmônica
A média harmônica é particularmente recomendada para calcular a média de um conjunto de
dados que constituem uma série de valores que são inversamente proporcionais. Obtém-se a
média harmônica dividindo-se o número n de valores pela soma dos inversos de todos os
valores.

·
i
H
x
n
X
1
23
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Exemplo:
Um carro, no trajeto em entre Vitória e Cachoeiro, faz a viagem de ida com uma velocidade
média de 60Km/h e a volta com a velocidade média de 80Km/h. Determinar a velocidade
média para a viagem de ida e volta.
h km X média velocidade
H
/ 57 , 68
80
1
60
1
2
·
+
· ·

6.3.2 – Mediana
A mediana é o valor central de um conjunto ordenado de dados, ela divide o conjunto em dois
grupos iguais, 50% dos valores menores ou igual mediana e 50% dos valores maiores ou
iguais à mediana
Processo para calcular a mediana
1) Para dados não agrupados
Inicialmente ordenam-se os dados em ordem crescente ou decrescente
Para um número impar de valores a mediana é o valor:

2
1 +
·
n
x Me
, onde n é o número de dados.
b) Para um número par de valores, a mediana é a média dos valores do meio.
2
1
2 2
+
+
·
n n
x x
Me
, onde n é o número de dados.

Exemplo: Calcular a mediana do seguinte conjunto de dados: 20 50 40 30 60 65 80 45 90 70
Valores ordenados: 20 30 40 45 50 60 65 70 80 90
55
2
60 50
2
1
2 2
·
+
·
+
·
+
n n
x x
Me
2) Quando os dados estão distribuídos em classe (agrupados) calcula-se a mediana usando os
seguintes procedimentos.
24
Classe da
mediana
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Exemplo: Determinar a mediana dos dados correspondentes a 40 alunos de uma determinada
escola.
i ESTATURAS
(cm)
FREQUÊNCIA Fi
1 150|------154 4 4
2 154|------158 9 13
3 158|------162 11 24
4 162|------166 8 32
5 166|------170 5 37
6 170|------174 3 40
Total 40
1) Cria-se uma coluna Fi chamada freqüência acumula, esta freqüência determina o
posicionamento dos valores dentro da distribuição. Na tabela observamos que existem 32
estaturas entre 150cm e 166cm, 13 estaturas entre 150cm e 158cm, e assim por diante. Uma
observação importante é que na tabela de distribuição de freqüência os dados já estão
ordenados
2) Determina-se em que classe a mediana está. Na tabela temos
20
2
40
2
· ·
∑ i
f
. A mediana
ocupa a 20ª posição, estando, portanto, na 3ª classe.
3) Numa tabela de freqüência há uma perda de informação a respeito dos dados originais,
sabemos que a mediana é um valor que está entre 158cm e 162cm. Para recuperamos um
valor para a mediana vamos estimar que existem 11 variáveis na 3ª classe eqüidistantes um
da outra.
cm M
e
54 , 160
11
4
7 158 · ⋅ + ·
Usando o mesmo raciocínio podemos desenvolver a seguinte fórmula para o cálculo da
mediana
158 162
Mediana
13ª posição 20ª posição
11
4

25
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
*
) (
*
2
i
ant
i
i
f
h F
f
Me

1
1
]
1

¸


+ ·



*
i
l - Limite inferior da classe mediana.
*
i
f - Freqüência simples da classe mediana.
F(ant) – freqüência acumulada da classe anterior a classe mediana.
h – amplitude da classe mediana.
Aplicando a fórmula vem:
cm h
f
ant F
f
l Me
i
i
i
54 , 160 54 , 2 158 4
11
13 20
158
) (
2
*
*
· + ·

,
_

¸
¸ −
+ ·

,
_

¸
¸

+ ·

6.3.3- Moda
A moda é a medida estatística que aparece com maior freqüência.
Exemplo: Determina a moda dos dados a seguir: 20 30 50 40 40 60 40 90 80 80
40 · Mo
Obs: A moda, não necessariamente é única. Um conjunto de dados pode ter duas, três,
quatro, ... ou até nenhuma moda.
Quando os dados estão distribuídos em classe, pode-se atribuir o valor da moda como sendo o
ponto médio da classe de maior freqüência. No exemplo anterior a moda seria então 160cm.
No entanto este tipo de moda não leva em consideração a instabilidade nas fronteiras das
classes, onde estão as variáveis que com pequenas modificações da amplitude do intervalo,
tendem a migrar para as classes vizinhas. Foi pensando nesta instabilidade que se
desenvolveu uma fórmula para o cálculo da moda, levando em consideração as freqüências
das classes vizinhas. A figura a seguir representa uma parte do histograma de uma
distribuição, em que são representadas: a classe de maior freqüência (que contém a moda) e
as classes vizinhas.

26
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Os triângulos PQT e RST são semelhantes, então:
h
D D
D
x
x h
x
D
D
2 1
1
2
1
+
· ⇒

·
Como
x M
i o
+ · 
, temos:
h
D D
D
M
i o
2 1
1
+
+ · 
h
D D
D
l Mo
i
.
2 1
1 *
+
+ ·
post i
ant i
f f D
f f D
− ·
− ·
*
2
*
1
Exemplo:
Determinar a moda dos dados representados na tabela anterior.
Primeiro determina-se o classe em que a moda está, ou seja a classe de maior freqüência, e
sem seguida aplica-se a fórmula
cm h
D D
D
l Mo
i
6 , 159 6 , 1 158 4
) 8 11 ( ) 9 11 (
9 11
158 .
2 1
1 *
· + · ⋅
− + −

+ ·
+
+ ·
27
Q
D
1
D
2
P
R
freqüência
x h-x
T
M
o
S
i
 Classes
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Neste caso a moda foi um pouco menor que o ponto médio de classe. Esta diferença se deve
ao fato da classe anterior à classe modal ter uma freqüência maior que a da classe superior,
arrastando a média para um valor um pouco abaixo do centro da classe.
6.3.4- Separatrizes
Medida estatística que separam os dados em grupos que apresentam o mesmo número
de valores.
Exemplo:
Mediana: Separa os dados em dois grupos que apresentam o mesmo número de
valores .
Quartis: separa os dados em quatro grupos que apresentam o mesmo número de
valores.
Decis: separa os dados em dez grupos que apresentam o mesmo número de valores.
Percentis: separa os dados em cem grupos que apresentam o mesmo número de
valores.
Para calcular as separatrizes podemos adaptar a fórmula da mediana generalizando para o
cálculo de um percentil k qualquer.
*
) (
*
100
i
ant
i
i k
f
h F
f k
P

1
1
]
1

¸


+ ·


Observação: Para calcular o quartil 3 temos: Q3 = P75
Exemplo: Calcular o
20
P
dos dados da tabela anterior.
Primeiro é preciso determinar a classe onde está o
20
P
8
100
40 20
·
x
, ocupa a 8ª posição ou seja está na classe 2.
cm P 78 , 155 78 , 1 154 4
9
4 8
154
20
· + ·

,
_

¸
¸ −
+ ·
28
k
P
K%
(100-K)%
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
A interpretação do percentil é a seguinte: 20% das estaturas estão abaixo de 155,78cm
enquanto que 80% estão acima.
6.4-MEDIDAS DE DISPERSÃO OU VARIABILIDADE
Nas análises de dados, alem da informação quanto ao “meio” de um conjunto de dados, é
conveniente dispor também de uma medida para avaliar a dispersão, ou seja, se os valores
estão relativamente próximos uns aos outros.
Imagine uma pesquisa em três residências a respeito do consumo de água durante o período
de 5 dias e os resultados estão apresentados na tabela a seguir:
CONSUMO
(1000 LITROS)
TOTAL
RESIDÊNCIA A 1,0 2,0 1,5 2,5 3,0 10,0
RESIDÊNCIA B 0,5 3,0 4,0 1,5 1,0 10,0
RESIDÊNCIA C 1,0 2,0 0,3 2,7 4,0 10,0
Observe que o consumo médio das três residências foi o mesmo, dia x / 2000
5
10000
 · · , no
entanto, uma observação rápida e visual indica que a residência C teve um consumo mais
diferenciado a cada dia se comparada às outras, ou seja um consumo menos estável. É
exatamente este tipo de informação que as medidas de dispersão fornecem numa análise de
dados. As principais medidas de dispersão serão estudadas a seguir.
6.4.1- Intervalo ou amplitude
Diferença entre o maior e o menor valor em um grupo de dados
Exemplo:
Determinar o intervalo do conjunto de dados: 12, 20, 3, 2, 15, 17.
18 2 20 · − · AT
No exemplo das residências temos:
Amplitude relativa ao consumo de água da residência A é 2.000 litros, o da residência B é
3500 litros e o da residência C é 3700 litros.
Obs. A amplitude não é considerada uma boa medida de dispersão pois só leva em
consideração os extremos do intervalo, não sendo sensível a todo conjunto de
dados.
29
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.4.2-Desvio Médio Absoluto
n
x x
DMA
i ∑

·
No conjunto de dados 12, 20, 3, 2, 15, 17 , temos 50 , 11
6
69
· · x . O desvio relativo ao valor
12 é 0,5, ou seja 5 , 0 5 , 11 12
1
· − · d . A interpretação deste valor é que 12 esta a 0,5 pontos
acima da média. Já o desvio relativo ao valor 2 é 5 , 9 50 , 11 2
4
− · − · d , o que significa que 2
está a 9,5 pontos abaixo da média.
Como a média dos desvios sempre será zero, uma forma de captar a dispersão dos dados é
calcular a média dos valores absolutos dos desvios.
Exemplo:
Calcular o desvio médio absoluto dos dados 12, 20, 3, 2, 15, 17.
6
| 5 , 11 17 | | 5 , 11 15 | | 5 , 11 2 | | 5 , 11 3 | | 5 , 11 20 | | 5 , 11 12 | − + − + − + − + − + −
· DMA
6
5 , 5 5 , 3 5 , 9 5 , 8 5 , 8 5 , 0
6
| 5 , 5 | | 5 , 3 | | 5 , 9 | | 5 , 8 | | 5 , 8 | | 5 , 0 | + + + + +
·
+ + − + − + +
· DMA
0 , 6
6
36
· · DMA
Como sugestão, calcule o desvio médio absoluto relativo ao consumo de água nas três
residências apresentadas na tabela anterior e compare os resultados.
6.4.3- Variância
A variância é também uma medida que capta a variabilidade de um conjunto de dados, e é
definida como a soma dos quadros dos desvios dividido pelo número de observações menos
um. Para representar a variância usaremos a letra
2
s
.
( )
1
2
2


·

n
x x
s
i

Exemplo: Calcular a variância do conjunto de dados: 12, 20, 3, 2, 15, 17.
30
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5
) 5 , 11 17 ( ) 5 , 11 15 ( ) 5 , 11 2 ( ) 5 , 11 3 ( ) 5 , 11 20 ( ) 5 , 11 12 (
2 2 2 2 2 2
2
− + − + − + − + − + −
· s
50 , 55
5
25 , 30 25 , 12 25 , 90 25 , 72 25 , 72 25 , 0
5
) 5 , 5 ( ) 5 , 3 ( ) 5 , 9 ( ) 5 , 8 ( ) 5 , 8 ( ) 5 , 0 (
2 2 2 2 2 2
2
·
+ + + + +
·
+ + − + − + +
· s

Quando os dados estão associados a alguma unidade de medida o valor da variância será na
unidade de medida ao quadrado.
No caso do consumo de água de uma residência, se os dados estão em litros à variância estará
em litros ao quadrado, o que em muitos casos dificulta a interpretação.
Para facilitar os cálculos e evitar que sejam feitas muitas aproximações dos desvios
apresentamos uma outra fórmula para o cálculo da variância.
) 1 ( ) ( 2 ] ) ( 2 [ ) ( que Temos
2 2
1
2 2 2
equação x x x x x x x x x x
i i i i ∑ ∑ ∑ ∑ ∑
+ − · + + · −
) 2 ( ) ( 2 2 que temos , 2 2 como
2
equação x n x x x n x e x x x x
i i i i ∑ ∑ ∑ ∑
· · ·
) 3 ( ) ( ) ( como
2 2
quação e x n x

·
Substituindo em (1) os valores de (2) e (3) vem:
2
2 2 2 2 2 2
i
2
i
) ( ) ( ) ( 2 x ) (x


∑ ∑ ∑

,
_

¸
¸
− · − · + − · −
n
x
n x x n x x n x n x
i
i i
( )
1 1 1
) (
2
2
2
2
2
2


·

,
_

¸
¸

·


·





n
n
x
x
n
n
x
n x
n
x x
s
i
i
i
i
i
( )
1
2
2


·


n
n
x
x
s
i
i

Quando os dados estão tabelados e são apresentados em associação com a freqüência em que
eles aparecem, podemos adaptar a fórmula anterior para:
( )






·
1
2
2
2
i
i
i
i i
f
f
x
x f
s
31
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.4.4- Desvio Padrão
A medida de dispersão mais usada nas analises de dados é o desvio padrão,e o seu cálculo e
feito extraindo a raiz quadrada da variância.
( )
1
2


·

n
x x
s
i
ou ainda
( )
1
2
2


·


n
n
x
x
s
i
i
Da mesma forma que a variância podemos adaptar a fórmula quando os dados estão
associados a uma freqüência
( )
1
1
2
1 2


·




i
i
f
f
x
x f
s
i
Exemplo:
Calcular o desvio do conjunto de dados: 12, 20, 3, 2, 15, 17.
Como já calculamos anteriormente a variância como 50 , 55
2
· s o desvio padrão será:
45 , 7 50 , 55 · · s
Como sugestão calcule o desvio padrão do consumo de água das três residências na tabela
anterior e compare os resultados.
Em muitas situações praticas é necessário fazer uma estimativa para ao desvio padrão e uma
sugestão de alguns autores especializados é estimar o desvio padrão como sendo um quarto
da amplitude.
4
amplitude
s ·
O ideal mesmo é calcular o desvio padrão, pois como sabemos, a amplitude só leva em
consideração os extremos de um conjunto de dados.
Exemplo:
Calcular o desvio padrão, correspondente as estaturas de um grupo de 40 alunos de uma
determinada escola, apresentados na tabela a seguir
Calcular o desvio padrão dos dados a seguir:
32
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
i ESTATURAS
(cm)
FREQUÊNCIA
( )
i
f
xi
i i
x f
2
i i
x f
1 150|------154 4 152 608 92416
2 154|------158 9 156 1404 219024
3 158|------162 11 160 1760 281600
4 162|------166 8 164 1312 215168
5 166|------170 5 168 840 141120
6 170|------174 3 172 516 88752
Total 40 6440 1038080
Observem que na tabela foi acrescentada a coluna
2
i i
x f para ajudar nos cálculos e utilizar a
fórmula associada com as freqüências que os dados são apresentados
cm s 64 , 5 80 , 31 25921 25952
39
40
6440
1038080
2
· · − ·

·
6.4.5- Coeficiente de variação
C.V. %=
s
 X
˙
100
Note que coeficiente de variação é expresso em porcentagem, ele é útil para comparar a
variabilidade de diferentes conjuntos de valores.
Exemplo: Desejamos analisar a variabilidade das notas de matemática de duas turmas, a
turma A e a Turma B. Foram calculadas a média e o desvio podrão de cada turma:

X
A
=7,5 ,
s
A
=1,6
e

X
B
=7,9
e
s
B
=2,3
. Qual das duas turmas apresentou maior variabilidade nas
notas?
C.V.
A
=
1,6
7,5
˙
100=21,33 % e C.V.
B
=
2,3
7,9
˙
100=29,11 %

Concluímos que a turma B tem uma maior variabilidade nas notas pois o seu coeficiente de
variação é maior.
33
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.5- INTERPRETAÇÃO A RESPEITO DA MÉDIA E DO DESVIO
PADRÃO
Quando a distribuição de um conjunto de dados se aproxima de uma distribuição normal, ou
seja, a curva de freqüência tem o formato de um sino, valem as seguintes regras empíricas
para estes dados.
• Cerca de 68% destes dados estão a menos de 1 desvio padrão a contar da
média.
• Cerca de 95% destes dados estão a menos de 2 desvio padrão a contar da
média.
• Cerca de 99,7% destes dados estão a menos de 3 desvio padrão da média.
OBS: As medidas estatísticas apresentadas nesse capítulo estão calculadas tendo
como referencia uma amostra, que tem como norma a representação pelas letras
do nosso alfabeto. No caso das medidas calculadas tendo como referencia uma
população, a representação será com letras do alfabeto Grego. Além disso, na
variância populacional, a SQD será divido por n.
( )
n
x x
i ∑

·
2
2
σ
e
n
x
i ∑
· µ
7- BOXPLOTS
O Boxplot é um resumo esquemático usado para descrever as características mais
proeminentes de um conjunto de dados que incluem: centro, dispersão, extensão e a natureza
de qualquer desvio em relação à simetria e a identificação de outliers, observações que
normalmente esta distantes da maior parte dos dados. Como apenas um outlier pode afetar
drasticamente os valores da média e do desvio-padrão um boxplot é baseado em medidas
“resistentes” à presença de alguns outliers. Para traçar um boxplot precisamos calcular o
valores máximo e mínimo de um conjunto de dados, assim como mediana, primeiro quartil e
terceiro quartil.
Exemplo:
Considere o seguinte conjunto de dados:
40 52 55 60 70 75 85 90 90 92 94 94 95 98 100 115 125 125
34
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
O resumo dos cinco medidas segue:
Min x
i
=40 Q
1
=72,5
Me=90
Max x
i
=125 Q
3
=96,5
O boxplot é esquematizado a a seguir:
7.1- Outliers
Para detectar a presença de outliers, são usados os seguintes critérios:
1) O valor de uma variável x
i
é considerada um outliers moderado se:
Q
1
−3,0 f x
i
Q
1
−1,5 f
ou
Q
3
1,5 f x
i
Q
3
3,0 f
, sendo
f =Q
3
−Q
1
2) O valor de uma variável
x
i
é considerada um outliers extremo se:
x
i
Q
1
−3,0 f
ou
x
i
Q
3
3,0 f
, sendo f =Q
3
−Q
1
Exemplo:
Identificar a existência ou não de outliers e traçar o boxplot dos dados a seguir
5,3 8,2 13,8 74,1 85,3 88,0 90,2 91,5 92,4 92,9 93,6 94,3 94,8
94,9 95,5 95,8 95,9 96,6 96,7 98,1 99,0 101,4 103,,7 106,0 113,5
Os indica relevantes são:
Min x
i
=5,3 Q
1
=90,2
Me=94,8 1,5 f =9,75
Max x
i
=113,5 Q
3
=96,7 f =96,7−90,2=6,50 3,0 f =19,50
Dessa foram, qualquer observação menor que 90,2-9,75=80,45 ou maior que
96,75+9,75=106,5 é um outlier. Há um outlier extremidade superior da amostra e quatro na
extremidade inferior. Como 90,2-19,5=70,7, as três observações 5,3; 8,2 e 13,8 são outliers
35
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
extremos, enquanto 74,1 e 113,5 são outliers moderado.7.2 Boxplots
comparativos
Um boxplot comparativo ou lado a lado é uma forma muito eficiente de revelar semelhanças e
diferenças entre dois ou mais conjunto de dados constituindo de observações da mesma
variável.
Exemplo: Os dados a seguir correspondem as notas de estatística de duas turmas:
Turma A: 6,0 7,0 8,0 9,0 5,0 6,5 7,5 8,7 5,5 6,0 5,5
Turma B: 2,0 3,0 9,0 5,0 10,0 7,0 8,0 4,0 9,5 3,5 2,0
A seguir está esquematizado o boxplot comparativo da varável nota de estatística na duas
turma A e B.
Observe que a turma B apresentou um dispersão maior que a a turma A, pois a distância entre
os quartis 1 e 3 é maior.
36
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
8 -REGRESSÃO E CORRELAÇÃO
A regressão e a correlação são duas técnicas estritamente relacionadas que envolvem
uma forma de estimação. Mais especificamente, a analise de correlação e regressão
compreende a análise de dados amostrais para saber se e como duas ou mais variáveis estão
relacionadas uma com a outra numa população.
O nosso objetivo será o estudo de situações que envolve duas variáveis. O coeficiente
de correlação é um número que resume o grau de relacionamento entre duas variáveis. A
analise de regressão tem como resultado uma equação matemática que descreve o
relacionamento entre as variáveis. Esta equação pode ser usada para estimar valores futuros
de uma variável quando se conhecem ou supõem conhecidos valores da outra variável.
Uma regressão linear, constitui uma tentativa de estabelecer uma equação
matemática linear que descreve o relacionamento entre duas variáveis. Duas importantes
características da equação linear são: o coeficiente angular “a” e o coeficiente linear “b” da
reta. Uma equação linear tem a forma y = ax + b e a seguinte representação gráfica:
x
y
a


·
O processo mais simples para verificar se duas variáveis se relaciona em situações que
aproximam de um modelo linear, consiste em plotar estas variáveis e verificar se uma relação
linear parece razoável.
37
x
x ∆
b
y ∆
y
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
8.1. Coeficiente de correlação linear
O instrumento empregado para medir a correlação linear é o coeficiente de correlação. Esse
coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis x e y , e,
ainda , o sentido dessa correlação (positivo ou negativo).
O coeficiente de correlação que usaremos é o coeficiente de correlação de Pearson,
que é dado por:
( )( )
( ) ( )
∑ ∑ ∑ ∑
∑ ∑ ∑
− −

·
] ][ [
2
2
2
2
y y n x x n
y x xy n
r
onde n é o número de observações.
Assim para tirarmos algumas conclusões significativas sobre o comportamento simultâneo das
variáveis analisadas temos as seguintes situações:
Se r = 1, a correlação entre duas variáveis é perfeita e então positiva
Se r=-1, a correlação entre duas variáveis é perfeita e então negativa
Se r=0, não correlação entre as variáveis.
Se
1 | | 6 , 0 ≤ ≤ r
, há uma correlação significante entre as variáveis.
Se 6 , 0 | | 3 , 0 ≤ ≤ r , há uma correlação relativamente fraca entre as variáveis.
Se
3 , 0 | | 0 < < r
, a correlação é muito fraca e praticamente, nada podemos concluir sobre a
relação entre as duas variáveis em estudo.
38
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
8.2.Regressão
O método mais usado para ajustar uma linha reta a um conjunto de pontos é conhecido
como o técnica dos quadrados mínimos.
Os valores de a e b para a reta y = ax + b que minimiza a soma dos quadrados
mínimos são as soluções das chamadas equações normais:
∑ ∑ ∑
∑ ∑
+ ·
+ ·
) ( ) (
) (
2
x b x a xy
nb x a y
onde n é o número de observações.
donde tiramos que:
x a y
n
x a y
b
x x n
y x xy n
a
− ·

·


·
∑ ∑
∑ ∑
∑ ∑ ∑
2 2
) ( ) (
) )( ( ) (
Exercícios
A tabela abaixo relaciona o número de moradores por residência e o consumo mensal de água
em uma amostra de dez residências de uma determinada cidade.
Nº Número de
moradores
Xi
Consumo
(1000 litros)
Yi
XiYi Xi
2
Yi
2
01 2 20
02 3 30
03 4 35
04 2 25
05 5 35
06 6 35
07 3 20
08 4 15
09 5 30
10 6 40

1) Completar a tabela.
2) Determinar o coeficiente de correlação:
39
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
( ) [ ] ( ) [ ]
·
− −

·
∑ ∑ ∑ ∑
∑ ∑ ∑
2
2
2
2
Y Y n X X n
Y X XY n
r
3)Classificar a correlação
4) Construir o diagrama de dispersão
Fazer a analise de regressão linear é descrever, através de um modelo matemático da forma
y=ax+b , a relação entre as duas variáveis.
5) Determinar o valor de a:
( )
∑ ∑
∑ ∑ ∑


·
2
2
X X n
Y X XY n
a
=
6) Determinar o valor de b:
X a Y b − ·
=
Escrever a equação de regressão: Y= aX +b =.........................
Traçar no diagrama de dispersão do item 4 o gráfico da equação de regressão
Estime qual deverá ser o consumo de água de uma residência que tem 3 moradores.
40
Y
X
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
9-EXERCÍCIOS
1. Uma loja vende cinco produtos básicos A, B, C, E. O lucro por unidade comercializada
destes produtos vale respectivamente $200,00; $300,00 $500,00 $1.000,00; $5.000,00. A
loja vendeu em determinado m6es 20, 30, 20, 10 e 5 unidades respectivamente. Qual foi o
lucro médio por unidade comercializada por esta loja?
2. O desvio padrão pode ser zero? Explique.
3. Calcule a média e a variância e desvio padrão para os seguinte conjunto de dados,
supondo que eles representem:
83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95
4. Qual seria o efeito sobre a média de um conjunto de números se adicionasse 10:
a) a um dos números. b) a cada um dos números
5. Para duas emissões de ações ordinária de um industria eletrônica, o preço médio diário, no
fechamento dos negócios, durante um período de um mês, para as ações A, foi de
R$150,00 com desvio padrão de R$5,00. Para as ações B, o preço médio foi de R$50,00
com desvio padrão de R$3,00. Nessas condições qual ação teve o seu preço mais estável
nesse período?
6. Os dados a seguir correspondem a vida útil em horas de duas marcas diferentes de
ferramentas de corte em um processo industrial
Marca A:
123 120 100 25 50 70 100 25 60 47
Marca B:
70 90 85 90 80 82 90 70 85 88
a) Determine a vida útil média, mediana e o desvio padrão de cada uma das diferentes
marcas.
b) Se você fosse comprar ferramentas, qual das duas marcas você compraria? Porque?
41
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
7. Uma população encontra-se dividida em três estratos, com tamanho, respectivamente
n1=40, n2=100 e n3=60. Sabendo que, ao ser realizada uma amostragem estratificada
proporcional, nove elementos da amostra foram retirados do 3º estrato, determine o
número total de elementos da amostra.
8. Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em um
determinado dia, obtendo os seguintes saldos em dolares:
52.500,00 18.300,00 35.700,00 43.800,00 22.150,00
6.830,00 3.250,00 17.603,00 35.600,00 7.800,00
16.323,00 42.130,00 27.606,00 18.350,00 12.521,00
25.300,00 31.452,00 39.610,00 22.450,00 7.380,00
28.800,00 21.000,00 14.751,00 39.512,00 17.319,00
Agrupe, por freqüência, estes dados.
A tabela abaixo corresponde a notas de estatística atribuídas a 44 alunos da turma A de
uma determinada Faculdade .
CLASSES notas fi Fi fci Xi fi.Xi fixi
2
1 0 |----- 2 5 5
2 2 |----- 4 13 24
3 4 |----- 6 27 70
4 6 |----- 8 30
5 8 |----- 10 44 126
TOTAL 246
Complete a tabela acima e:
a) Construa o Histograma.
b) Construa e a curva de freqüência.
c) Determine o percentual de alunos que conseguiram notas entre 2e 6.
d) Determine a média das notas.
e) Calcular a nota modal.
f) O professor determinou que os alunos que conseguiram nota inferior a mediana,
farão uma prova de recuperação. Qual é a nota mediana?
g) O professor determinou que o grupo formado pelos alunos que obtiveram as
10% melhores notas irão ajudar na recuperação do grupo alunos que obtiveram
as 15% piores notas. Determinar a nota mínima que estabelece as 10%
melhores notas e a nota máxima que estabelece as 15% piores notas.
42
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
h) Calcular o quartil 3.
i) Calcular a variância e o desvio padrão.
j) Se o professor errou a nota de três alunos, tendo que acrescentar 0,5 pontos a
cada nota, qual será a nova média da turma?
k) Se um aluno tirou uma nota 2,5, esta nota poderá ser considerada normal nesse
contexto?
l) Qual o percentual de alunos que tiraram notas superiores a 5,5?
10.Um grupo de 85 moças tem estatura média de 160,6 cm com desvio padrão igual a
5,79cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm sendo o desvio
padrão igual à 6,01 cm. Qual o coeficiente de variação de cada um dos grupos? Qual o
grupo mais homogêneo?
11.Um produtor mediu o tempo (em minutos) de uso diário da Internet por seus assinantes.
Com os dados obtidos construí-se o seguinte histograma:
a) Que porcentagem do total de assinantes fica entre meia hora e uma hora e meia na
rede
b) Qual a média, a mediana e a moda do tempo de uso da internet?
c) Construa a curva de freqüência
d) Calcular o desvio-padrão de tempo de usa da internet.
e) Calcular
Q
1
e P
70
f) Calcular o percentual de assinantes que usam mais de 130 minutos de internet
diariamente.
12.Observando os dados da tabela abaixo:
43
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
a) Agrupe os dados relativos à telefonia fixa em classes de amplitude 6, a partir de 6. Em
seguida, calcule a média e o desvio padrão dos dados agrupados.
b) Agrupe os dados relativos à telefonia móvel em classes de amplitude 6 a partir de 3.
Em seguida, calcule a média e os desvio padrão dos dados agrupados.
c) Suponha que, num levantamento posterior, cada valor da tabela relativo à telefonia fixa
tenha aumentado 15% e, para a telefonia móvel, esse aumento tenha sido de 10%.
Admita, ainda, que os limitantes de cada intervalo dos itens anteriores tenham
aumentado na mesma proporção. Quais serão, então, a nova média e a nova variância
das variáveis em questão?
13.Os dados a seguir representam o número de passageiros que viajaram sem o pagamento
de passagem, em uma determinada linha de ônibus urbano, num período de 40 dias, entre
as 8 e 9 horas da manhã.
0 1 0 2 3 0 0 1 2 3
5 5 0 1 1 2 3 5 5 1
2 1 5 0 1 2 2 3 5 1
1 1 0 0 0 2 2 5 5 2
Pede-se:
Construir uma tabela de distribuição de freqüência.
44
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
a) Traçar o histograma.
b) Calcular a Média.
c) Calcular a Moda.
d) Calcular a Mediana.
e) Quartil 1
f) Calcular o desvio padrão.
g) Se em um determinado dia 7 passageiros não pagaram passagem, este
resultado poderá ser considerado normal neste contexto?
14.Numa classe com 20 alunos as notas do exame final podiam variar de 0 a 100 e a
nota mínima para aprovação era 70. realizado o exame, verificou-se que oito alunos
foram reprovados. A média aritmética das notas desses oitos alunos foi 65,
enquanto a média dos aprovados foi 77.
Após a divulgação dos resultados, o professor verificou que uma questão havia sido
mal formulada e decidiu atribuir 5 pontos a mais para todos os alunos. Com essa
decisão, a média dos aprovados passou a ser 80 e a dos reprovados 68,8.
a)Calcule a média aritmética das notas das notas da classe toda antes da atribuição
dos cinco pontos extras.
b)Com a atribuição dos cinco pontos extras, quantos alunos, inicialmente
reprovados, atingiram nota para aprovação?
15.Certa empresa, estudando a variação de demanda de seu produto em relação à variação de
preço de venda, obteve a tabela:
Preço (X) 38 42 50 56 59 63 70 80 95 110
Demanda (Y)
)(yi)
350 325 297 270 256 246 238 223 215 208
Determine o coeficiente de correlação.
a) Estabeleça a equação da reta ajustada.
b) Estime Y para X =60 e X=120
A tabela abaixo representa a produção de uma industria:
ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988
QUANTIDA
DE (t)
34 36 36 38 41 42 43 44 46
Calcule:
a) O coeficiente de correlação;
Sugestão: par simplificar os cálculos, use para o tempo um variável auxiliar, por exemplo
X’ = X –1984
b) A resta ajustada;
c) A produção estimada para 1989
45
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
CAPÍTULO 2
Estatística com OpenOffice
1.Planilhas Eletrônicas
Planilhas eletrônicas são Softwares concebidos prioritariamente para se efetuarem cálculos que
envolvam variáveis. Com elas podem-se utilizar várias funções matemáticas, com destaque
para aquelas relacionadas com cálculos e representações de funções, Estatística e Matemática
Financeira. Hoje, são várias as possibilidades de escolha de planilhas eletrônicas, desde as
pagas, como o Excel da Microsoft, até as de uso livre, como o OpenOffice. Apesar do primeiro
ser, sem dúvida, o mais conhecido e utilizado, seja em aplicações domésticas ou em
empresas, o segundo destaca-se pela sua eficiente qualidade, pela similaridade com o Excel e,
principalmente, por ser gratuito e, por esse fato, foi o escolhido para ser utilizado neste
trabalho.
2.Trabalhando com o OpenOffice
O OpenOffice é um programa de planilha eletrônica, desenvolvido pela Sun Microsystems Inc.
e aperfeiçoado por usuários de várias comunidades espalhadas pelo mundo que roda em várias
plataformas, Windows e Linux entre outras. Nos últimos anos, assim como todas as aplicações
informáticas, tem passado por aperfeiçoamentos e ajustes visando maior usabilidade e
aproveitamento do desenvolvimento dos computadores. Neste material utilizaremos o
BrOffice.org 2.0, desenvolvido por FILHOCFFILHOCF com base no OpenOffice.org..
Não há, neste trabalho, a pretensão de oferecer um curso de OpenOffice, somente serão
mostrados recursos básicos que possam auxiliar as aplicações de Estatística básica. Assim,
serão mostradas, sempre em forma de aplicações, estratégias para o trabalho com: construção
de tabelas com dados simples e agrupados por classes, construção de gráficos de colunas e de
setores, construção de histogramas, construção de box-plot e regressão linear.
46
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
O ambiente de trabalho
Figura 1.
A área de trabalho do Microsoft OpenOffice

2.2. As funções no OpenOffice
São várias as formas de inserção de funções (operações matemáticas) no OpenOffice, entre
elas:
a) Utilizando os menus ou submenus selecionados na Barra de menus, clicando com o
mouse, ou recorrendo a teclas de atalho.
47
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Figura 2.
Criação de função pelo menu Inserir
b) Clicando no ícone correspondente da linha de entrada.
Figura 3.
Criação de função pelo ícone
c) Simplesmente digitando = dentro da célula selecionada e escolhendo uma função entre a
lista que será apresentada.
Figura 4.
Criação de função pela caixa de nome
48
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Nos dois primeiros casos será aberto o quadro Assistente de Funções que apresenta uma
série de funções para serem escolhidas. As funções estão classificadas por categoria conforme
mostrado a seguir:
Figura 5.
A caixa assistente de função
Para cada categoria escolhida, o menu apresenta as diferentes funções, bem como uma breve
descrição da função escolhida e da sua sintaxe.
Após a seleção da função desejada, você poderá digitar a fórmula no quadro Fórmula ou clicar
em Próximo para que os argumentos necessários sejam inseridos. Após a inserção, basta
clicar em OK.
Figura 6.
Argumentos da função
49
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Cabe lembrar que, a partir do momento que a forma de escrita e posicionamento dos diversos
elementos estiverem incorporadas pelo usuário, estes comandos poderão ser digitados
diretamente na célula, o poupando, assim, de ter que passar por todas estas etapas. Bastará,
então, digitar o sinal de igualdade (=) para que o OpenOffice entenda que é uma função e, em
seguida, inserir os comandos. Esta inserção poderá ocorrer tando diretamente na célula quanto
na linha de entrada.
Figura 7.
Inserção de função diretamente na célula
3.Construção de tabelas
Para compreendermos o processo de construção de tabelas de dados com o auxílio do
OpenOffice é necessário que separemos as variáveis em dois grupos: 1º grupo – as variáveis
qualitativas e as quantitativas discretas e 2º grupo – as quantitativas contínuas. Vamos
realizar os estudos a partir de exemplos práticos.
3.1 Grupo (variáveis qualitativas e variáveis
quantitativas discretas)
As variáveis tratadas nesse grupo são aquelas que não exigem agrupamentos de dados.
Vamos observar como seria construída uma tabela para representar os seguintes resultados de
uma pesquisa:
50
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
3.1.1.Freqüência absoluta
A freqüência absoluta é calculada com o
auxílio da função CONT.SE. Esta função
calcula a quantidade de células, dentro de
um intervalo, que contenham um
parâmetro desejado. Este parâmetro pode
ser um número, uma palavra, uma
expressão, etc.
51
Retorna o número de elementos que atendem a
determinados critérios dentro de um intervalo de célula.
Sintaxe
CONT.SE(intervalo;critérios)
Intervalo   é o intervalo ao qual os critérios deverão ser
aplicados.
Critérios   indica os critérios na forma de um número,
uma expressão ou uma seqüência de caracteres. Esses
critérios determinam quais células serão contadas. Você
também pode inserir um texto de pesquisa na forma de
uma expressão regular, por exemplo, "b.*" para todas as
palavras que começam com b. Também é possível indicar
um intervalo de células que contém o critério de
pesquisa. Se você quiser pesquisar um texto literal,
coloque o texto entre aspas duplas.
CONT.SE
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Acompanhe as instruções a seguir:
3.1.2.Freqüência relativa
Para se calcular a freqüência relativa há a
necessidade de introduzir a função SOMA.
Esta função soma uma seqüência de
valores numéricos ou uma série de
números isolados. Será utilizada para
totalizar as freqüências absolutas.
52
Adiciona todos os números em um intervalo de células.
Sintaxe
SOMA(número1; número 2; ...; número 30)
O parâmetro Número de 1 a 30 representa até 30
argumentos cuja soma deverá ser calculada.
Exemplo
Se você inserir os números 2, 3 e 4 nas caixas de texto
Número 1, Número 2 e Número 3, 9 será retornado como
resultado.
SOMA(A1;A3;B5) calcula a soma das três células.
SOMA (A1:E10) calcula a soma de todas as células do
intervalo de A1 a E10.
SOMA
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Acompanhe as instruções a seguir:
O Cálculo das freqüências relativas é feito com uma simples divisão, observe:
As freqüências relativas podem ser somadas utilizando o procedimento 2. Lembre-se que esse
total deve dar 1 (um), que equivale a 100%.
Perceba que os valores obtidos aparecem com duas casas decimais. Caso deseje utilizar menos
ou mais casas decimais poderá conseguir isto selecionando as células que deseja modificar e
clicando no botão (adicionar casa decimal) ou (excluir casa decimal) até obter a
quantidade de casas decimais desejada. Caso queira exprimir as freqüências relativas na forma
percentual basta selecionar as células desejadas e clicar no botão (porcentagem). Sua
tabela poderá ficar assim:
53
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Figura 8.
Tabela de distribuição de freqüências do estado civil
A grande vantagem de se ter uma tabela no OpenOffice é o dinamismo em sua operação.
Experimente alterar os resultados da pesquisa, trocando, por exemplo, solteiro por casado e
verifique o que ocorre com a tabela. Isso nos dá praticidade na hora de alterar algum valor
que tenha sido introduzido de forma equivocada.
3.2. Grupo (variáveis quantitativas contínuas)
As variáveis tratadas nesse grupo são aquelas que exigem agrupamentos de dados. Vamos
observar como seria construída uma tabela para representar os seguintes resultados de uma
pesquisa:
54
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
3.2.1 Intervalos de Classes
Para definir os intervalos de classes
precisaremos encontrar os valores máximo e
mínimo, utilizando as funções MAIOR e
MENOR, respectivamente.
Acompanhe as instruções a seguir:
Para determinar o Número de classes, a Amplitude de classe calculada, a Amplitude classe
adotada, o Limite inferior e o Limite superior, utilizaremos fórmulas matemáticas simples
55
Retorna o maior valor na posição_c de um conjunto de
dados.
Sintaxe
MAIOR(Dados; Posição_c)
Dados é a matriz de dados da amostra aleatória.
Posição_c é a posição do valor.
Exemplo
=MAIOR(A1:C50; 2) retornará o segundo maior valor do
intervalo de células A1:C50.
MAIOR
etorna o menor valor na posição_c de um conjunto de
dados.
Sintaxe
MENOR(Dados; Posição_c)
Dados é a matriz de dados da amostra aleatória.
Posição_c é a posição do valor.
Exemplo
=MENOR(A1:C50; 2) retornará o segundo menor valor
do intervalo de células A1:C50.
MENOR
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
utilizando apenas as quatro operações fundamentais (adição, subtração, multiplicação e
divisão)
Acompanhe as instruções a seguir:
3.2.2 Freqüência absoluta
Para calcular a freqüência absoluta novamente utilizaremos a função CONT.SE para calcular a
quantidade de células, dentro de um intervalo, que contenham o parâmetro desejado. O
parâmetro, desta vez, ser uma desigualdade, já que precisaremos estabelecer uma série de
valores que atendam a certo intervalo.
Acompanhe as instruções a seguir:
56
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
3.2.3 Freqüência relativa
A freqüência relativa é calculada utilizando-se a função SOMA. E operações de divisão..
Acompanhe as instruções a seguir:
57
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
O Cálculo das freqüências relativas é feito com uma simples divisão, observe:
As freqüências relativas podem ser somadas utilizando o procedimento 4. Lembre-se que esse
total deve dar 1 (um), que equivale a 100%.
Perceba que os valores obtidos aparecem com duas casas decimais. Caso deseje utilizar menos
ou mais casas decimais poderá conseguir isto selecionando as células que deseja modificar e
clicando no botão (adicionar casa decimal) ou (excluir casa decimal) até obter a
quantidade de casas decimais desejada. Caso queira exprimir as freqüências relativas na forma
percentual basta selecionar as células desejadas e clicar no botão (porcentagem). Sua
tabela poderá ficar assim:
Figura 9.
Tabela de distribuição de freqüências das idades
A grande vantagem de se ter uma tabela no OpenOffice é o dinamismo em sua operação.
Experimente alterar os resultados da pesquisa, trocando, por exemplo, uma ou mais idades e
verifique o que ocorre com a tabela. Isso nos dá praticidade na hora de alterar algum valor
que tenha sido introduzido de forma equivocada.
58
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
EXERCÍCIO DE APLICAÇÃO
Seja a tabela de dados brutos abaixo relativa aos salários dos operários da Empresa “X”:
Construir uma tabela de distribuição de freqüências no seguinte modelo:
Remuneração dos operários da Empresa “X” – julho de 2000
Salários-hora (R$)
Freqüência
ni
Freqüência
Acumulada
Ni
Freqüência
Relativa
fi
Freq.
Relativa
Acumulada
Fi
06 |÷ 08
08 |÷ 10
10 |÷ 12
12 |÷ 14
14 |÷ 16
16 |÷ 18
18 |÷ 20
20 |÷ 22
Total
Fonte: Departamento Pessoal
59
Operário
Salário
hora
Operário
Salário
hora
Operário
Salário
hora
Operário
Salário
hora
Operário
Salário
hora
Operário
Salário
hora
Operário
Salário
hora
1 11,60 21 21,66 41 15,86 61 16,41 81 14,03 101 15,38 121 6,69
2 14,22 22 18,12 42 16,89 62 10,14 82 16,20 102 11,62 122 10,47
3 15,55 23 7,80 43 14,24 63 21,07 83 9,91 103 21,45 123 7,39
4 15,87 24 12,33 44 16,42 64 10,41 84 11,46 104 10,60 124 18,97
5 10,33 25 17,80 45 16,34 65 20,47 85 20,72 105 16,55 125 15,79
6 7,48 26 20,89 46 21,76 66 10,46 86 9,48 106 14,64 126 14,74
7 6,04 27 19,08 47 20,28 67 12,68 87 18,62 107 12,03 127 13,55
8 13,57 28 20,25 48 9,38 68 15,34 88 13,73 108 14,51 128 18,65
9 21,67 29 15,21 49 9,13 69 17,85 89 10,59 109 10,27 129 9,27
10 16,46 30 6,05 50 17,68 70 15,69 90 12,06 110 11,95 130 12,08
11 17,27 31 9,18 51 9,89 71 15,66 91 15,44 111 20,33 131 14,35
12 19,91 32 20,31 52 8,06 72 14,51 92 6,09 112 21,87 132 19,31
13 10,88 33 10,90 53 12,06 73 11,91 93 15,43 113 16,26 133 21,47
14 6,83 34 6,61 54 19,81 74 10,99 94 20,55 114 15,01 134 6,71
15 15,75 35 6,73 55 11,36 75 16,37 95 14,64 115 16,24 135 19,45
16 8,70 36 15,50 56 18,08 76 6,98 96 21,54 116 6,44 136 13,06
17 12,73 37 9,21 57 16,62 77 11,05 97 20,90 117 7,05 137 20,97
18 13,93 38 9,83 58 20,58 78 10,74 98 8,04 118 16,95 138 10,21
19 12,69 39 9,29 59 10,87 79 21,33 99 10,64 119 8,13 139 10,07
20 18,70 40 15,20 60 6,57 80 8,53 100 7,68 120 19,65 140 16,41
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
4.Construção de gráficos
Assim como foi feito para o processo de construção de tabelas de dados também estudaremos
os gráficos separadamente por grupos. Nos limitaremos, neste trabalho, a estudar três tipos
de gráficos: Gráfico de colunas, Gráfico de setores (pizza) e Histograma. Vamos realizar os
estudos a partir das tabelas construídas no item 3.
4.1.Gráficos de colunas
Os gráficos de colunas são muito utilizados para representação de pesquisas divulgadas na
imprensa em geral. São aplicados, principalmente, para representação de dados qualitativos e
quantitativos discretos. Vamos observar como seria construído um gráfico para representar os
seguintes resultados de uma pesquisa:
Figura 10.
Tabela de distribuição de freqüências do estado civil
Após a obtenção da tabela de freqüências pode-se obter com facilidade o diagrama de colunas,
através do Assistente de Gráficos. Acompanhe as instruções a seguir:
Marque um trecho da planilha, onde será inserido o gráfico. O quadro seguinte surgirá na tela:
60
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Clique em Próximo >> e surgirá:
Selecione o tipo de gráfico desejado (no caso, colunas) e marque Mostrar elementos do
texto na visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e
surgirá:
Selecione Eixo Y, caso deseje visualizar linhas horizontais e escolha como quer o seu gráfico.
Ao fazer uma nova escolha o seu gráfico será mostrado no quadro à esquerda, assim poderá
escolher o estilo que mais lhe interessar. Clique em Próximo >> e surgirá:
61
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a
legenda apareça ou não. Clique em Criar e o seu gráfico estará pronto.
Com um clique duplo no gráfico você entrará no modo de edição do gráfico. Clicando o botão
direito do mouse sobre o gráfico será disponibilizado um Menu que permitirá algumas
modificações na formação, você poderá modificar cores e outros elementos do gráfico. Por
exemplo, ele poderá assumir a seguinte forma:
Experimente modificar algum dado da tabela, você perceberá que o gráfico se alterará
automaticamente.
62
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
4.2.Gráficos de setores (tipo Pizza)
Os gráficos de setores, assim como os de colunas, são aplicados, principalmente, para
representação de dados qualitativos e quantitativos discretos. Utilizaremos a mesma pesquisa
utilizada para construir o gráfico de colunas:
Marque um trecho da planilha, onde será inserido o gráfico. O quadro seguinte surgirá na tela:
Clique em Próximo >> e surgirá:
63
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Selecione o tipo de gráfico desejado (no caso, setores) e marque Mostrar elementos do
texto na visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e
surgirá:
Ao fazer uma nova escolha o seu gráfico será mostrado no quadro à esquerda, assim poderá
escolher o estilo que mais lhe interessar. Clique em Próximo >> e surgirá:
Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a
legenda apareça ou não. Clique em Criar e o seu gráfico estará pronto.
Dê um clique duplo sobre o gráfico, e novamente sobre cada uma das fatias. Escolha a aba
Rótulo de dados e marque em Mostrar valor com porcentagem e será exibido o valor
percentual de cada uma das fatias.
64
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Com um clique duplo no gráfico você entrará no modo de edição do gráfico. Clicando o botão
direito do mouse sobre o gráfico será disponibilizado um Menu que permitirá algumas
modificações na formação, você poderá modificar cores e outros elementos do gráfico. Por
exemplo, ele poderá assumir a seguinte forma:
Experimente modificar algum dado da tabela, você perceberá que o gráfico se alterará
automaticamente.
4.3.Histograma
Os histogramas são aplicados, principalmente, para representação de dados quantitativos
contínuos. Vamos observar como seria construído um gráfico para representar os seguintes
resultados de uma pesquisa:
65
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Figura 11.
Tabela de distribuição de freqüências das idades
Após a obtenção da tabela de freqüências pode-se obter com facilidade o histograma, através
do Assistente de Gráficos. Acompanhe as instruções a seguir:
Marque um trecho da planilha, onde será inserido o gráfico. O quadro seguinte surgirá na tela:
Clique em Próximo >> e surgirá:
66
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Selecione o tipo de gráfico desejado (no caso, colunas) e marque Mostrar elementos do
texto na visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e
surgirá:
Selecione Eixo Y, caso deseje visualizar linhas horizontais e escolha como quer o seu gráfico.
Ao fazer uma nova escolha o seu gráfico será mostrado no quadro à esquerda, assim poderá
escolher o estilo que mais lhe interessar. Clique em Próximo >> e surgirá:
Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a
legenda apareça ou não. Clique em Criar e o seu gráfico estará pronto.
67
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Perceba que há certas limitações quanto ao histograma o formato do gráfico, as classes não
aparecem no eixo x e sim na legenda, o que mantém um bom nível de clareza nos dados.
Mudanças na formatação também podem ser feitas caso se pretenda.
5. Medidas estatísticas
Vamos agora calcular as principais medidas estatísticas das variáveis quantitativas. Para
ilustrar os cálculos, vamos considerar os dados correspondentes à idade dos moradores do
Bairro Vila da Sabedoria.

Definimos a as medidas estatísticas a serem calculadas. Digite na Célula E4 o título:
Estatística da Pesquisa. Na células E6, E7, E8, e assim por diante, escrevemos as
principais medidas que serão calculadas: Média, Mediana, Moda, Variância, Desvio-
padrão, Quartil -1, Quartil -3, Porcentil -10 e Porcentil-90
68
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5. 1. Cálculo da média
Posicione o cursor na célula E7 e clique no ícone Assistentes de Função do OpenOfice.
No Assistente de funções escolha a categoria Estatística

69
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Na categoria Estatística escolha a função MÉDIA e clique em Próximo>> e abrirá um espaço
para a escolha do intervalo de dados para o qual será calculado a média.

Pode-se escolher o intervalo de dados de duas formas: clicando no ícone a direito do primeiro
número na seqüência, abrindo o Assistente da Função Média. Em seguida selecione o
intervalo de dados para calcular a média usando o cursor do mouse

70
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Clique no ícone à direita no Assistente de Funções MÉDIA e o resultado da média será
apresentado no Assistente de Funções


Clique em OK e o valor da média será transportado para a posição do cursor na planilha.


71
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Outra forma de selecionar o intervalo de dados a ser calculado a média, é diretamente no
Assistente de Função, na caixa onde aparece a Fórmula da função media, digitando como
argumento o intervalo de células onde se encontram os dados que se deseja calcular a média.
=MÉDEIA(B1:B31) .
5.2. Cálculo das outras medidas
No cálculo da Mediana, Moda, Variância e Desvio-padrão o procedimento é o mesmo do
Cálculo da média,diferenciando apenas as funções estatísticas.
5.2.1. Mediana
MED(B2:B31)
5.2.2. Moda
MODO(B2:B31)
72
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.2.3. Variância
VAR(B2:B31) – variância de uma amostra
5.2.4. Desvio-padrão
DESVPAD(B2:B31)- desvio-padrão de uma amostra
No calculo da variância e do desvio-padrão também podem se usadas as funções VARP() e
DESPADP, quando se deseja calcular as medidas de uma população.
5.2.5. Quartil
QUARTIL(B2:B31;1 )
No caso especifico do quartil, a função exige mais um argumento, o tipo do quartil: (0-MIN; 1
-25%; 2- 50% ; 3 -75% ; 4-MAX)
73
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
5.2.6. Percentil
PERCENTIL( B2:B31 ; 0,1)
Assim como os quartil, o percentil também exige outro argumento alem do intervalo de dados,
a taxa de porcentagem entre 0 e 1


74
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
A seguir é apresentada estatística da pesquisa, calculada seguindo os procedimentos
estabelecidos.
Obs: No caso especifico da moda, apareceu o símbolo #VALOR!, pois não houve a repetição
de nenhum valor nos dados da pesquisa. Se substituíssemos o valor 21 na linha 15 ,por
32,75. o valor da moda seria 32,75.
75
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
6.Diagrama de extremos e quartis (Boxplot)
Para a construção do diagrama de extremos e
quartis, são necessárias cinco estatísticas: a
mediana, os 1º e 3º Quartis, o máximo e o
mínimo. Os valores máximos e mínimos já
foram tratados no item 3.2.1. Os demais
dados serão trabalhados nos capítulos
seguintes. No momento vamos considerar
esses valores como dados para que seja
possível a construção do Box-plot.
Após a digitação da tabela pode-se obter com facilidade o diagrama de extremos e quartis,
através do Assistente de Gráficos.
76
É um tipo de representação gráfica, em que se
realçam algumas características da amostra. O
conjunto dos valores da amostra
compreendidos entre o 1º e o 3º quartis é
representado por um retângulo (caixa) com a
mediana indicada por uma barra. Consideram-se
em seguida duas linhas que unem os lados dos
retângulos com os valores máximo e mínimo,
respectivamente.
Box Plot
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Marque um trecho da planilha, onde será inserido o gráfico. O quadro seguinte surgirá na tela:
Clique em Próximo >> e surgirá:
Selecione o tipo de gráfico desejado (no caso, linhas) e marque Mostrar elementos do texto
na visualização para visualizar como ficará seu gráfico. Escolha a série de dados em Linhas e
clique em Próximo >>, surgirá:
Selecione Eixo Y, caso deseje visualizar linhas horizontais e escolha como quer o seu gráfico.
Escolha o gráfico Empilhado com símbolos como mostrados no desenho. Clique em
Próximo >> e surgirá:
77
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Nessa tela você poderá escolher um título para o seu gráfico. Clique em Criar e o seu gráfico
estará pronto.
Algumas modificações terão que ser feitas para que tenhamos o Box-plot com sua
configuração final. Comece dando um clique duplo sobre o gráfico construído. Em seguida dê
um clique duplo sobre uma das linhas. Surgirá a caixa:
78
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Clique em selecionar e escolha símbolo quadrado em Símbolos.
Em seguida modifique o tamanho para as medidas a seguir, escolhendo a cor preta para todos
eles:
Escolha invisível para o estilo da linha e apague a caixa de legenda clicando sobre ela e
digitando a tecla delete. O seu gráfico ficará assim:
79
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Algumas mudanças nas configurações poderão deixar o gráfico assim:

7. Regressão Linear e Correlação
Até o momento, vimos técnicas estatísticas em que se estuda uma variável de cada vez,
estabelecendo-se sua distribuição de freqüência, média, desvio padrão etc. Porém, muitas
vezes é necessário estudar duas ou mais variáveis ao mesmo tempo. Por exemplo, pode-se
obter mais informações estudando peso e altura juntos do que estudando cada um
separadamente; ou ainda, renda mensal junto com gastos com livros.
Em geral, estuda-se duas variáveis ao mesmo tempo com o objetivo de determinar se há
alguma relação entre elas e, se houver, qual o tipo de relação. Pode-se, por exemplo,
pesquisar uma relação entre idade e tempo de sobrevida em casos de cirurgia, ou procurar
saber que tipo de relação (linear, exponencial ou outra) existe entre tempo de permanência de
um paciente num programa de atendimento domiciliar e os custos do atendimento. Outras
vezes estudam-se duas variáveis conjuntamente na expectativa de poder usar uma delas para
80
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
prever a outra. Isto é o que será tratado neste capítulo, formas de se relacionar duas variáveis
e como representá-la no OpenOffice.
7.1. Dados Bivariados
Denominaremos Dados Bivariados o par de valores correspondente a um dado indivíduo ou
resultado experimental. Para ilustrar o estudo vamos utilizar um exemplo que ilustra uma
pesquisa feita com 10 alunos na qual foram obtidos o peso (kg) e a altura (cm) de cada um
deles. Vamos observar a construção da tabela:


7.2. Diagrama de dispersão

A técnica mais simples e provavelmente mais útil para estudar a relação entre duas variáveis é
o diagrama de dispersão. Em um diagrama de dispersão, cada um dos n pares de observações
(Xi,Yi), i = 1, ..., n, é representado graficamente como um único ponto. Os Xs são colocados
no eixo horizontal (abscissa) e os Ys são colocados no eixo vertical (ordenada). Olhando para o
arranjo dos pontos no gráfico, pode-se discernir um padrão indicador da forma funcional
subjacente aos dados.
Após a digitação da tabela pode-se obter com facilidade o diagrama de dispersão, através do
Assistente de Gráficos. Acompanhe as instruções a seguir:
81
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Marque um trecho da planilha, onde será inserido o gráfico. O quadro seguinte surgirá na tela:
Clique em Próximo >> e surgirá:
Selecione o tipo de gráfico desejado (no caso, Gráfico XY) e marque Mostrar elementos do
texto na visualização para visualizar como ficará seu gráfico. Clique em Próximo >> e
surgirá:
82
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
Desmarque Eixo Y para não visualizar linhas horizontais. Ao fazer uma nova escolha o seu
gráfico será mostrado no quadro à esquerda. Clique em Próximo >> e surgirá:
Nessa tela você poderá escolher um título para o seu gráfico, bem como optar se deseja que a
legenda apareça ou não. Opte pelas opções mostradas no desenho. Clique em Criar e o seu
gráfico estará pronto. Caso apareça a mensagem:
Clique em não.
83
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
7.3. Regressão Linear Simples
Olhando para os dados da pesquisa, vemos que alguma relação existe entre eles: quanto
maior o peso, maior a altura. Estes dados podem ser visualizados no diagrama de dispersão
acima. Observe que nem todos os pontos caem exatamente sobre uma linha reta, mas a
tendência é que os valores de Y cresçam de uma maneira aproximadamente linear à medida
que os valores de X cresçam.
Isto indica que a relação entre Y e X pode ser linear e pode ser descrita por uma linha reta.
Vamos tentar determinar uma “equação” para essa reta.
7.3.1. A equação da reta
Qualquer linha reta tem a forma geral: y=axb , onde a dá a inclinação da linha e b é o
ponto onde a linha cruza o eixo Y. Para quaisquer dois pontos, é fácil determinar a linha reta
que os une; porém, para três ou mais pontos, como no caso em questão, é em geral
impossível encontrar uma linha reta que passe por todos os pontos. Neste caso, o que se tenta
fazer é encontrar a linha reta que melhor represente a configuração dos pontos. Para
encontrar a equação da reta precisamos encontrar os valores de a e b e, para isso,
utilizaremos as funções INCLINAÇÃO e INTERCEPÇÃO.
84
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
O valor de a (coeficiente angular da reta) é
calculada com o auxílio da função
INCLINAÇÃO.




O valor de b (coeficiente linear da reta) é
calculada com o auxílio da função
INTERCEPÇÃO.







Acompanhe as instruções a seguir:
85
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
7.3.2. O gráfico da reta
Vamos exemplificar logo em seguida a obtenção da reta de regressão com o OpenOffice.
Comece por resgatar o diagrama de dispersão construído.
Dê um clique duplo sobre o gráfico e, em seguido, um clique duplo sobre um dos pontos.
Surgirá o seguinte quadro:

Escolha a guia Estatísticas
86
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________


Em seguida selecione Regressão Linear em Curva de regressão.

e clique em OK. Seu gráfico deverá ficar assim:

87
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
7.4. Coeficiente de Correlação
Em geral, na análise estatística, procura-se determinar a “força” de uma relação entre duas
variáveis. A medida mais comumente usada para o grau de associação linear entre Y e X é o
chamado coeficiente de correlação.

O coeficiente de correlação pode ser
calculado com o auxílio da função CORREL.


Em alguma célula disponível digite =CORREL(A2:A11;B2:B11). Algumas mudanças nas
configurações poderão deixar seus dados assim:

88
Estatística Descritiva Oscar Luiz Teixeira de Rezende
Rony Cláudio de Oliveira Freitas
__________________________________________________________________
8-BIBLIOGRAFIA
1. TRIOLA, Mario F. Introdução a Estatística. 7ª ed – Rio de janeiro: LTC , 1999.
2. STEVENSON, William J. Estatística aplicada à administração. São Paulo: Editora
Harbra LTDA, 1988.
3. CRESPO, Antônio Armont. Estatística fácil. São Paulo: Editora Saraiva, 1996.
4. SILVA, Medeiros da Silva, SILVA, Elio Medeiros, GONÇALVES, Valter, MUROLO,
Antônio Carlos. Estatística Para os Cursos de Economia, Administração e Ciências
Contábeis. 2
a
ed, Vol 1 e 2. São Paulo: Editora Atlas S.A, 1997.
5. DEVORE, Jay L. Probabilidade e Estatística para Engenharia e Ciências. 6ª Edição,
São Paulo: Pineira Thomson Learning, 2006.
89