Você está na página 1de 63

PROBABILIDADE

E ESTATÍSTICA

DIREÇÃO ACADÊMICA COORDENAÇÃO GERAL DE EAD


Célia Jussani Sandra Regina Giraldelli Ulrich

DIREÇÃO GERAL DIAGRAMAÇÃO E ARTE FINAL


Florindo Corral Reinado Silveira Carvalho

DIREÇÃO ADMINISTRATIVA REVISÃO FINAL


Gustavo Azzolini Meire Terezinha Müller

AUTORA
Eliana Mara Oliveira Lippe
FICHA CATALOGRÁFICA
Elaborada pela Biblioteca Central da FAM

L742p Lippe, Eliana Mara Oliveira


Probabilidade e estatística / Eliana Mara Oliveira Lippe ;
diagramação e arte final de Reinaldo Silveira Carvalho ; revisão final
de Meire Terezinha Müller. -- Americana, 2015.
93 f. : il.

Apostila elaborada para a disciplina EAD Probabilidade e estatística


- Faculdade de Americana. Núcleo Geral.

1. Estatística matemática. 2. Probabilidades. I. Carvalho, Reinaldo


Silveira. II. Müller, Meire Terezinha. III. Título.

CDU 311.1

Proibida a reprodução total ou parcial por meio de impressão, em forma idêntica, resumida
ou modificada em língua portuguesa ou qualquer outro idioma

1ª edição - 2015
1ª edição, 1ª reimpressão - 2016
A Faculdade de Americana – FAM é mantida pela Associação Educacional Americanense, está
situada Endereço: Av. Joaquim Boer, 733 – Americana-SP; CEP 13477-360 e foi Credenciada pela Portaria
MEC nº 766/99 – DOU 18/05/1999.
A história da IES começou quando os dirigentes do então Colégio Bandeirantes, atual Instituto
Educacional de Americana, decidiram constituir uma nova entidade mantenedora, a Associação Educacional
Americanense, que tem como mantida a Faculdade de Americana.
O projeto de instalação da Faculdade de Americana – FAM foi resultado das condições econômico-
educacionais que a região de Americana apresenta, além de experiência dos seus dirigentes como
educadores atuantes.
A Associação Educacional Americanense entende que o ensino, a pesquisa e a extensão não
podem deixar de responder de forma dinâmica, eficiente e consequente aos problemas sociais que refletem
as necessidades da comunidade local, regional e nacional.
Para operacionalizar o projeto de criação dos cursos superiores, a entidade mantenedora consultou
especialistas das diversas áreas do conhecimento.
Assim, o projeto FAM foi idealizado com seriedade e acima de tudo com o compromisso de oferecer
a universalidade do saber: caráter substancial das instituições que justificam suas funções na comunidade
onde estão inseridas.

MISSÃO
A missão da FAM é produzir e disseminar o conhecimento nos diversos campos do saber, contribuindo
para o exercício pleno da cidadania mediante formação humanista, crítica e reflexiva, consequentemente
preparando profissionais competentes e atualizados para o mundo do trabalho presente e futuro.

VISÃO
"Tornar-se referência no ensino superior, promovendo o desenvolvimento da educação, cultura e
conhecimento nas regiões do polo têxtil e metropolitana de Campinas".

VALORES
• Ética, credibilidade e transparência;
• Visão humanista entre ensino, pesquisa e extensão;
• Compromisso social;
• Comprometimento com a qualidade;
• Gestão participativa;
• Profissionalismo e valorização de recursos humanos;
• Universalidade do conhecimento e fomento à interdisciplinaridade
Prezado (a) Aluno (a),

Seja bem-vindo (a) à FAM – Faculdade de Americana!

Sentimo-nos orgulhosos em tê-lo fazendo parte da história que estamos construindo.

Aluno ingressante, que está dando início a esta fase tão importante, ou você que dá
continuidade aos seus estudos, esteja certo de que o seu sonho é parte das nossas
metas e que estaremos trabalhando, constantemente, para torná-lo um profissional
capaz e um cidadão completo.

Uma equipe empenhada também está à sua disposição para esclarecer quaisquer
dúvidas que permaneçam em relação ao curso.

Desejamos a todos bons estudos!

PROF. FLORINDO CORRAL


Direção Geral
FAM I Faculdade de Americana
SUMÁRIO
UNIDADE 1

Amostragem 8

UNIDADE 2

Variáveis 14

UNIDADE 3

Tabela 19

Gráficos 25

UNIDADE 4

Moda 30

Média 34

Mediana 37

Quartis 40

Percentis 43
UNIDADE 5

Intervalo de Classes 46

Amplitudes de Variância 49

UNIDADE 6

Desvio Padrão 53

Coeficiente de Variação 56

Coeficiente de Correlação 60
PROBABILIDADE E ESTATÍSTICA
Unidade 1

UNIDADE 1
TEMA 1:
AMOSTRAGEM

Conteúdos e Habilidades
Nesta aula, você estudará:

• Processo de amostragem.

• Definição de população.

• Definição dos métodos de amostragem.

• Escolha da dimensão da amostra.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Defina o que é amostragem.

• Como se define o processo de amostragem?

• Quais os diversos tipos de amostragem?

• Como se define o intervalo de confiança para o P?

Leitura Obrigatória

Neste tema você verá as principais questões relacionadas à amostragem:


o que é; em que circunstância é aplicada; como determinar. A ideia é
compreender na teoria o que é o processo de amostragem e traduzi-lo
para a prática diária.

Amostragem

Qual é o primeiro ponto a se pensar quando falamos em Amostragem?


Seria relacionar esse conceito a partir de alguns itens de uma caixa que Amostragem é um conjunto de
simbolizassem o total de itens, correto? Sim! todos os elementos que se deseja
estudar.
Definimos o conceito de amostragem como um conjunto de todos
os elementos que se deseja estudar. A este conjunto denominamos
de população. Mas então como definiríamos o termo população? Seria
uma coleção de todos os possíveis elementos, objetos ou medidas de
interesse.

8
PROBABILIDADE E ESTATÍSTICA
Unidade 1

Alguns exemplos que melhor definem o termo população:

• Conjunto das rendas de todos os habitantes de São Paulo;

• Conjunto de todas as notas dos alunos de Estatística.

Como geralmente o conjunto das amostras é muito grande e dificultaria a


combinação para fazer as análises, determinou-se que pode ser utilizada
uma amostra, a fim de representar o todo que deveria ser analisado.
Como então pode ser caracterizada uma amostra? É definida como
uma porção ou parte de uma população de interesse.
Alguns exemplos que melhor definem a amostra nos dias de hoje seriam:

• Antes da eleição diversos órgãos de pesquisa e imprensa


ouvem um conjunto selecionado de eleitores para ter uma ideia
do desempenho dos vários candidatos.

• IBGE faz levantamentos periódicos sobre emprego, desemprego,


inflação, etc.

• Em pesquisas científicas, pesquisadores utilizam deste recurso


para determinar a performance reprodutiva dos animais.

Existe alguns riscos de amostragem O risco é decorrência da


Amostra é uma porção ou parte de
quantidade das amostras analisadas. Pequenas quantidades analisadas
uma população de interesse.
podem não ser representativas do todo que deveria ser analisado. A
teoria da probabilidade pode ser utilizada para fornecer uma ideia do
risco envolvido, ou seja, o erro de usar uma amostra ao invés do todo.
Mas como é feita a escolha desta amostra? Os elementos que comporão
a amostra devem ser escolhidos ao acaso, pois caso contrário seria
considerada amostra viciada.
Baseados nestes conceitos, podemos definir Estatística Indutiva ou
Inferencial como sendo a coleção de métodos e técnicas utilizados
para se estudar uma população baseados em amostras probabilísticas
(aleatória) desta mesma população. Porém quando podemos dizer
que a amostra é probabilistica (aleatória)? Ocorre quando todos os
elementos da população tiverem probabilidade conhecida - e não zero Representação visual de um
- de pertencer à amostra. Para isso, a amostra deve satisfazer o critério processo de amostragem.
de amostra aleatória simples (aas). Fonte: Wikipedia

9
PROBABILIDADE E ESTATÍSTICA
Unidade 1

Importante:

Se a população for infinita ou muito grande, então as retiradas com e


sem reposição serão equivalentes, isto é, o fato de realocar o elemento
retirado de volta na população não vai afetar em nada a probabilidade de
extração do elemento seguinte.

Se, no entanto, a população for finita ou muito pequena, será necessário


fazer uma distinção entre os dois procedimentos, pois na extração com
reposição as diversas retiradas serão independentes, só não se alterando
se for no processo sem reposição.

Melhor explicando: se N representa o tamanho da população e n<N o


tamanho da amostra, então o número de amostras possíveis - de acordo
com os critérios com e sem reposição - será:

a) Com reposição: k = número de amostras = Nn

b) Sem reposição: k = número de amostras =

Uma caracteristica da população é denominada parâmetro (P). Um


parâmetro é uma constante, isto é, um número que representa uma
característica única da população. Assim, se P é uma população, os
principais parâmetros seriam:
• A média de P µP
• A variância de P δP2
• O desvio padrão de P δP
• A proporção de elementos de P que apresentam determinada
caracteristica π

** Exemplos: para a população P = {1, 3, 5, 6} os parâmetros


acima seriam:
µP = (1+3+5+6)/4 = 3,75
δP2 = (1+9+25+36)/4 = 3,69
δP = 1,9203 = 1,92
π = ¼ = 25%, onde o numerador representa o número de
elementos pares na população.

10
PROBABILIDADE E ESTATÍSTICA
Unidade 1

Um estimador é uma caracteristica da amostra. Como a amostra é


aleatória, um estimador é uma variável aleatória. Assim, tudo o que Um estimador é uma caracteristica
da amostra.
foi visto em probabilidade sobre variáveis aleatórias, aplica-se aos
estimuladores. A distribuição de probabilidade de um estimador é
denominada distribuição amostral.
Os principais estimadores são:

• A média da amostra, X que é um estimador da média da


população: µ

• A variância amostral, S2 que é um estimador da variância


populacional: δ2

• A proporção amostral, P, que é um estimador amostral da


proporção populacional π.

Uma estimativa é um valor único de um estimador. Assim X = 2 é


uma estimativa. O estimador é a expressão (fórmula) enquanto que a
estimativa é o valor particular que ele assume (número).
O erro padrão da média mede a variabilidade entre as médias amostrais
e dá a ideia do erro que se comete ao se subsitituir a média da população
pela média da amostra. Se a população é grande ou infinita, não mais
será possível pensar em construir tabelas para representar a distribuição
das médias amostrais. Neste caso, é necessário procurar por modelos
probabilísticos que descrevam a distribuição da média amostral. Neste
caso, como já explicado acima, a distinção entre amostragem com e
sem reposição não será necessário, pois o fator de correção será
“aproximadamente um” e não necessitará ser utilizado.
O tipo de amostragem pode ser classificado em probabilístico ou
não probabilistico. A classificação probabilistica ou aleatória é a mais O tipo de amostragem pode ser
utilizada. Dentro da amostragem não probabilistica temos: a amostragem classificado em probabilístico ou
não probabilistico.
a esmo, intencional e cotas. Já para a probabilistica, existem a
amostragem simples ou ocasional, a sistemática, a estratificada ou por
conglomerados. Entenda melhor analisando cuidadosamente o gráfico
abaixo:

11
PROBABILIDADE E ESTATÍSTICA
Unidade 1

a) Amostragem simples é o processo mais utilizado. Todos


os elementos da população têm a igual probabilidade de serem
escolhidos (para um população finita o processo dever ser sem
reposição). O importante é numerar todos os elementos e realizar
um sorteio, utilizando a tabela de números aleatórios.

b) Amostragem sistemática trata-se de uma variação da


amostragem aleatória simples, conveniente quando a população
está naturalmente ordenada, como fichas em um fichário, lista
telefônica, etc. Ela é utilizada frequentemente em pesquisas que
obrigam que a seleção seja feita durante a etapa de coleta dos
dados, por pessoas que não estão familiarizadas com tabelas de
números aleatórios ou com uso de software.

c) Amostragem estratificada é um processo de amostragem


usado quando nos deparamos com populações heterogêneas,
nas quais pode-se distinguir subpopulações mais ou menos
homogêneas, denominadas estratos. A partir destes estratos
seleciona-se uma amostra aleatória de cada subpopulação,
porém sempre guardando as devidas proporcionalidades.

12
PROBABILIDADE E ESTATÍSTICA
Unidade 1

O dimensionamento da amostra deve ser feito a partir da determinação


do tamanho total da amostra. O importante, se possivel, é escolher Saiba Mais
sempre mais de uma váriavel. Verifique a mensuração da variável (se Quando não se conhece o desvio
nominal, ordinal ou intervalar) e considere se a população é finita ou padrão, deve-se utilizar um valor
infinita. preliminar obtido por processos
como fazer uma aproximação ou
realizar um estudo piloto, iniciando o

Links Importantes processo de amostragem pequeno.


Pode-se utilizar este valor como
desvio padrão populacional.
Leia o artigo: A importância da estatística na formação do profissional
pedagogo, do autor Aloisio Machado da Silva Filho. Disponível em:
http://www.cairu.br/revista/arquivos/artigos/2014/Artigo%20A%20
IMPORTANCIA%20DA%20ESTATISTICA.pdf. Acesso em 09 de
setembro de 2014. O artigo propoe uma analise da função estatitica nas
mais diversas formações profissionais, principalmente pedagogo.

Leia o artigo: Estatística através de rosas dos ventos para o aeródromo


do galeão como auxílio à elaboração do código TAF, do autor Jéssica
Motta Guimarães. Disponível em: http://www.redemet.aer.mil.br/Artigos/
Estat%C3%ADstica_atrav%C3%A9s_de_rosas_dos_ventos_para_o_
aeroporto_do_Gale%C3%A3o_como_aux%C3%ADlio_ao_TAF.pdf.
Acesso em 09 de setembro de 2014. O artigo mais aplicado de estatitica
com as suas variações.

Finalizando
Neste tema você aprendeu, brevemente, como podemos utilizar a
amostragem nas mais variadas circunstâncias estatísticas. Aprendeu
também como calculá-la e como diferenciá-la nos mais variados
processos.

Glossário

Amostragem
Partes de um conjunto de todos os elementos que se deseja estudar.

Erro padrão da média


Mede a variabilidade entre as médias amostrais e dá a ideia do erro
que se comete ao se subsitituir a média da população pela média da
amostra.

Tipo de amostragem
Pode ser classificado em probabilístico ou não probabilístico.

IBGE
Instituto Brasileiro de Geografia e Estatística.

Esmo
Escolha aleatória.

13
PROBABILIDADE E ESTATÍSTICA
Unidade 2

UNIDADE 2
TEMA 2:
VARIÁVEIS

Conteúdos e Habilidades
Nesta aula, você estudará:
• O que são variáveis.
• Tipos de variáveis.
• Níveis de mensuração.
• Relação entre as variáveis.

Ao final, você deverá ser capaz de responder às seguintes questões:


• O que são variáveis? Dê uma definição.
• Como ela são classificadas?
• Quais os principais tipos de variáveis?
• É possível relacionar a teoria com a prática aplicando o conceito
de variáveis?

Leitura Obrigatória

Neste tema você terá a oportunidade de aprofundar seus conhecimentos


Variáveis são características
sobre variáveis e saber como aplicá-las. A ideia é compreender o
que são medidas, controladas ou
conceito - na teoria - e relacioná-lo com a prática diária.
manipuladas em uma pesquisa.
Qual é o primeiro ponto a se pensar quando falamos em Variáveis? São
as mais variadas situações que devemos considerar em cada problema
em questão.
Para que estudar variáveis? Para aprender a analisar os dados que
precisam ser avaliados. Como podemos definir o conceito de variáveis?
São características que são medidas, controladas ou manipuladas em
uma pesquisa. Diferem em muitos aspectos, principalmente no papel que
a elas é dado em uma pesquisa e na forma como podem ser medidas.
Alguns exemplos que melhor definem as variáveis:

• Em uma pesquisa científica sobre reprodução, deve-se considerar


a quantidade de fêmeas por macho para o acasalamento;

• Em uma pesquisa sobre preferência do eleitor por candidatos –


do tipo feita pelo IBOPE para as eleições - considerar todos os
pontos a favor e contra os candidatos em questão para vencer as
eleições.
14
PROBABILIDADE E ESTATÍSTICA
Unidade 2

A maioria das pesquisas empíricas pertencem claramente a uma dessas


categorias gerais: em uma pesquisa correlacional (levantamento) o
pesquisador não influencia (ou tenta não influenciar) nenhuma variável,
mas apenas as mede e procura por relações (correlações) entre elas,
como pressão sanguínea e nível de colesterol. Em uma pesquisa Logo do Instituto Brasileiro de
experimental (experimento) o pesquisador manipula algumas variáveis Opinião Pública e Estatística.
e então mede os efeitos desta manipulação em outras variáveis; por Fonte : Ibope.com.br

exemplo, aumentar artificialmente a pressão sanguínea e registrar o


nível de colesterol.
A análise dos dados em uma pesquisa experimental também
calcula (calcula? Não seria analisa?) “correlações” entre variáveis, Em uma pesquisa experimental
especificamente entre aquelas manipuladas e as que foram afetadas (experimento) o pesquisador
manipula algumas variáveis e então
pela manipulação. Entretanto, os dados experimentais podem
mede os efeitos desta manipulação
demonstrar conclusivamente relações causais (causa e efeito) entre em outras variáveis.
variáveis. Por exemplo, se o pesquisador descobrir que sempre que
muda a variável A também muda a varíavel B, então ele poderá concluir
que A “influencia” B. Dados de uma pesquisa correlacional podem
ser apenas “interpretados”em termos causais com base em outras
teorias (não estatísticas) que o pesquisador conheça, mas não podem
conclusivamente provar causalidade.
Os tipos de variáveis são:
Variáveis independentes - são aquelas manipuladas, enquanto
que variáveis dependentes são apenas medidas ou registradas.
Esta distinção confunde muitas pessoas que dizem que “todas as
variáveis dependem de alguma coisa”. Entretanto, uma vez que
se esteja acostumado a esta distinção, ela se torna indispensável.
Os termos variável dependente e independente aplicam-se
principalmente à pesquisa experimental, onde algumas variáveis
são manipuladas, e neste sentido, são “independentes”dos
padrões de reação inicial, intenções e características dos sujeitos
da pesquisa (unidades experimentais). Espera-se que outras
variáveis sejam “dependentes”da manipulação ou das condições
experimentais. Ou seja, elas dependem “do que os sujeitos farão”
em resposta. Contrariando um pouco a natureza da distinção,
esses termos também são usados em estudos em que não se
manipulam variáveis independentes, literalmente falando, mas
apenas se designam sujeitos. Por exemplo, se em uma pesquisa
compara-se a contagem de células brancas de homens e
mulheres, sexo pode ser chamado de variável independente e
célula branca de variável dependente.
Há obviamente algum erro em cada medida, o que determina o
“montante de informação” que se pode obter, mas basicamente o
fator que determina a quantidade de informação que uma variável
pode prover é o seu tipo de mensuração. Sob este prisma as
variáveis são classificadas como:

15
PROBABILIDADE E ESTATÍSTICA
Unidade 2

• Nominais: permitem apenas classificação qualitativa.


Seus valores possíveis são diferentes categorias não Saiba Mais
ordenadas, em que cada observação pode ser classificada.
As variáveis diferem em “quão bem”
Exemplos: raça, nacionalidade, área de atividade.
elas podem ser medidas, isto é, em
• Ordinais: permitem ordenar os itens medidos em quanta informação seu nível de
termos de qual tem menos e qual tem mais da qualidade mensuração pode prover.
representada pela variável, mas ainda não se permite que
se diga “o quanto mais”. Também são variáveis qualitativas;
seus valores possíveis são diferentes categorias ordenadas,
em que cada observação pode ser classificada. Exemplos:
classe social, nível de instrução.

• Discreta: São variáveis quantitativas. Seus valores


possíveis são em geral resultados de um processo de
contagem. Exemplos: número de filhos, número de séries
escolares cursadas com aprovação.

• Contínua: Também são variáveis quantitativas. Seus


valores possíveis podem ser expressos através de números
reais e varrem uma escala contínua de medição. Exemplos:
renda mensal, peso e altura.

• Intervalares: permitem não apenas ordenar em postos


os itens que estão sendo medidos, mas também quantificar
e comparar o tamanho das diferenças entre eles.

As variáveis discretas são obtidas mediante alguma forma de contagem,


Geralmente o objetivo principal de
ao passo que os valores das variáveis contínuas resultam, em geral,
toda pesquisa ou análise científica é
de uma medição, sendo frequentemente dados em alguma unidade de encontrar relações entre variáveis.
medida. Outra diferença entre os tipos de variáveis quantitativas está
na interpretação de seus valores. Assim, a interpretação de um valor
de uma variável discreta é dada exatamente por este mesmo valor.
Quando dizemos que um casal tem dois filhos, isso significa que o casal
tem exatamente 2 filhos. A interpretação de um valor de uma variável
contínua, ao contrário, é a de que se trata de um valor aproximado.
Isso decorre do fato de não existirem instrumentos de medida capazes
de oferecer precisão absoluta e, mesmo que existissem, não haveria
interesse e nem sentido em se querer determinar uma grandeza contínua
com todas as suas casas decimais. Logo, se ao executarmos a medição
de algum valor de uma variável contínua estamos sempre fazendo uma
aproximação, resulta que qualquer valor apresentado de uma variável
contínua deverá ser interpretado como uma aproximação compatível
com o nível de precisão e com o critério utilizado ao medir.
Duas ou mais variáveis quaisquer estão relacionadas se numa amostra
de observação os valores dessas variáveis são distribuídos de forma
consistente. Geralmente o objetivo principal de toda pesquisa ou análise
científica é encontrar relações entre variáveis. A filosofia da ciência
ensina que não há outro meio de representar “significado” exceto em
termos de relações entre quantidades ou qualidades, e ambos os casos
envolvem relações entre variáveis.
16
PROBABILIDADE E ESTATÍSTICA
Unidade 2

As duas propriedades formais mais elementares de qualquer relação


entre variáveis são a magnitude (“tamanho”) e a confiabilidade da
relação.

• Magnitude: é mais fácil de se medir do que confiabilidade. Por


exemplo, se cada homem em nossa amostra tem uma contagem
de células brancas maior do que o de qualquer mulher da
amostra, poder-se-ia dizer que a magnitude da relação entre as
duas variáveis é muito alta em nossa amostra.

• Confiabilidade: é um conceito muito menos intuitivo. Relaciona-


se à “representatividade” do resultado encontrado em uma amostra
específica de toda a populaçào. Em outras palavras, diz quão
provável será encontrar uma relação similar se o experimento
fosse feito com outras amostras retiradas da mesma população,
lembrando que o maior interesse está na população. O interesse
na amostra reside na informação que ela pode prover sobre a
população. Se o estudo atender a certos critérios específicos,
então a confiabilidade de uma relação observada entre variáveis
na amostra pode ser estimada quantitativamente e representada
usando uma medida padrão.

Por que a significância de uma relação entre variáveis depende do


tamanho da amostra?
Se há muito poucas observações, então há também poucas possibilidades
de combinação dos valores das variáveis, e então a probabilidade de
obter por acaso uma combinação desses valores que indique uma forte
relação é relativamente alta.
Quando é feito um levantamento de dados a respeito de um determinado
assunto, eles costumam ser representados em uma tabela de dados
brutos, na qual cada linha corresponde a uma observação e cada coluna
corresponde a uma variável.
Eventualmente em uma massa de dados há valores que foram coletados
em condições anormais (falha do equipamento, queda da energia, erro
do operador, erro de leitura, erro de digitação, etc). Esses valores,
principalmente quando estão muito afastados dos demais (para mais ou
para menos), infelizmente podem afetar de forma substancial o resultado
das análises estatísticas. São chamadas observações discrepantes ou
outliers. Assim sendo, é útil que tenhamos disponível um critério de
detecção de observações discrepantes. Uma vez detectada a presença
desta, poderá ser tomada a decisão de repetir aquele experimento, ou
meramente expurgar aquele dado da amostra (ou mesmo mantê-lo, se
for encontrada uma explicação plausível para aquela discrepância).

17
PROBABILIDADE E ESTATÍSTICA
Unidade 2

Links Importantes

Leia o artigo: Apostila de Estatística, do autor Marcelo Beneti.


Disponível em: http://www.administradores.com.br/artigos/negocios/
apostila-de-estatistica/40665/. Acesso em 10 de setembro de 2014. A
apostila fundamenta os principais conceitos relacionados às variáveis
estatísticas, dentre outros tópicos.

Leia o artigo: Planejamento estatístico de experimento científico, do


autor José Benício Chaves. Disponível em: http://www.dta.ufv.br/artigos/
planestat.htm. Acesso em 10 de setembro de 2014. Definição de como
determinar variáveis no campo científico e experimental.

Leia o artigo: A escolha do teste estatístico – um tutorial em forma


de apresentação em Power Point, dos autores David Normando; Leo
Tjaderhane; Catia Cardoso Quintão. Disponível em: http://www.scielo.br/
pdf/dpjo/v15n1/12.pdf. Acesso em 10 de setembro de 2014. Definição de
como determinar a escolha dos testes estatísticos envolvendo variáveis.

Finalizando

Neste tema você aprendeu, brevemente, como utilizar as variáveis e


como classificá-las adequadamente nas mais variadas circunstâncias
estatísticas.

Glossário

Variáveis
Amostragem como um conjunto de todos os elementos que se deseja
estudar.

Ordinal
Mede a variabilidade entre as médias amostrais e dá a ideia do erro
que se comete ao se subsitituir a média da população pela média da
amostra.

Intervalares
Pode ser classificado em probabilístico ou não probabilístico.

Discrepante
Fora do comum.

Magnitude
Ideia relacionada ao tamanho.

18
PROBABILIDADE E ESTATÍSTICA
Unidade 3

UNIDADE 3
TEMA 3:
TABELA

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como preparar uma tabela.
• Como os dados devem ser ordenados.
• Quais os tipos de tabelas existentes.
• Comparação entre as tabelas e os dados obtidos com gráficos.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Como é possível ordenar os dados em uma tabela de acordo
com a amostragem?
• Quais os tipos de tabelas?
• É possível relacionar os dados obtidos a partir da tabela aos
gráficos?
• Como é possível interpretar os resultados a partir dos dados
obtidos com a tabela?

Leitura Obrigatória

Neste tema você terá a oportunidade de aprofundar mais os seus


Na construção de tabelas de
conhecimentos sobre a preparação de tabelas e como trabalhar com frequência e gráficos, as variáveis
os dados. A ideia é compreender na teoria e relacionar o conhecimento são tratadas de forma diferente de
adquirido com a prática diária. acordo com o tipo.

A estatística descritiva é a parte da estatística que desenvolve e


disponibiliza métodos para resumo e apresentação de dados estatísticos,
com o objetivo de facilitar a compreensão e a utilização das informações
ali contidas.
Para melhor descrever o comportamento de uma variável que estudamos
no capítulo anterior, é comum apresentar os valores que ela assume
organizados sob a forma de tabelas que podem ser de frequências e
gráficos.

19
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Qual é a diferença entre essas tabelas? Quando podemos utilizar


os dados ordenados na forma de tabela ou gráfico? Qual é o mais
representativo?
A reunião ou agrupamento de dados estatísticos, quando apresentados
em tabelas, para apreciação ou investigação, determina o surgimento
das séries estatísticas. Estas séries resumem um conjunto ordenado
de observações através de três fatores fundamentais:
a) Tempo: refere-se à data ou à época em que o fenômeno foi
investigado;
b) Espaço: refere-se ao local ou região onde o fato ocorreu;
c) Espécie: refere-se ao fato ou fenômeno que está sendo
invetigado e cujos valores numéricos estão sendo apresentados.

Elas podem ser classificadas de acordo com o fator que estiver variando,
podendo ser simples ou mistas.
Série simples: são aquelas em que apenas um fator varia.
Podem ser de três tipos:
Série Histórica (temporal ou cronológica ou evolutiva): varia o
tempo permanecendo fixos o espaço e a espécie do fenômeno
estudado.
Exemplo:

Tabela 1: Casos de variola notificados no Brasil de


1993 a 1997. Fonte: Anuários Estatísticos - IBGE

Série geográfica (territorial ou regional): varia o espaço


permanecendo fixos o tempo e a espécie do fenômeno estudado.
Exemplo:

Tabela 2: Necessidades médias de


energia em alguns países, em 1973.
Fonte: Necessidades Humanas de Energia - IBGE

20
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Série especificativa (qualitativa ou categórica): varia a espécie do


fenômeno estudado, permanecendo fixos o tempo e o espaço.
Exemplo:

Tabela 3: Abate de animais,


por espécies, no Brasil, em 1993.
Fonte: Necessidades Humanas de Energia - IBGE

Série mista: são aquelas em que mais de um fator varia ou um


fator varia mais de uma vez.
Exemplos:
Série histórica geográfica

Tabela 4: Taxa de atividade feminina urbana


(em percentual) em 3 regiões do Brasil, 1981/1990
Fonte: Anuários Estatísticos do Brasil - 1992

Série especificativa geográfica

Tabela 5: Consumo per capita de alguns tipos de alimentos,


em algumas regiões metropolitanas do Brasil, no ano de 1998.
Fonte: Anuáreio estatísticos do Brasil - 1992

21
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Série especificativa histórica

Tabela 6: Taxa de mortalidade (%) de menores de um ano no Brasil,


segundo as três principais causas, no período de 1984 a 1987. Fonte:
Informe Epidemologico SUS.

Série distribuição de frequências: ocorre quando nenhum dos


A tabela é a forma não discursiva de
fatores varia. Nesta série os dados são agrupados em classes (intervalos
apresentar informações
com limites predeterminados) segundo suas respectivas frequências.
Segundo a natureza dos dados, as distribuições de frequências podem
ser de dois tipos :
- Para dados de enumeração.
- Para dados de mensuração.

A tabela é a forma não discursiva de apresentar informações, das quais


o dado numérico se destaca como informação central. Sua finalidade é
apresentar os dados de modo ordenado, simples e de facil interpretação,
fornecendo o máximo de informação num mínimo de espaço.

Quais são os conjuntos de dados que compõem uma tabela?

• Elementos da tabela
Uma tabela estatística é composta de elementos essenciais e
elementos complementares. Os elementos essenciais são:

- Título: é a indicação que precede a tabela, contendo a


designação do fato observado, local, época, etc.

- Corpo: é o conjunto de linhas e colunas onde estão


inseridos os dados.

- Cabeçalho: é a parte superior da tabela, que indica o


conteúdo das colunas.

- Coluna indicadora: é a parte da tabela que indica o


conteúdo das linhas.

22
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Já os elementos complementares são:

- Fonte: entidade que fornece os dados ou elabora a tabela.

- Notas: informações de natureza geral, destinadas a esclarecer o


conteúdo das tabelas.

- Chamada: informações específicas destinadas a esclarecer ou


conceituar dados numa parte da tabela. Deverão estar indicadas
no corpo da tabela, em números arábicos entre parênteses, à
esquerda nas casas e à direita na coluna indicadora. Deve ser
situada no rodapé da tabela.

• Número da tabela
Toda tabela deve ter sempre um número para identificá-la,
Toda tabela deve ter sempre um
assim como a sua localização. A numeração deve ser feita em números número para identificá-la, assim
arábicos, de modo crescente, precedidos da palavra Tabela, podendo como a sua localização.
ou não estar subordinada a capítulos ou seções. Exemplo: Tabela 5.

• Apresentação dos dados numéricos


Toda tabela deve ter dado numérico para informar a quantificação
de um fato específico observado, apresentado em números arábicos.
No sistema inglês, a separação entre o milhar e a centena é feita por Saiba Mais
vírgulas e a separação da parte inteira decimal é feita por ponto, ou seja, O corpo da tabela deve ser
inverso do sistema brasileiro. limitado, no mínimo, por três traços
horizontais. Recomenda-se não
delimitar as tabelas à direita e à
• Arredondamento esquerda por traços verticais. Se
possuir muitas linhas e poucas
Quando o algarismo que for abandonado for entre 0 e 4, fica colunas poderá ser apresentada
inalterado o último algarismo; porém, quando o primeiro algarismo a em duas ou mais partes dispostas
ser abandonado estiver entre 5-9, aumenta-se uma unidade no último lado a lado e separadas por traços
algarismo a aparecer. duplo.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta os
principais conceitos relacionados à preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatística aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

23
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Finalizando

Neste tema você aprendeu, brevemente, como ocorrem os elementos


da tabela e como classificá-las adequadamente nas mais variadas
circunstâncias estatísticas.

Glossário

Série
Refere-se à classificação para a formação da tabela.

IBGE
Instituto Brasileiro de Geografia e Estatística.

Anuários
É uma publicação anual que registra informações sobre um ou vários
ramos de atividade, tais como, ciências, artes, literatura, profissões,
economia, etc.

Misto
Assume a identidade de duas classificações.

Cabeçalho
Na terminologia da informática, o headre – ou, simplesmente, cabeçalho
– consiste na parte que contém as informações suplementares
colocados no começo de um bloco de dados que estão armazenados
ou transmitidos.

24
PROBABILIDADE E ESTATÍSTICA
Unidade 3

GRÁFICOS

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como preparar gráficos.
• Como os dados devem ser ordenados.
• Quais os tipos de gráficos existentes.
• Comparação com os dados obtidos com as tabelas.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Como é possível ordenar os dados em gráficos de acordo com
a amostragem?
• Quais os tipos de gráficos?
• É possível relacionar os dados obtidos com a tabela aos
gráficos?
• Como é possível interpretar os resultados a partir dos dados
obtidos com o gráfico?

Leitura Obrigatória

Neste tema você terá a oportunidade de aprofundar mais os seus


conhecimentos sobre a preparação de gráficos e como trabalhar com
os dados. A ideia é compreender os conteúdos na teoria e relacioná-los
com a prática diária.
O primeiro passo para se descrever graficamente um conjunto de dados
observados é verificar as frequências dos diversos valores existentes
da variável.
Definimos frequência de um dado valor de uma variável (qualitativa ou
quantitativa) como o número de vezes que esse valor foi observado. A frequência é uma grandeza física
Denotaremos a frequência do i-ésimo valor observado for fi. Sendo n o ondulatória que indica o número de
número total de elementos observados, verifica-se imediatamente. ocorrências de um evento (ciclos,
voltas, oscilações, etc) em um
determinado intervalo de tempo.

ΣΚ i = fi = n

Onde:
Κ é o número de diferentes valores existentes da variável.

25
PROBABILIDADE E ESTATÍSTICA
Unidade 3

A associação das respectivas frequências a todos os diferentes valores


observados define a distribuição de frequências do conjunto de valores
observados. Alternativamente, poderemos usar as frequências relativas.
Definimos a frequência relativa, ou proporção de um dado valor de uma
variável (qualitativa ou quantitativa), como o quociente de sua frequência
pelo número total de elementos observados. Ou seja, denotamos por pi
a frequência relativa ou proporção do i-ésimo elemento observado.
Para melhor descrever o comportamento de uma variável que estudamos
no capítulo anterior, é comum apresentar os valores que ela assume
organizados sob a forma de tabelas. Elas podem ser de frequências e
gráficos.
Qual é a diferença entre os gráficos? Quando podemos utilizar os dados
ordenados na forma de tabela ou gráfico? Qual é o mais representativo?
Na construção de tabelas de frequência e gráficos, as variáveis são
Diagrama ou gráfico circular (pie
tratadas de forma diferente de acordo com o tipo.
chart), também chamado diagrama
No caso de variáveis qualitativas, a descrição gráfica é muito simples, de setores, é uma representação
bastando computar as frequências relativas das diversas classificações gráfica, utilizada essencialmente
existentes, elaborando, a seguir, um gráfico conveniente. Esse gráfico para dados qualitativos, que tem
poderá ser um diagrama de barras, um diagrama circular ou outro por base um círculo, dividido em
qualquer tipo de diagrama equivalente. setores circulares, tantos quantas
as categorias apresentadas pelos
Tomaremos, por exemplo, 135 candidatos a vagas em um curso de
dados em estudo. As amplitudes
pós-graduação, classificados segundo sua formação específica de
dos ângulos dos setores são
graduação, conforme a tabela 1.
proporcionais às frequências das
categorias que representam. Assim,
o círculo representa a forma como
o total dos dados se distribui pelas
categorias e cada setor representa
uma fração do total dos dados.

Esses dados podem ser graficamente representados de diversas


formas. Assim, aqui eles serão representados por meio de um diagrama
de barras.

26
PROBABILIDADE E ESTATÍSTICA
Unidade 3

A vantagem da representação gráfica está em possibilitar uma rápida


impressão visual de como se distribuem as frequências ou as frequências
relativas no conjunto de elementos examinados. Entretanto, há que se
mencionar ainda a possibilidade de considerarmos distribuições segundo
outros critérios que não propriamente a frequência ou a frequência
relativa das observações. Como exemplo, tomemos as superfícies das
cinco regiões geográficas que compoem o Brasil, apresentadas na
tabela 2, conforme dados do IBGE (Instituto Brasileiro de Geografia e
Estatística). Calculando-se as porcentagens correspondentes, pode-se
construir o diagrama circular dado na Figura 2.

Tabela 2: Regiões geográficas do Brasil

No caso das variáveis quantitativas discretas, a representação gráfica


será também, normalmente, feita por meio de um diagrama de barras. A
construção do diagrama de barras é feita semelhantemente ao exemplo
anterior, desde que se disponha da tabela de frequências. Esta, por sua
vez, pode ser facilmente construída se conhecemos todos os valores
da variável no conjunto de dados. Como iremos marcar no eixo das
abscissas os valores da variável, resulta que, nesse caso, as barras
do diagrama serão verticais. Vamos ao título do exemplo: representar
graficamente o conjunto dado a seguir, constituído hipoteticamente por
vinte valores da variável “número de defeitos por unidade”, obtidos a
partir de aparelhos retirados de uma linha de montagem. Sejam os
seguintes os valores obtidos:

2 4 2 1 2
3 1 0 5 1
0 1 1 2 0
1 3 0 1 2

Usando a letra x para designar os diferentes valores da variável,


podemos construir a distribuição de frequência dada na tabela 3, a partir
da qual elaboramos o diagrama de barras correspondentes, dado pela
fig 3.

27
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Tabela 3: Distribuição de Frequência

O diagrama de barras, conforme já mencionamos, mostra a distribuição


das frequências no conjunto de dados. Tratando-se de variáveis
quantitativas, uma outra forma de representação gráfica é também
possível, tendo as vezes, interesse, com base nas frequências
acumuladas, as quais denotaremos por “F”.
A frequência acumulada, em qualquer ponto do eixo das abscissas, é
definida como a soma das frequências de todos os valores menores ou
iguais ao valor correspondente a esse ponto. Analogamente, teríamos
as frequências relativas acumuladas.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Finalizando

Neste tema você aprendeu, brevemente, quais são e como ocorrem


os elementos do gráfico, além de aprender como classificá-los
adequadamente nas mais variadas circunstâncias estatísticas.

28
PROBABILIDADE E ESTATÍSTICA
Unidade 3

Glossário

Frequência
Número de vezes que esse valor foi observado.

IBGE
Instituto Brasileiro de Geografia e Estatística.

Anuários
É uma publicação anual que registra informações sobre um ou vários
ramos de atividade, tais como ciências, artes, literatura, profissões,
economia, etc.

Misto
Assume a identidade de duas classificações.

Cabeçalho
Na terminologia da informática, o headre – ou, simplesmente, cabeçalho
– consiste na parte que contém as informações suplementares
colocadas no começo de um bloco de dados que estão armazenados
ou transmitidos.

29
PROBABILIDADE E ESTATÍSTICA
Unidade 4

UNIDADE 4
TEMA 5:
MODA

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar a moda.
• Como rearranjar os dados para encontrar a moda.
• Como pode ser aplicada.
• Comparação entre as diferentes moda.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para compor a moda?
• É possível extrair a moda a partir de tabelas?
• Como aplicar a moda correta?
• Quais exemplos práticos podemos aplicar para compor a moda?

Leitura Obrigatória

Em estatística denominam-se medidas de tendência central: a média, a


mediana e a moda. Essas medidas dependem da definição de centro de A moda é o valor mais típico e
um conjunto de valores ou de uma distribuição que pode ser interpretada representativo de uma distribuição.
de várias maneiras. A moda é o valor mais típico e representativo de Ela representa o seu valor mais
uma distribuição. Ela representa o seu valor mais provável. Como a provável.
mediana, a moda também não é influenciada pelos valores extremos
da distribuição e não permite manipulações algébricas como a fórmula
da média.
Existem algumas relações entre as diversas medidas de posição:

1) Para qualquer série, exceto quando no caso de todas as


observações coincidirem em um único valor, a média aritmética
é sempre maior que a média geométrica, a qual, por sua vez, é
maior que a média harmônica.

2) Para uma distribuição simétrica e unimodal, média = mediana


= moda
3) Para uma distribuição positivamente assimétrica, média >
mediana > moda. A distância entre a mediana e a média é cerca
de um terço da distância entre a moda e a média.

30
PROBABILIDADE E ESTATÍSTICA
Unidade 4

4) Para uma distribuição negativamente assimétrica, média <


mediana < moda. A distância entre a mediana e a média é cerca
de um terço da distância entre a moda e a média.

A moda de uma distribuição de frequência pode muitas vezes ser


aproximada pelo ponto médio de uma classe modal – a classe com maior
densidade de frequência. É possível calcular os valores aproximados da
mediana e da moda para dados agrupados quando o último intervalo
de classe tem limite superior indeterminado. No caso da mediana isso
é imediato e no caso da moda, o seu cálculo somente pode ser feito se
a última classe não for a classe modal sendo necessário primeiramente
calcular as densidades de frequência.
Infelizmente em algumas situações não é possível calcular a média e
temos que contar apenas com a mediana como medida de posição (ou
de tendência central) de uma distribuição estatística.

Exemplo 1:
Os dados abaixo se referem à idade de 20 alunos de uma turma de 6o.
Ano.

Idade: {12, 11,12,13,12,11,13,12,12,11,14,13,13,12,11,12,13,14,11,14}

A moda deste conjunto de dados será a idade que mais aparece, ou


seja, 12, pois é a idade que aparece mais vezes no conjunto.

Frequência: Em estatística, a frequência (ou frequência absoluta)


de um evento i é o número n_i de vezes que o evento ocorreu
em um experimento ou estudo.1 :12-19 Essas frequências são
normalmente representadas graficamente em histogramas.

Exemplo 2
A tabela abaixo apresenta as notas em matemática de uma turma de 30
alunos.

31
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Na coluna da esquerda temos as notas na disciplina de matemática e


na coluna da direita, quantos alunos obtiveram a respectiva nota. Dessa
forma, podemos observar que a nota que mais aparece nesse conjunto
de dados é 7. Portanto a Mo =7.

Exemplo 3
Os dados abaixo são referentes ao número dos calçados vendidos em
uma loja num determinado dia.

{35,33,36,35,37,36,39,40,43,35,36,42}

Nesse caso, existem dois números de sapatos que aparecem mais


vezes: 35 e 36. Logo, a moda pode ser: Mo=35 ou 36. Quando isso
ocorre dizemos que o conjunto de dados é bimodal.
Importante

1) seu valor é afetado pelo número de observações e como


elas estão distribuídas mas ela não é afetada pelos valores das
observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com


limites superiores indeterminados para a sua última classe

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Finalizando

Neste tema você aprendeu, brevemente, como calcular a moda


adequadamente nas mais variadas circunstâncias estatísticas.

32
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Glossário

Média
Somatória dos dados dividida pelo número total de elementos.

Mediana
É o valor do item central da série quando estes são arranjados em ordem
de magnitude.

Finito
Número determinado.

Geométrico
É um ramo da matemática preocupado com questões de forma, tamanho
e posição relativa de figuras e com as propriedades do espaço.

33
PROBABILIDADE E ESTATÍSTICA
Unidade 4

TEMA 6:
MÉDIA

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar as médias.
• Que tipo de dados podem ser utilizados para compor a média.
• Como pode ser aplicada.
• Comparação entre as diferentes médias.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para compor a média?
• É possível extrair a média a partir de tabelas?
• Como aplicar a média correta?
• Quais exemplos práticos podemos aplicar para compor a média?

Leitura Obrigatória
A junção de dados para compor a média.
Existem vários tipos de média. Um exemplo é a média arimética não
ponderada, que é definida como a soma das observações dividida pelo
número de observações. Para que ela possa ser utilizada, devem ser
verificadas algumas propriedades, como:
- A média é um valor típico, ou seja, um ponto de equilíbrio. Seu
valor pode ser substituído pelo valor de cada item na série de
dados sem mudar o total.
- A soma dos desvios das observações em relação à média é
igual a zero.

- A soma dos desvios elevados ao quadrado das observações em


relação à média é menor que qualquer soma de quadrados de
desvios em relação a qualquer outro número.

Segundo Neder, a ideia básica de selecionar um número tal que a soma


dos quadrados dos desvios em relação a este número é minimizada tem
grande importância na teoria estatística. Foi denominado de o “princípio
dos mínimos quadrados”. Ela é, por exemplo, a base racional do método
dos mínimos quadrados que é usado para ajustar a melhor.
34
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Um outro tipo é a média aritmética ponderada. Nesta, todos os valores


observados foram somados atribuindo-se o mesmo peso a todas as
observações. A soma dos pesos não pode ser igual a zero. Fora disto,
não existe restrição para os valores dos pesos. Se todos os pesos forem
iguais a 1, a média ponderada recai em seu caso particular: a média
aritmética não ponderada. O mesmo ocorre se todos os pesos forem
iguais a uma constante. Portanto, a média aritmética não ponderada na
realidade é uma média artimética ponderada com pesos iguais.
Frequentemente encontramos populações cujas unidades elementares
podem ser classificadas em duas categorias: uma que tem certo atributo
e outra que não tem esse atributo. Nesse caso, estamos interessados
na proporção de casos que possuem esse atributo. Uma proporção
comumente é pensada como uma fração ou porcentagem, mas também
pode ser pensada como um caso especial de média.
A média geométrica de uma amostra é definida como a raiz enésima
do produto nos valores amostrais. A média aritmética é maior do que a
média geométrica para qualquer série de valores positivos, com exceção
do caso em que os valores da série são todos iguais, quando as duas
médias coincidem. O cálculo da média geométrica é simples, porém a
interpretação e suas propriedades tornam-se mais evidentes quando
reduzimos a fórmula à sua forma logarítmica.
A conclusão a que chegamos é que o logaritmo da média geométrica é
igual à média aritmética dos logaritmos dos valores da série. Verifica-
se que a média geométrica somente tem significado quando todos os
valores da série são positivos.
A mais importante aplicação da média geométrica refere-se talvez ao
cálculo de taxas de crescimento médias, desde que essas possam ser
corretamente medidas somente por esse método.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

35
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Finalizando

Neste tema você aprendeu, brevemente, como ocorreram os elementos


do gráfico e como classificá-los adequadamente nas mais variadas
circunstâncias estatísticas.

Glossário

Média
Somatória dos dados dividida pelo número total de elementos.

Aritmética
É o ramo da matemática que lida com números e com as operações
possíveis entre eles.

Ponderada
Parâmetro utilizado para atribuir a maior ou a menor grandeza,
evidenciando o valor ponderado.

Geométrico
É um ramo da matemática preocupado com questões de forma, tamanho
e posição relativa de figuras, e com as propriedades do espaço.

36
PROBABILIDADE E ESTATÍSTICA
Unidade 4

TEMA 7:
MEDIANA

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar a mediana.
• Como rearranjar os dados para encontrar a mediana.
• Como pode ser aplicada.
• Comparação entre as diferentes medianas.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para compor a mediana?
• É possível extrair a mediana a partir de tabelas?
• Como aplicar a mediana correta?
• Quais exemplos práticos podemos aplicar para compor a
mediana?

Leitura Obrigatória
A mediana é o valor numérico que separa a metade superior de uma
amostra de dados, uma população ou uma distribuição de probabilidade, A mediana é o valor numérico
a partir da metade inferior. A mediana de uma lista finita de números que separa a metade superior
de uma amostra de dados, uma
pode ser encontrada a partir do valor mais baixo para o valor mais alto,
população ou uma distribuição de
sempre pelo meio. Exemplo: {1,3,5,7,11} – a mediana é 5. Se houver probabilidade, a partir da metade
número par, não existe mediana, sendo então definido como a média dos inferior.
valores os dois valores do meio. Exemplo: {1,3,5,7} – a mediana neste
caso é a média dos dois valores do meio: (3+5/2)=4. Para estatísticas
robustas, ela é fundamental, já que é resistente. Ela é independente
de qualquer distância métrica, já uma média geométrica é definida em
qualquer número de dimensão.
Uma aplicação da mediana é utilizá-la como medida de localização
quando a distribuição é desviada, quando os valores finais não são
conhecidos ou quando se exige reduzida importância para ser anexado,
por exemplo, uma vez que podem existir erros de medição.
Em termos de notação, alguns autores representam a mediana de uma
variável x ou como notação padrão μ1/21 por vezes também M3 . Não há
um símbolo amplamente aceito para a mediana, de modo que o uso
destes ou outros símbolos para o mediano deve ser explicitamente
definido quando eles são introduzidos.
37
PROBABILIDADE E ESTATÍSTICA
Unidade 4

A mediana então é o valor que ocupa a posição central da série de


observações de uma variável, em rol, dividindo o conjunto em duas
partes iguais, ou seja, a quantidade de valores inferiores à mediana é
igual 1a quantidade de valores superiores à mesma.
Este procedimento pode tornar-se inadequado quando o conjunto de
dados for composto por muitos elementos.
Ela pode ser representada por Md, sendo a medida que divide um
conjunto de dados ordenado em duas partes iguais: 50% dos valores
ficam abaixo e 50% ficam acima da mediana. Existem dois casos
diferentes para o cálculo da mediana, mas em ambos o primeiro passo
a ser tomado é a ordenação dos dados.

1º. caso: quando o n é ímpar:


Determinamos, primeiramente, a posição mais central (p) do conjunto
de dados ordenado
p = n+1/2

A mediana será o valor do conjunto de dados que ocupa a posição p, ou


seja, Md = xp
Exemplo:
Se X = tempo (h)
Para xi = 4, 5, 7, 9, 10, temos:

p = n+1/2 –> 5+1/2 = 3, logo

Md = xp = x3 = 7h

2. caso: quando o n é par:


Neste caso, temos duas posições centrais no conjunto de dados
ordenado, denotadas por p1 e p2. Ao utilizarmos a expressão p = n+1/2,
obtemos um valor não inteiro. As posições p1 e p2 são os dois inteiros
mais próximos do valor de p. A mediana será a média aritmética simples
dos valores do conjunto de dados que ocupam as posições p1 e p2, ou
seja,
Md = xp1 + xp2/2

Exemplo:
Se X = tempo (h)
Para x1 = 4, 5, 7, 9, 10, 12, temos:

p = n+1/2 = 6+1/2 = 3,5 (p1 = 3 e p2 = 4), logo

Md – xp1 + xp2/2 = X3+x4/2 = 7+9/2 = 8h

38
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Importante

1) seu valor é afetado pelo número de observações e como


elas estão distribuídas mas ela não é afetada pelos valores das
observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com


limites superiores indeterminados para a sua última classe

4) a mediana é a estatística mais adequada para descrever


observações que são ordenadas ao invés de medidas.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Finalizando

Neste tema você aprendeu, brevemente, como calcular a mediana


adequadamente nas mais variadas circunstâncias estatísticas.

Glossário

Média
Somatória dos dados dividida pelo número total de elementos.

Mediana
É o valor do item central da série quando estes são arranjados em ordem
de magnitude.

Finito
Número determinado.

Geométrico
É um ramo da matemática preocupado com questões de forma, tamanho
e posição relativa de figuras e com as propriedades do espaço.

39
PROBABILIDADE E ESTATÍSTICA
Unidade 4

TEMA 8:
QUARTIS

Conteúdos e Habilidades

Nesta aula, você estudará:


• Como encontrar o percentis.
• Quais ferramentas são necessárias para encontrar o percentis.
• Como pode ser aplicado.
• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o percentil?
• É possível extrair o percentil a partir de tabelas?
• Como aplicar o percentil nas mais variadas situações ?
• O percentil é o ponto final do dado que pode ser obtido ?

Leitura Obrigatória

A mediana é o valor que divide a amostra em duas partes iguais, deixando


exatamente 50% das observações de cada lado. Também poderíamos
dividir em quatro partes iguais, cada uma contendo 25% dos dados.
Nesse caso cada uma das partes seria um quartil.

O primeiro quartil escreve-se abreviadamente Q1/4 correspondendo a


25% dos dados. O segundo quartil Q2/4, corresponde à mediana. O
terceiro quartil Q3/4, corresponde a 75% das observações. O seu cálculo
é análogo ao da mediana. Começa-se por determinar a respectiva classe
observando as frequências relativas acumuladas.

40
PROBABILIDADE E ESTATÍSTICA
Unidade 4

A amostra também pode ser dividida em 10 partes de 10% cada,


originando os decis ou em 100 partes de 1% obtendo-se os percentis.
Denomina-se quartis os valores de uma série que a dividem em quatro
partes iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para
dividir a série em quatro partes iguais. O quartil 2 (Q2) sempre será
igual a mediana da série. O método mais prático é utilizar o principio do
cálculo da mediana para os 3 quartis. Na realidade serão calculadas “3
medianas” em uma mesma série.

Exemplo 1:
Calcule os quartis da série: {5,2,6,9,10,13,15} .
O primeiro passo a ser dado é o da ordenação (crescente ou
decrescente) dos valores: {2,5,6,9,10,13,15}. O valor que divide a série
acima em duas partes iguais é igual a 9, logo a Md=9 que será = Q2.
Temos agora {2,5,6} onde o Q1=5 e {10,13,15} e o Q3=13, como sendo
os dois grupos de valores iguais proporcionados pela mediana (quartil
2). Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes
iguais provenientes da verdadeira Mediana da série (quartil 2).

41
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Exemplo 2:
Calcule os quartis da série: {1,1,2,3,5,5,6,7,9,9,10,13}

- Quarti 2 = Md = (5+6)/2 = 5,5

- Quartil 1 será a mediana da série à esquerda de Md: {1,1,2,3,5,5,}


→ Q1 = (2+3)/2 = 2,5

- Quartil 3 será a mediana da série à direita de Md: {6,7,9,,9,10,13}


→ Q3 = (9+9)/2 = 9

Importante

1) seu valor é afetado pelo número de observações e como


elas estão distribuídas mas ela não é afetada pelos valores das
observações externas

2) para facilitar encontrar o quartil, divida o valor por quatro e


encontrará: Q1; Q2; Q3;Q4.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/
Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta
or principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Glossário

Quartil
É o valor obtido a partir da divisão por quatro.

Variância
É o agrupamento de dados.

Média aritmética
Média de todos os dados da amostra.

População
É o agrupamento de dados.

42
PROBABILIDADE E ESTATÍSTICA
Unidade 4

TEMA 9:
PERCENTIS

Conteúdos e Habilidades

Nesta aula, você estudará:


• Como encontrar o percentis.
• Quais ferramentas são necessárias para encontrar o percentis.
• Como pode ser aplicado.
• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o percentil?
• É possível extrair o percentil a partir de tabelas?
• Como aplicar o percentil nas mais variadas situações ?
• O percentil é o ponto final do dado que pode ser obtido ?

Leitura Obrigatória

O percentil é uma ferramenta da matemática e da estatistica muito


uitlizada em pediatria, que serve para comparar individualmente uma
criança, com um grupo modelo de outras 100 crianças com a mesma
idade (Per cem = per cento = por cem = porcento). As curvas de
percentis são representações gráficas com linhas que permitem fazer
estas comparações. Os devios no posicionamento de um indivíduo
numa curva de percentil, não devem ser interpretados como presença
de doença. Os percentis são só e apenas, o modo de comparar em
relação a determinados parâmetros, indivíduos do mesmo sexo e com
a mesma idade.
O crescimento é um importante indicador do bem estar de uma criança
e está sujeito a muitas influências. Entre elas destacam-se a genética
da própria criança, a sua alimentação e a ausência de doenças. Uma
alteração de qualquer de um destes fatores isoladamente ou em conjunto,
vai influenciar e modificar o seu crescimento. As curvas de percentis
usam-se na idade pediátrica mais do que qualquer outra idade, de modo
a monitorar o crescimento e os desvios, para que se possa intervir em
caso de necessidade. Há diversas tabelas e curvas de percentis para
além do crescimento. As curvas de percentis são difíceis de se construir
e por esta razão nem todos os países têm as suas próprias curvas.

43
PROBABILIDADE E ESTATÍSTICA
Unidade 4

• Um percentil indica que há x% de dados inferiores, ou seja, os


percentis dividem o conjunto de dados em 100 partes iguais;
• Há, portanto, 99 percentis;
• Os valores devem estar ordenados;

Para calcular a qual percentil pertence um dado valor

Percentil do valor x = número de valores inferiores a x . 100


número total de valores

Ele também é válido para outros tipos de dados. O nome genérico dos
quartis, decis e percentis é separatrizes.
Denominamos percentis ou centis como sendo os noventa e nove
valores que separam uma série em 100 partes iguais.
O percentil de ordem px100 (9<p<1), em um conjunto de dados de
tamanho n, é o valor da variável que ocupa a posição px (n+1) do
conjunto de dados ordenados. O percentil de ordem p (ou p-quantil)
deixa px100% das observações abaixo dele na amostra ordenada.
Casos particulares:

• Percentil 50 = mediana, segundo quartil (md, Q2, q(0,5))

• Percentil 25 = primeiro quartil (Q1), q(0,25)

• Percentil 75 = terceiro quartil (Q3), q(0,75)

Exemplo: 15,5,3,8,10,2,7,11,12 → n=9


ordenamos: 2<3<5<7<8<10<11<12<15
P1= 1/18; p2=3/18; p3=5/18; p4=7/18; p5=1/2; p6=11/18;
p7=13/18; p8=15/18; p9=17/18
Posição Md : q(0,5) =8
Posição de Q1 : q(0,25) = 4,5
Posição de Q3 : q(0,75) = 11,25

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: <http://www.norg.uminho.pt/emgpf/documentos/
Aplicada.pdf> Acesso em 29 de setembro de 2014. A apostila fundamenta
or principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

44
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: <http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.
pdf.> Acesso em 29 de setembro de 2014.

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Média aritmética
Média de todos os dados da amostra.

População
É o agrupamento de dados.

Referências
Referência bibliográfica básica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual.


São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo:
Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos de


economia, administração e ciências contábeis. 3.ed. São Paulo:
Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referência bibliográfica complementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5.ed. São


Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o


microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e
Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São


Paulo: Makron Books, 1993.

STEVENSON, W.J. Estatística Aplicada à Administração. São Paulo:


Harbra, 1996.

VIEIRA, Sonia. Elementos de estatística. 3.ed. São Paulo: Atlas, 1999.


145p. ISBN 85-224-2163-3.
45
PROBABILIDADE E ESTATÍSTICA
Unidade 5

UNIDADE 5
TEMA 10:
INTERVALO DE CLASSES

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar o intervalo de classes.
• Quais ferramentas são necessárias para encontrar o intervalo
de classes.
• Como pode ser aplicado o intervalo de classes.
• Comparação entre os diferentes intervalos existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o intervalo
de classe?
• É possível extrair o intervalo de classe a partir de gráficos e
tabelas?
• Como aplicar o intervalo de classe nas mais variadas situações?
• O intervalo de classe é o ponto final do dado que pode ser
obtido?

Leitura Obrigatória

O intervalo de classe faz parte dos elementos de uma distribuição de


frequência. As classes são intervalos de variação de uma variável.
As classes são representadas simbolicamente por i, sendo i=1,2, ...,
κ, onde κ é o número total de classes. O número total de valores é
simbolicamente por n. Assim no exemplo, o intervalo 154 -158 define
a segunda classe (i=2), o intervalo 166-170 define a quinta classe (i=5)
e assim por diante. Como a distribuição tem seis classes, logo κ=6, a
variável x assume 40 valores, logo n=40.
Os limites de classes são os extremos de cada classe. Para uma
determinada classe i, o limite inferior é simbolizado por l1 e o limite O intervalo de classe faz parte dos
superior por L1. O limite inferior da segunda classe é escrito como l2 = elementos de uma distribuição de
154, enquanto o limite superior da segunda classe é escrito como L2 = frequência.
158. De acordo com o IBGE as classes devem ser escritas como desta
qualidade até menor que aquela usando para isso o simbolo -. Assim,
l1-L1 significa inclusão de l1, e exclusão de L1. O indivíduo com estatura
158 cm estaria na terceira classe (i=3) e não na segunda.

46
PROBABILIDADE E ESTATÍSTICA
Unidade 5

A amplitude de um intervalo de classe ou simplesmente intervalo de


classe é o tamanho do intervalo que define a classe. O intervalo de
classe i é simbolizado por h1 e é obtido pela diferença entre os seus
limites.

h1 = L1-l1

No exemplo que usamos, o tamanho do intervalo da segunda classe


(h2) vale

h2 = L2-l2 = 158-154 = 4cm

Todos as outras classes do exemplo também têm intervalo de 4cm,


pois este é o intervalo entre cada um dos limites inferiores e os limites A amplitude de um intervalo de
classe ou simplesmente intervalo
superiores correspondentes. Quando dispomos de uma tabela primitiva
de classe é o tamanho do intervalo
ou de um rol, precisamos estabelecer a quantidade e o intervalo das
que define a classe.
classes que vamos criar; de outro modo, a distribuição de frequência
pode não ser util para a nova análise. Uma das maneiras de determinar
o número de classes é usando a Regra de Sturges que determina κem
função de n:
κ ± 1+3,3 log(n), onde κ é o número de classes e o n é o número de
dados. O limite superior não é computado na classe em que aparece,
isto é, a frequência desse elemento é incluída na classe onde ele é
inferior. Observe que o limite superior de uma classe é o limite inferior
da classe seguinte. Numa distribuição de frequência (tabela) temos a
chamada amplitude total (AT) que é obtida fazendo-se L(max)-Lmin,
se a distribuição estiver organizada em intervalos de classe (os dados
estiverem agrupados) ou simplesmente subtraindo-se o menor valor do
maior da sequência, se a distribuição estiver sem intervalo de classe (os
dados não estiverem agrupados).
Dessa forma, sugerimos que quando uma sequência de dados
estatísticos é tal que não seja possível fazer uma distribuição de As variáveis quantitativas contínuas
devem ser trabalhadas com
frequência (tabela) com, aproximadamente, até dez classes pode não
intervalos de classe.
ser necessário utilizar o recurso de intervalos de classes. A menos que
se agrupar por faixa etária, por exemplo, não há necessidade de se
trabalhar com intervalos quando o número de classes não exceder a
dez. Recomenda-se também que o número não ultrapasse 20 classes e
nem seja menor do que 5.
Há circunstâncias, porém, que se torna imperioso fazer agrupamentos
dos dados em intervalos de classe, seja pela quantidade deles, seja
pela forma como aparecem (forma decimal, por exemplo). As variáveis
quantitativas contínuas devem ser trabalhadas com intervalos de classe.

47
PROBABILIDADE E ESTATÍSTICA
Unidade 5

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Finalizando

Neste tema você aprendeu, brevemente, como calcular o intervalo de


classes adequadamente nas mais variadas circunstâncias estatísticas.

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Coeficiente
Termo determinado para ajustar a amostra.

Celsius
Escala de temperatura.

48
PROBABILIDADE E ESTATÍSTICA
Unidade 5

TEMA 11:
AMPLITUDE DE VARIÂNCIA

Conteúdos e Habilidades

Nesta aula, você estudará:


• Como encontrar a amplitude de variância.
• Quais ferramentas são necessárias para encontrar a amplitude
de variância.
• Como pode ser aplicada.
• Comparação entre as diferentes amplitudes de variância
existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar a amplitude
de variância?
• É possível extrair a amplitude de variânciaa partir de gráficos e
tabelas?
• Como aplicar a amplitude de variância nas mais variadas
situações?
• A amplitude de variância é o ponto final do dado que pode ser
obtido?

Leitura Obrigatória

Quando usamos uma “medida de tendência central, a média, a mediana


ou a moda, para caracterizar uma amostra, esquecemo-nos de dizer se A amplitude traduz a diferença
máxima observada entre dois
existe muita variabilidade dos individuos ou não. Por exemplo, saber
individuos da população (em termos
que o rendimento per capita médio dos EUA (U$31338) é igual ao
de variável estatística).
rendimento per capita médio da Islândia (U$31342), não nos permite
saber se existe uma maior percentagem de pobres nos EUA do que na
Islândia.
A amplitude traduz a diferença máxima observada entre dois individuos
da população (em termos de variável estatística). Depois de ordenados
os individuos, a amplitude quantifica-se pela diferença entre o “maior”
indivíduo e “menor” indivíduo:

49
PROBABILIDADE E ESTATÍSTICA
Unidade 5

A = x(n) - x(1)

A principal desvantagem da amplitude é que é muito sensível aos


indivíduos extremos, sendo muito influenciáveis por outliers. Outra A amplitude é uma medida rápida
desvantagem é não levar em consideração todos os indivíduos, mas da variabilidade.
apenas os dois extremos. Finalmente, quando a variável estatística
é discreta (classes), desde que exista pelo menos um indivíduo nas
classes extremas, a amplitude é sempre máxima, independentemente
da heterogeneidade da amostra.

● A amplitude de uma população formada por individuos iguais é


zero.

● A amplitude do produto de uma constante (diferente de zero)


por uma variável estatística é igual ao produto da constante pela
amplitude da variável estatística.

● A amplitude da soma de uma constante com uma variável


estatística é igual à amplitude da variável estatística

A variância amostral quantifica a distância ao quadrado média dos


indivíduos ao ponto central (desvio quadrático médio). Sendo X o ponto
central então a variância amostral, S2, vem dada por:

A variância amostral representa na física a dificuldade de um corpo alterar


a velocidade de rotação (mede a inércia angular do corpo material). A sua
importância deriva de, em termos teóricos, o comportamento dinâmico
de dois corpos serem idênticos se tiverem a mesma inércia angular
(variância) e o mesmo centro de massa (ponto médio). Por semelhança
com o sistema físico, duas populações serão semelhantes se tiverem a
mesma média e a mesma variância.
Em outras palavras, a amplitude é uma medida rápida da variabilidade.
Ela consiste na diferença entre o mais alto e o mais baixo valor de um
determinado conjunto de dados (ou seja, de um determinado campo
numérico da tabela Oracle). No entanto, na prática a amplitude não é
uma medida muito boa. Ela tem a vantagem de ser simples e rápida
de calcular. Porém tem a desvantagem de depender apenas de dois
valores de toda a distribuição (o menor valor e o maior valor). Com isso,
ela pode ser claramente influenciada por um único valor. Precisamos
então de medidas que levem em conta todos os valores da distribuição.
Essas medidas são a variância e o desvio padrão.

50
PROBABILIDADE E ESTATÍSTICA
Unidade 5

Para entendermos a variância, inicialmente precisamos apresentar


o conceito de desvio que consiste na distância de um valor arbitrário
ao valor médio da variável. A variância considera todos os valores da
distribuição, oferecendo uma vantagem sobre a amplitude que considera
somente dois valores. Por isso, ela é mais sensível ao grau de desvio
da distribuição de escores. No entanto, um problema da variância é a
sua interpretação difícil. Como no numerador da fórmula, os valores
dos desvios são elevados ao quadrado, a unidade original de medida
acaba sendo alterada. Por exemplo, de número de jogos, para número
de jogos ao quadrado, ou seja, o valor 1,333 para a variância significa
1,333 jogos ao quadrado.

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Coeficiente
Termo determinado para ajustar a amostra.

Celsius
Escala de temperatura.

51
PROBABILIDADE E ESTATÍSTICA
Unidade 5

Referências

Referência bibliográfica básica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual.


São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo:
Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos de


economia, administração e ciências contábeis. 3.ed. São Paulo:
Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referência bibliográfica complementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5.ed. São


Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o


microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e
Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São


Paulo: Makron Books, 1993.

STEVENSON, W.J. Estatística Aplicada à Administração. São Paulo:


Harbra, 1996.

VIEIRA, Sonia. Elementos de estatística. 3.ed. São Paulo: Atlas, 1999.


145p. ISBN 85-224-2163-3.

52
PROBABILIDADE E ESTATÍSTICA
Unidade 6

UNIDADE 6
TEMA 12:
DESVIO PADRÃO

Conteúdos e Habilidades

Nesta aula, você estudará:


• Como encontrar o desvio padrão.
• Quais ferramentas são necessárias para encontrar o desvio
padrão.
• Como pode ser aplicado.
• Comparação entre os diferentes desvios padrões.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o desvio
padrão?
• É possível extrair o desvio padrão a partir de tabelas?
• Como aplicar o desvio padrão nas mais variadas situações ?
• O desvio padrão é o ponto final do dado que pode ser obtido ?

Leitura Obrigatória

Embora tenha sido ultimamente pouco discutido, o cálculo da média


O desvio padrão de uma distribuição
aritmética e do desvio padrão de produtos e quocientes apresenta
de probabilidade, de uma variável
grande interesse estatístico. O desvio padrão de uma distribuição de
aleatória ou população é uma
probabilidade, de uma variável aleatória ou população é uma medida do medida do espalhamento dos seus
espalhamento dos seus valores. Ele é definido com a raiz quadrada da valores.
variância.
Para entender o desvio padrão, lembre-se que a variância é a média das
diferenças ao quadrado entre os pontos dados e a média. A variância
está tabulada em unidades quadradas. O desvio padrão, sendo a raiz
quadrada daquela quantidade, portanto, mede o espalhamento dos
dados ao redor da média, medida na mesma unidade que os dados.
Por exemplo, na população {4,8}, a média é 6 e os desvios da média
são {-2,2}. Estes desvios quadráticos são {4,4) a média dos quais
é 4. Portanto o desvio padrão é 2. Neste caso 100% dos valores da
população estão a um desvio padrão da média. O desvio padrão é a
medida mais comum da dispersão estatística, medindo quão largamente

53
PROBABILIDADE E ESTATÍSTICA
Unidade 6

estão espalhados os valores num conjunto de dados. Se muitos pontos


dados estão próximos à média, então o desvio padrão é pequeno; se
muitos pontos dados estão longe da média, então o desvio padrão é
grande. Se todos os valores forem iguais, então o desvio padrão é zero.
Para uma população, o desvio padrão pode ser estimado por um desvio
padrão modificado de uma amostra.

* Suponha que desejamos encontrar o desvio padrão do conjunto dos


números 4 e 8.

• Passo 1:
O desvio padrão é a medida mais
Encontre a média aritmética (ou média) de 4 e 8 = 6
comum da dispersão estatística,
medindo quão largamente estão
• Passo 2: espalhados os valores num conjunto
Encontre a diferença entre cada número e a média de dados.
4-6 = -2
8-6 = 2

• Passo 3:
Eleve ao quadrado cada uma das diferenças
(-2)2 = 4
22 = 4

• Passo 4:
Some as diferenças obtidas → 4 + 4 = 8

• Passo 5:
Divida a soma pela quantia de pontos (aqui temos dois números)
→ 8/2 = 4

• Passo 6:
Tome a raiz quadrada não negativa do quociente → RAIZ4 = 2
** Assim o desvio padrão é 2

Nem todas as variáveis aleatórias têm desvio padrão, pois estes valores
esperados não precisam existir. Por exemplo, o desvio padrão de uma
variável aleatória que segue uma distribuição de Cauchy é indefinida.
A distribuição de Cauchy-Lorentz, assim chamada em homenagem a
Augustin Cauchy e Hendrik Lorentz, é a distribuição de probabilidades
dada pela função densidade de probabilidade

A sua média não é definida, logo ela também não tem desvio padrão. O
seu segundo cumulante é infinito.
A distribuição de Cauchy pode ser simulada como a razão entre duas
normais independentes.

54
PROBABILIDADE E ESTATÍSTICA
Unidade 6

No mundo real, encontrar o desvio padrão de uma população toda não é


realística, exceto em certos casos, tais como standardized testing, onde
cada membro de uma população é tirado da amostra. Na maioria dos
casos, o desvio padrão de uma população é estimado examinando uma
amostra aleatória tirada da população.
Importante

1) seu valor é afetado pelo número de observações e como


elas estão distribuídas, mas ela não é afetada pelos valores das
observações externas;

2) é difícil encontrar o desvio padrão de uma população geral, o


ideal é selecionar bem a amostra.

3) seu valor pode ser obtido, como vimos, em distribuições, com


limites superiores indeterminados para a sua última classe;

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Média aritmética
Média de todos os dados da amostra.

População
É o agrupamento de dados.

55
PROBABILIDADE E ESTATÍSTICA
Unidade 6

TEMA 13:
COEFICIENTE DE VARIAÇÃO

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar o coeficiente de variação.
• Quais ferramentas são necessárias para encontrar o coeficiente
de variação.
• Como pode ser aplicado.
• Comparação entre os diferentes coeficientes existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o coeficiente
de variação?
• É possível extrair o coeficiente de variação a partir de gráficos e
tabelas?
• Como aplicar o coeficiente de variação nas mais variadas
situações ?
• O coeficiente de variação é o ponto final do dado que pode ser
obtido?

Leitura Obrigatória

O coeficiente de variação é uma medida de dispersão relativa empregada


O coeficiente de variação é uma
para estimar a precisão de experimentos e representa o desvio-padrão
medida de dispersão relativa
expresso como porcentagem da média. Sua principal qualidade é
empregada para estimar a precisão
a capacidade de comparação de distribuições diferentes. Ele pode de experimentos e representa o
ser obtido pela razão entre o desvio-padrão e a média e indica-se a desvio-padrão expresso como
variância por S2. O primeiro passo, entretanto, é encontrar primeiro o porcentagem da média.
desvio padrão.
Apenas relembrando:

Coeficiente de Variação

56
PROBABILIDADE E ESTATÍSTICA
Unidade 6

O desvio-padrão é calculado pela raiz quadrada da variância e é


representado por S, sendo também considerado uma medida de O coeficiente de variação em uma
dispersão, relativo à média e como duas distribuições podem ter médias/ carteira de ativos serve como
medida de risco para cada unidade
valores médios diferentes, o desvio-padrão dessas duas distribuições
de ativo.
não é compatível. O coeficiente de variação é ainda multiplicado por
100, passando a ser expresso como percentagem.
Exemplo:
O coeficiente de variação é dado pela fórmula:

Onde,

Cv → é o coeficiente de variação

s → é o desvio padrão

X ̅ → é a média dos dados

O coeficiente de variação é dado em %, por isso a fórmula é multiplicada


por 100.
O coeficiente de variação em uma carteira de ativos serve como medida
A palavra razão, vem do latim
de risco para cada unidade de ativo. O uso do coeficiente de variação é
ratio, e significa “divisão”. Como
usualmente recomendado para variáveis quantitativas do tipo razão (na no exemplo anterior, são diversas
qual exista um zero absoluto), tais como altura, peso e velocidade. as situações em que utilizamos o
conceito de razão.
Se a variável não é do tipo razão (exemplo, temperatura em graus
Celsius), o coeficiente de variação poderá assumir valores negativos
(caso a média seja negativa) a sua interpretação dependerá do
ponto de referência (ponto considerado como 0 na escala), levando a
interpretações equivocadas e relativas.
Uma outra definição do coeficiente de variação é que é a medida da
variabilidade. É independente da unidade da medida utilizada, sendo
que – mesmo que a unidade dos dados observados seja diferente, seu
valor não será alterado. O coeficente de variação (CV) é o desvio padrão
expresso como uma porcentagem média.

CV = 100. (s/média) (%)

Vejamos um exemplo onde se pretende comparar dois conjuntos de


dados quanto às suas variabilidades. O primeiro conjunto de 84 famílias
possui um desvio padrão para o salário de casa de s1 – R$28,04. O
segundo composto também por 84 familias possui um desvio padrão para
o gasto diário de s2 = R$61,00. É dificil uma comparação racional entre
esses valores, pois os desvios só podem ser devidamente avaliados

57
PROBABILIDADE E ESTATÍSTICA
Unidade 6

quando comparados entre a mesma grandeza. Assim, sabendo-se que


a média de salário das familias foi a média = R$405,83 e considerando
que o gasto médio diário no segundo conjunto foi de R$241,00, os
coeficientes de variação são respectivamente:

CV1 = 100 x 28,04/405,83

CV2 = 100 x 6/24 = 25%

Verifica-se que o CV para o gasto médio diário é muito maior do que


para o salário de casa. Logo, concluímos através do CV de cada grupo,
que o CV do grupo 2 é muito maior que o do grupo 1. O coeficiente
de variação tem aplicações na pesquisa para comparar a precisão de
diferentes experimentos. Entretanto, a qualificação de um coeficiente
como alto ou baixo requer familiaridade com o material que é objeto da
pesquisa.
Uma pergunta que pode surgir é: o desvio padrão calculado é grande
ou pequeno? Esta questão é relevante, por exemplo, na avaliação da
precisão de métodos. Um desvio padrão pode ser considerado grande
ou pequeno dependendo da ordem da grandeza da variável.
Um CV é considerado baixo (indicando um conjunto de dados
razoavelmente homogêneo) quando for menor ou igual a 25%.
Entretanto, esse padrão varia de acordo com a aplicação. Por exemplo,
em medidas vitais (batimento cardíaco, temperatura corporal, etc)
espera-se CV muito menor do que 25% para que os dados sejam
considerados homogêneos. Pode ser dificil classificar um coeficiente
de variação como baixo, médio, alto ou muito alto, mas este pode ser
bastante útil na comparação de duas variáveis ou dois grupos que a
princípio não são comparáveis.

Importante

1) O CV é interpretado como a variabilidade dos dados em relação


à média. Quanto menor o CV mais homogêneo é o conjunto de
dados

2) Adimensional, isto é, um número puro, que será positivo se


a média for positiva; será zero quando não houver variabilidade
entre os dados

3) Usualmente expresso em porcentagem, indicando o percentual


em que o desvio padrão é menor (100%CV<100%) ou maior
(100%CV>100%) do que a média.

58
PROBABILIDADE E ESTATÍSTICA
Unidade 6

Links Importantes

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.


Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.
pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or
principais conceitos relacionados a preparação da tabela e suas
aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.
Acesso em 29 de setembro de 2014.

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Coeficiente
Termo determinado para ajustar a amostra.

Celsius
Escala de temperatura.

59
PROBABILIDADE E ESTATÍSTICA
Unidade 6

TEMA 14:
COEFICIENTE DE CORRELAÇÃO

Conteúdos e Habilidades
Nesta aula, você estudará:
• Como encontrar o coeficiente de correlação.
• Quais ferramentas são necessárias para encontrar o coeficiente
de correlação.
• Como pode ser aplicado.
• Comparação entre os diferentes coeficientes existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:


• Todos os dados podem ser utilizados para encontrar o coeficiente
de correlação?
• É possível extrair o coeficiente de correlação a partir de gráficos
e tabelas?
• Como aplicar o coeficiente de correlação nas mais variadas
situações?
• O coeficiente de correlação é o ponto final do dado que pode ser
obtido?

Leitura Obrigatória
O coeficiente de correlação também é chamado de “coeficiente de
correlação produto-momento” ou simplesmente de “ρ” e mede o grau de
correlação (e a direção dessa correlação – se positiva ou negativa) entre
duas variáveis de escala métrica (intervalar ou de razão).
Esse coeficiente, normalmente representado por ρ assume apenas
valores entre -1 e 1.

ρ = 1, significa uma correlação perfeita positiva entre as duas


variáveis

ρ = -1, significa uma correlação negativa perfeita entre as duas


variáveis, isto é, se uma aumenta, a outra diminui

ρ = 0, significa que as duas variáveis não dependem linearmente


uma da outra. No entanto, pode existir uma dependência não
linear. Assim, o resultado ρ = 0 deve ser investigado por outros
meios.

60
PROBABILIDADE E ESTATÍSTICA
Unidade 6

O tamanho da variável indica força da correlação:

- 0,70 para mais ou para menos indica uma forte correlação

- 0,30 a 0,7 positivo ou negativo indica correlação moderada

- 0 a 0,30 indica fraca correlação (de acordo com o gráfico abaixo)

Usamos o termo correlação positiva quando r>0 e nesse caso à medida


que X cresce também cresce y e a correlação negativa quando r<0, e
nesse caso à medida que o X cresce y decresce (em média). Quanto
maior o valor de r (positivo ou negativo) mais forte a associação. No
extremo, se r=1 ou r=-1 então todos os pontos no gráfico de dispersão
caem exatamente numa linha reta. No outro extremo, se r=0 não existe
nenhuma associação linear. Note que correlações não dependem da
escala de valores de x ou y. Por exemplo, obteríamos o mesmo valor se
medíssemos altura e peso em metros e kilograma ou em pés e libras.
Considerando que o CV é útil para comparação, em termos relativos do
grau de concentração em torno da média

Se CV é menor ou igual a 15% ocorre baixa dispersão tornando a


amostra homogênea e estável; já se estiver entre 15 a 30% considera-
se uma dispersão média e se estiver maior que 30% considera-se de
alta dispersão e heterogênea. Um exemplo é o que está a seguir:

61
PROBABILIDADE E ESTATÍSTICA
Unidade 6

Os valores tomados individualmente no correr de um processo podem


parecer todos distintos e estarem dentro dos requisitos mínimos; como
um grupo, entretanto, eles tendem a formar padrões que podem ser
descritos como uma distribuição que pode ser caracterizada pelos
seguintes fatores:
Localização: valor específico da distribuição

Dispersão: a extensão de variação do menor valor ao maior

Forma: define o padrão de variação – simétrica, obliqua, etc

Importante
1) O CV é interpretado como a variabilidade dos dados em relação
à média. Quanto menor o CV mais homogêneo é o conjunto de
dados
2) Adimensional, isto é, um número puro, que será positivo se
a média for positiva; será zero quando não houver variabilidade
entre os dados
3) Usualmente expresso em porcentagem, indicando o percentual
que o desvio padrão é menor (100%CV<100%) ou maior
(100%CV>100%) do que a média.

Links Importantes
Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.
Disponível em: <http://www.norg.uminho.pt/emgpf/documentos/
Aplicada.pdf>. Acesso em 29 de setembro de 2014. A apostila
fundamenta or principais conceitos relacionados a preparação da tabela
e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique


Dantas Neder. Disponível em: <http://www.ecn26.ie.ufu.br/TEXTOS_
ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.
pdf>. Acesso em 29 de setembro de 2014.

62
PROBABILIDADE E ESTATÍSTICA
Unidade 6

Glossário

Desvio Padrão
É a medida de espalhamento de valores.

Variância
É o agrupamento de dados.

Coeficiente
Termo determinado para ajustar a amostra.

Celsius
Escala de temperatura.

Referências

Referência bibliográfica básica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual.


São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo:
Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos de


economia, administração e ciências contábeis. 3.ed. São Paulo:
Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referência bibliográfica complementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5.ed. São


Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o


microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e
Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São


Paulo: Makron Books, 1993.

STEVENSON, W.J. Estatística Aplicada à Administração. São Paulo:


Harbra, 1996.

VIEIRA, Sonia. Elementos de estatística. 3.ed. São Paulo: Atlas, 1999.


145p. ISBN 85-224-2163-3.

63

Você também pode gostar