Você está na página 1de 66

Introdução aos Métodos Estatı́sticos

Fábio Rodrigues Silva Geisiane Rodrigues dos Santos

Departamento de Ciências Exatas e da Terra

06/08 e 08/08

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 1 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 2 / 44
A Estatı́stica e suas Aplicações

Estatı́stica
A Estatı́stica emprega métodos para a coleta, organização, descrição, análise e interpretação
de dados para a tomada de decisões em ambientes de incertezas e variações.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 3 / 44
A Estatı́stica e suas Aplicações

Estatı́stica
A Estatı́stica emprega métodos para a coleta, organização, descrição, análise e interpretação
de dados para a tomada de decisões em ambientes de incertezas e variações.

Objetivos da disciplina
Proporcionar ao acadêmico uma visão abrangente das potencialidades dos métodos
estatı́sticos e o domı́nio das técnicas básicas da Ciência Estatı́stica, requerida no
planejamento, análise de dados, interpretação de resultados de pesquisa cientı́fica,
capacitando-o a manusear adequadamente os grandes volumes de dados.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 3 / 44
A Estatı́stica e suas Aplicações

Estatı́stica
A Estatı́stica emprega métodos para a coleta, organização, descrição, análise e interpretação
de dados para a tomada de decisões em ambientes de incertezas e variações.

Objetivos da disciplina
Proporcionar ao acadêmico uma visão abrangente das potencialidades dos métodos
estatı́sticos e o domı́nio das técnicas básicas da Ciência Estatı́stica, requerida no
planejamento, análise de dados, interpretação de resultados de pesquisa cientı́fica,
capacitando-o a manusear adequadamente os grandes volumes de dados.

Capacitar o aluno para o processo de coleta, apresentação e análise de dados, elaboração e


interpretação de tabelas e gráficos estatı́sticos, bem como para o cálculo e análise dos
principais indicadores estatı́sticos.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 3 / 44
A Estatı́stica e suas Aplicações

As principais técnicas que serão desenvolvidas no decorrer do curso têm por finalidade
auxiliar a responder, de forma objetiva e segura, situações que envolvem uma grande
quantidade de informações:

§ Em jogos de futebol, o número de escanteios, de faltas cometidas e o tempo de posse de


bola são dados geralmente fornecidos para auxiliar na conclusão de qual time foi
melhor em campo;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 4 / 44
A Estatı́stica e suas Aplicações

As principais técnicas que serão desenvolvidas no decorrer do curso têm por finalidade
auxiliar a responder, de forma objetiva e segura, situações que envolvem uma grande
quantidade de informações:

§ Em jogos de futebol, o número de escanteios, de faltas cometidas e o tempo de posse de


bola são dados geralmente fornecidos para auxiliar na conclusão de qual time foi
melhor em campo;

§ Uma firma está se preparando para lançar um novo produto e precisa conhecer as
preferências dos consumidores no mercado de interesse. Para isso, pode fazer uma
pesquisa de mercado entrevistando um número de residências escolhidas
aleatoriamente e usar os resultados para estimar as preferências de toda a população;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 4 / 44
A Estatı́stica e suas Aplicações

§ As técnicas estatı́sticas são necessárias para separar efeitos de fatores diferentes. É


possı́vel que, em uma comunidade, o consumo de sorvete dependa do preço do produto,
da renda média local, do número de crianças na comunidade e da temperatura média.
Se dispuser de observações de todos os diferentes fatores em jogo, podemos aplicar a
análise de regressão para determinar quais fatores têm os efeitos mais importantes;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 5 / 44
A Estatı́stica e suas Aplicações

§ As técnicas estatı́sticas são necessárias para separar efeitos de fatores diferentes. É


possı́vel que, em uma comunidade, o consumo de sorvete dependa do preço do produto,
da renda média local, do número de crianças na comunidade e da temperatura média.
Se dispuser de observações de todos os diferentes fatores em jogo, podemos aplicar a
análise de regressão para determinar quais fatores têm os efeitos mais importantes;

§ Testes de medicamentos (determinação de efeitos colaterais e eficácia no controle de


enfermidades) em dois grupos semelhantes (grupo experimental e grupo de controle): a
análise estatı́stica auxilia a determinar se todas as diferenças observadas realmente
foram causadas pelo novo medicamento ou se poderiam ter sido causadas por outros
fatores;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 5 / 44
A Estatı́stica e suas Aplicações

De modo geral, podemos dividir a Estatı́stica em três áreas:

§ Estatı́stica Descritiva: trata-se de um conjunto de técnicas destinadas a descrever e


resumir os dados, a fim de que possamos tirar conclusões a respeito das caracterı́sticas
de interesse;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 6 / 44
A Estatı́stica e suas Aplicações

De modo geral, podemos dividir a Estatı́stica em três áreas:

§ Estatı́stica Descritiva: trata-se de um conjunto de técnicas destinadas a descrever e


resumir os dados, a fim de que possamos tirar conclusões a respeito das caracterı́sticas
de interesse;
§ Probabilidade: teoria matemática utilizada para se estudar a incerteza oriunda de
fenômenos de caráter aleatório;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 6 / 44
A Estatı́stica e suas Aplicações

De modo geral, podemos dividir a Estatı́stica em três áreas:

§ Estatı́stica Descritiva: trata-se de um conjunto de técnicas destinadas a descrever e


resumir os dados, a fim de que possamos tirar conclusões a respeito das caracterı́sticas
de interesse;
§ Probabilidade: teoria matemática utilizada para se estudar a incerteza oriunda de
fenômenos de caráter aleatório;
§ Inferência Estatı́stica: estudo das técnicas que possibilitam a extrapolação, a um grande
conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de
valores, usualmente de dimensão muito menor.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 6 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 7 / 44
Definições

Definição (Dados)
Dados são fatos e números coletados, analisados e sintetizados para apresentação e
interpretação. Todos os dados coletados em um estudo particular denominam-se conjunto
de dados.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 8 / 44
Definições

Definição (Dados)
Dados são fatos e números coletados, analisados e sintetizados para apresentação e
interpretação. Todos os dados coletados em um estudo particular denominam-se conjunto
de dados.

Definição (Elementos)
Elementos são as entidades a respeito das quais se coletam os dados.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 8 / 44
Definições

Definição (Dados)
Dados são fatos e números coletados, analisados e sintetizados para apresentação e
interpretação. Todos os dados coletados em um estudo particular denominam-se conjunto
de dados.

Definição (Elementos)
Elementos são as entidades a respeito das quais se coletam os dados.

Definição (Variável)
Variável é a caracterı́stica de interesse a ser estudada.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 8 / 44
Definições

Definição (Dados)
Dados são fatos e números coletados, analisados e sintetizados para apresentação e
interpretação. Todos os dados coletados em um estudo particular denominam-se conjunto
de dados.

Definição (Elementos)
Elementos são as entidades a respeito das quais se coletam os dados.

Definição (Variável)
Variável é a caracterı́stica de interesse a ser estudada.

Definição (Escalas de Medição)


Escalas de medição determinam a quantidade de informação contida nos dados.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 8 / 44
Definições - Escalas de medição

As escalas de medição pode ser:


§ Escala Nominal – quando os dados referentes a uma variável consistem em rótulos ou
nomes usados para identificar um atributo do elemento;

§ Escala Ordinal – quando os dados exibirem as propriedades de dados nominais e


quando a ordem de classificação dos dados é significativa;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 9 / 44
Definições - Escalas de medição

As escalas de medição pode ser:


§ Escala Nominal – quando os dados referentes a uma variável consistem em rótulos ou
nomes usados para identificar um atributo do elemento;

§ Escala Ordinal – quando os dados exibirem as propriedades de dados nominais e


quando a ordem de classificação dos dados é significativa;

§ Escala Intervalar – quando os dados exibem as propriedades de dados ordinais e o


intervalo entre os valores for expresso em termos de unidade de medida fixa. Dados de
intervalo são sempre numéricos e possuem um ponto zero arbitrário;

§ Escala de Razão – quando os dados tiverem todas as propriedades de dados


intervalares e o quociente de dois valores for significativo (possui um zero absoluto).

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 9 / 44
Definições

Exemplo
§ Escala nominal: sexo (masculino e feminino), tipos de lojas (minimercados,
supermercados, hipermercados), nomes, raça, etc.

§ Escala ordinal: altura (baixo, médio, alto), grau de satisfação, escolaridade, status
socioeconômico, etc.

§ Escala intervalar: temperatura Celsius e Fahrenheit (o zero não indica ausência de


temperatura, daı́ ocorre que a operação de divisão é ilegı́tima), altitude, tempo
(calendário), etc.

§ Escala de razão: temperatura Kelvin, idade, peso, altura (é diferente de altitude),
área, distância, Velocidade, quantias em dinheiro, ı́ndices de retorno, contagem da
população, perı́odos de tempo, volume, etc.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 10 / 44
Definições

Dados categorizados podem ser agrupados por categorias especı́ficas e utilizam a escala de
medição nominal ou ordinal.

Dados quantitativos utilizam valores numéricos para indicar quantidade e são obtidos
utilizando medição de escala intervalar ou de razão.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 11 / 44
Definições

Dados categorizados podem ser agrupados por categorias especı́ficas e utilizam a escala de
medição nominal ou ordinal.

Dados quantitativos utilizam valores numéricos para indicar quantidade e são obtidos
utilizando medição de escala intervalar ou de razão.

Definição (Dados de Seção Transversal)


São dados coletados no mesmo intervalo de tempo ou aproximadamente no mesmo
intervalo de tempo.

Definição (Dados de Série Temporal)


São dados coletados ao longo de diversos perı́odos.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 11 / 44
Exemplo

Tabela 1: Conjunto de dados referentes a 10 fundos mútuos de investimento.

Tipo Valor do Rendimento Quociente Classificação


Nome do Fundo de ativo médio em 5 de despesas pela
fundo lı́quido ($) anos (%) (%) Morningstar
American Century Ultra IE 14,37 30,53 1,41 3 estrelas
Artisan Small Cap DE 16,92 15,67 1,18 3 estrelas
Fidelity Contrafund DE 73,11 17,99 0,89 5 estrelas
Gabelli Asset AAA DE 49,81 16,70 1,36 4 estrelas
Kalmar Gr Val Sm Cp DE 15,30 15,31 1,32 3 estrelas
Oakmark I DE 40,37 9,51 1,05 2 estrelas
PIMCO Emerg Mkts Bd D FI 10,68 13,57 1,25 3 estrelas
RS Value A DE 26,27 23,68 1,36 4 estrelas
USAA Income FI 12,10 4,31 0,62 3 estrelas
Wasatch Sm Cp Growth DE 35,41 13,98 1,19 4 estrelas

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 12 / 44
Exemplo

Observando a 1 vemos que:


1. Trata-se de um conjunto de dados que contém informações financeiras;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 13 / 44
Exemplo

Observando a 1 vemos que:


1. Trata-se de um conjunto de dados que contém informações financeiras;

2. Cada fundo de investimento individualmente é um elemento;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 13 / 44
Exemplo

Observando a 1 vemos que:


1. Trata-se de um conjunto de dados que contém informações financeiras;

2. Cada fundo de investimento individualmente é um elemento;

3. Existem cinco variáveis: Tipo de fundo, Valor do ativo lı́quido ($), Rendimento
médio em 5 anos (%), Quociente de despesas (%) e Classificação pela Morningstar;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 13 / 44
Exemplo

Observando a 1 vemos que:


1. Trata-se de um conjunto de dados que contém informações financeiras;

2. Cada fundo de investimento individualmente é um elemento;

3. Existem cinco variáveis: Tipo de fundo, Valor do ativo lı́quido ($), Rendimento
médio em 5 anos (%), Quociente de despesas (%) e Classificação pela Morningstar;

4. A escala de medição da variável tipo de fundo é nominal, enquanto que a escala de


medição da variável Classificação pela Morningstar é ordinal;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 13 / 44
Exemplo

Observando a 1 vemos que:


1. Trata-se de um conjunto de dados que contém informações financeiras;

2. Cada fundo de investimento individualmente é um elemento;

3. Existem cinco variáveis: Tipo de fundo, Valor do ativo lı́quido ($), Rendimento
médio em 5 anos (%), Quociente de despesas (%) e Classificação pela Morningstar;

4. A escala de medição da variável tipo de fundo é nominal, enquanto que a escala de


medição da variável Classificação pela Morningstar é ordinal;

5. Os dados da tabela são transversais (estão no mesmo intervalo de tempo).

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 13 / 44
Exemplo
§ As pontuações do TOEFL ITP são exemplos de dados com escala intervalar: três
estudantes com pontuações TOEFL ITP iguais a 620, 550 e 470 podem ser classificados,
ou ordenados, em termos do melhor para o pior desempenho. Além disso, as diferenças
entre as pontuações são significativas: o estudante 1 pontuou 620 ´ 550 “ 70 pontos a
mais que o estudante 2, que por sua vez pontuou 550 ´ 470 “ 80 pontos a mais que o
estudante 3.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 14 / 44
Exemplo
§ As pontuações do TOEFL ITP são exemplos de dados com escala intervalar: três
estudantes com pontuações TOEFL ITP iguais a 620, 550 e 470 podem ser classificados,
ou ordenados, em termos do melhor para o pior desempenho. Além disso, as diferenças
entre as pontuações são significativas: o estudante 1 pontuou 620 ´ 550 “ 70 pontos a
mais que o estudante 2, que por sua vez pontuou 550 ´ 470 “ 80 pontos a mais que o
estudante 3.

§ Escala de medição de razão: Considere o custo de um automóvel. Um valor zero para o


custo indicaria que o automóvel não tem nenhum custo e é grátis. Além disso, se
compararmos o custo de $ 30 mil para um automóvel e o custo de % 15 mil para um
segundo automóvel, a propriedade da razão mostra que o primeiro automóvel é
$30mil
“ 2 vezes (ou o dobro) o custo do segundo automóvel
$15mil

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 14 / 44
Exemplo
§ As pontuações do TOEFL ITP são exemplos de dados com escala intervalar: três
estudantes com pontuações TOEFL ITP iguais a 620, 550 e 470 podem ser classificados,
ou ordenados, em termos do melhor para o pior desempenho. Além disso, as diferenças
entre as pontuações são significativas: o estudante 1 pontuou 620 ´ 550 “ 70 pontos a
mais que o estudante 2, que por sua vez pontuou 550 ´ 470 “ 80 pontos a mais que o
estudante 3.

§ Escala de medição de razão: Considere o custo de um automóvel. Um valor zero para o


custo indicaria que o automóvel não tem nenhum custo e é grátis. Além disso, se
compararmos o custo de $ 30 mil para um automóvel e o custo de % 15 mil para um
segundo automóvel, a propriedade da razão mostra que o primeiro automóvel é
$30mil
“ 2 vezes (ou o dobro) o custo do segundo automóvel
$15mil

§ Um estudo da média do preço do litro da gasolina comum entre 2014 e 2018 (por
exemplo) contém dados de série temporal.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 14 / 44
Definições

Uma variável categorizada ou categórica é aquela com dados categorizados (escala


nominal ou ordinal)

Uma variável quantitativa é aquela com dados quantitativos (escala intervalar ou de razão)

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 15 / 44
Definições

Uma variável categorizada ou categórica é aquela com dados categorizados (escala


nominal ou ordinal)

Uma variável quantitativa é aquela com dados quantitativos (escala intervalar ou de razão)

Os dados quantitativos podem ser discretos ou contı́nuos:


§ Discretos: dados quantitativos que medem uma quantidade (algo enumerável, como
idade, número de lâmpadas produzidas, etc.);

§ Contı́nuos: dados quantitativos que medem uma quantificação (algo não enumerável,
como peso, tempo, etc.).

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 15 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 16 / 44
Dados Categorizados

Definição (Distribuição de frequências absolutas)


Resumo tabular de dados mostrando o número (frequência absoluta) de itens em cada
uma das diversas classes não sobrepostas.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 17 / 44
Dados Categorizados

Definição (Distribuição de frequências absolutas)


Resumo tabular de dados mostrando o número (frequência absoluta) de itens em cada
uma das diversas classes não sobrepostas.

Definição (Distribuição de frequências relativas)


Resumo tabular de dados mostrando a frequência relativa para cada classe.

Frequência relativa – fração ou proporção de itens que pertencem a uma classe. Para um
conjunto de dados com n observações, a frequência relativa de cada classe é:

frequência absoluta da classe


frequência relativa de uma classe “
n

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 17 / 44
Dados Categorizados

Definição (Distribuição de frequências relativas percentuais)


Resumo tabular de dados mostrando a frequência relativa percentual dos dados para
cada classe.
Frequência relativa percentual – frequência relativa multiplicada por 100.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 18 / 44
Dados Categorizados

Definição (Distribuição de frequências relativas percentuais)


Resumo tabular de dados mostrando a frequência relativa percentual dos dados para
cada classe.
Frequência relativa percentual – frequência relativa multiplicada por 100.

Definição (Distribuição de frequências acumuladas)


Resumo tabular de dados mostrando o número de itens menores do que, ou iguais a,
determinado valor.
Na distribuição acumulada, podemos utilizar as frequências absolutas, relativas ou
percentuais: basta somar sucessivamente os dados das classes de frequência.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 18 / 44
Dados Categorizados
Gráfico de colunas – representa dados categorizados sintetizados em uma distribuição de
frequências absolutas, relativas ou relativas percentuais.

Em um dos eixos do gráfico especificamos os rótulos que são utilizados para as classes
(categorias). Uma escala em frequência absoluta, relativa ou relativa percentual pode ser
utilizada para o outro eixo do gráfico.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 19 / 44
Dados Categorizados
Gráfico de setores – também representa dados categorizados sintetizados em uma
distribuição de frequências absolutas, relativas ou relativas percentuais.

Utilizamos frequências relativas para subdividir o cı́rculo em setores, ou partes, que


correspondam à frequência relativa de cada classe: multiplicamos a frequência relativa por
360 graus e encontramos quantos graus corresponde certa classe.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 20 / 44
Dados Categorizados – Exemplo

Os dados abaixo correspondem a uma amostra de 50 indivı́duos com um dos seis


sobrenomes mais comuns nos Estados Unidos (The World Almanac, 2006):

Brown Williams Williams Williams Brown


Smith Jones Smith Johnson Smith
Davis Smith Brown Williams Johnson
Johnson Smith Smith Johnson Brown
Williams Davis Johnson Williams Johnson
Williams Johnson Jones Smith Brown
Johnson Smith Smith Brown Jones
Jones Jones Smith Smith Davis
Davis Jones Williams Davis Smith
Jones Johnson Brown Johnson Davis

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 21 / 44
Dados Categorizados – Exemplo

A tabela de distribuição de frequências para este caso ficaria da seguinte forma:

Frequência Frequência Frequência


Classe
absoluta relativa relativa (%)
Brown 7 0,14 14,00%
Davis 6 0,12 12,00%
Johnson 10 0,20 20,00%
Jones 7 0,14 14,00%
Smith 12 0,24 24,00%
Williams 8 0,16 16,00%
Total 50 1,00 100,00%

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 22 / 44
Dados Categorizados – Exemplo
Abaixo, representamos o gráfico de colunas para a distribuição de frequências absolutas

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 23 / 44
Dados Categorizados – Exemplo
Abaixo, representamos o gráfico de setores para a amostra de 50 indivı́duos com um dos seis
sobrenomes mais comuns dos EUA

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 24 / 44
Dados Quantitativos
Mesma definição para distribuição de frequências absolutas, porém há um cuidado maior
quanto à definição das classes não sobrepostas:
1. Determinar o número de classes não sobrepostas: não existe fórmula única
?
§ k “ 5 se n ď 25 e k “ n se n ą 25;
§ Fórmula de Sturges k “ 1 ` 3, 322 ¨ log10 n;

2. Determinar a amplitude de cada classe: recomenda-se a mesma amplitude para


cada classe. Podemos determinar a amplitude de classe aproximada identificando o
maior e o menor valor dos dados e dividimos a diferença entre eles pelo número de
classes (usamos o maior inteiro maior que o valor encontrado como sendo a amplitude
das classes);

3. Determinar os limites de cada classe: os limites devem ser escolhidos de modo que
cada elemento pertença a uma e somente uma classe. Utiliza-se com frequência o
intervalo misto ($), onde o limite inferior pertence à classe em questão mas o limite
superior não pertence.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 25 / 44
Dados Quantitativos
§ Ponto médio da classe é o valor intermediário entre os limites superior e inferior da
classe;

§ Distribuições de frequências – mesma definição;

§ Apresentação gráfica – Histograma: é construı́do colocando-se a variável de interesse no


eixo horizontal e no eixo vertical colocamos a frequência absoluta, relativa ou relativa
percentual.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 26 / 44
Tabela 2: Taxas municipais de urbanização no Estado de Alagoas, 1970
Municı́pio Taxa Municı́pio Taxa Municı́pio Taxa
Água Branca 8 Inhapi 9 Passo de Camaragibe 35
Anadia 24 Jacaré dos Homens 35 Paulo Jacinto 42
Arapiraca 46 Jacuı́pe 23 Penedo 71
Atalaia 13 Japaratinga 22 Piaçabuçu 50
Barra de Santo Antônio 38 Jaramataia 34 Pilar 52
Barra de São Miguel 54 Joaquim Gomes 13 Pindoba 17
Batalha 44 Jundiá 6 Piranhas 19
Belém 20 Junqueiro 14 Poço das Trincheiras 7
Belo Monte 17 Lagoa da Canoa 10 Porto Calvo 22
Boca da Mata 14 Limoeiro de anadia 6 Porto das Pedras 23
Branquinha 18 Maceió 92 Porto Real do Colégio 29
Cacimbinhas 15 Major Isidoro 16 Quebrangulo 29
Cajueiro 30 Maragogi 15 Rio Largo 58
Campo Alegre 24 Maravilha 23 Roteiro 77
Campo Grande 20 Marechal Deodoro 37 Santa Luzia do Norte 72
Canapi 8 Maribondo 36 Santanta do Ipanema 34
Capela 24 Mar Vermelho 8 Santana do Mundaú 12
Carneiros 18 Mata Grande 13 São Brás 40
Chã Preta 9 Matriz de Camaragibe 44 São José da Laje 25
Coité do Nóia 10 Messias 17 São José da Tapera 7
Colônia Leopoldina 38 Minador do Negrão 9 São Luı́s do Quitunde 32
Coqueiro Seco 79 Monteirópolis 30 São Miguel dos Campos 34
Coruripe 15 Murici 26 São Miguel dos Milagres 22
Delmiro Gouveia 62 Novo Lino 18 São Sebastião 7
Dois Riachos 23 Olho D’água das Flores 37 Satuba 44
Feira Grande 13 Olho D’água do Casado 43 Tanque D’Arca 15
Feliz Deserto 62 Olho D’água Grande 14 Taquarana 9
Flexeiras 18 Olivença 9 Traipu 16
Girau do Ponciano 8 Ouro Branco 28 União dos Palmares 31
Ibateguara 22 Palestina 41 Viçosa 30
Igaci 11 Palmeira dos Índios 42
Igreja Nova 17 Pão-de-Açúcar 35

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 27 / 44
Vamos sintetizar os dados quantitativos da Tabela 2 utilizando uma tabela de distribuição de
frequências:
1. Utilizando a fórmula de Sturges k “ 1 ` 3, 322log10 n para determinar a quantidade de
classes, vemos que k “ 1 ` 3, 322log10 94 “ 7, 555, o que nos mostra que usaremos 8
classes;
2. A amplitude dos dados observados é de 92% ´ 6% “ 86%. Assim, vemos que a
86%
amplitude aproximada de cada classe será “ 10, 75%. Assim, podemos usar
8
como amplitude 11%;
3. Aqui utilizaremos os limites mistos.

Tabela 3: Frequência das taxas municipais de urbanização no Estado de Alagoas, 1970


Intervalo Ponto Frequência Frequência Frequência
de classe Médio absoluta relativa relativa (%)
06% $ 17% 11,375% 31 0,3298 32,98%
17% $ 28% 22,125% 24 0,2553 25,53%
28% $ 39% 32,875% 19 0,2021 20,21%
39% $ 50% 43,625% 9 0,0957 9,57%
50% $ 61% 54,375% 4 0,0426 4,26%
61% $ 72% 65,125% 3 0,0319 3,19%
72% $ 83% 75,875% 3 0,0319 3,19%
83% $ 94% 86,625% 1 0,0106 1,06%
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 28 / 44
Histograma das taxas municipais de urbanização no Estado de Alagoas, 1970.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 29 / 44
Sintetização de dados
Um polı́gono de frequências pode ser construı́do ligando os pontos médios de cada uma
das classes não sobrepostas. A ligação entre os pontos é feita por linhas retas. Os pontos
começam e terminam no mesmo eixo em que os rótulos das classes são dispostos.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 30 / 44
Sintetização de dados
Quando utilizamos a distribuição de frequências acumuladas para gerar o gráfico de
colunas ou o histograma de frequências, o polı́gono de frequências recebe o nome de ogiva.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 31 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 32 / 44
Inferência estatı́stica
Muitas situações requerem informações sobre um grupo amplo de elementos. Em virtude do
tempo, custo e outros fatores, é possı́vel coletar dados somente de uma pequena parte deste.
Definição
§ População é o conjunto de todos os elementos de interesse em determinado estudo.
§ Amostra é um subconjunto da população.

§ O processo de realização de uma pesquisa (levantamento) para coletar dados


correspondentes a uma população inteira se chama censo.
§ O processo de realização de uma pesquisa para coletar dados correspondentes a uma
amostra é denominado pesquisa amostral.
§ A Estatı́stica usa dados de uma amostra para fazer estimativas e testar hipóteses a
respeito das caracterı́sticas de uma população, utilizando um processo conhecido como
inferência estatı́stica.
§ Quando se utiliza uma amostra para estimar determinada caracterı́stica da população de
interesse, geralmente se apresenta uma declaração da qualidade, ou precisão, associada
à estimativa.
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 33 / 44
Inferência estatı́stica

Exemplo (População e amostra)


§ População: os 31 sabores de sorvete de uma sorveteria;
Amostra: cinco sabores testados para saber se a sorveteria vende sorvetes de
qualidade;
§ População: todos os eleitores do Brasil;
Amostra: 3.000 eleitores entrevistados em uma pesquisa Ibope;
§ População: todas as lâmpadas produzidas por uma fábrica em um dia;
Amostra: 800 lâmpadas testadas para avaliar o tempo médio de “vida” das
lâmpadas produzidas;

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 34 / 44
Inferência estatı́stica

Exemplo (População e amostra)


§ População: os 31 sabores de sorvete de uma sorveteria;
Amostra: cinco sabores testados para saber se a sorveteria vende sorvetes de
qualidade;
§ População: todos os eleitores do Brasil;
Amostra: 3.000 eleitores entrevistados em uma pesquisa Ibope;
§ População: todas as lâmpadas produzidas por uma fábrica em um dia;
Amostra: 800 lâmpadas testadas para avaliar o tempo médio de “vida” das
lâmpadas produzidas;

A partir de métodos Estatı́sticos também é possı́vel determinar o tamanho adequado de uma


amostra, levando em consideração diversos fatores que podem interferir nos resultados.
Amostras devem ser representativas de toda a população.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 34 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 35 / 44
O uso de computadores em Estatı́stica
Desenvolvimento rápido e constante na área de computação: novas técnicas de análise de
dados (métodos gráficos e computação intensiva).

Desenvolvimento de pacotes estatı́sticos atualmente usados em larga escala tanto no meio


acadêmico como em indústrias, bancos, órgãos de governo, etc.. Podem ser pacotes genéricos
ou especı́ficos (planejados para realizar análises particulares de uma determinada área).

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 36 / 44
O uso de computadores em Estatı́stica
Desenvolvimento rápido e constante na área de computação: novas técnicas de análise de
dados (métodos gráficos e computação intensiva).

Desenvolvimento de pacotes estatı́sticos atualmente usados em larga escala tanto no meio


acadêmico como em indústrias, bancos, órgãos de governo, etc.. Podem ser pacotes genéricos
ou especı́ficos (planejados para realizar análises particulares de uma determinada área).

Frequentemente grande quantidade de dados são captados para diversos fins, como análises
comportamentais de compra e venda. Empresas varejistas como Walmart capturam dados
sobre 20 a 30 milhões de transações todos os dias, enquanto que empresas financeiras como
a Visa processa aproximadamente 600 milhões de transações por dia.

A mineração de dados lida com métodos para desenvolver tomadas de decisões úteis a
partir de grandes bancos de dados. Utiliza uma combinação de procedimentos em Estatı́stica,
Matemática e Ciência da Computação para converter tais dados em informações úteis.
Depende muito de metodologia estatı́stica como Regressão e Correlação, mas necessita, ainda,
de técnicas de ciência da computação envolvendo inteligência artificial e aprendizado de
máquina (restrições de tempo).
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 36 / 44
O uso de computadores em Estatı́stica

Vários programas computacionais de uso comum contém rotinas estatı́sticas incorporadas às
suas funções básicas, como é o caso das planilas eletrônicas (Google Sheets, Microsoft Office
Excel, LibreOffice Calc, OpenOffice.org Calc, Calligra, Gnumeric etc.)

Planilha eletrônica Custo


Google Sheets $ 5 USD/usuário/mês (ou $ 50 USD/usuário/ano)
Microsoft Office Excel R$ 239,00 por usuário (ou R$ 24,00 por mês)
LibreOffice Calc Gratuito
OpenOffice.org Calc Gratuito
Calligra Gratuito
Gnumeric Gratuito

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 37 / 44
O uso de computadores em Estatı́stica

Programas especificamente desenvolvidos para efetuar análises estatı́sticas são conhecidos


como pacotes estatı́sticos (Minitab, SPlus, BMDP, SPSS, SAS, etc.).

Pacote Estatı́stico Custo


Minitab $ 1.595 USD/usuário (com descontos em atualizações)
BDMP Gratuito
SPSS R$ 425,68 por usuário/mês
JMP US$ 1.785,00
Stata $ 198,00, $ 395,00 ou $ 695,00/$995,00 USD por usuário
$ 89,00, $ 235,00 ou $ 395,00/$545,00 USD por ano
SPlus ????
R Gratuito
SAS ????

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 38 / 44
O uso de computadores em Estatı́stica
Qualquer que seja o programa a ser utilizado, três são as etapas que envolvem o seu uso:
§ Entrada de dados;
§ Execução da Análise Estatı́stica;
§ Interpretação dos resultados.

§ A Entrada de dados deve assumir certas convenções. Intrinsicamente, o que se tem é a


criação de uma matriz, em que cada linha corresponde a uma unidade experimental e
cada coluna a uma variável.

§ A fase da execução da Análise Estatı́stica pressupõe o conhecimento de como o


programa que está sendo utilizado trabalha as informações.

§ A fase de Interpretação dos Resultados é, em muitos casos, a mais difı́cil e interessante,
pois envolve o equacionamento das caracterı́sticas apresentadas na análise com vistas a
responder as questões inicialmente colocadas. Também verifica-se se resultados
absurdos não estão ocorrendo.
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 39 / 44
Atividade 1
Para o conjunto de dados abaixo, construa uma tabela de distribuição de frequências
(absoluta, relativa e relativa percentual) e um gráfico de colunas para a frequência absoluta.

Tabela 4: Dados de uma amostra de 50 compras de refrigerantes

Coca-cola Clássica Coca-cola Clássica Coca-cola Clássica Dr. Pepper


Coca-cola Diet Coca-cola Diet Coca-cola Clássica Coca-cola Clássica
Pepsi Coca-cola Clássica Pepsi Coca-cola Diet
Coca-cola Diet Coca-cola Clássica Coca-cola Clássica Pepsi
Coca-cola Clássica Sprite Sprite Pepsi
Coca-cola Clássica Coca-cola Clássica Dr. Pepper Pepsi
Dr. Pepper Coca-cola Diet Pepsi Pepsi
Coca-cola Diet Coca-cola Clássica Coca-cola Diet Coca-cola Clássica
Pepsi Coca-cola Diet Pepsi Dr. Pepper
Pepsi Coca-cola Clássica Coca-cola Clássica Pepsi
Coca-cola Clássica Sprite Coca-cola Clássica Sprite
Dr. Pepper Pepsi Coca-cola Clássica
Sprite Coca-cola Clássica Pepsi
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 40 / 44
Atividade 2

Para o conjunto de dados abaixo, construa uma tabela de distribuição de frequências


(absoluta, relativa e relativa percentual) e um gráfico de colunas para a frequência absoluta.

Tabela 5: Tempos para auditoria de final de ano (dias)

12 14 19 18
15 15 18 17
20 27 22 23
22 21 33 28
14 18 16 13

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 41 / 44
A Estatı́stica e suas aplicações

Conceitos básicos

Sintetização de dados

Inferência estatı́stica

O uso de computadores em Estatı́stica

Referências

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 42 / 44
Referências I

[1] Benze, B. G.
Estatı́stica aplicada a sistemas de informação.
EdUFSCar, São Carlos, 2009.
[2] Bussab, W. d. O., and Morettin, P. A.
Estatı́stica básica, 5 ed.
Saraiva, São Paulo, 2005.
[3] Crespo, A. A.
Estatı́stica fácil, 17 ed.
Saraiva, São Paulo, 2007.
[4] Downing, D., and Clark, J.
Estatı́stica aplicada.
Saraiva, São Paulo, 2005.
[5] Magalhães, M. N., and Lima, A. C. P.
Noções de Probabilidade e Estatı́stica, 7 ed.
EdUSP, São Paulo, 2015.
Introdução aos Métodos Estatı́sticos 06/08 e 08/08
SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 43 / 44
Referências II

[6] Martin, G.
Princı́pios de Estatı́stica.
Atlas, São Paulo, 1990.
[7] Spiegel, M. R.
Estatı́stica, 3 ed.
Makron books, São Paulo, 1993.
[8] Stevenson, W. J.
Estatı́stica aplicada a administração.
Harper & Row do Brasil, São Paulo, 1981.
[9] Sweeney, D. J., Williams, T. A., and Anderson, D. R.
Estatı́stica aplicada à Administração e Economia, 3 ed.
Cengage Learning, São Paulo, 2016.

Introdução aos Métodos Estatı́sticos 06/08 e 08/08


SILVA, F. R., SANTOS, G. R. UEMG – Unidade Frutal 44 / 44

Você também pode gostar