Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 3 - Dist Freq e Est Descritiva
Aula 3 - Dist Freq e Est Descritiva
Curso: Fı́sica
Análise de Dados
Segundo um estudo americano da New Vantage Partners, de 2021,
somente 24% das empresas já conseguem, de fato, ter uma
operação baseada em dados;
ãÑ A realidade é que diversas empresas ainda não conseguem extrair
valor de seus investimentos em big data e inteligência artificial.
Para tornar a sua empresa mais competitiva, por exemplo, adotar
uma gestão orientada a dados é um dos passos mais importantes a
serem tomados;
Por meio da metodologia de análise de dados, é possı́vel tomar
decisões com maior segurança e implementar estratégias mais
eficazes em diferentes aspectos do negócio.
Analisar dados é . . .
Análise Preditiva
Nesse tipo de análise, os dados são utilizados para fazer projeções de
cenários e identificar tendências futuras a partir de determinados
padrões.
Análise Prescritiva
Busca-se avaliar as consequências que certas decisões podem trazer.
Análise Diagnóstica
Busca-se investigar relações de causa e efeito nos objetos analisados.
Análise Descritiva
Tem como intenção descrever certos eventos ou objetos que estão sendo
analisados.
ãÑ Em outras palavras, descrever comportamentos e tendências
a partir de cenários realistas.
Estatı́stica Descritiva
Etapa inicial da análise de dados e tem por objetivo descrever os
dados observados.
ãÑ Na sua função de descrição dos dados, esta tem as seguintes
atribuições: a obtenção, organização, redução e representação dos
dados estatı́sticos de forma a auxiliar a descrição do fenômeno
observado.
Variável
Descreve alguma caracterı́stica de um indivı́duo, tal como altura,
gênero, salário, preferência, etc.
Notação: X “ tx1 , x2 , . . . , xn u; n: tamanho da amostra
x1 , x2 , . . . , xn (ou xi , i “ 1, . . . n): observações de X para cada
indivı́duo i.
Ex.: X: peso dos camundongos (em gramas).
Tipos de Variáveis
qualitativas (atributos/categorias).
- Nominais/Atributos/Categóricas: classificação em diferentes
categorias não-ordenadas.
- Ordinais: classificação em diferentes categorias ordenadas.
Séries Estatı́sticas
Corresponde a um conjunto de dados estatı́sticos, em geral apresentados
em tabela ou gráfico e organizado em função de três elementos: tempo,
local e categoria.
Tipos de séries:
- Temporal, Cronológica ou Histórica;
- Geográfica, Territorial ou de Localização;
- Categórica ou Especı́fica;
- Distribuição de Frequência.
Séries Temporais
Usadas para apresentar dados observados em determinado local,
discriminados ao longo do tempo.
Série Geográfica
Usada para apresentar dados de diferentes regiões geográficas, em
determinado tempo.
Série Categórica
Usada para apresentar dados que se distribuem em diferentes categorias,
em determinado tempo e local.
Gráfico Estatı́stico
Com a representação gráfica das séries estatı́sticas os gráficos produzem uma visão mais
rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a
interpretar os valores representativos deste fenômeno.
ãÑ Ojetivo: produzir, no investigador ou no público em geral, uma impressão mais
rápida e viva do fenômeno em estudo.
Cartograma
São representações através de mapas (cartas geográficas). Este gráfico é
empregado quando o objetivo é o de relacionar os dados estatı́sticos
diretamente com áreas geográficas ou polı́ticas.
Cartograma
Pictograma
É a representação gráfica através de figuras. Por se tratar de uma
apresentação atraente, é um gráfico que desperta muito a atenção do
leitor.
Pictograma
Limites de Classe
Extremos de cada classe.
Limite inferior da classe (li ): extremo inferior da classe i;
Limite superior da classe (Li ): extremo superior da classe i;
l2 “ 154 e L2 “ 158
Nota:
Sı́mbolo $: inclusão de li e exclusão de Li (li $ Li ñ li ď xi ď Li )
Ex.: o indivı́duo com uma estatura de 158 cm está incluı́do na terceira
classe (i “ 3) e não na segunda (154 $ 158 ñ 154 ď xi ď 158).
Analogamente, temos:
li % Li ; li $ Li ; li p ´ p Li ; li ´ Li
h2 “ L2 ´ l2 “ 158 ´ 154 “ 4 ùñ h2 “ 4.
AA “ xmáx ´ xmı́n
Nota:
O ponto médio de uma classe (xi ) é o valor representativo da
classe i
n: tamanho amostral
A soma de todas as frequências simples de dados agrupados em
classe uma é representada pelo sı́mbolo de somatório:
k
ÿ
fi “ f1 ` f2 ` . . . ` fk “ n
i“1
k: núm. de classes
n
ÿ
fi “ f1 ` f2 ` . . . ` fn “ 1 ` 1 ` 1 ` 1 ` 1 ` 4 ` 3 ` . . . ` 1 “ 40
i“1
ou
k
ÿ
fi “ f1 ` f2 ` . . . ` fk “ 4 ` 9 ` 11 ` 8 ` 5 ` 3 “ 40
i“1
Nota:
ř
fri “ 1 ou 100%;
Objetivo: permitir análises ou facilitar comparações.
onde t ď k.
Ex.:
Distribuição de frequências
Construção de uma distribuição de classes;
Histograma, Polı́gono de freq. simples, Polı́gono de freq.
acumulada (Ogiva);
- SIGAA: “Material de apoio 2”: Unidade IV;
- Livro: “Bioestatı́stica - teórica e computacional”, Arango, H. G., 3a
ed., Ed. Gen: Caps. 2 e 3;
Medidas Descritivas
Média, mediana, moda, variância, desvio padrão, coeficiente de
variação para dados agrupados;
Histograma, Polı́gono de freq. simples, Polı́gono de freq.
acumulada (Ogiva);
- SIGAA: “Material de apoio 2”: Unidades V e VI;
- Livro: “Bioestatı́stica - teórica e computacional”, Arango, H. G., 3a
ed., Ed. Gen: Cap. 4 (unidades 1 e 2);
Medidas de Assimetria e Curtose
- SIGAA: “Material de apoio 2”: Unidades VII;
- Livro: “Bioestatı́stica - teórica e computacional”, Arango, H. G., 3a
ed., Ed. Gen: Cap. 4 (unidade 3 e 4);
Estudo Estatı́stico
Ao planejar um estudo estatı́stico ou explorar dados produzidos por
terceiros, questione-se acerca dos seguintes pontos:
1 Quem? Quais indivı́duos os dados descrevem? Quantos indivı́duos
aparecem nos dados?
2 O quê? Quantas variáveis os dados contem? Quais são as definições
exatas dessas variáveis? Em qual unidade de medida cada variável
está registrada? Pesos, por exemplo, podem ser registrados em libras,
em milhares de libras ou em quilogramas?
3 Por quê? Quais propósitos tem os dados? Esperamos responder a
algumas perguntas especı́ficas? Desejamos respostas apenas para
esses indivı́duos ou para algum grupo maior supostamente
representado por esses indivı́duos? Os indivı́duos e as variáveis são
adequados aos propósitos pretendidos?
Espaço do estudo;
Tempo de estudo;
População (20 indivı́duos): quem seria o público alvo do estudo?;
Nota: Informações acerca da abrangência espacial (geográfica) e temporal servem para definir a
população com maior precisão.