Você está na página 1de 9

Exemplos de utilização da estatística: - Criar modelos que expliquem os fenômenos

aleatórios observáveis.
Pesquisas eleitorais;
ESTATÍSTICA DESCRITIVA
Pesquisa Científica;
- Organizar, apresentar e sintetizar os dados
Censo demográfico;
utilizando ferramentas como: gráficos, tabelas e
Marketing; medidas descritivas

Saúde; - Obter informações para possíveis modelos a


serem utilizados na inferência estatística
Segurança;
- Fase inicial da análise estatística

ESTATÍSTICA INFERENCIAL
Estatística como ferramenta do estado para
coleta e apresentação de dados de interesse - Calcular medidas estatísticas, com grau de
certeza (amostra representa toda a população)
utilizando dados de uma amostra para
generalizações sobre a população.

- Mensurar a fidedignidade de cada inferência


feita sobre a população, com base na amostra.

ANÁLISE ESTATÍSITCA

1. Determinação do número de observações


(tamanho da amostra);

2. Seleção das unidades observacionais;

3. Cálculo das medidas estatísticas;

4. Determinação da confiança nas estimativas;

5. Significância dos testes estatísticos;


EVENTOS OBSERVÁVEIS (MULTIPLICIDADE DE
6. Precisão das estimativas;
CAUSAS) DADOS (FERRAMENTAS
7. Inferências e generalizações sobre as
MATEMÁTICAS) INFORMAÇÕES (TABELAS, populações
GRÁFICOS, PROBABILIDADES)
A estatística é aplicada devido a impossibilidade
de estudar de toda a população, por isso é feito a
A Estatística é usada em quase todos os aspectos análise com amostras, ela garante o aumento da
da Ciência de Dados. É usada para analisar, capacidade de registro de dados a ser
transformar e limpar dados, avaliar e otimizar compreendidos e a validação dos fenômenos
algoritmos de aprendizado de máquina e também naturais e sociais pesquisados e investigados, a
é usada na apresentação de percepções e otimização de recursos, planejamento de
descobertas. atividades, redução de riscos e a previsão de
resultados para correta tomada de decisão.
ESTATÍSTICA PROBABILISTICA
CONCEITOS FUNDAMENTAIS EM ESTATÍSTICA
- Medir a chance de ocorrência de um
Estatística é a “a parte da matemática que estuda
determinado resultado. os métodos para coletar, organizar, e
interpretar dados de diferentes áreas visando COLETA DOS DADOS
tomada de decisão
DIRETA --------- INDIRETA
❖ Bioestatística: Campo da estatística ligado ao
CONTÍNUA
biológico, da saúde.
❖ População: é o conjunto de elementos que PERÍODICA
queremos pesquisar e apresenta alguma
característica em comum. OCASIONAL
❖ Amostra: parte da população que apresenta -Dados: são observações coletadas de um
as mesmas características da população. determinado grupo de interesse.
Parcela convenientemente selecionada da ❖ Dados primários: quando os dados
população coletados são originais ou coletados pela
Técnicas de amostragem primeira vez.
❖ Dados secundários: quando os dados são
Homogeneidade e representatividade da coletados usando fontes disponíveis.
população
Planejamento:

Objetivo da amostragem → quantidade e ❖ Determinação do objetivo da pesquisa;


qualidade mínima da amostra ❖ Definição de métodos a serem utilizados;
❖ Caracterização da Amostra;
❖ Variável: ❖ Definição do método de aquisição e
processamento de dados
Variável é o meu objeto de pesquisa, é a pergunta
para a qual a minha pesquisa está procurando Método Estatístico: Técnica que visa estruturar e
resposta. Essa variável pode ser classificada no organizar as fases ou etapas que devem ser
estudo de tipos de variáveis. Uma variável pode estabelecidas na abordagem de uma observação
ser classificada como qualitativa (nominal ou estatística:
ordinal) ou quantitativa (discreta ou contínua).
❖ Definição do problema
VARIÁVEIS QUALITATIVAS ❖ Planejamento
❖ Coleta de Dados
Dados não numéricos;
❖ Apuração dos Dados
Ex: sexo, escolaridade, profissão ❖ Apresentação dos Dados
❖ Análise e interpretação

APRESENTAÇÃO DOS DADOS

Tabela é um quadro que resume o conjunto de


dados observados

Título:

VARIÁVEIS QUANTITATIVAS
Corpo:
Mensuradas em escala numérica

Ex: idade, preço, peso, tempo.

Objetivo: detectar e corrigir erros e


inconsistências ocorridos durante um processo
de coleta
de dados, determinar as principais características ❖ Bimodal
destes mesmos dados e propiciar familiaridade
com eles

GRÁFICO:

Representação visual do conjunto de dados


observados ❖ Trimodal

❖ Polimodal

- Quando tem uma tabela que não tem os


números exatos, tem apenas intervalos.

Exemplo:

Na tabela em classes, a moda está entre o limite


inferior e superior de uma classe, mas não há
como saber o seu valor exato.

A Moda bruta, neste caso, será o ponto médio da


classe.
AULA 03 –

MEDIDAS DE POSIÇÃO

- Estatísticas calculadas a partir de populações


são chamadas estatísticas populacionais ou
parâmetros.

- Estatísticas calculadas a partir de amostras são


chamadas estatísticas amostrais ou estimativas.

MODA
Moda é o valor que ocorre com mais
frequência na distribuição, isto é, o valor que
mais se repete. MÉDIA
❖ Amodal Média Aritmética

não possui moda. A média (Me) é calculada somando-se todos os


valores de um conjunto de dados e dividindo-se
pelo número de elementos deste conjunto.

Como a média é uma medida sensível aos valores


da amostra, é mais adequada para situações em
que os dados são distribuídos mais ou menos de
❖ Monomodal forma uniforme, ou seja, valores sem grandes
discrepâncias.
Apenas 1 moda.
❖ Por ser sensível aos dados, nem sempre
fornece os resultados mais adequados.
❖ Isso porque todos os dados possuem a
mesma importância (peso)

Exemplo:

Considerando as notas e os respectivos pesos de


cada uma delas, indique qual a média que o aluno
obteve no curso.

Exemplo:

Sabendo que as notas de um aluno foram:

8,2; 7,8; 10,0; 9,5; 6,7, qual a média que ele obteve
no curso?

“A média pode não ser uma representação


honesta dos dados, pois é facilmente influenciada MEDIANA
pelos valores muito grandes ou muito pequenos
dentro do conjunto de dados” (RUMSEY, 2016, A Mediana (Md) representa o valor central de um
p.46) conjunto de dados. Para encontrar o valor da
mediana é necessário colocar os valores em
A média quando muito distante dos valores ordem crescente ou decrescente.
amostrados significa que há uma alta
variabilidade, já se os valores e a média forem Quando o número elementos de um conjunto é
próximos, a variabilidade é baixa, a amostra é par, a mediana é encontrada pela média dos dois
mais homogênea. valores centrais. Assim, esses valores são
somados e divididos por dois.

n é par 𝑀𝑒 é a média aritmética dos valores do


Média Aritmética Ponderada meio:
A média aritmética ponderada é calculada
multiplicando cada valor do conjunto de dados
pelo seu peso.

Depois, encontra-se a soma desses valores que n é ímpar a 𝑀𝑒 é o valor posição:


será dividida pela soma dos pesos.
demonstrar os dados, pois não indica o grau de
dispersão deles.

Exemplo:
DISTRIBUIÇÃO E MEDIDAS DE POSIÇÃO Vamos considerar as idades de dois grupos de
crianças que irão participar de duas festas
diferentes:

Festa A: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e


13 anos

Festa B: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9


anos

Em ambos os casos, a média é igual a 7 anos de


idade. Entretanto, ao observar as idades dos
participantes podemos admitir que as atividades
escolhidas não são iguais, a festa A possui maior
dispersão em relação à média.

DESVIO MÉDIO

O desvio médio absoluto é a média aritmética de


todos os desvios calculados

Lembrando que: desvio é a diferença entre os


As medidas de posição são diferentes, o desvio dados e a média calculada (sempre calculando do
padrão é maior; maior número menos o menor, para dar positivo)

Exemplo:

Média das idades: 7 anos

Desvios: 7-1 = 6; 7-2 = 5; 7-2 = 5; 12-7 = 5; 12-7 =


5; 13-7 = 6;

Se é a média aritmética de uma amostra de


números x1, x2, … , xn, chama-se desvio absoluto
médio o número:
As medidas de posição são iguais, o desvio
padrão é menor;

MEDIDAS DE DISPERSÃO
Desvio Médio: 6+5+5+5+5+6 / 6 (número de
Medidas de dispersão são parâmetros dados)
estatísticos usados para determinar o grau de
variabilidade dos dados de um conjunto de Dm = 5,3
valores.

São medidas que se distanciam (dispersam) da VARIÂNCIA


média, dizendo se a distribuição é mais
homogênea ou mais heterogênea. A variância é determinada pela média dos
quadrados de cada desvio.
- Quando os dados são diferem muito da média (a
população está muito heterogênea), caso o Considere uma amostra representada por {x1, x2,
contrário (está muito homogênea). …., xn} de n observações numéricas. A variância
de uma população (Var(x)) é definida por:
- Mas caso há muita diferença, significa que a
média não representa uma medida eficiente para
Quando todos os valores de uma amostra são
iguais, o desvio padrão é igual a 0. Sendo que,
quanto mais próximo de 0, menor é a dispersão
dos dados.

Desvio padrão baixo = Mais homogêneo, menos


variabilidade;

Desvio padrão alto = Mais heterogêneo, maior


Exemplo:
variabilidade;
Festa A
Exemplo
Dados: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e
13 anos

Agora, sabemos que a variação das idades do


primeiro grupo em relação a média é de
aproximadamente 5 anos, enquanto a do segundo
grupo é de apenas 1 ano.

Desvio padrão muito alto, dados muito


heterogêneos significa que minha a média não
No caso como não temos frequência, não reflete a minha população, pois a variabilidade
multiplicamos. dos dados da amostra é elevada.

Festa B FREQUÊNCIA

Dados: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 Frequência Absoluta


anos A frequência absoluta é a quantidade de vezes
que ocorre cada item de uma pesquisa estatística.
Esse número representa quantas vezes uma
variável foi respondida ou observada.

A frequência absoluta simples ou, frequência


absoluta, é o registro do número de repetições de
uma variável estudada.

Exemplo
Observe que apesar da média ser igual, o valor da Uma pesquisa foi realizada com alunos do 3.º ano
variância é bem diferente, ou seja, os dados do do Ensino Médio onde foram perguntados sobre
primeiro conjunto são bem mais heterogêneos. suas preferências de estilos musicais. Ao total 54
alunos responderam à pesquisa.

DESVIO PADRÃO

O desvio padrão é definido como a raiz quadrada


da variância. Desta forma, a unidade de medida do
desvio padrão será a mesma da unidade de
medida dos dados, o que não acontece com a
variância.

Qual a frequência absoluta da variável samba?


A frequência absoluta da variável samba é igual 8 O número de vezes que uma única variável ocorre
é chamado frequência absoluta (Fa) ou,
Frequência Absoluta Acumulada
simplesmente frequência.
A frequência absoluta acumulada ou, frequência
A Frequência Relativa da variável “gato” é:
acumulada, é a soma das frequências absolutas
simples de cada variável

Exemplo

Completando a tabela do exemplo anterior,


temos: Fórmula da Frequência Relativa

Na frequência acumulada, a cada linha somamos


a frequência absoluta com a acumulada anterior.
Assim, vamos acumulando os valores a cada
linha da tabela.
Onde:
A última linha da coluna da frequência acumulada
já representa o total de entrevistados. Fi é a frequência relativa de uma variável i
qualquer da pesquisa;

Fa é a quantidade de vezes que ocorre essa


variável na pesquisa (frequência absoluta);

n é o número total de respostas.

OBS:

A frequência relativa é um número entre 0 e 1;

É comum apresentar a frequência relativa em


porcentagem (basta multiplicar por 100);

A soma das frequências relativas de uma


pesquisa é igual a 1 ou, 100%.
Frequência Relativa Exemplo 2
A frequência relativa é a divisão entre o número de Uma pesquisa avaliou as intenções de voto em
vezes que um dado específico se repete, pela um candidato caso as eleições ocorressem hoje.
quantidade total de dados. A tabela de frequências mostra os dados da
pesquisa.
A frequência relativa compara a quantidade de
respostas de um dado específico, com a
quantidade total de respostas coletadas em uma
pesquisa estatística.

Exemplo 1

Uma pesquisa realizada com 75 pessoas levantou


informações sobre animais de estimação.

Frequência relativa acumulada

A frequência relativa acumulada é o acúmulo da


frequência relativa. Para encontrar a frequência
relativa acumulada, acrescentamos uma nova
coluna à tabela. Copiamos a primeira frequência
relativa na primeira linha, a segunda linha será a
soma da frequência relativa da linha com a
frequência acumulada da linha anterior, e assim
sucessivamente.

CORRELAÇÃO E REGRESSÃO

- Medidas de dispersão e de posição são


utilizadas para comparar populações, mas essa
comparação depende da dispersão dos meus
dados.

Existem situações nas quais há interesse em


estudar o comportamento conjunto de uma ou
mais variáveis;

O comportamento conjunto de duas variáveis


quantitativas pode ser observado por meio do
gráfico de dispersão.
CORRELAÇÃO

Grau de relacionamento entre duas variáveis.

Uma medida do grau e do sinal da correlação


linear entre duas variáveis (X,Y) é dado pelo
Coeficiente de Correlação Linear de Pearson,
definido por:

OBS: Correlação não implica relação de causa-


efeito

Diagrama de dispersão: eixo cartesiano com as


variáveis quantitativas consideradas

O valor de “r” estará sempre no intervalo de -1 a


1.
entre as variáveis – DIRETAMENTE
PROPORCIONAIS.

- Ausência de correlação;

- Quanto mais próximo de 1, maior a correlação


entre duas variáveis, já próximo do 0, menor a
correlação.

Coeficiente é adimensional

Independe das unidades de medidas das variáveis

Positivo

Variáveis diretamente proporcionais

Negativo

Variáveis inversamente proporcionais


REGRESSÃO

Equação matemática que descreve o


relacionamento entre variáveis.

Função que explica grande parte da variação de Y


- Menor correlação; forte negativa; por X.
- Mais próximo de -1, maior o grau de correlação Parcela da variabilidade de Y não explicada por X
entre as variáveis – INVERSA; é atribuída ao acaso (erro aleatório)

A equação explica e define como a variável x varia


de acordo com a variável y.

- Maior correlação; forte positiva; quanto maior a


inclinação, maior o grau de relação;
-Mais próxima de +1 maior o grau de correlação

Você também pode gostar