Você está na página 1de 5

APOSTILA DE ESTUDO - AVALIAÇAO I

ESTATÍSTICA

Introdução à Estatística
Ciência de aprendizagem a partir de dados.
A Estatística fornece métodos que auxiliam o processo de tomada de decisão e está presente
em todas as áreas da ciência que envolva a coleta de análise de dados.
A Estatística está compreendida em duas partes: Estatística Descritiva e Estatística Indutiva.
A Estatística Descritiva reúne um conjunto de técnicas para sumarizar os dados, como tabelas
e gráficos, e medidas descritivas que permitem tirar muitas informações contidas nos dados.
Objetivo da Estatística: Tirar conclusões sobre populações com base nos resultados
observados em amostras extraídas dessas populações.

Conceitos Básicos de Estatística


População: É o conjunto de indivíduos ou objetos que apresentam pelo menos uma
característica em comum, cujo comportamento se deseja analisar. É o todo.
Amostra: É um subconjunto da população. Um recorte da população.
Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, a
característica estudada.

Estudo
A amostragem é a parte inicial de qualquer estudo estatístico. Consiste na escolha criteriosa
dos elementos a serem submetidos ao estudo.
As fases principais do método estatístico são: definição do problema, planejamento, coleta de
dados, apuração, apresentação de dados, análise e interpretação de dados.
Estudos Descritivos ou Exploratórios: apresentam de forma organizada os dados
produzidos por serviços de informação.
Estudos Comparativos ou Confirmatórios: testam hipóteses pré-determinadas. Incluem
estudos de caso-controle, estudo de corte e ensaios clínicos.

Estudo Populacional X Estudo Amostral


Ambos estão sujeitos a erros.
Erros não-amostrais ocorrem quando:
- Os dados são coletados, registrados ou analisados incorretamente;
- Usa-se instrumento/equipamento defeituoso na realização da mensuração;
- Questionários ou formulários tem questões formuladas de modo tendencioso.
Erros amostrais ocorrem quando:
- A amostra não reflete a população;
- O tamanho da amostra não é adequada.
Indica-se o estudo populacional quando:
- A população é pequena;
- A coleta é barata.
Amostragem
Procedimento para obtenção de uma amostra de uma população.
Vantagens:
- Menor custo;
- Rapidez nos resultados;
- Mais fácil de ser controlada por envolver operações menores.
Seleciona-se a Amostragem a partir de procedimentos amostrais.

Procedimentos Amostrais
Probabilística:
- Realizado por sorteio;
- Probabilidades conhecidas;
- Todos tem a chance de fazer parte da amostra.
Não Probabilística:
- Prejuízo na representatividade em relação à população, como por exemplo através de
voluntários, acesso mais fácil ou participação intencional.

Amostragem Probabilística
Tipos de Amostragem Probabilística:
- Amostragem Aleatória Simples;
- Amostragem Estratificada;
- Amostragem por Conglomerados.
As amostras probabilísticas são preferíveis do ponto de vista estatístico, mas, na prática, elas
nem sempre são possíveis.

Tamanho da Amostra
O tamanho da Amostra dependerá de vários fatores, como:
- Objetivo do Estudo;
- Margem de Erro Tolerável;
- Grau de confiança desejado e o poder do estudo.
As amostras não devem ser muito grandes, porque isso seria uma perda de recursos. Também
não devem ser muito pequenas, porque o resultado do trabalho seria de pouca utilidade.

Variáveis
Variável é aquilo que se deseja observar para se tirar algum tipo de conclusão, a característica
estudada.

Variáveis Qualitativas ou Categóricas


São características de uma população que não podem ser medidas. A resposta é sempre dada
em nome.
As Variáveis Qualitativas/Categóricas podem ser:
- Variáveis Qualitativas Ordinais: Possui uma ordem, uma hierarquia;
- Variáveis Qualitativas Nominais: Não possuem ordem ou sequência hierárquica.
Variáveis Quantitativas
São características de uma população que pode ser quantificada, medida. A resposta é sempre
dada de forma numeral.
As Variáveis Quantitativas podem ser:
- Variáveis Quantitativas Discretas: Assumem apenas valores inteiros. São obtidos mediante
alguma forma de contagem.
- Variáveis Quantitativas Contínuas: São aquelas que podem assumir qualquer valor em um
intervalo de variação, seja em intervalo de classes ou números quebrados.

Séries Estatísticas
Séries Estatísticas consistem na apresentação das informações (variáveis) em forma de
tabelas, objetivando sintetizar os dados observados e tornando-os mais fáceis de compreender
e interpretar.
Série Histórica: Os dados são observados segundo a época de ocorrência. Normalmente tem
relação com a diferença comportamental de tal variável de acordo com o passar do tempo.
Série Geográfica: Os dados são observados segundo a localidade de ocorrência. Tem relação
com a diferença comportamental de tal variável de acordo com os diferentes lugares.
Série Específica ou Categórica: Os dados são observados segundo a modalidade, o nome.
Série Mista: Combinação dos tipos de séries citados anteriormente.

Coleta e Armazenamento de Dados


As coletas de dados, geralmente, são feitas através do preenchimento de fichas pelo
pesquisador e/ou através de respostas a questionários.
Dados Brutos: Conjunto dos dados numéricos obtidos após a coleta dos dados.
Rol: É a ordenação dos dados brutos. Pode ser em ordem crescente ou decrescente de seus
valores.

Organização de Dados e Apresentação de Dados


Os dados podem ser apresentados em tabelas ou gráficos.
Amplitude Total ou Amplitude da Amostra: É dada pela diferença entre o maior e menor
valor do rol.

A = Xmáx - Xmín

Frequência Absoluta Simples (fi): Indica quantas vezes cada elemento aparece no rol.
Frequência Total (ft): Soma das frequências simples absolutas.
Frequência Relativa (fri): Proporção de unidades que caem em cada categoria. Para obter a
frequência relativa de uma dada categoria é necessário calcular sua porcentagem.

Dados Agrupados em Classes


É conveniente agrupar os valores observados em classes se a variável do objeto de estudo for
Quantitativa Contínua.
Se, por um lado, a variável for discreta e o número de valores dessa variável for muito grande,
recomenda-se também o agrupamento em classes.
Para determinar a quantidade de classes é necessário seguir alguns passos:
1º Passo: Visualizar
Se n (número de observações) for menor ou igual a 25, o número de classes (K) será igual a 5.
Se n for maior que 25, K será equivalente à raíz quadrada de n.
2º Passo: Achar o valor máximo e o valor mínimo do conjunto de dados;
3º Passo: Calcular a Amplitude, diferença entre o valor máximo e o valor mínimo;
4º Passo: Dividir a Amplitude dos dados pelo número de classes.
O resultado da divisão, então, é a amplitude do Intervalo de Classe. É recomendável
arredondar o resultado para um valor mais alto.
5º Passo: Organizar as classes, de maneira que a primeira contenha o menor valor observado.
6º Passo: Ir desenvolvendo suas classes com o símbolo |-, que determina o limite no intervalo
daquela classe. O intervalo será fechado à esquerda e aberto à direita, ou seja, não pertencem
à classe os valores iguais ao extremo superior.

Gráficos
Tipos de Gráficos:
- Gráficos em Barras;
- Gráficos em Colunas;
- Gráficos em Linhas;
- Gráfico em Setores;
- Histogramas.

Gráfico em Barras
Gráficos em Barras são adequados para dados Qualitativos;
Ilustra comparações entre Variações Categóricas;
As Categorias se organizam no eixo vertical e as Frequências são postas no eixo horizontal.

Gráfico em Colunas
Gráficos em Colunas são adequados para dados Qualitativos;
Ilustra comparações entre Variações Categóricas;
As Categorias se organizam no eixo horizontal e as Frequências ou Frequências Relativas são
dispostas no eixo vertical.
Há uma separação entre cada coluna, diferente do Histograma, cujo cada coluna se encontra
colada uma à outra.

Gráfico em Linhas
O Gráfico em Linhas é geralmente utilizado quando uma das variáveis é o tempo, definido no
eixo horizontal;
Fornece uma ideia da tendência geral e do grau da variabilidade;
Em geral, os intervalos de tempo são espaçados igualmente.

Gráfico em Setores
Gráficos em Setores é indicado para apresentar Variáveis Qualitativas Nominais;
Cada Categoria corresponderá a uma divisão ou a um setor de um círculo;
Mostra a análise da participação de cada Categoria em relação ao total.

Histograma
Histograma é a representação gráfica de distribuição de frequências para dados agrupados em
classes;
É composto por retângulos adjacentes representando a tabela de frequências;
O eixo horizontal representa os Intervalos de Classes, sempre colados um ao outro, e o eixo
vertical representa as Frequências.

ESTATÍSTICA DESCRITIVA

Medidas Descritivas
Medidas Descritivas são calculadas para auxiliar na descrição de variáveis quantitativas.
Permitem a sumarização dos dados.
São importantes ferramentas na análise exploratória dos dados, independentemente do objeto
de estudo.

Medidas de Tendência Central


As Medidas de Tendência Central sintetizam o conjunto de dados por meio de um único valor
para descrever a distribuição da variável de interesse. Tem como objetivo identificar um valor
representativo do centro dos dados.
As Medidas de Tendência Central incluem a Média Aritmética e Mediana.

Média Aritmética
A Média Aritmética é dada pelo quociente entre a Soma dos Valores Observados e a
Frequência Total (o número total de observações):

Soma dos Valores Observados


Frequência Total

Vantagens:
- Medida Natural para Síntese de Variáveis Quantitativas;
- Simples;
- Medida Base para vários métodos em inferência estatística.
Maior Limitação:
- Muito sensível a valores extremos (muito grandes ou muito pequenos), tornando o resultado
não representativo.
- Nesses casos, deve-se retirar esse valor discrepante e calcular a média com os restantes.

Média Aritmética Ponderada


Média Aritmética Ponderada é a média aritmética de quando os dados estão em uma tabela de
distribuição de frequência. Nesse caso, para calcular é necessário multiplicar o valor com
a frequência em que ele aparece.
Em certos casos, principalmente quando a variável é contínua e a amostra é grande, são
apresentadas apenas as tabelas de distribuição de frequência, cujo os dados brutos não são
fornecidos. Ou seja, o banco de dados se encontra fechado e não aberto.
Para calcular a média ponderada de dados agrupados em classes, é preciso calcular o valor
central de cada classe, somando o valor mínimo com o valor máximo e dividindo por 2. Depois,
multiplica-se pela frequência e tem-se a média ponderada do Intervalo de Classe.

Você também pode gostar