Você está na página 1de 15

Capítulo 01

Introdução a análise exploratória de dados

O que é Estatística

Entendemos a Estatística como um conjunto de técnicas que permite, de


forma sistemática, organizar, descrever, analisar e interpretar dados
oriundos de estudos ou experimentos, realizados em qualquer área do
conhecimento. Estamos denominando por dados um ( ou mais) conjunto
de valores, numéricos ou não.
A grosso modo podemos dividir a Estatística em:

• Estatística Descritiva;
• Probabilidade;
• Inferência Estatística;
Estatística Descritiva: Pode ser definida como um conjunto de técnicas
destinadas a descrever e resumir os dados, a fim de que possamos tirar
conclusões a respeito de características de interesse.

Probabilidade: pode ser pensada como a teoria matemática utilizada


para se estudar a incerteza oriunda de fenômenos de caráter aleatório.

Inferência Estatística: é o estudo de técnicas que possibilitam a


extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir de subconjuntos de valores, usualmente de
dimensão muito menor.
Observação: Se tivermos acesso a todos os elementos não há
necessidade de usarmos as técnicas de Inferência Estatística. Mas, na
impossibilidade de acesso a todo o conjunto de dados, por razões,
econômica, ética, física, etc., estas técnicas se fazem necessárias.

A um grande conjunto de dados que contém a característica que temos


interesse em analisar recebe o nome de população.

Exemplo de população:

• Todos os habitantes da cidade de Pindamonhangaba;


• Todas as lâmpadas produzidas por uma fabrica em um determinado
intervalo de tempo;
• Todo o sangue no corpo de uma pessoa;
Nem sempre podemos utilizar os elementos de toda população pelos
motivos já citados. Exemplos

Uma empresa, usualmente, não dispõe de verba suficiente para saber o


que pensam todos os consumidores de seus produtos; (econômico)

Pesquisa de opinião a respeito da intenção de voto da população de um


pais em relação aos pretendentes ao cargo de presidente do pais;
(econômico)

Experimentos de laboratório que envolvem o uso de seres vivos; ( ético)

Analise de sangue de uma pessoa ou em um experimento para


determinar o tempo de funcionamento das Lâmpadas produzidas por uma
industria.
Tendo em vista as dificuldades de várias naturezas para observar todos os
elementos de uma população, tomaremos alguns deles para formar um
grupo a ser estudado. Este subconjunto da população, em geral com
dimensão sensivelmente menor, é denominado amostra.

Tipos de seleção de amostragem

A amostragem mais usada é a Amostra Casual Simples, em que


selecionamos ao acaso, com ou sem reposição, os itens da população que
farão parte da amostra.

A amostragem também pode ser Estratificada, por exemplo, se em uma


população há mais mulheres do que homens e então podemos selecionar
um percentual destes indivíduos.

Amostragem Sistemática, em que selecionamos os indivíduos de forma pré


– determinada.
O MÉTODO ESTATÍSTICO

 Indústrias realizam pesquisa entre os consumidores para o lançamento


de um novo produto;
 As pesquisas eleitorais fornecem elementos para que os candidatos
direcionem a campanha;
 Emissoras de tevê utilizam pesquisas que mostram a preferência dos
espectadores para organizar sua programação;
 A pesquisa do desempenho dos atletas ou das equipes em uma partida
ou em um campeonato interfere no planejamento dos treinamentos;
 No desenvolvimento de uma liga para fabricar motor de carro e assim
deixá-lo mais leve, com a intenção de reduzir o consumo de
combustível.
 Elaborar procedimentos para trocas de peças desgastadas do setor
plástico.
 Realizar uma solda em ambientes ríspido da terra.
A PESQUISA É COMPOSTA BASICAMENTE DE 5 FASES

1. Coleta de Dados;

2. Crítica dos Dados;

3. Apuração dos Dados;

4. Exposição dos Dados;

5. Análise dos Resultados.


Coletando Dados

• As empresas precisam de informações para tomar decisões; parte dessas


decisões será estatística.
• Para aqueles que tomam decisões, o papel principal da estatística é
fornecer-lhes os métodos para obter e converter dados (valores, fatos,
observações, medições) em informações úteis.
Dados de entrada

Coletar Organizar Analisar Interpretar

Informações de saída
EXERCÍCIOS DE FIXAÇÃO

1º Para as situações descritas a seguir, identifica a população e a amostra


correspondente. Discuta a validade do processo de inferência estatística
para cada um dos casos

 Para avaliar a eficácia de uma campanha de vacinação no Estado de São


Paulo, 200 mães de recém nascidos, durante o primeiro semestre de um
dado ano e uma dada maternidade em São Paulo, foram perguntadas a
respeito da última vez em que vacinaram seus filhos.
R: As crianças do Estado de São Paulo formam a população de interesse. As
respostas das mães serão usadas para avaliar a eficácia da campanha de
vacinação. A amostra de mães de recém nascidos escolhida em uma só
maternidade não parece ser uma boa opção, entre outras, pelas seguintes
razões: não temos garantia de obter informações sobre a vacina nas várias
regiões do estado nem nas várias camadas sociais; como vacinas não são
dadas imediatamente em recém nascidos, precisaríamos que as mães
entrevistadas tivessem outros filhos para poderem dar a informação
necessária. Extrapolar os resultados da amostra, nesse caso, parece ser
inadequado.
 Uma amostra de sangue foi retirada de um paciente com suspeita de
anemia.

R: O sangue do paciente é a população de interesse e por características


biológicas ele é homogêneo em todo o corpo. Portanto uma pequena
quantidade, suficiente para os exames, poderá dar o panorama do que
esta acontecendo com o paciente. A inferência da amostra para toda a
população é adequada.
 Para avaliar a audiência de um programa de TV, 563 indivíduos foram
entrevistados por telefone com relação ao canal em que estavam
sintonizados.

 A fim de avaliar a intenção de voto para presidente dos brasileiros, 122


pessoas foram entrevistadas em Brasília.
2º Discuta para cada um dos casos abaixo, os cuidados que precisam ser
tomados para garantir uma boa conclusão a partir da amostra.

 Um grupo de criança será escolhida para receber uma nova vacina contra
meningite.

R: É preciso identificar as características que poderiam influir no resultado


da vacina. Por exemplo, será que a idade, sexo e condição social,
produzem diferentes resultados? Se esse for o caso, é conveniente garantir
que a amostra contenha crianças com essas características em número
proporcionalmente próximo ao que aparecem na população.
 Sorteamos um certo número de donas de casa, para testar um novo
sabão em pó.

 Uma fábrica deseja saber se sua produção de biscoitos está com o


sabor previsto.

 Aceitação popular de um certo projeto do governo.

 Lançamento de um novo carro para o ano de 2016.

 Soldagem de um cavalete para transporte de vidros.

Você também pode gostar