Você está na página 1de 56

TEMA: INTRODUÇÃO A ESTATÍSTICA AULA 1

Autor – Celso G. Van-Dúnem Paquete


MD, Analytics
Objectivos
• Capacitar os técnicos com conhecimento básicos sobre
estatística;

• Fornecer bases para uso e aplicações do método estatístico;


Sumário
• História
• Definição de Estatística
• Tipos de Estatísticas
• Dados
• Variáveis
• População e amostra
• O Método Estatístico
• Séries e estatística
• Frequência em estatística
• Tabela de Distribuição de frequência
História
• O uso de dados estatísticos remonta aos censos
realizados na antiga Babilónia, Egipto e, mais
tarde, no Império Romano, quando os dados
colectados eram sobre assuntos relacionados ao
Estado, tais como nascimentos e óbitos.
• A Partir do século XVI começaram a surgir as
primeiras análises sistemáticas de fatos sociais,
como baptizados, casamentos, funerais,
originando as primeiras tábuas e tabelas e os
primeiros números relativos. Lucas 2:1 decreto da parte de César
Augusto para que todo o mundo se
alistasse (Estatistica)
História
• Em latim statisticum collegium (palestra sobre os assuntos
do Estado); Italiano statista, que significa "homem de
estado", ou político.

• A palavra foi proposta pela primeira vez no século XVII, em


Godofredo Achenwall
latim, por Schmeitzel na Universidade de Lena e adoptada
pelo académico alemão Godofredo Achenwall. Aparece
como vocabulário na Enciclopédia Britânica em 1797, e
adquiriu um significado de colecta e classificação de dados,
no início do século 19.
Enciclopédia Britânica 1797
Definição de Estatística
• Ciência que trata da colecta, organização, análise e interpretação dos
dados para a tomada de decisões.

• Ciência que fornece os princípios e os métodos para colecta,


organização, resumo, análise e interpretação de dados.

• É uma parte da Matemática Aplicada que fornece métodos para a


colecta, organização, descrição, análise e interpretação de dados e
para a utilização dos mesmos na tomada de decisões.
Ramos da estatística
A colecta, a organização e a descrição dos
dados estão a cargo da Estatística
Descritiva, enquanto a análise e a
Estatística interpretação desses dados ficam a cargo
da Estatística Indutiva ou Inferencial.

Inferencial ou
Descritiva
Indutiva

é o ramo da estatística que


envolve o uso de uma amostra
é o ramo da estatística que
para chegar a conclusões sobre
envolve a organização, o resumo e
uma população. Uma ferramenta
a representação dos dados.
básica no estudo da estatística
inferencial é a probabilidade.
Estatística descritiva
• Preocupa-se em descrever os dados colectados, organizá-los em tabelas e
gráficos, fazendo aplicação com cálculos de medidas como média, mediana,
moda, desvio padrão, etc., que facilitará a análise para a tomada de decisão.

• Descreve um conjunto de dados variáveis, reduzindo-os a um pequeno número


de medidas que contém toda a informação relevante. Utiliza número para
descrever fatos. Somente descreve e avalia certo grupo (amostra), sem tirar
quaisquer conclusões ou inferências sobre um grupo maior (população).

• O objectivo da Estatística Descritiva e resumir as principais características de


um conjunto de dados por meio de tabelas, gráficos e resumos numéricos.
Descrever os dados pode ser comparado ao acto de tirar uma fotografia da
realidade.
Estatística Inferencial
• Tem por suporte a teoria das probabilidades e pode ser compreendida
como um conjunto de métodos que possibilitam a generalização de
aspectos colectados de uma população fundamentada em resultados
amostrais.

• Examina-se uma amostra, para que os resultados obtidos possam ser


generalizados para toda a população. Toda conclusão tirada por
amostragem, quando generalizada para a população, apresenta um grau
de incerteza. Ao conjunto de técnicas e procedimentos que permitem dar
ao pesquisador um grau de confiabilidade nas afirmações que faz para a
população, baseadas nos resultados das amostras, damos o nome de
Inferência Estatística.
Estatística Inferencial
• Diz respeito à análise e interpretação de dados amostrais. Consiste
em obter e generalizar conclusões sobre a população a partir de uma
amostra. Utiliza-se da estimação de parâmetros e verificação de
hipóteses, esta por meio, da aplicação dos testes de significância.
Dados
1. é qualquer característica que possa ser observada ou medida de alguma
maneira. As matérias-primas da estatística são os dados observáveis.
2. Consistem em valores provenientes de observações, contagens, medições ou
respostas;
3. Letra, símbolo ou caracter armazenado em um banco ou base de dados que por
si só não tem valor (Data Science);
4. O dado não possui significado relevante e não conduz a nenhuma compreensão
5. Informação colectada e registada referente a uma variável.
6. são informações colectadas ou obtidas através de pesquisa de opinião ou de
outras fontes. O “dado” é o ente mais valioso e mais primário de todo o processo
estatístico.
Dados
• Dados brutos: são valores ou os dados originais ainda
não numericamente organizados após a colecta ou
digitação.

• Rol: é a ordenação dos valores ou dados obtidos


(dados brutos) em ordem crescente ou decrescente
de grandeza numérica ou qualitativa.
Classificação dos dados
Quando realizamos um estudo,
Tipos de dados é importante saber o tipo de
dado envolvido. A natureza dos
dados com os quais estamos
trabalhando determinará qual
Dados Dados procedimento estatístico pode
qualitativos quantitativos ser usado.

consistem em
consistem em medidas
atributos, rótulos ou
numéricas ou
entradas não
contagens
numéricas
Variável
• É aquilo que se deseja observar para se tirar algum tipo de conclusão,
geralmente as variáveis para estudo são seleccionadas por processos
de amostragem.
• são atributos mensuráveis e observáveis que assumem determinadas
características dentro de uma pesquisa e que variam entre indivíduos.
• é uma condição ou característica das unidades da população; a
variável pode assumir valores diferentes em diferentes unidades.
Tipos de variáveis

Variáveis

Quantitativas Qualitativas ou
(Natureza atributos (Natureza
numérica) não numérica)

qualitativa
quantitativas quantitativas qualitativa ordinal
categórica ou
discretas contínuas ou por postos
nominal
Variáveis Quantitativas
• As variáveis quantitativas apresentam, como possíveis realizações,
números resultantes de uma contagem ou mensuração.
Tipos de Variáveis Quantitativas
• Os valores podem ser mensurados numericamente e podem ser
classificados como discretas e contínuas.

• variáveis quantitativas discretas, são aquelas variáveis que pode


assumir somente valores inteiros num conjunto de valores. É gerada
pelo processo de contagem. Os valores atribuídos à variável serão
expressos por números inteiros
• variáveis quantitativas contínuas, são aquelas variáveis que podem
assumir um valor dentro de um intervalo de valores. É gerada pelo
processo de medição. os valores atribuídos à variável foram oriundos
de medições. São expressos por números com casas decimais.
Variáveis Qualitativas
• As variáveis qualitativas apresentam como possíveis realizações uma
qualidade (ou atributo) do individuo pesquisado.
• Os valores são expressos em atributos ou qualidades do pesquisado,
não podendo ser mensuradas numericamente.
Tipos de Variáveis Qualitativas
• variável qualitativa categórica ou nominal, para a qual não existe nenhuma
ordenação nas possíveis realizações; são utilizados símbolos, ou números,
para representar determinado tipo de dados, mostrando, assim, a qual
grupo ou categoria eles pertencem.

• Ordinal ou por postos: quando uma classificação for dividida em categorias


ordenadas em graus convencionados, havendo uma relação entre as
categorias do tipo “maior do que”, “menor do que”, “igual a”, os dados por
postos consistem de valores relativos atribuídos para denotar a ordem de
primeiro, segundo, terceiro e, assim, sucessivamente, é aquela qe para a
qual existe certa ordem nos possíveis resultados.
Exemplos Variáveis Qualitativas
a) A cor dos olhos de estudantes de um curso de biologia – variável
qualitativa nominal.
b) Colecção de livros de biologia – variável qualitativa nominal.
c) Sexo dos estudantes de uma instituição, isto é, masculino ou
feminino - variável qualitativa nominal.
d) Grau de instrução de pessoas que trabalham em um hospital –
variável qualitativa ordinal.
e) Relação de classificados em um concurso público – variável
qualitativa ordinal.
Exemplos Variáveis Quantitativas
a) Número de filhos por casal – variável quantitativa discreta.
b) Número de pontos feitos em um paciente de um hospital – variável
quantitativa discreta.
c) Número de equipamentos em um laboratório - variável quantitativa
discreta.
d) Número de estudantes que cursam Licenciatura em Biologia - variável
quantitativa discreta.
e) Número de alimentos, em quilogramas, ingerida por estudantes num
restaurante - variável quantitativa continua.
f) Quantidade de dinheiro gasto por turistas– variável quantitativa
continua.
g) Volume de refrigerante, em ml, contido em um copo - variável
quantitativa contínua.
População ou Universo e Amostra
• Há dois tipos de conjuntos de dados usados em estatística. Esses
conjuntos são chamados de população e amostra.
• Ao conjunto de entes portadores de, pelo menos, uma característica
comum denominamos população estatística ou universo estatístico.
Na maioria das vezes, por impossibilidade ou inviabilidade económica
ou temporal, limitamos as observações referentes a uma determinada
pesquisa a apenas uma parte da população. A essa parte proveniente
da população em estudo denominamos amostra.
• Para que haja uma clara definição das unidades que formam a
população, e necessária a especificação de três elementos: uma
característica em comum, localização temporal e localização geográfica.
População ou Universo
• é a colecção de todos os resultados, respostas, medições ou contagens
que são de interesse.
• é o conjunto de unidades sobre o qual desejamos obter informação.
• Conjunto de todos os elementos relativos a um determinado fenómeno
que possuem pelo menos uma característica em comum, podendo ser
finita ou infinita.
• é a totalidade dos itens considerados no estudo;
• E a totalidade de elementos que estão sob discussão e dos quais se
deseja informação, se deseja investigar uma ou mais características. A
população pode ser formada por pessoas, domicílios, peças de
produção, cobaias, ou qualquer outro elemento a ser investigado.
População ou Universo
• é o conjunto de coisas ou pessoas sobre as quais você irá coletar dados
ou gerar alguma conclusão. Esse grupo deve possuir alguma
característica em comum.
Amostra
• Quando queremos obter informações a respeito de uma população,
observamos alguns elementos que chamamos de amostra, que é uma
parcela da população utilizada para uma posterior analise de dados.
Em vez de utilizar toda a população, que resulta em maior custo,
tempo e por muitas vezes ser inviável, o processo de amostragem
utiliza uma pequena Porcão representativa da população.
• é um subconjunto ou parte de uma população, deverá ser
considerada finita; é um subconjunto finito de uma população.
• é todo subconjunto de unidades retiradas de uma população para
obter a informação desejada.
• é a parte da população seleccionada para análise, e representa todas
as características da população como se fosse uma fotografia desta
Amostragem
• É a técnica especial para recolher amostras, que garante, tanto
quanto possível, o acaso na escolha. Dessa forma, cada elemento da
população passa a ter a mesma chance de ser escolhido, o que
garante à amostra o carácter de representatividade.
• Antes de obter uma amostra, é preciso definir os critérios que serão
usados para seleccionar as unidades que comporão essa amostra. De
acordo com a técnica usada, tem-se um tipo:
• Amostra aleatória, casual, ou probabilística;
• Amostra semiprobabilística;
• amostra não-probabilística ou de conveniência.
Técnicas de amostragem
Para a selecção de uma amostra casual ou aleatória simples precisamos ter uma
Amostragem casual ou
lista completa dos elementos da população (ou de unidades de amostragem
aleatória simples
apropriadas). Este tipo de amostragem consiste em seleccionar a amostra através
amostra aleatória
de um sorteio, sem restrição.

A amostragem proporcional estratificada considera a população dividida em


Técnicas de Amostragem

Amostragem
subconjuntos, em que cada subconjunto recebe o nome de estrato. Cada
proporcional
subconjunto (chamado estrato) tem uma característica comum entre seus
estratificada
elementos

Conglomerados são divisões populacionais tendo em conta a proximidade física


Amostragem de
dos elementos. Por exemplo, a população Angolana pode ser conglomerada em
Conglomerados
províncias (; os bairros são conglomeráveis em quarteirões etc.

A amostragem sistemática toma por base de selecção algum critério de escolha


Amostragem sistemática dos elementos. Exemplos que podem ser citados desta amostragem: os prédios
de uma rua, os funcionários de um hotel, as linhas de produção, etc..
Técnicas de amostragem
Amostra não-
Amostra aleatória ou probabilística
Amostra semiprobabilística
probabilística ou de
conveniência

amostra amostra por amostra por


simples estratificada
sistemática conglomerados quotas
O método estatístico
Contínua (Registro)

Directa (Dados Primários) Periódica


Colecta De Dados
Indirecta (dados secundários. Ocasional
Fases Do Método Estatístico

Externa
Crítica Dos Dados
Interna

Manual,

Apuração Dos Dados Electromecânica

Electrónica

Exposição Ou Apresentação
Tabelas Ou Gráficos
Dos Dados
Estatística Indutiva Ou
Análise Dos Resultados
Inferencial
O método estatístico
Identificação
do Problema

Recolha de
dados

Critica dos
dados

Apresentação
dos dados

Análise e
interpretação
Identificação do problema ou situação
• Devera ser claro, desde o início do estudo, qual o problema a analisar
e, uma vez conhecido, qual o tipo de decisões que se pretender
tomar. Esta etapa requer já algum conhecimento estatístico pois os
métodos a aplicar não são, independentes da informação que se
pretende recolher.
• O que devemos pesquisar – primeiramente, é preciso definir com
clareza quais os objectivos da pesquisa que queremos realizar. Qual o
Público-alvo? os elementos para os quais desejamos que as
conclusões vindas da pesquisa sejam válidas.
Recolha de dados
• Uma vez identificado o problema, a etapa seguinte consiste na
recolha dos dados necessaires, apropriados, tao completos quanto
possível e, sobretudo, pertinentes para a situação que se pretende
analisar.
• A recolha de toda a informação necessita pode ser feita directamente
quando os dados são obtidos de fonte original ou de forna indirecta
quando os dados recolhidos provem já de uma recolha directa.
• Aos primeiros, que e possível encontrar em registos ou ficheiros,
chamam-se dados primários enquanto que os valores não disponíveis
nestas fontes e calculados a partir daqueles são dados secundários.
Recolha de dados
• As fontes de dados podem ainda ser classificadas coma internas ou
externas.
Recolha de dados
• No respeitante a periodicidade, a recolha dos dados pode ser
classificada como:
• Continua - quando realizada permanentemente
• Periódica - quando feita em intervalos de tempo
• Ocasional - quando realizada de modo esporádico.
Critica dos dados
• Uma vez os dados recolhidos é necessário proceder-se a uma revisão
critica de modo a suprimir valores estranhos ou eliminar erros capazes de
provocar futuros enganos de apresentação e análise ou mesmo de enviesar
as conclusões obtidas.
• Esta critica e tanto mais necessária quando toda ou parte da informação
provem de fontes secundarias, sujeitas a erros de reprodução e que nem
sempre explicitam como os dados foram recolhidos ou quais os limites a
sua utilização.
• A crítica é externa quando visa às causas dos erros por parte do
informante, por distracção ou má interpretação das perguntas que lhe
foram feitas; é interna quando visa a observar os elementos originais dos
dados da colecta.
Apresentação dos dados
• Após a recolha e a critica, convém organizar os dados de maneira
pratica e racional, para um melhor entendimento do fenómeno que
se pretende estudar. Começa aqui o principal objective da Estatística
Descritiva: criar os instrumentos necessários para classificar e
apresentar conjuntos de dados numéricos de tal modo que a
informação neles contida seja apreendida mais fácil e rapidamente.
• Os dados colectados devem ser organizados em tabelas que facilitem
a visualização e o cálculo de medidas estatísticas (médias, desvios e
amplitude da amostra, etc.). As tabelas podem ser representadas por
meio de gráficos que permitem um exame ainda mais rápido e fácil
dos resultados da pesquisa
Analise e interpretação dos resultados
• Por ultimo e necessário interpretar os resultados encontrados. Esta
interpretação estará tanto mais facilitada quanto se tiverem escolhido, em
etapas anteriores, os instrumentos mais apropriados a representação e
analise do tipo de dados recolhidos.

• O objectivo último da Estatística é tirar conclusões sobre o todo


(população) a partir de informações fornecidas por parte representativa do
todo (amostra). Assim, realizadas as fases anteriores (Estatística
Descritiva), fazemos uma análise dos resultados obtidos, através dos
métodos da Estatística Indutiva ou inferencial, que tem por base a indução
ou inferência, e tiramos desses resultados conclusões e previsões.
Séries estatísticas
• Denominamos série estatística toda tabela que apresenta a
distribuição de um conjunto de dados estatísticos em função da
época, do local ou da espécie.
• Daí, podemos inferir que numa série estatística observamos a
existência de três elementos ou factores: o tempo, o espaço e a
espécie. Conforme varie um dos elementos da série, podemos
classificá-la em histórica, geográfica e específica.
• Uma série estatística é um conjunto de dados ordenados segundo
uma característica comum, as quais servirão posteriormente para se
fazer análises e inferências.
Séries Estatísticas

Séries
Estatísticas

Série Série de
Série Temporal Série Específica Série Mista ou
Geográfica ou Distribuição de
ou Cronológica ou Qualitativa Composta
Territorial Freqüências
Série Temporal ou Cronológica

• Séries históricas, cronológicas, temporais ou marchas - Descrevem os


valores da variável, em determinado local, discriminados segundo
intervalos de tempo variáveis.
• É a série cujos dados estão dispostos em correspondência com o
tempo, ou seja, varia o tempo e permanece constante o fato e o local.
• Produção de Petróleo Bruto no Brasil de 1976 a 1980
Série Geográfica ou Territorial
• Séries geográficas, espaciais, territoriais ou de localização -
Descrevem os valores da variável, em determinado instante,
discriminados segundo regiões.
• É a série cujos dados estão dispostos em correspondência com o
local, ou seja, varia o local e permanece constante a época e o fato.
• População Urbana do Brasil em 1980
Série Específica ou Qualitativa
Séries específicas ou categóricas - descrevem os valores da variável, em
determinado tempo e local, discriminados segundo
especificações ou categorias.
É a série cujos dados estão dispostos em correspondência com a
espécie ou qualidade, ou seja, varia o fato e permanece constante a
época e o local.
• População Urbana e Rural do Brasil em 1980 (x 1000)
Série Mista ou Composta
• Tabela de dupla entrada - Muitas vezes temos necessidade de apresentar,
em uma única tabela, a variação de valores de mais de uma variável, isto
é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries
em uma única tabela, obtemos uma tabela de dupla entrada. Em uma
tabela desse tipo ficam criadas duas ordens de classificação: uma
horizontal (linha) e uma vertical (coluna).
• A combinação de duas ou mais séries estatísticas constituem novas séries
denominadas compostas e apresentadas em tabelas de dupla entrada. O
nome da série mista surge de acordo com a combinação de pêlo menos
dois elementos
Série de Distribuição de Frequências
• é, de longe, a mais importante e a mais utilizada em estatística. Na
distribuição de frequência, os dados são ordenados segundo um
critério de magnitude, em classes ou intervalos, permanecendo fixos
o fato, o local e a época. Isto é, embora o fenómeno estudado seja
único, este poderá sofrer uma subdivisão em classes
Tabelas
• Uma tabela resume os dados por meio do uso de linhas e colunas,
nas quais são inseridos os números. Uma tabela compõe-se de:
1. Corpo – conjunto de linhas e colunas que contem informações sobre a
variável em estudo.
2. Cabeçalho – parte superior da tabela que especifica o conteúdo das
colunas.
3. Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas.
4. Linhas – rectas que facilitam a leitura, no sentido horizontal, de dados que
se inscrevem nos seus cruzamentos com as colunas.
5. Casas ou Células – espaço destinado a um só numero.
6. Titulo – conjunto de informações (as mais completas possíveis) localizado
no topo da tabela.
• Existem, ainda, elementos complementares que são: a fonte, as notas
e as chamadas, os quais devem ser colocados no rodapé da tabela.
Tabela de distribuição de frequência
• Para que uma variável estudada seja observada mais
adequadamente, podemos dispor ordenadamente seus valores em
uma tabela. Essa tabela é chamada de distribuição de frequências ou
tabela de frequências.
• Distribuição de Frequência é uma série estatística onde os dados se
encontram dispostos em categorias ou classes juntamente com as
respectivas frequências.
• Uma distribuição de frequência é uma tabela que mostra classes ou
intervalos dos valores com a contagem do número de ocorrências em
cada classe ou intervalo. A frequência f de uma classe é o número de
ocorrências de dados na classe.
Tabela de distribuição de frequência
• As distribuições de frequências são representações nas quais os
valores da variável se apresentam em correspondência com suas
repetições, evitando assim, que eles apareçam mais de uma vez na
tabela, poupando, desse modo, espaço, tempo e, muitas vezes,
dinheiro.
• A partir desses dados desorganizados, chamados de dados brutos
(dados tal como foram colectados, sem nenhum tipo de organização),
e difícil chegar a alguma conclusão a respeito da variável em estudo.
• Obteríamos alguma informação a mais se arranjássemos os dados
segundo uma certa organização como na sua ordem de magnitude,
ou seja, se arrumássemos os dados na forma de um rol (lista em que
os valores são dispostos em uma determinada ordem, crescente ou
decrescente).
Tipos de Frequência
Frequência
Absoluta Ou Frequência
Frequência relativa
Simples

Frequência
acumulada
Frequência absoluta ou frequência simples
• Frequência simples ou frequência absoluta ou, simplesmente,
frequência de uma classe ou de um valor individual é o número de
observações correspondentes a essa classe ou a esse valor.

• A quantidade de vezes que um determinado dado ou valor é repetido


na amostra.
Tabelas De Contingência
• Muitas vezes os elementos da amostra ou da população são
classificados de acordo com duas variáveis qualitativas.
• Os dados devem então ser apresentados em tabelas de contingência,
isto é, em tabelas de dupla entrada, cada entrada relativa a uma das
variáveis.
• As tabelas de contingência podem apresentar frequências relativas
em percentagens, além das frequências.
Bibliografia
Givaldo Oliveira Dos Santos, Bioestatística, Instituto Federal de Educação,
Ciências e Tecnologia de Alagoas Departamento de Educação a Distância
Universidade Aberta do Brasil
Larson, Ron Estatística aplicada / Ron Larson, Betsy Farber ; tradução José
Fernando Pereira Gonçalves ; revisão técnica Manoel Henrique Salgado. -- São
Paulo : Pearson Education do Brasil, 2015.
Vieira, Sónia, 1942- Introdução à bioestatística [recurso electrónico)/ Sónia
Vieira. - Rio de Janeiro : Elsevier, 2011. 345 p., recurso digital;
Crespo, António Arnot Estatística fácil. - 19.ed. actual. - São Paulo : Saraiva, 2009.
Luz, José Gilvan da. Estatística, Aracaju : Gutemberg, 2010.
Elizabeth Reis, Estatística Descritiva, Edições Silabo, 7ª Edição Lisboa, 2008
Guimarães, Paulo Ricardo Bittencourt. Métodos quantitativos estatísticos 1.ed.
rev.. -Curitiba, PR : IESDE Brasil, 2012.
Links uteis
• Documentação do Power BI - https://learn.microsoft.com/pt-
br/power-bi/
• O que é Power BI? - https://learn.microsoft.com/pt-br/power-
bi/fundamentals/power-bi-overview
Canais do you tube para aprender estatística
• https://www.youtube.com/c/CertificadoCursosOnline

• https://www.youtube.com/c/CanalPesquise
SITES PARA CURSOS GRATUITOS COM CERTIFICADOS
• Cursos Online - https://www.datascienceacademy.com.br
Cursos gratuitos da DSA
Aplicações de interesse

• O Power BI é uma colecção de serviços de software, aplicativos e conectores que trabalham juntos para
transformar suas fontes de dados não relacionadas em informações coerentes, visualmente envolventes
e interactivas. Os dados podem estar em uma planilha do Excel ou em uma colecção de data
warehouses híbridos locais ou baseados na nuvem. Com o Power BI, você pode se conectar facilmente a
fontes de dados, visualizar e descobrir conteúdo importante e compartilhá-lo com todas as pessoas que
quiser.

Você também pode gostar