Você está na página 1de 32

Cálculo das Probabilidades e Estatística I

Profa . Maria Lídia Coco Terra

Departamento de Estatística
Universidade Federal da Paraíba - UFPB
marialidia@de.ufpb.br

João Pessoa, 04 de junho de 2019


Introdução

• O que é Estatística?
• Coleção de métodos para planejar experimentos, obter e orga-
nizar dados, resumi-los, analisá-los, interpretá-los e deles extrair
conclusões.
• Os dois ramos da estatística:
• Estatística Descritiva: Trata da organização, resumo e apre-
sentação dos dados.
• Estatística Inferencial: A partir de uma amostra, tirar conclu-
sões sobre a população.
Objetivo da Estatística Descritiva

• Na estatística descritiva o objetivo é resumir os dados coletados


de forma a extrair destes, conhecimento útil acerca do problema
que gerou os dados.
• Nessa fase da pesquisa, estamos preocupados em apresentar os
dados em forma de tabelas e gráficos e em obter medidas que
quantifiquem os resultados do estudo.
Conceitos Básicos

População: é o conjunto de elementos, indivíduos ou objetos


que se pretende estudar.
Amostra: é qualquer subconjunto de elementos de uma popu-
lação. [n: número de indivíduos que constituem uma amostra]

Obs: a amostra deve ser selecionada seguindo certas regras


e deve ser representativa, de modo que ela represente todas
as características da população como se fosse uma fotografia
desta.
Censo X Estudos por amostragem

• Na pesquisa estatística a forma de coleta dos dados pode ser


feita através de censo ou amostragem.

Censo: quando todos os indivíduos de uma população são pes-


quisados.
Amostragem: quando utilizamos uma amostra de indivíduos
de uma determinada população. O processo de retirada de in-
formações dos “n” elementos amostrais, deve seguir um método
criterioso e adequado (tipos de amostragem).

• Um estudo por amostragem é preferível a um censo por diversos


motivos, dentre os quais:
• Menor custo;
• Rapidez;
• Resultados muito próximos aos do censo.
Conceitos Básicos

Parâmetro: Descrição numérica de uma característica da po-


pulação.
Ex: Média, Mediana, Desvio Padrão populacional.

Estimador: Característica numérica estabelecida para uma amos-


tra.
Ex: Média amostral, Mediana amostral, Desvio Padrão amos-
tral.

Estimativa: Valor numérico assumido por um estimador numa


determinada amostra.
Conceitos Básicos

Unidade: qualquer indivíduo, elemento ou objeto que faça parte


do conjunto a ser estudado. Podem ser pessoas, domicílios,
escolas, creches, células ou qualquer outra unidade.
Variável: característica das unidades sobre as quais quere-
mos obter informações. Os símbolos utilizados para represen-
tar as variáveis são as letras maiúsculas do alfabeto, tais como
X , Y , Z , . . . que pode assumir qualquer valor de um conjunto
de dados.

Obs: As variáveis podem ser classificadas em quatro categorias.


Tipos de Variáveis

Qualitativa: quando seus valores são expressos por atributos.


Podem ser classificadas em nominal ou ordinal.

• Nominal: Os indivíduos são classificados em categorias segundo


uma característica.
Ex: Sexo, Bairro, Curso, etc.
• Ordinal: Os indivíduos são classificados em categorias que pos-
suem algum tipo inerente de ordem. Neste caso, uma categoria
pode ser “maior” ou “menor” do que outra.
Ex: Nível de Escolaridade (Analfabeto < Ensino Fundamen-
tal < Ensino Médio < Ensino Superior ), Escala de Qualidade
(Péssimo < Ruim < Regular < Bom < Ótimo), etc.
Tipos de Variáveis

Quantitativa: quando seus valores são expressos em números.


Esta por sua vez pode ser classificada em discreta ou contínua.

• Discreta: é a variável que só pode assumir valores pertencentes


a um conjunto enumerável. Normalmente resulta de enumera-
ções ou contagens.
Ex: Número de Filhos, Idade, Número de Acidentes de Transito,
etc.
• Contínua: é a variável que pode assumir infinitos valores dentro
de um intervalo finito. Resulta, em geral, de medições.
Ex: Peso, Altura, Renda, etc.
Tipos de Variáveis
Estatística Descritiva

• Podemos dizer que a Estatística Descritiva é a base de uma boa


análise estatística.
• Não há uma pesquisa eficiente sem essa base.

• O conjunto de técnicas que permite descrever, analisar e in-


terpretar os dados numéricos referentes à uma população ou
amostra define essa importante parte da Estatística.
• O objetivo da Estatística Descritiva é sintetizar de uma forma
compreensível toda informação contida em um conjunto de
dados.
• Esta síntese está na construção de tabelas, gráficos e cálculo de
medidas que representem adequadamente a informação contida
nos dados.
Estatística Descritiva

• Em um sentido amplo, as funções da Estatística Descritiva são


as seguintes:

1 Obtenção dos dados (coleta);


2 Organização e classificação dos dados;
3 Apresentação dos dados (através de tabelas e gráficos);
4 Cálculo de medidas que forneçam um resumo das informações
contidas no conjunto de dados (medidas-resumo).
Etapas da Estatística Descritiva

(1) Definição do problema: Trata de uma completa formulação


do problema em questão.
(2) Definição do objetivo: Trata de definir a meta a ser alcançada
diante do problema em questão.

(3) Planejamento: Consiste em determinar a metodologia para li-


dar com o problema em questão, através do levantamento de
informações sobre o tema em estudo. O planejamento implica
em obter respostas para uma série tradicional de perguntas en-
volvendo

“quem”, “o que”, “sempre”, “por que”, “para que”, “para


quando”.
Exemplo 1.1

• Suponha que em João Pessoa exista o interesse na obtenção de


informações sobre determinada virose que atinge parte da popu-
lação da cidade em determinada época do ano. O primeiro tra-
balho da equipe encarregada da pesquisa, será evidentemente,
o de obter resposta para as perguntas organizadas da seguinte
forma:

• Quem tem interesse em obter as informações?


• O que devemos procurar saber?
• Será executada sempre? A pesquisa será periódica ou ocasi-
onal?
• Por que as informações são necessárias e desejáveis?
• Para que se desejam as informações?
• Para quando a pesquisa deve ser concluída?
Etapas da Estatística Descritiva

• Sempre é preciso levar em consideração o seguinte:

(a) O exame das informações disponíveis, ou seja, análise de tudo


que foi publicado sobre o assunto, obtendo-se relatórios sobre
atividades semelhantes ou correlatas;
(b) A definição da população de interesse, ou seja, é necessário saber
qual o conjunto que vai ser pesquisado, distribuindo e classifi-
cando os elementos pertencentes a esse conjunto, de modo a
permitir um trabalho mais organizado e mais fácil;
(c) A construção adequada de um questionário;
(d) A escolha pelo tipo de levantamento, ou seja, deve-se decidir
por um censo (analisar todos os indivíduos da população) ou
por um levantamento amostral (obtenção de amostra a partir
de uma metodologia existente).
Etapas da Estatística Descritiva

(e) A programação das atividades a serem desenvolvidas;

(f) O custo total de todas as etapas do trabalho a ser


desenvolvido;

(g) Cuidadosa análise das informações disponíveis;

(h) Se em (b) a opção for um levantamento amostral, realizar o


delineamento da amostra.
Etapas da Estatística Descritiva

(4) Coleta de dados:


(a) Feita após o planejamento e a devida determinação das carac-
terísticas mensuráveis do fenômeno de interesse (coletivamente
típico) que se quer pesquisar.
(b) A coleta de dados pode ser feita de várias formas. A forma ideal
é aquela que maximiza todos os recursos disponíveis, dados os
objetivos e a precisão estipulados de forma prévia.
(c) Quando os dados forem referentes a indivíduos, a coleta po-
derá ser realizada mediante respostas a questionários previa-
mente elaborados.
(d) Por fim, é importante lembrar da classificação dos dados (pri-
mários e secundários) e das formas de coleta de dados (direta e
indireta) definidos anteriormente.
Etapas da Estatística Descritiva

(5) Apuração e apresentação dos dados: A apuração baseia-


se na validação dos dados coletados, buscando eventuais falhas
que tenham ocorrido durante a coleta de dados.

(6) Apresentação dos dados: Consiste da apresentação dos dados


através de tabelas e gráficos, tornando mais fácil o exame do
fenômeno sob estudo.

(7) Análise estatística e apresentação dos resultados: São cal-


culadas quantidades de interesse através de alguma técnica exis-
tente, com o intuito de descrever, de forma aproximada, a rea-
lidade referente ao fenômeno em questão. O interesse maior re-
side em se tirar conclusões que auxiliem o pesquisador a resolver
seu problema. Nesta fase, calculam-se medidas cuja finalidade
principal é descrever o fenômeno que se está investigando.
Estatística Descritiva

• Representação tabular: a organização dos dados em tabelas


proporciona um meio eficaz de estudo do comportamento de
características de interesse. Ex: Distribuição de Frequências.
• Representação gráfica: proporciona uma interpretação imedi-
ata dos resultados devido a sua simplicidade e clareza.
• Medidas resumo: possibilitam representar um conjunto de da-
dos relativo a observação de determinado fenômeno de forma
resumida. São classificadas em medidas de posição, dispersão,
assimetria e curtose.
Tabelas Estatísticas

• Em geral, uma tabela estatística deve apresentar a seguinte es-


trutura:
• Cabeçalho;
• Corpo;
• Rodapé.

• O cabeçalho deve conter informação suficiente para responder


às seguintes questões:
• O que está representando?
• Onde ocorreu?
• Quando ocorreu?

• Observação: Uma tabela sempre apresenta as laterais abertas.


Caso as laterais estejam fechadas, chamamos de quadro.
Tabelas Estatísticas

• O corpo são as colunas e subcolunas onde efetivamente regis-


tramos os dados e o rodapé é reservado para observações per-
tinentes à tabela, e para o registro da fonte dos dados.
• De um modo geral, em uma tabela estatística devem ser consi-
derados os seguintes itens:

• Elementos essenciais:
1 Título: Indicação que precede a tabela e que contém a desig-
nação do fato observado, o local e a época em foi registrado;

2 Cabeçalho: Parte superior da tabela que especifica o conteúdo


das colunas;
3 Coluna Indicadora: Parte da tabela que especifica o conteúdo
das linhas.
4 Corpo da Tabela: Conjunto de colunas e linhas que contém as
informações sobre a variável em estudo.
Tabelas Estatísticas

• Elementos complementares:
(a) Fonte: Indicação da entidade responsável pelo fornecimento do
conjunto de dados ou pela sua elaboração;

(b) Notas: Informações de natureza geral destinadas a conceituar


ou esclarecer o conteúdo das tabelas ou a indicar a metodologia
adotada no levantamento ou na elaboração dos dados;

(c) Chamadas: Informações da natureza específica sobre deter-


minada parte da tabela, que tem como objetivo conceituar ou
esclarecer sobre os dados obtidos.
Distribuição de Frequências
• É utilizada para resumir toda a informação obtida, de modo a
facilitar a análise. Ao se estudar uma variável, é desejável co-
nhecer o comportamento da mesma, analisando a ocorrência de
todos os possíveis resultados obtidos a partir do conhecimento
das informações.
• É uma tabela onde se preocupa em fazer corresponder os valores
(categorias) observados da variável em estudo e as respectivas
frequências.
Distribuição de Frequências
• Dados Brutos: São os dados obtidos através de algum pro-
cedimento estatístico, que estão disponíveis logo após a coleta,
mas que não estão numericamente organizados.
Exemplo: 50 crianças foram entrevistadas, fornecendo diversas
informações. Em relação à variável IDADE, por exemplo, temos
que:

8 11 8 12 14 13 11 14 14 15
6 10 14 19 6 12 7 5 8 8
10 16 10 12 12 8 11 6 7 12
7 10 14 5 12 7 9 12 11 9
14 8 14 8 12 10 12 19 7 15

• Como se pode observar no exemplo, os valores estão dispostos


de forma desordenada e pouca informação se consegue obter
inspecionando os dados.
Distribuição de Frequências
• Rol: São os dados ordenados, de forma crescente ou decres-
cente. A vantagem de ordenar o conjunto de observações está
em detectar de um modo mais amplo a variabilidade das mes-
mas. No exemplo anterior, dispondo os dados em ordem cres-
cente, temos:

5 7 8 8 10 11 12 12 14 15
5 7 8 8 10 11 12 12 14 15
6 7 8 9 10 11 12 13 14 16
6 7 8 9 10 12 12 14 14 19
6 7 8 10 11 12 12 14 14 19

• Note que dessa forma fica fácil de verificar os valores extremos


(máximo e mínimo). Esse tipo de procedimento não é viável
quando se tem um conjunto de dados muito grande, pois a
análise se torna extremamente complicada.
Distribuição de Frequências

Freqüência simples absoluta [fi ]: É o número de vezes que


cada valor da variável se repete na amostra ou população.

Freqüência simples relativa [fri ]: É o número de vezes que


esse valor ocorre relativamente ao total da amostra [n]; no fundo
representa a parcela da amostra.
fi
fri =
n
Distribuição de Frequências

Frequência acumulada absoluta [Facj ]: É a soma do número


de ocorrências para os valores iguais ou inferiores ao valor dado.
j
X
Facj = fi = f1 + f2 + . . . + fj .
i=1

Frequência relativa acumulada [Fracj ]: É o número de vezes


que a frequência acumulada absoluta ocorre relativamente ao
total da amostra [n].
j
X f1 + f2 + . . . + fj
Fracj = fri = fr1 + fr2 + . . . + frj = .
n
i=1
Distribuição de Frequências por Valores

• É o arranjo dos valores e suas respectivas frequências, ou seja,


é uma tabela onde os valores da variável aparecem individual-
mente. Teremos uma tabela assim:

Xi fi
X1 Número de valores iguais a X1 =f1
X2 Número de valores iguais a X2 =f2
X3 Número de valores iguais a X3 =f3
.. ..
. .
Xk Número de valores iguais a Xk =fk
Σ f1 + f2 + . . . + fk = n

• Note que para cada Xi existe uma frequência fi associada.


Dessa forma, teremos que i = 1, . . . , k. Em outras palavras,
dizemos que a tabela possui k linhas.
Distribuição de Frequências por Valores

• Exemplo: Construir a distribuição de frequências por valores,


utilizando os dados do exemplo anterior.

Xi (idade) fi fri faci fraci


05 2 2/50 2 2/50
06 3 3/50 5 5/50
07 5 5/50 10 10/50
08 7 7/50 17 17/50
09 2 2/50 19 19/50
10 5 5/50 24 24/50
11 4 4/50 28 28/50
12 9 9/50 37 37/50
13 1 1/50 38 38/50
14 7 7/50 45 45/50
15 2 2/50 47 47/50
16 1 1/50 48 48/50
19 2 2/50 50 1
Σ 50 1
Exercício 1.1

• De acordo com a Secretária de Turismo da Paraíba, os quatro


estados com maior participação no número de turistas que de-
sembarcaram no aeroporto de João Pessoa em 2009 foram: São
Paulo (SP), Rio de Janeiro (RJ), Bahia (BA) e Paraná (PR). Os
dados de uma amostra de 30 turistas abordados no aeroporto
são apresentados a seguir:

1 Que tipo de variável é essa?


2 Construa uma tabela de distribuição de frequências, usando f e
fr.
Exercício 1.1

Estado Frequência Frequência Frequência Freq. Relativa


(Xi ) (fi ) relativa (fri ) Acum. (fac) Acum. (frac)
BA 6 6/30 = 0, 2 6 0, 2
PR 5 5/30 = 0, 17 11 0, 37
RJ 6 6/30 = 0, 2 17 0, 57
SP 13 13/30 = 0, 43 30 1
Total (Σ) 30 1
Exercício 1.2

• Considere o conjunto de dados abaixo:

9 8 5 4 5 6 2 2 4 3
4 7 9 5 6 7 1 4 7 2
4 6 3 5 7 9 5 1 4 8

1 Que tipo de variável é essa?


2 Construa uma tabela de distribuição de frequências, usando as
frequências vistas anteriormente.

Você também pode gostar