Você está na página 1de 8

Material de Estudo

Probabilidade e Estatı́stica

1 Introdução
A Estatı́stica é a ciência dos dados que permite de forma sistemática coletar, organizar, analisar,
interpretar e apresentar conjuntos de dados oriundos de estudos ou experimentos, realizados em qualquer
área do conhecimento.
O objeto de estudo em estatı́stica é um conjunto de dados que pode constituir uma população ou
uma amostra.

• Uma população é um conjunto finito ou infinito de elementos.

• Uma Amostra é um subconjunto de uma população e busca-se geralmente amostras representativas,


aquelas que mantém as caracterı́sticas da população.

Exemplo: O número de eleitores no estado de Mato Grosso consiste uma população finita e grande. O
tamanho das pesquisas eleitorais realizadas pelos institutos consiste numa amostra. Áreas de preservação
ambiental (parques, reservas, etc.), código florestal, tratamento de águas poluı́das ou contaminadas.
Areas são: Estatı́stica descritiva, Teoria de probabilidade e Inferência Estatı́stica.

• Estatı́stica descritiva - é a parte que tem por objetivo organizar, apresentar e sintetizar dados
observados de determinada população, sem pretensões de tirar conclusões de caráter extensivo.

• Teoria de probabilidade - objetiva descrever e prever as caracterı́sticas de populações infinitas.

• Inferência Estatı́stica - é a parte que, baseando-se em estudos realizados sobre os dados de uma
amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra
foi retirada. A estatı́stica inferencial tem sua estrutura fundamentada na teoria matemática das
probabilidades. É, também definida como um conjunto de métodos para a tomada de decisões.

1
Estatı́stica Descritiva 2

2 Estatı́stica Descritiva
A estatı́stica descritiva é parte da estatı́stica que lida com: Organização, Análise, Representação e
redução de dados. Esta é feita por meio de tabelas de frequências, gráficos e medidas descritivas (média,
variância, coeficiente de variação, entre outra).

• Tipo de variável,

• Representação tabular e gráfico,

• Medidas de posição,

• Medidas de dispersão,

• Lista de exercı́cios.

2.1 Tipo de variáveis

Variável é qualquer caracterı́stica dos elementos da amostra. As variáveis podem ter valores numéricos
ou não.

(i) Variáveis qualitativas ou categóricas são as caracterı́sticas dos dados que não possuem valores
quantitativos. Estas variáveis são definidas por categorias, ou seja, representam uma classificação
dos indivı́duos.




 Ordinal existe uma ordenação entre as categorias





 desempenho (ótimo, bom, regular e ruim),

Qualitativa escolaridade, purificação de agua, estagio da doença.





 Nominal não exige ordenação dentre as categorias.



 sexo, cor de olhos, nacionalidade, doente/sadio.

(ii) As variáveis quantitativas são aquelas que expressam quantidades numericamente.



 Discreta

 São variáveis que podem assumir valores inteiros.





 É gerada pelo processo de contagem.





 Número de filhos, número de globulos vermelhos numa



 gota de sangue, número de idiomas, etc.
Quantitativa


 Contı́nua São variáveis que podem assumir um valor dentro de um





 intervalo de valores. É gerada pelo processo de medição.





 Pressão arterial, idade, peso, altura das pessoas,



 velocidade, medição de gás cloro, salario, etc.
Estatı́stica Descritiva 3

O CPF que tipo de variável é? e porque?

Observações

Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a
variável idade, medida em anos completos, é quantitativa (contı́nua); mas, se for informada apenas
a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos
lutadores de boxe, uma variável quantitativa (contı́nua) se trabalhamos com o valor obtido na balança,
mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado,
etc.).
Outro ponto importante é que nem sempre uma variável representada por números é quantitativa.
O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o sexo
de animais é registrado na planilha de dados como 1 se é macho e 2 se fêmea. Isto não significa que a
variável sexo passou a ser quantitativa!, é somente uma identificação.

2.2 Representação tabular e gráfico para dados qualitativos

Temos o seguinte exemplo em que mostra um tabela já organizada com resultados e uns gráficos para
melhor percepção dos dos dados. A fonte da Tabela 1 foi obtida do livro Bioestatı́stica, Arango, H.G.
Observamos da tabela que existe uma alta intoxicação em crianças por medicamentos o que representa
um 38%.

Tabela 1: Tabela de distribuição de Frequências para dados de intoxicação e envenenamento em crianças


de 1 a 5 anos.
Causas Frequência Frequência Frequência Relativa
categóricas Absoluta Relativa Porcentual
(fa ) (fr ) (fr %)
Medicamentos 152 0,380 38,00%
Produtos Domésticos 49 0,123, 12,25%
Produtos quı́micos 45 0,113 11,25%
Animais peçonhentos 34 0,085 8,50%
Pesticidas domésticos 26 0,065 6,50%
Plantas 23 0,058 5,75%
Outros 71 0,178 17,75%
Total 400 1,00 100%
Estatı́stica Descritiva 4

2.2.1 Gráficos para variáveis qualitativas

Identificamos que os dados de causas de intoxicação e envenenamento em crianças é considerada uma


variável qualitativa nominal. Os dados qualitativos são usualmente bem ilustrados num simples gráfico
de barras ou também um diagrama circular.

(a)

(b)

Figura 1: (a) Gráfico de barras e (b) Diagrama circular


Estatı́stica Descritiva 5

2.2.2 Distribuição de Frequências para variáveis qualitativas

Para obtenção de resultados como o exemplo 1, seguimos como primeiro passo uma descrição de dados
para criar uma tabela de distribuições de frequências usando os seguintes cálculos,

• n é o tamanho da amostra (Frequência absoluta Total),

• Frequência é a medida que quantifica a ocorrência dos valores de uma variável dado a um conjunto
de dados.

- Frequência Absoluta, fa , é o número de ocorrências de uma variável.

- Frequência Relativa, fr = fa /n, porcentagem relativa à Frequência Absoluta.

- Frequência Relativa Porcentual fr % = fr × 100%.

Agora usamos um outro exemplo em que podemos ver o conjunto de dados da Tabela 2.
Exemplo 2: Para adequar os produtos às preferências dos clientes, um provedor fez uma pesquisa
sobre os provedores a qualidade dos serviços prestados utilizando uma amostra de 20 clientes, obtendo
as seguintes informações..

Tabela 2: Variáveis de 20 clientes de um provedor


Amostra Sexo Qualidade Amostra Sexo Qualidade
1 feminino Boa 11 feminino Ruim
2 feminino Boa 12 feminino Ruim
3 feminino Boa 13 masculino Boa
4 feminino Boa 14 masculino Boa
5 feminino Boa 15 masculino Ótimo
6 feminino Ótimo 16 masculino Regular
7 feminino Ótimo 17 masculino Regular
8 feminino Regular 18 masculino Ruim
9 feminino Regular 19 masculino Ruim
10 feminino Ruim 20 masculino Ruim

Identificamos que os dados apresentam duas variáveis, Sexo é variável qualitativa nominal e Quali-
dade é variável qualitativa ordinal, e o tamanho da amostra será n = 20 pois temos 20 observações.
Estatı́stica Descritiva 6

Tabela 3: Distribuição de freqüência do sexo de 20 clientes de um provedor.


Sexo Freqüência Freqüência Freqüência
Absoluta Relativa Percentual
(fa) (fr) (fp)
feminino 12 0,60 60%
masculino 8 0,40 40%
20 1,00 100%

Para a variável qualidade no atendimento, além das freqüências utilizadas para a variável sexo, pode-
mos utilizar mais duas freqüências:

• Freqüência Acumulada (FA)- obtida pelo soma das freqüências absolutas;

• Freqüência Percentual Acumulada (FP) - obtida pela soma das freqüências percentuais.

Tabela 4: Distribuição de freqüência da qualidade de atendimento de um provedor de acordo com 20


clientes
Qualidade no Freqüência Freqüência Freqüência Freqüência Freqüência
Atendimento Absoluta Relativa Percentual Acumulada Percentual
(fa) (fr) (fp) (FA) Acumulada
(FP)
Ótima 3 0,15 15% 3 15%
Boa 7 0,35 35% 10 50%
Regular 4 0,20 20% 14 70%
Ruim 6 0,30 30% 20 100%
Total 20 1,00 100% - -

Observações Para uma boa organização dos dados, tenha em conta que a soma das frequências
absolutas deve de ser o total de tamanho da amostra, n. A soma das frequências relativas deve de ser
1, 00 e a soma das frequências porcentuais deve de ser 100%.
Agora, dados qualitativos são usualmente bem ilustrados num simples gráfico de barras onde a altura
da barra é igual à freqüência. O gráfico na Figura 2 têm as freqüências percentuais da Tabela 4.
Exercicio: Vocês podem fazer o gráfico circular considerando a Frequência porcentual lembrando que
o circulo representa meu 100% e será partilhado em pedaços porcentagem.
Exercicio: é possivel contruir o grafico circular usando alguma das frequências absolutas? comente no
Forum.
Estatı́stica Descritiva 7

Figura 2: Qualidade no atendimento de um provedor de acordo com 20 clientes

Em alguns casos podemos estar interessados em resumir duas variáveis qualitativas ao mesmo tempo,
neste caso vamos estudar a relação entre duas variáveis qualitativas que pode ser representada em uma
tabulação cruzada. Nesta tabela conta-se quantos valores correspondem a cada par de possı́veis resultados,
para as duas variáveis. O resultado pode ser apresentado como freqüência absoluta ou relativa, em relação
as colunas ou as linhas (nunca ambas).

2.2.3 Tabulação cruzada

A tabulação cruzada é um importante componente onde duas variáveis são tabuladas simultaneamente.
Os resultados podem ser apresentados como frequências absolutas ou relativas, em relação as colunas ou
as linhas (nunca ambas). Podemos construir a tabela cruzada para o Exemplo 1.

Tabela 5: Distribuição de frequência absoluta de 20 clientes de um provedor de acordo com qualidade de


atendimento e o sexo
Qualidade Sexo total
feminino masculino
Ótimo 2 1 3
Boa 5 2 7
Regular 2 2 4
Ruim 3 3 6
Total 12 8 20
Estatı́stica Descritiva 8

A seguir apresentamos a Figura 2.2.3 de barras justapostas de duas variáveis qualitativas.

Figura 3: Distribuição de frequências absoluta de 20 clientes de um provedor de acordo com qualidade


de atendimento e o sexo.

Você também pode gostar