Você está na página 1de 41

Tópicos de Estatística Aplicada

Prof.: Dr. Jaime Martins de Sousa Neto

Abril / 2015
SUMÁRIO

INTRODUÇÃO....................................................................................................................... 4
1. CONCEITOS BÁSICOS.................................................................................................. 5
1.1. Estatística ................................................................................................................ 5
1.2. Método Científico ..................................................................................................... 5
1.2.1. Método Experimental ........................................................................................ 5
1.2.2. Método Estatístico ............................................................................................ 5
1.3. População ............................................................................................................... 6
1.4. Amostra e amostragem ........................................................................................... 7
1.5. Parâmetro, Estimador e Estimativa .......................................................................... 8
1.6. Censo ...................................................................................................................... 9
1.7. Visão sistêmica da estatística .................................................................................. 9
2. TIPOS DE VARIÁVEIS ................................................................................................... 9
2.1. Qualitativas .............................................................................................................. 9
2.2. Quantitativas.......................................................................................................... 10
3. APRESENTAÇÃO DE DADOS ..................................................................................... 10
3.1. Tabelas.................................................................................................................. 10
3.1.1. Componentes fundamentais de uma tabela .................................................... 11
3.1.2. Generalidades sobre as tabelas ..................................................................... 12
3.2. Séries Estatísticas ................................................................................................. 13
3.2.1. Série Cronológica, Temporal, Evolutiva, Histórica ou em Marcha de
Andamento ................................................................................................................... 13
3.2.2. Série Geográfica, Territorial ou de localização................................................ 13
3.2.3. Série Específica, Qualitativa ou Categórica .................................................... 13
3.2.4. Conjugação de Séries Estatísticas ................................................................. 14
3.3. Gráficos ................................................................................................................. 14
3.3.1. Gráficos para Variáveis Qualitativas ............................................................... 15
3.3.2. Gráficos para Variáveis Quantitativas ............................................................. 18
3.3.1. Distribuição de Frequências ........................................................................... 19
3.4. Medidas de Posição .............................................................................................. 24
3.4.1. Média Aritmética ............................................................................................. 24
3.4.2. Mediana.......................................................................................................... 26
3.4.3. Moda .............................................................................................................. 28
3.4.4. Separatrizes (quartis, decis, percentis) ........................................................... 30
3.5. Medidas de Dispersão ou de Variação .................................................................. 33
3.5.1. Medidas do tipo amplitude .............................................................................. 33
3.5.2. Medidas do tipo desvio ................................................................................... 34
4. PROBABILIDADE ......................................................................................................... 38
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

4.1. Experimento aleatório ............................................................................................ 38


4.2. Espaço amostral .................................................................................................... 38
4.3. Evento ................................................................................................................... 38
4.3.1. Evento simples ............................................................................................... 39
4.3.2. Evento composto ............................................................................................ 39
4.3.3. Evento certo e evento impossível ................................................................... 39
4.4. Definição de probabilidade .................................................................................... 39
4.5. Esperança matemática .......................................................................................... 39
REFERÊNCIAS ................................................................................................................... 41

3
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

INTRODUÇÃO
Todos nós já ouvimos, em nosso dia a dia, alguém se referir à palavra estatística. Mas,
afinal, o que é estatística? O termo “estatística” originou-se do vocábulo latino Status.
Inicialmente essa palavra foi utilizada para definir a coleta e apresentação de dados
quantitativos de interesse do Estado, para fins militares e tributários, no intuito de obter
informações sobre suas populações, riquezas, etc. Posteriormente, o termo passou a ser
empregado para se referir à coleta, apresentação e análise dos dados quantitativos de modo
que fosse possível efetuar julgamentos racionais sobre os mesmos. Nesse sentido, ela é
frequentemente usada no plural; assim referimo-nos às estatísticas de natalidade,
mortalidade, de trânsito, etc. Embora este seja o conceito usual de estatística, na realidade
essas aplicações são consideradas de rotina e de importância secundária.
De acordo com a Revista do Instituto Internacional de Estatística, cinco homens (Hermann
Conring, Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William Petty) já
receberam a honra de serem chamados de fundadores da estatística, por diferentes autores.
Alguns autores dizem que é comum encontrar como marco inicial da estatística a publicação
do "Observations on the Bills of Mortality" (Observações sobre os Sensos de Mortalidade,
1662) de John Graunt.
Seus fundamentos matemáticos foram postos no século XVII com o desenvolvimento da
teoria das probabilidades por Pascal e Fermat, que surgiu com o estudo dos jogos de azar.
O método dos mínimos quadrados foi descrito pela primeira vez por Carl Friedrich Gauss
por volta do ano de 1794. O uso de computadores modernos tem permitido a computação
de dados estatísticos em larga escala e também tornaram possível novos métodos antes
impraticáveis.
A estatística, como parte da matemática aplicada, trata da coleta, da análise e da
interpretação de dados observados. Estudando os mais variados fenômenos das diversas
áreas do conhecimento, ela representa um valioso instrumento de trabalho.
Hoje, a importância da estatística cresce a partir do fato que ciências como a Física,
Química, Engenharia, Medicina, Economia, Biologia, Ciências Agronômicas, Ciências
Administrativas, Ciências Sociais e outras a utilizam como ferramenta. Quando aplicada às
ciências biomédicas recebe o nome de bioestatística, quando aplicada à psicologia recebe o
nome de psicometria, quando aplicada à economia recebe o nome de econometria, quando
aplicada a fenômenos biológicos recebe o nome de biometria.
Assim, justifica-se o estudo da estatística por estudantes de qualquer curso e por
profissionais cujas atividades envolvam dados quantitativos. Até mesmo os leigos são
permanentemente envolvidos com estatísticas. Vejamos como estas três categorias estão,
cotidianamente, envolvidas pela estatística:
a) Os estudantes necessitam da estatística, pois só assim eles saberão, dentro da
técnica, coletar, organizar, resumir e interpretar as anotações efetuadas em um
ensaio planejado, bem como para melhor entenderem os trabalhos científicos que
lhes são pertinentes;
b) Os profissionais, através de amostras, são alertados no controle de qualidade de
uma determinada indústria, sondam a opinião publica para averiguar a preferência
por um produto, etc.;
c) Os leigos são constantemente atingidos por rádios, televisões, jornais com dados do
tipo: custo de vida aumentou 5% no mês passado, certa emissora de rádio tem um
índice de 40,2% de audiência no horário de 8 às 10h, etc.
Portanto, a estatística é uma ciência que está presente no cotidiano da sociedade humana.

4
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

1. CONCEITOS BÁSICOS

1.1. Estatística
É um ramo da matemática que se interessa em obter conclusões a partir de dados
observados e nos métodos científicos para coleta, organização, resumo, apresentação,
análise e interpretação dos dados amostrais. Em outras palavras, a Estatística compreende
o planejamento e a execução de pesquisas, a descrição e análise dos resultados e a
formulação de predições com base nesses resultados. O método estatístico é um processo
utilizado para obter, apresentar e analisar características ou valores numéricos para uma
melhor tomada de decisões em situações de incerteza. A Estatística se divide em:
a) Estatística descritiva – parte da Estatística que procura somente descrever e
analisar certo grupo, sem tirar quaisquer conclusões de caráter mais genérico
sobre um grupo maior. A estatística descritiva procura sintetizar ou resumir um
conjunto de dados, chegando, no geral, a expressar esse conjunto por um único
elemento, como, por exemplo, a média. Tem por objetivo a coleta, organização,
apresentação dos dados amostrais, ou seja, descreve os aspectos importantes
de um conjunto de características observadas.
b) Inferência estatística – se uma amostra é representativa de uma população,
conclusões importantes sobre a população podem ser inferidas de sua análise. A
parte da Estatística que trata das condições de validade dessas inferências
chama-se inferência estatística ou estatística indutiva.

1.2. Método Científico


Método científico é um conjunto de meios dispostos convenientemente para se chegar a um
fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o
método estatístico.

1.2.1. Método Experimental


Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa
de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método
preferido no estudo da Física, da Química e ciências afins.

1.2.2. Método Estatístico


Muitas vezes temos a necessidade de descobrir fatos em um campo em que o método
experimental não se aplica (nas ciências sociais, por exemplo), já que os vários fatores que
afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar
a causa que, naquele momento, nos interessa. Nesses casos, lançamos mão do método
estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes, admite
todas essas causas presentes variando-as, registrando essas variações e procurando
determinar, no resultado final, que influências cabem a cada uma delas.

1.2.2.1. Fases do método estatístico


Podemos distinguir, no método estatístico, as seguintes fases:
a) Planejamento: consiste em determinar quais são os dados a serem levantados e
como estes serão levantados, fazendo uma análise de materiais e custos
necessários durante a pesquisa;
b) Coleta de dados: após cuidadoso planejamento, damos início à coleta de dados. A
coleta pode ser direta e indireta;

5
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

A coleta é direta quando os dados são coletados diretamente na fonte. A coleta


direta de dados pode ser classificada relativamente ao fator tempo em;
i. contínua (registro) – quando feita continuamente, tal como a de nascimentos
e óbitos e a de frequência dos alunos às aulas;
ii. periódica - quando feita em intervalos constantes de tempo, como os censos
(de 10 em 10 anos) e as avaliações mensais dos alunos;
iii. ocasional – quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergência, como no caso de epidemias que assolam
ou dizimam rebanhos inteiros.
A coleta pode ser indireta quando os dados são levantados em órgãos que já tenham
efetuado a pesquisa de campo. Como exemplo, podemos citar a pesquisa sobre a
mortalidade infantil, que é feita através de dados colhidos por uma coleta direta;
c) Crítica dos dados: obtidos os dados, eles devem ser cuidadosamente criticados, à
procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros
grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A
crítica dos dados pode ser realizada externamente (por algum informante) ou
internamente (pelo pesquisador);
d) Apuração dos dados: é a soma e o processamento dos dados obtidos e a disposição
mediante critérios de classificação. A apuração pode ser manual, eletromecânica ou
eletrônica;
e) Exposição ou apresentação dos dados: Por mais diversa que seja a finalidade que
se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas
ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de
tratamento estatístico;
f) Análise dos resultados: é o objetivo último da Estatística que consiste em tirar
conclusões sobre o todo (população) a partir de informações fornecidas por parte
representativa do todo (amostra). Assim, fazemos uma análise dos resultados
obtidos e tiramos desses resultados conclusões e previsões.
1.3. População
Consiste na totalidade de uma unidade de observação (usualmente pessoas, objetos ou
eventos) a partir dos quais se deseja tomar uma decisão. As características de uma
população são comumente chamadas de parâmetros, os quais são valores fixos e
geralmente desconhecidos. A população pode ser finita ou infinita.
a) População finita – é aquela em que o número de unidades de observação pode ser
contado e é limitado.
 Exemplos de população finita
 alunos matriculados em Estatística Aplicada;
 todas as famílias beneficiadas pelo programa de reforma agrária no Brasil;
 todas as declarações do Imposto de Renda recebidas pela Receita Federal.
b) População infinita – quando na quantidade de informações é ilimitada, ou sua
composição é tal que as unidades da população não podem ser contadas.
 Exemplos de população infinita
 conjunto de medidas de determinado comprimento, porque não há limite para o
número de vezes em que se pode medir esse comprimento;
 gases, líquidos e alguns sólidos, como o talco, porque as unidades não podem ser
identificadas e contadas.

6
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

1.4. Amostra e amostragem


A amostra é uma parte selecionada da totalidade de observações abrangidas pela
população, através da qual se faz um juízo ou inferência. O estudo estatístico inicia-se com
a coleta de parte de uma população denominada amostra, constituída de n unidades de
observações e que deve ter as mesmas características da população. Essa coleta recebe o
nome de amostragem. Entre os vários tipos de amostragem, destacamos três:
a) Amostragem Aleatória Simples (AAS) – processo de retirada de uma amostra de
uma população no qual cada unidade tem a mesma chance (ou oportunidade) de ser
retirada.
 Exemplo de uma amostragem aleatória simples
Deseja-se uma amostra de tamanho 30 de uma população de tamanho 900; numeram-se as
unidades de observação da população de 001 a 900. Para obtenção da amostra consulte a
tabela de números aleatórios (Quadro 1), adote uma regra de leitura, por exemplo, inicie de
cima para baixo, a partir da primeira coluna, considerando apenas os três primeiros dígitos.
Assim sendo, a primeira unidade sorteada será a 244a, a segunda a 873a, e assim
sucessivamente. A amostra ficará dessa maneira:
244 873 807 824 605 028 646 236 058 691 839 306 185 964 113
422 274 288 130 568 709 427 139 318 306 449 843 168 435 946

Quadro 1 – Números aleatórios

Fonte: Bezerra, 2006


b) Amostragem Sistemática (AS) – quando a retirada das unidades de observação é
feita periodicamente, sendo o intervalo de seleção calculado, para uma população
finita, por meio da divisão do tamanho da população (N) pelo tamanho da amostra (n)
a ser selecionada.

7
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Exemplo de uma amostragem sistemática


Deseja-se retirar uma amostra de 5 alunos de uma turma de 50, utilizando a técnica de
amostragem sistemática. O intervalo de seleção é, então, 50/5 = 10. Sorteia-se o primeiro
elemento da amostra, sendo que este deverá estar entre 1 e 5, pois o limite máximo do
primeiro elemento da amostra é o próprio intervalo de seleção calculado. Vamos escolher,
por exemplo, o 3. Como o intervalo de seleção igual a 10 obtém-se os demais elementos
que serão amostrados. A amostra será:
AS = {3, 13, 23, 33, 43}
c) Amostragem Estratificada Proporcional (AEP) - A população é dividida em
subgrupos, denominados estratos (por exemplo, por sexo, classe de renda, bairro
etc.) e a AAS ou AS é utilizada na seleção de uma amostra de cada estrato. Esses
estratos devem ser internamente mais homogêneos do que a população toda, com
respeito às variáveis em estudo. Aqui, um conhecimento prévio sobre a população
em estudo é fundamental.
A AEP tem as seguintes características:
 dentro de cada estrato há uma grande homogeneidade (pequena variabilidade);
 entre os estratos há uma grande heterogeneidade (grande variabilidade).
É comum os estratos terem tamanhos diferentes. Nesses casos, a proporcionalidade do
tamanho da amostra de cada estrato da população deve ser mantida na amostra. Por
exemplo, se um estrato corresponde a 20% do tamanho da população, ele também deve
corresponder a 20% da amostra.
 Exemplo de uma amostragem estratificada proporcional
Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria em uma
determinada universidade, realizaremos um levantamento por amostragem. A população é
composta por 70 professores, 80 servidores técnicos administrativos e 800 alunos. Supondo
que a opinião sobre a gestão atual da reitoria possa ser relativamente homogênea dentro de
cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para
obter uma amostra global de tamanho n = 15. A Tabela 1 mostra as relações de
proporcionalidade.

Tabela 1 – Relações de proporcionalidade da amostra da universidade analisada

Estrato Proporção na população Tamanho do subgrupo na amostra

Professores 70/950 (0,074 ou 7,4%) np = 15 x 0,074 ≈ 1

Servidores 80/950 (0,084 ou 8,4%) ns = 15 x 0,084 ≈ 1

Alunos 800/950 (0,842 ou 84,2%) na = 15 x 0,842 ≈ 13

Assim, a amostra pretendida deverá incluir um professor, um servidor e 13 alunos,


escolhidos aleatoriamente na população universitária para realização da pesquisa de
opinião sobre a gestão atual da reitoria.
1.5. Parâmetro, Estimador e Estimativa
No estudo de determinada população, geralmente estamos interessados em obter, para
certas variáveis, os valores de parâmetros como: media (µ) e variância (σ2). Parâmetros
são características da população, as quais possuem valores fixos e ordinariamente
desconhecidos. Como, normalmente, os valores desses parâmetros não são conhecidos,
obtemos as respectivas estimativas, a partir dos valores observados em uma amostra.
8
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

É importante distinguir a média da amostra ( x ) da média da população ou média verdadeira


(µ). A média da amostra é um estimador da média populacional. Em geral, o estimador de
um parâmetro da população é uma função dos valores observados em uma amostra dessa
população. Chama-se de estimativa ao valor do estimador obtido com base em
determinada amostra. Estimativa é, pois, um particular valor assumido pelo estimador.

1.6. Censo
É o tipo de estudo estatístico que abrange todas as unidades de observação de uma
população.
Exemplo de censo: censo demográfico realizado pelo IBGE, a cada dez anos, no qual são
consultados todos os lares brasileiros.
1.7. Visão sistêmica da estatística
A Estatística pode ser entendida como sendo constituída por três áreas: a estatística
descritiva, o cálculo das probabilidades e a inferência estatística. A figura abaixo apresenta
uma visão sistêmica da Estatística.

Figura 1 – Visão sistêmica da Estatística. Fonte: Lopes (2000)

2. TIPOS DE VARIÁVEIS
Na estatística variável é uma atribuição de um número a cada característica da unidade de
observação. As variáveis classificam-se em:

2.1. Qualitativas
Considera-se uma variável como qualitativa quando as modalidades que a compõem
formam um conjunto amorfo, não estruturado numericamente, ou seja, quando não há
ligação entre essas modalidades, independentemente do fato de constituírem um conjunto
completo. Assim, essas variáveis resultam de uma classificação por tipos ou atributos. Elas
podem ser:
a) Nominal: os valores são classificados em categorias ou classes não ordenadas, ou
seja, não existe nenhuma ordenação das possíveis realizações.
 Exemplos de variável qualitativa nominal
 Sexo (1-Macho e 0-Fêmea);
 Tipo sanguíneo (1-tipo O, 2-tipo A, 3-tipo B, 4-tipo AB);

9
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Região de nascimento dos alunos de certo curso, em uma determinada


Faculdade (1=Nordeste, 2=Norte, 3=Sul, 4=Sudeste, 5=Centro-oeste).

b) Ordinal: quando a ordem entre as categorias se torna importante.


 Exemplos de variável qualitativa ordinal
 Nível de severidade de uma lesão: 1=fatal, 2=severa, 3=moderada, 4=pequena;
 Nível de instrução: 1=analfabeto 2=educação infantil 3=ensino fundamental,
4=ensino médio, 4=educação superior.

2.2. Quantitativas
Considera-se uma variável como quantitativa quando os dados são de caráter nitidamente
quantitativo e o conjunto dos resultados possui uma estrutura numérica. Essas variáveis são
classificadas em duas categorias:
a) Discretas: os valores formam um conjunto finito ou enumerável de números inteiros
positivos (0, 1, 2, 3,...), ou seja, podem assumir apenas determinados valores e
resultam de uma contagem.
 Exemplos de variável quantitativa discreta
 Quantidade de alunos matriculados em Estatística Aplicada;
 Número de casos de raiva registrados em fortaleza nos últimos 5 anos;
 Número de leitos disponíveis nos hospitais públicos de Fortaleza.
b) Contínuas: podem assumir qualquer valor dentro de uma determinada faixa de
valores e resultam de uma medição.
 Exemplos de variável quantitativa contínua
 Estatura e peso;
 Concentração de um poluente;
 Nível sérico de colesterol de um paciente;
 Temperatura.

3. APRESENTAÇÃO DE DADOS
Coletados os dados, é conveniente organizá-los de maneira prática e racional, para o
melhor entendimento do fenômeno que estamos estudando. Jamais deveremos apresentar
os dados para análise sob a forma que se chegou, após a simples apuração, pois, na
maioria das vezes, o conjunto de valores é extenso e desorganizado requerendo grande
atenção para ser entendido.
Denominamos de Série Estatística a organização dos dados. Portanto, uma série
estatística pode ser definida como toda e qualquer coleção de dados estatísticos referentes
a uma mesma ordem de classificação quantitativa.
Sua apresentação pode ocorrer por meio de tabelas, gráficos e distribuições de freqüências.

3.1. Tabelas
A tabela é uma apresentação numérica dos dados e consiste em dispô-los em linhas e
colunas de forma ordenada, de acordo com as regras estabelecidas pelos diversos sistemas
estatísticos. Os componentes fundamentais de uma tabela são o título, o corpo e o rodapé.
O título deve conter informações suficientes para que sejam respondidas as seguintes
questões:

10
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 O que? → Referente ao fato. Fato é o fenômeno que foi investigado e cujos valores
numéricos estão sendo apresentados;
 Onde? → Referente ao espaço geográfico. Espaço geográfico é o local ou região
onde o fato ocorreu;
 Quando? → Correspondente à época. Época refere-se à data ou ao tempo em que o
assunto foi investigado.
O que diferencia uma série estatística de outra são exatamente estas três características,
constantes do título: fato, local e época, como veremos adiante.

3.1.1. Componentes fundamentais de uma tabela


Seja a seguinte tabela:

Tabela 1 - População residente nas regiões do Brasil em 2007 TÍTULO

Zona Designativa Regiões População Residente


Norte 14.623.316
Nordeste 51.534.406
Sudeste 77.873.120 CORPO
Sul 26.733.595
Centro-Oeste 13.222.854
RODAPÉ Fonte: IBGE, 2007
Enumerativa
Coluna
Indicadora
Coluna

a) Título: é a parte superior da tabela, na qual se indicam a natureza do fato estudado,


o local e a época em que foi observado (O que? Onde? Quando?)
b) Corpo: é a parte da tabela composta de linhas e colunas que contem informações
sobre a variável em estudo. No corpo encontramos as zonas designativa, indicativa e
enumerativa.
 Zona Designativa: esta colocada logo abaixo do título e compreende o chamado
cabeçalho. Nesta zona são colocados os diversos informes referentes ao
conteúdo de cada coluna.
 Zona Indicativa ou Indicadora: situa-se ao lado esquerdo, servindo para a
colocação vertical de valores ou nomes que especificam o conteúdo da linha.
 Zona Enumerativa: são as expressões numéricas do fato estudado, compondo-se
de linhas, colunas e células ou casas.
 Linha: é uma serie horizontal de informações;
 Coluna: é uma serie vertical de informações;
 Célula ou casa: é a interseção de uma linha com uma coluna.
c) Rodapé: é o espaço após o fecho da tabela onde são colocadas as notas de
natureza informativa (Fonte, Notas e Chamadas).

11
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Fonte: refere-se a entidade que coletou, organizou e/ou forneceu os dados


expostos
 Notas e chamadas: são as informações, em língua concisa, colocadas no rodapé
da tabela, após a indicação da fonte, quando a matéria contida na tabela exige
esclarecimentos. A nota é usada para conceituação ou esclarecimento geral e a
chamada para esclarecer certas minúcias em relação a casos, linhas e colunas.
Quando houver mais de uma nota, elas devem ser enumeradas em algarismos
romanos e as chamadas em algarismos arábicos elevados e entre parênteses.
Entre os textos das notas e, também, entre os textos das chamadas, devemos
colocar ponto e traço, com exceção da última nota e da última chamada, que são
seguidas de ponto final.

3.1.2. Generalidades sobre as tabelas


a) Os dados devem ser organizados segundo a ordem cronológica, geográfica,
alfabética ou de acordo com a magnitude;
b) Cada tabela deve ter significação própria de modo a prescindir, quando isolada, de
consulta a textos;
c) As unidades devem ser expressas claramente, usando-se as convenções
apropriadas;
d) Nenhuma casa deve ficar em branco, apresentando sempre um número ou sinal
conveniente, tais como:
 Traço (-): quando o dado não existir;
 Três pontos (...): quando não se dispuser da informação, muito embora ela possa
ser quantificada;
 Zero (0): quando o valor numérico é muito pequeno para ser expresso na unidade
adequada;
 Interrogação (?): quando se tem dúvida quanto a exatidão de determinado valor.
e) Devem ser evitadas as tabelas nas quais a maior parte das casas inexiste o
fenômeno;
f) Nenhuma tabela será disposta de modo que a leitura exija a colocação da publicação
fora de sua posição normal;
g) As tabelas serão fechadas no alto e embaixo, por linhas horizontais, nunca nas
laterais. Deve ser observado ainda o seguinte:
 Quando a tabela tiver, no sentido vertical, continuação na página seguinte, não
terá a linha escura inferior e sim a palavra “continua”, sendo que o cabeçalho
será repetido na pagina seguinte com o titulo e a palavra “continuação”;
 As tabelas não serão fechadas, à direita e à esquerda, por linhas verticais.
h) As colunas muito extensas devem ter, de cinco em cinco ou de dez em dez linhas,
um intervalo em branco;
i) Quando em uma tabela mais de uma coluna for apresentada sob uma mesma
especificação, separar-se-á esse conjunto por uma linha mais grossa;
j) Os conjuntos tabulares devem ser precedidos de uma indicação dos sinais
empregados e, no final, a relação completa da fonte e dos respectivos endereços.

12
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.2. Séries Estatísticas


A série estatística pode ser definida como o conjunto de números associados a um
fenômeno expresso em quantidades absolutas ou relativas, dispostos em correspondência
com um ou mais de um critério de classificação.
Conforme o critério de agrupamento, as séries classificam-se em homógradas (aplicadas no
caso em que a variável de classificação é discreta – series geográfica, temporal e
específica) e heterógradas, para variáveis de classificação contínuas (mais comumente
denominadas de distribuição de frequências.

3.2.1. Série Cronológica, Temporal, Evolutiva, Histórica ou em Marcha de


Andamento
É a série estatística em que os dados são observados, segundo a época de ocorrência. A
variável é a época, permanecendo fixos o lugar e o fato. Exemplo:

Tabela 3 – População do Brasil registrada nos censos demográficos: 1940 – 2000


Ano População em milhões
1940 41
1950 52
1960 70
1970 93
1980 119
1991 156
2000 170
Fonte: IBGE, Censo Demográfico 1940/2000

3.2.2. Série Geográfica, Territorial ou de localização


É a serie em que os dados são observados segundo a localidade de ocorrência. A variável é
o lugar, permanecendo fixos o tempo e o fato. Exemplo:

Tabela 4 – População dos países mais populosos do mundo em 2011


País População em milhões
China 1348
Índia 1241
Estados Unidos 313
Indonésia 242
Brasil 197
Fonte: IBGE, Países 2012

3.2.3. Série Específica, Qualitativa ou Categórica


É a série estatística em que os dados são agrupados segundo a modalidade de ocorrência.
A variável é o fato, permanecendo fixos o lugar e a época. Exemplo:

13
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Tabela 5 – Aspectos do meio ambiente no Brasil em 2009


Aspecto Valor
Áreas cultivadas (% da área total) 8,10
Áreas de pastagens permanentes (% da área total) 23,17
Produção de gás natural (bilhões de m3) 28,92
Produção de petróleo (mil barris/dia) 2.029,04
Fonte: IBGE, Países 2012

3.2.4. Conjugação de Séries Estatísticas


Em sua maior parte as séries estatísticas são apresentadas conjugadas, isto é, são
apresentadas em uma única tabela a variação de mais de uma variável (duas ou mais),
como no exemplo a seguir:

Tabela 6 – Participação das grandes Regiões do Brasil no Produto Interno Bruto no período
de 2005 a 2009
Grandes Participação do Produto Interno Bruto (%)
Regiões
2005 2006 2007 2008 2009
Norte 5,0 5,1 5,0 5,1 5,0
Nordeste 13,1 13,1 13,1 13,1 13,5
Sudeste 56,5 56,8 56,4 56,0 55,3
Sul 16,6 16,3 16,6 16,6 16,5
Centro-Oeste 8,9 8,7 8,9 9,2 9,6
Fonte: IBGE, em parceria com os Órgãos Estaduais de Estatística, Secretarias Estaduais de Governo
e Superintendência da Zona Franca de Manaus – SUFRAMA, 2012
Observamos que cada uma das colunas que contem os anos forma uma série geográfica
por Grande Região do Brasil. Do mesmo modo, temos séries históricas ao considerarmos,
isoladamente, cada uma das linhas da Tabela 6. Este tipo de tabela recebe a denominação
de tabela de dupla entrada.

3.3. Gráficos
A representação gráfica da distribuição de uma variável tem a vantagem de rápida e
conscientemente, informar sobre a sua variabilidade. Gráficos facilitam a visualização dos
valores e são amplamente utilizados na apresentação de dados estatísticos.
Na elaboração de gráficos, por motivos estéticos, deve-se levar em conta os seguintes
aspectos:
a) O gráfico, em seu conjunto, deve enquadrar-se em um retângulo de dimensões que
o torne agradável à vista;
b) As figuras não devem ser nem muito largas, nem muito estreitas, devendo obedecer
a um sentido estético;
c) O gráfico, por seu objetivo de simplificar, deve conter somente algumas divisões de
escala vertical; as linhas horizontais devem ser poucas, de modo a torná-lo
agradável à sua leitura e interpretação;
São elementos complementares de um gráfico:

14
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Título geral, indicativo da situação estudada, a época e o local;


 As escalas e as respectivas unidades de medida;
 A indicação das convenções adotadas (geralmente quando se representam os
resultados das observações de uma mesma situação em duas ou mais regiões
diversas);
 A fonte de informação de onde foram retirados os valores.
Observação! Quando observar um gráfico ou uma tabela, particularmente como parte de
um anúncio, seja cauteloso; observe as escalas usadas nos eixos horizontal e vertical.
Pode-se distorcer a verdade com as técnicas estatísticas.

3.3.1. Gráficos para Variáveis Qualitativas

3.3.1.1. Gráfico de barras


As categorias são organizadas verticalmente, enquanto os valores têm disposição
horizontal, para enfatizar a comparação de valores e dar menos ênfase ao tempo. Exemplo:

Gráfico 1 – População Economicamente Ativa (1000 pessoas) por grupo de idade observado
no Brasil no mês de julho de 2011

50 anos ou mais
Grupos de Idade

25 a 49 anos

18 a 24 anos

15 a 17 anos

10 a 14 anos

0 5000 10000 15000 20000


População Economicamente Ativa (1000 pessoas)
Fonte: IBGE – Pesquisa Mensal de Emprego

3.3.1.2. Gráfico de Barras Agrupadas


No gráfico abaixo os valores de cada categoria (mulheres, homens) foram agrupados em
duas classes, correspondentes aos nascidos vivos registrados no Brasil.
Gráfico 2 – Nascidos vivos registrados no Brasil segundo o sexo no quinquênio 2006 - 2010

2010

2009
Mulheres
Anos

2008
Homens
2007

2006

1.300.000 1.400.000 1.500.000 1.600.000 1.700.000


Nascidos vivos
Fonte: IBGE – Estatísticas do Registro Civil

15
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.3.1.3. Gráfico de Colunas


Ilustra comparações entre categorias, as quais são organizadas de maneira horizontal e os
valores de maneira vertical para enfatizar a variação ao longo do tempo. Exemplo:

Gráfico 3 - Densidade demográfica segundo as Grandes Regiões do Brasil no ano 2000

90
80
Densidade demográfica

70
60
(hab./km²)

50
40
30
20
10
0
Norte Nordeste Sudeste Sul Centro-Oeste
Grandes Regiões do Brasil

Fonte: IBGE, Censo Demográfico (2000)

3.3.1.4. Gráfico em Colunas Remontadas


Para cada coluna utiliza-se uma legenda correspondente à especificação representada pela
coluna. No gráfico abaixo, estabelece-se para cada mês do segundo semestre de 2011 o
rendimento médio mensal segundo a ocupação dos trabalhadores da cidade de São Paulo.

Gráfico 4 - Rendimento médio nominal, segundo a ocupação, habitualmente recebido no


trabalho principal (Reais) no segundo semestre do ano 2011 na cidade de São Paulo

2.500,00 das Pessoas Ocupadas


Rendimento Médio (R$)

2.000,00
dos Trabalhadores por Conta
Própria
1.500,00
dos Empregados no Setor
Privado - com Carteira de
1.000,00 Trabalho assinada
dos Empregados no Setor
Privado - sem Carteira de
500,00
Trabalho assinada
dos Empregados no Setor
0,00 Público
jul/11 ago/11 set/11 out/11 nov/11 dez/11
Meses

Fonte: IBGE – Pesquisa Mensal de Emprego

16
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.3.1.5. Gráfico em colunas superpostas


Cada coluna é segmentada em partes componentes, sendo possível comparar visualmente
a importância de cada uma delas. Exemplo:

Gráfico 5 - Domicílios particulares permanentes no Brasil, por situação do domicílio


70.000.000

60.000.000
Domicílios Particulares

50.000.000

40.000.000
Zona Rural
30.000.000
Zona Urbana
20.000.000

10.000.000

0
1970 1980 1991 1996 2000 2010
Censos
Fonte: IBGE, 1996 - Contagem de População, 1970 (Amostra), 1980 (Amostra), 1991 (Amostra), 2000
(Universo) e 2010 (Universo) - Censo Demográfico

3.3.1.6. Gráfico de setores


Consiste num círculo de raio arbitrário, representando o todo, dividido em setores, que
correspondem às partes de maneira proporcional. Exemplo:

Gráfico 6 - Pessoas de 10 anos ou mais de idade, residentes no Brasil, por estado civil

Casado(a)

Desquitado(a) ou
37,03 separado(a) judicialmente
Divorciado(a)
54,78
Viúvo(a)

Solteiro(a)
1,94

4,55 1,69

Fonte: IBGE - Censo Demográfico, 2000

17
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.3.2. Gráficos para Variáveis Quantitativas

3.3.2.1. Histograma
É usado para ilustrar o comportamento de valores agrupados em classes, ou seja, é o
gráfico de barras da freqüência de uma variável. Esse gráfico, bem como a Poligonal
Característica, o Polígono de Frequências, as Ogivas de Galton e Composto serão
detalhados posteriormente. Exemplo:

Gráfico 7 - Histograma de frequências simples da escolaridade mulheres entre 25-55


anos, residentes
400 da região metropolitana de Porto Alegre/RS no ano de 2002
350
300
Freqüência

250
200
150
100
50
0
0a3 4a7 8 a 10 10 a 11 Mais de 11

Anos de Estudo

Fonte: IBGE - PNAD, 2002

3.3.2.2. Diagrama de dispersão


São aqueles em que os dados são representados por um ponto no cruzamento do sistema
de coordenadas cartesianas (ordenada e abscissa, normalmente intituladas como eixos X e
Y, respectivamente). Também conhecido por diagrama de pontos, é muito indicado para
análises estatísticas em estudos de correlação entre duas variáveis. Exemplo:

Figura 1 – Diagramas de dispersão que mostram a correlação positiva entre as variáveis

3.3.2.3. Gráfico sequencial ou em linha


Quando uma das variáveis é o tempo, este é colocado no eixo horizontal, e o diagrama de
dispersão denomina-se gráfico sequencial ou em linha. Exemplo:

18
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Gráfico 8 – Evolução do rebanho bovino no Brasil entre os anos de 1970 a 2006


200.000.000
180.000.000
160.000.000
140.000.000
120.000.000
Efetivo

100.000.000
80.000.000
60.000.000
40.000.000
20.000.000
0
1970 1975 1980 1985 1995 2006
Anos
Fonte: IBGE – Censo Agropecuário

3.3.1. Distribuição de Frequências


É a série estatística em que os dados são agrupados com suas respectivas frequências. A
época, o lugar e o fato permanecem fixos, mas o fato é apresentado através de gradações
em que é capaz de subdividir-se.

3.3.1.1. Classificação das distribuições de frequências


Dependendo se as variáveis são discretas ou contínuas, as distribuições de frequências são
classificadas em distribuições de frequências sem intervalos de classes e com intervalos de
classes.
Quando as variáveis forem discretas é possível construir uma tabela de freqüência onde os
valores da variável aparecerão individualmente. Estas Distribuições são denominadas,
também de distribuições com intervalo degenerado e nelas não há perda de informação.
Já quando a variável for contínua, será sempre conveniente agrupar os valores observados
em classes. Com o agrupamento dos valores da variável em classes, se ganha em
simplicidade, porém, perdem-se pormenores. No entanto, isto não é preocupante, pois na
realidade o que se busca é realçar o essencial do conjunto de dados, sem interessar os
casos isolados.

3.3.1.2. Dados Brutos


São aqueles que ainda não foram numericamente organizados. São os dados originais, da
forma como foram coletados.
Exemplo ilustrativo 1: uma amostra de 50 estudantes do sexo masculino, com 22 anos de
idade, de certa universidade cearense, cujos pesos, em kg, foram:
Tabela 7 – Dada brutos correspondentes ao peso de 50 estudantes do sexo masculino de
certa universidade cearense
93 89 90 88 90 90 90 91 92 89
80 74 76 63 77 75 78 79 80 69
117 102 105 101 106 104 107 110 112 102
88 83 84 81 85 83 86 87 87 82
100 94 96 93 97 95 98 98 99 94

19
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.3.1.3. Rol
É o arranjo dos dados numéricos brutos em ordem crescente ou decrescente de grandeza.
Para o nosso exemplo ilustrativo da variável quantitativa contínua peso de 50 estudantes do
sexo masculino de certa universidade cearense, o rol está exposto na Tabela 8.
Tabela 8 – Dada brutos correspondentes ao peso de 50 estudantes do sexo masculino de
certa universidade cearense organizados em rol
63 69 74 75 76 77 78 79 80 80
81 82 83 83 84 85 86 87 87 88
88 89 89 90 90 90 90 91 92 93
93 94 94 95 96 97 98 98 99 100
101 102 102 104 105 106 107 110 112 117

3.3.1.4. Distribuição de frequência


É uma tabela resumida na qual os dados são organizados em grupos de classe ou
categorias convenientemente estabelecidas e numericamente ordenadas. Ao construir uma
tabela de distribuição de freqüência, deve-se atentar para:
a) A seleção do número apropriado de classes para a tabela;
b) A obtenção de um intervalo de classe e amplitude apropriadas para cada grupo de
classe;
c) O estabelecimento de limites para cada classe a fim de evitar uma sobreposição.

 Regras gerais para elaborar uma distribuição de frequência


 1º Passo: Definição do número de classes (k)
O numero de classes (k) a ser utilizado depende, principalmente, do número de
observações nos dados. Em geral, a distribuição de frequência deve conter, pelo menos,
cinco (5) classes, porém não mais do que quinze (15). Como esse caráter empírico pode
variar consideravelmente entre os pesquisadores, sugere-se um dos critérios propostos a
seguir:

Critérios Número de classes (k)

i. Modo Prático k = 5 para n ≤ 25 e k = √n para n > 25

ii. Fórmula de Sturges k = 1 + 3,22log n

iii. Fórmula de Yule k = 2,5.4√n

 2º Passo: Calcular a amplitude total do rol (AT)


Amplitude Total ou “Range” é a diferença entre o maior e menor valor de um conjunto de
dados (AT = Vmax – Vmin);
 3º Passo: definição da amplitude da classe ou intervalo de classe (h)
A Amplitude da classe é o comprimento da classe, a qual é dada por h = AT/k. Quando for
necessária aproximação, a amplitude da classe é aproximada para o maior inteiro. Sempre
devemos utilizar h constante para todas as classes, com o objetivo de facilitar os cálculos
posteriores;

20
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 4º Passo: formação dos intervalos de classes;


 5º Passo: construção da tabela de frequências. Calcular as freqüências de cada
classe mediante uma tabulação ou regra de apuração
Agora, iremos construir uma distribuição de frequências para o nosso exemplo ilustrativo1:
1) Dada brutos correspondentes ao peso de 50 estudantes do sexo masculino de certa
universidade cearense organizados em rol
63 69 74 75 76 77 78 79 80 80
81 82 83 83 84 85 86 87 87 88
88 89 89 90 90 90 90 91 92 93
93 94 94 95 96 97 98 98 99 100
101 102 102 104 105 106 107 110 112 117
a) Determinação do no de classes: k = √n ; n = tamanho da amostra
k = √n → k = √50 = 7,07 ≈ 7 classes
b) Determinação da amplitude total do rol: AT = Vmax – Vmin
AT = 117 – 63 = 54
c) Determinação da amplitude de cada classe:
h = AT/k = 54/7 = 7,7 ≈ 8
d) Formação dos intervalos de classes
Tabela 9 – Distribuição de frequência para o exemplo ilustrativo 1
Frequência
Ponto Frequência Frequência
No da Frequência Acumulada
Classes Médio da Absoluta Acumulada
Classe Relativa (fri) Relativa
Classe (Xi) Simples (fi) (fai)
(frai)
1 63├ 71 67 2 2 0,04 0,04
2 71├79 75 5 7 0,1 0,14
3 79├87 83 10 17 0,2 0,34
4 87├95 91 16 33 0,32 0,66
5 95├103 99 10 43 0,2 0,86
6 103├111 107 5 48 0,1 0,96
7 111├119 115 2 50 0,04 1

d.1. Formação das Classes


Inicialmente, retira-se o menor valor do rol (63 – que será o limite inferior da primeira classe)
e acrescenta-se a amplitude da classe (calculada no item “d”→h = 8) tendo como resultado
o limite superior da primeira classe que será 71. Repete-se esse valor (71) na segunda
classe (que será o limite inferior da mesma) somando-se, novamente, a amplitude (h = 8)
tendo como resultado o limite superior da segunda classe que será 79 e, assim,
sucessivamente.
Atenção: o símbolo ├ indica que o limite inferior está incluso no intervalo daquela
determinada classe e o limite superior não!!!
d.2. Obtenção do ponto médio das classes
Classe 1: (63 + 71)/2 = 67
Classe 2: (71 + 79)/2 = 75

21
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Classe 3: (79 + 87)/2 = 83


Classe 4: (87 + 95)/2 = 91
Classe 5: (95 + 103)/2 = 99
Classe 6: (103 + 111)/2 = 107
Classe 7: (111 + 119)/2 = 115
d.3. Frequência absoluta simples
Referem-se ao número de elementos da amostra incluídos no intervalo de classe
correspondente.
d.4. Frequência acumulada
Freq. Acumulada da classe 1 (fa1) = freq. simples da classe (1) = f1
Freq. Acumulada da classe 2 (fa2) = freq. simples (1) + freq. Simples (2) = f1+f2
Freq. Acumulada da classe 3 (fa3) = freq. acumulada (2) + freq. Simples (3) = f1+f2+f3
...
Freq. Acumulada da classe “k” (fak) = freq. acumulada (k-1) + freq. Simples (k) = f1+f2+...+fk
d.5. Frequência relativa
A frequência relativa é dada pela divisão entre a frequência simples da classe considerada
pelo número total de observações (n).
d.6. Frequência relativa acumulada
Seguem-se as mesmas idéias da frequência acumulada (simples). Assim, temos:
Freq. rel. acumulada da classe 1 (fra1) = freq. rel. simples da classe (1) = fr1
Freq. rel. acumulada da classe 2 (fra2) = freq. rel. simples (1) + freq. rel. simples (2) = fr1+fr2
Freq. rel. acumulada da classe 3 (fra3) = freq. rel. acumulada (2) + freq. rel. simples (3) =
fr1+fr2+fr3
...
Freq. rel. acumulada da classe “k” (frak) = freq. rel. acumulada (k-1) + freq. rel. simples (k) =
fr1+fr2+...+frk

3.3.1.5. Histograma
É a representação gráfica de uma distribuição de frequências por meio de retângulos
justapostos, de forma que a área de cada retângulo seja proporcional à frequência da classe
que ela representa, sendo as larguras dos retângulos proporcionais as amplitudes dos
intervalos de classe. É o gráfico em colunas justapostas (pois a variável é contínua) de uma
distribuição de frequências. O gráfico seguinte mostra o histograma da frequência absoluta
simples para o exemplo ilustrativo 1.
Gráfico 9 - Histograma de frequências simples dos pesos dos estudantes

18
16
14
12
Frequência

10
8
6
4
2
0
67 75 83 91 99 107 115
Peso dos estudantes (kg)

22
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.3.1.6. Polígono de frequência


É um gráfico em linha em que as frequências são locadas sobre perpendiculares levantadas
nos pontos médios. Na construção do polígono é necessário ligar o primeiro e o último ponto
médio com o eixo horizontal de modo a cercar a área da distribuição observada. Para isso,
acrescentam-se duas classes, uma anterior a primeira e outra posterior a ultima, ambas com
frequências zero (0).
Gráfico 10 – Polígono de frequência dos pesos dos estudantes

18
16
14
12
Frequência

10
8
6
4
2
0
59 67 75 83 91 99 107 115 123
Peso dos estudantes (kg)

3.3.1.7. Polígono de frequência acumulada (Ogiva)


Os gráficos das frequências acumuladas são denominados ogivas. A construção é idêntica a
do polígono de frequência, no entanto são utilizados os limites de classes. A ogiva pode ser
traçada tanto para frequências acumuladas abaixo de (fa↓) como para frequências
acumuladas acima de (fa↑). Vejamos os significados dessas frequências. A fa↓ de uma
classe (frequência absoluta acumulada crescente) significa o número de elementos do
conjunto que tem valor abaixo do limite superior da própria classe. Por sua vez, a fa↑ de
uma classe (frequência absoluta acumulada decrescente) indica o número de elementos do
conjunto que tem valor acima do limite inferior desta mesma classe. O quadro abaixo
apresenta a forma de obtenção das frequências acumuladas abaixo de (fa↓) e acima de
(fa↑) a partir das frequências absolutas simples (fi) referentes ao exemplo ilustrativo 1.
Quadro 1 – Frequências acumuladas abaixo de (fa↓) e acima de (fa↑) do peso dos
estudantes

Classes fi fa↓ fa↑

63├ 71 2 2 50 (=48+2)
71├79 5 7 (=2+5) 48 (=43+5)
79├87 10 17 (=7+10) 43 (=33+10)
87├95 16 33 (=17+16) 33 (=17+16)
95├103 10 43 (=33+10) 17 (=7+10)
103├111 5 48 (=43+5) 7 (=2+5)
111├119 2 50 (=48+2) 2
Total n=50 - -

23
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

A representação gráfica das frequências acumuladas abaixo de e das frequências


acumuladas acima de, denominado de Composto por alguns autores, está apresentada no
Gráfico 11 abaixo (utilizando os dados do exemplo ilustrativo 1).
Gráfico 11 - Ogivas dos pesos dos estudantes (Gráfico Composto)
60

50
Frequência acumulada

40

30

20

10

0
67 75 83 91 99 107 115
Peso dos estudantes (kg)

─ Abaixo de ---- Acima de


Na interseção dos polígonos abaixo de e acima de temos um valor central, representativo da
distribuição, que identifica que 50% dos valores observados situam-se abaixo daquele valor
e os 50% restantes acima do mesmo. Esse valor denomina-se mediana, como veremos
quando do estudo das medidas de posição ou de tendência central.

3.4. Medidas de Posição

3.4.1. Média Aritmética


É a principal medida de posição, sendo utilizada principalmente quando os dados
apresentam distribuição simétrica ou aproximadamente simétrica, como acontece com a
maioria das situações práticas. A média é a soma dos valores dividida pelo número de
valores.
Assim, sejam X1, X2, X3,…, Xn valores de X associados às n observações. A média
aritmética é dada por:

Deve-se diferenciar por meio da notação apropriada a média populacional (µ) da amostral
( ). A média aritmética de uma população finita é calculada somando-se todos os valores da
população e dividindo-se pelo tamanho N da mesma, sendo representada pela letra grega µ
(pronuncia-se mi), cuja expressão é:

 Exemplo ilustrativo 2: média para dados não agrupados


Deseja-se saber a idade média dos estudantes de certa turma cujas idades estão abaixo:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
43 58 17 39 62 38 23 31 45 49

24
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Para dados agrupados, a média é calculada segundo a fórmula abaixo:

 Exemplo para dados agrupados


Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a média dos pesos dos estudantes para os dados agrupados.

Ponto Frequência
Classes Médio da Absoluta
Classe (Xi) Simples (fi)

63├ 71 67 2 134
71├79 75 5 375
79├87 83 10 830
87├95 91 16 1456
95├103 99 10 990
103├111 107 5 535
111├119 115 2 230
Total ─ n=50 ∑xi.fi = 4550

Assim, a média dos pesos de 50 estudantes do sexo masculino de certa universidade


cearense será:

Assim, a média dos pesos dos estudantes é 91 kg.

3.4.1.1. Propriedades da Média


a) A soma dos desvios dos valores da variável é sempre igual a zero→
b) A soma dos quadrados dos desvios dos valores da variável é sempre um valor
mínimo → ;
c) Se um conjunto de n1 números tem média , um conjunto de n2 números tem média
, e assim sucessivamente, até um conjunto de nk números tem média . Então, a
média do conjunto formado por todos os números (n1+n2+...+nk) é dada pela média
ponderada de todas as médias, segundo a expressão:

d) A média de um conjunto de dados acrescido (ou subtraído) em cada elemento por


uma constante é igual à média original mais (ou menos) essa constante;
e) Multiplicando todos os dados por uma constante a nova média será igual ao produto
da média anterior pela constante.

25
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.4.1.2. Importância, utilidades, vantagens e desvantagens da média aritmética


a) É facilmente calculável;
b) É rigorosamente definida e exata;
c) Descreve todos os dados de uma série e é de fácil compreensão;
d) É a medida de tendência central mais utilizada;
e) Depende de cada um dos valores da série e a alteração de um deles altera o seu
valor;
f) É influenciada por valores extremos, podendo, em alguns casos, não representar a
série;
g) Não pode ser empregada para dados qualitativos;
h) Pode acontecer da média aritmética ser um número que não está no conjunto de
valores da variável ou no conjunto de dados. Neste caso diz-se que a média não tem
existência concreta; e
i) Não pode ser calculada para distribuições com limites indeterminados (indefinidos).

3.4.2. Mediana
Colocando-se os valores de uma série em ordem crescente ou decrescente, a mediana é o
valor que ocupa a posição central. Além e representar a série, ela serve para analisar sua
distribuição, bem como para comparar fenômenos da mesma espécie, o que também ocorre
com as outras medidas de posição.

3.4.2.1. Mediana para dados não agrupados

Se n é ímpar, a mediana é o valor de ordem desse conjunto. Por exemplo: a mediana


do conjunto A={2,3,7,11,15,17,21} é o número 11, pois esse valor ocupa a quarta posição do
conjunto: (7+1)/2 = 4.

Se n é par, a mediana é definida como o valor médio entre as posições e Por


exemplo: no conjunto de dados B={12,14,14,15,16,17,20} a mediana é:

3.4.2.2. Mediana para dados agrupados


a) Dados agrupados sem intervalos de classes
Quando os dados estão agrupados em uma distribuição de frequências, mas sem intervalos
de classes, preliminarmente, determinamos as frequências acumuladas.
Se o número de elementos do conjunto for ímpar, a mediana será o elemento de ordem
e será o valor cuja frequência acumulada contiver este elemento.

 Exemplo ilustrativo 3: calcular a mediana para a distribuição de frequência, com


número ímpar de elementos, dada abaixo:
Xi fi fai
1 1 1
2 3 4
3 5 9
4 2 11
Total 11 ─

26
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Como o número de elementos da distribuição é ímpar (n=11), então a mediana será o


elemento de ordem 6º. Assim, a frequência acumulada que contém o
sexto elemento corresponde a terceira classe, visto que a segunda classe só aborda até o
quarto elemento (observe a frequência acumulada!). Assim, a mediana será 3.
 Exemplo ilustrativo 4: calcular a mediana para a distribuição de frequência, com
número par de elementos, dada abaixo:
Xi fi fai
82 5 5
85 10 15
87 15 30
89 8 38
92 4 42
Total 42 ─
A ordem do elemento está entre e . Assim, a
frequência acumulada que contém o elemento de ordem vinte e um e vinte e dois
corresponde à terceira classe, visto que a segunda classe só aborda até décimo quinto
elemento (observe a frequência acumulada!). Assim, a mediana será 87.
b) Dados agrupados em intervalos de classes
Neste caso a mediana é dada pela expressão:

Onde:
Li = limite inferior da classe que contém a mediana;
n = número de elementos do conjunto de dados;
Faant = soma das frequências das classes anteriores à classe que contém a mediana;
Fmd = frequência absoluta simples da classe que contém a mediana; e
h = amplitude da classe.
 Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a mediana dos pesos dos estudantes para os dados agrupados.

Ponto Frequência Frequência


Classes Médio da Absoluta Simples Acumulada
Classe (Xi) (fi) (fai)
63├ 71 67 2 2
71├79 75 5 7
79├87 83 10 17
87├95 91 16 33
95├103 99 10 43
103├111 107 5 48
111├119 115 2 50
Total ─ 50 ─
 Cálculo da mediana para dados agrupados em intervalos de classes:

27
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

1º Passo: n/2 = 50/2 = 25º


2º Passo: o 25º elemento está na 4ª classe (observe a frequência acumulada!)
3º Passo: a mediana será

Assim, a mediana dos pesos dos estudantes é 91 kg.

3.4.2.3. Importância, utilidades, vantagens e desvantagens da mediana


a) É uma medida definida e exata;
b) É de fácil compreensão;
c) A mediana depende da posição e não dos valores dos elementos da série ordenada;
d) Serve para análise comparativa;
e) O valor da mediana pode ou não coincidir com um elemento do conjunto de dados.
Quando o número de elementos do conjunto (n) é ímpar, há essa coincidência, mas
o mesmo não acontece quando n é par.

3.4.3. Moda
Define-se moda (ou modas) de um conjunto o valor (ou valores) que mais se repete, ou seja,
de maior frequência.

3.4.3.1. Dados não agrupados em classes


Sejam os seguintes conjuntos de dados:
A = {1,2,2,2,2,2,2,2,3,3,3,3,3,5,5}
B = {2,3,7,7,7,9,9,11,11,11,13,15}
C = {2,3,7,9,11}
D = {2,2,3,3,7,7,9,9}
No conjunto A o número 2 é o que apresenta maior frequência, no caso repete-se sete
vezes. Então, a moda do conjunto A é 2 (mo = 2).
O conjunto B é uma série bimodal, pois os números 7 e 11 repetem-se três vezes tendo,
portanto, duas modas nesse conjunto (7 e 11).
Nos conjuntos C e D todos os valores têm a mesma frequência (um e dois,
respectivamente). Logo, não existe moda, isto é, os conjuntos são amodais.

3.4.3.2. Moda para dados agrupados

a) Dados agrupados sem intervalos de classes


Nas distribuições sem o agrupamento em intervalos de classes, a simples observação da
coluna das frequências nos permite saber qual é o elemento da série que apresenta a maior
frequência e que, portanto, é o valor que está na moda.
Exemplo ilustrativo 5: calcular a moda da distribuição abaixo:

28
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Xi fi
3 3
5 6
7 5
9 4
11 2
Total 20
No exemplo acima, observamos que a segunda classe é a que possui a maior frequência
simples, então, a moda para essa distribuição será 5.
b) Dados agrupados em classes
Existem vário métodos para o cálculo da moda, quando os dados estão agrupados em
classes, entre eles os de Czuber, o de King e o empírico de Pearson.
A classe que apresenta a maior frequência é denominada classe modal e o ponto médio
dessa classe é chamado moda bruta.
Iremos trabalhar com o método de King. Neste método, a moda é dada por:

Onde:
Li = limite inferior da classe modal;
Fant = frequência absoluta simples da classe anterior à que contém a moda;
Fpost = frequência absoluta simples da classe posterior à que contém a moda; e
h = amplitude da classe.
 Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a moda dos pesos dos estudantes para os dados agrupados.

Frequência
Classes Absoluta
Simples (fi)
63├ 71 2
71├79 5
79├87 10
87├95 16
95├103 10
103├111 5
111├119 2
Total 50

Assim, a moda dos pesos dos estudantes é 91 kg.

29
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.4.3.3. Importância, utilidade, vantagens e desvantagens da moda


a) É de fácil compreensão;
b) Pode não ocorrer em uma série ou ocorrer mais de uma vez em outras;
c) Não é rigorosamente definida e exata;
d) Não é influenciada por todos os valores de uma série;
e) É uma das medidas de tendência central de grande importância;
f) É muito utilizada quando há valores extremos que afetam, de maneira acentuada, o
valor da média.

3.4.4. Separatrizes (quartis, decis, percentis)


Sabemos que, num conjunto de valores colocados em ordem de grandeza, o valor médio ou
média aritmética dos dois valores centrais, que divide o conjunto em duas partes iguais, é a
mediana. De modo análogo, num conjunto de dados dispostos, em ordem de grandeza, os
valores Q1, Q2 e Q3 que dividem o conjunto em quatro partes iguais são chamados de
primeiro, segundo e terceiro quartis. O segundo quartil é a própria mediana, conforme
mostra a Figura 2.

Figura 2 – Ilustração das divisões dos quartis em um conjunto ordenado de dados


De modo semelhante, os valores que dividem o conjunto de dados em dez partes iguais são
chamados decis e são representados por D1, D2,..., D9, enquanto que os valores que
dividem o conjunto em cem partes iguais são denominados percentis e representados por
P1, P2,..., P99. O quinto decil e o qüinquagésimo percentil correspondem à mediana. O 25º e
o 75º percentis correspondem ao 1º e 3º quartis, respectivamente.

3.4.4.1. Cálculo das separatrizes para dados não agrupados em classes


A ordem dos quartis, decis e percentis pode ser obtida pela seguinte fórmula:

Onde:
x = ordem da observação;
n = número total de observações da série; e
p = percentil, em porcentos, dessa observação.

30
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Exemplo ilustrativo 6 (quando n é ímpar): calcular os quartis para o conjunto


ordenado abaixo:
Variável 15 18 19 24 27 31 32 38 39 42 43
Ordem 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª

O 1º quartil está entre a terceira e quarta ordem (entre as variáveis 19 e 24) → interpolação
linear! Q1 = 19 + (24 - 19). 0,5 = 21,5.
Q2 = md = 31.

O 3º quartil está entre a terceira e quarta ordem (entre as variáveis 38 e 39) → interpolação
linear! Q3 = 38 + (39 - 38). 0,5 = 38,5.
 Exemplo ilustrativo 7 (quando n é par): calcular os quartis para o conjunto ordenado
abaixo:
Variável 10 12 12 16 20 23 25 28
Ordem 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

O 1º quartil está entre a segunda e terceira ordem. Como nas duas a variável 12 se repete,
então Q1 = 12.

O 3º quartil está entre a sexta e sétima ordem (entre as variáveis 23 e 25) → interpolação
linear! Q3 = 23 + (25 - 23). 0,25 = 23,5.

3.4.4.1. Cálculo das separatrizes para dados agrupados em classes


a) Dados agrupados sem intervalos de classes
Atenção! Observar, pela frequência acumulada, a classe que contém a separatriz!
 Exemplo ilustrativo 8: calcular os quartis para a distribuição abaixo:
Xi fi fai
2 5 5
4 7 12
5 8 20
6 4 24
Total 24 ─
Então:

31
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

b) Dados agrupados em classes


As fórmulas para a determinação dessas separatrizes são semelhantes às usadas para o
cálculo da mediana, ou seja:

Onde:
i = 1,2,3, para o caso de quartis;
i = 1,2,...,9, para o caso de decis;
i = 1,2,...,99, para o caso de percentis;
Li = limite inferior da classe referida;
Faant = frequência acumulada da classe anterior à referida;
Fi = frequência absoluta simples da classe referida; e
h = amplitude da classe.
 Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber setuagésimo quinto percentil dos pesos dos estudantes para os dados
agrupados.

Ponto Frequência Frequência


Classes Médio da Absoluta Simples Acumulada
Classe (Xi) (fi) (fai)
63├ 71 67 2 2
71├79 75 5 7
79├87 83 10 17
87├95 91 16 33
95├103 99 10 43
103├111 107 5 48
111├119 115 2 50
Total ─ 50 ─

32
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

1º Passo: determinar a classe que contém a separatriz (observe a frequência acumulada!):

2º Passo: Assim, o elemento de ordem 37,5º encontra-se na quinta classe. Sabendo-se a


classe, aplica-se a fórmula:

3.5. Medidas de Dispersão ou de Variação


As medidas de posição, como foram vistas, servem para representar resumidamente os
dados estatísticos. No entanto, essas medidas não retratam a maneira como os dados estão
distribuídos em relação à média dos dados ou em torno de uma determinada medida de
posição, isto é, não retratam a sua variabilidade. O cálculo de uma medida de tendência
central só se justifica devido a variabilidade presente na natureza. Não haveria sentido se
calcular ma média para um conjunto de dados onde não houvesse variação. Por outro lado,
se a variabilidade dos dados for muito grande, a sua média terá um grau de confiabilidade
muito pequeno.
Assim, as medidas de dispersão servem para verificar com que confiança as medidas de
tendência central resumem as informações fornecidas pelos dados obtidos em uma
pesquisa.

3.5.1. Medidas do tipo amplitude


As medidas do tipo amplitude informam sobre a distância ou amplitude de um ponto a outro.

3.5.1.1. Amplitude Total ou Range


É a diferença entre o maior e o menor valor de uma série de dados. A amplitude total
permite avaliar o grau de aproximação com que determinada média representa os dados.
Numa distribuição de frequências, com os dados agrupados em classes, a amplitude total é
a diferença entre o limite superior da última classe e o limite inferior da primeira classe, isto
é:

A amplitude total tem o grande inconveniente de só levar em consideração os dois valores


extremos do conjunto, não considerando todo o conjunto de dados. Deste modo ela é
apenas uma indicação aproximada da variabilidade ou dispersão.

3.5.1.2. Amplitude Quartílica (AQ)


É a diferença entre o terceiro e o primeiro quartil de uma série de dados. É útil quando em
duas séries se tem a mesma amplitude total e desejamos fazer distinção entre os dois
conjuntos através das amplitudes.
A amplitude quartílica é utilizada quando empregamos a mediana como medida de
tendência central. A amplitude quartílica tem também o inconveniente de só levar em
consideração dois valores.

33
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

3.5.2. Medidas do tipo desvio


As medidas do tipo desvio, ao contrário das anteriores, levam em consideração todo o
conjunto de valores, por isso são elas as mais empregadas. Essas medidas consideram a
distância (desvio) de cada valor da variável em relação a uma medida de tendência central,
geralmente a média.

3.5.2.1. Desvio Quartílico (DQ)


O desvio quartílico não é uma boa medida de dispersão, pois é simplesmente a semi-
amplitude quartílica, discutida no item 3.5.1.2.

3.5.2.2. Desvio Médio (DM)


É a média aritmética dos afastamentos, tomados em valor absoluto, dos diversos valores de
um conjunto de dados em relação a certa medida de posição, geralmente a média
aritmética. Se as diferenças são pequenas, evidentemente, os valores diferem pouco entre
si.
O desvio médio é tomado em módulo, pois a soma dos desvios tomados em relação à
média é sempre nula (primeira propriedade da média).
O desvio médio é definido por:

 Exemplo ilustrativo 9 (para dados não agrupados): calcule o desvio médio para o
conjunto W = {2,3,5,8,9,10,19}.

 Exemplo para dados agrupados:


Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber o desvio médio dos pesos dos estudantes para os dados agrupados.
Observação: média já calculada ( ) no item 3.4.1.

34
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Ponto Médio Frequência


da Classe Absoluta – . fi
(Xi) Simples (fi)
67 2 67-91 . 2 = 48
75 5 75-91 . 5 = 80
83 10 83-91 . 10 = 80
91 16 91-91 . 16 = 0
99 10 99-91 . 10 = 80
107 5 107-91 . 5 = 80
115 2 115-91 . 2 = 48
Total 50 416
Assim, o desvio médio para os dados do exemplo ilustrativo 1 será:

3.5.2.3. Variância e Desvio Padrão


Ao estudarmos o desvio médio vimos que os afastamentos foram tomados em módulo, uma
vez que a soma de todos os desvios em relação à média é nula, de acordo com a primeira
propriedade da média aritmética. De acordo com a segunda propriedade da média, temos
que a soma dos quadrados dos desvios tomados em relação à média é um mínimo.
Aproveitando, pois, essa propriedade, definiremos a variância ou quadrado médio (QM)
como a média dos quadrados dos desvios, isto é:

Desenvolvendo a fórmula do item “b”, temos:

35
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

A vantagem de se trabalhar com essas duas últimas fórmulas é que trabalhamos


diretamente com os dados originais, não havendo, pois, necessidade de calcularmos
previamente a média e os desvios em relação a ela.
O numerador na fórmula da variância, quando se trabalha com amostras, é usualmente
denominado de soma dos quadrados (SQ), enquanto o denominador é chamado de graus
de liberdade (GL). Portanto, a variância ou quadrado médio (QM) é dado por:

Atenção! Quanto maior for o tamanho da amostra (n) menor é o desvio, pois, nesse caso, a
média estimada se aproxima da média populacional ou paramétrica (µ).
Uma das grandes desvantagens que tem a variância é o fato de não ser medida na mesma
unidade dos dados originais. Este inconveniente controlado extraindo-se a raiz quadrada da
variância. Deste modo, o desvio padrão (s) é definido como a raiz quadrada da variância.

 Exemplo para dados agrupados:


Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a variância e o desvio padrão dos pesos dos estudantes para os dados
agrupados.
1º Passo: cálculo das colunas adicionais (Xi. fi) e (Xi2. fi) na distribuição de freqüência em
questão.
Ponto Médio da Frequência X i. f i Xi2. fi
Classe
67 (Xi) Absoluta2Simples 134 8978
75 (f5i) 375 28125
83 10 830 68890
91 16 1456 132496
99 10 990 98010
107 5 535 57245
115 2 230 26450
Total 50 4550 420194
2º Passo: aplicação do somatório das colunas adicionais calculadas (Xi. fi = 4550) e (Xi2. fi =
420194) na fórmula da variância amostral para dados agrupados. Assim, teremos:

 Propriedades
I. Variância
 Somando-se ou subtraindo-se uma constante aos dados a variância não se altera;

36
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

 Multiplicando todos os dados por uma constante “K”, a nova variância ficará
multiplicada por “K2”;
II. Desvio Padrão
 Somando-se ou subtraindo-se uma constante “K”aos dados, o desvio padrão não se
altera;
 Multiplicando todos os dados por uma constante “K”, o novo desvio padrão fica
multiplicado por “K”;

3.5.2.4. Coeficiente de Variação

Não se devem comparar diretamente duas ou mais medidas de dispersão. Por exemplo, não
se pode afirmar que uma variabilidade medida pelo desvio padrão de 11,20 kg para o peso,
é maior que uma variabilidade, também medida pelo desvio padrão, de 5,5 m para a altura.
É óbvio que não devemos comparar grandezas distintas como as referidas anteriormente
(peso e altura) em relação à sua variabilidade. Para isso, é necessário convertê-las para um
valor relativo. Para resolver esse problema, Karl Pearson, matemático inglês (1857-1936),
que contribuiu significativamente para a ciência estatística, desenvolveu uma medida
relativa, denominada coeficiente de variação (CV), que consta da divisão do desvio padrão
pela média aritmética e, geralmente, expresso em porcentagem, como a expressão abaixo:

 Calculando o coeficiente de variação para o exemplo ilustrativo 1, temos:

3.5.2.5. Erro padrão da média


Quando se obtém uma amostra aleatória de tamanho n (AAS), calcula-se a média amostral
estimar-se a média populacional ou paramétrica (µ). Se uma nova AAS for realizada, a
estimativa obtida será diferente daquela da primeira amostra. Esse processo, se repetido,
fornecerá estimativas diferentes em cada etapa.
Dessa forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam
populações de médias amostrais, quando todas as passíveis (ou as infinitas) amostras são
retiradas de uma população. A variabilidade de uma média é estimada pelo seu erro padrão.
O erro padrão fornece um mecanismo de medir a precisão com que a média
populacional foi estimada.
Quanto menor o erro padrão, maior será a precisão da média estimada.
A fórmula do erro padrão da média é dada abaixo:

 Calculando o erro padrão para a média do exemplo ilustrativo 1, temos:

37
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

4. PROBABILIDADE
Probabilidade, num conceito amplo, é o estudo dos fenômenos aleatórios. Os fenômenos
estudados em estatística são fenômenos cujo resultado, mesmo em condições normais de
experimentação, variam de uma observação para outra, dificultando dessa maneira a
previsão de um resultado futuro. Para explicação desses fenômenos, chamados de
aleatórios, adota-se o modelo matemático denominado teoria das probabilidades.
Para entender a inferência estatística, é preciso entender vários conceitos de probabilidade.
A probabilidade e a estatística estão estreitamente relacionadas, porque formulam opostos
de questões. Na probabilidade sabemos como um processo ou experimento funciona e
queremos predizer quais serão os resultados de tal processo. Em estatística não sabemos
como um processo funciona, mas podemos observar os resultados e utilizar as informações
sobre os mesmos para conhecer a natureza do processo ou do experimento.
O termo probabilidade é usado de modo muito amplo na conversação diária para sugerir
certo grau de incerteza sobre o que ocorreu no passado, o que ocorrerá no futuro e o que
está ocorrendo no presente.
Logo os modelos probabilísticos podem ser úteis em diversas áreas do conhecimento
humano, como em administração de empresas, ciências econômicas ou comércio exterior.

4.1. Experimento aleatório


É aquele que poderá ser repetido sob as mesmas condições indefinidamente. Tal
experimento apresenta variações de resultados, não sendo possível afirmar a priori qual
será sua determinação antes que o mesmo tenha sido realizado. É possível, porém,
descrever a probabilidade de cada possível resultado, bem como é possível relacionar todos
os resultados que podem ocorrer. O lançamento de uma moeda é um experimento aleatório,
pois esse experimento poderá ser repetido quantas vezes desejarmos. Antes do
lançamento, não podemos dizer qual será o resultado, mas somos capazes de relatar os
possíveis resultados: cara ou coroa.

4.2. Espaço amostral


Definimos de espaço amostral “S”como sendo o conjunto de todos os possíveis resultados
de um experimento “E”.
Por exemplo, no experimento que consiste no lançamento de um dado, o espaço amostral é
S = {1,2,3,4,5,6}.

4.3. Evento
Evento é qualquer conjunto de resultados de um experimento. Sendo o evento um
subconjunto de S, indicaremos os eventos por letras maiúsculas: A, B, C e assim por diante.
Por exemplo, no experimento que consiste no lançamento de um dado, podemos definir o
evento A como “sair um número par”.

38
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

Então, A = {sair um número par} → A = {2,4,6}.

4.3.1. Evento simples


É aquele formado por um único elemento do espaço amostral.
Por exemplo, no experimento que consiste no lançamento de um dado, o evento B, definido
como “sair um número maior que 5”, é um evento simples → B = {6}.

4.3.2. Evento composto


É aquele que possui mais de um elemento. Note que o evento A = {2,4,6} é um evento
composto.

4.3.3. Evento certo e evento impossível


Diante das explicações sobre eventos, notamos que S (espaço amostral) e (conjunto
vazio) também são eventos, chamados respectivamente de evento certo e evento
impossível.

4.4. Definição de probabilidade


A probabilidade matemática de um acontecimento é a relação entre o número de casos
favoráveis e o número de casos possíveis, desde que haja rigorosa equipossibilidade entre
todos os casos.
Designado por “S”o número de casos possíveis e por “A” o número de casos favoráveis,
temos a probabilidade “P”, assim definida:

Ou seja:

O valor de P(A) é sempre uma fração compreendida entre zero e um, pois o número de
casos favoráveis nunca pode ser maior que o número de casos possíveis.
Os valores limites de probabilidade são:
a) P(A) = 0 quando A = 0, isto é, não há casos favoráveis; há certeza de não acontecer;
b) P(A) = 1 quando A = S, isto é, todos os casos são favoráveis, havendo certeza do
acontecimento.
A probabilidade do não-acontecimento costuma ser simbolizada pela letra “Q”, onde
Q(A) = 1-P(A). Logo: P(A) + Q(A) = 1.

4.5. Esperança matemática


Aos valores que em estatística denominamos de médias, no cálculo das probabilidades
denominamos de esperança matemática.
O cálculo da esperança é possível pela fórmula:

Onde:
E(x) = esperança matemática de ocorrer o evento x;

39
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

n = número de tentativas;
p = probabilidade de sucesso, ou seja, probabilidade de ocorrer o evento x em uma tentativa
única.
Originalmente o conceito de esperança matemática surgiu em função de sua relação com
jogos de azar e, em sua forma mais simples, é o produto da quantia que um jogador pode
ganhar (o prêmio) pela probabilidade de que isso ocorra.
 Exemplo ilustrativo 10: em uma caixa encontram-se 100 canetas, sendo 20 pretas,
50 vermelhas e 30 azuis. Qual o valor esperado de canetas azuis, em 20 retiradas de
uma caneta, se houve reposição da mesma na caixa?

 Exemplo ilustrativo 11: Um lojista mantém extensos registros das vendas diárias de
certo aparelho. O quadro a seguir dá o número xi de aparelhos vendidos em uma
semana e a respectiva probabilidade:

Número (xi) 0 1 2 3 4 5
Probabilidade P(X=xi) 0,1 0,1 0,2 0,3 0,2 0,1

Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma
semana?
Solução:
Calculemos inicialmente E(X), que é o número esperado de aparelhos vendidos em uma
semana: E(X) = (0).(0,1) + (1).(0,1) + (2).(0,2) + (3).(0,3) + (4).(0,2) + (5).(0,1) = 2,70. Para x
unidades vendidas o lucro é 20x. Logo, o lucro esperado é de 20.R$ 2,70 = R$ 54,00.

40
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto

REFERÊNCIAS
BEZERRA, Antonio Marcos Esmeraldo. Estatística e Experimentação Agrícola. Fortaleza
2004 (Apostila).
CASTANHEIRA, N. P. Estatística aplicada para todos os níveis. 04. ed. Curitiba: Editora
IBPEX Ltda., 2007. v. 01. 305 p.
IBGE. Instituto Brasileiro de Geografia e Estatística. Censo Demográfico de 1940, 1950,
1960, 1970, 1980, 1991 e 2000.
—————. Censo Agropecuário de 1970, 1975, 1980, 1985, 1995 e 2006.
—————. Estatísticas do Registro Civil de 2006, 2007, 2008, 2009 e 2010.
—————. Países, 2012.
—————. Pesquisa Mensal de Emprego de 2011.
—————. Pesquisa Nacional por Amostra de Domicílios (PNAD) de 2002.
LOPES, Paulo Afonso. Probabilidades e Estatística. Rio de Janeiro: Reichmann & Affonso
Editores, 2000.
MELO, F. I. O. . Estatística Aplicada às Ciências Biológicas. I - Estatística Básica.
Fortaleza Ceará: Departamento de Fitotecnia - Universidade Federal do Ceará, 2000
(Apostilas).
WILLCOX, Walter (1938) The Founder of Statistics. Review of the International Statistical
Institute 5(4):321-328.

41

Você também pode gostar