Você está na página 1de 13

INSTITUTO SUPERIOR DE CONTABILIDADE E

AUDITORIA DE MOÇAMBIQUE
ESTATÍSTICA I

 Introdução à Estatística

1. ALGUMAS NOTAS SOBRE ESTATÍSTICA

A sobrevivência no mundo do trabalho hoje depende cada vez mais de conhecimento, pois em função do
desenvolvimento tecnológico, característica marcante no mundo contemporâneo, exige-se profissionais mais
criativos e versáteis, capazes de entender o processo de trabalho como um todo. Esses profissionais devem ser
autónomos e ter iniciativa para resolver problemas em equipe e para utilizar diferentes tecnologias e linguagens,
que vão além da comunicação oral e escrita. A cada momento recebemos uma carga de informações codificadas
através dos meios de comunicação, internet e outros. A decodificação dessas informações se faz necessária, pois
hoje, o mercado de trabalho procura profissionais que tenham a capacidade de entender estatística e incentivar
sua utilização.

Podemos encontrar Estatística nos meios de comunicação: jornais, revistas, TV, rádio, internet, etc. Ela é
mostrada através de pesquisa de opinião pública, de índices de mortalidade ou crescimento, de índices de
contaminação ambiental, de desemprego, de acidentes, de violência, de inflação, etc. Os dados colectados,
organizados, resumidos, analisados e interpretados transformam-se em informações de grande importância para
os que estão interessados em curar, em educar, em administrar, fazer ciência ou dirigir a política de acordo com
a realidade.

Portanto, a utilização da Estatística é cada vez mais acentuada em qualquer actividade profissional da vida
moderna. Nos seus diversificados ramos de actuação, as pessoas estão frequentemente expostas à Estatística,
utilizando-a com maior ou menor intensidade.

2. DEFINIÇÃO DE ESTATÍSTICA

É extremamente difícil apresentar uma definição de Estatística, além do que muitos dos seus conceitos
fundamentais não apresentam uma definição explícita, ou, se a apresentam, esta não se revela suficientemente
clara para dar uma ideia definitiva de seu significado.

1
Algumas definições:

a) É uma ciência cujo objectivo é observar fenómenos da mesma natureza, recolher, apresentar, analisar e
interpretar dados numéricos de modo a auxiliar na tomada de decisões ou generalização de características
tiradas na amostra para todo o conjunto de unidades a estudar (população).

b) É a ciência dos dados. Envolve a colecta, a classificação, o resumo, a organização, a análise e a


interpretação da informação numérica;

c) É um método de trabalho que auxilia todas as outras ciências, no seu campo de acção.

2.1. Estatística nas empresas

A direcção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu
administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão o
trabalho de organizar, dirigir e controlar a empresa.

Por meio de sondagens e censos, podemos conhecer a realidade geográfica e social, os recursos naturais,
humanos e financeiros, as expectativas da comunidade sobre a empresa, estabelecer metas e objectivos com
maior possibilidade de serem alcançados a curto, médio ou longos prazos.

A Estatística ajudará em tal trabalho, como também na selecção e organização da estratégica a ser adoptada no
empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do
produto e mesmo dos possíveis lucros e/ou perdas.

A Estatística permite reduzir o erro das generalizações apressadas a respeito de tabelas e gráficos,
frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística.

3. ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INDUTIVA


Podemos dividir a Estatística em duas áreas, nomeadamente:

3.1. Estatística Descritiva ou Dedutiva


Definição: é a parte da Estatística referente a colecta e tabulação de dados.

Utiliza métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir a
informação contida nesses dados e para apresentar a informação de forma conveniente.

É aquela que tem por objectivo descrever e analisar determinada população, sem pretender tirar conclusões de
carácter mais genérico.

Dado um conjunto de elementos, podemos em relação a um certo fenómeno estudar todos os seus elementos,
classificando-os, fornecendo números indicativos que sumariem, certas características dos dados; são números
sumariantes, que fornecem descrições de todo o conjunto sem a apresentação total dos elementos, ou mesmo
medidas e relações do conjunto, não perceptíveis com a pura apresentação do rol de dados. A este sector da
Estatística denomina-se Estatística Descritiva.

2
3.2. Estatística Indutiva ou Inferência Estatística
Definição: é a parte da Estatística que, baseando-se em resultados obtidos da análise de uma amostra da
população, procura inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi
retirada.

Portanto, a Estatística indutiva refere-se a um processo de generalização, a partir de resultados particulares.


Consiste em obter e generalizar conclusões, ou seja, inferir propriedades para o todo com base na parte, no
particular.

O processo de generalização, que é característico do método indutivo, está associado a uma margem de
incerteza. A existência da incerteza deve-se ao facto de que a conclusão, que se pretende obter para o conjunto
de todos os indivíduos analisados quanto a determinadas características comuns, baseia-se em uma parcela do
total de observações.

A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da Probabilidade.

4. POPULAÇÃO, AMOSTRA E AMOSTRAGEM

4.1. População / Universo

Definição: é o conjunto de elementos, que podem ser seres animados ou inanimados, que apresentem pelo
menos uma característica comum e que interessa analisar.

A população pode ser classificada pelo tamanho, sendo finita, quando possui um número determinado de
elementos e infinita, quando possui um número infinito de indivíduos.

4.2. Amostra
Definição: é um subconjunto ou uma parte seleccionada da totalidade de observações abrangidas pela
população, através da qual se faz um juízo ou inferência sobre as características da população.

4.3. Amostragem
Definição: é um conjunto de técnicas estatísticas que possibilitam realizar pesquisas em universos infinitos,
estudando as relações existentes entre a população e a amostra.

Este conjunto de técnicas pode ser subdividido em dois grupos básicos: a amostragem aleatória e a amostragem
não aleatória.

A amostragem aleatória ocorre quando os elementos da amostra são obtidos aplicando métodos que permitem
que todos tenham a mesma possibilidade de serem seleccionados (ex.: para obter uma amostra representativa
de 10% para a pesquisa de estatura de 70 alunos, pode-se:
- Numerar os alunos de 01 a 70;
- Escrever os números de 01 a 70 em pedaços iguais de papéis de tal forma que não seja possível identifica-los,
coloca-los dentro de uma caixa e proceder ao sorteio, tirando um a um, até formar a amostra com tamanho
desejado.

A amostragem não aleatória ocorre quando o pesquisador selecciona intencionalmente os componentes da


amostra.
Outros Conceitos:

3
Parâmetros: são valores singulares que existem na população e que servem para caracterizá-la. Para definir um
parâmetro deve-se examinar toda a população.
Ex.: Os alunos do curso de Marketing no ISCAM têm em média 1,68 metros de estatura.

Estimativa: é um valor aproximado do parâmetro e é calculado a partir da amostra.

5. VARIÁVEIS ESTATÍSTICAS
Uma variável é qualquer característica de um elemento observado (pessoa, objeto ou animal) e pode-se
descrever dois tipos de variáveis para um estudo, nomeadamente:

5.1. Variáveis Qualitativas: é o que representa qualidade, atributo ou característica,… que se distingue por alguma
característica não numérica. Ex.: género, etc.

5.2. Variáveis Quantitativas: são números que representam contagens ou medições.


As variáveis quantitativas dividem-se em:

 Variáveis Quantitativas Discretas: resultam de um conjunto enumerável de valores possíveis. Ex.: número
de viaturas vendidas diariamente num parque, número de estudantes em cada turma do ISCAM, etc.
 Variáveis Quantitativas Contínuas: resultam de um conjunto de valores possíveis, geralmente obtidos por
meio de um instrumento de medição.
Ex.: peso, altura, etc.

5.3. Escalas de medida de variáveis

Dependendo do tipo de variáveis que constituem os dados estes podem ser expressos em quatro escalas
distintas: nominal, ordinal, por intervalo e por rácios.

5.3.1. Para Dados Qualitativos

 As variáveis qualitativas podem ser Nominais ou Ordinais, sendo Nominais quando não é possível
estabelecer uma sequência/ordem lógica entre elas ( ex.: cor da roupa, profissão, etc.) e Ordinais
quando pode-se encontrar uma ordem entre elas (ex.: categoria dos funcionários de uma empresa,
desempenho dos estudantes: baixo, médio, alto, etc.)

5.3.2. Para Dados Quantitativos

As variáveis quantitativas podem ter uma escala por Intervalos ou por Rácios

 Escala por Intervalos: este tipo de escala é usado com dados quantitativos tanto discretos como
contínuos sendo que a distância entre os valores que constituem os intervalos deve ser igual. Não
permitem efectuar todas as operações matemáticas.
Ex.: A temperatura em ºC (neste caso, 40ºC não representam efectivamente o dobro de 20ºC).

 Escala por Rácios: as escalas deste tipo têm as mesmas propriedades que as escalas por intervalos para
variáveis contínuas e, adicionalmente, permitem a utilização das 4 operações aritméticas. Apresentam a
característica de possuírem um zero absoluto como valor mínimo .

4
Ex.: Por exemplo o peso pode constituir uma escala por rácios.

EXERCICIOS (Parte I):

1. Defina Estatística e dê dois exemplos em que ela é útil

2. De entre 3000 clientes de uma loja, seleccionou-se 30 que foram inquiridos sobre o meio de comunicação
preferido, tendo-se obtido os seguintes resultados: rádio10, televisão 12 e jornal 8. Neste conjunto de dados
indique a população, amostra e variável Estatística.

3. Para cada um dos caracteres diga o tipo de dado, se são contínuos ou discretos e classifique-os quanto à
escala de medição:

a) Idade b) Local de nascimento c) Distância de casa até ao local de trabalho


d) Cor de cabelo e) Profissão f) Número de pessoas do agregado familiar
g) Nível académico

4. Analise as afirmações seguintes e coloque verdadeira (V) ou falsa (F):


a) As variáveis podem ser qualitativas (intervalares ou razões) ou quantitativas (nominais ou ordinais).
b) Inferência estatística é uma metodologia para tirar conclusões válidas duma amostra a partir dos
dados da população.
c) Parâmetro é uma variável fixa que se refere a população
d) População ou Universo é conjunto de indivíduos apresentando uma característica especial.

e) Uma variável é contínua quando pode tomar qualquer valor num intervalo.

f) Uma amostra só é representativa se tiver todos os elementos da população de interesse.

5. Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de televisão. Como
teste, o comercial é mostrado em um programa de notícias locais, às 18h30min. Dois dias mais tarde, uma
firma de pesquisa de mercados realizou um levantamento telefónico para obter informações sobre os índices
de respostas (percentagem de telespectadores que responderam ter visto o comercial). Será conveniente o
uso de uma amostra nessa situação? Explique.

6. REPRESENTAÇÃO GRÁFICA DE DADOS

5
A representação gráfica é um complemento da representação tabular (em tabelas). Normalmente, contém menos
informação que as tabelas, mas são de mais fácil leitura. A principal vantagem da representação gráfica em
relação a representação em tabelas é o facto de ela permitir que se consiga ter uma visualização imediata da
distribuição dos valores observados.

6.1. Tipos de gráficos


Existem vários tipos de gráficos tais como: o gráfico de barras, gráficos circulares (Pie charts), Histogramas e
mais.

O tipo de gráfico a usar depende da variável em questão. Contudo, os elementos simplicidade, clareza e
veracidade devem ser considerados, aquando da elaboração de um gráfico.

 Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de
traços desnecessários que possam levar o observador a uma análise morosa ou sujeita a erros.
 Clareza – o gráfico deve possibilitar uma correcta interpretação dos valores representativos do
fenómeno em estudo.
 Veracidade – o gráfico deve expressar a verdade sobre o fenómeno em estudo.

6.1.1. Gráficos de barras


Estes gráficos têm por objectivo comparar grandezas (variáveis) por meio de rectângulos de igual largura e
alturas proporcionais às respectivas grandezas. Este gráfico é utlizado para representar a distribuição de
frequências de variáveis nominais e ordinais.

Características

 Todas as barras devem ter a mesma largura diferindo somente no comprimento;


 Devem existir espaços iguais entre as barras, o qual esse espaço deve ser suficiente para que as
inscrições que identificam as diferentes barras não tragam confusão ao leitor.
 As barras devem ser desenhadas observando a sua ordem de grandeza, para facilitar a leitura e análise
comparativa dos valores.

Exemplo: Consideremos a tabela abaixo que se refere a produção de milho nas três regiões do país.

Região do país Produção de milho (Toneladas)


Norte 17350
Centro 12530
Sul 14550
Total 44430

6
Exemplo de Interpretação: a região Norte apresenta a maior produção de milho com 17350 toneladas,
sendo que a região Centro do país é a que produz menos milho apresentado uma produção de 12530
toneladas.

NOTA: existem Gráficos de barras Múltiplas que que fazem a análise conjunta de duas ou mais variáveis

6.1.2. Gráficos circulares ou de sectores (Pie Charts)


Também são usados para representar a distribuição de frequências de variáveis nominais e ordinais, como o
gráfico de barras. No entanto, são mais usados quando as categorias da variável em estudo são menores ou
iguais a 6, para permitir uma melhor leitura, sem correr risco de distorcer a informação que o gráfico nos
apresenta, como também, quando se pretende dar ênfase à comparação das percentagens de cada categoria.

A construção do gráfico de sectores segue uma regra de 3 simples, onde as frequências de cada classe
correspondem ao ângulo que se deseja representarem relação a frequência total que representa o total de
100% que corresponde a 360° da área total do gráfico circular.

Total___________100%

Parte ___________ X%

Características:

 A área do gráfico equivale á totalidade de casos (360° = 100%)


 Cada “fatia” representa a percentagem de cada categoria

7
Exemplo: Considerando o exemplo da produção de milho nas três regiões do país podemos representar a

informação da tabela num gráfico circular.

Norte Centro Sul

44430______100% 44430______100% 44430______100%

17350______ X° 12530______ X° 14550______ X°

X=39% X=28% X=33%

Exemplo de Interpretação: o que foi verificado na interpretação do histograma no ponto 2.3.1.1, pode ser
confirmado também através do gráfico circular acima representado. A região do país que mais produziu milho
foi a região Norte ocupando 39% da produção, seguido da região Sul com 33%, sendo que a região centro
apresentou a menor produção de milho com 28% da produção total que o país teve.

6.1.3. Histogramas:
É formado por um conjunto de rectângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de
tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um
histograma é proporcional à soma das frequências simples ou absolutas. Na linha horizontal (eixo das
abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as frequências. Este
gráfico é utlizado para representar a distribuição de frequências de variáveis contínuas.

Características:

 Cada barra representa a frequência do intervalo respectivo;


 Os intervalos devem ter a mesma amplitude;
 As barras devem estar todas juntas.

8
Exemplo: Consideremos o exemplo sobre o tempo em minutos que os Clientes de uma determinada

operadora de telefonia móvel utilizam em um mês.

i Classe (= tempo) Ponto Médio (Núm consumidores)


1 69.2|---94.8 82 3
2 94.8|---120.4 107.6 8
3 120.4|---146.0 133.2 16
4 146.0|---171.6 158.8 7
5 171.6|---197.2 184.4 4
6 197.2|---222.8 210 2
Total     40

Histograma

Exemplo de Interpretação: dos clientes entrevistados cerca de 16 gastam em média 133.2 minutos (valor
observado a partir do histograma) por mês ou gastam entre 120.4 a 146.0 minutos (valor retirado a partir da
tabela de frequências) por mês numa determinada operadora de telefonia móvel, sendo que somente 2
clientes gastam em média 210 minutos por mês.

ELEMENTOS PRINCIPAIS ELEMENTOS PARA A ORGANIZAÇÃO DE DADOS CONTÍNUOS E


CONSTRUÇÃO DO HISTOGRAMA:

a) Classe – é cada um dos intervalos em que os dados são agrupados.


b) Limites de classes são os valores extremos de cada classe.

Linf = limite inferior de uma classe;


Lsup= limite superior de uma classe.

c) Amplitude – é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode ser
referida ao total de dados ou a uma das classes em particular.

Amplitude Total (At) – é calculada pela seguinte expressão: At = Max. (rol) – Min.(rol).

Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a
expressão a seguir:
9
Máx(rol )  Mín.( rol )
h
n , onde n é o número de intervalos de classe.

Linf  Lsup
d) Ponto médio de classe (xi) - é calculado pela seguinte expressão: xi 
2

e) Número de classes ou intervalos de classe

Para a determinação do número de classes de uma distribuição podemos lançar mão de duas regras
que nos dá o número de classes em função do número de valores da variável -Regra da raiz ou a
Regra de Sturges:

Regra da raiz: dar preferência ao seu uso quando os dados da pesquisa não superarem 60
elementos.
k  n , onde k é o número de classes e n é o número de dados observados.

Regra de Sturges: deverá ser usada quando n > 60.

k  1  3,3  log n , onde k é o numero de classe e n é o número total de dados

f) Frequência absoluta (fi) - frequência absoluta de uma classe de ordem i, é o número de dados que
pertencem a essa classe.

g) Frequência relativa (fr) - frequência relativa de uma classe de ordem i, é o quociente da frequência
absoluta dessa classe (fi), pelo total, ou seja,
fi
fri 
Total

Obs: a soma de todas as frequências absolutas é igual ao total.

h) Frequência acumulada (Fi) - frequência acumulada de uma classe de ordem i, é a soma das frequências
até a classe de ordem i.

i) Frequência relativa acumulada (Fri) - frequência relativa acumulada de uma classe de ordem i, é a soma
das frequências relativas até a classe de ordem i

NOTA: resolver o exemplo a seguir com o Docente Humberto Inguane

10
A tabela abaixo apresenta os salários semanais (em Milhares de Meticais) de 60 operários de uma ONG em
funcionamento em Moçambique.

110 120 125 136 145 150 165 172 180 185
110 120 125 140 145 155 165 172 180 190
115 120 130 140 145 158 168 175 180 190
115 120 130 140 147 158 168 175 180 195
117 120 130 140 150 160 170 175 180 195
117 123 135 142 150 163 170 178 185 198
Construir uma distribuição de frequências e gráficos adequados.

6.1.4. Gráficos de Linhas

São usados para representar séries temporais, principalmente quando a série cobrir um grande número de
períodos de tempo.

Exemplo : Considere a série temporal da tabela abaixo, referente ao número de toneladas de trigo e de

milho produzidos no distrito PQR, durante os anos de 1970 a 1980.

Toneladas de Toneladas de
Anos
trigo milho
1970 200 75
1971 185 90
1972 225 100
1973 250 85
1974 240 80
1975 195 100
1976 210 110
1977 225 105
1978 250 95
1979 230 110
1980 235 100

Gráfico de linhas

11
EXERCICIOS (Parte II):

1. A seguinte tabela apresenta a distribuição do número de chamadas recebidas num posto telefónico em
períodos de 1 minuto

x 0 1 2 3 4 5 6

freq. (f) 40 26 14 6 3 0 1

a) Determine as frequências relativas e acumuladas

b) Apresente graficamente a informação resumida na tabela

c) Faça um breve comentário.

2. Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem.

26 28 24 13 18
18 25 18 25 24
20 21 15 28 17
27 22 13 19 28
Organize os dados numa tabela de frequências

3. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.


162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
166 169 152 170 172 165 162 164

12
a) Calcular a amplitude total.

b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe?

c) Construir uma tabela de frequência das alturas dos alunos.

d) Determinar os pontos médios das classes.

4. Dado o rol do número de erros de impressão da primeira página de um jornal durante 50 dias, obteve-se os
seguintes resultados:
5 5 5 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
10 10 10 10 10 11 11 11 11 12
12 12 12 12 12 12 12 12 13 14
14 14 14 14 14 14 15 16 19 22

Construir uma distribuição de frequências e gráficos adequados.

5. Considere a tabela abaixo que representa uma amostra da distribuição dos tempos (T) em minutos, de
duração das chamadas dos Clientes de uma operadora de telefonia móvel:

I Tempo (T em min) Nº de Clientes F


1 0 - 5 --- ---
2 5 - 10 31 74
3 10 - 15 16 ---
4 15 - 20 --- 101
5 20 - 25 --- 110
6 25 - 30 10 120
Total

a) Classifique a variável analisada.

b) Determine a média e a moda da distribuição

c) Qual a percentagem de Clientes que falam mais de 10 minutos mas não passa 25 minutos?

d) Qual o tempo mínimo dos 15% dos Clientes que mais falam no celular?

13

Você também pode gostar