Você está na página 1de 129

Universidade Jean Piaget de Angola

Faculdade de Ciências Sociais e Humanas


Estatı́stica I

Professor: Rui da C. A. Alfredo

10 de Outubro de 2021

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
1 / 127 I
Estatı́stica Descritiva

A palavra Estatı́stica tem origem na palavra em latim status, traduzida


como o estudo do estado e significava, originalmente, uma colecção de
informação de interesse para o estado sobre a população e economia.Essas
informações eram colectadas objectivando o resumo de informações
indispensáveis para os Governantes conhecerem suas Nações e para a
construção de programas de Governo. Há indı́cios de que 3000 anos A.C. já
se faziam censos na Babilónia, China e Egipto e até mesmo no quarto livro
do Velho Testamento faz referência a uma instrução dada a Moisés, para
que se fizesse um levantamento dos homens de Israel que estivessem a
guerrear.Usualmente, estas informações eram utilizadas para a taxação de
impostos ou para alistamento militar. O Imperador César Augusto, por
exemplo, ordenou que se fizesse o Censo de todo o Império Romano.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
2 / 127 I
O primeiro dado estatı́stico disponı́vel foi o de registos Egı́pcios de presos de
guerra na data de 5000 A.C,e em 3000 A.C. existiam também registros
Egı́pcios da falta de mão-de-obra relacionada a construção de piramedes.No
ano de 2238 A.C. o imperador da China Yao, ordenou que fosse feito o
primeiro recenseamento com fins agrı́colas e comerciais. Em 600 A.C. no
Egipto todos os indivı́duos tinham que declarar todos os anos ao Governo de
sua provı́ncia a sua profissão e suas fontes de rendimento, caso não a
fizessem seria declarada a pena de morte.Contudo, mesmo que a prática de
colectar dados sobre colheitas, composição da população humana ou de
animais, impostos,etc., fosse conhecida pelos Egı́pcios, Hebreus e Gregos,
apenas no século XVII a estatı́stica passou a ser considerada disciplina
autónoma, tendo como objectivo básico a descrição dos Bens do Estado.
A palavra estatı́stica surge em 1752, pelo Alemão Gottfried
Achenwall(1719 − 1772).Também foi Gottfried quem estabeleceu a relação
entre a estatı́stica com as outras ciências.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
3 / 127 I
No final do séculoXVIII a estatı́stica foi definida como sendo”o estudo
quantitativo de certos fenómenos sociais, destinados à informações dos
Homens do estado,”desde então esta definição tem agregado uma série de
outras funções além, é claro, a de fornecer informações a nossos
Governantes.
Qualquer ciência experimental não pode prescindir das técnicas
proporcionadas pela estatı́stica, como por exemplo:, a Fı́sica, a Biologia, a
Administração, a Economia,etc.
Todos esses ramos de actividade profissional tem necessidade de um
instrumental que se preocupa com o tratamento quantitativo dos fenómenos
de massa ou colectivos, cuja mensuração e análise requerem um conjunto de
observações de fenómeno ou particulares.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
4 / 127 I
A estatı́stica pode ser encarada como uma ciência ou como um método de
estudo.Duas concepções para a palavra estatı́stica:
1 No plural(estatı́sticas):indica qualquer colecção consistente de dados
numéricos, reunidos com a finalidade de fornecer informações acerca de
uma actividade qualquer. Exemplo: as estatı́sticas demográficas
referem-se aos dados numéricos sobre nascimentos,falecimentos,
matrimónios,etc.
2 No singular(estatı́stica): indica um corpo de técnicas, ou ainda uma
metodologia técnica desenvolvida para a colecta, a classificação, a
apresentação, a análise e interpretação de dados quantitativos e a
utilização desses dados para a tomada de decisões.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
5 / 127 I
Duas razões para se estudar estatı́stica:

1 Para não ser enganado;


2 Para se tornar um Profissional em estatı́stica.

Necessidade da estatı́stica nas ciências económicas e de gestão


Nas áreas económicas e de gestão de empresas,a Estatı́stica pode ser
utilizada com três objectivos:
1 Descrever e compreender relações entre diferentes caracterı́sticas de
uma população;
2 tomar decisões mais correctas ;
3 fazer face à mudança.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
6 / 127 I
Estatı́stica:é um ramo da matemática que se destina ao estudo dos
processos de obtenção, colecta,organização,apresentação,descrição, análise e
interpretação de dados numéricos, variáveis, referentes a qualquer fenómeno,
seja sobre uma população ou colecção, seja sobre um conjunto de seres para
a utilização dos mesmos para a tomada de decisões.
Observação:alguns Autores não a consideram como um ramo da matemática
mas sim, uma ciência pelo facto de, ter métodos e técnicas próprias.
A estatı́stica tem como objectivo fundamental o estudo de uma
população.Esse estudo pode ser feito de duas maneiras:
1 Investigando todos os elementos da população; ou
2 Por amostragem, ou seja, selecionando alguns elementos da população.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
7 / 127 I
A estatı́stica divide-se em dois grandes grupos:Descritiva e Inferencial.
Estatı́stica descritiva: é a parte da estatı́stica que se preocupa com a
colecta,organização, classificação, apresentação, interpretação e analise de
dados referentes ao fenómeno através de gráficos e tabelas além de calcular
medidas que permite descrever o fenómeno.
Essa área apenas descreve e analisa um conjunto de dados, sem tirar
conclusões.
Exemplo: Em uma empresa 130 empregados ganham em média 50.000 por
mês.
Estatı́stica indutiva ou inferencial: é a parte da estatı́stica que partindo de
uma amostra, estabelece hipóteses, tira conclusões sobre a população de
origem e que formula previsões fundamentando-se na teoria das
probabilidades.É a que trata das inferências e conclusões, isto é, a partir da
análise de dados são tiradas conclusões.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
8 / 127 I
Inferência: é o processo de generalização a partir de resultados particulares.
Exemplo:Uma pesquisa de opinião pública revelou que 55% da população
Angolana apoia um determinado Candidato para Presidente da república.Se
este Candidato for realmente inscrito para as eleições a presidente da
república é de se esperar que ele se eleja.
Na análise estatı́stica de dados, pode-se obter os resultados de duas
maneiras: através de um censo ou através de uma amostragem, isto é
pesquisa em uma amostra.
Observação:Alguns autores consideram a estatı́stica dividida em três áreas,
considerando a probabilidade como a terceira, mas neste curso ficaremos
apenas com as duas acima mencionadas.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 deSociais
Outubroe Humanas
de 2021 Estatı́stica
9 / 127 I
Exemplo: Pesquisa de mercado, pesquisa de opinião pública,etc.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
10 / 127 I
População ou Universo:é o conjunto, finito ou infinito, de indivı́duos ou
objectos que apresentam em comum determinadas caracterı́sticas definidas,
cujo comportamento interessa analisar.
O conceito de população em estatı́stica é bem mais amplo do que o uso
comum desta palavra.A população pode ser formada por pessoas, animais,
minerais, cobaias, peças de produção, ou qualquer outro elemento a ser
investigado.
Exemplos:
1 Pesquisa para estimar o consumo total de energia eléctrica em MWh
nas residências de Viana-Luanda, no ano 2019.
População ou Universo:Todas as residências, que estavam ligadas à rede
eléctrica de Viana-Lda, no ano 2019.
Caracterı́stica em comum:consumo anual de energia eléctrica em MWh.
2 Alunos da universidade Jean Piaget.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
11 / 127 I
Indivı́duo ou unidade estatı́stica:é cada um dos elementos que compõem a
população.A população ou universo estatı́stico pode ser dividido em:
1 População finita:Apresenta um número limitado de elementos.Dessa
forma, é possı́vel enumerar todos os elementos componentes.
Exemplo:Todos os alunos do curso de economia e gestão da
universidade Jean Piaget, em 2021;os produtos de um
supermercado,etc.
2 População infinita:Apresenta um número ilimitado de elementos, o que
torna impossı́vel a enumeração de todos os elementos componentes.
EXemplo: Os nascimentos de Bebéis, o número de peixe no mar, etc.
Em geral, como a quantidade total da população a ser investigada é muito
grande, tornando inviável a investigação de todos os elementos
populacionais existentes, decide-se assim, por estudar parte da população a
fim de se obter uma avaliação estática da amostragem.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
12 / 127 I
Amostra é uma parte ou um subconjunto finito da população que é
observada com objectivo de obter informação para estudar a caracterı́stica
pretendida.Esse subconjunto deve ter dimensão menor que o da população e
os seus elementos devem ser representativos da população.
Dimensão da amostra:é o número de elementos da amostra.
Muitas vezes, por motivos práticos ou económicos, limitam-se os estudos
estatı́sticos somente a uma parte da população ”à amostra ”.
A utilização de uma amostra e não da população num estudo estatı́stico,
deve-se pelo menos a uma das seguintes razões:
1 a população ser infinita;
2 menor custo(em termos de dinheiro e de tempo);
3 melhor investigação dos elementos observados;
4 quando precisa-se uma informação rápida.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
13 / 127 I
As medidas estatı́sticas obtidas com base na população são denominadas
parâmetros e as medidas obtidas com base em amostras são denominadas
estimativas.
Amostragem:é uma técnica especial de escolher amostras, de forma a
garantir o acaso na escolha.As técnicas de amostragens são:
Amostragem casual ou amostragem aleatória simples:os elementos de uma
população são escolhidos de tal forma que todos tenham a mesma chance
de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou
um programa de geração de números aleatórios.
Amostragem estratificada: subdivide-se a população em, no mı́nimo, dois
estratos(subpopulações) que compartilham a mesma caracterı́stica e em
seguida escolhe-se uma amostra de cada.Exemplo: homens e mulheres.
Amostragem sistemática: escolhe-se um ponto de partida e então,
sistematicamente, selecionam-se os outros.Por exemplo: o
3◦ , 403◦ , 803◦ , 1203◦ , · · · indivı́duos.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
14 / 127 I
Amostragem por conglomerados: divide-se a população em
conglomerados(áreas), em seguida sorteiam-se algumas áreas e analisam-se
todos os elementos dos conglomerados escolhidos.Por exemplo: Bairros.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
15 / 127 I
Censo:é o exame completo de uma população.Quanto maior é a mostra,
mais precisas e confiáveis deverão ser as induções feitas sobre a população.
Sondagem:é um estudo estatı́stico de uma população, feito através de uma
amostra, destinado a estudar uma ou uma mais das caracterı́sticas tal como
elas se apresentam nessa população.

Variáveis Estatı́sticas
Variável:é a caracterı́stica que vai ser observada,medida ou contada nos
elementos de uma população ou da amostra e que pode variar, ou seja,
assumir um valor diferente de elemento para elemento.
Exemplo:sexo, peso, altura,idade,etc.
Observação:não basta identificar a variável a ser trabalhada, é necessário
fazer-se a distinção entre os tipos de variáveis.
Variável qualitativa ou Categórica:é aquela que se refere a qualidade e não
pode ser medida.
Exemplo:sexo, profissão, tipo de sangue, estado civil, comportamento,cor da
pele,etc.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
16 / 127 I
As variáveis qualitativas podem ser:
1 Nominais:não apresentam uma ordem natural de ocorrência.
Exemplo:cor dos olhos,cor da pele, marcas de carro,sexo,etc.
2 Ordinais:apresentam uma ordem natural de ocorrência.
Exemplo:Estado civil dos alunos da disciplina de estatı́stica I do curso
de economia e gestão(solteiro,casado, divorciado),classe
social(baixa,media,alta),etc.
Variável quantitativa:é aquela que é mensurável, isto é, aquela que pode ser
representada por números.Exemplo:a idade, o peso, às notas, a altura,etc.
As variáveis quantitativas subdividem-se em:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
17 / 127 I
1 Discretas:são aquelas que podem assumir apenas valores inteiros em
pontos da recta.É possı́vel enumerar todos os possı́veis valores da
variável.
Exemplo:idade dos alunos da especialidade de gestão, número de golos
marcados numa partida de futebol,etc.
2 Contı́nuas:são aqueles que podem assumir qualquer valor num certo
intervalo(contı́nuo) da recta real.Não é possı́vel enumerar todos os seus
possı́veis valor.Exemplo:pesos dos bebéis nascidos numa maternidade
ao longo duma semana,a temperatura de um material,etc.
Em resumo, as variáveis são classificadas, em estatı́stica,como:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
18 / 127 I
Dados: são os resultados da observação de uma variável qualitativa ou
quantitativa.Exemplo:lançamos uma moeda ao ar 5 vezes e foram obtidos os
seguintes resultados: cara, cara, coroa, cara, coroa.
Fenómeno estatı́stico:é qualquer evento que se pretende analisar e cujo
estudo é possı́vel.
Método: é o meio mais eficaz para atingir uma meta.Existem 2 métodos
cientı́ficos que são: o método experimental e o método estatı́stico.
Método experimental: consiste em manter constante, todas as causas,
menos uma, que é que sofre variação para se observar os efeitos, caso
existem.Exemplo:estudos da Quı́mica,Fı́sica,etc.

Método Estatı́stico:
Diante da impossibilidade de manter as causas contantes(nas ciências
sociais), admitem todas essas causas presentes variando-as, registrando
essas variações e procurando determinar, no resultado final, que influencias
cabem a cada uma delas.Exemplo: Quais as causas que definem o preço de
uma mercadoria quando a sua oferta diminui?
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
19 / 127 I
Seria impossı́vel, no momento da pesquisa, manter constantes a
uniformidade dos salários, o gosto dos consumidores, nı́vel geral de preços
de outros produtos,etc.

Fases do método estatı́stico


Definição do problema: saber exactamente aquilo que se pretende pesquisar
é o mesmo que definir correctamente o problema.
Planejamento: Consiste em se determinar o procedimento necessário para
resolver o problema. como levantar as informações? que dados deverão ser
colectados? como se deve obte-los? qual levantamento a ser utilizado?
censitário? por amostragem? e o cronograma das actividades? os custos
envolvidos?
Colecta dos dados:fase operacional. É o registo sistemático dos dados, com
um objectivo determinado. um dado estatı́stico é considerado a matéria
prima sobre a qual iremos aplicar os métodos estatı́sticos. A colecta do
dados pode ser:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
20 / 127 I
Colecta directa: quando é obtida directamente da fonte.
Exemplo: uma empresa realiza uma pesquisa para saber a preferência de
seus consumidores pela sua marca. A colecta directa pode ser: contı́nua(
registros de nascimentos, óbitos,casamentos,etc.), periódica( recenseamento
demográfico, censo industrial) e ocasional( registo de casos de pólio).
Colecta indirecta: é feita por deduções a partir dos elementos conseguidos
pela colecta directa, por analogia, por avaliação, indı́cios ou
proporcionalização.Esses dados podem ser:
Dados primários: quando são publicados pela própria pessoa ou organização
que os haja recolhido.
Exemplo: tabelas do censo demográfico do INE.
Dados secundários: quando são publicados por outras organizações.
Exemplo: quando determinado jornal publica estatı́sticas referentes ao censo
demográficos extraı́dos do INE.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
21 / 127 I
Crı́tica dos dados:a crı́tica dos dados deve ser feita com cuidado através de
um trabalho de revisão e correcção, ao qual chamamos de
crı́tica(consistência), a fim de não incorrer em erros que possam afectar de
maneira sensı́vel os resultados.
Quelet dividiu a crı́tica em:externa e interna.
Apuração dos dados: resumo dos dados através de sua contagem e
agrupamento.É a condensação e tabulação dos dados.
Apresentação: há duas formas de apresentação que não se excluem
mutuamente. A apresentação tabular, ou seja, é uma apresentação
numérica de dados em linhas e colunas distribuı́das de modo ordenado,
segundo regras fixadas pelo controle nacional de estatı́stica e apresentação
gráfica dos dados numéricos que constitui uma apresentação geométrica
permitindo uma visão rápida e clara do fenómeno.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
21 / 127 I
Análise e interpretação dos dados: A última fase é mais importante e
delicada.Está ligada essencialmente ao cálculo das medidas e coeficientes,
cuja finalidade principal é descrever o fenómeno( estatı́stica descritiva).Na
estatı́stica indutiva a interpretação dos dados se fundamentam na teoria da
probabilidade.

Séries estatı́sticas
Série estatı́stica: é toda tabela que apresenta a distribuição de um conjunto
de dados estatı́sticos em função da época, do local, ou da
espécie(fenómeno).
Numa série estatı́stica observa-se a existência de três elementos ou factores:
o tempo, o espaço e a espécie.
Conforme varie um desses elementos, a série estatı́stica classifica-se em
temporal, geográfica e especı́fica.
Série temporal, histórica ou cronológica: é a série cujos dados estão em
correspondência com o tempo, ou seja, variam com o tempo.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
22 / 127 I
Exemplo:

Preço do artigo ”Y ” no atacado na cidade ”X ”

ANOS PRECO M É DIO EM KWANZAS


2003 100
2004 150
2005 200
2006 250
2007 300

Fonte: Dados Fictı́cios

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
23 / 127 I
Série geográfica, territorial ou de localidade: é a série cujos dados estão em
correspondência com a região geográfica, ou seja, o elemento variável e o
factor geográfico(região).
Exemplo:

Número de Assaltos na cidade ”X ” em 2006

REGI ÃO N ÚMERO DE ASSALTOS


Centro 74
Zona Sul 54
Zona Norte 31
Zona Leste 29
Zona Oeste 44

Fonte: Dados Fictı́cios

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
24 / 127 I
Série especı́fica ou categórica: é a série cujos dados estão em
correspondência com a espécie, ou seja,variam com o fenómeno.
Exemplo:

Número de Candidatos ao preparatório da Universidade ”X ”

ÁREA OFERTADA N ÚMERO DE CANDIDATOS


Ci ências Sociais Aplicadas 2086
Ci ências Exactas 1065
Ci ências Humanas 1874
Ci ências Biol ógicas 1102
Ci ências Tecnol ógicas 1902

Fonte: Dados Fictı́cios

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
25 / 127 I
Série mistas: as combinações entre as séries anteriores constituem novas
séries que são denominadas séries compostas ou mistas e são apresentadas
em tabelas de dupla entrada.
Exemplo:

Número de Alunos Matriculados nas Escolas Particulares ao preparatório da


Cidade ”X ”

BAIRROS 2005 2006 2007


BAIRRO − A 2894 3454 2989
BAIRRO − B 7075 9876 6543
BAIRRO − C 1099 3218 2100
BAIRRO − D 4333 3455 3543
BAIRRO − E 2976 1765 4098

Fonte: Dados Fictı́cios

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
26 / 127 I
Distribuição de frequências
Dados brutos: são aqueles que não foram numericamente organizados,ou
seja,estão na forma com que foram colectados.
Exemplo: Número de filhos de um grupo de 50 casais

2 3 0 2 1 1 1 3 2 5
6 1 1 4 0 1 5 6 0 2
1 4 1 3 1 7 6 2 0 1
3 1 3 5 7 1 3 1 1 0
3 0 4 1 2 2 1 2 3 2

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
27 / 127 I
Rol:é a organização dos dados brutos em ordem de grandeza crescente ou
decrescente.
Exemplo: Número de filhos de um grupo de 50 casais

0 0 0 0 0 0 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 3 3 4
4 4 5 5 5 6 6 6 7 7

Dá-se o nome de distribuição de frequência ao conjunto de todos os valores


de uma variável estatı́stica com as correspondentes frequências. Podemos
distinguir dois tipos de distribuição de frequências:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
28 / 127 I
De valores da variável agrupados:Utilizam-se as distribuições de valores da
variável agrupados quando o número de valores que toma a variável é
pequeno.O procedimento está indicado principalmente para variáveis
discretas.A construção da respectiva distribuição de frequências é
equivalente a construção de uma tabela, onde se listam os diferentes valores
observados da variável, com as seguintes frequências:
Frequência absoluta(ni ):número de vezes que um acontecimento é
observado(ou se repete) dentro de um determinado tipo de observações.
frequência relactiva(fi ):percentagem em que se verificam os valores da
variável.Trata-se da razão entre o número de ocorrências do
acontecimento(ni = Frequência absoluta) é o número total de observações n.
Frequência absoluta acumulada(Ni ): Estas frequências são obtidas
somando-se a frequência absoluta do valor considerado, às frequências
absolutas anteriores a este mesmo valor.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
29 / 127 I
Frequência relactiva acumulada(Fi ):obtidas somando-se a frequência
relactiva do valor considerado, às frequências relactivas anteriores a este
mesmo valor.
De acordo com o exposto, o quadro de frequências para uma distribuição de
valores agrupados apresenta o seguinte aspecto:

xi ni fi Ni Fi
n1
x1 n1 n N1 = n1 F 1 = f1
n2
x2 n2 n N1 + n2 F 1 + f2
.. .. .. .. ..
. . . . .
nk
xk nk n n 1
Total n 1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
30 / 127 I
Exemplo:Consideremos uma amostra constituı́da pelo número de irmãos de
22 Alunos da Universidade Jean Piaget de Angola:

1222623222131212212210

Neste caso os dados são de natureza discreta, com um número pequeno de


valores distintos, condensam-se então numa tabela da forma:
xi ni fi Ni Fi
0 1 0, 05 1 0, 05
1 6 0, 27 7 0, 32
2 12 0, 54 19 0, 86
3 2 0, 09 21 0, 95
6 1 0, 05 22 1
Total 22 1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
31 / 127 I
De valores da variável agrupados em intervalos de classe: Empregam-se as
distribuições de valores da variável agrupados em intervalos de classe
quando número de valores assumidos pela variável é grande ou quando se
trata de variáveis contı́nuas.
Nesse caso devemos considerar outros elementos e conceitos além dos
mencionados anteriormente.
Construção de intervalos
Nomenclatura:
K: número de classes
-Deve depender do número n de observações efectuadas;
-Não deve ser inferior a 5 ou superior a 15;
-Iremos usar as seguintes regras para determinar K:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
32 / 127 I

Para n ≤ 25 → K = 5 e para n > 25 → k = n(critério da raiz), para
amostras de pequena dimensão.
K=1+3,3log(n) Regra ou fórmula de Sturges ( para amostras
grandes).
2k ≥ n Regra da potência.
R:amplitude amostral( diferença entre a maior e a menor observação)

R = xn:n − x1:n
h:amplitude de cada classe

R
h=
K
yi : ponto médio da classe i

linf + lsup
yi =
2
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
33 / 127 I
Portanto, o quadro de frequências para uma distribuição deste tipo
apresenta o seguinte aspecto:

Classes Yi ni fi Ni Fi
n1
[l1 ; l2 [ Y1 n1 n N 1 = n1 F1 = f1
n2
[l2 ; l3 [ Y2 n2 n N 1 + n2 F1 + f2
.. .. .. .. .. ..
. . . . . .
nk
[lk ; lk+1 [ Yk nk n n 1
Total n 1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
34 / 127 I
Exemplo: Os valores a seguir correspondem as notas de 40 pessoas numa
prova de concurso público, obtenha uma distribuição de frequências:

Neste caso os dados são de natureza discreta mas com um número grande
de observações representativas assim, vamos representar os dados numa
tabela com intervalos de classes:

Definição de classes
Determinar o número (k=?) de classes:
Aplicando a regra de sturges→ k = 1 + 3, 3log (40) = 6, 287 → k ' 6

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
35 / 127 I
Determinar a amplitude da amostra, isto é, a diferença entre o valor
máximo e o valor mı́nimo.

R = 98 − 70 = 28

Dividir essa amplitude pelo valor k; tomar para essa amplitude de classe h
um valor aproximado por excesso do valor anteriormente obtido:
28
h= '5
6
Construir as classes, de modo que tenham todas a mesma amplitude e cuja
união contenha todos os elementos da amostra:
C1 = [70, 75[ ; C2 = [75, 80[ ; C3 = [80, 85[ ; C4 = [85, 90[ ;
C5 = [90, 95[ ; C6 = [95, 100[.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
36 / 127 I
Contagem do número de elemento de cada classe: Conta-se o número de
elementos da amostra que pertencem a cada classe.Analogamente ao que
foi considerado no caso dos dados discretos, esses valores serão as
frequências absolutas das classes.

Classes Yi ni fi Ni Fi
[70; 75[ 72, 5 6 0, 15 6 0, 15
[75; 80[ 77, 5 9 0, 225 15 0, 375
[80; 85[ 82, 5 11 0, 275 26 0, 65
[85; 90[ 87, 5 9 0, 225 35 0, 875
[90; 95[ 92, 5 3 0, 075 38 0, 95
[95; 100[ 97, 5 2 0, 05 40 1
Total 40 1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
37 / 127 I
Análise gráfica
Um Gráfico é um recurso visual da estatı́stica utilizado para representar um
fenómeno.A sua utilização em larga escala nos meios de comunicação
social,técnica e cientı́fica, devem-se tanto a sua capacidade de refectir
padrões gerais e particulares do conjunto de dados em observação como à
facilidade de interpretação e eficiência com que resume a informação dos
mesmos.
Embora os gráficos fornecem menor grau de detalhes que as tabelas, estes
apresentam um ganho na compreensão global dos dados, permitindo que se
aperceba imediatamente da sua forma geral sem deixar de evidenciar alguns
aspectos particulares que sejam do interesse do pesquisador.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
38 / 127 I
Os gráficos mais utilizados para representar os dados são:
Gráfico circular- dados qualitativos;
Gráfico de barras- dados qualitativos ou quantitativos discretos;
Gráfico de frequências acumuladas-dados qualitativos na escala ordinal
ou quantitativos discretos;
Histograma- dados quantitativos contı́nuos;
Polı́gono de frequências- dados quantitativos;
Polı́gono de frequências acumuladas-dados quantitativos contı́nuos.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
39 / 127 I
Gráfico em sectores:é a representação gráfica de uma série estatı́stica em
cı́rculo de raio qualquer,por meio de sectores com ângulos centrais
proporcionais às ocorrências.
É utilizado quando se pretende comparar cada valor da série com o total.
O total da série corresponde a 360◦ .O gráfico em sectores representam
valores absolutos ou percentagens complementares.
As séries geográficas, especificas e categóricas em nı́vel nominal são mais
representadas em gráficos de sectores, desde que não apresentem muitas
parcelas( no máximo sete).Cada parcela componente do total será expressa
em graus, calculada através de uma regra de três:
Total − 360◦
Parte − x ◦

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
40 / 127 I
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
41 / 127 I
Gráfico de Barras:neste gráfico a altura de cada barra traduz o valor da
frequência(absoluto ou relactiva) respeitante a cada valor da variável. No
eixo horizontal assinalam-se os valores possı́veis da variável, no vertical, as
frequências absolutas ou relactivas.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
42 / 127 I
Gráfico de frequências acumuladas: é a representação gráfica de frequências
acumuladas(absolutas ou relactivas) correspondente à variável em estudo

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
43 / 127 I
Histograma: é um gráfico de colunas justapostas que representa uma
distribuição de frequência para dados contı́nuos ou uma variável discreta
quando ela apresentar muitos valores distintos. No eixo horizontal são
dispostos os limites das classes segundo os quais os dados foram agrupados,
enquanto que o eixo vertical coresponde às frequências absolutas ou
relactivas das mesmas.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
44 / 127 I
Polı́gono de frequência é um gráfico de linha cuja construção e feita
unindo-se os pontos de coordenadas de abcissas correspondentes aos pontos
médios de cada classe e as ordenadas, às frequências absolutas ou relactivas
dessas mesmas classes.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
45 / 127 I
Polı́gono de frequências acumuladas um polı́gono de frequências,ou polı́gono
integral: é um gráfico de linhas onde são representadas frequências
absolutas, Ni , ou relactivas, Fi , acumuladas. A frequência acumulada para
valores inferiores ao limite inferior da primeira classe e nula. A frequência
acumulada para para valores superiores ao limite superior da última classe e
n,se forem representadas as frequências Ni , ou 1, se forem representadas as
frequências Fi .

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
46 / 127 I
Percentagem(%): é a razão cujo denominador é igual a 100. Ela representa
uma comparação de uma parte com um todo.

Transformação de um número decimal em percentagem

Para transformar um número decimal em percentagem multiplica-se por 100.


Exemplo:
1 0, 4 = 0, 4 × 100 = 40%.
2 0, 25 = 0, 25 × 100 = 25%.

Transformação de uma percentagem em um número decimal

Transforma-se a percentagem em fracção decimal e em seguida em número


decimal.
Exemplo:
40
1 40% = 100 = 0, 4.
75
2 75% = 100 = 0, 75.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
47 / 127 I
Cálculo da percentagem de um número

Multiplica-se o número, pela percentagem transformada em um número


decimal.
Exemplo 1: Calcula: 15% de 50 kwanzas. 50 × 0, 15 = 7, 50 kwanzas.
Exemplo 2: A turma do joão tem 25 Alunos. Sabendo 17 Alunos tiraram
positiva em Estatı́stica, qual foi a percentagem de negativas?
x: Percentagem dos Alunos que tiraram positiva em Estatı́stica.
y:Percentagem dos Alunos que tiraram negativa em Estatı́stica.

25 − − − − − − − − − 100%

17 − − − − − − − − − x
=⇒ x = 68%.
Logo, a percentagem dos Alunos que tiraram negativa é:
y = (100 − x)% = (100 − 68)% = 32%.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
48 / 127 I
Arredondamentos

O termo algarismos significativos refere-se ao número de algarismos


necessários para expressar o valor de uma medida experimental sem perda
de exactidão.
Como fazer arredondamento?
Para fazer o arredondamento atendendo o número de casas decimais, faz-se:

1 Se a casa decimal imediatamente a seguir à escolhida for > 5,


aumenta-se uma unidade à casa decimal escolhida.Exemplo: 7, 26
arredondar a uma casa decimal 7, 3.
2 Se a casa decimal imediatamente a seguir à escolhida for < 5, deixa
inalterável à casa decimal escolhida. Exemplo: 7, 24 arredondar a uma
casa decimal 7, 2.
3 Se a casa decimal imediatamente à seguir a escolhida for igual a 5,
existem 3 possibilidades:
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
49 / 127 I
Se a casa escolhida for par, mantém-se inalterada a casa escolhida.
Exemplo:7, 250 arredondando a uma casa decimal fica, 7, 2.
Se a casa escolhida for ı́mpar, aumenta-se uma unidade à casa decimal
escolhida.
Exemplo: 7, 350 arredondando a uma casa decimal fica:7, 4.
Se o próximo algarismo que se segue ao 5 for diferente de 0,
aumenta-se uma unidade à casa decimal escolhida.
Exemplo:7, 251 arredondando a uma casa decimal fica:7, 3.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
49 / 127 I
Medidas descritivas

Uma maneira de se resumir os dados de uma variável quantitativa, além de


tabelas e gráficos, é apresentá-los em forma de valores numéricos,
denominados medidas descritivas. Estas medidas se calculadas a partir de
dados populacionais, são denominadas parâmetros e se calculadas a partir
de dados amostrais são denominadas estimadores ou estatı́sticas. As
medidas descritivas auxiliam a análise do comportamento dos dados.

Propriedades das medidas descritivas

Objectividade;
Dependência de todas as observações;
Significado bem preciso para sua interpretação;
Facilidade de cálculo.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
50 / 127 I
Medidas de Localização
Essas medidas são assim denominadas por indicarem um ponto em torno do
qual se concentram os dados, ou ainda para determinar como determinado
valor se posiciona em relação aos restantes.Elas podem ser: de tendência
central(média, mediana e moda) e de tendência não
central(quantis(quartis,decis e percentis)).
Dados não agrupados
Média(X ): é a soma de todos os valores observados dividida pelo número
de observações. É a medida de localização mais utilizada.
n
1X x1 + x2 + x3 + · · · + xn
X = Xi =
n n
i=1
(média amostral)
n
1X x1 + x2 + x3 + · · · + xn
µ= Xi =
n n
i=1
(média populacional)
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
51 / 127 I
Caracterı́sticas da média

Fornece um número abstracto, o qual poderá não ser comum a


nenhuma observação;
É uma medida influenciada por todos os valores observados. Qualquer
alteração num deles produz alterações no valor da média;
Pode ser grandemente afectada por extremos, especialmente quando a
dimensão da amostra é reduzida. Pode portanto,em alguns casos,
fornecer uma imagem distorcida dos dados, não sendo a medida mais
adequada para os descrever;
Quando os dados são homogéneos é a melhor medida descritiva de
localização;
É a medida de tendência central mais eficiente, quando se pretende
fazer inferência estatı́stica.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
52 / 127 I
Exemplo: Se os dados são 2, 6, 11, 8, 11, 4, 7, 5. Então :
2 + 6 + 11 + 8 + 11 + 4 + 7 + 5
X = = 6, 75
8
Desvio em relação a média(di ): é a diferença entre cada elemento de um
conjunto de valores e a média aritmética.

di = Xi − X
, onde xi é um elemento do conjunto de valores.
Exemplo: Sabendo-se que a produção leiteira diária da Vaca Mimosa,
durante uma semana, foi de 10, 14, 13, 15, 16, 18, 12 litros, temos, para a
produção média semanal:
10 + 14 + 13 + 15 + 16 + 18 + 12
= 14
7
Logo, X = 14litros.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
53 / 127 I
Os desvios em relação à media são dados por:
d1 = x1 − X = 10 − 14 = −4;
d2 = x2 − X = 14 − 14 = 0;
d3 = 13 − 14 = −1;
d4 = 15 − 14 = 1;
d5 = 16 − 14 = 2;
d6 = 18 − 14 = 4;
d7 = 12 − 14 = −2.
A soma dos desvios dos números de um conjunto a contar da média é zero.
Por isso, no exemplo anterior, temos: −4 − 1 + 2 − 2 + 0 + 1 + 4 = 0.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
54 / 127 I
Propriedades da média aritmética

A média aritmética tem certas propriedades interessantes e úteis, que


explicam por que é ela a medida de tendência central mais usada:
1 A média aritmética de um conjunto de números pode ser sempre

calculada.
2 Para um dado conjunto de números a média aritmética e única.

3 A média é sensı́vel a ( ou afectada por) todos os valores do conjunto.

Assim, se um valor se modifica, a média também se modifica.


Exemplo: A média dos números 1, 2, 2, 3, 4 e dada por:
1+2+2+3+4
= 2, 4
5
Se alterarmos o conjunto para 1, 2, 3, 3, 4 a média passa a ser dada por
1+2+3+3+4
= 2, 6
5
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
55 / 127 I
4) Somando-se( ou subtraindo-se) uma constante(c) de todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuı́da) dessa
constante. Simbolicamente se,

yi = xi ± c

então:
y = x ± c.
Exemplo:Somando-se 2 litros de leite a cada produção diária da Mimosa
tem-se:

y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 14

Daı́:
12 + 16 + 15 + 17 + 18 + 20 + 14
y= = 16
7
Lembrando que a média anterior era x = 14., temos que:

y = 16 = 14 + 2 = x + 2
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
56 / 127 I
5)Multiplicando-se( ou dividindo-se) uma constante (c) de todos o valores
de uma variável, a média do conjunto fica multiplicada(ou dividida) dessa
constante.
Simbolicamente se,
yi = xi × c
então:
y =x ×c
.
Exemplo: Multiplicando-se por 3 cada produção diária da Mimosa temos
que:
y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54, y7 = 36
Daı́:
30 + 42 + 39 + 45 + 48 + 54 + 36
= 42
7
Lembrando que a média anterior era:
y = 42 = 14 × 3 = x × 3
.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
57 / 127 I
Média aritmética ponderada(Xp ):é uma média aritmética na qual será
atribuı́do um peso a cada valor da série.
n
X
Xi .p
i=1
Xp = n
X
pi
i=1

Exemplo: em uma faculdade a média semestral de cada disciplina é


calculada considerando as duas médias bimestrais com peso 3 cada uma e
um exame final com peso 4. Se um Aluno obtém 8, 0 no 1o bimestre, 9, 0
no 2o e 9, 6 no exame final de Estatı́stica, qual será a sua média semestral
em estatı́stica?
O cálculo da média aritmética deve levar em conta os pesos desiguais das
notas. Assim, para esse Aluno temos:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
58 / 127 I
Avaliação Notas Peso
1o Bimestre 8, 0 3
2o Bimestre 9, 0 3
Exame final 9, 6 4
Total − 10

Logo:
3(8, 0) + 3(9, 0) + 4(9, 6)
Xp = = 8, 94
10
Isto é, a média semestral desse aluno em Estatı́stica é 8, 94.
Média Geométrica: sejam x1 , x2 , · · · xn os valores observados, tem-se:

G= n
x1 .x2 · · · xn

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
59 / 127 I
Média Harmónica:ao inverso da média aritmética dos inversos dos valores da
variável dá-se o nome de Harmónica.
n n
H= 1 1 1
= n
x1 + x2 + ··· + xn
X 1
xi
i=1

Média quadrática:Consideremos os valores observados:x1 , x2 , · · · , xn .A


média quadrática é a raiz quadrática da média aritmética dos quadrados da
variável.
Deste modo, temos:
v
u n
uX
r u xi2
2 2 2
u
x1 + x2 + · · · + xn t i=1
Q= =
n n

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
60 / 127 I
Mediana(Me ):é um valor que separa a série em duas partes de igual número
de termos de tal maneira que, num dos grupos fiquem termos inferiores a
mediana e noutro os termos superiores.

Processo para determinar a mediana

1 Ordenar os valores;
2 Se o número de dados é ı́mpar, a mediana é o valor que está no centro
da série;
3 Se o número de dados é par, a mediana é a média dos dois valores que
estão no centro da série.
(
X n+1 se n impar ;
2
Me = X n +X n +1
2
2
2
se n par .

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
61 / 127 I
Exemplo: Calcule a mediana de cada uma das seguintes distribuições:
1 3, 9, 5, 7, 9, 1, 9;
2 42, 3, 9, 5, 7, 9, 1, 9.

Resolução

1.1. Ordenação:1, 3, 5, 7, 9, 9, 9.
1.2. Cálculo da ordem do elemento central: porque n = 7 é ı́mpar então:

Me = X n+1 = X 7+1 = X 8 = X4 = 7
2 2 2

2.1. Ordenação:1, 3, 5, 7, 9, 9, 9, 42.


2.2. Cálculo da ordem do elemento central: porque n = 8 é par então:

X n2 + X n2 +1 X 8 + X 8 +1 X4 + X5 7+9 16
2 2
Me = = = = = =8
2 2 2 2 2

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
62 / 127 I
Caracterı́sticas da mediana

É fácil de calcular e compreender;


É determinada pelo número de observações e não pelo seu valor. Deste
modo os valores extremos, quer sejam grandes ou pequenos, não
afectam o seu valor;
É uma boa medida descritiva quando existam valores extremos;
Para fins de inferência estatı́stica não satisfaz as propriedades de um
bom estimador.
Moda(M0 ): é o valor de um conjunto de dados que surge com maior
frequência se os dados são discretos, ou o intervalo de classe com
maior frequência se os dados são contı́nuos.
Exemplo: Para o conjunto de dados: 8 12 12 11 9 6 11 12 13 14, a
moda é M0 = 12.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
63 / 127 I
Quanto a moda uma distribuição estatı́stica pode ser:
1 Amodal: é toda distribuição que não tem moda;
2 Unimodal: é toda distribuição que tem uma só moda;
3 Plurimodal: é a distribuição que tem mais do que uma moda.

Caracterı́sticas da Moda

É fácil de calcular e interpretar e não é afectada por valores extremos;


Não existe em algumas distribuições enquanto que em outras poderá
existir mais do que uma moda. Neste caso a distribuição diz-se
multimodal(bimodal,trimodal,etc);
É especialmente útil para reduzir a informação de conjuntos de dados
qualitativos;
É em geral menos utilizada que a média e a mediana.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
64 / 127 I
Dados agrupados(caso Discreto)
K= no de observações representativas.
k
X
1
Média(X ) = n xi × ni (amostral)
i=1
k
X
1
Média(µ) = n xi × ni (populacional)
i=1
Para calcular a média dos dados apresentados em tabelas e não agrupados
em classes deve-se multiplicar os valores da variável pela respectiva
frequência absoluta e somam-se os produtos dividindo-se o total pelo
número da amostra.
Exemplo:Calcular a média dos dados apresentados na tabela abaixo:
xi 0 2 5 8 9 11 13
ni 15 25 7 12 32 10 9
De acordo, com os dados da tabela tem-se:
0.15 + 2.25 + 5.7 + 8.12 + 9.32 + 11.10 + 13.9 696
X = = = 6, 3
110 110
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
65 / 127 I
Mediana(Me ): Para calcular a mediana deve-se ordenar em ordem crescente
os dados da variável e acumulá-los.Se o número for par utiliza-se a fórmula
n
+ n2 +1
 
da mediana par Me = 2
2 .Se o número for ı́mpar utiliza-se a
n+1

fórmula: Me = 2
Exemplo 1: Determinar o valor da mediana da tabela abaixo:

xi ni Ni
1 3 3
2 5 8
3 12 20
4 7 27
5 3 30
Total 30 −
n
+ n2 +1 15+16 31
De acordo com a tabela acima tem-se: Me = 2
2 = 2 = 2 = 15, 5.
Logo: Me = 15, 5; Me = 3.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
66 / 127 I
Exemplo 2: Determinar o valor da mediana da tabela abaixo:

xi ni Ni
1 3 3
2 5 8
3 2 10
4 18 28
5 3 31
Total 31 −
n+1 31+1
De acordo com a tabela acima tem-se: Me = 2 = 2 = 16. Logo:

Me = 16, 5; Me = 4.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
67 / 127 I
Moda(M0 ): O apuramento da moda é imediato, pois consiste simplesmente
na verificação do valor da variável em estudo que mais se repete.
Exemplo: Dada a seguinte distribuição estatı́stica :

xi 1 2 3 4 5
ni 10 12 12 8 4

Identifique a sua moda.


Com base nos dados da tabela, tem-se: M0 = 2 e M0 = 3.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
68 / 127 I
Dados agrupados(caso contı́nuo)
k
X
li +ls
Média(X ) = n1 yi × ni =, onde yi = 2 (amostral).
i=1
k
X
1 li +ls
Média(µ) = n yi × ni =, onde yi = 2 (Populacional).
i=1
Para determinar a média dessa distribuição deve-se registrar os dados numa
tabela complementar na qual dever-se-à determinar o ponto médio de cada
classe que corresponderá ao valor da variável o qual deverá ser multiplicado
pela frequência cujo total deverá ser dividido pela amostra.
Exemplo: De acordo com a tabela abaixo, calcula a média:

Classes ni
[0; 5[ 50
[5; 10[ 120
[10; 15[ 42
Total 212

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
69 / 127 I
De acordo com a tabela acima, tem-se:
Classes ni yi yi .ni
[0; 5[ 50 2, 5 125
[5; 10[ 120 7, 5 900
[10; 15[ 42 12, 5 525
Total 212 − 1550
1550
Portanto:X = 212 = 7, 3.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
70 / 127 I
Mediana(Me ): Para a identificação da classe onde se acha a mediana
dever-se-á considerar aquela que corresponda a frequência acumulada
imediatamente superior a metade das observações efectuadas.
Me = n2 -Identificação da classe mediana.
Dentro da classe mediana o valor da mediana pode ser obtido utilizando a
formula: n
− Ni
Me = L + 2 × h,
nicm
onde:
L: limite inferior da classe mediana;
n:número de observações;
Ni :frequência acumulada até a classe anterior a classe mediana;
h: amplitude da classe;
nicm :frequência absoluta da classe mediana.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
71 / 127 I
Exemplo: Dada a seguinte tabela de frequências que corresponde as alturas
dos alunos de uma turma:
Classes ni Ni
[1, 55; 1, 60[ 5 5
[1, 60; 1, 65[ 11 16
[1, 65; 170[ 23 39
[1, 70; 175[ 8 47
[1, 75; 180[ 3 50
Total 50 −
De acordo com a tabela tem-se:
n
= 25
2
e a classe média é:
[1, 65; 1, 70[
n
2 − Ni 25 − 16
Me = L + × h = 1, 65 + × 0, 05 = 1, 67.
nicm 23
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
72 / 127 I
Moda(M0 ):Quando a distribuição estiver agrupada em classe não se indicam
os valores da moda mas sim a classe modal. Determina-se a moda
aplicando a fórmula:
n1
M0 = L + × h,
n1 + n2
onde:
L:limite inferior da classe modal;
n1 :diferença entre a frequência da classe modal e a frequência da classe
anterior à da classe modal;
n2 :diferença entre a frequência da classe modal e a frequência da classe
posterior à da classe modal e h:amplitude da classe.
Exemplo: Dada a distribuição estatı́stica de dados agrupados em classe,
determina a classe modal:
Classes ni
[1; 5[ 10
[5; 9[ 5
[9; 13[ 15
[13; 17[ 12
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
73 / 127 I
O intervalo que contém a moda é aquele com a maior frequência absoluta.
Neste exemplo seria a classe 3. Portanto:
n1 15 − 5
M0 = L + ×h =9+ ×4 ' 12, 08.
n1 + n2 (15 − 5) + (15 − 12)

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
74 / 127 I
Comparação entre a média, mediana e moda

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
75 / 127 I
Medidas de tendêcia não central ou medidas de posição

As medidas de tendência não central fornecem localizações especiais dos


valores das variáveis. Em termos gerais são chamados Quantis e podem ser:
Quartis,decis e percentis. Os mais utilizados são os quartis.
Quartis: é uma medida de posição que divide a série estatı́stica em quatro
partes. Existem três quartis: q1 , q2 e q3 .
Primeiro Quartil(q1 ): A esquerda de q1 estão aproximadamente 25% dos
dados e a sua direita aproximadamente 75%.
Segundo Quartil(q2 ): assim como a mediana, divide o grupo de dados em
duas partes, cada uma com aproximadamente de 50% dos dados.q2 = Me.
Terceiro Quartil(q3 ): a esquerda de q3 estão aproximadamente75% dos
dados e a sua direita aproximadamente 25%.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
76 / 127 I
Dados não agrupados
Exemplo 1: Consideremos a série estatı́stica:1, 4, 5, 6, 8, 9, 11, 14, 15, 18, 29 e
determine os Quartis.
Começamos por determinar a mediana que é igual ao 2o quartil.
A série estatı́stica tem um número ı́mpar de termos,logo: Me = Q2 = 9.
A partir da mediana a série fica dividida em duas semi-séries.
1 1, 4, 5, 6, 8;
2 11, 14, 15, 18, 20.
As medianas destas semi-séries são respectivamente iguais a 5 e a 15.E, por
isso temos :
q1 = 5; q3 = 15.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
77 / 127 I
Exemplo 2: Consideremos a série estatı́stica:

1; 2; 4; 6; 7; 9; 12; 14; 15; 16; 20 e 24.

Determine os quartis.
A série estatı́stica tem um número par de termos,por isso:

9 + 12
Me = = 10, 5 = q2 .
2

A mediana divide a série estatı́stica em duas semi-séries:


1 1, 2, 4, 6, 7 e 9);
2 12, 14, 15, 18, 20 e 24.
As medianas respectivas são:
4+6 15 + 18
= 5 = q1 e = 16, 5 = q3 .
2 2

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
78 / 127 I
Dados agrupados:tratando-se de dados agrupados, obtém-se os quartis
através da fórmula:
c n − Ni
qc = L + 4 ×h
nicm
, onde:
c = 1 ⇒ q1 ; c = 2 ⇒ q2 ; c = 3 ⇒ q3
Na tabela abaixo indicam-se os salários, em milhares de escudos, dos
empregados, de uma empresa.

Salários em milhares de escudos(x) Número de empregados


[10; 30[ 4
[30; 50[ 16
[50; 70[ 84
[70; 90[ 156
[90; 110[ 24
[110; 130[ 10
[130; 150[ 6

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
79 / 127 I
Determine o 1o , 2o e 3o quartis.
Sabe-se que:
n
4 − Ni
q1 = L + × h;
nicm
2n
4 − Ni
q2 = L + × h;
nicm
3n
4 − Ni
q3 = L + × h.
nicm

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
80 / 127 I
Vamos calcular as frequências acumuladas:

Salários Número de empregados(ni ) Acumuladas(Ni )


[10; 30[ 4 4
[30; 50[ 16 20
[50; 70[ 84 104
[70; 90[ 156 260
[90; 110[ 24 284
[110; 130[ 10 294
[130; 150[ 6 300
Total 300 −

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
81 / 127 I
1 Cálculo de q1 : para calcularmos q1 é porque n4 = 75, o intervalo
correspondente a esta frequência acumulada é [50; 70[.
Assim: L = 50;
Ni = 20 (frequência acumulada anterior ao intervalo [50; 70[);
nicm = 20 (frequência do intervalo [50; 70[);
h = 20 (amplitude do intervalo);
q1 = 50 + 75−20
84 × 20 = 63, 09.
2 cálculo de q2 :
Porque: 2n4 = 150,então o intervalo correspondente é :[70; 90[.
L = 70; Ni = 104; nicm = 156; h = 20;
q2 = 70 + 150−104
156 × 20 = 70 + 5, 9 = 75, 9.
3 cálculo de q3 :
Porque: 3n4 = 225, o intervalo correspondente é: [70; 90[.
L = 70;Ni = 104; nicm = 156; h = 20;
q3 = 70 + 225−104
156 × 20 = 70 + 15, 50 = 85, 5.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
82 / 127 I
Interpretação do resultado:

Há 75 empregados (25%) com salários até 63090$00;

Há 150 empregados (50%) com salários até 75900$00;

Há 75 empregados (25%) com salários até 85500$00.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
83 / 127 I
Decis e Percentis
Decil:é uma medida de posição que divide a série estatı́stica em dez partes
iguais.
Percentil:é uma medida de posição que divide a série estatı́stica em cem
partes iguais. Se se tratar de dados não agrupados, procede-se como para
os quartis.
Normalmente os decis e os percentis só têm interesse para um grande
número de valores, isto é, para dados agrupados.
A expressão que nos dá os decis é análoga a dos quartis.
n
c 10 − Ni
Dc = L + × h,
nicm
c = 1, 2, · · · , 9.
Para os percentis temos:
n
c 100 − Ni
Pc = L + × h,
nicm
c = 1, 2, · · · , 99.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
84 / 127 I
Com os dados do problema anterior, calcule D1 ; D8 ; P6 e P98 .
Cálculo de D1 :
n
10 − Ni
D1 = L + ×h
nicm
n
Como 10 = 300
10 = 30, o intervalo correspondente a esta frequência
acumulada é :[50; 70[;
Ni = 20 (frequência acumulada anterior ao intervalo [50; 70[);
nicm = 84( frequência do intervalo [50; 70[);
h = 20 (amplitude do intervalo);
D1 = 50 + 30−20
84 × 20 = 52, 38.
Cálculo de D8 :

Como 8n10 = 240, o intervalo corresponde a esta frequência acumulada é o


intervalo [70; 90[.
Ni = 104; nicm = 156; h = 20;
D8 = 70 + 240−104
156 × 20 = 70 + 17, 43 = 87, 43.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
85 / 127 I
Cálculo de P6 :

6n
Como 100 = 6×300
100 = 18, o intervalo a que corresponde esta frequência
acumulada é o intervalo [30; 50[;
L = 30; Ni = 4; nicm = 16; h = 20;
P6 = 30 + 18−4
16 × 20 = 30 + 17, 5 = 47, 5.

Cálculo de P98 :

Como 98n100 = 294, o intervalo a que corresponde esta frequência acumulada


é o intervalo [110; 130[.
Assim:
L = 110; Ni = 284; nicm = 10; h = 20;
P98 = 110 + 294−284
10 × 20 = 110 + 20 = 130.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
86 / 127 I
Interpretação dos resultados :

D1 = 52, 38- Há 10% dos empregados, isto é, 30 (10% de 300), com
salários até 52380$00;

D8 = 87, 43−Há 80% de empregados, isto é, 240 com salários até
87430$00;

P6 = 47, 50− Há 6% de empregados, isto é, 18, com salários até 47500$00;

P98 = 130−Há 98% de empregados, isto é, 294 empregados, com salários
até 130000$00.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
87 / 127 I
Medidas de dispersão

As medidas de dispersão auxiliam as medidas de localização a descrever o


conjunto de dados adequadamente.Indicam se os dados estão, ou não,
próximos uns dos outros. As quatro medidas de dispersão que serão
definidas a seguir são:Amplitude total, amplitude interquartil variância e
desvio padrão.
Amplitude total(AT ):Diferença entre o maior e o menor valor.

AT = Xmax − Xmin

Amplitude interquartil(dq):é a diferença entre o terceiro e o primeiro quartil.


É mais estável que a amplitude total por não considerar os valores mais
extremos. Esta medida abrange 50% dos dados e é útil para detectar valores
discrepantes.
dq = q3 − q1 .

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
88 / 127 I
Considere a série seguinte:

1; 2; 4; 5; 6; 7; 8; 9; 10; 11; 14; 16; 17; 18 e 20.

Determine a amplitude e o interquartil.


A série está ordenada e tem número ı́mpar de termos 15.
A mediana divide a série em duas semi-séries.
Na primeira:1; 2; 4; 5; 6; 7 e 8, o termo médio que representa o primeiro
quartil é o q1 = 5.
Na segunda:10, 11, 14, 16, 17, 18, 20, o termo que representa o terceiro
quartil é q3 = 16. Deste modo tem-se:
1 AT = Xmax − Xmin = 20 − 1 = 19;
2 dq = q3 − q1 = 16 − 5 = 11.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
89 / 127 I
Desvio absoluto médio(d):é a média dos desvios absolutos em relação à
média amostral. Calcula-se pela seguinte fórmula:
n
1X
d= ni |xi − x|
n
i=1

Variância
Defini-se a variância e representa-se por s 2 , como sendo a medida que se
obtém somando os quadrados dos desvios das observações da amostra,
relactivamente a sua média e dividindo pelo número de observações da
amostra menos um. As expressões para o cálculo das variâncias
populacional e amostral são apresentadas a seguir:
Dados não agrupados
n
X
σ 2 = n1 (xi − µ)2 (Populacional)
i=1
n n
X 1 X 2
s2 = 1
n−1 (xi − x)2 = (xi − nx 2 ).(amostral)
n−1
i=1 i=1
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
90 / 127 I
Dados agrupados
k
X
σ 2 = n1 (xi − µ)2 × ni (Populacional)
i=1
k
X
s2 = 1
n−1 (xi − x)2 × ni (amostral)
i=1
Exemplo: Calcular o desvio médio da série A: {9, 7, 6, 1, 12}. Começaremos
por calcular o valor da média:
9 + 7 + 6 + 1 + 12
X = = 7.
5
E, por isso, tem-se:

|9 − 7| + |7 − 7| + |6 − 7| + |1 − 7| + |12 − 7| 2+1+6+5
d= = = 2.8.
5 5
O valor encontrado para o desvio médio da série A foi igual a 2.8.Isso
significa que os dados se afastam em média 2.8 da média aritmética da série
analisada.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
91 / 127 I
Desvio√padrão amostral(s):é√a raiz quadrada positiva da variância.
s = + s 2 (amostral)e σ = σ 2 (populacional).
O desvio padrão amostral informa-nos sobre a dispersão dos valores
observados relactivamente à sua média. Quanto maior for a dispersão ,
tanto maior será o desvio padrão.Se não existir dispersão,isto é, se todos os
valores forem iguais ( e consequentemente, iguais a média), então o desvio
padrão é nulo.
A variância e o desvio padrão são as medidas de variabilidade mais usadas
em análise estatı́stica.Uma das suas principais caracterı́sticas importantes é
que têm em consideração todos os valores observados.O desvio padrão
indica a proximidade com que os valores estão agrupados ao redor da
média.Um valor pequeno do desvio padrão significa que as observações
estão pouco espalhadas à volta da média.A variância é o quadrado do
desvio padrão.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
92 / 127 I
Coeficiente de variação(cv ): é o quociente entre a variância e o módulo da
média.
s
cv =
|x|
ou em percentagem,
s
cv = × 100%
|x|

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
93 / 127 I
Exemplo: A seguinte tabela de frequências contém os dados do número de
artigos vendidos por certo armazém em 50 dias, agrupados em 6 classes.

Classes Yi ni fi Ni Fi
[10; 20[ 15 2 0.04 2 0, 04
[20; 30[ 25 10 0.2 12 0.24
[30; 40[ 35 12 0.24 24 0.48
[40; 50[ 45 14 0.28 38 0.76
[50; 60[ 55 9 0.18 47 0.94
[60; 70[ 65 3 0.06 50 1
Total − 50 1 − −

Calcule a variância.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
94 / 127 I
A média é X = 40, 4.Logo, a variância será:
n
1 X
s2 = ni (xi − x)2 = 164, 12
n−1
i=1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
95 / 127 I
Medidas de assimetria e Curtose

As medidas de assimetria e curtose, assim como as medidas de tendência


central e as medidas de dispersão, auxiliam para a descrição e compreensão
de distribuição de frequência e são úteis para comparar a forma das
distribuições das variáveis em análise.

Momentos

São medidas descritivas de carácter mais geral dão origem às demais
medidas descritivas, como as de tendência central, dispersão, assimetria e
de curtose. Conforme a potência considerada tem-se a ordem ou o grau do
momento calculado.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
96 / 127 I
Momentos simples ou centrados na origem (mr )

O momento simples de ordem ”r”é definido como:


n
X
mr = n1 Xir (Dados em bruto);
i=1
k
X
mr = 1
n Xir ni (Dados em distribuição de frequência), onde:
i=1
r é um numero inteiro positivo;
m0 = 1;
m1 = média aritmética.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
97 / 127 I
Momentos centrados na média (Mr )

O momento de ordem ”r”centrado na média, é definido como:


n
X
1
Mr = n (Xi − X )r (Dados em bruto);
i=1
k
X
Mr = 1
n (Xi − X )r ni (Dados em distribuição de frequência), onde:
i=1
r é um numero inteiro positivo;
M0 = 1;
M1 = 0;
M2 = Variancia(s 2 ).

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
98 / 127 I
Momentos abstratos (αr )

São definidos da seguinte forma:


Mr
αr = ,
sr
onde: s = desvio padrão.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais e de
Humanas
2021 Estatı́stica
99 / 127 I
Medidas de assimetria

As medidas de assimetria são expressas em coeficientes, que permitem


analisar a forma da distribuição de frequência dos dados, calculados com
base nas relações entre as medidas de moda, média, mediana e demais
separatrizes e o desvio padrão. Assim, pelas medidas de assimetria ou
também de forma gráfica, pode-se concluir se a distribuição é simétrica,
assimétrica à direita ou assimétrica à esquerda.
Uma distribuição com classes é simétrica quando: Média= Mediana=
Moda.
Uma distribuição com classes é Assimétrica à esquerda ou negativa
quando: Média< Mediana< Moda.
Uma distribuição com classes é Assimétrica à direita ou positiva
quando: Média> Mediana> Moda.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
100 / 127 I
Coeficiente de Assimetria

O coeficiente de assimetria permite comparar duas ou mais distribuições


diferentes e avaliar qual delas é mais assimétrica.Quanto maior for o
coeficiente de assimetria mais assimétrica é a curva.
Dependendo das informações de que se dispõe, pode-se calcular de quatro
formas o coeficiente de assimetria:coeficiente de Pearson ”A”, coeficiente de
Pearson ”B”, coeficiente de Bowley e coeficiente de Kelley.
Quando se dispõe de valores da media e do desvio-padrão,pode-se calcular o
coeficiente de assimetria de duas formas:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
101 / 127 I
1a forma: Coeficiente de Pearson ”A”: Para cálculo desse coeficiente,
usa-se a seguinte fórmula:

3(X − Med)
AMed = .
s
Após o cálculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
AMed = 0; a distribuição é simétrica.
AMed > 0; a distribuição é assimétrica positiva.
AMed < 0; a distribuição é assimétrica negativa.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
102 / 127 I
2a forma: Coeficiente de Pearson ”B”: Para calculo desse coeficiente,
usa-se a seguinte formula:

X − Mod
AMod = .
s
Após o calculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
AMod = 0; a distribuição é simétrica.
AMod > 0; a distribuição é assimétrica positiva.
AMod < 0; a distribuição é assimétrica negativa.
Quando não se dispõe os valores calculados da media e do desvio padrão,
mas têm-se os dados dos quartis, utiliza-se a forma a seguir.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
103 / 127 I
3a forma: Coeficiente de Assimetria de Bowley ou Coeficiente Quartı́lico de
Assimetria: Para cálculo desse coeficiente, usa-se a seguinte fórmula:
q3 + q1 − 2Med
Aq = .
q3 − q1
Após o cálculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
Aq = 0; a distribuição é simétrica.
Aq > 0; a distribuição é assimétrica positiva.
Aq < 0; a distribuição é assimétrica negativa.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
104 / 127 I
4a forma: Coeficiente de Assimetria de Kelley ou Coeficiente de Assimetria
dos Centis: Para cálculo desse coeficiente, usa-se a seguinte fórmula:
c90 + c10 − 2Med
Ac =
c90 − c10
Após o cálculo do coeficiente deve-se analisar o resultado encontrado,
considerando a seguinte convenção:
Ac = 0; a distribuição é simétrica.
Ac > 0; a distribuição é assimétrica positiva.
Ac < 0; a distribuição é assimétrica negativa.
Coeficiente momento de assimetria(α3 ): é o terceiro momento abstrato.

M3
αr = ,
s3

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
105 / 127 I
O campo de variação do coeficiente de assimetria é:−1 ≤ α3 ≤ +1.
Intensidade de assimetria:
|α3 | < 0.2 ⇒ Simetria;
0.2 < |α3 | < 1.0 ⇒ Assimetria fraca;
|α3 | > 1.0 ⇒ Assimetria forte.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
106 / 127 I
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
107 / 127 I
Medidas de Curtose

Entende-se por curtose o grau de achatamento de uma distribuição, em


comparação com uma distribuição padrão. Com referência ao grau de
achatamento de uma curva, pode-se ter três tipos de curva:mesocúrtica,
leptocúrtica e platicúrtica.
A curva mesocúrtica é a curva básica que apresenta um grau de
achatamento padrão equivalente ao da curva normal.
já a curva leptocúrtica apresenta um alto grau de afilamento, superior ao
normal, sendo uma curva mais fechada ou empinada.
Por outro lado, a curva platicúrtica apresenta um alto grau de achatamento,
superior ao normal, sendo mais aberta.
Para medir o grau de curtose utiliza-se a seguinte fórmula para calcular o
coeficiente de curtose:
q3 − q1
K=
2(C90 − C10 )
.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
108 / 127 I
Com o valor calculado pela fórmula de Assimetria acima,conclui-se sobre a
realidade de curtose de seguinte forma:
Se K = 0, 263, a curva corresponde a uma distribuição de frequência
mesocúrtica;
Se K > 0, 263, a curva corresponde a uma distribuição de frequência
platicúrtica;
Se K < 0, 263, a curva corresponde a uma distribuição de frequência
leptocúrtica ;

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
109 / 127 I
Coeficiente momento de curtose(α4 ):corresponde ao momento abstrato de
quarta ordem.
M4
α4 = 4 ,
s
onde: M4 = momento centrado de quarta ordem.
Interpretação:
Se α4 < 3 ⇒ curva Platicúrtica;
Se α4 = 3 ⇒ curva Mesoticúrtica;
Se α4 > 3 ⇒ curva Leptocúrtica.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
110 / 127 I
Amostras Bivariadas

É comum estudar amostras com dados que medem duas caracterı́sticas


e nos interessa determinar se existe alguma relação entre as duas
variáveis.
para visualizar a relação entre os dados de uma amostra bivariada é útil
fazer a representação gráfica do chamado diagrama de dispersão.
Exemplo: A seguir apresentamos uma amostra com a classificação( em
percentagem) e 10 estudantes na 1a e 2a frequência na disciplina de
Estatı́stica I.
1a Freq 60 74 66 34 60 66 57 71 39 57
2a Freq 72 82 75 46 73 74 70 82 60 61

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
111 / 127 I
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
112 / 127 I
Se utiliza o termo correlação para descrever entre os dados de amostras
bivariadas. A seguir apreciamos a correlação entre duas variáveis a partir
dos gráficos:

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
113 / 127 I
Coeficiente de correlação linear: serve para quantificar o grau de correlação
linear entre as variáveis.
É uma medida adimensional útil para comparar variáveis com unidades de
medida diferentes.
n n
1X 1X
X = Xi ; y= Yi
n n
i=1 i=1
n n
! !
1 X 1 X
Sx2 = xi2 − nx 2 ; Sy2 = yi2 − ny 2
n−1 n−1
i=1 i=1
n
!
2 1 X
SXY = xi yi − nxy , onde :
n−1
i=1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
114 / 127 I
X,Y- São variáveis amostrais.
n-Tamanho da amostra.
x y -Médias amostrais das variáveis X,Y, respectivamente.
SX , SY -Desvios padrões amostrais das variáveis X,Y, respectivamente.
SXY - covariância amostral.
Definição ( coeficiente de correlação de Pearson(r)): mede o grau de
associação linear entre x e y(amostra bivariada quantitativa) e é dado por:

SXY
r= , −1 ≤ r ≤ 1.
SX SY

Se r é um valor próximo de 1, então X e Y têm uma correlação linear


positiva forte.
Se r é um valor próximo de −1, então X e Y têm uma correlação linear
negativa forte.
Se r é um valor próximo de 0, então X e Y não estão correlacionadas
ou têm uma correlação muito fraca.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
115 / 127 I
Matriz de Variâncias e Covariâncias
 2 
SX SXY
[SXi Xj ] = ,
SYX SY2
onde SXY = SYX .

Matriz de correlação
 
1 r
[rij ] =
r 1

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
116 / 127 I
A classificaçao ( em percentagem )de 10 estudantes na 1a e 2a frequencias
na disciplina de Estatistica I vem dada pela tabela abaixo. Determine o
coeficiente de correlaçao linear, a matriz de Variâncias e Covariâncias e a
matriz de correlação.
1a Freq 60 74 66 34 60 66 57 71 39 57
2a Freq 72 82 75 46 73 74 70 82 60 61

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
117 / 127 I
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
118 / 127 I
Análise Combinatória

Análise combinatória é a parte da Matemática que estuda os processos de


contagem.Ela surgiu da necessidade de se calcular o número de
possibilidades que podem ocorrer em uma certa experiência, sem precisar
descrever cada uma dessas possibilidades.
A análise combinatória é também um suporte da teoria das probabilidades,
auxilia na contagem do número de casos favoráveis e do número de casos
possı́veis.

Princı́pio fundamental da contagem ou princı́pio multiplicativo

Este princı́pio consiste em multiplicar o número de possibilidades de cada


etapa da experiência.Se determinado acontecimento ocorre em n etapas
diferentes, e se cada etapa ocorre de k formas diferentes, então o número
total de maneiras de ocorrer o acontecimento é: T = k1 × k2 × · · · × kn .

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
119 / 127 I
Exemplo: Quantos números de três algarismos podemos formar com os
algarismos 1, 2, 3, 4, 5, 6, 7, 8 e; 9 com e sem reposição?
Resolução
1 Com reposição: denotamos por ,

k1 − 1a etapa; k2 − 2a etapa e k3 − 3a etapa.


Pelo PFC, tem-se: T = k1 × k2 × k3 = 9 × 9 × 9 = 729 números.
2 Sem reposição: T = k × k × k = 9 × 8 × 7 = 504 números.
1 2 3
Portanto, podemos formar 729 números de 3 algarismos sem reposição
e 504 números com reposição.

Factorial

Def: são produtos de factores naturais sucessivos em que os factores


chegam até a unidade e são indicados por um ponto de exclamação(!), logo
após o número. Simbolicamente, tem-se:

n! = n × (n − 1) × (n − 2) × · · · × 2 × 1, se n > 0.

Por convenção 0! = 1.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
120 / 127 I
Exemplos:
1 5! = 5 × 4 × 3 × 2 × 1 = 120;
7! 7×6×5!
2
5! = 5! = 7 × 6 = 42.

Agrupamentos

Def: é um grupo de grupos, ou seja, é a união de dois ou mais grupos.


Existem dois tipos de agrupamentos.
1 Agrupamento em que a ordem dos elementos é importante e são
chamados arranjos ou permutações.
2 Agrupamento em que a ordem dos elementos não é importante e são
chamados de combinações.
Os arranjos podem ser simples ou completos( com repetição).

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
121 / 127 I
Arranjos simples
Def:são agrupamentos que diferem entre si ao mudarmos a ordem dos seus
elementos.
Para arranjos de n elementos, tomados p a p(p ≤ n), tem-se:

n!
An,p =
(n − p)!
, onde:
n- número total de elementos;
p- número de elementos de cada arranjo;
An,p - número de arranjo de n elementos tomados p a p.
Exemplo: quantos números de 3 algarismos podemos escrever com os
números 1, 2, 3, 4 e 5 sem repetição? Resolução:
Temos que formar arranjos do tipo 123, 321, 213, etc
n! 5!
An,p = =⇒ A5,3 = = 60
(n − p)! (5 − 3)!
Portanto, podemos escrever 60 números de 3 algarismos distintos.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
122 / 127 I
Arranjos completos ou com repetição

Def:é um grupo de p elementos de um dado conjunto, com n elementos


distintos, onde a mudança de ordem determina grupos diferentes, podendo
|
porém ter elementos repetidos. Indicamos o arranjo com repetição por An,p .
No arranjo com repetição, temos todos os elementos do conjunto a
disposição a cada escolha, por isso, pelo PFC, temos:
|
An,p = np
A permutação pode ser simples ou com repetição.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
123 / 127 I
Permutação simples

Def: são arranjos ode participam todos os elementos do conjunto.Desta


forma, temos:
Pn = n!
, onde pn é o número total de permutações simples de n elementos distintos.
Exemplo: quantos números de 3 algarismos podemos escrever com os
algarismos 3, 4 e 5, sem repetição?
Resolução:
Observe que em cada agrupamento participam todos os números por
exemplo, um dos números é 543.
pn = n! =⇒ p3 = 3! = 6
Portanto, podemos escrever 6 números de 3 algarismos.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
124 / 127 I
Permutação com repetição

O número de n objectos dos quais n1 são iguais, n2 são iguais · · · nk são


iguais é:

(n1 ,n2 ,··· ,nk ) n!


pn =
n1 !n2 ! · · · nk !
, com n1 + n2 + · · · + nr = n.
Exemplo 1: quantos são os anagramas do nome Marina?
Resolução:
Temos: n = 6 e n1 = 2.
(n ,n ,··· ,nk )
pn 1 2 = n1 !n2n!!···nk ! =⇒ pnn1 = nn!1 ! =⇒ p62 = 6!
2! = 360 anagramas.

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
125 / 127 I
Exemplo 2: Dada a palavra Escola:
1 quantos são os seus anagramas?
2 quantos anagramas começam com E e terminam com A?
Resolução:
1 Anagramas é cada uma das permutações das letras de uma
palavra.Como a palavra escola tem 6 letras então, o número de
anagramas será: p6 = 6! = 720.
2 E A
Fixando as letras E e A, podemos permutar as outras 4 letras entre E e
A, isto é, p4 = 4! = 24.
No caso da permutação com repetição existe um caso especial, a
permutação circular.
O número de permutações de n objectos diferentes arranjados em cı́rculo
é:

Pcn = (n − 1)!

Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências


10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
126 / 127 I
Combinação simples

Def: combinação de n elementos p a p são o número de subconjuntos de p


elementos que se pode formar com os elementos do conjunto.
n!
Cn,p =
p!(n − p)!
5! 5!
Exemplo 1: C5,2 = 2!(5−2)! = 2!3! = 35;
Exemplo 2: Quantas comissões de 3 pessoas podemos formar com um
grupo de 7 pessoas?
Resolução:
Podemos combinar, as 7 pessoas 3 em 3, isto é:

7! 7!
C7,3 = = = 35
3!(7 − 3)! 3!4!
.
Alfredo Universidade Jean Piaget de AngolaFaculdade de Ciências
10 de Outubro
Sociais edeHumanas
2021 Estatı́stica
127 / 127 I

Você também pode gostar