Você está na página 1de 150

Um Ensaio Sobre a Estatística Descritiva

1ª edição Kindle
Copyright © Setembro 2017 por Marcello Praça Gomes da Silva.

Engenheiro. Físico. Matemático.


Especialista em Regulação de Serviços Públicos de
Telecomunicações.
MBA em Gerência de Telecomunicações.
MBA em Gestão de Tecnologia da Informação e Negócios Virtuais.
Especialização em Docência Superior.
Especialização em Projeto e Gerência de Redes de Computadores.
Especialização em Gestão Estratégica.
Especialização em Planejamento e Educação Ambiental.

Ilustrações feitas pelo autor.


Revisão técnica, gramatical e estilística feitas pelo autor.

Palavras-Chave:
Álgebra, Conjuntos, Dados, Distribuições, Frequência, Histograma.

Key Words:
Algebra, Data, Distributions, Frequency, Histogram, Sets.

Áreas de Interesse:
Análise de Erros, Big Data, Estatística Descritiva, Matemática,
Metrologia.

Fields of Interest:
Big Data, Descriptive Statistics, Error Analysis, Mathematics,
Metrology.

Direitos autorais:
Todos os direitos reservados. Nenhuma parte desta publicação, em
parte ou no todo, pode ser reproduzida e disseminada, em qualquer
forma ou por qualquer meio, sejam eles impressos, eletrônicos,
mecânicos, fotocópias e outros que existam ou venham a existir,
sem haver prévia permissão por escrito do autor e da editora.
Normas para uso de conteúdo:
A informação contida neste e-book só poderá ser utilizada para fins
terceiros com a devida autorização por escrito do autor e da editora.
Malgrado todas as precauções terem sido tomadas no preparo
deste material, o autor e a presente editora não se responsabilizam
pelos danos, perdas ou procedimentos que possam ser causados,
direta ou indiretamente, pela informação contida nesta obra.
Índice

Lista de Figuras e Tabelas

Pensamentos

Dedicatórias

Agradecimentos

Prefácio

Cap. 01 O Que É Estatística?

Cap. 02 O Que É Estatística Descritiva?

Cap. 03 Conceitos Fundamentais

Cap. 04 Levantamentos Estatísticos

Cap. 05 A Matemática dos Levantamentos

Cap. 06 Exercícios

Cap. 07 Abusos e Maus Usos da Estatística

Bibliografia Recomendada

Símbolos, Abreviaturas e Siglas

Estrangeirismos Comentados

Obras do Autor
Lista de Figuras e Tabelas

Divisões da Estatística ( I )

Divisões da Estatística ( II )

Conjunto População e Subconjunto Amostra

Histograma

Histograma Tridimensional

Polígono de Frequências

Ogiva de Galton

Funções no Graphmatica

Tabela 1: NCA por Sturges

Tabela 2: NCA pela Raiz Quadrada


Pensamentos

É necessário cuidar da ética para não anestesiarmos nossa


consciência e começarmos a achar que tudo é normal.
(Mario Sergio Cortella apud CONSELHOS PARA CONSELHOS,
2014, página 32).

Conselhos para Conselhos. 52 Mensagens de Notáveis para


Inspirar o Conselho e Diretoria da sua Empresa. Paulo
Vasconcellos, Júlio Miranda e Augusto Carneiro (organizadores).
Belo Horizonte, 2014. 64 pág.

Em virtude da atualidade e importância deste pensamento, sempre


renovado pelos novos escândalos de corrupção que aparecem
nestas terras tupiniquins, fiz absoluta questão de inserí-lo
novamente (antes ele já havia sido usado no livro sobre médias
heronianas).

O autor.
Dedicatórias

Ao meu neto e minha filha.


À Bibi, Polar e Smilo.
Ao meu pai e minha mãe (in memoriam).
Ao meu padrinho e madrinha (in memoriam).
À Sleepy e Shalissa (in memoriam).

Ainda que muitos pensem que possa ser algo trivial, dedicar um livro
a alguém é uma coisa de muita responsabilidade.

O autor.
Agradecimentos

Agradeço a todos aqueles que comigo estiveram enquanto este livro


era escrito e revisado: Bibi, Polar e Smilo. Sleepy e Shalissa em
espírito. Companheiros caninos inseparáveis em todos os
momentos, sejam eles bons ou maus. Esses sim são verdadeiros e
eternos amigos. Devo muito a todos eles. Que sejam ricamente
abençoados nesta vida e também no porvir.

O autor.
Prefácio

Este é um livro introdutório e sucinto sobre alguns aspectos da


Estatística Descritiva. Não é, e nem pretende ser, um livro exaustivo
sobre o tema.
É importante ressaltar que não serão vistos assuntos que,
normalmente, são cobertos nesta disciplina, como as medidas de
dispersão, de assimetria, de curtose e de posicionamento. Todos
eles serão vistos detalhadamente em obras específicas, com os
devidos aprofundamentos. A parte de médias, por exemplo, está
sendo tratada em uma série própria (três volumes já foram
publicados até esta data, a saber: média aritmética, média
geométrica e média heroniana). Outros mais virão em breve (como
o que será dedicado ao valor eficaz ou média RMS, Root Mean
Square).
Contudo, a visão aqui mostrada contempla uma farta base
conceitual para dar o devido suporte aos estudos mais avançados
que virão. A Matemática usada é básica e está no nível de um bom
Ensino Médio. É importante ter algum conhecimento elementar de
planilhas eletrônicas (funções, geração de gráficos) para poder fazer
determinados exercícios numéricos. Exercícios literais de
demonstração também foram propostos (e resolvidos) e servem
para dar um maior aprofundamento e solidez ao tema (já que
somente apresentar fórmulas prontas aos alunos nunca é uma boa
metodologia de ensino, ainda que seja muito frequente nas salas de
aula).
Há um capítulo específico com alguns exercícios propostos e
suas respectivas respostas, sendo que um deles demanda o uso de
um CAD matemático para ser feito. Não apenas são dadas as
respostas, mas também são feitos comentários e explicações. As
abundantes notas de fim detalham muitos conceitos.
Esta obra pode ser usada como complemento aos textos
tradicionais e na preparação para concursos, ENEM e vestibulares.
É útil como material de leitura adicional em disciplinas sobre
Estatística Descritiva no nível de graduação e especialização (em
áreas como Administração, Marketing, Contabilidade, gestão em
geral).
A gênese deste livro foi o curso de Probabilidade e Estatística
para Telecomunicações que o autor ministrou em Brasília, no ano de
2011, com 40 h (quarenta horas) nominais de duração. Teve como
público-alvo profissionais de nível superior em Ciências Exatas e/ou
com a base matemática adequada para o devido acompanhamento,
servidores públicos federais do Executivo. Apesar de não existirem
pré-requisitos formais, era desejável que os participantes tivessem
razoável desenvoltura em assuntos como álgebra básica (e.g.,
exponenciais, logaritmos, equações, inequações), matrizes e
determinantes, sequências, trigonometria plana, geometria analítica
e euclidiana (plana e espacial), números complexos, cálculo
diferencial e integral de uma ou mais variáveis, análise vetorial e
equações diferenciais ordinárias e parciais. Este curso cobriu os
seguintes assuntos: Visão das Aplicações da Probabilidade e
Processos Estocásticos, Teoria dos Conjuntos, Estatística
Descritiva, Probabilidade e Regressão Linear. Com certeza não foi
um curso elementar.
Para finalizar, é mandatório dizer que a Estatística é um dos
assuntos matemáticos mais úteis no quotidiano. O seu
desconhecimento é uma das características daquilo que se
denomina analfabetismo em Matemática. Desconhecer a Estatística
(e a Teoria das Probabilidades) em muito contribui para a existência
de tolas superstições e crendices, tão difundidas entre o populacho
ignorante[i] e em muitas pessoas que dizem ter o tal “diploma
superior”.
É certo que ela deveria ser mais bem explorada nas salas de
aula brasileiras (inclusive no ensino universitário). Lamentavelmente
não é, mas espero sinceramente que venha a ser um dia. Reformas
é que não faltam para isso (mesmo que, até o presente momento,
todas elas tenham sido não mais que medíocres). Ainda está para
vir uma reforma educacional que foque no que chamo “elogio do
mérito”, ao invés do ubíquo e deprimente “elogio da mediocridade”.
Duas palavras que começam com a letra m, mas com significados
tão diferentes.
Dito isto, vamos dar o devido início aos nossos estudos. Boa
sorte a todos.
Gratias.

Marcello Praça Gomes da Silva


Belo Horizonte, Minas Gerais, Brasil
29 de Setembro de MMXVII a.D.[ii]
Cap. 01
O Que É Estatística?

Estatística é uma ciência exata, uma subdivisão da


Matemática Aplicada, que se incumbe de:

Coletar;
Descrever;
Organizar;
Analisar; e
Interpretar

dados de origem experimental (numéricos ou não numéricos) com o


propósito de concluir afirmações ou ajudar a prever acontecimentos
futuros[iii]. Por fim, se for o caso, será possível decidir.
E o que seriam os tais dados? A palavra se origina do latim e,
de acordo com o Dicionário Priberam da Língua Portuguesa, é um
substantivo comum masculino que significa (transcrições ipsis
litteris):

- Resultado de pesquisa ou cálculo;


- Informação relativa a um indivíduo;
- Informação capaz de ser processada por um sistema informático.

Nota-se aqui algo muito comum nas definições não técnicas


(que é a confusão feita entre dado e informação). De qualquer
maneira, para os propósitos deste livro, as definições são
plenamente adequadas ao entendimento.
Em um sentido mais restrito, a palavra estatísticas (no plural)
significa os próprios dados ou os números deles derivados, como as
diferentes médias, a mediana, a moda, o desvio-padrão, os quartis,
os decis, etc.
Na referência impressa [GRANER] encontramos a seguinte
definição na página 10 (que foi aqui transcrita ipsis litteris):
Matemática aplicada aos dados de observação.

Isto é:

A observação de fenômenos[iv] gera dados.


Os dados gerados são tratados matematicamente.
Tal matemática aplicada recebe o nome de Estatística.

Ela encontra aplicação em todas (sem exceção) as áreas do


conhecimento humano, seja ele tecno-científico ou não. Vejamos
exemplos.

* Ciências Astronômicas
(v.g., Astrofísica, Astroquímica, Astrometria, Astrobiologia);

* Física
(v.g., Termologia, Eletromagnetismo, Mecânica, Óptica);

* Química
(v.g., Geral, Atomística, Inorgânica, Orgânica, Quântica);

* Ciências Biológicas
(v.g., Biologia, Ecologia, Botânica, Zoologia);

* Engenharias
(v.g., Eletrônica, Aeronáutica, Civil, Mecânica, Telecomunicações,
Nuclear);

* Ciências Médicas[v]
(v.g., Medicina, Epidemiologia, Farmacologia, Veterinária);

* Geociências
(v.g., Mineralogia, Geofísica, Geoquímica, Climatologia,
Meteorologia);

* Administração e Ciências Econômicas


(Administração de Empresas, Economia, Contabilidade);
* Ciências Humanas
(v.g., Direito[vi], Sociologia, Política, Linguística, Jornalismo,
Marketing).

Procedimentos estatísticos rudimentares já são feitos há


milhares de anos (como as menções a censos na Bíblia). Porém,
sua sistematização científica é bem recente. Alguns poucos nomes
famosos nesta área são Thomas Bayes (inferência bayesiana,
teorema de Bayes), John W. Tukey, Karl Pearson, Francis Galton,
William Gosset (mais conhecido por seu pseudônimo, Student),
Quetelet e Ronald A. Fisher. A Teoria das Probabilidades é uma
área próxima à Estatística[vii] e nos faz lembrar de grandes nomes
como Blaise Pascal, Pierre de Fermat (se lembram do Teorema de
Fermat?), Abraham de Moivre, Pierre-Simon Laplace e Kolmogorov.
Cap. 02
O Que É Estatística Descritiva?

É a subdivisão da Estatística que se incumbe de coletar,


descrever e organizar os dados.

Coleta
Descrição
Organização

E quem se incumbe dos 2 (dois) últimos verbos (analisar e


interpretar) da definição do capítulo anterior? Bem, a análise e a
interpretação são feitas pela Estatística Indutiva (ou Inferencial).
As inferências feitas sempre possuem uma incerteza
associada (que também é chamado erro) com uma dada
probabilidade. Daí a Estatística estar intimamente relacionada com a
Teoria das Probabilidades. Neste livro não trataremos da Estatística
Inferencial, mas tão somente da Descritiva.

Divisões da Estatística ( I )
Outra corrente de pensamento (que é mais antiga e hoje é
considerada obsoleta) considera que a Estatística se divide em 2
(dois) ramos, a saber: um ramo responsável por representar os
dados de origem experimental nas diferentes formas gráficas
existentes e o outro ramo responsável por toda a parte de cálculo
que for necessária (e.g., para os devidos fins de análise e
interpretação dos dados experimentais)[viii].
O primeiro desses ramos seria então denominado Estatística
Gráfica e o segundo Estatística Analítica.

Divisões da Estatística ( II )

Vejamos, agora, aquele que será nosso primeiro exercício


proposto. Não se trata de um exercício numérico, mas sim o que eu
chamo exercício do pensamento.

Exercício 01
Analise criticamente as 4 (quatro) afirmações a seguir.
1. A Estatística estuda como controlar, minimizar e observar a
variabilidade inevitável de todas as medidas e observações.

2. A Estatística possibilita obter informações confiáveis.

3. Estatística é a ciência de obter conclusões a partir de dados.

4. Sem métodos estatísticos, sem validade científica.

Atentar na análise a ser feita para as seguintes indagações:

- A variabilidade é algo inevitável ou não?


- Ela possibilita obter ou ela sempre obtém?
- Estatística é realmente considerada uma ciência? Sempre terá
sido assim?
- Há validade científica no uso dos métodos estatísticos?

Não há aqui respostas inteiramente corretas nem inteiramente


erradas (como, por sinal, quase sempre ocorre no mundo real). Há
sim respostas com maior ou menor aderência à realidade[ix]
(respostas que dependem, por exemplo, da maturidade intelectual
dos leitores)[x].

Há 5 (cinco) conceitos básicos, na verdade são conceitos


essenciais, que permeiam a Estatística, os quais são:

- População (ou Universo);


- Amostra;
- Censo e Pesquisa (Sondagem);
- Variável; e
- Intervalo.

Veremos, pois, cada um deles em detalhes no próximo


capítulo.
Cap. 03
Conceitos Fundamentais

POPULAÇÃO

Na Estatística Descritiva, população (P) é o conjunto[xi]


formado por todos os elementos que são de interesse de uma
determinada pesquisa (conceito esse que será visto posteriormente
neste capítulo) e que são possuidores, ao menos, de uma
característica em comum. Também é conhecida, às vezes, como
universo (U).
Alguns autores usam as terminologias população estatística e
universo estatístico com o mesmo significado de população e
universo.
Vejamos exemplos.

1. Se eu desejo conhecer idade, altura e peso dos moradores do


município de São Paulo, esses moradores constituem a população
ou universo do meu estudo.
OBS.: Pessoas que trabalham no município de São Paulo, mas
moram em outros municípios (como Osasco ou Santo André), não
fazem parte do conjunto universo do estudo em questão (pois não
residem no município de São Paulo, apenas ali trabalham). O
mesmo se diz de turistas.

2. Uma Faculdade de Educação Física quer saber o perfil sócio-


econômico dos alunos atualmente matriculados e daqueles que já
se formaram. Assim, os alunos que estão matriculados naquele
momento e todos os que já se formaram em tal faculdade
constituem a população ou universo do estudo em questão.
OBS.: Alunos que estão com a matrícula trancada por ocasião do
estudo não fazem parte da população que será considerada.
3. O governo brasileiro quer entrevistar (pessoalmente ou por
telefone) todos os contribuintes pessoa física que estão na alíquota
máxima do imposto de renda. Assim, tais contribuintes constituem a
população ou universo do estudo em questão.
OBS.: Pessoas físicas que estão nas demais alíquotas não fazem
parte da população que será entrevistada (ainda que paguem
imposto de renda). Da mesma forma, aqueles que não pagam
imposto de renda não serão entrevistados.

4. A diretoria de uma empresa quer conhecer o perfil familiar[xii] dos


colaboradores de tal empresa (funcionários por ela diretamente
contratados e terceirizados). Assim, as famílias de tais
colaboradores são a população do estudo em questão (já os
vizinhos não são, a não ser que também sejam colaboradores da
mesma empresa).

5. Um fabricante de chocolates (em barras, bombons) deseja


conhecer qual é o público consumidor do seu produto no Brasil.
Qual é a respectiva população? A princípio, diríamos que o universo
é a totalidade dos brasileiros (ou, melhor dizendo, daqueles que
moram no Brasil, mesmo não sendo brasileiros de nascença). No
entanto, é mandatório meditar a respeito das seguintes questões:

5.1. Será que todo brasileiro realmente consome chocolate?


Pensem a respeito da população de rua, dos que moram nos locais
mais distantes dos grandes centros urbanos e dos miseráveis.
Pensem também naqueles que têm restrições médicas ao consumo
de chocolate (por conta do açúcar ali presente).

5.2. Uma coisa é ser um consumidor eventual, outra bem diferente é


ser um consumidor frequente. Alguém muito pobre pode, por
exemplo, comer uma barra de chocolate de tal empresa pelo fato de
tê-la ganho de outra pessoa. Será que isso faz dela um consumidor
que merece ser conhecido (do ponto de vista da pesquisa que será
feita)?
5.3. É preciso saber que tipos de chocolate a empresa fabrica
(branco, ao leite, com amendoim, com passas, etc). Os produtos
almejam um público de maior renda (são produtos caros e
sofisticados) ou podem ser considerados genéricos?

É possível que uma dada população não tenha todos os seus


elementos bem conhecidos (nem mesmo se saiba a sua
cardinalidade). Por exemplo, se a população for o conjunto formado
pelos exoplanetas do nosso universo, nós não sabemos quantos
eles são e nem onde estão. Mas nem mesmo precisamos ir além do
nosso próprio planeta. Se a população for o conjunto formado pelos
grãos de areia que existem em todas as praias terrenas, a
quantidade desses grãos não é conhecida (ainda que existam
métodos que a possam estimar).
AMOSTRA

Na Estatística Descritiva chama-se amostra, simbolizada por


A ou S (do inglês sample), a um subconjunto finito de uma
população. Em termos de diagramas de Venn (ou Venn-Euler)[xiii]
temos:

Conjunto População e Subconjunto Amostra

Na notação da Teoria Matemática dos Conjuntos podemos


escrever:

Devemos ler: o conjunto A (amostra) é um subconjunto de U


(ou está contido em U). Podemos também dizer que o conjunto U
contém o conjunto A (U é superconjunto de A). Não há impedimento
formal à seguinte situação limite:

Devemos ler: o conjunto A (amostra) é igual ao conjunto U


(população). Nesse caso particular, todos os elementos do conjunto
universo U também são elementos do conjunto amostra A.
O número de elementos da amostra é chamado dimensão da
amostra ou cardinalidade da amostra e doravante será simbolizado
pela letra latina minúscula n. Pertence ao conjunto dos números
naturais excluindo o zero (não faz sentido haver uma amostra sem
elementos, isto é, de cardinalidade nula). Amostra sem elementos é
inexistência de amostra.

Se a cardinalidade do conjunto população é n(P) e a


cardinalidade do subconjunto amostra é n(A), podemos afirmar, a
partir das definições feitas, que a seguinte desigualdade é válida.

O número de elementos do conjunto amostra é menor ou igual


ao número de elementos do conjunto população (a cardinalidade do
conjunto amostra é menor ou igual à cardinalidade do conjunto
população). As cardinalidades serão iguais quando os conjuntos
forem iguais.

O conjunto amostra pode ser representativo da população ou


não. Por representatividade entendemos que as características da
população podem ser inferidas a partir do conhecimento da amostra.
Podemos ter amostras que são representativas e amostras que não
são representativas.
É possível que conclusões errôneas sejam obtidas se as
amostras não forem adequadas. Em geral, o processo de
amostragem (ou sampling) deverá atender 2 (dois) critérios, a saber:
As amostras devem ser obtidas por um processo aleatório
(randômico) e serem representativas da população.
Quando uma amostra não é obtida por um processo aleatório
ela é chamada amostra direcionada ou tendenciosa ou com viés.
Isto pode se dar por intencionalidade ou em razão da aplicação de
um método inadequado.

OBS.: É importante dizer que um subconjunto é um conjunto (da


mesma maneira, um superconjunto é um conjunto). Subconjunto e
superconjunto são termos que indicam uma relação entre dois
conjuntos (o subconjunto está contido no superconjunto; o
superconjunto contém o subconjunto).
Fiz questão de fazer este comentário pois, certa vez, um aluno
apresentou dúvidas a esse respeito. Era como se ele considerasse
conjunto, subconjunto e superconjunto 3 (três) coisas distintas.
CENSO e PESQUISA

O censo, também chamado recenseamento, é um estudo


estatístico, feito geralmente com periodicidade decenal (10 em 10
anos), em que a totalidade de uma população é considerada.

Exemplo:
Recenseamento da população de um dado país.

Dependendo da população, o censo é caro, complexo e


demanda tempo razoável para ser feito. Recensear a população
brasileira é um exemplo típico (não apenas somos mais de 200
milhões, mas estamos espalhados em um país de dimensões
continentais). Já o censo de um país como Malta (na Europa) é
muito mais fácil (o país é pequeno e sua população não é
numerosa).

A sondagem, também conhecida como pesquisa, é um


estudo estatístico em que uma amostra (uma parte) de uma certa
população é considerada.

Exemplos:
- Medir a audiência de um programa televisivo ou radiofônico
Para tal estudo não é possível analisar todos os domicílios de um
país (sem esquecer que em um mesmo domicílio podem haver
vários televisores)[xiv];

- Fazer uma pesquisa de intenção de votos ou de boca-de-urna[xv]

- Verificar a quantidade de TUPs que estão inoperantes em um


estado
Fazer um censo para tal estudo esbarra na típica falta de recursos
dos órgãos públicos (pagamento de diárias e ajudas de custo,
gastos com o transporte dos fiscais).
Qual é a razão de fazer uma sondagem se um censo daria
informações mais corretas sobre a população? Bem, como já foi dito
antes, o censo custa caro e demanda tempo para ser feito (sem
contar todas as complexidades inerentes ao processo). Fazer uma
sondagem e aplicar técnicas estatísticas inferenciais é um meio de
chegar a resultados próximos com economia de dinheiro e
tempo[xvi].
VARIÁVEL

Na Estatística Descritiva, ao se fazer uma pesquisa (ou


censo), chama-se variáveis aqueles aspectos a serem
considerados e que assumem valores dentro de um certo conjunto.
Ao conjunto de valores que podem ser assumidos pela
variável dá-se o nome de domínio da variável.
As variáveis podem ser classificadas em:

[ 1 ] Qualitativas ou Categóricas
Integram os dados ditos qualitativos ou categorizados (não
numéricos). Dividem-se em dois tipos.

1.1 Nominal
Faz-se uma classificação pura. Não há ordenamento e nem
comparação entre os valores. Exemplos:

- Grupo sanguíneo do ser humano (A, B, AB, O);


- Sexo no nascimento (masculino, feminino);
- Estado de nascença (Bahia, Paraná, Amapá, Goiás, etc);
- Nacionalidade (brasileiro, francês, etíope, japonês, polonês, etc);
- Cores usadas na pintura de um apartamento (azul celeste, cinza
claro, carmim, verde floresta, etc).

1.2 Ordinal
Faz-se uma classificação com ordenamento. Aqui ocorre uma
comparação entre os valores. Exemplos:

- Patentes do Exército (major é uma patente superior à de cabo);


- Nível de escolaridade (fundamental, médio, superior,
especialização, mestrado, doutorado, pós-doutorado);
- Notas expressas em conceitos (A+, A, A-, B, C, D, E).

[ 2 ] Quantitativas ou Numéricas
Integram os dados ditos quantitativos ou numéricos.
Ex.: Altura, peso, preço em dólares de um produto ou serviço.
Altura e peso são grandezas medidas por valores numéricos
acoplados a uma determinada unidade de medida (por exemplo,
altura de 1,75 m e peso de 43 kgf)[xvii].

As variáveis numéricas podem ser de dois tipos.

2.1 Discretas
Integram os dados ditos discretos (geralmente finitos). Com as
variáveis discretas podemos fazer uma correspondência um-a-um
com o conjunto dos números naturais (inclusive o zero). Ex.:

* Número de filhos de cada um dos funcionários de uma dada


empresa;

* Número de TUPs instalados por município de uma UF;

* Número de exoplanetas já descobertos (de acordo com a


nacionalidade dos cientistas descobridores).

Notar que, em todos esses casos, a contagem se dá por números


naturais (0, 1, 2, 3, 4, ...). Um funcionário pode não ter filhos, ter um,
dois, etc. Um município pode ter zero, um, dois, três, quatro, ...,
TUPs instalados. Os cientistas de um país podem ter descoberto
um, dois, três, quatro, cinco, etc exoplanetas ou não terem
descoberto nenhum.

2.2 Contínuas
Integram os dados ditos contínuos (são aqueles que jazem ou estão
presentes em qualquer local na reta real). Ex.:

* Peso e altura dos funcionários terceirizados de uma empresa


Em termos do peso: 45 kgf; 34,6 kgf; 83,15 kgf.
Em termos da altura: 1,76 m; 1,67 m; 1,81 m.

* Comprimento de cordões ópticos monofibra


1.800 cm; 2.100 cm; 704,5 cm.

* Nível de potência de recepção (em dBm) na interface antena-


coaxial em um rádio digital operando na faixa frequencial de 2,4
GHz.
-10 dBm; -11,5 dBm.

O fato da variável ser contínua não significa que ela possa assumir
qualquer valor na reta real (sempre costuma haver uma faixa de
validade para a variável e isso caracteriza um intervalo de valores
válidos). O mesmo é dito para as variáveis discretas. Vejamos os
seguintes exemplos.

- Não é possível uma pessoa medir 4,65 m de altura nem 12 cm de


altura;

- Um ser humano não pode pesar 700 kgf (setecentos quilogramas-


força);

- O número de estrelas no nosso universo não é nulo nem negativo;

- A temperatura ambiente na superfície do planeta Terra não pode


alcançar os 4.000 oC (quatro mil graus Celsius).

Definir o intervalo de valores válidos nem sempre é uma tarefa fácil.


Imaginem, por exemplo, a questão da altura das pessoas. Se a
pessoa mais alta que se conhece media 2,27 m poderíamos dizer
que esta é a altura máxima possível para um ser humano.
Entretanto, anos após poderíamos ter alguém medindo 2,28 m e
esta passaria a ser a pessoa mais alta que se conhece.

Exercício.
Para os exemplos a seguir, quais são os tipos de variáveis e quais
são os seus domínios de validade?

1.
BAs abertos ao longo de um mês pela prestadora A relativamente à
prestadora B.

Resp. Numérica discreta finita. O domínio é o conjunto dos números


naturais (zero BA, um BA, dois BAs, três BAs, etc). Ao final do mês
temos uma certo número finito de BAs abertos.

2.
Fabricantes e modelos de DMRs.

Resp. Qualitativa nominal. Fabricante A (modelos A1, A2, etc),


fabricante B (modelos B1, B2, etc), fabricante C (modelos C1, C2,
etc) e assim em diante até o último fabricante. Não existe ordenação
envolvendo os fabricantes e nem seus modelos.

3.
Chamadas telefônicas diárias recebidas em um centro de
atendimento de uma dada prestadora do SMP.

Resp. Numérica discreta finita. O domínio é o conjunto dos números


naturais (zero chamadas, uma chamada, duas chamadas, etc). Ao
final do dia temos um certo número finito de chamadas.

4.
Número de CDRs gerados em um dia em uma prestadora do STFC.

Resp. Numérica discreta finita. O domínio é o conjunto dos números


naturais (nenhum CDR gerado, um CDR gerado, dois CDRs
gerados, etc). Ao final do dia temos um certo número finito de CDRs
gerados.

5.
Nível de potência de recepção medido na antena de um handset
celular de terceira geração (3G).

Resp. Numérica contínua. O domínio é o conjunto dos números


reais limitado em um determinado intervalo fechado (pelo nível
mínimo de potência recebida e pelo nível máximo de potência
recebida).

6.
Amplitude da tensão elétrica de ruído térmico presente em um
resistor.

Resp. Numérica contínua. O domínio é o conjunto dos números


reais limitado em um determinado intervalo fechado (pelo nível
mínimo de tensão e pelo nível máximo de tensão).

7.
Sexo dos funcionários públicos de um dado município de uma UF.

Resp. Qualitativa nominal. Não existe ordenação envolvendo o sexo


dos funcionários.

8.
Nível de escolaridade dos servidores públicos federais do Brasil.

Resp. Qualitativa ordinal (pós-doutorado, doutorado, mestrado,


especialização, graduação, ensino médio, ensino fundamental, sem
escolaridade conhecida).
Notar que há ordenação, uma vez que o grau de doutorado é
superior ao grau de mestrado e este é superior ao grau de
especialização e por aí vai.

9.
Wattagem (ou consumo de potência) de televisores.

Resp. Numérica contínua. Os televisores possuem uma faixa de


consumo de potência que varia, principalmente, com as suas
dimensões físicas e tecnologias empregadas.

10.
Dimensões Físicas de um Equipamento (L x H x W).
Resp. Numérica contínua. Trata-se de 3 (três) comprimentos físicos:
o comprimento propriamente dito, a altura e a largura.

11.
Nacionalidade (italiano, mexicano, filipino, turco, canadense, sueco,
etc).

Resp. Qualitativa nominal. Não existe aqui nenhuma questão de


ordenamento envolvendo as diferentes nacionalidades.

12.
Altura de instalação de uma antena em uma torre (em metros).

Resp. Numérica contínua. Notar que a antena pode, a princípio, ser


instalada em qualquer altura da dita torre. A unidade usada (metros)
não altera a condição da variável. Na verdade, temos um intervalo
de validade (que é delimitado por uma altura máxima e por uma
altura mínima).

13.
Classe social (A, B, C, D, E).

Resp. Qualitativa ordinal (a classe A é mais rica que a B que, por


sua vez, é mais rica que a C e assim em diante).

14.
Número de filhos de um casal.

Resp. Numérica discreta finita (sem filhos, um filho, dois filhos, três
filhos, etc).

15.
Velocidade de um foguete (em quilômetros por segundo, km/s).

Resp. Numérica contínua. A unidade usada (quilômetros por


segundo) não altera a condição da variável. Temos aqui um intervalo
de validade (que é delimitado por uma velocidade máxima e por
uma velocidade mínima).

16.
Estado civil (casado, solteiro, separado, divorciado, viúvo).

Resp. Qualitativa nominal. Não existe aqui nenhuma questão de


ordenamento.

17.
Altitude de uma estação de radiodifusão (em pés, ft).

Resp. Numérica contínua. A unidade usada (pés) não altera a


condição da variável (poderíamos ter outras unidades como a jarda,
o metro). Temos aqui um intervalo de validade (que é delimitado por
uma altitude máxima e por uma altitude mínima).

18.
Aceleração de um carro (em metros por segundo ao quadrado,
m/s2).

Resp. Numérica contínua. A unidade usada (metros por segundo ao


quadrado) não altera a condição da variável (poderíamos ter outras
unidades como o pé por segundo ao quadrado, a jarda por segundo
ao quadrado). Temos aqui um intervalo de validade (que é
delimitado por uma aceleração máxima e por uma aceleração
mínima).

19.
Naturalidade (fluminense, mineiro, paulista, baiano, cearense, etc).

Resp. Qualitativa nominal. Não existe aqui nenhuma questão de


ordenamento envolvendo a UF na qual alguém nasceu.

20.
Potência de saída de um equipamento transmissor em VHF (em
watts, W).

Resp. Numérica contínua. A unidade usada (watts) não altera a


condição da variável (poderíamos ter outras unidades como o
cavalo-vapor, o dBm, o horsepower). Temos aqui um intervalo de
validade (que é delimitado por uma potência de saída máxima e por
uma potência de saída mínima).

21.
Pacotes entrantes diariamente em um roteador.

Resp. Numérica discreta finita (zero pacotes, um pacote, dois


pacotes, etc). Ao final do dia terão entrado X pacotes no roteador
(sendo X um número natural).

22.
Temperatura da sala de equipamentos (em graus Fahrenheit, oF).

Resp. Numérica contínua. A unidade usada (graus Fahrenheit) não


altera a condição da variável (poderíamos ter outras unidades como
o grau Celsius, o grau Rankine, o grau Reaumur). Temos aqui um
intervalo de validade (que é delimitado por uma temperatura máxima
e por uma temperatura mínima).

23.
Conceitos dos alunos em uma disciplina (A, B, C, D, E).

Resp. Qualitativa ordinal (o conceito A é superior ao B que, por sua


vez, é superior ao C e assim em diante). Os conceitos literais estão
relacionados à faixas de notas, por exemplo:

Conceito A: ( 9, 10 ]
De 9 exclusive até 10 inclusive.

Conceito B: ( 8, 9 ]
De 8 exclusive até 9 inclusive.

Conceito C: ( 7, 8 ]
De 7 exclusive até 8 inclusive.

Conceito D: ( 6, 7 ]
De 6 exclusive até 7 inclusive.

Conceito E: [ 0, 6 ]
De 0 inclusive até 6 inclusive.
INTERVALO

Na Estatística Descritiva chamamos intervalo à faixa de


valores delimitadora de uma determinada variável.
Por exemplo, o intervalo das pressões absolutas em um duto
pressurizado é de 18 a 25 psi (pounds per square inch ou libras-
força por polegada quadrada, lbf/in2), incluindo os extremos.

Temos aqui uma variável numérica contínua que jaz em um


intervalo real (o qual está contido no conjunto dos números reais)
fechado em ambas as extremidades.
Este exemplo suscita interessantes questionamentos. Qual é o
motivo da pressão estar limitada em 18 lbf/in2 e não poder alcançar,
digamos, 17,2 lbf/in2? No outro extremo do intervalo, qual é a razão
da pressão máxima ser 25 lbf/in2 e não poder alcançar, digamos,
25,5 lbf/in2? Estas questões não dizem respeito à Estatística
propriamente dita, mas sim ao fabricante do duto e/ou ao operador
do sistema. São questões de Engenharia de Tubulações. Talvez
estejamos frente a um intervalo para a operação segura da
tubulação.

E quanto às variáveis categóricas? Terão elas um intervalo


associado? Sim, com certeza terão. Vejamos, por exemplo, o caso
do conjunto dos países que são membros da Organização das
Nações Unidas (ONU). Temos aqui uma variável categórica ou
qualitativa. O conjunto é finito, sendo dado por:

F = {Brasil, México, Dinamarca, Nepal, Austrália, ..., Zâmbia}


Os 3 (três) pontinhos indicam que há outros países a serem
considerados (nem todos foram listados).
Cap. 04
Levantamentos Estatísticos

A partir daqui usaremos com frequência os conceitos da


álgebra de somatórios e produtórios .
Os seguintes conceitos são essenciais ao entendimento.

Nível de Mensuração dos Dados:


Determina em qual ‘escala’ os dados são considerados. Sendo
assim, temos 3 (três) escalas principais, a saber:

[ 1 ] Escala Nominal:
É aquela que dá nomes (daí a palavra nominal, ou seja, que
diz respeito a um nome) aos elementos para poder separá-los em
categorias distintas, por exemplo:

Equipamentos rádio:

RA (Rádio Analógico):

Monocanal

Multicanal

RD (Rádio Digital):

RDP (Rádio Digital Plesiócrono)

RDS (Rádio Digital Síncrono)

Cor do cabelo:

Preto

Castanho claro
Castanho escuro

Loiro

Grisalho

Peças fabricadas numa indústria:

PA (peça aprovada)[xviii]

PR (peça rejeitada)

[ 2 ] Escala Ordinal:
É aquela que faz uso de números com o intuito de classificar
os elementos em ordem crescente ou em ordem decrescente (pode
guardar subjetividades inerentes ou não), por exemplo:

- Opinião dos usuários sobre a prestação do SME no estado do RJ:


Péssima, Ruim, Regular, Boa, Ótima
Aqui há uma clara subjetividade nas respostas dadas. Basta haver
uma experiência ruim próxima à entrevista para a resposta tender a
péssima. Ou o contrário pode ocorrer (uma maravilhosa experiência
pode fazer a resposta tender a ótima).

- Patentes nas Forças Armadas (Exército, Marinha e Aeronáutica)


Não há subjetividade nesta situação (a patente é o que é).

[ 3 ] Escala Intervalar:
Esta escala, além de considerar a ordem, também quantifica
as diferenças numéricas entre os elementos. Vejamos alguns
exemplos.

Comprimento físico (expresso em metros, m) de bobinas de


cabos (elétricos, ópticos, coaxiais, de pares, de controle e
instrumentação).
Sejam dois cabos ópticos com comprimentos 6,0 m (seis
metros) e 10,0 m (dez metros). O segundo é mais comprido que o
primeiro e a diferença entre os dois (isto é, o maior comprimento
menos o menor comprimento) é de 4,0 m (quatro metros).

Temperaturas (expressas em graus Celsius, oC), máxima e


mínima, medidas ao longo dos dias de um mesmo ano em um dado
local (v.g., o portão principal de entrada do terreno de uma
montadora automobilística).
Seja um determinado dia do ano onde se mediu a mínima de
+18 C (dezoito graus Celsius positivos) e a máxima de +26oC (vinte
o

e seis graus Celsius positivos). A segunda temperatura é maior que


a primeira e a diferença entre elas (isto é, a maior temperatura
menos a menor temperatura) é de +8oC (oito graus Celsius).

Quantidade diária de pacotes que são descartados por um


roteador em funcionamento no campus da UFMG na Pampulha.
No dia X foram descartados 1.000 (mil) pacotes pelo roteador
e no dia X+1 foram descartados 1.100 (mil e cem) pacotes. Isto quer
dizer que no dia X+1 mais pacotes foram descartados
(precisamente foram descartados cem pacotes a mais).

Peso (expresso em quilogramas-força, kgf) das antenas


planares e paraboloidais de uma estação de telefonia móvel celular
de uma dada prestadora do SMP em uma certa cidade de uma UF.
Uma antena de 30 kgf (trinta quilogramas-força) é mais
pesada que uma outra de 5 kgf (cinco quilogramas-força), sendo
que a diferença entre elas (o maior peso menos o menor peso) é de
25 kgf (vinte e cinco quilogramas-força).
Coleta dos Dados:
É o início da aplicação do Método Estatístico. Se divide em:

[ 1 ] Direta:
É aquela cujos dados são obtidos pelo próprio pesquisador
(e.g., por meio de questionários e entrevistas; medições feitas
diretamente em pontos de medida e/ou interfaces físicas de
equipamentos[xix]). Neste caso estamos a medir diretamente (daí o
nome) aquilo que é de nosso interesse. Atuamos nas fontes
primárias.
Outro exemplo vem da literatura. Se desejarmos uma melhor
compreensão da obra de um autor, devemos ler tal obra na língua
em que originalmente foi escrita (uma vez que toda e qualquer
tradução sempre traz alguma imperfeição). Contudo, isto nem
sempre é possível (pois precisaríamos dominar tal língua e isso nem
sempre ocorre). Então, ao invés de consultar a fonte primária,
consultamos uma fonte secundária (que é a tradução) ou, até
mesmo, uma fonte terciária[xx].
Sumarizando temos:

Fonte Primária -->> Coleta Direta

Existem coletas diretas de natureza contínua (como os


levantamentos de óbitos e nascimentos, os quais sempre estão
ocorrendo), de natureza periódica (o censo decenal) e de natureza
ocasional (como a coleta de dados referentes a uma epidemia ou a
um maremoto).

[ 2 ] Indireta:
É aquela feita a partir de elementos que já são de
conhecimento prévio (por exemplo, de uma coleta direta feita
anteriormente).
Crítica dos Dados:
Visa identificar e corrigir falhas, incoerências e imperfeições
que possam influenciar negativamente os resultados pretendidos.
Sendo assim, existem, por exemplo, as críticas feitas aos
modelos de questionário que serão (ou foram) apresentados.
Observem o significado dos verbos usados:

(Futuro) Serão -- > É aquela crítica feita a priori.


(a crítica é feita antes da pesquisa ter ocorrido, o questionário ainda
será apresentado ao respondente)

(Passado) Foram --> É aquela crítica feita a posteriori.


(a crítica é feita após a pesquisa ter ocorrido, o questionário já foi
apresentado ao respondente)

Vejamos, por fim, alguns exemplos de incoerências, falhas e


imperfeições comuns nos dados coletados.

1.
Dados incompletos:
O campo onde o dado deve ser inserido foi deixado em branco (o
dado não foi inserido) ou o dado foi inserido de forma incompleta.

Profissão: “ ” (um caractere blank)


Não existe tal profissão (a não ser que o estado de desempregado
ou subempregado seja simbolizado por um blank). O campo deve
ter sido deixado em branco por esquecimento.

Nome Completo: José


Foi inserido somente o prenome da pessoa (mas deveria ter sido
inserido o nome completo).

Nome da Disciplina: Sistemas de


Está faltando uma parte do nome (Sistemas de Telecomunicações,
Sistemas de Controle, Sistemas de Informação, Sistemas de
Tratamento de Esgoto).

2.
Dados incoerentes:
A incoerência está presente no próprio dado relativamente ao seu
significado.

Salário Mensal em Reais: -2.000,00


Dado: -2.000,00 (numérico)
Significado: Salário mensal de um funcionário
Não é possível um salário ser negativo (ainda não chegamos neste
nível de escravidão).

Estado Civil: Divorciado


Dado: Divorciado (categórico)
Significado: Estado civil de uma pessoa
É incoerente pois se refere a um bebê de sete meses de idade.

Altura do prédio (metros): 4.500


Dado: 4.500 (numérico)
Significado: Altura de um prédio em relação ao solo
É incoerente pois não existe prédio com essa altura (não até o
presente momento).

Idade (anos): 370


Dado: 370 (numérico)
Significado: Idade de uma pessoa em anos
É incoerente pois se refere a um ser humano.

Estado: Texas
Dado: Texas (categórico)
Significado: Unidade da federação brasileira
É incoerente pois o Texas não é um dos estados do Brasil.

Peso (kgf): 1.000 (mil)


Dado: 1.000 (numérico)
Significado: Peso de uma pessoa em quilogramas-força
É incoerente pois se refere a um ser humano.

3.
Falta de coerência entre dois campos associados (campos
apresentam incoerência um em relação ao outro, ou seja, quando os
dois são comparados):
Notar que o campo em si não é incoerente, a incoerência surge no
relacionamento entre os diferentes campos.

Seja um registro que foi preenchido em 2017 pela própria pessoa.


Idade em Anos: 20
x
Data de Nascimento: 12/05/1969
Se a idade da pessoa é 20 anos não é possível que ela tenha
nascido no ano de 1969. Notar que 20 (vinte) anos é uma idade
compatível com o ser humano (se for tomada isoladamente). O
mesmo é dito sobre a data de nascimento (o dia, o mês e o ano são
válidos: existe o dia 12 do mês de maio e existiu o ano de 1969).

Nível de TX: 0 dBm


x
Tipo de Serviço: Radiodifusão AM
A radiodifusão AM não opera com tal nível de potência de
transmissão (zero dBm é um nível muito baixo de potência de
transmissão para uma emissora AM). Notar que zero dBm é um
nível válido de potência de transmissão (se for visto isoladamente).
O mesmo é dito sobre o tipo de serviço (a radiodifusão AM é um
serviço existente).

Modulação: 2-FSK
x
Bit Rate (Mbps): 622
O esquema de modulação 2-FSK não se presta a uma taxa de
transmissão desta magnitude (por ser ela muito elevada). Notar que
2-FSK é um esquema de modulação válido (se for visto
isoladamente). O mesmo é dito sobre a taxa de transmissão (622
Mbps é uma taxa de transmissão existente em sistemas ópticos).

4.
Arquivos idênticos com nomes diferentes:
CDR_Emp7_MG_12.03.12.xlsx
x
CDR_E07_Minas_12.3.12.xls

Notar as diferenças na referência ao estado (MG x Minas), no


formato da data (03 x 3) e no rótulo (CDR_Emp7 x CDR_E07).
É muito comum nos campos preenchidos pelos usuários (aqueles
onde se digitam os valores) haver divergências as mais diversas.
Vejamos o caso do nome da capital do estado de Minas Gerais. Uns
podem preencher “Belo Horizonte”, outros “Belo horizonte”, outros
“BH”, outros “BHE”, outros “BHZ”. Outras variantes ainda podem
estar presentes (como B. Horizonte).
Sistemas assim são mais bem projetados quando existe uma lista
de opções (no caso, cidades) e o usuário seleciona a opção
escolhida. A escolha pode se dar primeiramente na UF (no caso,
Minas Gerais) e só depois na cidade (será aberta uma listagem com
as cidades pertencentes ao estado de Minas Gerais).

5.
Arquivos diferentes com nomes idênticos:
Lrx_Rd1_Bts_BHE-105.xlsx
x
Lrx_Rd1_Bts_BHE-105.xlsx
Este último se refere, na verdade, à BTS BHE-108 (tendo ocorrido
um erro de digitação).
Ficamos com 2 (dois) arquivos com diferentes conteúdos, mas que
foram salvos com o mesmo nome (em pastas distintas, pois se
fosse na mesma pasta um deles iria sobrescrever o outro). Corrigir
este erro exigirá abrir os arquivos e conferir se os conteúdos
conferem com a BTS que consta no nome do arquivo.
Dados Brutos (raw data):
É o conjunto de valores, resultantes de uma pesquisa, que
ainda não foram devidamente organizados (por exemplo, as alturas
medidas dos alunos de uma turma).
Ver a entrada Raw Data no capítulo sobre estrangeirismos para
maiores informações.

Rol:
São os dados brutos que sofreram ordenação (seja ela
crescente ou decrescente) e geralmente com a indicação adicional
do número total de ocorrências (não obrigatório).
Vejamos o exemplo a seguir.
Temos os seguintes dados brutos levantados (é o número de
filhos de cada empregado de uma fábrica). De cara notamos que a
fábrica possui 19 (dezenove) empregados.

(4, 1, 0, 5, 2, 3, 4, 4, 5, 7, 6, 2, 1, 0, 1, 3, 2, 5, 4)

Vamos primeiramente criar um rol crescente (de zero filhos até


sete filhos).

(0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6, 7)
n = 19

Agora vamos criar um rol decrescente (de sete filhos até zero
filhos).

(7, 6, 5, 5, 5, 4, 4, 4, 4, 3, 3, 2, 2, 2, 1, 1, 1, 0, 0)
n = 19

A ordenação é uma operação que não altera o número de


elementos da distribuição.
Com essas ordenações (crescente ou decrescente) é mais fácil
elaborar estatísticas relativas à distribuição em questão.

Maior número de filhos = 7


Menor número de filhos = 0
Amplitude da distribuição (range) = 7 - 0 = 7
Número de funcionários sem filhos = 2
Número de funcionários com o maior número de filhos = 1
Número médio de filhos por funcionário:

OBS.: A média escolhida para calcular o tal “número médio de filhos”


foi a média aritmética simples (MAS). É a mais usada das médias
existentes. De qualquer forma, outra média poderia ter sido usada
(como a média harmônica).

Aqui se vê uma característica interessante da média aritmética


simples (MAS): o valor encontrado no exemplo (3,1) não pertence à
distribuição (não se tem 3,1 filhos).
Frequência de Ocorrência (de um elemento da distribuição):
É o número de vezes que cada elemento do rol se faz
presente na distribuição.
Por exemplo: se em um dado rol o número 2.048 (dois mil e
quarenta e oito) aparecer 4 (quatro) vezes, a sua frequência de
ocorrência será 4, ou seja:

f(2.048) = 4

Seja a seguinte distribuição literal das cores usadas nas


pinturas externas das 8 (oito) casas de um condomínio residencial.

Casa 1: azul
Casa 2: branco
Casa 3: preto
Casa 4: azul
Casa 5: rosa
Casa 6: verde
Casa 7: azul
Casa 8: azul

A cardinalidade desta distribuição é igual a 8 (oito).


Calculemos as frequências absolutas de ocorrência de cada cor.

f(azul) = 4 (quatro casas são pintadas em azul)


f(branco) = 1 (uma casa é pintada em branco)
f(preto) = 1 (uma casa é pintada em preto)
f(rosa) = 1 (uma casa é pintada em rosa)
f(verde) = 1 (uma casa é pintada em verde)

Notar que o somatório das frequências absolutas de


ocorrência de cada cor fornece o número total de casas da
distribuição.
f(azul) + f(branco) + f(preto) + f(rosa) + f(verde) =
= 4 +1 + 1 + 1 + 1 = 8
Tabulação dos Dados:
Após o rol, se tabula os dados em uma tabela de
frequências, subdividindo-se os dados em classes (i.e.,
agrupamentos). Neste momento se determina as frequências de
cada classe (i.e., o número de ocorrências em cada classe).
E como nós vamos determinar o número de classes que serão
usadas em uma dada tabela de frequências? Veremos no capítulo a
seguir 3 (três) possibilidades.
Cap. 05
A Matemática dos Levantamentos

Veremos, primeiramente, como proceder para determinar o


número aproximado de classes (NC) que devem ser criadas no
processo de tabulação dos dados. Serão vistos 3 (três) critérios
diferentes. Vejamos quais são eles.

[1]
Fórmula, Regra ou Critério da Raiz (Quadrada)

NC é o número aproximado de classes e n é o número de


elementos do conjunto amostra. O número aproximado de classes é
dado pela raiz quadrada da cardinalidade do conjunto amostra.
A fórmula da raiz quadrada também é condizente com uma
amostra de um único elemento (não é possível ter mais de uma
classe se a amostra for unitária). Se n for unitário teremos NC
também unitário (pois a raiz quadrada de um é igual a um).
OBS.: Alguns autores usam, com o mesmo significado, a letra k
minúscula ao invés de NC.
Exemplo: Se tivermos n igual a 900, o número de classes será
igual a 30 (trinta), uma vez que:

30 x 30 = 900

sqrt(900) = 30

Neste exemplo, o número aproximado de classes já é um valor


natural não nulo e, em razão disso, não precisará sofrer nenhum
processo ulterior de aproximação. Logo, não precisamos falar em
número aproximado de classes, mas sim em número de classes.

[2]
Fórmula, Regra ou Critério da Potência de 2

NC é o menor valor natural não nulo que satisfaz a


desigualdade e n é o número de elementos do conjunto amostra.
Dois elevado ao número de classes deve ser maior ou igual à
cardinalidade do conjunto amostra.
A fórmula da potência de 2 para n unitário fornece:

Não faz sentido ter zero classes (NC=0) para n unitário. Assim,
a escolha lógica é NC igual a 1.
Exemplo: Se tivermos n igual a 29 (vinte e nove), o número de
classes será igual a 5 (cinco), pois 2 elevado a 5 é igual a 32 (que é
o primeiro resultado maior que 29).

2E1 = 2
(ainda é menor que 29)

2E2 = 2 x 2 = 4
(ainda é menor que 29)

2E3 = 2 x 2 x 2 = 8
(ainda é menor que 29)

2E4 = 2 x 2 x 2 x 2 = 16
(ainda é menor que 29)

2E5 = 2 x 2 x 2 x 2 x 2 = 32
(é maior que 29)

[3]
Fórmula, Regra ou Critério de Sturges
(Regra do Logaritmo)

Este critério é devido a Herbert A. Sturges, tendo aparecido no


paper The Choice of a Class Interval, publicado no periódico Journal
of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926),
pp. 65-66, da ASA, American Statistical Association (ver
http://www.amstat.org/). A íntegra desse paper pode ser acessada no
web site http://www.jstor.org (um repositório de artigos tecno-
científicos).

NC é o número aproximado de classes, log10 é o logaritmo de


base dez (decimal ou vulgar) e n é o número de elementos do
conjunto amostra.
A fórmula de Sturges também é condizente com uma amostra
de um único elemento (não é possível ter mais de uma classe se a
amostra for unitária). Se n for unitário teremos NC também unitário
(pois o logaritmo decimal de 1 é igual a zero).
Relembrando o essencial dos logaritmos temos:
sendo b o logaritmando, a a base e y o logaritmo.

Mas, independentemente do critério que for adotado (da raiz,


de Sturges ou outro), o número de classes deve sempre pertencer ao
conjunto (i.e., 1, 2, 3, ...), pois não faz sentido termos zero
classes, um número negativo de classes ou ainda um número
fracionário de classes. Assim sendo, pode ser que NC deva passar
por um processo de arredondamento, resultando em um novo valor
(dito NCA ou NC arredondado).

Onde NCA é NC (ou k) após sofrer o devido processo de


arredondamento e Round é a função matemática de
arredondamento[xxi] que é aplicada ao argumento.
Vejamos, agora, alguns exemplos com o Critério de Sturges
(antes e após a aplicação da função de arredondamento). Na coluna
NC fixamos a exibição em 3 (três) casas decimais.

Tabela 1: NCA por Sturges


E agora com o Critério da Raiz Quadrada (antes e após a
aplicação da função de arredondamento) nos mesmos valores de n
da tabela anterior. Novamente, na coluna NC fixamos a exibição em 3
(três) casas decimais.

Tabela 2: NCA pela Raiz Quadrada


Pergunta-se: O que percebemos ao comparar os valores das
duas tabelas? Será que isso é sempre verdadeiro?
Dica. Para a primeira pergunta devemos comparar as duas
tabelas linha a linha. Para a segunda pergunta podemos usar um
CAD matemático e plotar gráficos das funções do critério da raiz e do
critério de Sturges.

Há quem não faça uso desses critérios para determinar o


número de classes, mas use algum método próprio. Não é algo
errado, é bom saber. De qualquer forma, é importante ter em mente
que o número de classes não deve ser excessivo.
Tendo sido determinado o número de classes (NCA), é preciso
agora determinar qual deve ser a amplitude das classes, a qual é
conhecida como intervalo de classe (é o tamanho da classe).
Chamando o intervalo de classe de h (do inglês height, altura)
temos:

Onde:

h
Intervalo de classe (amplitude da classe). É um valor real positivo;

yMAX
É o maior valor presente no rol. É um valor real (podendo ser
negativo, nulo ou positivo);

yMIN
É o menor valor presente no rol. É um valor real (podendo ser
negativo, nulo ou positivo);

NCA
NC após sofrer o processo de arredondamento pela função Round;

Delta A. Amplitude total do rol (i.e., a diferença entre o maior valor do


rol e o menor valor do rol). É uma medida da dispersão
(variabilidade) dos dados na distribuição.
Quanto maior for a amplitude total do rol, maior será a variabilidade
dos dados ali presentes (mais eles estarão dispersos). Notar que a
amplitude total do rol corresponde à amplitude total da distribuição
antes da ordenação (a operação de ordenação apenas muda a
posição dos elementos na listagem, não afetando nem a quantidade
total de elementos nem os seus valores).
OBS.:
Notar que, com esta definição, todas as classes terão a mesma
amplitude h.

É possível, embora não seja obrigatório, arredondar o valor do


intervalo de classe h. Se isso for feito teremos:

onde:

hA é h após sofrer o processo de arredondamento pela função


Round.

Dependendo do valor arredondado hA teremos um dos 3 (três)


casos a seguir:

Exemplo.

h = 10,7
hA = Round(h) = Round(10,7) = 11
Exemplo.

h=6
hA = Round(h) = Round(6) = 6

Exemplo.

h = 4,3
hA = Round(h) = Round(4,3) = 4

Para evitar que o produto seja maior ou menor que delta A,


podemos criar intervalos de classe com amplitudes intervalares
distintas, de tal forma que:

Na notação de somatórios temos:


Por fim, serão determinados os limites de cada uma das
classes, a saber: o limite superior (dito ls) e o limite inferior (dito
li). A matemática intervalar deverá ser usada nesse momento.
Modernamente, a Estatística Descritiva faz uso de uma
simbologia particular para a representação de intervalos fechados ou
abertos, a saber:

Fechado à esquerda e aberto à direita;

Aberto à esquerda e fechado à direita;

Fechado tanto à esquerda quanto à direita;

Aberto tanto à esquerda quanto à direita.

Exemplificando:

45 60
O 45 é incluído no intervalo e o 60 é excluído;

45 60
O 45 é excluído do intervalo e o 60 é incluído;

45 60
Ambos, 45 e 60, são incluídos no intervalo;
45 60
Ambos, 45 e 60, são excluídos do intervalo.

Cada classe pode ser representada por um número médio, o


qual é, geralmente, o ponto médio (pm) da classe, ou seja:

O ponto médio da classe é dado pela MAS entre o limite


superior (ls) e o limite inferior (li).
O conceito fulcral que está envolvido nesta definição de ponto
médio é equidistância. Isto é, o ponto médio equidista dos pontos
extremos do intervalo da classe. É este conceito que será usado
para demonstrar a fórmula do ponto médio.

A quantidade de valores existentes em uma dada classe


chama-se frequência absoluta ou frequência simples da classe
(fi), onde i varia desde 1 (primeira classe) até NCA.
Observar que o seguinte somatório é válido.
Ao somarmos todas as frequências absolutas temos o número
de elementos do conjunto amostra (n).
É possível calcular a frequência relativa de cada classe i (fri),
que é a razão[xxii] entre a frequência absoluta da classe i (quantos
elementos existem na classe i) e o número de elementos da amostra
(o tamanho total da amostra).

Logo, para a primeira classe temos a seguinte frequência


relativa:

Para a segunda classe temos a seguinte frequência relativa:

E assim em diante. Portanto:


Chama-se frequência relativa percentual ao valor de fri
multiplicado por 100 (cem), ou seja:

Observar que:

Agora, calcula-se a frequência acumulada (fa) de uma dada


classe como sendo a soma da frequência absoluta da classe mais as
frequências absolutas das classes anteriores (em havendo)[xxiii]. Para
a classe de número i faremos a acumulação das frequências
absolutas desde a primeira classe até a i-ésima classe.
Notar que a frequência acumulada da última classe (NCA)
valerá:

pois teremos feito a acumulação de todas as frequências absolutas.


A frequência acumulada relativa (far) de uma dada classe é a
soma da frequência relativa da classe com as frequências relativas
das classes anteriores (em havendo), ou seja:

Notar que a frequência acumulada relativa da última classe


será unitária (pois já teremos feito todos os acúmulos possíveis,
nada mais restando para ser acumulado).

Chama-se frequência acumulada relativa percentual ao


valor da frequência acumulada relativa de uma classe multiplicado
por 100 (cem). Para a i-ésima classe temos:

Observar que:
Visão Sucinta de Norma de Apresentação de Tabela Estatística

Essencialmente, uma tabela estatística é constituída dos


seguintes elementos:

Título
Identifica o fenômeno, o local e a época. O título deve ser o mais
completo possível (sem ser extenso demais). Se localiza
imediatamente antes da primeira linha da tabela.

Cabeçalhos (das colunas)


Identifica o conteúdo de cada coluna da tabela. Se houver unidade
de medida ela deve ser exibida (por exemplo, tensão elétrica em
volts). Se localiza na parte superior da tabela (na primeira linha).

Corpo
Identifica onde ficam as informações sobre o fenômeno. É composto
pelas linhas, pelas colunas e pelas células ou casas (em cada célula
deve haver apenas um único valor). A célula é dada pelo cruzamento
de uma coluna com uma linha e não pode ficar em branco.

Coluna Indicadora
É a coluna situada mais à esquerda na tabela e indica qual é o
conteúdo de cada uma das linhas.

Fonte
Identifica a origem dos valores da tabela. Por exemplo:
SAN ROMÁN, Antonio Pulido. Estadistica y Tecnicas de
Investigación Social. 4 ed. Espanha: Ediciones Pirámide, 1976, pág.
X.
Notar que a página deve ser sempre indicada (do contrário, se
quiséssemos conferir a tabela teríamos de ficar procurando por ela
ao longo do livro).

Observações ou Notas
Ao final da tabela (após a fonte) podem haver observações contendo
informações adicionais de relevância.

Temos a seguir um exemplo de tabela estatística. Os


elementos constitutivos são os seguintes:

Título: Produção Brasileira do Minério X em 2006-2011


Cabeçalhos: Ano e Produção (em quilotoneladas)[xxiv]
Coluna Indicadora: A coluna dos anos (de 2006 até 2011)
Corpo: Os anos e as correspondentes produções em kton
Fonte: Anuário Estatístico Mineral 2012

Não há observações em tal tabela. Observar que a fonte não


contempla a página (o que é uma falha).

As informações detalhadas e exaustivas sobre como as tabelas


estatísticas devem ser corretamente confeccionadas podem ser
obtidas nas duas referências a seguir.
ABNT. NBR 10520: informação e documentação: apresentação de
citações em documentos. Rio de Janeiro, 2002. 7 p.

IBGE: Normas de apresentação tabular. 3. ed. Rio de Janeiro, 1993.


61 p.
Resultados Gráficos

Finalizando a parte de levantamentos estatísticos, veremos


brevemente como apresentar os resultados graficamente. Serão
vistas 3 (três) possibilidades.

Histograma
Diagrama na forma de retângulos adjacentes. As bases de tais
retângulos jazem no eixo horizontal (sendo que o comprimento de
cada base corresponde a um intervalo de classe e cada altura
corresponde ou à frequência absoluta da classe ou à frequência
relativa da classe). Assim, a altura do retângulo e a respectiva
frequência (absoluta ou relativa) são diretamente proporcionais.
Sendo a altura de cada retângulo proporcional a sua
frequência, a área de cada retângulo também o é (uma vez que a
área de um retângulo é dada pela multiplicação do comprimento da
base pelo comprimento da altura).
O centro da base de cada retângulo corresponde ao ponto
médio da respectiva classe.
Havendo X classes haverá X retângulos no histograma.
Histogramas podem ser simétricos ou assimétricos (puxados
para a esquerda ou puxados para a direita).
Em termos de moda[xxv] podem indicar distribuições
monomodais (uma só moda), bimodais (duas modas) ou multimodais
(várias modas, de três para mais). Com os CADs estatísticos é
possível, inclusive, desenhar histogramas tridimensionais para dar
uma visualização mais estilosa.
A seguir vemos um histograma tradicional (isto é, na forma
bidimensional ou plana). O mesmo histograma na versão
tridimensional é visto logo após. Trata-se de um histograma de
alturas. Nas bases dos retângulos temos as alturas em centímetros
(cm) com os respectivos quantitativos na vertical.
Notar que a distribuição é puxada para a direita (onde está
concentrada a maior quantidade de valores).
Foram criados com o Histogram Maker Online (www.meta-
chart.com) em 26.09.17.
OBS.: Se todos os intervalos de classe forem do mesmo tamanho
(ou seja, se tiverem a mesma amplitude), todas as bases dos
retângulos terão o mesmo comprimento. Do contrário, teremos bases
com comprimentos diferentes.

Polígono de Frequência
Linha poligonal aberta que une os pares (ponto médio da
classe i, frequência da classe i).

(pm da classe 1, frequência da classe 1)


(pm da classe 2, frequência da classe 2)
(pm da classe 3, frequência da classe 3)
...
(pm da última classe, frequência da última classe)
Para fechar o “polígono” com o eixo horizontal podemos criar
uma classe fantasma inicial e uma classe fantasma final (usamos a
palavra fantasma pois tais classes inexistem na realidade). Cada
classe fantasma terá frequência nula (não existem elementos nas
classes fantasmas) e, em consequência, os retângulos
correspondentes terão alturas nulas.
A figura a seguir nos mostra um polígono frequencial fechado
com os dados à esquerda. Ele foi obtido com o Social Sciences
Statistics usando a ferramenta Frequency Polygon Maker em
26.09.17.

Ogiva de Galton
Chama-se ogiva ao gráfico das frequências acumuladas de
uma dada distribuição. As ogivas permitem obter informações
estatísticas relevantes (como, por exemplo, as separatrizes: quartis,
decis, percentis, mediana).
No eixo das abscissas (eixo XOX) temos as classes dos dados
e no eixo das ordenadas (eixo YOY) temos as frequências
acumuladas (se procura ressaltar os valores acumulados em cada
um dos limites superiores de cada classe).
A ogiva de Galton tem o formato geral de uma letra S
maiúscula.
A ilustração a seguir foi feita no Microsoft Office Standard 2010.

Ogiva de Galton

Há também outros gráficos usados na Estatística Descritiva,


como os de colunas, os de linhas, os diagramas de dispersão, os
setoriais (popularmente conhecidos como gráficos em forma de
pizza) e os diagramas de Pareto.
Cap. 06
Exercícios

Este capítulo traz diversos exercícios e as suas


correspondentes resoluções comentadas.

Exercício 1:
Tendo estudado os rudimentos de levantamentos estatísticos,
elabore a tabela final, considerando tudo aquilo que foi visto, dos
dados brutos a seguir (os quais foram levantados em uma
determinada fiscalização presencial). Não esquecer de fazer todas
as verificações que forem pertinentes.
Trata-se das idades (dadas em anos cheios[xxvi]) dos funcionários de
uma indústria.
Exercício 2:
Escrever um pseudo-código[xxvii] em português para a execução da
função Round que foi vista anteriormente no número de classes
(NCA) e no intervalo de classe (hA).
Procurar ser o mais detalhista possível na escrita deste pseudo-
código.

Exercício 3:
Provar que o ponto médio (pm) de uma classe qualquer é dado
pela expressão a seguir (onde li é o limite inferior da classe e ls é o
limite superior da mesma classe).

O conceito essencial para fazer tal demonstração é o de


equidistância.
Essa demonstração pode ser feita usando a Geometria Analítica
Plana ou o Cálculo Vetorial.

Exercício 4:
Como a fórmula de Sturges deverá ser escrita em termos de
logaritmos de base 2? Em outras palavras, quais deverão ser os
valores de k e p (duas constantes numéricas reais) na formulação a
seguir para que esta formulação corresponda à fórmula de Sturges
(sendo log2 o logaritmo de base dois)?
Generalize o exercício anterior para um logaritmo em uma base
qualquer (desde que, obviamente, seja uma base válida).

Exercício 5:
Relacionar o número aproximado de classes quando obtido pelo
critério da raiz quadrada e quando obtido pelo critério de Sturges.
Use um CAD matemático para plotar as curvas. Analise-as
(inclusive em termos da validade nos seguintes semiplanos: lateral
esquerdo, lateral direito, superior e inferior).

OBS.:
Lateral esquerdo: É o semiplano situado à esquerda do eixo das
ordenadas (eixo YOY). Todos os pontos que jazem neste semiplano
possuem abscissas negativas.

Lateral Direito: É o semiplano situado à direita do eixo das


ordenadas (eixo YOY). Todos os pontos que jazem neste semiplano
possuem abscissas positivas.

Superior: É o semiplano situado acima do eixo das abscissas (eixo


XOX). Todos os pontos que jazem neste semiplano possuem
ordenadas positivas.

Inferior: É o semiplano situado abaixo do eixo das abscissas (eixo


XOX). Todos os pontos que jazem neste semiplano possuem
ordenadas negativas.
Resoluções comentadas.

Resp. Ex. 1.
Aqui os dados brutos foram ordenados formando um rol crescente.

A partir do rol podemos facilmente calcular as diferentes grandezas


envolvidas[xxviii].

O menor valor da distribuição é igual a 21.


O maior valor da distribuição é igual a 39.
Existem 10 x 10 = 100 valores (n) na distribuição.
A amplitude At da distribuição é igual a 18 (sendo igual ao maior
valor da distribuição menos o menor valor da distribuição).

39 - 21 = 18

Por Sturges, o número teórico de classes (antes da aproximação ser


feita) é igual a 7,644. Com a devida aproximação, o número de
classes fica igual a 8 (oito).
Round (7,644) = 8

A amplitude de cada classe é igual a 2,25 (se aproximarmos teremos


2).

Eis a tabela de frequências (à esquerda os dados não estão


agrupados em classes, à direita os dados estão agrupados em
classes).
Compondo as frequências acumuladas crescentes em um gráfico
temos a correspondente Ogiva de Galton.
Notar que a ogiva começa em zero (zero por cento) e termina em
100 (cem por cento). Em zero nada ainda foi acumulado e em cem a
acumulação é total (não há mais nada para ser acumulado).
Observem como o formato da ogiva se assemelha a uma letra S
maiúscula (conforme já foi dito).
O extremo à direita da curva finda em 100 (cem), uma vez que aí a
acumulação é total (100%).
Resp. Ex. 2.
Um pseudo-código é mostrado a seguir.

valor arredondado := 0
Ler valor de entrada (teclado)
Extrair parte inteira e fracionária do valor de entrada
Se parte fracionária for menor que 0,5
Então
valor arredondado := parte inteira
Senão
valor arredondado := parte inteira + 1
Fim Do Se
Exibir valor arredondado (impressora, terminal de vídeo)

São válidos os seguintes comentários.

1. Inicialmente, a variável chamada valor arredondado recebe o valor


zero[xxix].
2. O valor de entrada será lido do dispositivo teclado.
3. Não foi detalhado como deve ser feito o processo de extração das
partes inteiras e fracionárias. Esta extração poderá ser feita pelo
chamamento das funções INTE() e FRAC()[xxx].
4. Existe aqui uma estrutura do tipo Se-Então-Senão (If-Then-Else
em inglês). Se a condição for satisfeita será executada a parte
correspondente ao Então. Se a condição não for satisfeita será
executada a parte correspondente ao Senão. A condição é: parte
fracionária menor que 0,5.
5. Se a parte fracionária for menor que 0,5 a parte inteira será
mantida.
6. Se a parte fracionária for maior ou igual a 0,5 a parte inteira será
aumentada de uma unidade.
7. O final da estrutura é marcado por Fim Do Se.
8. Ao final, o valor arredondado será exibido em um terminal de
vídeo ou será impresso.

Resp. Ex. 3.
Sejam li, pm e ls 3 (três) pontos distintos quaisquer que jazem no
eixo real. As respectivas coordenadas posicionais (abscissas) são
dadas por:

X1 = li
X2 = pm
X3 = ls
Sendo que:

X1 < X2 < X3

li < pm < ls
ou
ls > pm > li
A ilustração a seguir nos mostra a situação descrita. O desenho foi
feito no semieixo positivo, mas também poderia ter sido feito no
semieixo negativo.

Pela própria definição do que seja ponto médio de um segmento


retilíneo temos a seguinte igualdade entre as duas distâncias:

dist (li , pm) = dist (pm , ls)


E assim:

Lembrar de uma definição da função módulo (ou função valor


absoluto).

O módulo de x (sendo x um número real qualquer) é dado pela raiz


quadrada de x elevado ao quadrado.
Façam a demonstração para os próximos casos:
[a] Os dois pontos se situam na parte negativa do eixo das
abscissas;
[b] Um ponto se situa na parte negativa do eixo das abscissas e o
outro na parte positiva.

Resp. Ex. 4.
Igualando as duas formulações temos:

donde
Temos dois logaritmos com bases diferentes. É preciso igualá-
las. Pela propriedade da mudança de base temos:

E assim:
Finalmente:

Portanto,

Assim, a fórmula de Sturges usando logaritmos de base 2 é


dada por:

No caso de uma base válida qualquer (dita base g) temos:

Agora precisamos resolver um sistema de duas equações.


Novamente, a constante k é unitária. Quanto ao valor de p
temos de converter a base g na base 10 (ou o contrário).

Notar que se g = 10 teremos

como já era de se esperar.

Resp. Ex. 5.
Definam inicialmente as seguintes funções de uma variável cada (os
ípsilons são funções de n).
Notar que, para este exercício, iremos tratar n como se fosse uma
variável real contínua (positiva) com o propósito de melhor visualizar
os formatos das duas curvas.

Usaremos o software Graphmatica for Windows versão 2.4 (por sua


simplicidade) com o propósito de plotar as duas curvas de interesse.
Uma interessante característica deste software é o fato dele poder
exibir mais de uma curva simultaneamente na tela (em cores
diferentes). Vejamos, pois, as devidas explicações.
O intervalo visível do eixo horizontal foi setado de 1 (um) até 100
(cem) e o intervalo visível do eixo vertical foi setado de 1 (um) até 15
(quinze). Isto é feito na aba View (Visualização) opção Grid Range
(Amplitude do Gradil).

É definido um retângulo de visualização com vértices dados por:

Vértice 1: ( left, bottom )


Vértice 2: ( left, top )
Vértice 3: ( right, bottom )
Vértice 4: ( right, top )
Enter Range of Grid (Entrar com o Intervalo da Grade):
Left (Esquerda):
Limite inferior da visualização horizontal (= 1).

Right (Direita):
Limite superior da visualização horizontal (= 100).

Bottom (Embaixo):
Limite inferior da visualização vertical (= 1).

Top (Topo):
Limite superior da visualização vertical (= 15).

Clicar em OK após fazer as devidas seleções ou em Cancel para


cancelar.

As funções são escritas da seguinte forma (sem os espaços em


branco entre os caracteres):

y=sqrt(x)

y=1+3,322*log(x)

Sendo que sqrt simboliza a raiz quadrada (do inglês square root) e
log simboliza o logaritmo de base dez. A multiplicação é expressa
pelo operador * (asterisco). A lista de funções disponíveis no
software pode ser vista no Graphmatica Help (Auxílio do
Graphmatica) em Graphing Equations, Operator Table (Plotando
Equações, Tabela de Operadores).
A seguir temos a plotagem das duas funções (a raiz quadrada em
rosa e a de Sturges em preto). Estamos trabalhando somente no
primeiro quadrante (onde o radicando e o logaritmando assumem
valores reais positivos). Além disso, as plotagens começam em x
unitário (x=1).
Podemos ver que as duas funções são sempre crescentes (ou seja,
à medida que n aumenta de valor as funções também aumentam de
valor).

Funções no Graphmatica

Notar que existem pontos de intersecção (as duas curvas se


interceptam). Estes pontos são determinados calculando o valor de n
que satisfaz a igualdade a seguir.

O Graphmatica nos permite encontrar estes pontos muito facilmente.


Na aba Tools (Ferramentas) selecionamos Find Intersection
(Descobrir Intersecção). As duas equações são apresentadas
(Equation 1 e Equation 2) e basta clicar em Calculate (Calcular) para
os resultados (x,y) serem apresentados em Results (Resultados).
Os dois pontos são dados por (comprovem a validade com uma
calculadora eletrônica):

(x1,y1) = (1 , 1)
(x2,y2) = (39,9416 , 6,3199)

O primeiro dos dois pares de intersecção pode ser facilmente


calculado, senão vejamos. O segundo par exige mais esforço para
ser obtido.

Após o segundo ponto de intersecção, usar o critério da raiz


quadrada (ao invés do critério de Sturges) nos leva a obter um
número maior de classes.

OBS.:
Caso não seja possível visualizar as cores das plotagens, ainda
assim é muito fácil identificar quem é quem. Basta ver o ponto de
abscissa 25 (vinte e cinco) e ordenada 5 (cinco). A função sqrt(x)
passa por esse ponto (já a outra não passa).
Cap. 07
Abusos e Maus Usos da Estatística

A seguir apresentaremos diversos abusos e maus usos da


Estatística (os quais são, infelizmente, muito comuns). Para cada
um deles serão feitos os devidos comentários explicativos. Vejamos
pois.

1. Percentagens Distorcidas
(por desconhecimento do assunto ou de propósito)

Exemplo.
As notas de cada avaliação de uma matéria podem variar de zero
até dez (incluindo os dois extremos). Na primeira avaliação um
aluno tirou 0,2. Na segunda avaliação o mesmo aluno tirou 0,6.
Houve uma melhora de 200% (duzentos por cento) afirma o
pedagogo da escola com entusiasmo.

Comentário.
A percentagem em si é um fato incontestável, porém a melhoria
ocorrida foi irrisória frente ao que deveria ter sido (se o aluno nada
sabia na primeira avaliação, continuou não sabendo nada na
segunda). Qual seria o motivo do tal entusiasmo? O que estaria
sendo comemorado frente a uma situação tão catastrófica?

2. Distorções de Forma Deliberada

Exemplo.
Pesquisa mostrou que 97% (noventa e sete por cento) dos
assinantes de uma empresa de televisão a cabo consideram o
serviço prestado excelente. A pesquisa foi feita com assinantes que
também são funcionários da própria empresa ou com cônjuges de
funcionários.

Comentário.
A amostra foi selecionada de modo a traduzir o resultado que a
empresa queria ter (isto é, uma excelente prestação do serviço).
Essa escolha gerou uma severa distorção no resultado da pesquisa
(inviabilizando-a do ponto de vista estatístico, mas dando à diretoria
a visão que gostariam que fosse verdadeira). Se o resultado final for
disponibilizado ao público (sem informar todos os detalhes
pertinentes à amostra utilizada), teremos um exemplo de mau-
caratismo empresarial (algo que, infelizmente, é extremamente
frequente, mormente no Brasil).
Temos também aqui uma situação de amostra ruim (não
representativa da população e não escolhida de forma aleatória).

3. Estimativas por Suposição Não Fundamentada


(é o popular “chute”)

Exemplo.
Informe oficial de um Partido Político: O comício de candidato a
governador de Minas Gerais reúne duzentas mil pessoas na Praça
da Estação em Belo Horizonte. Enquanto isso, fotografias aéreas e
cálculos com base em gradeamentos estimaram a presença de, no
máximo, vinte mil pessoas.

Comentário.
O partido fez uma estimativa sem qualquer fundamento científico.
Isto pode ter ocorrido por pura ignorância (o que não seria nenhuma
novidade) ou por simples má-fé (que é bem mais provável). Infla-se
o quantitativo de público presente para passar a falsa ideia de
grande apoio popular das massas. No caso em tela, a inflação feita
foi simplesmente absurda. O chute é 10 (dez) vezes maior que a
estimativa científica.
4. Gráficos Enganadores
(por desconhecimento ou de propósito)

Exemplo.
A seguir temos uma visualização dos vencimentos brutos mensais
de dois tipos de servidores (A e B), sendo que A recebe
vencimentos muito superiores aos vencimentos de B (cerca de onze
vezes mais).

A altura dos retângulos ilustra (ou deveria ilustrar) a magnitude dos


vencimentos brutos mensais recebidos.

Comentário.
Muito embora os vencimentos de A sejam mais de 11 (onze) vezes
maiores que os vencimentos de B, a altura do retângulo de A (à
esquerda) é pouco maior que a altura do retângulo de B (à direita).
A distorção visual é gritante.
Experimentem desenhar em escala tal situação para ter a real
compreensão dos valores envolvidos. Isto está mostrado a seguir.
Em uma planilha eletrônica colori 11 (onze) células (à esquerda)
para representar os vencimentos brutos de A e apenas 1 (uma)
célula (à direita) para representar os vencimentos brutos de B. A
relação entre as alturas não é exata, mas sim aproximada (contudo
é uma excelente aproximação frente ao valor real).

Este é o aspecto gráfico que deveria ter sido apresentado. O gráfico


original é também um exemplo de distorção (gráfica) de forma
deliberada.

5. Pressão Indevida do Pesquisador ou do Próprio Ambiente

Exemplo 1.
Pergunta o entrevistador: Você já furtou algo em um supermercado?
A pergunta foi feita na presença de um agente da Lei (ou em uma
delegacia).

Comentário 1.
Não se pode esperar que haja uma resposta verdadeira nessas
circunstâncias.

Exemplo 2.
Você já colou em alguma prova? A pergunta foi feita com o diretor
da escola ao lado do aluno entrevistado.

Comentário 2.
É, em essência, a mesma situação do primeiro exemplo. Existe uma
tendência em responder não (a não ser que estejamos em presença
de um colador contumaz que já não se importa se o diretor sabe ou
deixa de saber).

Exemplo 3.
Você entende que as empresas fabricantes de cigarros devem ser
punidas? A pergunta foi feita a um funcionário de uma destas
empresas e, ainda por cima, no interior das dependências da
empresa.

Comentário 3.
Tanto o ambiente quanto o fato de ser funcionário induzem o
respondente a dar uma determinada resposta. Analisem as
seguintes condições de contorno da entrevista.
1. Alguém pode passar justo na hora que a resposta estiver sendo
dada e ouvir o que o funcionário diz ao entrevistador.
2. O funcionário pode ter medo de ser identificado e punido (até
mesmo demitido).
3. Mesmo que não possa ser identificado e ninguém ouça, o
funcionário pode tender a proteger o ramo industrial no qual trabalha
e de onde tira o seu (dele) sustento.
6. Perguntas Tendenciosas

Exemplo 1.
Você é favorável à proibição da fabricação e comercialização de
armas de fogo no Brasil, já que elas podem ser usadas para matar
criancinhas?

Comentário 1.
Notar que criancinhas também podem ser mortas por travesseiros
(por asfixia) e nem por isso os travesseiros devem deixar de ser
fabricados e comercializados. A pergunta procura tocar no lado
sentimental do entrevistado.
Perguntas deste tipo são típicas de quem é favorável ao
desarmamento da população (da população de bem que fique bem
claro, uma vez que a bandidagem não respeita leis e não seria essa
em particular que iriam respeitar).

Exemplo 2.
Você é a favor de não aumentar os vencimentos dos servidores
públicos federais para que, dessa forma, sobre mais dinheiro para
ajudar os velhinhos desamparados do Brasil?

Comentário 2.
Notar que a pergunta monta uma suposta situação de causa e
efeito. A causa é o não aumento dos vencimentos e o efeito é ajudar
os velhinhos desamparados. É óbvio que não dar aumento a uma
categoria fará com que haja mais dinheiro disponível para fazer
outras coisas (entre elas ajudar os tais velhinhos desamparados).
Todavia, também sobrará mais dinheiro para ser desviado por
políticos desonestos e guardado em malas, sobrará mais dinheiro
para fazer obras desnecessárias e superfaturadas, sobrará mais
dinheiro para contratar protegidos inúteis e por aí vai.
7. Amostras Ruins
(amostras apresentando bias)
Serão vistos exemplos de amostras tendenciosas. Os 3 (três)
primeiros são, simplesmente, aberrantes e risíveis.

Exemplo 1.
Pesquisa a respeito da qualidade do Ensino Médio no Brasil
amostra, tão somente, alunos de escolas particulares da elite e de
colégios militares.

Comentário 1.
Parece que se quer ter um resultado excelente, escondendo a
mediocridade generalizada que é o ensino público (fundamental e
médio) no Brasil.

Exemplo 2.
Pesquisa sobre a qualidade geral da prestação do SMP no estado
de São Paulo amostra, unicamente, assinantes do Pontal do
Paranapanema e do Vale da Ribeira.

Comentário 2.
E o que ocorre nas demais regiões do estado (inclusive na própria
capital e em grandes cidades como Campinas, São José dos
Campos e Santos)? Foram simplesmente esquecidas? Notar que a
pesquisa é bem ampla e se refere a todo o estado de São Paulo.

Exemplo 3.
Pesquisa sobre a qualidade geral da prestação do SCM no Brasil
amostra, apenas, assinantes que fazem uso de meios de acesso
rádio (lembrar que há, também, os assinantes com acesso por meio
cabeado).

Comentário 3.
A quem interessa deixar de lado os assinantes com acesso por meio
cabeado (coaxial, óptico, de pares)?
Bibliografia Recomendada

Há uma grande quantidade de bons livros em português sobre


Estatística Descritiva. Para os leitores interessados recomendo os
seguintes:

AKAMINE, Carlos Takeo e YAMAMOTO, Roberto Katsuhiro. Estudo


Dirigido Estatística Descritiva. Érica, 1998.

COSTA, Sérgio Francisco. Introdução Ilustrada à Estatística. 3 ed.


São Paulo: Editora Harbra, 1998.

GRANER, E. A. Estatística: Bases para o seu Emprêgo na


Experimentação Agronômica e em Outros Problemas Biológicos. 2.
ed. São Paulo: Edições Melhoramentos, 1966[xxxi].

Apesar de antigo, é um livro bem útil e que merece ser consultado


por aqueles interessados nas aplicações da Estatística nas ciências
biológicas.

SAN ROMÁN, Antonio Pulido. Estadistica y Tecnicas de


Investigación Social. 4 ed. Espanha: Ediciones Pirámide, 1976.

Apesar de não ser escrito em português, o castelhano é uma língua


irmã e de fácil entendimento na literatura técnica. Vale a pena ser
consultado.

SOUNIS, Emilio. Bioestatística: Princípios Fundamentais,


Metodologia, Estatística, Aplicação às Ciências Biológicas. 2 ed
revisada. São Paulo: McGraw-Hill do Brasil, 1975.

STEIN, Carlos Efrain e LOESCH, Claudio. Estatística Descritiva e


Teoria das Probabilidades. 2 ed. Blumenau: EDIFURB, 2011.
Símbolos, Abreviaturas e Siglas

Segue, para facilitar a consulta, uma lista com os símbolos, as


siglas e as abreviaturas, dispostas em ordem alfabética, que foram
utilizadas neste livro.
Seguem, também, explicações adicionais para cada uma das
entradas (sempre que isso se mostrar pertinente e útil).

2-FSK
FSK binário ou de dois estados frequenciais (que são a frequência
linear f1 e a frequência linear f2). É um esquema de modulação
digital onde a frequência da onda portadora (carrier em inglês) é
chaveada entre os valores f1 e f2 de acordo com o sinal digital de
entrada no equipamento modulador. Ver a entrada FSK.

3G
Do inglês Third Generation. Indica a terceira geração de
radiotelefonia móvel celular.

A
Conjunto amostra ou conjunto amostral. O mesmo que S (do inglês
sample). É um subconjunto do conjunto universo U (ou U é um
superconjunto de A).

a.D.
Do latim anno Domini (ano do Senhor ou ano de Deus). A letra dê é
grafada maiúscula (D) em sinal de respeito à Divindade (Deus).
Caso não se deseje fazer uma alusão ao Cristianismo é possível
usar a sigla EC (de Era Comum) com o mesmo significado. Assim
sendo, 2017 a.D. é o mesmo que 2017 EC.

ABNT
Associação Brasileira de Normas Técnicas.
AM
Do inglês Amplitude Modulation (Modulação em Amplitude). Um
esquema analógico de modulação usado, por exemplo, em
radiodifusão (emissoras AM). Para este esquema de modulação, a
amplitude da onda portadora varia de acordo com o sinal modulador
(a informação é transmitida nas variações de amplitude da onda
portadora).

ASA
Do inglês American Statistical Association. Associação Americana
(EUA) de Estatística.

b
Letra bê minúscula. Símbolo de bite (bit em inglês). A menor
unidade de informação que pode ser processada (por exemplo, por
um computador). Esta palavra tem sua origem no inglês BInary digiT
(dígito binário). Um bite assume o valor 0 (desligado, apagado, zero)
ou 1 (ligado, aceso, um).

B
Letra bê maiúscula. Símbolo de baite (byte em inglês). Tipicamente,
o baite corresponde a 8 (oito) bites (sendo conhecido como 8-bit
byte). No passado, entretanto, já foram usados baites com um
número diferente de bites (os quais não são mais usados na
atualidade). Em termos de simbologia notar que:

b (bite) <> B (baite)

BA
Boletim de Anormalidade. Um documento, impresso ou eletrônico,
que relata uma determinada anormalidade em um equipamento,
logicial[xxxii] ou sistema (por exemplo, uma falha em um módulo
amplificador de áudio ou um resultado errado na saída de um
programa de computador).

bps
Bites por segundo (do inglês bits per second). Unidade de medida
de velocidade ou taxa de transmissão digital. Também se escreve
b/s ou bite/s.
Notar que escrever bps e Bps traduz distintas unidades (bites por
segundo em bps e bytes por segundo em Bps). Assim:

1 Bps = 8 bps
(considerando um 8-bit byte)

BTS
Do inglês Base Transceiver Station (Estação Base Transceptora).
Em português existe a sigla correspondente ERB (Estação Rádio-
Base).

CAD
Do inglês Computer-Aided Design (Projeto Assistido por
Computador, PAC). Existem CADs especializados em Matemática
ou mesmo em uma área específica da Matemática (como é o caso
da própria Estatística). Um exemplo de CAD matemático genérico é
o Graphmatica for Windows (que foi usado para este livro) e um
exemplo de CAD matemático orientado à Estatística é o SPSS
(Statistical Package for the Social Sciences), hoje denominado IBM
SPSS Statistics.

CC
Corrente Contínua (aportuguesação do inglês Direct Current, DC).

CDR
Do inglês Call Detail Record. Registro de detalhamento de uma
chamada (telefônica).

cm
Símbolo da unidade centímetro (unidade de medida de comprimento
do SI). Prefixo métrico centi (c) + unidade metro (m). Um centésimo
(1/100) do metro. Notar que ambas as letras são grafadas
minúsculas. Assim, formas como CM ou cM são, ambas, erradas.
1 cm = (1/100) m = 0,01 m

1 m = 100 cm = 102 cm

dBm
Decibel em relação ao miliwatt. Unidade absoluta de medida de
nível de potência (potência logarítmica ou logaritmizada) muito
usada em Telecomunicações. É formada pela unidade decibel (dB)
acoplada à unidade miliwatt (somente com a letra m do prefixo mili).
Também se usa escrever dBmW (ainda que mais raramente).

Notar que o logaritmo usado é o de base dez (decimal).


A expressão anterior mostra como obter o valor do nível de potência
em dBm (Y) a partir do valor correspondente da potência linear em
miliwatts (X).

DC
Do inglês Direct Current. Ver a entrada CC.

dist
Distância entre dois pontos (de uma reta, por exemplo). Se os dois
pontos forem coincidentes, a distância entre eles será nula.

DMR
Do inglês Digital Microwave Radio. Rádio digital que opera na faixa
frequencial (ou banda) de micro-ondas[xxxiii].

e.g.
Do latim exempli gratia (por exemplo). Nesta abreviatura, as duas
letras devem ser grafadas minúsculas. O mesmo que v.g.

ENEM
Exame Nacional do Ensino Médio.

EUA
Estados Unidos da América.

f( )
Designa uma dada função do argumento ( ). Exemplo:

f(x) = x2

Designa uma função quadrática da variável x.

FMA
Frequência Muito Alta. O mesmo que VHF.

FSK
Do inglês Frequency-Shift Keying (Chaveamento por Deslocamento
em Frequência). Um esquema de modulação digital. Ver a entrada
2-FSK.

ft
Do inglês foot (plural feet). Símbolo da unidade pé (unidade SIPM
de medida da grandeza comprimento). A correspondência a seguir é
exata.

1 ft = 30,48 cm = 0,3048 m

Dependendo da aplicação, podemos usar a seguinte aproximação: 1


ft (um pé) correspondendo a 30 cm (trinta centímetros). Uma
aproximação de melhor qualidade é 30,5 cm.
GHz
Unidade SI de medida de frequência linear múltipla do hertz. É
composta pelo prefixo SI giga (G) + unidade hertz (Hz).

1 GHz = 1.000.000.000 Hz = 109 Hz

Notar que apenas a letra z é minúscula. Assim, formas como GHZ e


ghz são, ambas, erradas.

GT
Do inglês Greater Than. Maior que.

GTE
Do inglês Greater Than or Equal to. Maior que ou igual a.

h
Altura (do inglês height). Na Estatística Descritiva designa o
intervalo de classe.
OBS.: É interessante saber que há na Topografia (e também na
Cartografia e Geodésia) uma diferença conceitual envolvendo altura
e altitude. Nessas áreas, a altura costuma ser designada pela letra
agá maiúscula (H) e a altitude pela letra agá minúscula (h). A
diferença entre elas reside na questão do referencial (o referencial
da altitude é o nível médio do mar, NMM). Já na Geometria
Euclidiana é frequente usar ambas as formas (h e H) indistintamente
com o significado de altura (pois tal letra, independentemente de ser
grafada h ou H, deriva do inglês height).

i.e.
Do latim id est (ou seja, isto é). Nesta abreviatura, as duas letras
devem ser grafadas minúsculas.

IBGE
Instituto Brasileiro de Geografia e Estatística.
If-Then-Else
Do inglês Se-Então-Senão. Se <condição verdadeira> Então <fazer
opção 1> Senão <fazer opção 2>. É terminado com End If (Fim Do
Se).

If condição
Then
Ação 1
Else
Ação 2
End If

in
Símbolo da unidade polegada (inch, plural inches) de medida de
comprimento no SIPM. Em português é comum usar o símbolo pol
ao invés de in. A relação entre a polegada (in) e o centímetro (cm) é
exata (e deriva de uma definição de caráter metrológico), a saber:

1 in = 2,54 cm

Uma aproximação frequente é 2,5 cm. A vantagem desta


aproximação é fazer com que uma polegada corresponda a 1/4 (um
quarto) de dez centímetros.

in2
Símbolo da unidade polegada quadrada. Uma polegada quadrada
corresponde à medida da área de um quadrado cujo lado mede uma
polegada (1 in).

k
1. O mesmo que NC.
2. Símbolo do prefixo métrico quilo. Exemplos: quilograma (kg),
quilômetro (km), quilonewton (kN), quilopascal (kPa), quilovolt (kV).

kg
Símbolo da unidade fundamental de medida de massa no SI (o
quilograma). Ambas as letras devem ser grafadas minúsculas.
Assim, formas como KG e Kg são, ambas, erradas. Particularmente,
há de se ressaltar que, entre o público leigo, é muito comum
escrever o símbolo do prefixo quilo com a letra K maiúscula (ao
invés da letra k minúscula como deveria ser).

kgf
Quilograma-força. Unidade de medida de força no Sistema Técnico
Métrico. É grafada com as 3 (três) letras minúsculas (desse modo,
formas como KGF ou kGF são, ambas, erradas).

km/s
Símbolo da unidade quilômetro por segundo (uma unidade SI de
medida da grandeza velocidade linear).

1 km/s = 1.000 m/s = 103 m/s

Notar que a grafia correta do símbolo usa todas as letras


minúsculas. Sendo assim, uma forma como KM/S é errada.

kton
Símbolo da unidade de medida de massa quilotonelada. Prefixo
métrico quilo (k) mais unidade tonelada métrica (ton).

1 kton = 1.000 ton = 103 ton

L
Comprimento (do inglês length).

lbf
Libra-força. Unidade de medida da grandeza força no SIPM. Notar
que existe uma diferença conceitual entre libra-força e libra-massa
(pois elas são usadas em grandezas físicas distintas).
lbf/in2
Libra-força (lbf) por polegada quadrada (in2). Unidade de medida da
grandeza pressão no SIPM. Corresponde à pressão de uma libra-
força aplicada em uma área medindo uma polegada quadrada. O
mesmo que psi.
OBS.: No SI a unidade oficial de medida da grandeza pressão é o
pascal (símbolo Pa), que corresponde a um newton por metro
quadrado (1 N/m2).

log
Logaritmo decimal. Por ser o logaritmo mais usado, é comum não
escrever a base (dando a entender que se trata da base dez).
Contudo, para não haver dúvidas sobre qual é a base usada, é
preferível escrever log10.

log2
Logaritmo de base 2. O logaritmo de base dois se relaciona com o
logaritmo decimal por meio de uma conversão de base.

log10
Logaritmo de base 10 (dito decimal, vulgar ou de Briggs).

LT
Do inglês Less Than. Menor que.

LTE
Do inglês Less Than or Equal to. Menor que ou igual a.

m
Letra eme minúscula. Símbolo da unidade de medida metro (a
unidade fundamental no SI para a medida da grandeza
comprimento). Notar a diferença que existe no SI entre m
(minúsculo) e M (maiúsculo).

M (maiúsculo) -->> prefixo SI mega (um milhão)


m (minúsculo) -->> unidade metro[xxxiv]

m/s
Símbolo da unidade metro por segundo (unidade SI de medida da
grandeza velocidade linear). Um metro por segundo corresponde a
um deslocamento de 1 m (um metro) no intervalo de tempo de 1 s
(um segundo).

m/s2
Símbolo da unidade metro por segundo ao quadrado ou metro por
segundo por segundo (unidade SI de medida da grandeza
aceleração linear). Um metro por segundo ao quadrado corresponde
à variação de velocidade linear de 1 m/s (um metro por segundo)
durante 1 s (um segundo).

MAS
Média Aritmética Simples (é a média aritmética com ponderação
unitária de todos os seus termos). De todas as médias existentes,
esta é a mais usada.
Notar que a MAS somente pode ser usada em valores numéricos
reais.

Mbps
Do inglês megabits per second (megabites por segundo)[xxxv]. Um
Mbps corresponde à velocidade (ou taxa) de transmissão digital de
1 (um) milhão de bites em 1 (um) segundo. Prefixo SI mega (M) +
unidade bite por segundo (bps).

1 Mbps = 1.000.000 bps = 106 bps

Notar que a grafia correta do símbolo é M (maiúsculo) e bps


(minúsculos). Sendo assim, formas como mbps e MBPS são,
ambas, erradas.
OBS.: Não confundir a unidade Mbps (megabite por segundo) com a
unidade MBps (megabyte por segundo).[xxxvi]
MHz
Símbolo da unidade megahertz (uma unidade SI de medida da
grandeza frequência linear). Múltiplo da unidade fundamental hertz
(Hz). Um milhão de hertz. Prefixo SI mega (M) + unidade hertz (Hz).

1 MHz = 1.000.000 Hz = 106 Hz

Notar que a grafia correta do símbolo é M e H (ambos maiúsculos) e


z (minúsculo). Sendo assim, formas como mhz e MHZ são, ambas,
erradas.

mW
Símbolo da unidade miliwatt de medida de potência linear. Um
milésimo (1/1.000) do watt. Prefixo mili (m) + unidade watt (W).

1 mW = (1/1.000) W = 10-3 W

É muito usado no ambiente das Telecomunicações.

n(A) ou n
A cardinalidade do conjunto amostra A. É o número de elementos
pertencentes ao conjunto A. Lembrar que a cardinalidade do
conjunto amostra é um número natural não nulo que é igual ou
menor que a cardinalidade do correspondente conjunto universo.

n(A) =< n(U)

Seja um conjunto amostra (composto por variáveis categóricas)


dado por:

A = {azul, branco, preto, rosa, verde, marrom, cinza}

n(A) = 7
n(P)
A cardinalidade do conjunto população (ou conjunto universo). É o
número de elementos pertencentes ao conjunto P. O mesmo que
n(U).

n(U)
O mesmo que n(P). É o número de elementos pertencentes ao
conjunto U (conjunto universo ou universal).

NBR
Norma BRasileira. Uma norma brasileira vinda da ABNT.

NCA
NC arredondado. É o número aproximado de classes após sofrer um
processo de arredondamento. NCA é um valor natural não nulo (que
pertence ao conjunto ene asterisco).

NC
Número aproximado de classes.

NET
Do inglês Not Equal To. Não É Igual A. Diferente de.

O(0)
Origem O de um sistema de coordenadas cartesianas
unidimensionais ou monodimensionais (de uma única dimensão). A
origem de tal sistema possui abscissa nula (X=0).
OBS.: Em um sistema de coordenadas cartesianas planas temos
O(0,0) e em um sistema de coordenadas cartesianas tridimensionais
temos O(0,0,0).
No caso de O(0,0) temos que a abscissa e a ordenada são nulas na
origem (X=Y=0) e no caso de O(0,0,0) a cota também é nula na
origem (X=Y=Z=0).

OX
O mesmo que XOX. É o eixo das abscissas (ou eixo horizontal). De
forma análoga temos o eixo OY (ou YOY) que é o eixo das
ordenadas.

P
População (estatística) ou conjunto população. O mesmo que U.

PA
Peça que foi aprovada em um procedimento de inspeção de
qualidade de fabricação em uma indústria.

PAC
Projeto Assistido por Computador. O mesmo que CAD.

pm
Ponto médio (de um dado segmento de reta). O pm equidista dos
pontos extremos do dito segmento.
OBS.: O conceito de ponto médio não se aplica somente aos
segmentos retilíneos (podemos usá-lo, por exemplo, em segmentos
parabólicos, em segmentos hiperbólicos, em segmentos circulares,
em segmentos de cicloides e outros mais).

PR
Peça que foi rejeitada em um procedimento de inspeção de
qualidade de fabricação em uma indústria.

PRODUT( )
O mesmo que produtório de ( ).

psi
Do inglês pounds per square inch (libras-força por polegada
quadrada). Unidade de medida da grandeza pressão no SIPM. O
mesmo que lbf/in2. Um psi corresponde à força de 1 lbf (uma libra-
força) aplicada à área de 1 in2 (uma polegada quadrada).
Q.e.d.
Do latim Quod erat demonstrandum (como queríamos demonstrar
ou c.q.d.). Uma forma erudita de encerrar as demonstrações
matemáticas.

RA
Rádio analógico.

RD
Rádio digital.

RDP
Rádio digital plesiócrono (é o rádio digital que usa a tecnologia de
transmissão plesiócrona).

RDS
Rádio digital síncrono (é o rádio digital que usa a tecnologia de
transmissão síncrona).

RMQ
Raiz Média Quadrática. Ver a entrada RMS.

RMS
Do inglês Root Mean Square (Raiz Média Quadrática, RMQ) ou
valor eficaz. É uma média muito empregada na Engenharia e na
Física.

s
Letra esse minúscula. Símbolo da unidade de medida de tempo no
SI (segundo).

S
Do inglês Sample. Conjunto amostra ou conjunto amostral. O
mesmo que A.

SCM
Serviço de Comunicação Multimídia.

SI
Sistema Internacional de Unidades. A sigla vem do francês Système
International d'Unités. É o sistema de unidades de medida oficial e
de uso obrigatório no Brasil[xxxvii].
As unidades básicas (ou fundamentais) do SI, assim como as
grandezas por elas medidas, são 7 (sete), a saber: metro
(comprimento físico), quilograma (massa), segundo (tempo), kelvin
(temperatura termodinâmica), ampere (intensidade de corrente
elétrica), mol (quantidade de matéria ou de substância) e candela
(intensidade luminosa).

SIPM
Sistema Inglês de Pesos e Medidas. Sistema tradicional de
unidades de medida ainda usado em alguns países (como, por
exemplo, os Estados Unidos da América). Unidades como a libra-
massa (grandeza massa), a polegada (grandeza comprimento), o pé
por segundo ao quadrado (grandeza aceleração linear) e a jarda
(grandeza comprimento) fazem parte deste sistema.

SME
Serviço Móvel Especializado.

SMP
Serviço Móvel Pessoal. Popularmente conhecido como serviço de
telefonia móvel.

SOMA( )
O mesmo que somatório de ( ).

SPSS
Do inglês Statistical Package for the Social Sciences (Pacote
Estatístico para as Ciências Sociais). Um poderoso e versátil CAD
matemático especializado em Estatística.
sqrt ou SQRT
Do inglês SQuare RooT. Raiz quadrada.

STFC
Serviço Telefônico Fixo Comutado, destinado ao uso do público em
geral. É o serviço de telefonia fixa (prestado na forma individual e
coletiva).

ton
Símbolo da unidade de medida de massa tonelada métrica. Uma
tonelada métrica corresponde a 1.000 (mil) quilogramas.

1 ton = 1.000 kg = 103 kg

É costumeiro chamar esta unidade apenas de tonelada (ao invés de


tonelada métrica).

TUP
Telefone de Uso Público. Ficou conhecido vulgarmente no Brasil
como orelhão em razão do seu formato característico.

TX
Do inglês Transmission (Transmissão). Usado, por exemplo, em
equipamento TX (equipamento de transmissão).

txt
Do inglês TeXT (texto). Uma extensão de arquivos de computador.

U
Universo (estatístico) ou conjunto universo (conjunto universal). O
mesmo que P.

UF
Unidade da Federação. Designa, de forma genérica, os estados, o
distrito federal (DF) e os territórios (que, presentemente, inexistem)
da República Federativa do Brasil. Assim, Santa Catarina é uma UF.
O Amapá também.

UFMG
Universidade Federal de Minas Gerais.

v.g.
Do latim verbi gratia (por exemplo). Nesta abreviatura, as duas
letras devem ser grafadas minúsculas. O mesmo que e.g.

VHF
Do inglês Very High Frequency. Frequência Muito Alta (FMA). Faixa
de frequência linear que vai de 30 MHz até 300 MHz. A televisão
analógica (dita TV em VHF) funciona nesta faixa de frequência.
Embora seja raro, também podemos encontrar na literatura técnica
a forma vhf (com as três letras minúsculas).

VOLP
Vocabulário Ortográfico da Língua Portuguesa. Existe a versão
impressa e a versão eletrônica online (hospedada no web site da
Academia Brasileira de Letras).

W
1. Símbolo da unidade watt (unidade SI de medida da grandeza
potência, sob a forma linear). Para este símbolo, a letra W é
obrigatoriamente grafada maiúscula. Assim, escrever 5 w querendo
dizer cinco watts é um erro (o correto seria 5 W).
Exemplo: 10 W (dez watts).

2. Largura (do inglês width).

3. Peso (do inglês weight).

X
Abscissa (é a primeira coordenada em um sistema de coordenadas
cartesianas retangulares ou oblíquas).

XOX
Em um sistema de coordenadas cartesianas (retangulares ou
oblíquas) é o eixo das abscissas ou eixo horizontal (eixo dos xises).
Também se diz eixo OX.

Y
Ordenada (é a segunda coordenada em um sistema de
coordenadas cartesianas retangulares ou oblíquas).

YOY
Em um sistema de coordenadas cartesianas (retangulares ou
oblíquas) é o eixo das ordenadas ou eixo vertical[xxxviii] (eixo dos
ípsilons). Também se diz eixo OY.

Z
Cota ou altura (é a terceira coordenada em um sistema de
coordenadas cartesianas retangulares ou oblíquas).

oC

Grau Celsius. Popular unidade de medida da grandeza temperatura.

oF

Grau Fahrenheit. Unidade de medida da grandeza temperatura no


SIPM. É uma unidade de uso quotidiano nos Estados Unidos da
América, por exemplo.

%
Percentagem (ou porcentagem). Indica uma divisão por 100 (cem).
Exemplo: 30% (trinta por cento).
Indicador de fechado à esquerda (considera o valor) e aberto à
direita (não considera o valor). Simbologia muito usada nas tabelas
da Estatística Descritiva.

Indicador de aberto à esquerda (não considera o valor) e fechado à


direita (considera o valor). Simbologia muito usada nas tabelas da
Estatística Descritiva.

Indicador de fechado tanto à esquerda quanto à direita (considera


ambos os valores extremos). Simbologia muito usada nas tabelas
da Estatística Descritiva.

Indicador de aberto tanto à esquerda quanto à direita (não considera


ambos os valores extremos). Simbologia muito usada nas tabelas
da Estatística Descritiva.

{ }
Chaves de abertura (à esquerda) e de fechamento (à direita).
Usadas, por exemplo, na Teoria Matemática dos Conjuntos (na
listagem dos elementos de um dado conjunto). A seguir temos um
conjunto F formado pelos países continentais da América do Sul que
não possuem fronteira com o Brasil (a cardinalidade deste conjunto
é igual a dois).

F = {Equador, Chile}

[ ]
Colchetes de abertura (à esquerda) e de fechamento (à direita).
Usados, por exemplo, na matemática de intervalos (para indicar o
conceito de fechado). Por exemplo:

[10, 18]
Indica um intervalo real fechado à esquerda (em 10) e fechado à
direita (em 18). Os valores 10 e 18 pertencem ao dito intervalo.

( )
Parênteses de abertura (à esquerda) e de fechamento (à direita).
Usados, por exemplo, na matemática de intervalos (para indicar o
conceito de aberto). Por exemplo:

(10,18)
Indica um intervalo real aberto à esquerda (em 10) e aberto à direita
(em 18). Os valores 10 e 18 não pertencem ao dito intervalo.
Na notação de intervalos podemos fazer uso simultâneo de
colchetes e parênteses. Vejamos um exemplo.

[10,18)
O valor 10 pertence ao dito intervalo, mas o valor 18 não.

Está contido em. Símbolo usado na Teoria Matemática dos


Conjuntos para relacionar dois conjuntos A e B onde um está
contido no outro (por exemplo, A está contido em B). Não confundir
os conceitos de “pertencer a” com “estar contido em”.

Implica em. Resulta em. Acarreta em. Tende a (no caso de limites).

-->>
Corresponde a.

Dupla implicação (dita implicação de ida e implicação de volta).


Desta forma. Portanto. Por conseguinte. Sendo assim. Destarte.
Dessarte.

| |
Duas barras verticais. Indicador da função módulo ou função valor
absoluto. Em linguagens de programação é comum fazer uso das
letras ABS (do inglês ABSolute) para indicar tal função. Assim:

ABS(x) = | x |

Exemplos:

ABS(0) = | 0 | = 0

ABS(3,14) = | 3,14 | = 3,14


ABS(-2) = | -2 | = 2

<
Menor que. Também é possível usar a sigla LT (do inglês Less
Than) com o mesmo significado.

Menor que ou igual a. É também simbolizado por =<. Também é


possível usar a sigla LTE (do inglês Less Than or Equal to) com o
mesmo significado.

=<
Menor que ou igual a.
Maior que ou igual a. É também simbolizado por >=. Também é
possível usar a sigla GTE (do inglês Greater Than or Equal to) com
o mesmo significado.

>=
Maior que ou igual a.

>
Maior que. Também é possível usar a sigla GT (do inglês Greater
Than) com o mesmo significado.

Aproximadamente igual a. Por exemplo:

É a constante numérica real (irracional e transcendental) pi da


Geometria Euclidiana (aqui exibido com quatro casas decimais,
sendo a última aproximada). Sendo um número irracional, não
importa quantas casas decimais usemos pois sempre teremos uma
aproximação (ainda que com qualidade cada vez maior à medida
que fizermos uso de mais casas decimais).

Diferente de. Também é possível usar a sigla NET (do inglês Not
Equal To) com o mesmo significado. Outro símbolo usado é <>
(mormente na área de Informática).

<>
Diferente de.
Raiz quadrada do argumento ( ). O argumento deve ser um
número real nulo ou positivo[xxxix]. Ver a entrada sqrt.

Conjunto dos números naturais exceto o zero. Devemos ler ene


asterisco. Tal conjunto (que é infinito) é dado por:

{ 1, 2, 3, 4, 5, 6, 7, ... }

O conjunto dos números reais positivos (não inclui o zero, uma vez
que ele não é um número positivo). A ilustração a seguir mostra a
diferença entre o que se considera números negativos (à esquerda
do zero na reta real), positivos (à direita do zero na reta real) e o
próprio zero (que é a origem da reta real).

Símbolo pertence da Teoria Matemática dos Conjuntos. Define uma


relação de pertinência entre um elemento e um conjunto (i.e., um
elemento pertence, ou não pertence, a um dado conjunto).
OBS.: Não dizemos que um elemento está contido em um conjunto,
mas sim que ele pertence a esse conjunto (ele faz parte desse
conjunto).

Letra grega maiúscula pi. É empregada para indicar um produtório.


Algumas vezes se escreve PRODUT( ) com o mesmo significado.

Letra grega maiúscula sigma. É empregada para indicar um


somatório. Algumas vezes se escreve SOMA( ) com o mesmo
significado.

OBS.: Não foram contemplados nesta relação símbolos muito


óbvios e amplamente usados no quotidiano da Matemática
elementar (quatro exemplos clássicos são o sinal de igualdade, =; o
sinal de subtração, -; o sinal de barra indicativo de divisão, / e o sinal
de adição, +). É suposto que eles já sejam muito bem conhecidos
por todos os leitores deste livro e não precisem ser explicados.
De qualquer forma, a linha que divide a contemplação da não
contemplação é tênue e depende inteiramente do entendimento do
autor a esse respeito.
Estrangeirismos Comentados

Segue, para facilitar a consulta, uma lista com os


estrangeirismos, dispostos em ordem alfabética, que foram
utilizados neste livro.
O conceito de estrangeirismo aqui empregado engloba, tão
somente, as palavras (ou expressões ou frases) que estão grafadas
no próprio idioma de origem (sem qualquer alteração na forma de
escrita). Assim, é um conceito mais restrito que o conceito
gramatical clássico. Assumindo tais considerações, a palavra spin
seria aqui tida como estrangeirismo, porém a aportuguesação espim
já não seria. O mesmo é dito dos seguintes pares: socket / soquete,
stub / estube e plug / plugue (ou os verbos to plug e plugar).
Temos na lista anglicismos (do inglês), latinismos (do latim) e,
até mesmo, um interlinguismo (da interlíngua).

8-Bit Byte
Do inglês. Baite composto por 8 (oito) bites. De forma genérica
escrevemos Y-bit byte (onde Y designa o número de bites que
compõe o baite).

A posteriori
Locução latina. A partir daquilo que é posterior. A partir do(s)
conceito(s) ulterior(es). Pelas razões posteriores. Se parte do efeito
para a causa. Ver a entrada a priori.
Exemplo de uso: Sempre é fácil para um “especialista” fazer uma
análise a posteriori.

A priori
Locução latina. A partir daquilo que é anterior. A partir do(s)
conceito(s) prévio(s). A partir de fundamento(s) anterior(es).
Exemplo de uso: A priori, não devemos fazer julgamentos
precipitados sobre assuntos complexos.
Apud
Do latim. Perto de, junto a. Usada para fazer citações indiretas (com
o significado de “citado por”, “conforme”, “segundo”).
Conforme <o autor> fulano de tal.
Segundo <o autor> fulano de tal.
Exemplo de uso: (Mario Sergio Cortella apud CONSELHOS PARA
CONSELHOS, 2014, página 32). Significa que no livro
CONSELHOS PARA CONSELHOS, de 2014, foi feita uma citação
de autoria de Mario Sergio Cortella na página 32.

Bias
Do inglês. Viés, polarização, tendência, inclinação. O bias pode ser
não intencional (quando não se percebe que proceder de uma
determinada maneira levará à tendências indesejadas) ou
intencional (quando se visa obter um determinado resultado).
Exemplo de uso: Iremos promover todo um treinamento específico
para minimizar a ocorrência de bias na pesquisa que será feita pela
nossa organização.

Bit Rate
Do inglês. Taxa de transmissão digital ou taxa de bites (é medida em
bites por segundo ou em seus múltiplos). De uma forma mais geral,
é expressa em bites por uma dada unidade de medida de tempo
(que, tipicamente, é o segundo, mas podendo ser qualquer outra).
Exemplo de uso: Qual é a bit rate naquela interface de dados?

Blank
Do inglês. Espaço em branco.
Exemplo de uso: É preciso inserir um blank entre os dois valores
numéricos para separá-los.

Byte
Do inglês. Baite. Corresponde a um grupamento de 8 (oito) bites
tratado como uma unidade. No passado existiram bytes de
diferentes tamanhos (byte de 6 bites, por exemplo), mas atualmente
só se emprega o byte de 8 bites (8-bit byte). É uma unidade usada
para medir a capacidade digital de armazenamento (arquivo de
tantos bytes). Também pode ser usada na medida de taxa de
transmissão digital (bytes por uma dada unidade de tempo, como o
segundo).
Exemplo de uso (de armazenagem): Aquele arquivo txt possui
quantos bytes?

Copyright
Do inglês. Direito de cópia. Já existe na língua portuguesa a forma
aportuguesada copirraite (tal aportuguesação foi meramente
ortográfica, sendo a pronúncia tão somente uma tosca aproximação
da pronúncia original).
Exemplo de uso: Nesta Universidade sempre se respeita o
copyright.

e-book (plural e-books)


Do inglês. Electronic book. Livro eletrônico. Também é possível
encontrar a grafia ebook (sem usar o hífen). Na língua portuguesa
temos a tradução e-livro (sendo que e- é um neoprefixo[xl] muito
usado no mundo virtual, por exemplo: e-tutoria, e-privacidade, e-
periódico, e-labo, e-pagamento).
Exemplo de uso: Como está indo o mercado de e-books no Brasil?

Fields of interest
Do inglês. Áreas de interesse. Diz-se daquelas áreas do saber que
são do interesse de uma determinada obra (cartilha, livreto, livro,
monografia de final de curso, dissertação, tese ou artigo de
periódico). Para esta obra, Big Data é uma área de interesse.

Graphmatica for Windows


Um CAD matemático de uso genérico. Por suas características
(como a facilidade de uso), é bem adequado como ferramenta de
auxílio para o Ensino Médio e para disciplinas matemáticas na área
de Ciências Sociais.
Exemplo de uso: Iremos usar o Graphmatica for Windows para
averiguar o comportamento das funções.

Gratias
Da interlíngua. Obrigado(a).

Handset
Do inglês. Aparelho telefônico móvel (seja ele um smartphone ou
não).
Exemplo de uso: Quantos handsets foram vendidos no mês
passado pela loja?

Horsepower
Do inglês. Uma unidade de medida de potência (na forma linear)
que corresponde aproximadamente a 746 watts. Simbolizado hp ou
HP.

In memoriam
Do latim. Em memória de. Usa-se, em textos escritos, quando nos
referimos a alguém (seja pessoa ou animal) já falecido.
Exemplo de uso: Este livro é dedicado à Kepler (in memoriam).

Ipsis litteris
Do latim. Literalmente ou “com as mesmas letras” (no sentido de
“com as mesmas palavras”). Deve ser pronunciada da seguinte
forma: /ípsis lítêris/.
Exemplo de uso: O texto do pronunciamento do presidente foi
transcrito ipsis litteris na reportagem.

Key words
Do inglês. Palavras-chave. São palavras, ou expressões, que
indicam conceitos essenciais em uma obra. Para esta, a palavra
dados é uma key word.

Megabyte
Do inglês. Megabaite. Múltiplo da unidade byte. Prefixo mega (mas
não o prefixo mega do SI) + unidade byte.
Exemplo de uso: Qual é o tamanho do arquivo em megabytes?

Online
Do inglês. Diz-se de um equipamento ou sistema que está
conectado a uma rede de computadores (por exemplo, a internete).
Exemplo de uso: Não é possível fazer saques pois o sistema do
banco não está online.

Paper
Do inglês. Artigo científico publicado em um periódico.
Exemplo de uso: Quantos papers já foram publicados este ano pelo
departamento?

Randomness
Do inglês. Aleatoriedade.

Range
Do inglês. Amplitude, domínio de variação, extensão.
Exemplo de uso: Qual é o range da variável altitude?

Raw Data (singular raw datum)[xli]


Do inglês. Dados brutos (i.e., aqueles dados que ainda não foram
processados, que não sofreram tratamento algum).
No contexto deste livro, os dados brutos são aqueles obtidos de
processos de contagem, de observações ou das respostas dadas às
perguntas de uma entrevista ou de um questionário (impresso ou
eletrônico), sem que tenha havido qualquer tipo de tratamento
estatístico.
Os dados brutos também são conhecidos como dados primitivos.
Exemplo de uso: Gostaria de ter acesso aos raw data de todas as
entrevistas que foram feitas por aquele funcionário.
OBS.: Dados elaborados são aqueles que sofreram algum tipo de
tratamento. Eles derivam dos dados brutos. Por exemplo: o
pesquisador mede a altura de todos os alunos de uma classe. O
conjunto de valores medidos são os dados brutos. A partir daí, ele
calcula a altura média de todos os alunos dessa classe, a altura
média dos meninos dessa classe e a altura média das meninas
dessa classe. Essas 3 (três) médias são dados elaborados fazendo
uso de um determinado procedimento matemático (que é o cômputo
de médias aritméticas simples).

Sample
Do inglês. Amostra. O verbo samplear[xlii] (amostrar) já foi ouvido
pelo autor em uma palestra sobre conversores analógico-digitais
(conversores AD). Confesso que não vejo a menor utilidade em usar
tal verbo (já que o verbo amostrar transmite todos os conceitos que
precisamos saber).

Sampling
Do inglês. Amostragem. O substantivo comum sampleamento
(amostragem) já foi ouvido pelo autor na mesma palestra em que
ouviu samplear. Decididamente, foi uma palestra inovadora do ponto
de vista linguístico.

Smartphone
Do inglês. Telefone celular inteligente (que roda um sistema
operacional que permite a instalação de programas conhecidos
como aplicativos).

Software
Do inglês. Programa de computador. Em português existem as
formas logicial e logiciário (ainda que ambas sejam bem raras).
Exemplo de uso: Você já instalou aquele software de conversão de
unidades no meu computador pessoal?

Web Site
Do inglês. Site da Web ou site da internete[xliii]. A palavra Web (Teia)
costuma, frequentemente, ser usada como um sinônimo de
internete, ainda que seja uma sinonímia imperfeita (pois a internete
é muito mais que a World Wide Web). Também aparece escrita
como uma única palavra (sem hífen): website.
Exemplo de uso: Qual foi o web site mais acessado na última
semana no nosso departamento?
Obras do Autor Publicadas na Plataforma Eletrônica
Kindle (em ordem cronológica de publicação)

1. Variação da Atenuação de Cabos Coaxiais com a


Temperatura.
Abril 2015. ASIN: B00VZFDBDM.

2. Frequências, Comprimentos de Onda e Larguras de Linha:


Um Ensaio.
Maio 2015. ASIN: B00YG3NMYS.

3. Casamento de Impedâncias Resistivas com Célula L.


Agosto 2015. ASIN: B013MNAPQK.

4. A Unidade de Transmissão Neper: Um Tutorial.


Outubro 2015. ASIN: B0164RQYM0.

5. Sobre Quadrados, Retângulos e Paralelogramos.


Novembro 2015. ASIN: B0180S9ZA4.

6. A Sociedade da Informação e a Infocracia.


Dezembro 2015. ASIN: B019ZJTAVQ.

7. Distância Entre Dois Pontos em um Sistema de Coordenadas


Cartesianas Oblíquas.
Janeiro 2016. ASIN B01AQRAO48.

8. Projeção de Segmentos Retilíneos em Sistemas de


Coordenadas Cartesianas Oblíquas.
Fevereiro 2016. ASIN B01BIKLOZK.

9. Área de Triângulos Planos a Partir das Coordenadas Polares.


Março 2016. ASIN B01CV4YPB2.

10. 75 Piadas e Pensamentos Matemáticos.


Março 2016. ASIN B01DCVHUII.
11. Neologismos Tecno-Científicos.
Abril 2106. ASIN B01E9TQ6PK.

12. Uma Pequena História das Comunicações Ópticas Guiadas.


Junho 2016. ASIN B01GIU44N4.

13. Percentagens e CPMF.


Junho 2016. ASIN B01H6BKWH6.

14. Terminações em RF.


Julho 2016. ASIN B01I6X0LJC.

15. Triplas Pitagóricas Através das Fórmulas de Duplicação de


Ângulos.
Julho 2016. ASIN B01J0L15J4.

16. 121 Piadas e Pensamentos Matemáticos com Comentários.


Setembro 2016. ASIN B01LKQON0K.

17. A Fórmula da Tangente do Ângulo-Metade Através de uma


Proof Without Words.
Setembro 2016. ASIN B01LWNHVUW.

18. Um Ensaio Sobre Latitudes e Longitudes em Diferentes


Unidades Angulares.
Outubro 2016. ASIN B01MFDRWC7.

19. Uma Introdução aos Bipolos Elétricos.


Novembro 2016. ASIN B01N3NAZYM.

20. Rotação e Translação no Sistema de Coordenadas Polares.


Dezembro 2016. ASIN B01MS1HESE.

21. Pequeno Glossário de Filtros Elétricos.


Janeiro 2017. ASIN B01MY7MIN5.

22. Divagações Matemáticas.


Fevereiro 2017. ASIN B06WLPGHQV.
23. Teoria dos Conjuntos para Concursos, ENEM e Vestibulares.
Março 2017. ASIN B06XVBS4K6.

24. Sobre Círculos e Circunferências.


Maio 2017. ASIN B0716RN7XH.

25. Um Ensaio Sobre Segmentos Circulares.


Maio 2017. ASIN B071ZG4TXZ.

26. Média Aritmética: Conceitos e Aplicações.


Junho 2017. ASIN B072WML8LH.

27. Média Geométrica: Conceitos e Aplicações.


Junho 2017. ASIN B073MBM7C1.

28. Ângulo de Deflexão de Refletores Passivos.


Julho 2017. ASIN B074672DF5.

29. Obtenção das Coordenadas Geográficas para Radioacesso.


Agosto 2017. ASIN B074MN21HK.

30. Média Heroniana: Conceitos e Aplicações.


Agosto 2017. ASIN B074VHPZF6.
[i]A palavra ignorante não é, e nem deveria ser considerada, um
insulto. Ser um ignorante é ser, meramente, alguém que ignora algo.
Eu, por exemplo, sou ignorante em Cardiologia e Direito Tributário e
não considero isso demérito algum.

[ii]
Numeração romana: M (1.000), X (10), V (5) e I (1). Assim sendo,
o ano MMXVII corresponde ao ano 2.017 na numeração indo-
arábica. Vejamos.
2.017 = 1.000 (M) + 1.000 (M) + 10 (X) + 5 (V) + 2 (II)
Ainda que sejam pouco usados atualmente, os algarismos romanos
encontram uso na numeração de páginas de livros e documentos,
nos mostradores de relógios analógicos e nas fachadas de imóveis.

[iii]
Não estamos tratando aqui de futurologia barata de pretensos
gurus nem de supostas previsões do futuro com base em
espiritualismos (leitura de cartas, de mãos, etc).

[iv]
A palavra fenômeno está sendo empregada em sentido amplo.
Um terremoto, por exemplo, é um fenômeno natural geológico
passível de ser observado e, a partir desta observação, é possível
haurir dados sobre ele. Igualmente, a observação dos alunos de
uma escola permite obter uma multiplicidade de dados sobre eles
(e.g., idade, altura, peso, renda familiar, cor dos olhos e dos
cabelos). Assim, os alunos da escola podem ser encarados como
um fenômeno.

[v]Esta separação que fiz é um tanto quanto artificial, já que as


Ciências Médicas fazem parte das Ciências Biológicas (lembrar que
bios é um radical grego que significa vida, estando presente em
palavras como biografia, biomassa, biosfera, biofísica, biometria,
bióloga, biocombustível e biotipo).
[vi]
Se os advogados a conhecerem, com razoável profundidade,
será um valioso auxílio nos tribunais. O mesmo é dito de
promotores, procuradores e juízes.

[vii]
Tanto é que muitas disciplinas nas graduações recebem o nome
genérico de Probabilidade e Estatística (ProbEst). Tipicamente, há
somente uma única disciplina na maioria dos cursos de graduação
na área das Ciências Exatas (excetuando, obviamente, aquelas
graduações de Estatística e Matemática, bacharelado).

[viii]
Em uma época onde não existiam computadores (como os que
hoje existem) é possível entender o porquê desta divisão. Elaborar
gráficos era algo bem complexo e que demandava muito tempo e
esforço (era trabalho de desenhista profissional). Atualmente, até
mesmo aquele famoso software generalista de planilhamento é
capaz de gerar gráficos razoáveis.

[ix]Dependendo da realidade considerada, poderá haver respostas


diferentes (porém válidas) para a mesma pergunta.

[x]A resposta dada por um aluno do último ano do Ensino Médio


deverá ser substancialmente diferente da resposta dada por alguém
que tenha concluído um mestrado em Estatística (ou mesmo uma
graduação). É isso que se espera em razão do nível e da extensão
dos conhecimentos adquiridos.

[xi] Conjunto é um conceito primitivo que nos faz lembrar de


agrupamento, coleção de objetos. Ao falarmos em conjunto neste
livro não estamos nos referindo ao conceito preciso de conjunto da
Teoria Matemática dos Conjuntos. Nesta, a repetição de valores não
é levada em conta. A seguir temos um exemplo que segue a Teoria
Matemática dos Conjuntos. Trata-se de um conjunto M com
características de pessoas em termos de altura (ou se é alto ou se é
baixo).
M = { alto, baixo, alto, alto } = { alto, baixo }

A cardinalidade de M é dada por:

n(M) = 2

Existem aqui elementos listados repetidos, mas é o mesmo conjunto


M (o qual somente possui dois elementos, alto e baixo). Cada
elemento de um conjunto deve ser contado somente uma única vez.
No entanto, quando se fala de conjunto neste livro não se tem em
mente esta característica.
Para este livro, os três “conjuntos” a seguir são diferentes (já para a
Teoria Matemática dos Conjuntos se trata do mesmo conjunto, o
qual tem cardinalidade igual a dois).

B = { 5, 5, 2 }
B possui 3 (três) elementos.

C = { 5, 2 }
C possui 2 (dois) elementos.

D = { 5, 5, 5, 2 }
D possui 4 (quatro) elementos.

O conjunto B pode representar o número de filhos dos três


funcionários terceirizados de uma empresa: um tem cinco filhos, o
outro também e o terceiro tem dois filhos. Já o conjunto C pode se
referir a uma empresa com dois funcionários terceirizados e o
conjunto D a uma empresa com quatro funcionários terceirizados.
Cada um dos casos é diferente e deve ser tratado de forma
diferente nos levantamentos estatísticos (experimentem, por
exemplo, calcular as médias aritméticas simples de cada um dos
tais conjuntos).
Se quisermos evitar tais questões, podemos usar a palavra
distribuição ou sequência de valores ao invés de conjunto.
Caso o leitor deseje se aprofundar na Teoria dos Conjuntos, eu
recomendo o seguinte livro :
LIPSCHUTZ, Seymour. Teoria dos Conjuntos. Tradução por
Fernando Vilain Heusi da Silva. São Paulo, SP: McGraw-Hill, 1972.
Tradução de: Schaum’s Outline of Theory and Problems of Set
Theory and Related Topics.
Este é, a meu ver, o melhor livro em língua portuguesa sobre o
assunto. É um livro que merece ser lido, relido e guardado na
biblioteca particular para futuras consultas.
Outra possibilidade, publicado em versão eletrônica na plataforma
Kindle, é Teoria dos Conjuntos para Concursos, ENEM e
Vestibulares do autor.

[xii]
Envolvendo o(a) colaborador(a), seu cônjuge e filhos(as). Notar
que esta definição exclui, por exemplo, avós e avôs (mesmo que
eles morem na mesma casa).

[xiii]
Esses diagramas são representações pictóricas das relações
envolvendo dois ou mais conjuntos. Apesar de não serem
considerados provas matemáticas formais, os diagramas de Venn
são muito úteis como auxílios visuais das relações entre dois ou
mais conjuntos.

[xiv]
Isso sem contar o fato que atualmente os programas televisivos
também podem ser assistidos em computadores pessoais
(desktops, notebooks), tablets ou telefones inteligentes
(smartphones). Em um mesmo apartamento, o pai pode estar
assistindo um programa no televisor da sala de estar, a mãe outro
programa no televisor do quarto, um dos filhos em um notebook e o
outro filho em um tablet. E todos os quatro podem ser programas
televisivos diferentes.
[xv]Lembrar que em uma mesma cidade (como Belo Horizonte) há
uma grande quantidade de locais de votação e, além disso, os
eleitores chegam para votar distribuídos ao longo do dia (durante o
horário de votação).

[xvi]
Em termos de um país ou de um estado (ou mesmo de um
município), fazer um censo eleitoral seria algo inviável e sem
sentido. As intenções de voto mudam naturalmente com o decorrer
do tempo e, mesmo que o censo fosse feito, uma semana após o
término o resultado poderia ser completamente diferente (imaginem
que nesse meio tempo fosse descoberto um grande escândalo de
corrupção envolvendo um dos candidatos, algo que infelizmente é
muito comum no Brasil).

[xvii]
O fato do peso (W, do inglês weight) ser uma grandeza vetorial
e a altura (H, do inglês height) ser uma grandeza escalar não muda
tais considerações. Outrossim, vale a pena lembrar que peso é uma
grandeza diferente de massa (pois a massa é uma grandeza
escalar). Peso e massa são diretamente proporcionais (a constante
de proporcionalidade é a aceleração local da gravidade).
Vetorialmente podemos escrever:

A seta colocada sobre as letras indica uma grandeza vetorial.


No linguajar popular se fala peso quando se deveria falar massa.
Ver o diálogo a seguir.

- Qual é o seu peso?


- Ah, eu peso 70 quilos.

O correto seria responder (já que se perguntou sobre peso):

- Ah, eu peso 70 quilogramas-força.


A resposta originalmente dada contém um erro mais sutil. É comum,
no falar popular, usar a palavra quilo como se fosse um sinônimo de
quilograma. Todavia, quilo (simbolizado pela letra latina k minúscula)
é um prefixo métrico (não é uma unidade de medida). Assim:
quilo+metro dá quilômetro (km), quilo+litro dá quilolitro (kL),
quilo+volt dá quilovolt (kV), etc. Foi uma resposta duplamente
errada.

1 quilômetro (km) = 1.000 metros (m)


1 quilolitro (kL) = 1.000 litros (L)
1 quilovolt (kV) = 1.000 volts (V)

[xviii] Aprovada (ou rejeitada) pelo controle de qualidade da indústria.

[xix]Um equipamento rádio, por exemplo, pode ter um ponto de


medida que permita monitorar o nível de potência de recepção.
Plugamos ali um voltímetro digital e, por meio da tensão CC que é
lida no visor do instrumento, fazemos uma correspondência com o
nível de potência que estamos recebendo na interface entre o
equipamento e a linha (por exemplo, um cabo coaxial).
Este caso é bem interessante pois não estamos medindo
diretamente o próprio nível de potência de recepção, mas sim uma
tensão elétrica CC que lhe é proporcional. A rigor, do ponto de vista
da eletrônica envolvida, a medição do nível de recepção é indireta
(ela seria direta se fosse o próprio nível de potência que estivesse
sendo medido). Mas do ponto de vista da coleta de dados, o
engenheiro de campo está colhendo os dados no próprio local e
onde isto é fisicamente possível. Ele está a fazer uma coleta direta.

[xx] Imaginem o seguinte caso. O autor escreveu um livro em


islandês (que caracteriza a fonte primária). Foi feita uma tradução
do islandês para o francês (que se torna a fonte secundária). Então,
um tradutor fez a tradução do francês para o português e,
finalmente, o livro foi publicado no Brasil (aqui leremos a fonte
terciária). Houve, portanto, o envolvimento de duas traduções (a
primeira do islandês para o francês e a segunda do francês para o
português).

[xxi]
O arredondamento pode ser feito tal qual a regra mostrada a
seguir.
Se o primeiro algarismo após a vírgula for 0, 1, 2, 3 ou 4 o algarismo
antes da vírgula será mantido.
Se o primeiro algarismo após a vírgula for 5, 6, 7, 8 ou 9 o algarismo
antes da vírgula será acrescido de uma unidade.
Por exemplo:

Round(1,13) = 1
Round(4,3) = 4
Round(104,59) = 105
Round(11,7) = 12
Esta não é a única regra de aproximação existente. Alguns autores
trabalham com uma subregra própria para tratar o caso específico
do algarismo 5 (cinco).

[xxii]
Razão é o mesmo que divisão (dizer “a razão entre dois
números” é o mesmo que dizer “a divisão entre dois números”). A
seguir temos um exemplo de como se escreve a razão entre os
números reais A e B (sendo que A está no numerador e B no
denominador).

A/B
[xxiii]
Foi dito “em havendo” pois a primeira classe não possui classe
anterior a ela (uma vez que ela é a primeira).

[xxiv]
Uma quilotonelada (símbolo kton) é uma unidade de medida de
massa que corresponde a 1.000 (mil) toneladas, sendo que 1 (uma)
tonelada corresponde a 1.000 (mil) quilogramas. Assim:
[xxv] A moda de uma distribuição é o valor que ocorre mais vezes
(i.e., o mais frequente na distribuição). Vejam o exemplo a seguir.

M = {0, 0, 0, 0, 1, 2, 4, 7}
Temos uma distribuição com 8 (oito) valores numéricos inteiros. A
moda desta distribuição é o 0 (zero), o qual aparece 4 (quatro)
vezes. Trata-se de uma distribuição monomodal ou unimodal.
Vejamos, agora, um exemplo de distribuição bimodal.

F = {1, 1, 3, 4, 5, 5, 6, 7}
Temos, novamente, uma distribuição com 8 (oito) valores numéricos
inteiros. É uma distribuição com duas modas, a saber: 1 (um) e 5
(cinco), os quais aparecem duas vezes cada um.

[xxvi]
Para este propósito, ano cheio é aquele que não considera
nem os meses nem os dias para o cálculo da idade, mas apenas o
fato do momento se dar antes ou depois da data de aniversário da
pessoa. Vamos supor que alguém faça aniversário no dia 30 (trinta)
de outubro (que faça cinquenta anos nesse dia). Se o
preenchimento da tabela fosse feito em 20 (vinte) de outubro essa
pessoa teria 49 (quarenta e nove) anos e se fosse feito em 10 (dez)
de novembro ela teria 50 (cinquenta) anos.

[xxvii]
Pseudo-código é uma escrita, em um dado idioma, dos passos
a serem seguidos para a resolução de um dado problema. Não se
trata de linguagem de programação, mas sim de instruções escritas
em um linguajar quotidiano. Estando de posse do pseudo-código
fica mais fácil passar para uma determinada linguagem de
programação (por exemplo, Python, C++ ou Perl).

[xxviii]
Notar que não é obrigatório montar um rol para efetuar tais
cálculos. No entanto, a montagem do rol facilita muito determinar,
por exemplo, qual é a moda e qual é o maior valor e o menor valor
da distribuição numérica (o que, por sua vez, permite calcular a
amplitude ou range da distribuição).

[xxix]
Aqui vemos uma diferença conceitual que existe em certas
linguagens de programação envolvendo dois símbolos, = (igual) e :=
(dois pontos igual). Para uma constante (como pi ou o número de
Euler) se usa o sinal de igualdade =. Porém, se faz uso de := para
algo que muda (ou pode mudar) de valor.
Vejam o exemplo a seguir.

Ler x
Ler y
Ant := 10
Se x > y Então Ant := Ant + 5
Exibir Ant

Inicialmente são lidos os valores reais de x e y e a variável Ant


recebe o valor 10 (dez). Então se faz um teste (com a estrutura Se-
Então). Caso x seja maior que y, Ant terá seu valor aumentado de 5,
Do contrário, Ant manterá o valor original 10. A quinta linha se
encarrega de exibir o valor de Ant após o teste ter sido feito (ou se
exibirá 10 ou se exibirá 15). Assim, Ant não é uma constante e por
isso não se usa o sinal de igualdade.

[xxx]INTE() é uma função que extrai a parte inteira de um número


real (antes da vírgula) e FRAC() é uma função que extrai a parte
fracionária de um número real (após a vírgula). Vejamos o seguinte
exemplo envolvendo o número real x.
x = 35,92
INTE(x) = INTE(35,92) = 35
FRAC(x) = FRAC(35,92) = 0,92
Assim, podemos escrever a seguinte igualdade.

x = INTE(x) + FRAC(x)
35,92 = 35 + 0,92
Notar que a extração da parte inteira não implica nenhum tipo de
arredondamento. Notar ainda que INTE() e ROUND() podem gerar
resultados diferentes quando aplicados ao mesmo valor numérico.
Vejamos um exemplo onde isso acontece.

x = 32,79
INTE(x) = INTE(32,79) = 32
ROUND(x) = ROUND(32,79) = 33
Logo, INTE(x) <> ROUND(x)

Já no exemplo seguinte as funções geram o mesmo resultado.

x = 4,256
INTE(x) = INTE(4,256) = 4
ROUND(x) = ROUND(4,256) = 4
Logo, INTE(x) = ROUND(x)

[xxxi]Vemos no título deste livro o acento circunflexo na palavra


emprêgo (atualmente grafada emprego, sem tal acento). Não se
trata, porém, de um erro ortográfico. Notar que o livro foi publicado
no ano de 1966 e, naquela época, se fazia largo uso do acento
diferencial entre as formas abertas e fechadas (por exemplo, o
pronome pessoal êle e o nome da letra ele, o substantivo comum
emprêgo e o verbo emprego da primeira pessoa do singular do
presente do indicativo e a preposição para e o verbo pára).
Infelizmente, com as malfadadas reformas ortográficas da língua
portuguesa, os acentos diferenciais praticamente foram extintos (e,
com isso, se perdeu uma importante função diferenciadora na
escrita).

[xxxii]
O mesmo que software. Trata-se de uma palavra muito pouco
usada (outro sinônimo, igualmente pouco usado, é logiciário).
Ambas são oriundas de uma época onde reinava a reserva de
mercado na Informática. Naqueles tempos também se tentou fazer
algo como uma reserva de mercado linguística na Eletrônica (a qual
não vingou). Outros exemplos foram:

- Ferramental (ao invés de hardware);

- TEC (Transistor de Efeito de Campo) ao invés de FET (Field-Effect


Transistor);

- TBJ (Transistor Bipolar de Junção) ao invés de BJT (Bipolar


Junction Transistor).

[xxxiii]
Era grafado microondas (sem hífen) antes da última reforma
ortográfica da língua portuguesa.

[xxxiv]A letra latina m minúscula também é usada no SI como


símbolo do prefixo mili (um milésimo, 1/1.000). Por exemplo: mm
(milímetro), mg (miligrama), mF (milifarad), mH (milihenry), mV
(milivolt).

miligrama -> prefixo mili (m) + unidade grama (g)


milifarad -> prefixo mili (m) + unidade farad (F)
milihenry -> prefixo mili (m) + unidade henry (H)
milivolt -> prefixo mili (m) + unidade volt (V)

No caso específico da unidade milímetro temos:

mm -> prefixo mili (m) + unidade metro (m)

A rigor, isso não deixa de ser uma ambiguidade (pois o prefixo mili
faz uso da mesma letra que a unidade metro, m minúsculo). No
entanto, é algo consagrado já faz mais de dois séculos (desde a
invenção do sistema métrico decimal na França revolucionária). Não
vejo como isso possa ser mudado (até pelo fato da letra M
maiúscula já ser usada no SI como símbolo do prefixo mega).

[xxxv]As formas bite e megabite são, respectivamente, as


aportuguesações do inglês bit e megabit (com a inserção das vogais
de apoio final e).

(substantivo comum inglês) bit + vogal de apoio final e


--> (substantivo comum português) bite

(substantivo comum inglês) megabit + vogal de apoio final e


--> (substantivo comum português) megabite

[xxxvi]
O byte é simbolizado pela letra latina B maiúscula (já o bite
pela letra latina b minúscula). De forma análoga a bite, existe a
aportuguesação baite. O megabyte (aportuguesado megabaite) é
um múltiplo do byte e corresponde a pouco mais de um milhão de
bytes.

OBS.: Apesar do prefixo SI mega (M) representar um milhão, o


megabyte não corresponde exatamente a um milhão de bytes. A
razão para isso está no uso da base 2 (dita base binária) ao invés
da base decimal (base dez).

10E+3 = 103 = 1.000

210 = 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 = 1.024
Notar que:

29 = 512 < 1.000


(ainda não chegamos a mil)

211 = 2.048 > 1.000


(já passamos de mil, mas 210 passou antes)

Dois elevado à décima potência (1.024) é a potência de dois mais


próxima de dez elevado ao cubo (1.000).
Este é um assunto vasto e repleto de considerações as mais
diversas. Ele será visto em profundidade em um livro que estou
escrevendo sobre unidades de medida aplicadas ao campo da
Ciência da Computação (o bite, o baite, o octeto, a palavra, etc).

[xxxvii]
É interessante notar que esta obrigatoriedade nem sempre é
seguida pelos profissionais e pelas empresas (o que eu,
particularmente, vejo como algo salutar). É comum, por exemplo,
expressar o diâmetro de canos em polegadas (in) e fazer referência
ao diâmetro em pés (ft) de antenas paraboloidais de micro-ondas. E
quem é da área técnica com certeza se lembra dos famosos
bastidores de 19 (dezenove) polegadas.

[xxxviii]
Se o sistema de coordenadas cartesianas for oblíquo não faz
sentido chamar o eixo YOY de vertical, mas sim de eixo oblíquo ou
eixo inclinado. De qualquer maneira, ele continua sendo o eixo das
ordenadas ou eixo dos ípsilons (só que agora se trata de ordenadas
oblíquas).

Sistema de Coordenadas Cartesianas Retangulares


(bidimensionais):
(Abscissa X, Ordenada Y)

Sistema de Coordenadas Cartesianas Oblíquas (bidimensionais):


(Abscissa Oblíqua X, Ordenada Oblíqua Y)

[xxxix]
Não estamos considerando neste trabalho a existência de
argumentos imaginários conforme é mostrado a seguir (onde j
representa a unidade imaginária, a raiz quadrada de menos um).
O uso de j como símbolo da unidade imaginária é oriundo da
Engenharia Elétrica (na Matemática se usa preferencialmente i).
Este uso de j na Engenharia decorre do fato da letra i representar
uma corrente elétrica (que é uma grandeza física de uso muito
frequente na Engenharia Eletroeletrônica).

[xl]
A palavra neoprefixo é um neologismo na língua portuguesa (de
neo, novo). Notar que o prefixo e- usa uma letra (e) e um hífen (-), o
que é algo inusitado no nosso idioma (se trata de um prefixo que
surgiu na língua inglesa e, em razão do desenvolvimento
tecnológico, foi adotado pela língua portuguesa). Será que com o
decorrer do tempo este prefixo perderá o hífen e será escrito apenas
e? Se vier a ocorrer teremos formas como elabo (ao invés de e-
labo), elivro (ao invés de e-livro), ecomércio (ao invés de e-
comércio) e egoverno (ao invés de e-governo).

[xli]
O inglês tem diversas palavras (oriundas do latim) terminadas em
um que fazem o plural em a (por exemplo, erratum plural errata,
curriculum plural curricula e bacterium plural bacteria). Datum, plural
data, é outro exemplo.

[xlii]
Do verbo inglês to sample + sufixo ar indicador da primeira
conjugação verbal.

to sample + ar -->> samplear


[xliii]
Do inglês. Inter + net. A grande rede mundial de computadores.
Em português, o mais correto é usar a forma internete com a letra e
ao final (muito embora internet seja quase que exclusivamente
usada).

internet (inglês) + e -->> internete (português)


É interessante observar que o próprio VOLP (Vocabulário
Ortográfico da Língua Portuguesa), da Academia Brasileira de
Letras, dicionariza a grafia internet (como um substantivo feminino).
Consultar a Busca no Vocabulário no web site da Academia
Brasileira de Letras (em http://www.academia.org.br/) para a devida
comprovação. Fiz tal comprovação em 29.09.2017 entrando com os
vocábulos internet e internete.

Você também pode gostar