Escolar Documentos
Profissional Documentos
Cultura Documentos
4 Raciocínio Logico RETIFICACAO PDF
4 Raciocínio Logico RETIFICACAO PDF
RACIOCÍNIO LÓGICO
1) AVALIAR A HABILIDADE DO
CANDIDATO EM ENTENDER A
ESTRUTURA LÓGICA DE RELAÇÕES
ARBITRÁRIAS ENTRE PESSOAS,
LUGARES, OBJETOS, EVENTOS OU
SITUAÇÕES FICTÍCIAS, BEM COMO
DEDUZIR NOVAS INFORMAÇÕES DAS
RELAÇÕES FORNECIDAS;
• O primeiro estágio pode ocorrer de m modos distintos. Quando os elementos de um determinado conjunto A forem
• O segundo estágio pode ocorrer de n modos distintos. algarismos, A = {0, 1, 2, 3, …, 9}, e com estes algarismos
pretendemos obter números, neste caso, os agrupamentos de 13
Desse modo, podemos dizer que o número de formas diferente e 31 são considerados distintos, pois indicam números diferentes.
que pode ocorrer em um acontecimento é igual ao produto m . n
Quando os elementos de um determinado conjunto A
forem pontos, A = {A1, A2, A3, A4, A5…, A9}, e com estes
Exemplo: Alice decidiu comprar um carro novo, e inicialmente pontos pretendemos obter retas, neste caso os agrupamentos
ela quer se decidir qual o modelo e a cor do seu novo veículo. Na são iguais, pois indicam a mesma reta.
concessionária onde Alice foi há 3 tipos de modelos que são do
interesse dela: Siena, Fox e Astra, sendo que para cada carro há Conclusão: Os agrupamentos...
5 opções de cores: preto, vinho, azul, vermelho e prata. Qual é o
número total de opções que Alice poderá fazer? 1. Em alguns problemas de contagem, quando os agrupamentos
se diferirem pela natureza de pelo menos um de seus elementos, os
Resolução: Segundo o Principio Fundamental da Contagem, agrupamentos serão considerados distintos.
Alice tem 3×5 opções para fazer, ou seja,ela poderá optar por 15 ac = ca, neste caso os agrupamentos são denominados
carros diferentes. Vamos representar as 15 opções na árvore de combinações.
possibilidades:
Pode ocorrer: O conjunto A é formado por pontos e o problema
é saber quantas retas esses pontos determinam.
Didatismo e Conhecimento 1
RACIOCÍNIO LÓGICO
2. Quando se diferir tanto pela natureza quanto pela ordem Multiplicando e dividindo por (n – k)!
de seus elementos, os problemas de contagem serão agrupados e
considerados distintos.
ac ≠ ca, neste caso os agrupamentos são denominados arranjos.
Fatorial: Na matemática, o fatorial de um número natural n, Note que n (n – 1) . (n – 2). ... .(n – k + 1) . (n – k)! = n!
representado por n!, é o produto de todos os inteiros positivos
menores ou iguais a n. A notação n! foi introduzida por Christian Podemos também escrever
Kramp em 1808. A função fatorial é normalmente definida por:
Permutações: Considere A como um conjunto com n
elementos. Os arranjos simples n a n dos elementos de A, são
denominados permutações simples de n elementos. De acordo com
a definição, as permutações têm os mesmos elementos. São os n
elementos de A. As duas permutações diferem entre si somente
Por exemplo, 5! = 1 . 2 . 3 . 4 . 5 = 120
pela ordem de seus elementos.
Note que esta definição implica em particular que 0! = 1,
porque o produto vazio, isto é, o produto de nenhum número é 1. Cálculo do número de permutação simples:
Deve-se prestar atenção neste valor, pois este faz com que a função
recursiva (n + 1)! = n! . (n + 1) funcione para n = 0. O número total de permutações simples de n elementos
Os fatoriais são importantes em análise combinatória. Por indicado por Pn, e fazendo k = n na fórmula An,k = n (n – 1) (n – 2)
exemplo, existem n! caminhos diferentes de arranjar n objetos . … . (n – k + 1), temos:
distintos numa sequência. (Os arranjos são chamados permutações)
E o número de opções que podem ser escolhidos é dado pelo Pn = An,n= n (n – 1) (n – 2) . … . (n – n + 1) = (n – 1) (n – 2)
coeficiente binomial. . … .1 = n!
Portanto: Pn = n!
Didatismo e Conhecimento 2
RACIOCÍNIO LÓGICO
Didatismo e Conhecimento 3
RACIOCÍNIO LÓGICO
06. (MACKENZIE) – Numa empresa existem 10 diretores, 03.
dos quais 6 estão sob suspeita de corrupção. Para que se analisem
as suspeitas, será formada uma comissão especial com 5 diretores,
na qual os suspeitos não sejam maioria. O número de possíveis Algarismos
comissões é:
(A) 66
(B) 72
(C) 90 Letras
(D) 120
(E) 124 As três letras poderão ser escolhidasde 5 . 5 . 5 =125 maneiras.
Os quatro algarismos poderão ser escolhidos de 5 . 4 . 3 . 2 =
07. (ESPCEX) – A equipe de professores de uma escola 120 maneiras.
possui um banco de questões de matemática composto de 5 O número total de senhas distintas, portanto, é igual a 125 .
questões sobre parábolas, 4 sobre circunferências e 4 sobre retas. 120 = 15.000.
De quantas maneiras distintas a equipe pode montar uma prova
com 8 questões, sendo 3 de parábolas, 2 de circunferências e 3 de 04.
retas? I) O número de cartões feitos por Cláudia foi
(A) 80
(B) 96
(C) 240
(D) 640 II) O número de cartões esperados por João era
(E) 1.280
Didatismo e Conhecimento 4
RACIOCÍNIO LÓGICO
IV) O número de possibilidades para se escolher 2 entre 3 MMC
restantes é
O mínimo múltiplo comum de dois ou mais números é o
menor número positivo que é múltiplo comum de todos os números
dados. Consideremos:
V) Assim, o número total de grupos que podem ser formados
- O número 6 e os seus múltiplos positivos:
é2.3=6
M*+ (6) = {6, 12, 18, 24, 30, 36, 42, 48, 54, ...}
09. - O número 8 e os seus múltiplos positivos:
M*+ (8) = {8, 16, 24, 32, 40, 48, 56, 64, ...}
10. Podemos descrever, agora, os múltiplos positivos comuns:
a) 9 . A*10,3 = 9 . 103 = 9 . 10 . 10 . 10 = 9000 M*+ (6) M*+ (8) = {24, 48, 72, ...}
b) 8 . A*9,3 = 8 . 93 = 8 . 9 . 9 . 9 = 5832
c) (a) – (b): 9000 – 5832 = 3168 Observando os múltiplos comuns, podemos identificar o
d) 9 . A9,3 = 9 . 9 . 8 . 7 = 4536 mínimo múltiplo comum dos números 6 e 8, ou seja: MMC (6,8)
e) (a) – (d): 9000 – 4536 = 4464 = 24
Outra técnica para o cálculo do MMC:
2) AVALIAR NOÇÕES BÁSICAS DOS Decomposição isolada em fatores primos
SEGUINTES ASSUNTOS: SUCESSÕES,
MÁXIMO DIVISOR COMUM E MÍNIMO Para obter o mmc de dois ou mais números por esse processo,
MÚLTIPLO COMUM; TEORIA DOS
procedemos da seguinte maneira:
CONJUNTOS; ANÁLISE COMBINATÓRIA;
- Decompomos cada número dado em fatores primos.
ESTATÍSTICA E PROBABILIDADE.
- O mmc é o produto dos fatores comuns e não-comuns, cada
um deles elevado ao seu maior expoente.
MDC e MMC Exemplo
Achar o mmc entre 18 e 120.
MDC – O máximo divisor comum de dois ou mais números é
o maior número que é divisor comum de todos os números dados.
Consideremos: 18 2 120 2 18 = 2 . 32
9 3 60 2 120 = 23 . 3 . 5
- o número 18 e os seus divisores naturais: 3 3 30 2
D+ (18) = {1, 2, 3, 6, 9, 18}. 1 15 3 mmc (18, 120) = 23 . 32 . 5 = 8 . 9 . 5 = 360
5 5
- o número 24 e os seus divisores naturais: 1
D+ (24) = {1, 2, 3, 4, 6, 8, 12, 24}.
Conjunto
Podemos descrever, agora, os divisores comuns a 18 e 24:
D+ (18) D+ (24) = {1, 2, 3, 6}.
Número de Elementos da União e da Intersecção de Conjuntos
Observando os divisores comuns, podemos identificar o maior
divisor comum dos números 18 e 24, ou seja: MDC (18,24) = 6. Dados dois conjuntos A e B, como vemos na figura abaixo,
podemos estabelecer uma relação entre os respectivos números de
Outra técnica para o cálculo do MDC: elementos.
Exemplo
Achar o mdc entre 300 e 504.
300 2 504 2 300 = 22 . 3 . 52
150 2 252 2 504 = 23 . 32 . 7
75 3 126 2
25 5 63 3 mdc (300, 504) = 22 . 3 = 4 . 3 = 12
5 5 21 3 Note que ao subtrairmos os elementos comuns
1 7 7
evitamos que eles sejam contados duas vezes.
1
Didatismo e Conhecimento 5
RACIOCÍNIO LÓGICO
Observações: Como representar um conjunto
a) Se os conjuntos A e B forem disjuntos ou se mesmo um Pela designação de seus elementos: Escrevemos os elementos
deles estiver contido no outro, ainda assim a relação dada será entre chaves, separando os por vírgula.
verdadeira.
b) Podemos ampliar a relação do número de elementos para Exemplos
três ou mais conjuntos com a mesma eficiência.
- {3, 6, 7, 8} indica o conjunto formado pelos elementos 3,
Observe o diagrama e comprove. 6, 7 e 8.
{a; b; m} indica o conjunto constituído pelos elementos a, b
e m.
{1; {2; 3}; {3}} indica o conjunto cujos elementos são 1, {2;
3} e {3}.
Uma vez que “tal que” pode ser denotado por t.q. ou | ou ainda
:, podemos indicar o mesmo conjunto por:
{x, t . q . x tem a propriedade P} ou, ainda,
{x : x tem a propriedade P}
Conjuntos
Exemplos
Conjuntos Primitivos
- { x, t.q. x é vogal } é o mesmo que {a, e, i, o, u}
Os conceitos de conjunto, elemento e pertinência são - {x | x é um número natural menor que 4 } é o mesmo que
primitivos, ou seja, não são definidos. {0, 1, 2, 3}
Um cacho de bananas, um cardume de peixes ou uma porção - {x : x em um número inteiro e x2 = x } é o mesmo que {0, 1}
de livros são todos exemplos de conjuntos.
Conjuntos, como usualmente são concebidos, têm elementos. Pelo diagrama de Venn-Euler: O diagrama de Venn-Euler
Um elemento de um conjunto pode ser uma banana, um peixe ou consiste em representar o conjunto através de um “círculo” de tal
um livro. Convém frisar que um conjunto pode ele mesmo ser forma que seus elementos e somente eles estejam no “círculo”.
elemento de algum outro conjunto.
Por exemplo, uma reta é um conjunto de pontos; um feixe de Exemplos
- Se A = {a, e, i, o, u} então
retas é um conjunto onde cada elemento (reta) é também conjunto
(de pontos).
Em geral indicaremos os conjuntos pelas letras maiúsculas A,
B, C, ..., X, e os elementos pelas letras minúsculas a, b, c, ..., x, y,
..., embora não exista essa obrigatoriedade.
Em Geometria, por exemplo, os pontos são indicados por
letras maiúsculas e as retas (que são conjuntos de pontos) por
letras minúsculas.
Outro conceito fundamental é o de relação de pertinência que
nos dá um relacionamento entre um elemento e um conjunto. - Se B = {0, 1, 2, 3 }, então
Didatismo e Conhecimento 6
RACIOCÍNIO LÓGICO
Conjunto Vazio Exemplos
Conjunto vazio é aquele que não possui elementos. Representa- - {2,4} = {4,2}, pois {2,4} ⊂ {4,2} e {4,2} ⊂ {2,4}. Isto
se pela letra do alfabeto norueguês 0/ ou, simplesmente { }. nos mostra que a ordem dos elementos de um conjunto não deve
ser levada em consideração. Em outras palavras, um conjunto
Simbolicamente: ∀ x, x ∉ 0/ fica determinado pelos elementos que o mesmo possui e não pela
ordem em que esses elementos são descritos.
Exemplos - {2,2,2,4} = {2,4}, pois {2,2,2,4} ⊂ {2,4} e {2,4} ⊂
{2,2,2,4}. Isto nos mostra que a repetição de elementos é
- 0/ = {x : x é um número inteiro e 3x = 1} desnecessária.
- 0/ = {x | x é um número natural e 3 – x = 4} - {a,a} = {a}
- 0/ = {x | x ≠ x} - {a,b = {a} ⇔ a= b
- {1,2} = {x,y} ⇔ (x = 1 e y = 2) ou (x = 2 e y = 1)
Subconjunto Conjunto das partes
Sejam A e B dois conjuntos. Se todo elemento de A é também Dado um conjunto A podemos construir um novo conjunto
elemento de B, dizemos que A é um subconjunto de B ou A é a formado por todos os subconjuntos (partes) de A. Esse novo
parte de B ou, ainda, A está contido em B e indicamos por A ⊂ B. conjunto chama-se conjunto dos subconjuntos (ou das partes) de A
Simbolicamente: A ⊂ B ⇔ ( ∀ x)(x ∈ ∀ ⇒ x ∈ B) e é indicado por P(A).
Simbolicamente: P(A)={X | X ⊂ A} ou X ⊂ P(A) ⇔ X ⊂ A
Portanto, A ⊄ B significa que A não é um subconjunto de B Exemplos
ou A não é parte de B ou, ainda, A não está contido em B.
Por outro lado, A ⊄ B se, e somente se, existe, pelo menos, a) = {2, 4, 6}
um elemento de A que não é elemento de B. P(A) = { 0/ , {2}, {4}, {6}, {2,4}, {2,6}, {4,6}, A}
Simbolicamente: A ⊄ B ⇔ ( ∃ x)(x ∈ A e x ∉ B)
b) = {3,5}
Exemplos P(B) = { 0/ , {3}, {5}, B}
c) = {8}
- {2 . 4} ⊂ {2, 3, 4}, pois 2 ∈ {2, 3, 4} e 4 ∈ {2, 3, 4} P(C) = { 0/ , C}
- {2, 3, 4} ⊄ {2, 4}, pois 3 ∉ {2, 4}
- {5, 6} ⊂ {5, 6}, pois 5 ∈ {5, 6} e 6 ∈ {5, 6} d) = 0/
P(D) = { 0/ }
Inclusão e pertinência
Propriedades
A definição de subconjunto estabelece um relacionamento 0/ o conjunto vazio. Valem as
Seja A um conjunto qualquer e
entre dois conjuntos e recebe o nome de relação de inclusão ( ⊂ ). seguintes propriedades
A relação de pertinência ( ∈ ) estabelece um relacionamento
entre um elemento e um conjunto e, portanto, é diferente da
relação de inclusão. 0/ ≠( 0/ ) 0/ ∉ 0/ 0/ ⊂ 0/ 0/ ∈ { 0/ }
Simbolicamente 0/ ⊂ A ⇔ 0/ ∈ P(A) A ⊂ A ⇔ A ∈ P(A)
x ∈ A ⇔ {x} ⊂ A
x ∉ A ⇔ {x} ⊄ A
Se A tem n elementos então A possui 2n subconjuntos e,
portanto, P(A) possui 2n elementos.
Igualdade
União de conjuntos
Sejam A e B dois conjuntos. Dizemos que A é igual a B e
indicamos por A = B se, e somente se, A é subconjunto de B e B é A união (ou reunião) dos conjuntos A e B é o conjunto formado
também subconjunto de A. por todos os elementos que pertencem a A ou a B. Representa-se
Simbolicamente: A = B ⇔ A ⊂ B e B ⊂ A por A ∪ B.
Demonstrar que dois conjuntos A e B são iguais equivale, Simbolicamente: A ∪ B = {X | X ∈ A ou X ∈ B}
segundo a definição, a demonstrar que A ⊂ B e B ⊂ A.
Segue da definição que dois conjuntos são iguais se, e somente
se, possuem os mesmos elementos.
Portanto A ≠ B significa que A é diferente de B. Portanto A ≠ B
se, e somente se, A não é subconjunto de B ou B não é subconjunto
de A. Simbolicamente: A ≠ B ⇔ A ⊄ B ou B ⊄ A
Didatismo e Conhecimento 7
RACIOCÍNIO LÓGICO
Exemplos - A = {1, 2, 3} e B = {2, 3, 4}
CAB = A – B = {1} e CBA = B – A = {14}
- {2,3} ∪ {4,5,6}={2,3,4,5,6}
- {2,3,4} ∪ {3,4,5}={2,3,4,5} - A = {0, 2, 4} e B = {1 ,3 ,5}
- {2,3} ∪ {1,2,3,4}={1,2,3,4} CAB = A – B = {0,2,4} e CBA = B – A = {1,3,5}
- {a,b} ∪ φ {a,b}
Observações: Alguns autores preferem utilizar o conceito de
Intersecção de conjuntos completar de B em relação a A somente nos casos em que B ⊂ A.
- Se B ⊂ A representa-se por B o conjunto complementar
A intersecção dos conjuntos A e B é o conjunto formado por de B em relação a A. Simbolicamente: B ⊂ A ⇔ B = A – B =
todos os elementos que pertencem, simultaneamente, a A e a B. CAB`
Representa-se por A ∩ B. Simbolicamente: A ∩ B = {X | X ∈ A
ou X ∈ B}
Exemplos
Exemplos
Seja S = {0, 1, 2, 3, 4, 5, 6}. Então:
- {2,3,4} ∩ {3,5}={3} a) A = {2, 3, 4} ⇒ A = {0, 1, 5, 6}
- {1,2,3} ∩ {2,3,4}={2,3}
b) B = {3, 4, 5, 6 } ⇒ B = {0, 1, 2}
- {2,3} ∩ {1,2,3,5}={2,3}
c) C = φ ⇒ C = S
- {2,4} ∩ {3,5,7}= φ
Número de elementos de um conjunto
Observação: Se A ∩ B= φ , dizemos que A e B são conjuntos
disjuntos.
Sendo X um conjunto com um número finito de elementos,
representa-se por n(X) o número de elementos de X. Sendo, ainda,
A e B dois conjuntos quaisquer, com número finito de elementos
temos:
n(A ∪ B)=n(A)+n(B)-n(A ∩ B)
A ∩ B= φ ⇒ n(A ∪ B)=n(A)+n(B)
n(A -B)=n(A)-n(A ∩ B)
Subtração B ⊂ A ⇒ n(A-B)=n(A)-n(B)
Didatismo e Conhecimento 8
RACIOCÍNIO LÓGICO
4. Sabendo-se que um conjunto A possui 1024 subconjuntos, 4) Resposta “10”.
quantos elementos possui o conjunto A? Solução: Se k é o número de elementos do conjunto A, então
2k é o número de subconjuntos de A.
5. 12 - Dados os conjuntos A = {1; 3; 4; 6}, B = {3; 4 ; 5; 7} e Assim sendo: 2k=1024 ⇔ 2k=210 ⇔ k=10.
C = {4; 5; 6; 8 } pede-se:
a) A ∪ B 5) Solução: Representando os conjuntos A, B e C através do
b) A ∩ B diagrama de Venn-Euler, temos:
c) A ∪ C a)
d) A ∩ C
Respostas d)
1) Resposta “E”.
Solução: A ligação entre elemento e conjunto é estabelecida
pela relação de pertinência ( ∈ ) e não pela relação de igualdade
(=). Assim sendo, 3 ∈ {3} e 3≠{3}. De um modo geral, x ≠ {x},
∀ x.
2) Solução:
a) Verdadeira, pois 2 é elemento de A. A ∩ C={4,6}
b) Falsa, pois {2} não é elemento de A.
c) Verdadeira, pois 3 é elemento de A. 6) Resposta “X={1;3;5}”.
d) Verdadeira, pois {3} é elemento de A. Solução: Como X ∩ A= φ e X ∪ A=S, então X= A
e) Falsa, pois 4 não é elemento de A. =S-A=CsA ⇒ X={1;3;5}
3) Resposta “32”.
Solução: Lembrando que: “Se A possui k elementos, então
A possui 2k subconjuntos”, concluímos que o conjunto A, de 5
elementos, tem 25 = 32 subconjuntos.
Didatismo e Conhecimento 9
RACIOCÍNIO LÓGICO
7) Resposta “X = {2;3;4} n(T’) = 5 (cinco tardes sem chuva)
Solução: Como A ⊂ X, então A ∪ X = X = {2;3;4}. n(M’) = 6 (seis manhãs sem chuva)
n(M Ç T) = 0 (pois quando chove pela manhã, não chove à
8) Resposta “A”. tarde)
Solução: De acordo com o enunciado, temos:
Daí:
Assim sendo
a) O número total de crianças da escola é:
n( A ∪ B ∪ C ∪ D ) = n( A) + n( B ) + n(C ) + n( D ) = 15 + 9 + 13 + 33 = 70
b) O número de crianças que são meninas ou são ruivas é: Em linhas gerais a Estatística fornece métodos que auxiliam
o processo de tomada de decisão através da análise dos dados que
n[( A ∪ B ) ∪ ( B ∪ D )] = n( A) + n( B ) + n( D ) = 15 + 9 + 33 = 57 possuímos.
Em Estatística, um resultado é significante, portanto, tem
10) Resposta “C”. significância estatística, se for improvável que tenha ocorrido por
Solução: acaso (que em estatística e probabilidade é tratado pelo conceito de
Seja M, o conjunto dos dias que choveu pela manhã e T o chance), caso uma determinada hipótese nula seja verdadeira, mas
conjunto dos dias que choveu à tarde. Chamando de M’ e T’ os não sendo improvável caso a hipótese base seja falsa. A expressão
conjuntos complementares de M e T respectivamente, temos: teste de significância foi cunhada por Ronald Fisher.
Didatismo e Conhecimento 10
RACIOCÍNIO LÓGICO
Mais concretamente, no teste de hipóteses com base em Regressão: Regressão linear - Regressão não-linear -
frequência estatística, a significância de um teste é a probabilidade Regressão logística - Método dos mínimos quadrados - Modelos
máxima de rejeitar acidentalmente uma hipótese nula verdadeira Lineares Generalizados - Modelos para Dados Longitudinais.
(uma decisão conhecida como erro de tipo I). O nível de - Análise Multivariada: Distribuição normal multivariada -
significância de um resultado é também chamado de α e não deve Componentes principais - Análise fatorial - Análise discriminante
ser confundido com o valor p (p-value). - Análise de “Cluster” (Análise de agrupamento) - Análise de
Por exemplo, podemos escolher um nível de significância de, Correspondência.
digamos, 5%, e calcular um valor crítico de um parâmetro (por - Séries Temporais: Modelos para séries temporais - Tendência
e sazonalidade - Modelos de suavização exponencial - ARIMA -
exemplo a média) de modo que a probabilidade de ela exceder esse
Modelos sazonais.
valor, dada a verdade da hipótese nulo, ser 5%. Se o valor estatístico
calculado (ou seja, o nível de 5% de significância anteriormente Panorama Geral:
escolhido) exceder o valor crítico, então é significante “ao nível
de 5%”. Variáveis: São características que são medidas, controladas
Se o nível de significância (ex: 5% anteriormente dado) é ou manipuladas em uma pesquisa. Diferem em muitos aspectos,
menor, o valor é menos provavelmente um extremo em relação principalmente no papel que a elas é dado em uma pesquisa e na
ao valor crítico. Deste modo, um resultado que é “significante forma como podem ser medidas.
ao nível de 1%” é mais significante do que um resultado que é
significante “ao nível de 5%”. No entanto, um teste ao nível de 1% Pesquisa “Correlacional” X Pesquisa “Experimental”:
é mais susceptível de padecer do erro de tipo II do que um teste de A maioria das pesquisas empíricas pertencem claramente a uma
5% e por isso terá menos poder estatístico. dessas duas categorias gerais: em uma pesquisa correlacional
Ao divisar um teste de hipóteses, o técnico deverá tentar (Levantamento) o pesquisador não influencia (ou tenta não
maximizar o poder de uma dada significância, mas ultimamente influenciar) nenhuma variável, mas apenas as mede e procura por
tem de reconhecer que o melhor resultado que se pode obter é um relações (correlações) entre elas, como pressão sangüínea e nível
compromisso entre significância e poder, em outras palavras, entre de colesterol. Em uma pesquisa experimental (Experimento) o
os erros de tipo I e tipo II. pesquisador manipula algumas variáveis e então mede os efeitos
É importante ressaltar que os valores p Fisherianos são desta manipulação em outras variáveis; por exemplo, aumentar
artificialmente a pressão sangüínea e registrar o nível de colesterol.
filosoficamente diferentes dos erros de tipo I de Neyman-Pearson.
A análise dos dados em uma pesquisa experimental também calcula
Esta confusão é infelizmente propagada por muitos livros de
“correlações” entre variáveis, especificamente entre aquelas
estatística. manipuladas e as que foram afetadas pela manipulação. Entretanto,
os dados experimentais podem demonstrar conclusivamente
Divisão da Estatística: relações causais (causa e efeito) entre variáveis. Por exemplo,
se o pesquisador descobrir que sempre que muda a variável A
- Estatística Descritiva: Média (Aritmética, Geométrica, então a variável B também muda, então ele poderá concluir que
Harmônica, Ponderada) - Mediana - Moda - Variância - Desvio A “influencia” B. Dados de uma pesquisa correlacional podem
padrão - Coeficiente de variação. ser apenas “interpretados” em termos causais com base em outras
- Inferência Estatística: Testes de hipóteses - Significância teorias (não estatísticas) que o pesquisador conheça, mas não
- Potência - Hipótese nula/Hipótese alternativa - Erro de tipo I - podem ser conclusivamente provar causalidade.
Erro de tipo II - Teste T - Teste Z - Distribuição t de Student -
Normalização - Valor p - Análise de variância. Variáveis dependentes e variáveis independentes: Variáveis
- Estatística Não-Paramétrica: Teste Binomial - Teste Qui- independentes são aquelas que são manipuladas enquanto que
quadrado (uma amostra, duas amostras independentes, k amostras variáveis dependentes são apenas medidas ou registradas. Esta
independentes) - Teste Kolmogorov-Smirnov (uma amostra, duas distinção confunde muitas pessoas que dizem que “todas variáveis
amostras independentes) - Teste de McNemar - Teste dos Sinais - dependem de alguma coisa”. Entretanto, uma vez que se esteja
Teste de Wilcoxon - Teste de Walsh - Teste Exata de Fisher - Teste acostumado a esta distinção ela se torna indispensável. Os termos
variável dependente e independente aplicam-se principalmente à
Q de Cochran - Teste de Kruskal-Wallis - Teste de Friedman.
pesquisa experimental, onde algumas variáveis são manipuladas,
- Análise da Sobrevivência: Função de sobrevivência -
e, neste sentido, são “independentes” dos padrões de reação
Kaplan-Meier - Teste log-rank - Taxa de falha - Proportional inicial, intenções e características dos sujeitos da pesquisa
hazards models. (unidades experimentais).Espera-se que outras variáveis sejam
- Amostragem: Amostragem aleatória simples (com reposição, “dependentes” da manipulação ou das condições experimentais.
sem reposição) - Amostragem estratificada - Amostragem por Ou seja, elas dependem “do que os sujeitos farão” em resposta.
conglomerados - Amostragem sistemática - estimador razão - Contrariando um pouco a natureza da distinção, esses termos
estimador regressão. também são usados em estudos em que não se manipulam variáveis
- Distribuição de Probabilidade: Normal - De Pareto - De independentes, literalmente falando, mas apenas se designam
Poisson - De Bernoulli - Hipergeométrica - Binomial - Binomial sujeitos a “grupos experimentais” baseados em propriedades pré-
negativa - Gama - Beta - t de Student - F-Snedecor. existentes dos próprios sujeitos. Por exemplo, se em uma pesquisa
- Correlação: Variável de confusão - Coeficiente de correlação compara-se a contagem de células brancas (White Cell Count em
de Pearson - Coeficiente de correlação de postos de Spearman - inglês, WCC) de homens e mulheres, sexo pode ser chamada de
Coeficiente de correlação tau de Kendall). variável independente e WCC de variável dependente.
Didatismo e Conhecimento 11
RACIOCÍNIO LÓGICO
Níveis de Mensuração: As variáveis diferem em “quão bem” Aspectos básicos da relação entre variáveis: As duas
elas podem ser medidas, isto é, em quanta informação seu nível propriedades formais mais elementares de qualquer relação entre
de mensuração pode prover. Há obviamente algum erro em cada variáveis são a magnitude (“tamanho”) e a confiabilidade da
medida, o que determina o “montante de informação” que se pode relação.
obter, mas basicamente o fator que determina a quantidade de - Magnitude é muito mais fácil de entender e medir do que a
informação que uma variável pode prover é o seu tipo de nível de confiabilidade. Por exemplo, se cada homem em nossa amostra
mensuração. Sob este prisma as variáveis são classificadas como tem um WCC maior do que o de qualquer mulher da amostra,
nominais, ordinais e intervalares. poderia-se dizer que a magnitude da relação entre as duas variáveis
- Variáveis nominais permitem apenas classificação (sexo e WCC) é muito alta em nossa amostra. Em outras palavras,
qualitativa. Ou seja, elas podem ser medidas apenas em termos
poderia-se prever uma baseada na outra (ao menos na amostra em
de quais itens pertencem a diferentes categorias, mas não se pode
quantificar nem mesmo ordenar tais categorias. Por exemplo, pode- questão).
se dizer que 2 indivíduos são diferentes em termos da variável A - Confiabilidade é um conceito muito menos intuitivo, mas
(sexo, por exemplo), mas não se pode dizer qual deles “tem mais” extremamente importante. Relaciona-se à “representatividade”
da qualidade representada pela variável. Exemplos típicos de do resultado encontrado em uma amostra específica de toda a
variáveis nominais são sexo, raça, cidade, etc. população. Em outras palavras, diz quão provável será encontrar
- Variáveis ordinais permitem ordenar os itens medidos uma relação similar se o experimento fosse feito com outras
em termos de qual tem menos e qual tem mais da qualidade amostras retiradas da mesma população, lembrando que o maior
representada pela variável, mas ainda não permitem que se diga interesse está na população. O interesse na amostra reside na
“o quanto mais”. Um exemplo típico de uma variável ordinal é o informação que ela pode prover sobre a população. Se o estudo
status sócio-econômico das famílias residentes em uma localidade: atender certos critérios específicos (que serão mencionados
sabe-se que média-alta é mais “alta” do que média, mas não se posteriormente) então a confiabilidade de uma relação observada
pode dizer, por exemplo, que é 18% mais alta. A própria distinção entre variáveis na amostra pode ser estimada quantitativamente e
entre mensuração nominal, ordinal e intervalar representa um bom representada usando uma medida padrão (chamada tecnicamente
exemplo de uma variável ordinal: pode-se dizer que uma medida de nível-p ou nível de significância estatística).
nominal provê menos informação do que uma medida ordinal,
mas não se pode dizer “quanto menos” ou como esta diferença se Significância Estatística (nível-p): A significância estatística
compara à diferença entre mensuração ordinal e intervalar.
de um resultado é uma medida estimada do grau em que este
- Variáveis intervalares permitem não apenas ordenar em
resultado é “verdadeiro” (no sentido de que seja realmente o que
postos os itens que estão sendo medidos, mas também quantificar
e comparar o tamanho das diferenças entre eles. Por exemplo, ocorre na população, ou seja no sentido de “representatividade da
temperatura, medida em graus Celsius constitui uma variável população”). Mais tecnicamente, o valor do nível-p representa um
intervalar. Pode-se dizer que a temperatura de 40C é maior do que índice decrescente da confiabilidade de um resultado. Quanto mais
30C e que um aumento de 20C para 40C é duas vezes maior do que alto o nível-p, menos se pode acreditar que a relação observada
um aumento de 30C para 40C. entre as variáveis na amostra é um indicador confiável da relação
entre as respectivas variáveis na população. Especificamente, o
Relações entre variáveis: Duas ou mais variáveis quaisquer nível-p representa a probabilidade de erro envolvida em aceitar o
estão relacionadas se em uma amostra de observações os valores resultado observado como válido, isto é, como “representativo da
dessas variáveis são distribuídos de forma consistente. Em população”. Por exemplo, um nível-p de 0,05 (1/20) indica que há
outras palavras, as variáveis estão relacionadas se seus valores 5% de probabilidade de que a relação entre as variáveis, encontrada
correspondem sistematicamente uns aos outros para aquela amostra na amostra, seja um “acaso feliz”. Em outras palavras, assumindo
de observações. Por exemplo, sexo e WCC seriam relacionados se que não haja relação entre aquelas variáveis na população, e o
a maioria dos homens tivesse alta WCC e a maioria das mulheres experimento de interesse seja repetido várias vezes, poderia-se
baixa WCC, ou vice-versa; altura é relacionada ao peso porque esperar que em aproximadamente 20 realizações do experimento
tipicamente indivíduos altos são mais pesados do que indivíduos haveria apenas uma em que a relação entre as variáveis em questão
baixos; Q.I. está relacionado ao número de erros em um teste se
seria igual ou mais forte do que a que foi observada naquela
pessoas com Q.I.’s mais altos cometem menos erros.
amostra anterior. Em muitas áreas de pesquisa, o nível-p de 0,05 é
Importância das relações entre variáveis: Geralmente costumeiramente tratado como um “limite aceitável” de erro.
o objetivo principal de toda pesquisa ou análise científica é
encontrar relações entre variáveis. A filosofia da ciência ensina Como determinar que um resultado é “realmente”
que não há outro meio de representar “significado” exceto em significante: Não há meio de evitar arbitrariedade na decisão
termos de relações entre quantidades ou qualidades, e ambos final de qual nível de significância será tratado como realmente
os casos envolvem relações entre variáveis. Assim, o avanço da “significante”. Ou seja, a seleção de um nível de significância acima
ciência sempre tem que envolver a descoberta de novas relações do qual os resultados serão rejeitados como inválidos é arbitrária.
entre variáveis. Em pesquisas correlacionais a medida destas Na prática, a decisão final depende usualmente de: se o resultado
relações é feita de forma bastante direta, bem como nas pesquisas foi previsto a priori ou apenas a posteriori no curso de muitas
experimentais. Por exemplo, o experimento já mencionado de análises e comparações efetuadas no conjunto de dados; no total
comparar WCC em homens e mulheres pode ser descrito como de evidências consistentes do conjunto de dados; e nas “tradições”
procura de uma correlação entre 2 variáveis: sexo e WCC. A existentes na área particular de pesquisa. Tipicamente, em muitas
Estatística nada mais faz do que auxiliar na avaliação de relações ciências resultados que atingem nível-p 0,05 são considerados
entre variáveis. estatisticamente significantes, mas este nível ainda envolve uma
Didatismo e Conhecimento 12
RACIOCÍNIO LÓGICO
probabilidade de erro razoável (5%). Resultados com um nível-p Observando um exemplo mais geral. Imagine-se uma
0,01 são comumente considerados estatisticamente significantes, população teórica em que a média de WCC em homens e mulheres
e com nível-p 0,005 ou nível-p 0,001 são freqüentemente é exatamente a mesma. Supondo um experimento em que se retiram
chamados “altamente” significantes. Estas classificações, porém, pares de amostras (homens e mulheres) de um certo tamanho da
são convenções arbitrárias e apenas informalmente baseadas em população e calcula-se a diferença entre a média de WCC em cada
experiência geral de pesquisa. Uma conseqüência óbvia é que um par de amostras (supor ainda que o experimento será repetido várias
resultado considerado significante a 0,05, por exemplo, pode não vezes). Na maioria dos experimento os resultados das diferenças
sê-lo a 0,01. serão próximos de zero. Contudo, de vez em quando, um par
de amostra apresentará uma diferença entre homens e mulheres
Significância estatística e o número de análises realizadas: consideravelmente diferente de zero. Com que freqüência isso
Desnecessário dizer quanto mais análises sejam realizadas em acontece? Quanto menor a amostra em cada experimento maior a
um conjunto de dados, mais os resultados atingirão “por acaso” probabilidade de obter esses resultados errôneos, que, neste caso,
o nível de significância convencionado. Por exemplo, ao calcular
indicariam a existência de uma relação entre sexo e WCC obtida
correlações entre dez variáveis (45 diferentes coeficientes de
de uma população em que tal relação não existe. Observe-se mais
correlação), seria razoável esperar encontrar por acaso que cerca de
um exemplo (“razão meninos para meninas”, Nisbett et al., 1987):
dois (um em cada 20) coeficientes de correlação são significantes
Há dois hospitais: no primeiro nascem 120 bebês a cada dia
ao nível-p 0,05, mesmo que os valores das variáveis sejam
totalmente aleatórios, e aquelas variáveis não se correlacionem e no outro apenas 12. Em média a razão de meninos para meninas
na população. Alguns métodos estatísticos que envolvem muitas nascidos a cada dia em cada hospital é de 50/50. Contudo, certo
comparações, e portanto uma boa chance para tais erros, incluem dia, em um dos hospitais nasceram duas vezes mais meninas do
alguma “correção” ou ajuste para o número total de comparações. que meninos. Em que hospital isso provavelmente aconteceu?
Entretanto, muitos métodos estatísticos (especialmente análises A resposta é óbvia para um estatístico, mas não tão óbvia para
exploratórias simples de dados) não oferecem nenhum remédio os leigos: é muito mais provável que tal fato tenha ocorrido no
direto para este problema. Cabe então ao pesquisador avaliar hospital menor. A razão para isso é que a probabilidade de um
cuidadosamente a confiabilidade de descobertas não esperadas. desvio aleatório da média da população aumenta com a diminuição
do tamanho da amostra (e diminui com o aumento do tamanho da
Força X Confiabilidade de uma relação entre variáveis: amostra).
Foi dito anteriormente que força (magnitude) e confiabilidade
são dois aspectos diferentes dos relacionamentos entre variáveis. Por que pequenas relações podem ser provadas como
Contudo, eles não são totalmente independentes. Em geral, em significantes apenas por grandes amostras: Os exemplos dos
uma amostra de um certo tamanho quanto maior a magnitude da parágrafos anteriores indicam que se um relacionamento entre
relação entre variáveis, mais confiável a relação. as variáveis em questão (na população) é pequeno, então não
Assumindo que não há relação entre as variáveis na população, há meio de identificar tal relação em um estudo a não ser que a
o resultado mais provável deveria ser também não encontrar amostra seja correspondentemente grande. Mesmo que a amostra
relação entre as mesmas variáveis na amostra da pesquisa. Assim, seja de fato “perfeitamente representativa” da população o efeito
quanto mais forte a relação encontrada na amostra menos provável não será estatisticamente significante se a amostra for pequena.
é a não existência da relação correspondente na população. Então Analogamente, se a relação em questão é muito grande na
a magnitude e a significância de uma relação aparentam estar população então poderá ser constatada como altamente significante
fortemente relacionadas, e seria possível calcular a significância a mesmo em um estudo baseado em uma pequena amostra. Mais um
partir da magnitude e vice-versa. Entretanto, isso é válido apenas exemplo:
se o tamanho da amostra é mantido constante, porque uma relação
Se uma moeda é ligeiramente viciada, de tal forma que
de certa força poderia ser tanto altamente significante ou não
quando lançada é ligeiramente mais provável que ocorram caras
significante de todo dependendo do tamanho da amostra.
do que coroas (por exemplo uma proporção 60% para 40%). Então
dez lançamentos não seriam suficientes para convencer alguém de
Por que a significância de uma relação entre variáveis
depende do tamanho da amostra: Se há muito poucas observações que a moeda é viciada, mesmo que o resultado obtido (6 caras
então há também poucas possibilidades de combinação dos e 4 coroas) seja perfeitamente representativo do viesamento da
valores das variáveis, e então a probabilidade de obter por acaso moeda. Entretanto, dez lançamentos não são suficientes para
uma combinação desses valores que indique uma forte relação é provar nada? Não, se o efeito em questão for grande o bastante, os
relativamente alta. Considere-se o seguinte exemplo: dez lançamentos serão suficientes. Por exemplo, imagine-se que a
Há interesse em duas variáveis (sexo: homem, mulher; WCC: moeda seja tão viciada que não importe como venha a ser lançada
alta, baixa) e há apenas quatro sujeitos na amostra (2 homens e 2 o resultado será cara. Se tal moeda fosse lançada dez vezes, e cada
mulheres). A probabilidade de se encontrar, puramente por acaso, lançamento produzisse caras, muitas pessoas considerariam isso
uma relação de 100% entre as duas variáveis pode ser tão alta quanto prova suficiente de que há “algo errado” com a moeda. Em outras
1/8. Explicando, há uma chance em oito de que os dois homens palavras, seria considerada prova convincente de que a população
tenham alta WCC e que as duas mulheres tenham baixa WCC, ou teórica de um número infinito de lançamentos desta moeda teria
vice-versa, mesmo que tal relação não exista na população. Agora mais caras do que coroas. Assim, se a relação é grande, então
considere-se a probabilidade de obter tal resultado por acaso se poderá ser considerada significante mesmo em uma pequena
a amostra consistisse de 100 sujeitos: a probabilidade de obter amostra.
aquele resultado por acaso seria praticamente zero.
Didatismo e Conhecimento 13
RACIOCÍNIO LÓGICO
Pode uma “relação inexistente” ser um resultado “Formato geral” de muitos testes estatísticos: Como o
significante: Quanto menor a relação entre as variáveis maior objetivo principal de muitos testes estatísticos é avaliar relações
o tamanho de amostra necessário para prová-la significante. Por entre variáveis, muitos desses testes seguem o princípio exposto no
exemplo, imagine-se quantos lançamentos seriam necessários para item anterior. Tecnicamente, eles representam uma razão de alguma
provar que uma moeda é viciada se seu viesamento for de apenas medida da diferenciação comum nas variáveis em análise (devido
0,000001 %! Então, o tamanho mínimo de amostra necessário à sua relação) pela diferenciação global daquelas variáveis. Por
cresce na mesma proporção em que a magnitude do efeito a ser exemplo, teria-se uma razão da parte da diferenciação global dos
demonstrado decresce. Quando a magnitude do efeito aproxima-se valores de WCC que podem se dever ao sexo pela diferenciação
de zero, o tamanho de amostra necessário para prová-lo aproxima- global dos valores de WCC. Esta razão é usualmente chamada
se do infinito. Isso quer dizer que, se quase não há relação entre duas de razão da variação explicada pela variação total. Em estatística
variáveis o tamanho da amostra precisa quase ser igual ao tamanho o termo variação explicada não implica necessariamente que tal
da população, que teoricamente é considerado infinitamente variação é “compreendida conceitualmente”. O termo é usado
grande. A significância estatística representa a probabilidade de
apenas para denotar a variação comum às variáveis em questão, ou
que um resultado similar seja obtido se toda a população fosse
seja, a parte da variação de uma variável que é “explicada” pelos
testada. Assim, qualquer coisa que fosse encontrada após testar
valores específicos da outra variável e vice-versa.
toda a população seria, por definição, significante ao mais alto
nível possível, e isso também inclui todos os resultados de “relação
inexistente”. Como é calculado o nível de significância estatístico:
Assuma-se que já tenha sido calculada uma medida da relação entre
Como medir a magnitude (força) das relações entre duas variáveis (como explicado acima). A próxima questão é “quão
variáveis: Há muitas medidas da magnitude do relacionamento significante é esta relação”? Por exemplo, 40% da variação global
entre variáveis que foram desenvolvidas por estatísticos: a escolha ser explicada pela relação entre duas variáveis é suficiente para
de uma medida específica em dadas circunstâncias depende do considerar a relação significante? “Depende”. Especificamente,
número de variáveis envolvidas, níveis de mensuração usados, a significância depende principalmente do tamanho da amostra.
natureza das relações, etc. Quase todas, porém, seguem um Como já foi explicado, em amostras muito grandes mesmo relações
princípio geral: elas procuram avaliar a relação comparando-a de muito pequenas entre variáveis serão significantes, enquanto que
alguma forma com a “máxima relação imaginável” entre aquelas em amostras muito pequenas mesmo relações muito grandes não
variáveis específicas. Tecnicamente, um modo comum de realizar poderão ser consideradas confiáveis (significantes). Assim, para
tais avaliações é observar quão diferenciados são os valores das determinar o nível de significância estatística torna-se necessária
variáveis, e então calcular qual parte desta “diferença global uma função que represente o relacionamento entre “magnitude” e
disponível” seria detectada na ocasião se aquela diferença fosse “significância” das relações entre duas variáveis, dependendo do
“comum” (fosse apenas devida à relação entre as variáveis) nas tamanho da amostra. Tal função diria exatamente “quão provável é
duas (ou mais) variáveis em questão. Falando menos tecnicamente, obter uma relação de dada magnitude (ou maior) de uma amostra
compara-se “o que é comum naquelas variáveis” com “o que de dado tamanho, assumindo que não há tal relação entre aquelas
potencialmente poderia haver em comum se as variáveis fossem variáveis na população”. Em outras palavras, aquela função
perfeitamente relacionadas”. Outro exemplo: forneceria o nível de significância (nível-p), e isso permitiria
Em uma amostra o índice médio de WCC é igual a 100 em conhecer a probabilidade de erro envolvida em rejeitar a idéia de
homens e 102 em mulheres. Assim, poderia-se dizer que, em que a relação em questão não existe na população. Esta hipótese
média, o desvio de cada valor da média de ambos (101) contém “alternativa” (de que não há relação na população) é usualmente
uma componente devida ao sexo do sujeito, e o tamanho desta
chamada de hipótese nula. Seria ideal se a função de probabilidade
componente é 1. Este valor, em certo sentido, representa uma
fosse linear, e por exemplo, apenas tivesse diferentes inclinações
medida da relação entre sexo e WCC. Contudo, este valor é uma
para diferentes tamanhos de amostra. Infelizmente, a função é
medida muito pobre, porque não diz quão relativamente grande é
aquela componente em relação à “diferença global” dos valores de mais complexa, e não é sempre exatamente a mesma. Entretanto,
WCC. Há duas possibilidades extremas: S em muitos casos, sua forma é conhecida e isso pode ser usado para
- Se todos os valore de WCC de homens são exatamente determinar os níveis de significância para os resultados obtidos
iguais a 100 e os das mulheres iguais a 102 então todos os desvios em amostras de certo tamanho. Muitas daquelas funções são
da média conjunta na amostra seriam inteiramente causados pelo relacionadas a um tipo geral de função que é chamada de normal
sexo. Poderia-se dizer que nesta amostra sexo é perfeitamente (ou gaussiana).
correlacionado a WCC, ou seja, 100% das diferenças observadas
entre os sujeitos relativas a suas WCC’s devem-se a seu sexo. Por que a distribuição normal é importante: A “distribuição
- Se todos os valores de WCC estão em um intervalo de 0 a normal” é importante porque em muitos casos ela se aproxima bem
1000, a mesma diferença (de 2) entre a WCC média de homens da função introduzida no item anterior. A distribuição de muitas
e mulheres encontrada no estudo seria uma parte tão pequena estatísticas de teste é normal ou segue alguma forma que pode ser
na diferença global dos valores que muito provavelmente seria derivada da distribuição normal. Neste sentido, filosoficamente,
considerada desprezível. Por exemplo, um sujeito a mais que a distribuição normal representa uma das elementares “verdades
fosse considerado poderia mudar, ou mesmo reverter, a direção da acerca da natureza geral da realidade”, verificada empiricamente,
diferença. Portanto, toda boa medida das relações entre variáveis e seu status pode ser comparado a uma das leis fundamentais
tem que levar em conta a diferenciação global dos valores das ciências naturais. A forma exata da distribuição normal (a
individuais na amostra e avaliar a relação em termos (relativos) de característica “curva do sino”) é definida por uma função que tem
quanto desta diferenciação se deve à relação em questão. apenas dois parâmetros: média e desvio padrão.
Didatismo e Conhecimento 14
RACIOCÍNIO LÓGICO
Uma propriedade característica da distribuição normal é que Como se conhece as consequências de violar a suposição de
68% de todas as suas observações caem dentro de um intervalo normalidade: Embora muitas das declarações feitas anteriormente
de 1 desvio padrão da média, um intervalo de 2 desvios padrões possam ser provadas matematicamente, algumas não têm provas
inclui 95% dos valores, e 99% das observações caem dentro de teóricas e podem demonstradas apenas empiricamente via
um intervalo de 3 desvios padrões da média. Em outras palavras, experimentos Monte Carlo (simulações usando geração aleatória
em uma distribuição normal as observações que tem um valor de números). Nestes experimentos grandes números de amostras
padronizado de menos do que -2 ou mais do que +2 tem uma são geradas por um computador seguindo especificações pré-
freqüência relativa de 5% ou menos (valor padronizado significa designadas e os resultados de tais amostras são analisados usando
que um valor é expresso em termos de sua diferença em relação à uma grande variedade de testes. Este é o modo empírico de avaliar
média, dividida pelo desvio padrão). o tipo e magnitude dos erros ou viesamentos a que se expõe o
pesquisador quando certas suposições teóricas dos testes usados
Ilustração de como a distribuição normal é usada em não são verificadas nos dados sob análise. Especificamente, os
raciocínio estatístico (indução): Retomando o exemplo já estudos de Monte Carlo foram usados extensivamente com testes
discutido, onde pares de amostras de homens e mulheres foram baseados na distribuição normal para determinar quão sensíveis
retirados de uma população em que o valor médio de WCC em eles eram à violações da suposição de que as variáveis analisadas
homens e mulheres era exatamente o mesmo. Embora o resultado tinham distribuição normal na população. A conclusão geral destes
mais provável para tais experimentos (um par de amostras por estudos é que as conseqüências de tais violações são menos severas
experimento) é que a diferença entre a WCC média em homens do que se tinha pensado a princípio. Embora estas conclusões não
e mulheres em cada par seja próxima de zero, de vez em quando devam desencorajar ninguém de se preocupar com a suposição
um par de amostras apresentará uma diferença substancialmente de normalidade, elas aumentaram a popularidade geral dos testes
diferente de zero. Quão freqüentemente isso ocorre? Se o tamanho estatísticos dependentes da distribuição normal em todas as áreas
da amostra é grande o bastante, os resultados de tais repetições de pesquisa.
são “normalmente distribuídos”, e assim, conhecendo a forma da
Objeto da Estatística: Estatística é uma ciência exata que
curva normal pode-se calcular precisamente a probabilidade de
visa fornecer subsídios ao analista para coletar, organizar, resumir,
obter “por acaso” resultados representando vários níveis de desvio
analisar e apresentar dados. Trata de parâmetros extraídos da
da hipotética média populacional 0 (zero). Se tal probabilidade
população, tais como média ou desvio padrão. A estatística
calculada é tão pequena que satisfaz ao critério previamente aceito
fornece-nos as técnicas para extrair informação de dados, os
de significância estatística, então pode-se concluir que o resultado quais são muitas vezes incompletos, na medida em que nos dão
obtido produz uma melhor aproximação do que está acontecendo informação útil sobre o problema em estudo, sendo assim, é
na população do que a “hipótese nula”. Lembrando ainda que objetivo da Estatística extrair informação dos dados para obter uma
a hipótese nula foi considerada apenas por “razões técnicas” melhor compreensão das situações que representam. Quando se
como uma referência contra a qual o resultado empírico (dos aborda uma problemática envolvendo métodos estatísticos, estes
experimentos) foi avaliado. devem ser utilizados mesmo antes de se recolher a amostra, isto
é, deve-se planejar a experiência que nos vai permitir recolher os
Todos os testes estatísticos são normalmente distribuídos: dados, de modo que, posteriormente, se possa extrair o máximo de
Não todos, mas muitos são ou baseados na distribuição normal informação relevante para o problema em estudo, ou seja, para a
diretamente ou em distribuições a ela relacionadas, e que podem ser população de onde os dados provêm. Quando de posse dos dados,
derivadas da normal, como as distribuições t, F ou Chi-quadrado procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando
(Qui-quadrado). Tipicamente, estes testes requerem que as de lado a aleatoriedade presente. Seguidamente o objetivo do
variáveis analisadas sejam normalmente distribuídas na população, estudo estatístico pode ser o de estimar uma quantidade ou testar
ou seja, que elas atendam à “suposição de normalidade”. Muitas uma hipótese, utilizando-se técnicas estatísticas convenientes,
variáveis observadas realmente são normalmente distribuídas, o as quais realçam toda a potencialidade da Estatística, na medida
que é outra razão por que a distribuição normal representa uma em que vão permitir tirar conclusões acerca de uma população,
“característica geral” da realidade empírica. O problema pode baseando-se numa pequena amostra, dando-nos ainda uma medida
surgir quando se tenta usar um teste baseado na distribuição do erro cometido.
normal para analisar dados de variáveis que não são normalmente Exemplo: Ao chegarmos a uma churrascaria, não precisamos
distribuídas. Em tais casos há duas opções. Primeiramente, pode- comer todos os tipos de saladas, de sobremesas e de carnes
se usar algum teste “não paramétrico” alternativo (ou teste “livre disponíveis, para conseguirmos chegar a conclusão de que a
de distribuição”); mas isso é freqüentemente inconveniente porque comida é de boa qualidade. Basta que seja provado um tipo de
tais testes são tipicamente menos poderosos e menos flexíveis em cada opção para concluirmos que estamos sendo bem servidos e
termos dos tipos de conclusões que eles podem proporcionar. que a comida está dentro dos padrões.
Alternativamente, em muitos casos ainda se pode usar um teste
baseado na distribuição normal se apenas houver certeza de que Médias
o tamanho das amostras é suficientemente grande. Esta última
opção é baseada em um princípio extremamente importante que Noção Geral de Média
é largamente responsável pela popularidade dos testes baseados
na distribuição normal. Nominalmente, quanto mais o tamanho Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e
da amostra aumente, mais a forma da distribuição amostral (a efetue uma certa operação com todos os elementos de A.
distribuição de uma estatística da amostra) da média aproxima- Se for possível substituir cada um dos elementos do conjunto A
se da forma da normal, mesmo que a distribuição da variável em por um número x de modo que o resultado da operação citada seja
questão não seja normal. Este princípio é chamado de Teorema o mesmo diz-se, por definição, que x será a média dos elementos
Central do Limite. de A relativa a essa operação.
Didatismo e Conhecimento 15
RACIOCÍNIO LÓGICO
Média Aritmética P1 .x1; P2 .x2 ; P3 .x3;...Pn xn
x=
P1 + P2 + P3 + ...+ Pn
Definição
A média dos elementos do conjunto numérico A relativa à Observe que se P1 = P2 = P3 = ... = Pn = 1, então:
adição é chamada média aritmética. x1; x2 ; x3;...; xn que é a média aritmética simples.
x=
n
Cálculo da média aritmética
Conclusão
Se x for a média aritmética dos elementos do conjunto
numérico A = {x1; x2; x3; ...; xn}, então, por definição: A média aritmética ponderada dos n elementos do conjunto
numérico A é a soma dos produtos de cada elemento multiplicado
pelo respectivo peso, dividida pela soma dos pesos.
n parcelas Exemplo
e, portanto,
Calcular a média aritmética ponderada dos números 35, 20 e
x1; x2 ; x3;...; xn
x= 10 com pesos 2, 3, e 5, respectivamente.
n
Resolução
Conclusão
Se x for a média aritmética ponderada, então:
A média aritmética dos n elementos do conjunto numérico A é
a soma de todos os seus elementos, dividida por n. 2.35 + 3.20 + 5.10 70 + 60 + 50 180
x= ↔x= ↔x= ↔ x = 18
2 + 3+ 5 10 10
Exemplo
A média aritmética ponderada é 18.
Calcular a média aritmética entre os números 3, 4, 6, 9, e 13.
Observação: A palavra média, sem especificar se é aritmética,
Resolução deve ser entendida como média aritmética.
Didatismo e Conhecimento 16
RACIOCÍNIO LÓGICO
8. Numa turma de 8ª série 10 alunos possuem 14 anos, 12 5) Solução:
alunos possuem 15 anos e oito deles 16 anos de idade. Qual será a) (15 + 48 + 36)/3 =
a idade média dessa turma? 99/3 = 33
c) (59 + 84 + 37 + 62 + 10)/5=
Profissionais → Quantidade → Salário
= 252/5
Serventes → 20 profissionais → R$ 320,00 = 50,4
Técnicos → 10 profissionais → R$ 840,00
d) (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9)/9=
Engenheiros → 5 profissionais → R$ 1.600,00
45/9 =
=5
10. Calcule a média ponderada entre 5, 10 e 15 para os respec-
tivos pesos 10, 5 e 20.
6) Resposta “22”.
Solução: Neste caso a solução consiste em multiplicarmos
Respostas cada número pelo seu respectivo peso e somarmos todos estes pro-
dutos. Este total deve ser então dividido pela soma total dos pesos:
1) Resposta “5”.
Solução: 10.1+ 14.2 + 18.3 + 30.5 10 + 28 + 54 + 150 242
= = = 22
M.A. ( 2 e 8 ) = 2 + 8 / 2 = 10 / 2 = 5 → M.A. ( 2 e 8 ) = 5. 1+ 2 + 3 + 5 11 11
Didatismo e Conhecimento 17
RACIOCÍNIO LÓGICO
Pegamos então este produto e extraímos a sua raiz cúbica, Salário +% Salário Salário +% Salário
chegando ao valor médio 6. Inicial Informado final inicial médio final
Extraímos a raiz cúbica, pois o conjunto é composto de 3 ele-
R$ R$ R$ R$
mentos. Se fossem n elementos, extrairíamos a raiz de índice n. 20% 12, 8417
1.000,00 1.200,00 1.000,00 1.128,74
Didatismo e Conhecimento 18
RACIOCÍNIO LÓGICO
Aplicação Prática 6. Dados dois números quaisquer, a média aritmética simples
e a média geométrica deles são respectivamente 20 e 20,5. Quais
Dentre todos os retângulos com a área igual a 64 cm², qual são estes dois números?
é o retângulo cujo perímetro é o menor possível, isto é, o mais
econômico? A resposta a este tipo de questão é dada pela média 7. A média geométrica entre dois números é igual a 6. Se a eles
geométrica entre as medidas do comprimento a e da largura b, uma juntarmos o número 48, qual será a média geométrica entre estes
vez que a.b = 64. três números?
A média geométrica G entre a e b fornece a medida desejada. 8. Calcule a média geométrica entre 4 e 9.
G = R[a × b] = R[64] = 8
9. Calcule a média geométrica entre 3, 3, 9 e 81
Resposta
10. Calcule a média geométrica entre 1, 1, 1, 32 e 234.
É o retângulo cujo comprimento mede 8 cm e é lógico que
a altura também mede 8 cm, logo só pode ser um quadrado! O Respostas
perímetro neste caso é p = 32 cm. Em qualquer outra situação em
que as medidas dos comprimentos forem diferentes das alturas, 1) Resposta “4”.
teremos perímetros maiores do que 32 cm. Solução:
Interpretação gráfica M .G.(2e8) = 2 2 × 8 = 16 = 4 ⇒ M .G.(2e8) = 4
A média geométrica entre dois segmentos de reta pode ser 2) Resposta “2”.
obtida geometricamente de uma forma bastante simples. Solução:
Sejam AB e BC segmentos de reta. Trace um segmento de reta M .G.(1,2e4) = 3 1× 2 × 4 = 3 8 = 2 ⇒ M .G.(1,2e4) = 2
que contenha a junção dos segmentos AB e BC, de forma que eles
formem segmentos consecutivos sobre a mesma reta.
Observação: O termo média proporcional deve ser, apenas,
utilizado para a média geométrica entre dois números.
3) Resposta “6”.
Solução: Aplicando a relação: g2 = a.h, teremos:
Didatismo e Conhecimento 19
RACIOCÍNIO LÓGICO
Repare que todos os números são potência de 2, podemos en- Sabemos que a = 41 - b, portanto atribuindo a b um de seus
tão escrever: possíveis valores, iremos encontrar o valor de a.
5
2.4.8.16.32 ⇒ 5 2.2 2.2 3.2 4.2 5 Para b = 16 temos:
⇒ 41b − b 2 = 400 ⇒ −b 2 + 41b − 400 = 0 Logo, ao juntarmos o número 48 aos dois números iniciais, a
média geométrica passará a ser 12.
Note que acabamos obtendo uma equação do segundo grau:
8) Resposta “6”.
-b2 + 41b - 400 = 0 Solução: G = 2 4.9 = 6
Didatismo e Conhecimento 20
RACIOCÍNIO LÓGICO
É uma medida de localização do centro da distribuição dos - A mediana não é tão sensível, como a média, às observações
dados, definida do seguinte modo: Ordenados os elementos da que são muito maiores ou muito menores do que as restantes
amostra, a mediana é o valor (pertencente ou não à amostra) que a (outliers). Por outro lado a média reflete o valor de todas as
divide ao meio, isto é, 50% dos elementos da amostra são menores observações.
ou iguais à mediana e os outros 50% são maiores ou iguais à A média ao contrário da mediana, é uma medida muito
mediana. influenciada por valores “muito grandes” ou “muito pequenos”,
Para a sua determinação utiliza-se a seguinte regra, depois de
mesmo que estes valores surjam em pequeno número na amostra.
ordenada a amostra de n elementos: Se n é ímpar, a mediana é o
Estes valores são os responsáveis pela má utilização da média em
elemento médio. Se n é par, a mediana é a semi-soma dos dois
elementos médios. muitas situações em que teria mais significado utilizar a mediana.
A mediana, m, é uma medida de localização do centro da A partir do exposto, deduzimos que se a distribuição dos
distribuição dos dados, definida do seguinte modo: dados:
Ordenados os elementos da amostra, a mediana é o valor - for aproximadamente simétrica, a média aproxima-se da
(pertencente ou não à amostra) que a divide ao meio, isto é, 50% mediana.
dos elementos da amostra são menores ou iguais à mediana e os - for enviesada para a direita (alguns valores grandes como
outros 50% são maiores ou iguais à mediana. “outliers”), a média tende a ser maior que a mediana.
Para a sua determinação utiliza-se a seguinte regra, depois de - for enviesada para a esquerda (alguns valores pequenos
ordenada a amostra de n elementos: como “outliers”), a média tende a ser inferior à mediana.
- Se n é ímpar, a mediana é o elemento médio.
- Se n é par, a mediana é a semi-soma dos dois elementos
médios.
=10.75 e =11
Didatismo e Conhecimento 21
RACIOCÍNIO LÓGICO
Salário (em euros) 75 100 145 200 400 1700 Esta medida é especialmente útil para reduzir a informação de
um conjunto de dados qualitativos, apresentados sob a forma de
Frequência absoluta 23 58 50 20 7 2 nomes ou categorias, para os quais não se pode calcular a média
Frequência acumulada 23 81 131 151 158 160 e por vezes a mediana (se não forem susceptíveis de ordenação).
Qp =
56 56 57 60 61 61 62 67
Didatismo e Conhecimento 22
RACIOCÍNIO LÓGICO
b) Um aluno com 61 kg pode ser considerado um pouco Tabela de Frequências: Como o nome indica, conterá os
“forte”, pois naquela turma só 25% dos alunos é que têm peso valores da variável e suas respectivas contagens, as quais são
maior ou igual a 60.5 kg. denominadas frequências absolutas ou simplesmente, frequências.
No caso de variáveis qualitativas ou quantitativas discretas, a
Escalas – Tabelas – Gráficos tabela de freqüência consiste em listar os valores possíveis da
variável, numéricos ou não, e fazer a contagem na tabela de dados
Tipos de gráficos: Os dados podem então ser representados brutos do número de suas ocorrências. A frequência do valor i será
de várias formas: representada por ni, a frequência total por n e a freqüência relativa
por fi = ni/n.
Diagramas de Barras Para variáveis cujos valores possuem ordenação natural
(qualitativas ordinais e quantitativas em geral), faz sentido
incluirmos também uma coluna contendo as frequências
acumuladas f ac, obtidas pela soma das frequências de todos os
valores da variável, menores ou iguais ao valor considerado.
No caso das variáveis quantitativas contínuas, que podem
assumir infinitos valores diferentes, é inviável construir a tabela de
frequência nos mesmos moldes do caso anterior, pois obteríamos
praticamente os valores originais da tabela de dados brutos. Para
resolver este problema, determinamos classes ou faixas de valores
e contamos o número de ocorrências em cada faixa. Por ex., no
caso da variável peso de adultos, poderíamos adotar as seguintes
faixas: 30 |— 40 kg, 40 |— 50 kg, 50 |— 60, 60 |— 70, e assim
por diante. Apesar de não adotarmos nenhuma regra formal para
estabelecer as faixas, procuraremos utilizar, em geral, de 5 a 8
faixas com mesma amplitude.
Eventualmente, faixas de tamanho desigual podem ser
Diagramas Circulares
convenientes para representar valores nas extremidades da tabela.
Exemplo:
Histogramas
Pictogramas
1ª (10)
2ª (8)
3ª (4)
4ª (5)
5ª (4)
= 1 unidade
Didatismo e Conhecimento 23
RACIOCÍNIO LÓGICO
Diagrama Circular: Para construir um diagrama circular
ou gráfico de pizza, repartimos um disco em setores circulares
correspondentes às porcentagens de cada valor (calculadas
multiplicando-se a frequência relativa por 100). Este tipo de gráfico
adapta-se muito bem para as variáveis qualitativas nominais.
Exemplo:
Polígono de Frequência:
Semelhante ao histograma, mas construído a partir dos pontos
médios das classes. Exemplo:
Probabilidade
Didatismo e Conhecimento 24
RACIOCÍNIO LÓGICO
Evento: Corresponde a qualquer subconjunto do espaço União de Eventos
amostral; será representado por A e o número de elementos do
evento por n(A). Considere A e B como dois eventos de um espaço amostral S,
finito e não vazio, temos:
Os conjuntos S e Ø também são subconjuntos de S, portanto
são eventos.
A
Ø = evento impossível.
S = evento certo.
B
Conceito de Probabilidade
S
Então, logo:
Didatismo e Conhecimento 25
RACIOCÍNIO LÓGICO
Probabilidade Condicionada Problema: Realizando-se a experiência descrita exatamente n
vezes, qual é a probabilidade de ocorrer o evento A só k vezes?
Considere dois eventos A e B de um espaço amostral S, finito
e não vazio. A probabilidade de B condicionada a A é dada pela Resolução:
probabilidade de ocorrência de B sabendo que já ocorreu A. É - Se num total de n experiências, ocorrer somente k vezes
representada por P(B/A). o evento A, nesse caso será necessário ocorrer exatamente n – k
vezes o evento A.
Veja: - Se a probabilidade de ocorrer o evento A é p e do evento A é
1 – p, nesse caso a probabilidade de ocorrer k vezes o evento A e
n – k vezes o evento A, ordenadamente, é:
Didatismo e Conhecimento 26
RACIOCÍNIO LÓGICO
05. Uma urna contém 500 bolas, numeradas de 1 a 500. Uma 06 mulheres com 2 filhos.
bola dessa urna é escolhida ao acaso. A probabilidade de que seja 02 mulheres com 3 filhos.
escolhida uma bola com um número de três algarismos ou múltiplo
de 10 é Como as 23 mulheres têm um total de 25 filhos, a probabilidade
(A) 10% de que a criança premiada tenha sido um(a) filho(a) único(a) é
(B) 12% igual a P = 7/25.
(C) 64%
(D) 82% 03. P(dama ou rei) = P(dama) + P(rei) =
(E) 86%
04. No lançamento de dois dados de 6 faces, numeradas de 1 a
06. Uma urna contém 4 bolas amarelas, 2 brancas e 3 bolas 6, são 36 casos possíveis. Considerando os eventos A (dois números
vermelhas. Retirando-se uma bola ao acaso, qual a probabilidade ímpares) e B (dois números iguais), a probabilidade pedida é:
de ela ser amarela ou branca?
Respostas
01.
Como A B = , A e B são eventos mutuamente exclusivos;
02. Logo: P(A B) = P(A) + P(B) =
A partir da distribuição apresentada no gráfico:
08 mulheres sem filhos.
07 mulheres com 1 filho.
Didatismo e Conhecimento 27
RACIOCÍNIO LÓGICO
07.
Se apenas um deve acertar o alvo, então podem ocorrer os ANOTAÇÕES
seguintes eventos:
(A) “A” acerta e “B” erra; ou
(B) “A” erra e “B” acerta.
Assim, temos:
P (A B) = P (A) + P (B) —————————————————————————
P (A B) = 40% . 70% + 60% . 30% —————————————————————————
P (A B) = 0,40 . 0,70 + 0,60 . 0,30
P (A B) = 0,28 + 0,18 —————————————————————————
P (A B) = 0,46
P (A B) = 46% —————————————————————————
—————————————————————————
08.
Sendo A e B eventos independentes, P(A B) = P(A) . P(B) e —————————————————————————
como P(A B) = P(A) + P(B) – P(A B). Temos:
P(A B) = P(A) + P(B) – P(A) . P(B) —————————————————————————
0,8 = 0,3 + P(B) – 0,3 . P(B)
—————————————————————————
0,7 . (PB) = 0,5
P(B) = 5/7. —————————————————————————
Didatismo e Conhecimento 28
RACIOCÍNIO LÓGICO
ANOTAÇÕES
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
———————————————————————————————————————————————————
———————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
Didatismo e Conhecimento 29
RACIOCÍNIO LÓGICO
ANOTAÇÕES
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
———————————————————————————————————————————————————
———————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
————————————————————————————————————————————————————
Didatismo e Conhecimento 30