Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Precision Journalism
by Philip Meyer
Houve um tempo em que tudo que demorou foi uma dedicação à verdade, muita energia e
algum talento para a escrita. Você ainda precisa dessas coisas, mas elas já não são
suficientes. O mundo tornou-se tão complicado, o crescimento da informação disponível
tão explosivo, que o jornalista precisa ser um filtro, bem como um transmissor, um
organizador e intérprete, bem como aquele que reúne e entrega fatos. Além de saber como
obter informações na impressão ou no ar, ele ou ela também deve saber como entrar na
cabeça do receptor.Em suma, um jornalista deve ser um gerenciador de banco de dados,
um processador de dados e um analista de dados.
É preciso treinamento especial. Nos bons velhos tempos, havia uma dúvida séria nos
círculos profissionais sobre se o jornalismo, como disciplina, incluía todo o
conhecimento. O jornalismo, nesta visão, é todo procedimento, não substância.1Quando
James Bryant Conant teve que lidar com um legado inesperado para Harvard para
"melhorar os padrões do jornalismo", ele escolheu treinamento substantivo para jornalistas
de meados da carreira. "O Sr. Conant sentiu que não havia uma base de conhecimento
suficiente para justificar uma escola de jornalismo ... essa conclusão levou a um programa
extraordinariamente bem sucedido que não desejamos alterar", lembrou o presidente da
Harvard, Derek Bok, cinquenta anos depois.2
O programa Nieman de Harvard, que oferece aos jornalistas selecionados de meio período
de carreira um ano acadêmico para reparar quaisquer lacunas educacionais que eles
percebem, é usado por alguns para ampliar seu escopo como generalistas. Mas cada vez
mais estão usando isso para se adaptar às novas demandas, tornando-se mais
especializados. Em um mundo onde a quantidade de informação está dobrando a cada
cinco anos,3É preciso um especialista para entender, e muito menos se comunicar, muito
disso. O corpo periodístico jornalístico, portanto, deve incluir esses elementos:
Na medida em que os jornalistas aprendem a fazer essas coisas, estão cumprindo um dos
elementos de uma profissão: o acesso a um corpo de conhecimento esotérico. Estamos
aprendendo, e o jornalismo está se tornando mais profissionalizado, mas, como acontece
com qualquer mudança radical, está acontecendo insegura e a diferentes taxas em
diferentes lugares.
O problema de ser um jornalista passivo e inocente é que, como qualquer pessoa passiva e
inocente, pode ser facilmente aproveitado. O tema subjacente na crítica mais moderna do
jornalismo é que a mídia é muito facilmente dominada por políticos poderosos e seus
"roteadores" habilidosos, cujos desejos facilmente determinam o que é definido como
notícias e o que não é. Para se defender contra ser manipulado, a mídia precisa de mais
autoconfiança e os melhores O caminho para a autoconfiança é através do
conhecimento. As pesquisas de mídia proliferaram na década de 1980, precisamente
porque os editores já não confiavam nas pesquisas que os políticos tentavam dar a eles e
armaram-se com suas próprias operações de coleta de dados por autodefesa.Assim, a
votação não se tornou uma maneira de tornar a notícia como uma ferramenta melhorada
do próprio processo de criação de notícias - desde que, claro, os jornalistas sejam
responsáveis por todo o processo, desde a concepção, até o design de pesquisa, a análise e
a interpretação. O jornalista de precisão não contrata um pesquisador para criar um evento
de notícias; O jornalista se torna o pesquisador. Jim Norman dos USA Today , Rich Morin
do WashingtonPost e IA (Bud) Lewis do Los Angeles Times estavam entre os protótipos.
Além da objetividade
O modelo do jornalista como inocente passivo tinha pelo menos uma virtude:
proporcionava uma espécie de disciplina. Era consistente com a tradição de objetividade,
uma tradição que impede o jornalista de impor pontos de vista pessoais aos leitores. Mas o
modelo de objetividade foi concebido para um mundo mais simples, onde os fatos sem
adornos podem falar por si mesmos. A frustração sobre o ideal de objetividade insatisfeito
levou alguns dos meios de comunicação social na década de 1960 a abraçar algo chamado
de "novo jornalismo", que libertou os jornalistas das restrições da objetividade
concedendo-lhes licença artística para se tornarem narcisistas. Jimmy Breslin e Tom
Wolfe estiveram entre os primeiros profissionais bem-sucedidos, e seus métodos
funcionaram até chegarem a um ponto em que deixaram de ser jornalistas. As ferramentas
literárias de ficção, incluindo detalhes requintados, monólogo interior (o que uma pessoa
notável está pensando, bem como o seu comportamento aberto), e estrutura curta, com um
personagem, um problema e uma resolução em um curto espaço de tempo de Palavras,
podem produzir produtos jornalísticos que são uma alegria para ler. Infelizmente, o
processo de coleta de dados é extremamente difícil. Para que a vida pareça ser uma
história curta, é preciso ser extremamente seletivo, e isso exige reunir uma grande
quantidade de fatos a partir dos quais selecionar. As restrições do jornalismo diário não
suportarão esse nível de esforço dia após dia. Alguns praticantes do "novo jornalismo"
levaram a fazer Seus fatos para acompanhar as pressões do prazo. Outros não conseguiram
inventar as coisas, mas combinaram fatos de diferentes casos para escrever retratos
compostos de realidade que passaram como casos reais.5
Apesar dos problemas, a nova não ficção continua sendo um esforço interessante para
lidar com a complexidade da informação e encontrar uma maneira de comunicar a verdade
essencial. Empurra o jornalismo em direção ao art. O problema é que o jornalismo exige
disciplina, e a disciplina da arte pode não ser o tipo mais apropriado.Uma solução melhor
é empurrar o jornalismo para a ciência, incorporando as poderosas ferramentas de análise
e coleta de dados da ciência e sua busca disciplinada por uma verdade verificável.
Esta não é uma ideia nova. Walter Lippmann observou há setenta anos que o jornalismo
depende da disponibilidade de fato objetivável. "Mais pontos, então, em que qualquer
evento pode ser consertado, objetivado, medido, nomeado, mais pontos existem em que as
notícias podem ocorrer".6 O método científico oferece uma maneira de fazer
acontecimentos objetivados, medidos e nomeados.
"Ao longo dos anos, todos nós contratamos pessoas como ele - e tornamos nossos jornais
menos centrados nos leitores no processo", disse Batten. "Chegou o momento de parar. E
nossos aliados nas faculdades e universidades que educam jovens jornalistas precisam
entender essa verdade - e nos envie as pessoas com vontade de se comunicar com os
leitores".8
O novo jornalismo de precisão é o jornalismo científico.(Em França, o termo "jornalismo
de precisão" foi traduzido como "le journalisme scientifique"). Significa tratar o
jornalismo como se fosse uma ciência, adotando método científico, objetividade científica
e ideais científicos para todo o processo de comunicação de massa. Se isso soa
absurdamente pretensioso, lembre-se de que a própria ciência é restrita sobre suas
realizações e suas possibilidades e tem suas próprias sanções contra a pretensão. "Sempre
há fatos escondidos, e as verdades são evasivas em todos os domínios da investigação
humana", escreveu o físico de Cranberg. "O que é necessário para descobrir fatos ocultos e
chegar a verdades difíceis é uma determinação qualificada para obter Eles, e essa é uma
determinação que é apropriada para um jornalista devidamente treinado quanto a um físico
devidamente treinado ".
A partir da década de 1970, o jornalismo começou a se dirigir para uma posição mais
científica ao longo de dois caminhos separados. A crescente disponibilidade de
computadores disponibilizou grandes cadáveres de dados aos jornalistas de uma forma que
não era possível antes.E no escritório de negócios, o fracasso da circulação do jornal em
acompanhar o crescimento do número de domicílios fez com que os editores pagassem
atenção mais sistemática ao mercado e os fatores que motivavam os leitores a gastar
tempo e dinheiro com os produtos dos editores. A noção de que um jornal é um produto e
que um leitor é uma criatura racional que faz uma escolha sobre se pagar o custo de usar o
produto tornou-se respeitável. E assim as forças do mercado estavam empurrando o
jornalismo como um todo, e não apenas alguns jogadores isolados no campo, para uma
posição mais científica.
Saber o que fazer com os dados é a essência do novo jornalismo de precisão. O problema
pode ser pensado como tendo duas fases: a fase de entrada, onde os dados são coletados e
analisados e a fase de saída, onde os dados estão preparados para entrar na mente do
leitor.Este livro é sobretudo sobre a primeira fase, mas os dois estão tão interligados que
também irá negociar até certo ponto com o lado da saída.
O objetivo principal do que se segue será dizer-lhe como fazer essas coisas com dados:
1. Colecione. Seja ou não alguma vez tentar imitar os cientistas em seus métodos de coleta
de dados, você pode aproveitar o conhecimento de alguns de seus truques.Sempre vale a
pena lembrar, como o professor H. Douglas Price me disse em Harvard, na primavera de
1967, que "os dados não são provenientes da cegonha".
Modelos teóricos
Em uma manhã de primavera, correndo ao longo de uma rua enevoada de Chapel Hill,
coloquei uma colina baixa e vi na distância uma figura amarela agachada de cerca de 18
centímetros de altura. Parecia tenso, pronto para a primavera, presas presas, visando um
ponto ao longo do meu caminho à frente. Quando me aproximei e meus olhos
conseguiram resolver a figura com mais clareza, eu vi o que realmente era: uma lâmpada
de fogo comum. A imagem do cachorro tinha sido a criação do meu próprio cérebro,
impondo uma ordem e um padrão próprio sobre os dados ambíguos transmitidos pelos
olhos.
Os dados brutos sozinhos nunca podem ser suficientes.Para ser útil, para ser entendido, os
dados devem ser processados, abstraídos, enquadrados em algum tipo de estrutura. Você
deve colocar o material em um quadro mental que auxilia na interpretação e na
compreensão.Esta obviedade aplica-se igualmente aos dados da percepção diária e às
cordas dos números nos computadores. Para pensar neles, você precisa de um quadro
perceptual. Se você não fornecer um conscientemente, sua mente inconsciente, talvez
motivada por ansiedade como a de um basculador em um bairro de donos de cachorros,
pode fornecer o que é errado para você.
Testando o modelo
O outro estudo (Study X) perguntou sobre os mesmos problemas com uma escala de cinco
pontos, e mostrou que em 52 a 10 por cento, mais pessoas chamavam de jornal justo do
que injusto. E o público estava quase dividido na questão da privacidade: 32 por cento
pensavam que os jornais invadem a privacidade e 30 por cento pensavam que respeitavam
a privacidade. Os dois estudos foram realizados apenas seis meses de intervalo, entre
dezembro de 1984 e maio de 1985.
Como você poderia esperar, um foi apresentado como um estudo de "boas notícias" cheio
de otimismo sobre as atitudes do público em relação à mídia. O outro resultou em um
relatório cheio de tristeza e presságio. Agora, esta é a surpresa: o relatório ensolarado foi
escrito pelas pessoas que produziram Study Y, aquele com as atitudes desfavoráveis
citadas acima. E o relatório sombrio foi baseado nos números no Estudo X, aquele que
descobriu que a maioria das pessoas confia nos jornais.
Agora, é verdade que existe algum perigo de que a avaliação não seja fria e objetiva o
suficiente. Os dois estudos de jornal citados acima são uma boa ilustração. A cura para
esse problema não é abandonar o processo de fazer hipóteses, mas indicar sua hipótese e
avaliá-la em plena visão pública para que outros investigadores possam verificar seu
trabalho. Tanto o Times Mirror quanto os pesquisadores da ASNE fizeram exatamente
isso.Nenhum dano a longo prazo foi feito, porque ambos deixaram uma trilha de papel que
descrevia seu método, suas descobertas e a rota para suas conclusões. Ainda melhor, eles
disponibilizaram seus dados para análise secundária por outros estudiosos. Suas
publicações estimularam muitas análises e discussões sobre o próximo passo na
compreensão do relacionamento peculiar entre um meio de notícias e seus leitores,
ouvintes ou espectadores. Uma das características da ciência é que ela está sempre sujeita
a tais verificações e revisões. Essa é uma das lições do caso dos dois estudos de
credibilidade.O outro é que é extremamente importante pensar cuidadosamente sobre a
estrutura teórica com a qual se aborda um problema e apreciar as conseqüências da
escolha de um modelo esquemático.
Testes de realidade
Uma vez que você escolhe um modelo, você pode estar preso com ele por um longo
tempo. Um modelo que funciona bem o suficiente para o propósito em breve logo se torna
confortável, como um sapato antigo, e é abandonado relutantemente. Modelos
inadequados, agarrados após a sua utilidade desapareceram, são fonte de superstição,
sabedoria convencional e mentes fechadas. Herbert Butterfield, historiador da ciência
moderna, argumentou que o desenvolvimento de novos modelos era mais importante na
criação da física moderna do que na coleta de novos dados. Um cientista bem sucedido
precisa "da arte de lidar com o mesmo pacote de dados do que antes, colocando-os em um
novo sistema de relações entre eles, dando-lhes um quadro diferente, o que praticamente
significa colocar um tipo diferente de pensão para o momento."16 O método científico
moderno fornece um incentivo para colocar esse tampão de pensamento diferente, levando
a um teste contínuo dos modelos antigos e a uma busca perpétua de melhores.Aristóteles,
cujo modelo para a mecânica do movimento sustentava que um corpo em movimento
continuava em um determinado caminho apenas enquanto algo o estava empurrando,
estava errado. E, no entanto, seu modelo era dominante durante séculos, em parte porque a
ciência ainda não estava condicionada ao desafio e à experimentação. (Um problema que
agrava Aristóteles e seus contemporâneos gregos foi a distinção nítida entre filósofos e
pessoas trabalhadoras. Realizar um experimento envolveria sujar as mãos. Essa falta de
vontade para fazer mais do que pensar persistiu até o tempo de Galileu, que preferia
"pensamento Experiências "para o real.)
1. Ceticismo. "Se sua mãe diz que ela o ama, confira", é um aforismo da cultura do
jornalismo, e não da ciência, mas também se encaixa. Nem os jornalistas nem os cientistas
se contentam em descansar com o que a opinião popular ou a afirmação da autoridade é
verdadeira. A verdade é sempre tentativa, sempre tem espaço para a nitidez e a melhoria.
A importância da humildade
É irônico que a defesa jornalística da Primeira Emenda hoje seja frequentemente discutida
a partir de uma posição absolutista. O pensamento político do século XVIII subjacente à
constituição dos Estados Unidos, em particular a Primeira Emenda, baseia-se na rejeição
do absolutismo. No início da era científica, a futilidade de atrair qualquer crença particular
era clara porque novos dados ou uma nova interpretação de dados antigos sempre surgiam
para desafiar as antigas crenças. E então fazia sentido tolerar as crenças pouco ortodoxas e
protegê-las sob a lei básica da terra. A heresia de hoje pode ser a sabedoria de amanhã.
Uma das vantagens de adotar um modelo teórico para uso jornalístico é que ele mantém
você e seus leitores focados no relevante. Muitas informações nos assuntos públicos são
arcanas e complicadas. O jornalista que se torna um especialista no campo coberto pode
rapidamente perder o caminho em detalhes irrelevantes.
Minha primeira grande história de pesquisa como repórter de um jornal foi sobre o
desperdício de compra de seguro de incêndio e tempestade de vento em edifícios escolares
em Dade County, Flórida. Sob o plano em vigor, o programa de seguro foi controlado por
um agente cuja remuneração era uma participação das comissões. Quanto mais custo do
seguro, mais dinheiro ele ganhou. Os debates nas reuniões do conselho escolar sobre o
assunto eram obscuros em seus detalhes e impossíveis de seguir.Em frustração, o
superintendente das escolas perguntou ao seu conselho para um estudo de US $ 10.000
para resolver as complexidades técnicas. O pedido foi apresentado e eventualmente
morreu.
O que era necessário para entender a situação era um modelo teórico que poderia ser
operacionalizado. O meu era um modelo básico de rolo de registro ou retrocesso.Isso
levou às seguintes hipóteses:
2. Se o conselho acompanhar esse custo, seus membros devem receber algo de valor: por
exemplo, o poder de recompensar seus amigos no negócio de seguros.
3. Se eles estão recompensando seus amigos, os membros do conselho devem novamente
receber algo em troca.
Cada uma dessas proposições é simples. Você não precisa de uma compreensão detalhada
do negócio de seguros ou de sua regulamentação para entender qualquer um deles.E cada
um poderia ser operacionalizado.
Um repórter que trabalha nessa história hoje, obviamente, usará um computador em vez de
três fichas de índice para verificar os nomes. Mas a mecânica é menos importante do que o
conceito. Um modelo que aponta para os fatos relevantes e sugere uma operacionalização
é muito mais importante para aumentar seu poder como repórter do que a máquina Isso faz
parte do clérigo. As máquinas tornam possíveis as coisas que não poderiam ser feitas antes,
mas para tirar o máximo proveito delas, precisamos pensar da maneira que os cientistas
pensam, construindo os modelos que nos permitem usar o novo poder de computação.
Os jornalistas tendem a ser pessoas práticas e, como tal, às vezes somos rápidos demais
para desprezar as pessoas que lidam com o que nos parece ser uma teoria vazia que não
possui nenhuma aplicação do mundo real. Mas, sem teoria, não temos nada além de dados
brutos não ordenados, e nós sufocamos nele. O computador pode alfabetizá-lo para nós,
pode nos dar listas ordenadas por qualquer dimensão encontrada nos dados, mas ainda
temos que ter uma teoria para dar uma lista à lista.
Fontes de teorias
De onde vêm as teorias? A gama de fontes é ampla, do folclore aos produtos das mentes
mais criativas e sofisticadas da ciência. Uma boa teoria é aquela que tem consequências
que podem ser testadas e usadas como blocos de construção para mais descobertas e mais
teorias. A ciência é tão dependente da abertura como o jornalismo. Michael Polyani, um
químico que trabalhou no início da era nuclear, comparou o processo científico com um
grupo de trabalhadores que montava um quebra-cabeça gigante. Um grupo não pode fazê-
lo de forma eficiente, a menos que cada membro saiba o que os outros membros estão
fazendo. "Deixe-os trabalhar para juntar o quebra-cabeça à vista dos outros, de modo que
cada vez que um pedaço é encaixado por um, todos os outros imediatamente prestarão
atenção para o próximo passo que se torna possível em conseqüência", disse ele. .19 A
metodologia dos jornalistas que cobrem os assuntos públicos é exatamente a mesma,
mesmo que o processo seja menos autoconsciente. Os repórteres, como os cientistas, estão
no negócio dos testes de realidade, examinando as teorias existentes, pensando em suas
conseqüências, desenvolvendo hipóteses relacionadas que podem ser operacionalizadas
(ou seja, testadas) e colocá-las à prova.
Educação
Outra teoria popular da época era que a causa fundamental dos tumultos era a dificuldade
que os negros do sul tinham em ser assimilados na cultura do norte.Forçados pela
repressão do sul e os efeitos da escravidão em um papel passivo, eles encontraram uma
saída para uma agressão prolongada depois de deixarem o Sul. Essa teoria, também, é
facilmente operacionalizada. Se for verdade, os tumultos devem ser um comportamento
mais frequente para os imigrantes do Sul do que os negros criados no Norte. A pesquisa
da Free Press produziu um resultado diferente. Outra teoria submetida ao teste de
realidade e achou falta!
Sul Norte
Rioters 8% 25%
As relações raciais provaram ser um campo fértil para os testes de realidade jornalística
mais recentemente. Os prêmios Pulitzer foram conquistados para as histórias publicadas
no Dallas Morning News em 1985 e aConstituição de Atlanta Em 1988, mostrou como os
programas do governo federal estavam sendo utilizados para perpetuar a discriminação
racial. O caso do Texas envolveu segregação em habitação pública. A história de Atlanta
documentou a discriminação em empréstimos hipotecários segurados pelo governo
federal. Ambos os projetos basearam-se em análises computacionais de grandes bancos de
dados governamentais. Ambos começaram com um quadro teórico: um governo com um
compromisso com a igualdade racial deve produzir resultados mensuráveis que reflitam
essa igualdade. A medição e a análise mostraram que, na realidade, os resultados dos
programas governamentais não refletiam a igualdade.22 Para decidir o que medir, os
repórteres tiveram que ter uma teoria e uma hipótese operacional.Em outras palavras, eles
estavam pensando como cientistas.
Aqui está o que Julia D. Wallace, editor-executivo dosEUA para projetos especiais, teve
que dizer depois de seus primeiros meses de luta com jornalismo de precisão: "Eu acho
que a linha de fundo aqui é que vai levar mais para ser um jornalista no Futuro. Não basta
ter habilidades de escrita, boas fontes e muita energia. Repórteres e editores precisarão
saber algo sobre estatísticas e software.
Notas
1. Por exemplo, Ron Lovell, The Quill , outubro de 1987, pp. 22-24: "Não há um corpo substantivo de
conhecimento para o campo". Retornar ao texto
3. "Em breve vai dobrar a cada quatro". Richard Saul Wurman,Information Anxiety (Nova York:
Doubleday, 1989), p. 32. retornar ao texto
4. Veja, por exemplo, Nicholas Von Hoffman, "Opiniões de opinião pública: jornais fazendo suas
próprias novidades?" Public Quarterly, 44: 4 (Winter 1980), 572. retornar ao texto
5. Para alguns exemplos, veja a discussão sobre "a nova não ficção" em Philip Meyer, Jornalismo
ético: um guia para estudantes, praticantes e consumidores (New York: Longman, 1987). Retornar
ao texto
6. Walter Lippmann, Public Opinion (Nova York: The Free Press, Paperback Edition, 1965, primeira
publicação, 1922), p. 216. retornar ao texto
9. Michael J. Davies, citado em Keys to Success: estratégias para o Marketing de jornais nos anos
90 (Reston, Va .: American Newspaper Publishers Association, 1989), p. 5. retornar ao texto
10. Christine D. Urban, "Expectativas do leitor - O que eles pensam de nós", endereço para American
Newspaper Publishers Association, San Francisco, abril de 1986. retornar ao texto
14. "Credibilidade do jornal: Building Reader Trust" (Reston, Va .: American Society of Newspaper
Editors, 1985). Retornar ao texto
15. "The People & The Press: uma investigação espelhada de tempos das atitudes públicas para as
mídias de notícias conduzidas pela Organização Gallup" (Los Angeles: Times Mirror, 1986),
p. 4. retornar ao texto
16. Herbert Butterfield, The Origins of Modern Science , Revised Edition (Nova York: The Free Press,
Paperback Edition, 1965, primeira publicação, 1957), p. 13. retornar ao texto
17. Oliver Wendell Holmes. Citado por Arthur Schlesinger, Jr., "The Opening of the American
Mind", New York Times Book Review ; 23 de julho de 1959, p. 27. retornar ao texto
18. "Os Seguros Freeloading obtêm seus $ 59,000", Miami Herald , 27 de setembro de 1959,
p. 1B. Retornar ao texto
19. Citado em Richard Rhodes, The Making of the Atomic Bomb(Nova York: Simon & Schuster,
1986), p. 34. retornar ao texto
20. Philip Meyer, "The People Beyond 12th Street: Uma Pesquisa de Atitudes de Negros de Detroit
Após o Motim de 1967" , reimpressão de Detroit Free Press , 1967. retornar ao texto
21. Philip Meyer, "As consequências do martírio: militância negra e a morte de Martin Luther King",
" Public Opinion Quarterly , TK. Retornar ao texto
22. Craig Flournoy e George Rodrigue, "Separados e desiguais: a segregação ilegal permeia a
habitação subsidiada da nação", Dallas Morning News , 10 de fevereiro de 1985, p. 1. retornar ao
texto
23. Julia D. Wallace, observações ao Congresso da Primeira Emenda, Washington, DC, 27 de outubro
de 1989. retorno ao texto
2
Alguns elementos de análise de dados
Às vezes, muitas novidades podem ser empacotadas em apenas um número. Suponhamos
que o Supremo Tribunal de Justiça decida se anular um precedente de longa data. Um
relatório sobre o que o Tribunal decidiu poderia consistir apenas no seguinte:
Se você já conhecesse os antecedentes do caso, sabia que a Corte tinha nove juízes, o fato
de que cinco votaram para anular o precedente anterior lhe daria todas as informações
adicionais que você precisava. Essas histórias quantitativas de um número são bastante
comuns no negócio de notícias.
A taxa mais utilizada é a taxa por cem ( por cento, em latim) ou por cento. Um percentual
é o equivalente decimal de uma fração, mas com o ponto decimal movido dois lugares
para a direita. Portanto:
1/2 = .5 = 50%
Nenhuma porcentagem faz sentido a menos que você conheça sua base.
A maneira de calcular uma porcentagem sem perder o controle da base é obter a fração
primeiro. Se 11 membros da equipe de futebol de 42 homens 1986 se formaram em quatro
anos, a taxa de graduação de quatro anos do esquadrão é 11/42. O 11 na fração é o número
que se formou e 42 é a base para a qual o número que se formou está sendo comparado. A
base é a parte inferior da fração.Eu sei, isso soa elementar, mas você ficaria surpreso com
a quantidade de estudantes que têm dificuldade em lembrar disso.(Quando eu explico isso
aos alunos, peço-lhes que visualizem uma estátua no campus: por exemplo,
Silencioso Sam na Carolina ou Tommy Trojan no sul da Califórnia. A base está na parte
inferior.Isso parece ajudar.)
Ser capaz de identificar a base é importante, por causa da próxima regra:
Quando você compara duas porcentagens, você precisa ter certeza de que eles têm a
mesma base.
Alguns escritores de notícias, evidentemente, pensam que é aborrecido manter a base
constante ao fazer comparações percentuais. Eu vi histórias de jornal onde a base foi
mudada na metade: "Noventa por cento dos negros no condado de Baxter votaram em
Dukakis, mas 95 por cento dos apoiantes de Bush eram brancos". Em um caso, a base é
negra, na outra é apoiadores de Bush. Essa comparação não faz sentido, embora você
possa enganar algo significativo se você conhecesse o percentual negro no
eleitorado. Quanto melhor dizer, "Dukakis recebeu 90% do voto negro e 40% do voto
branco".
Quando você tem a base firmemente em mente, você pode converter a fração para uma
decimal por divisão. Não se esqueça do movimento de dois lugares do ponto decimal
implícito no conceito de porcentagem:
Cinquenta por cento é outra maneira mais fácil de dizer 50 centésimos. Se deixássemos a
casa decimal e dissesse .50 centésimos ou 0,5 por cento, teríamos mais do que uma
redundância, teríamos um número completamente diferente (metade de um por cento). Às
vezes, você verá em expressões impressas como .50 por cento, onde o escritor realmente
significa 50 por cento. O ponto decimal foi evidentemente lançado apenas para a
ênfase. Então, aqui está outra regra da vida:
Diferença percentual
Talvez você pensou que usar a imagem de uma estátua para reforçar o conceito de uma
base percentual era bobo. Mas quando você tenta encontrar uma diferença percentual,
você realmente apreciará a importância de manter a base identificada.
Em 12 de outubro de 1989, a Média Industrial Dow Jones fechou em 2759,84. No dia
seguinte, sexta-feira, 13 de outubro de 1989, fechou em 2568,26. Pergunta: qual foi a
queda percentual?
A diferença percentual significa exatamente o que diz: a diferença entre dois valores
tomados como uma porcentagem do valor que você está usando como base. Se você quiser
a alteração percentual do Tempo 1 para o Tempo 2, então o valor do Tempo 1 é a base.
190,58
= .0690547 = 6,91%
2759.84
Observe que, para passar do decimal para a porcentagem, movemos os dois locais
decimais para a direita e adicionamos um sinal de porcentagem. Também arredondamos
para duas casas decimais, o que provavelmente é mais precisão do que precisamos, mas
nos inclinamos para o estilo do Wall Street Journal .
Observe também que o arredondamento não é o mesmo que o truncado. Se estivéssemos
truncados, sairíamos com 6,90 por cento.Mas, uma vez que o valor caído é mais da metade,
arredondamos para 6,91. Para avaliar os dígitos descartados, coloque um decimal
imaginário na frente deles. Neste caso, .547 é maior do que .5, e assim você se
arredonda. Se fosse inferior a .5, você truncaria (ou seja, deixaria cair os dígitos
excedentes). E se fosse exatamente .5?Isso não faz muita diferença, mas, por razões de
consistência, eu arredundo nesse caso - na teoria de que se eu realizasse meu Divisão para
mais casas decimais, pode haver um valor lá fora, que daria para maior que .5.
Agora, tente esta questão: qual o ganho percentual que o mercado deve fazer desde o
fechamento de sexta-feira para recuperar seu status no fechamento de quinta-feira? Talvez
você pense que, uma vez que caiu 6,91 por cento, ele deve subir 6,91 por cento para voltar
para onde estava. Não tão! Deve voltar os mesmos 190.58 em pontos absolutos, mas ao
enquadrar esta questão mudamos a base percentual. A base está agora fechada de sexta-
feira, e assim:
190,58
= .0741603 = 7,42%
2569,84
Para recuperar a perda de 6.91 por cento, o mercado teve que ganhar 7.42 por cento.
Depois daquela queda da sexta-feira 13, eu ouvi um apresentador de televisão se referir a
ele como a segunda maior queda na história.Isso era verdade em pontos absolutos, mas em
termos percentuais era apenas o 12º. Aqui está o registro, tirado do Wall Street Journal:1
Os motivos para que o Dow fosse muito maior agora do que era na década de 1930 são
diretos. A economia cresceu e as empresas valem mais. Parte do crescimento é real e parte
é a inflação. Estas são tendências seculares , o que significa que elas afetam quase tudo na
sociedade. Se você for fazer comparações ao longo do tempo, você deve filtrar esse efeito
secular para ver o que está acontecendo especificamente com o fenômeno que você está
investigando. Em outras palavras, você precisa diminuir os números, usar um termo
favorecido por Cook e Campbell.3 Exprimir mudanças em termos percentuais é uma
maneira de se detrender, mas não é a única maneira. Ajudar o Dow Jones pela inflação
seria outro. Os analistas e contadores financeiros não fazem rotineiramente isso, mas, se o
fizerem, o efeito sobre a Dow Jones Industrial Average seria a abertura dos olhos. Seu
crescimento a longo prazo, embora ainda real, não seria quase tão impressionante.
Algumas pessoas usam a regra "Divida o pequeno número pelo grande número". Essa é a
regra errada. Isso só funciona se a diferença percentual for inferior a 100. Em nossa
comparação de sessenta anos, onde o valor para o ano base é menor do que o valor para o
ano de comparação, a média industrial Dow aumentou 1100%.
Outra maneira de expressá-lo seria dizer que a média industrial foi "11 vezes maior" em
outubro de 1989 do que em outubro de 1929. Não recomendo esse uso porque é muito
facilmente confundido com "11 vezes maior". Neste caso, o Dow de 1989 é 12 vezes tão
grande quanto o Dow de 1929.
Existe uma explicação simples para essa confusão. "Times greater" compara o valor base
com a diferença (a quantidade "maior"). E "times as great" compara o valor base com o
novo valor. O número de 1989, 2759.84 é 12 vezes o valor de 230.07 de 1929. É apenas
11 vezes a diferença.
Isso é bastante claro quando você pensa sobre isso. Infelizmente, muitos escritores de
notícias não pensam nisso e usam "times greater" e "times as" como se elesSignificava o
mesmo. Eles não! Considere este exemplo do Atlanta Journal-Constitution:
Washington - Uma arma de assalto tem 20 vezes mais chances de ser usada no crime do
que uma arma de fogo convencional, de acordo com um estudo do Atlanta Journal-
Constitution Washington Bureau.
Enquanto as armas de assalto representam 1 milhão - ou 0,5 por cento - dos 200 milhões
de armas de fogo de propriedade privada nos Estados Unidos, eles foram usados em um
dos 10 crimes que resultaram em um registro de armas de fogo no ano passado, mostra o
estudo.
A comparação da incidência de armas de assalto com a incidência esperada é
perfeitamente razoável. Mas 10 por cento são 19 vezessuperiores a meio por cento, não 20
vezes maiores. No entanto, é 20 vezes tão grande, o que provavelmente é o que os
escritores queriam dizer.4
Esse erro leva você a ter mais problemas quando você está falando de mudanças menores,
duas ou três vezes. Se você tem 20 anos, e eu tenho três vezes mais velho que você, eu
devo ter 60 anos. Mas se eu for três vezes maior do que você, eu tenho 80 anos. Tento
mantê-lo direto para o meu bem.
Mesmo assim, não é possível criar uma cesta de mercado que se aplique igualmente a
todos os grupos. Por exemplo, os aposentados que possuem suas casas não são afetados
por mudanças nos valores de aluguel ou de casa. Para os aposentados em casa do governo
federal, cujas pensões são indexadas ao CPI, a indexação cria uma ganância
inesperada. Os seus rendimentos aumentam automaticamente mais do que os seus próprios
custos normais de vida.
Aqui está um exemplo perto de casa. David H. Weaver e G. Cleveland Wilhoit relataram
em 1986 que a renda média dos jornalistas aumentou de US $ 11.113 em 1970 para US
$ 19.000 em 1981. Isso foi uma má notícia para os jornalistas, ressaltaram, porque o
período intermediário era uma inflação furiosa, E os jornalistas realmente perderam cerca
de US $ 7.000 por ano No poder de compra.6 Para verificar seu cálculo, você precisa do
IPC para 1970 e para 1981. De acordo com o Resumo Estatístico dos Estados
Unidos, publicado anualmente pelo Escritório de Impressão do Governo dos EUA, foi
38,8 e 90,9, respectivamente (o índice usa os preços para o Período 1982-1984 como base
de 100). Em seguida, converta a renda média diária para 1970 em dólares constantes de
1981. Use a fórmula para equivalentes de fração que você aprendeu na escola secundária:
38,8 90,9
=
11,133 X
Talvez você esteja mais confortável com uma frase em inglês do que uma equação: 38,8 é
de US $ 11,133 como 90,9 é para a quantidade desconhecida (renda de 1970 expressa em
dólares constantes de 1981). Seguindo a regra de multiplicação cruzada da álgebra da
escola secundária, você acha que:
38,8 * X = 11,133 * 90,9
Fórmulas neste livro usam notação de computador: o sinal de "tempos" é um asterisco (*) ao invés do antigo
"X". Isso liberta "X" para representar um desconhecido. Um slash (/) significa "dividido por".
Punch ele em sua calculadora, e 1970 $ 11,133 resulta ser igual a $ 26,082.21 em dólares
constantes de 1981. Assim, os salários do jornalismo realmente diminuíram 27 por cento
durante esse período.Por quê? Duas coisas aconteceram. O desempenho de dois
jovensrepórteres do Washington Post no escândalo do Watergate motivou muitos jovens
para se tornarem jornalistas. Ao mesmo tempo, as barreiras às mulheres na profissão
foram reduzidas. Ambos os eventos aumentaram consideravelmente o grupo de
trabalhadores disponíveis no jornalismo. Essa inesperada juventude idealista e motivada
deu aos proprietários da mídia uma escolha maravilhosa.Opção 1: elevar os padrões do
jornalismo, aproveitando o melhor do grupo ampliado e recebendo o melhor e mais
brilhante no jornalismo.Opção 2: escolha a próxima geração de Jornalistas selecionando
aqueles que trabalhariam pela menor quantidade de dinheiro e levando as economias para
a linha inferior. Graças a Weaver e Wilhoit, agora sabemos como esse saiu.
(Se você é um estudante que contempla uma carreira no jornalismo, não se desanime. Os
efeitos do Watergate e da feminização tiveram que seguir seu curso no final da década de
1980 e os salários começaram a subir mais rápido que a inflação.)
Mais dicas para usar o CPI: livros mais antigos que este usam figuras CPI que têm 1967 =
100 como base. O Bureau of Labor Statistics recentemente converteu-se para a nova base
onde o período 1982-1984 = 100. Por algum tempo eles vão publicar ambos os
números.Atualize seu Resumo Estatístico todos os anos para se manter atualizado. A partir
desta escrita, o Resumo Estatístico dá um IPC para todos os anos de volta a 1950. Para
anos anteriores, veja um conjunto bonito de volumes chamado Estatística Histórica dos
Estados Unidos.7 Ele fornece todos os números BLS de volta ao início da Primeira Guerra
Mundial e, em seguida, usa estimativas de outras fontes históricas para produzir CPIs
anuais de volta para 1800.
Se você precisar da figura mensal mais recente, ligue para este número: (202) 523-
9658. Uma voz gravada lhe dará o IPC no mês mais recente. Os números mensais vêm em
duas categorias, o CPI-U e o CPI-W. O CPI-U é para todos os consumidores urbanos e
cobre cerca de 80 por cento da população. O CPI-W é para assalariados urbanos e
trabalhadores clericais. Eles são coletados separadamente para que os diferentes efeitos
sobre a inflação possam ser rastreados para os dois grupos (embora se sobrepõem
consideravelmente). Para a maioria dos propósitos de política pública, o CIP-U mais
abrangente é usado para fazer ajustes de inflação.
As tendências fazem novidades, quer porque tenham andado em silêncio e que nem
muitos tenham notado ou por causa de uma interrupção repentina de uma tendência. Para
se concentrar na tendência da notícia, você deve separá-la de todas as tendências paralelas
em segundo plano. O crescimento da população é uma tendência secular que, como a
inflação, pode fazer outras tendências mais do que parecem.
É um número que é fácil de entender no nível intuitivo. Quando a penetração era de 100%
em um determinado mercado, um jornal foi vendido para cada casa. Quando estava acima
de 100 por cento, mais jornais foram vendidos do que famílias - comum na década de
1950. Hoje, o número é muito menor e ainda está caindo, com alguns jornais
metropolitanos experimentando penetração doméstica de menos de 50%. Expressando a
circulação do jornal como proporção para as famílias (porque a circulação entregues em
casa é vendida para Famílias em vez de indivíduos) torna a tendência real mais fácil de ver
(veja a Figura 2A).
Para um exemplo extremo de crescimento da população como fator de confusão, eu gosto
de mostrar aos alunos um mapa de dispersão que mostra a adesão à igreja e o consumo de
álcool ano a ano. Um diagrama de dispersão mostra cada ponto de dados em um espaço
bidimensional. Neste caso, a dimensão vertical representa a adesão à igreja (maior é mais)
e a dimensão horizontal representa as vendas de licor (para a direita é mais). Cada ponto
de dados é um ano, representado por um ponto colocado de acordo com a participação da
igreja e as vendas de bebidas alcoólicas nesse ano.
Apenas observando o diagrama de dispersão (Figura 2B), você pode ver que quanto maior
a participação da igreja, maiores as vendas de bebidas alcoólicas. Na verdade, a correlação
é quase perfeita. A parte divertida está produzindo teorias para explicá-lo - por exemplo, a
igreja libera pessoas de culpa, e assim eles se sentem livres para beber; Ou beber faz com
que as pessoas se sintam culpadas, e então vão à igreja. Claro, ambos são explicados pelo
crescimento populacional, e Quando desentendemos os números, expressando-os como
rácios de população, a associação desaparece.
Onde você obtém números de população para usar em detrending? O recenseamento dos
EUA é coletado apenas a cada dez anos, mas muitas organizações produzem estimativas
provisórias para os anos intermediários. O serviço de taxa e dados padrão produz estudos
de audiência de mídia e estimativas de população, e seus relatórios estão disponíveis em
bibliotecas maiores e nos departamentos de marketing de organizações de mídia. O Audit
Bureau of Circulations tem estimativas domésticas a nível do condado ano a ano. A
maioria dos jornais e muitas escolas de jornalismo são membros do ABC e têm acesso aos
seus dados, tanto na forma impressa como no disquete de PC.
Ajuste de curva
Um ajuste direto funciona para muitos tipos de dados de tendências.Você pode usar sua
calculadora ou um programa estatístico, como SPSS (Pacote Estatístico para Ciências
Sociais), para fazer uma regressão e diagrama de dispersão com o tempo como variável
independente ou X. O coeficiente de correlação (capítulo 4) informará o quão bem seus
dados se encaixam no modelo de linha direta. Se é um bom ajuste, você pode até tentar
prever o futuro, desenhando a linha reta mais adequada e estendendo-a com uma ponta
rápida. Essa projeção linear diz o que acontecerá se as tendências atuais continuarem
inalteradas - o que, é claro, pode não fazer.
A natureza, infelizmente, não gosta de linhas retas. Não se preocupe.Você pode usar o
mesmo programa de regressão para se adequar a uma linha curva. Primeiro, examine o
diagrama de dispersão e use sua imaginação para ver que tipo de linha pode caber. Se é
uma curva simples, que não se torce em uma nova direção em algum ponto ao longo do
seu comprimento, às vezes pode ser endireitada reexpressando uma das variáveis em
termos de função não-linear.
Se sua curva for oca para cima, para usar o termo de Tukey, experimente uma expressão à
direita de Y. Se for oco para baixo, mova para a esquerda. Faça o contrário para
reexpressar a variável independente ou X. Verifique seu diagrama de dispersão cada vez
que você tentar uma dessas conversões para ver se a curva está se endireitando. Se isso
funciona, e se você tentar prever o futuro com a técnica de "straightedge", lembre-se de
que é uma previsão baseada em uma transformação de Y ou X, e você terá que convertê-la
de volta antes de sua previsão produzir qualquer sentido.
Aqui está um exemplo. David Arant e eu nos perguntamos se os papéis que ganham o
maior número de Prêmios Pulitzer também são os melhores editados. Nós criamos um
método para medir a qualidade da edição básica de um documento e planejamos isso
contra os recados Pulitzer para uma amostra de 58 organizações de jornal. Encontramos
um forte efeito para os primeiros Pulitzers, mas caiu rapidamente depois disso. Em outras
palavras, o efeito não era linear. Você pode vê-lo na Figura 2C (1). Os pontos formam
uma curva em vez de uma linha reta. Para endireitar a curva, precisávamos esticar a escala
de Pulitzer na parte inferior, e a melhor maneira de fazer isso acabou por usar a raiz
quadrada da pontuação de Pulitzer em lugar da pontuação em bruto como independente ou
X variável. Outro endireitamento foi obtido eliminando um "outlier".A Associated Press,
com sua alta taxa de má ortografia e alta taxa Pulitzer, estava claramente em uma classe
por si só. Ao limitar o estudo aos jornais, obtivemos uma aproximação mais próxima de
uma linha reta. O resultado é na Figura 2C (2). Isso nos deu uma correlação
estatisticamente significante. A moral é que é uma boa idéia olhar sempre o diagrama de
dispersão antes de lidar com a correlação.
Suavização
Se a natureza não gosta de linhas retas, ela também não gosta muito de curvas
logaritmicas lisas. As tendências mais interessantes são muitas vezes as que se torcem e se
tornam mais exóticas. Tukey tem um procedimento para lidar com dados tão complicados
que ele chama de "suavização". A teoria por trás do suavização é que o erro de medição é
em si uma tendência secular e pode ser retirado usando cada ponto como um controle nos
pontos vizinhos. Uma média móvel é um método de alisamento bastante familiar. Se você
tiver dados mensais que precisam ser suavizados, expresse janeiro como a média de
dezembro, janeiro e fevereiro. Então, para fevereiro, use a média de janeiro, fevereiro e
março.
A recomendação de Tukey é usar medianas rolantes de três em vez de meios. Veja como
fazer isso: compare cada ponto de dados com aqueles de cada lado e, em seguida,
substitua-o pelo meio dos três.Por exemplo, na série 324, os dois seriam alterados para três
porque três são a mediana do conjunto. Dessa forma, os pontos descontroladamente fora
do alcance serão enterrados. Isso é bom, diz Tukey, porque esses pontos estranhos
chamam a atenção e tornam difícil ver o que está acontecendo realmente. "O valor do
alisamento", ele diz, "... é a visão mais clara do geral, uma vez que está livre de
detalhes".8 Em outras palavras, é exatamente o que um jornalista precisa. E se um liso de
executar medianas de três deixa alguns lugares irregulares, Tukey recomenda fazê-lo
novamente - e novamente - até que o alisamento não mude mais as coisas. Existem
maneiras mais complicadas de suavizar, e estão além do escopo deste livro. Consulte o
trabalho da Tukey para obter detalhes ou tente uma das rotinas de suavização no SYSTAT,
um pacote de software popular para rotinas estatísticas.9 A Figura 2C (1) mostra um lote de
leitores de jornais diários por idade exata. Seu objetivo é ver como o leitor muda de
acordo com o estágio da vida. A versão suavizada, 2C (2), torna isso mais claro.
Números de índice
Outra maneira de obter clareza para análise e comunicação é usar números de índice. O
CPI é um bom exemplo de um número de índice. Com 1982-1984 estabelecido em 100 e
setembro 1989 às 125, você sabe que os preços subiram 25% do período base.
Ajuste sazonal
Outra forma de destruição é o ajuste sazonal. Quando o Bureau of Labor Statistics emite
seus números de desemprego mensais, nos dá números que podem ser comparados
diretamente de um mês para o próximo para que possamos ver de imediato se as coisas
estão melhorando ou piorando.
Mas o desemprego é sazonal. As aberturas e fechamentos escolares e as condições
climáticas podem afetar o número de pessoas que procuram trabalho em diferentes épocas
do ano. Para avaliar a saúde da economia, estamos interessados nas mudanças mês a mês
que não podem ser atribuídas à variação sazonal. Os estatísticos do BLS realizam essa
destruição ao analisar as mudanças sazonais passadas e assumindo que o ano atual não
será muito diferente. Então, eles subtraem a parcela atribuível à mudança de estação e
relatam o resto.Existe algum risco nisso, é claro, porque as variações sazonais não são
uniformes de ano para ano. Mas é melhor do que não fazê-lo. Se a Casa Branca derruba
números de desemprego no outono de um ano eleitoral que mostram uma queda dramática
no desemprego, os repórteres cuidadosos verificarão se o ajuste sazonal não foi omitido.Se
houver, o declínio pode ser meramente o resultado de grande parte da força de trabalho
adolescente voltando para a escola.
Residuais de regressão
Uma técnica estatística para destruição é útil Quando você precisa controlar alguma
variável contínua que ocorra a maior parte do que você está interessado. Andrew Brack
estava estudando a qualidade editorial dos jornais na Carolina do Norte, mas ele foi
prejudicado pelo fato de que o tamanho da circulação explica a maior parte da
variância. Os papéis maiores têm mais recursos, e assim eles dão aos seus leitores mais
por seu dinheiro. A Brack, no entanto, reuniu uma amostra de papéis grandes e pequenos,
mediu-os em vários indicadores de qualidade editorial, combinou os indicadores em um
índice e os traçou em um gráfico. Veja a Figura 2E para o resultado.O eixo vertical
representa a qualidade e o eixo horizontal representou a circulação. Quando cada papel é
plotado no gráfico, sua distribuição se aproxima de uma linha reta.
Usando o modelo linear geral (GLM) para traçar a linha reta mais adequada para
descrever o efeito da circulação na qualidade, Brack voltou sua atenção para os desvios
dessa linha. Alguns papéis foram muito maiores em qualidade do que Seria previsto pelo
seu tamanho de circulação, e outros eram muito menores. Ao medir esses desvios do que a
circulação previria, ele obteve uma medida de qualidade deprimida que eliminou o efeito
do tamanho da circulação. O termo técnico para esta técnica é a análise residual, pois
considera a variação residual, ou a variância que resta após o tamanho da circulação
explica o que pode. (O Capítulo 4 terá uma explicação mais completa).
Pontuações padronizadas
Notas
4. Jim Stewart e Andrew Alexander, "Assault Guns Muscling In On Front Lines of Crime", Atlanta
Journal-Constitution, 21 de maio de 1989, p. 1. retornar ao texto
7. Estatísticas históricas dos Estados Unidos: Colonial Times to 1970 , Bicentennial Edition
(Washington: US Government Printing Office, 1975), p. 211.retornar ao texto
8. John W. Tukey, Exploratory Data Analysis (Boston: Addison-Wesley, 1977), p. 205. retornar ao
texto
9. Leland Wilkinson, SYSTAT: o sistema de estatística (Evanston, Ill .: SYSTAT, Inc.,
1988). Retornar ao texto
Se você já conhecesse os antecedentes do caso, sabia que a Corte tinha nove juízes, o fato
de que cinco votaram para anular o precedente anterior lhe daria todas as informações
adicionais que você precisava. Essas histórias quantitativas de um número são bastante
comuns no negócio de notícias.
A taxa mais utilizada é a taxa por cem ( por cento, em latim) ou por cento. Um percentual
é o equivalente decimal de uma fração, mas com o ponto decimal movido dois lugares
para a direita. Portanto:
1/2 = .5 = 50%
Nenhuma porcentagem faz sentido a menos que você conheça sua base.
A maneira de calcular uma porcentagem sem perder o controle da base é obter a fração
primeiro. Se 11 membros da equipe de futebol de 42 homens 1986 se formaram em quatro
anos, a taxa de graduação de quatro anos do esquadrão é 11/42. O 11 na fração é o número
que se formou e 42 é a base para a qual o número que se formou está sendo comparado. A
base é a parte inferior da fração.Eu sei, isso soa elementar, mas você ficaria surpreso com
a quantidade de estudantes que têm dificuldade em lembrar disso.(Quando eu explico isso
aos alunos, peço-lhes que visualizem uma estátua no campus: por exemplo,
Silencioso Sam na Carolina ou Tommy Trojan no sul da Califórnia. A base está na parte
inferior.Isso parece ajudar.)
Ser capaz de identificar a base é importante, por causa da próxima regra:
Quando você compara duas porcentagens, você precisa ter certeza de que eles têm a
mesma base.
Alguns escritores de notícias, evidentemente, pensam que é aborrecido manter a base
constante ao fazer comparações percentuais. Eu vi histórias de jornal onde a base foi
mudada na metade: "Noventa por cento dos negros no condado de Baxter votaram em
Dukakis, mas 95 por cento dos apoiantes de Bush eram brancos". Em um caso, a base é
negra, na outra é apoiadores de Bush. Essa comparação não faz sentido, embora você
possa enganar algo significativo se você conhecesse o percentual negro no
eleitorado. Quanto melhor dizer, "Dukakis recebeu 90% do voto negro e 40% do voto
branco".
Quando você tem a base firmemente em mente, você pode converter a fração para uma
decimal por divisão. Não se esqueça do movimento de dois lugares do ponto decimal
implícito no conceito de porcentagem:
Cinquenta por cento é outra maneira mais fácil de dizer 50 centésimos. Se deixássemos a
casa decimal e dissesse .50 centésimos ou 0,5 por cento, teríamos mais do que uma
redundância, teríamos um número completamente diferente (metade de um por cento). Às
vezes, você verá em expressões impressas como .50 por cento, onde o escritor realmente
significa 50 por cento. O ponto decimal foi evidentemente lançado apenas para a
ênfase. Então, aqui está outra regra da vida:
Diferença percentual
Talvez você pensou que usar a imagem de uma estátua para reforçar o conceito de uma
base percentual era bobo. Mas quando você tenta encontrar uma diferença percentual,
você realmente apreciará a importância de manter a base identificada.
A diferença percentual significa exatamente o que diz: a diferença entre dois valores
tomados como uma porcentagem do valor que você está usando como base. Se você quiser
a alteração percentual do Tempo 1 para o Tempo 2, então o valor do Tempo 1 é a base.
Então, primeiro obtenha o valor absoluto da diferença. Subtrair 2668.26 de 2759.84, e
você acha que o Dow caiu 190.58 pontos.Agora você pode configurar a
fração. (Certifique-se de usar a base direita.) O declínio percentual é:
190,58
= .0690547 = 6,91%
2759.84
Observe que, para passar do decimal para a porcentagem, movemos os dois locais
decimais para a direita e adicionamos um sinal de porcentagem. Também arredondamos
para duas casas decimais, o que provavelmente é mais precisão do que precisamos, mas
nos inclinamos para o estilo do Wall Street Journal .
Observe também que o arredondamento não é o mesmo que o truncado. Se estivéssemos
truncados, sairíamos com 6,90 por cento.Mas, uma vez que o valor caído é mais da metade,
arredondamos para 6,91. Para avaliar os dígitos descartados, coloque um decimal
imaginário na frente deles. Neste caso, .547 é maior do que .5, e assim você se
arredonda. Se fosse inferior a .5, você truncaria (ou seja, deixaria cair os dígitos
excedentes). E se fosse exatamente .5?Isso não faz muita diferença, mas, por razões de
consistência, eu arredundo nesse caso - na teoria de que se eu realizasse meu Divisão para
mais casas decimais, pode haver um valor lá fora, que daria para maior que .5.
Agora, tente esta questão: qual o ganho percentual que o mercado deve fazer desde o
fechamento de sexta-feira para recuperar seu status no fechamento de quinta-feira? Talvez
você pense que, uma vez que caiu 6,91 por cento, ele deve subir 6,91 por cento para voltar
para onde estava. Não tão! Deve voltar os mesmos 190.58 em pontos absolutos, mas ao
enquadrar esta questão mudamos a base percentual. A base está agora fechada de sexta-
feira, e assim:
190,58
= .0741603 = 7,42%
2569,84
Para recuperar a perda de 6.91 por cento, o mercado teve que ganhar 7.42 por cento.
Depois daquela queda da sexta-feira 13, eu ouvi um apresentador de televisão se referir a
ele como a segunda maior queda na história.Isso era verdade em pontos absolutos, mas em
termos percentuais era apenas o 12º. Aqui está o registro, tirado do Wall Street Journal:1
Encontro Fechar Mudança de Mudança
Ponto percentual
Os motivos para que o Dow fosse muito maior agora do que era na década de 1930 são
diretos. A economia cresceu e as empresas valem mais. Parte do crescimento é real e parte
é a inflação. Estas são tendências seculares , o que significa que elas afetam quase tudo na
sociedade. Se você for fazer comparações ao longo do tempo, você deve filtrar esse efeito
secular para ver o que está acontecendo especificamente com o fenômeno que você está
investigando. Em outras palavras, você precisa diminuir os números, usar um termo
favorecido por Cook e Campbell.3 Exprimir mudanças em termos percentuais é uma
maneira de se detrender, mas não é a única maneira. Ajudar o Dow Jones pela inflação
seria outro. Os analistas e contadores financeiros não fazem rotineiramente isso, mas, se o
fizerem, o efeito sobre a Dow Jones Industrial Average seria a abertura dos olhos. Seu
crescimento a longo prazo, embora ainda real, não seria quase tão impressionante.
Algumas pessoas usam a regra "Divida o pequeno número pelo grande número". Essa é a
regra errada. Isso só funciona se a diferença percentual for inferior a 100. Em nossa
comparação de sessenta anos, onde o valor para o ano base é menor do que o valor para o
ano de comparação, a média industrial Dow aumentou 1100%.
Outra maneira de expressá-lo seria dizer que a média industrial foi "11 vezes maior" em
outubro de 1989 do que em outubro de 1929. Não recomendo esse uso porque é muito
facilmente confundido com "11 vezes maior". Neste caso, o Dow de 1989 é 12 vezes tão
grande quanto o Dow de 1929.
Existe uma explicação simples para essa confusão. "Times greater" compara o valor base
com a diferença (a quantidade "maior"). E "times as great" compara o valor base com o
novo valor. O número de 1989, 2759.84 é 12 vezes o valor de 230.07 de 1929. É apenas
11 vezes a diferença.
Isso é bastante claro quando você pensa sobre isso. Infelizmente, muitos escritores de
notícias não pensam nisso e usam "times greater" e "times as" como se elesSignificava o
mesmo. Eles não! Considere este exemplo do Atlanta Journal-Constitution:
Washington - Uma arma de assalto tem 20 vezes mais chances de ser usada no crime do
que uma arma de fogo convencional, de acordo com um estudo do Atlanta Journal-
Constitution Washington Bureau.
Enquanto as armas de assalto representam 1 milhão - ou 0,5 por cento - dos 200 milhões
de armas de fogo de propriedade privada nos Estados Unidos, eles foram usados em um
dos 10 crimes que resultaram em um registro de armas de fogo no ano passado, mostra o
estudo.
A comparação da incidência de armas de assalto com a incidência esperada é
perfeitamente razoável. Mas 10 por cento são 19 vezessuperiores a meio por cento, não 20
vezes maiores. No entanto, é 20 vezes tão grande, o que provavelmente é o que os
escritores queriam dizer.4
Esse erro leva você a ter mais problemas quando você está falando de mudanças menores,
duas ou três vezes. Se você tem 20 anos, e eu tenho três vezes mais velho que você, eu
devo ter 60 anos. Mas se eu for três vezes maior do que você, eu tenho 80 anos. Tento
mantê-lo direto para o meu bem.
Ajustando pela inflação
Mesmo assim, não é possível criar uma cesta de mercado que se aplique igualmente a
todos os grupos. Por exemplo, os aposentados que possuem suas casas não são afetados
por mudanças nos valores de aluguel ou de casa. Para os aposentados em casa do governo
federal, cujas pensões são indexadas ao CPI, a indexação cria uma ganância
inesperada. Os seus rendimentos aumentam automaticamente mais do que os seus próprios
custos normais de vida.
Aqui está um exemplo perto de casa. David H. Weaver e G. Cleveland Wilhoit relataram
em 1986 que a renda média dos jornalistas aumentou de US $ 11.113 em 1970 para US
$ 19.000 em 1981. Isso foi uma má notícia para os jornalistas, ressaltaram, porque o
período intermediário era uma inflação furiosa, E os jornalistas realmente perderam cerca
de US $ 7.000 por ano No poder de compra.6 Para verificar seu cálculo, você precisa do
IPC para 1970 e para 1981. De acordo com o Resumo Estatístico dos Estados
Unidos, publicado anualmente pelo Escritório de Impressão do Governo dos EUA, foi
38,8 e 90,9, respectivamente (o índice usa os preços para o Período 1982-1984 como base
de 100). Em seguida, converta a renda média diária para 1970 em dólares constantes de
1981. Use a fórmula para equivalentes de fração que você aprendeu na escola secundária:
38,8 90,9
=
11,133 X
Talvez você esteja mais confortável com uma frase em inglês do que uma equação: 38,8 é
de US $ 11,133 como 90,9 é para a quantidade desconhecida (renda de 1970 expressa em
dólares constantes de 1981). Seguindo a regra de multiplicação cruzada da álgebra da
escola secundária, você acha que:
38,8 * X = 11,133 * 90,9
Fórmulas neste livro usam notação de computador: o sinal de "tempos" é um asterisco (*) ao invés do antigo
"X". Isso liberta "X" para representar um desconhecido. Um slash (/) significa "dividido por".
Punch ele em sua calculadora, e 1970 $ 11,133 resulta ser igual a $ 26,082.21 em dólares
constantes de 1981. Assim, os salários do jornalismo realmente diminuíram 27 por cento
durante esse período.Por quê? Duas coisas aconteceram. O desempenho de dois
jovensrepórteres do Washington Post no escândalo do Watergate motivou muitos jovens
para se tornarem jornalistas. Ao mesmo tempo, as barreiras às mulheres na profissão
foram reduzidas. Ambos os eventos aumentaram consideravelmente o grupo de
trabalhadores disponíveis no jornalismo. Essa inesperada juventude idealista e motivada
deu aos proprietários da mídia uma escolha maravilhosa.Opção 1: elevar os padrões do
jornalismo, aproveitando o melhor do grupo ampliado e recebendo o melhor e mais
brilhante no jornalismo.Opção 2: escolha a próxima geração de Jornalistas selecionando
aqueles que trabalhariam pela menor quantidade de dinheiro e levando as economias para
a linha inferior. Graças a Weaver e Wilhoit, agora sabemos como esse saiu.
(Se você é um estudante que contempla uma carreira no jornalismo, não se desanime. Os
efeitos do Watergate e da feminização tiveram que seguir seu curso no final da década de
1980 e os salários começaram a subir mais rápido que a inflação.)
Mais dicas para usar o CPI: livros mais antigos que este usam figuras CPI que têm 1967 =
100 como base. O Bureau of Labor Statistics recentemente converteu-se para a nova base
onde o período 1982-1984 = 100. Por algum tempo eles vão publicar ambos os
números.Atualize seu Resumo Estatístico todos os anos para se manter atualizado. A partir
desta escrita, o Resumo Estatístico dá um IPC para todos os anos de volta a 1950. Para
anos anteriores, veja um conjunto bonito de volumes chamado Estatística Histórica dos
Estados Unidos.7 Ele fornece todos os números BLS de volta ao início da Primeira Guerra
Mundial e, em seguida, usa estimativas de outras fontes históricas para produzir CPIs
anuais de volta para 1800.
Se você precisar da figura mensal mais recente, ligue para este número: (202) 523-
9658. Uma voz gravada lhe dará o IPC no mês mais recente. Os números mensais vêm em
duas categorias, o CPI-U e o CPI-W. O CPI-U é para todos os consumidores urbanos e
cobre cerca de 80 por cento da população. O CPI-W é para assalariados urbanos e
trabalhadores clericais. Eles são coletados separadamente para que os diferentes efeitos
sobre a inflação possam ser rastreados para os dois grupos (embora se sobrepõem
consideravelmente). Para a maioria dos propósitos de política pública, o CIP-U mais
abrangente é usado para fazer ajustes de inflação.
As tendências fazem novidades, quer porque tenham andado em silêncio e que nem
muitos tenham notado ou por causa de uma interrupção repentina de uma tendência. Para
se concentrar na tendência da notícia, você deve separá-la de todas as tendências paralelas
em segundo plano. O crescimento da população é uma tendência secular que, como a
inflação, pode fazer outras tendências mais do que parecem.
É um número que é fácil de entender no nível intuitivo. Quando a penetração era de 100%
em um determinado mercado, um jornal foi vendido para cada casa. Quando estava acima
de 100 por cento, mais jornais foram vendidos do que famílias - comum na década de
1950. Hoje, o número é muito menor e ainda está caindo, com alguns jornais
metropolitanos experimentando penetração doméstica de menos de 50%. Expressando a
circulação do jornal como proporção para as famílias (porque a circulação entregues em
casa é vendida para Famílias em vez de indivíduos) torna a tendência real mais fácil de ver
(veja a Figura 2A).
Onde você obtém números de população para usar em detrending? O recenseamento dos
EUA é coletado apenas a cada dez anos, mas muitas organizações produzem estimativas
provisórias para os anos intermediários. O serviço de taxa e dados padrão produz estudos
de audiência de mídia e estimativas de população, e seus relatórios estão disponíveis em
bibliotecas maiores e nos departamentos de marketing de organizações de mídia. O Audit
Bureau of Circulations tem estimativas domésticas a nível do condado ano a ano. A
maioria dos jornais e muitas escolas de jornalismo são membros do ABC e têm acesso aos
seus dados, tanto na forma impressa como no disquete de PC.
Ajuste de curva
Um ajuste direto funciona para muitos tipos de dados de tendências.Você pode usar sua
calculadora ou um programa estatístico, como SPSS (Pacote Estatístico para Ciências
Sociais), para fazer uma regressão e diagrama de dispersão com o tempo como variável
independente ou X. O coeficiente de correlação (capítulo 4) informará o quão bem seus
dados se encaixam no modelo de linha direta. Se é um bom ajuste, você pode até tentar
prever o futuro, desenhando a linha reta mais adequada e estendendo-a com uma ponta
rápida. Essa projeção linear diz o que acontecerá se as tendências atuais continuarem
inalteradas - o que, é claro, pode não fazer.
A natureza, infelizmente, não gosta de linhas retas. Não se preocupe.Você pode usar o
mesmo programa de regressão para se adequar a uma linha curva. Primeiro, examine o
diagrama de dispersão e use sua imaginação para ver que tipo de linha pode caber. Se é
uma curva simples, que não se torce em uma nova direção em algum ponto ao longo do
seu comprimento, às vezes pode ser endireitada reexpressando uma das variáveis em
termos de função não-linear.
Se sua curva for oca para cima, para usar o termo de Tukey, experimente uma expressão à
direita de Y. Se for oco para baixo, mova para a esquerda. Faça o contrário para
reexpressar a variável independente ou X. Verifique seu diagrama de dispersão cada vez
que você tentar uma dessas conversões para ver se a curva está se endireitando. Se isso
funciona, e se você tentar prever o futuro com a técnica de "straightedge", lembre-se de
que é uma previsão baseada em uma transformação de Y ou X, e você terá que convertê-la
de volta antes de sua previsão produzir qualquer sentido.
Aqui está um exemplo. David Arant e eu nos perguntamos se os papéis que ganham o
maior número de Prêmios Pulitzer também são os melhores editados. Nós criamos um
método para medir a qualidade da edição básica de um documento e planejamos isso
contra os recados Pulitzer para uma amostra de 58 organizações de jornal. Encontramos
um forte efeito para os primeiros Pulitzers, mas caiu rapidamente depois disso. Em outras
palavras, o efeito não era linear. Você pode vê-lo na Figura 2C (1). Os pontos formam
uma curva em vez de uma linha reta. Para endireitar a curva, precisávamos esticar a escala
de Pulitzer na parte inferior, e a melhor maneira de fazer isso acabou por usar a raiz
quadrada da pontuação de Pulitzer em lugar da pontuação em bruto como independente ou
X variável. Outro endireitamento foi obtido eliminando um "outlier".A Associated Press,
com sua alta taxa de má ortografia e alta taxa Pulitzer, estava claramente em uma classe
por si só. Ao limitar o estudo aos jornais, obtivemos uma aproximação mais próxima de
uma linha reta. O resultado é na Figura 2C (2). Isso nos deu uma correlação
estatisticamente significante. A moral é que é uma boa idéia olhar sempre o diagrama de
dispersão antes de lidar com a correlação.
Suavização
Se a natureza não gosta de linhas retas, ela também não gosta muito de curvas
logaritmicas lisas. As tendências mais interessantes são muitas vezes as que se torcem e se
tornam mais exóticas. Tukey tem um procedimento para lidar com dados tão complicados
que ele chama de "suavização". A teoria por trás do suavização é que o erro de medição é
em si uma tendência secular e pode ser retirado usando cada ponto como um controle nos
pontos vizinhos. Uma média móvel é um método de alisamento bastante familiar. Se você
tiver dados mensais que precisam ser suavizados, expresse janeiro como a média de
dezembro, janeiro e fevereiro. Então, para fevereiro, use a média de janeiro, fevereiro e
março.
A recomendação de Tukey é usar medianas rolantes de três em vez de meios. Veja como
fazer isso: compare cada ponto de dados com aqueles de cada lado e, em seguida,
substitua-o pelo meio dos três.Por exemplo, na série 324, os dois seriam alterados para três
porque três são a mediana do conjunto. Dessa forma, os pontos descontroladamente fora
do alcance serão enterrados. Isso é bom, diz Tukey, porque esses pontos estranhos
chamam a atenção e tornam difícil ver o que está acontecendo realmente. "O valor do
alisamento", ele diz, "... é a visão mais clara do geral, uma vez que está livre de
detalhes".8 Em outras palavras, é exatamente o que um jornalista precisa. E se um liso de
executar medianas de três deixa alguns lugares irregulares, Tukey recomenda fazê-lo
novamente - e novamente - até que o alisamento não mude mais as coisas. Existem
maneiras mais complicadas de suavizar, e estão além do escopo deste livro. Consulte o
trabalho da Tukey para obter detalhes ou tente uma das rotinas de suavização no SYSTAT,
um pacote de software popular para rotinas estatísticas.9 A Figura 2C (1) mostra um lote de
leitores de jornais diários por idade exata. Seu objetivo é ver como o leitor muda de
acordo com o estágio da vida. A versão suavizada, 2C (2), torna isso mais claro.
Números de índice
Outra maneira de obter clareza para análise e comunicação é usar números de índice. O
CPI é um bom exemplo de um número de índice. Com 1982-1984 estabelecido em 100 e
setembro 1989 às 125, você sabe que os preços subiram 25% do período base.
As pessoas de vendas de publicidade de jornal às vezes usam números de índice para
comparar a audiência de um jornal com seu mercado. Se 35 por cento dos adultos no
mercado tiveram diplomas universitários e 47 por cento dos leitores têm diplomas
universitários, o índice é 134. Esta é outra maneira de dizer que a taxa de graduação da
faculdade é 34 por cento maior entre os leitores do que no mercado como um todo. Ao
aplicar esta indexação a uma variedade de meios de comunicação concorrentes, o
vendedor de anúncios pode argumentar que o público de seu papel é mais sofisticado e
tem mais poder de compra do que os números de circulação bruta indicariam.
Ajuste sazonal
Outra forma de destruição é o ajuste sazonal. Quando o Bureau of Labor Statistics emite
seus números de desemprego mensais, nos dá números que podem ser comparados
diretamente de um mês para o próximo para que possamos ver de imediato se as coisas
estão melhorando ou piorando.
Residuais de regressão
Uma técnica estatística para destruição é útil Quando você precisa controlar alguma
variável contínua que ocorra a maior parte do que você está interessado. Andrew Brack
estava estudando a qualidade editorial dos jornais na Carolina do Norte, mas ele foi
prejudicado pelo fato de que o tamanho da circulação explica a maior parte da
variância. Os papéis maiores têm mais recursos, e assim eles dão aos seus leitores mais
por seu dinheiro. A Brack, no entanto, reuniu uma amostra de papéis grandes e pequenos,
mediu-os em vários indicadores de qualidade editorial, combinou os indicadores em um
índice e os traçou em um gráfico. Veja a Figura 2E para o resultado.O eixo vertical
representa a qualidade e o eixo horizontal representou a circulação. Quando cada papel é
plotado no gráfico, sua distribuição se aproxima de uma linha reta.
Usando o modelo linear geral (GLM) para traçar a linha reta mais adequada para
descrever o efeito da circulação na qualidade, Brack voltou sua atenção para os desvios
dessa linha. Alguns papéis foram muito maiores em qualidade do que Seria previsto pelo
seu tamanho de circulação, e outros eram muito menores. Ao medir esses desvios do que a
circulação previria, ele obteve uma medida de qualidade deprimida que eliminou o efeito
do tamanho da circulação. O termo técnico para esta técnica é a análise residual, pois
considera a variação residual, ou a variância que resta após o tamanho da circulação
explica o que pode. (O Capítulo 4 terá uma explicação mais completa).
Pontuações padronizadas
Notas
4. Jim Stewart e Andrew Alexander, "Assault Guns Muscling In On Front Lines of Crime", Atlanta
Journal-Constitution, 21 de maio de 1989, p. 1. retornar ao texto
7. Estatísticas históricas dos Estados Unidos: Colonial Times to 1970 , Bicentennial Edition
(Washington: US Government Printing Office, 1975), p. 211.retornar ao texto
8. John W. Tukey, Exploratory Data Analysis (Boston: Addison-Wesley, 1977), p. 205. retornar ao
texto
Por outro lado, considere a inteligência humana medida pelo, digamos, o teste de QI de Stanford-Binet. Isso varia
perguntando quanto da variação é causada pela hereditariedade e quanto pelo ambiente, se pode ser mudado, e se
Variáveis.
A diferença, então, faz novidades. E em qualquer análise estatística, a primeira coisa que geralmente queremos sa
varia. Uma vez que descobrimos isso, geralmente estamos interessados em encontrar as fontes da variância. Idealm
contentar em descobrir o que correlaciona ou covaries com a variável em que estamos interessados.Como a causa
bem - a mesma coisa. Se dois fenômenos interessantes covirarem (o que significa que eles variam juntos), eles diz
mas deixam de ser insuficientes, e com razão. Por exemplo, o quão bem você executa na faculdade pode depende
simplesmente ajudam a explicar isso, indicando o nível de habilidade subjacente que é a causa dos resultados dos
As aplicações estatísticas, tanto no jornalismo como na ciência, visam encontrar causas, mas é necessário muito c
modéstia está se tornando, então pense em estatísticas como uma busca pela variância inexplicada. É um conceito
Variação de medição
Existem duas maneiras de usar as estatísticas. Você pode fazer um livro de receitas, aplicando fórmulas sem enten
acontecendo. A rota do livro de receitas pode ser fácil e rápida, mas para realmente melhorar sua compreensão, vo
a pena gastar algum tempo para obtê-lo no nível intuitivo. Se você vê a diferença entre variância baixa (número d
em algumas maneiras de medir a variação.
Uma medida deve começar com uma linha de base. (Lembre-se do comediante perguntado: "Como é sua esposa?"
Ao medir a variância, o "em comparação com o que" é a tendência central, e a medida conveniente da tendência c
usar ovalor esperado .
Comece com a variável mais simples possível, que varia em apenas duas condições: zero ou uma, branca ou preta
real, que os estatísticos têm um termo para elas. Eles são chamados devariáveis dicotômicas . Outra palavra descr
Uma variável dicotômica interessante na atual sociedade americana é um estatuto de minoria. As políticas destina
minoria.(Saltejamos, por enquanto, as possíveis complicações de fazer isso.) Agora imagine duas cidades, uma no
a maior variação?
Com apenas um pouco de reflexão, você verá que a cidade do meio oeste não tem muita variação em sua maquiag
variância racial.
Aqui está outra maneira de pensar sobre a diferença. Se você soubesse a distribuição racial na cidade do meio-oes
98% de chance de estar certo. Na cidade do sul, você faria o mesmo palpite, mas seria muito menos certo de estar
considerarmos a aritmética da amostragem.
1. A diferença é interessante.
2. A diferença é diferente para diferentes variáveis e em diferentes populações.
Miami Herald
Los Angeles Times
Philadelphia Inquirer
Washington Post
Boston Globe
New York Times
Chicago Tribune
Newsday
Detroit Free Press
Apenas ao examinar a lista, você pode ver muita variação lá. O artigo com a pior expressão na lista tem mais de d
proporção dos extremos, é de um modo intuitivamente satisfatório. Mas é uma medida difícil porque não usa toda
ponto de referência (um comparado com o que) calculando a média, que é a soma dos valores divididos pelo núm
errado 11,6 por cento do tempo. Quando falamos de variação, estamos realmente falando de variância em torno (o
1. Tome o valor de cada caso e subtrai a média para obter a diferença.
2. Marque essa diferença para cada caso.
Essa é uma lista bastante longa e detalhada. Se este fosse um texto estatístico, você teria uma equação. Você gosta
Então, faça tudo acima, e o resultado é a variância neste caso. Isso funciona para cerca de 100, dar ou dar um pon
dar a este número alguma utilidade intuitiva? Bem, a primeira coisa a lembrar é que a variância é um conceito abs
chegando perto de uma maneira de fazer isso. Se tomarmos a raiz quadrada da variância (razoavelmente suficient
chamada de desviopadrão da média. Ou apenas desvio padrão para baixo. E o número que você compara é o meio
Neste caso, a média é 11,6 eo desvio padrão é 10, o que significa que há muita variação em torno dessa média. Em
casos cairão dentro de um desvio padrão da média. Então, se o desvio padrão é um valor pequeno em relação ao v
da média. Se o desvio padrão for um grande valor em relação à média, então a variância é relativamente grande.
No caso em questão, a variação na taxa de erro de "minúsculo", a variância é bastante grande, com apenas um cas
variância!
Miami Herald
Los Angeles Times
Philadelphia Inquirer
Washington Post
Boston Globe
New York Times
Chicago Tribune
Newsday
Detroit Free Press
A circulação média para este grupo de nove é 708.678 e o desvio padrão em torno dessa média é 238.174. Então,
terços ficariam bastante próximos da média - dentro de um terço do valor da média.
Uma maneira de obter uma boa imagem da forma de uma distribuição, incluindo a quantidade de variância, é com
padrão, tem uma média de 100 e um desvio padrão de 16. Então, imagine um campo de trigo de Kansas com o res
conhece o seu Índice de QI, e há uma linha reta no campo marcado com números a intervalos de um metro de 0 a
seu QI. Olhe para a Figura 3A. Um histograma vivo! Como o QI é normalmente distribuído, a linha mais longa se