Você está na página 1de 62

The New

Precision Journalism
by Philip Meyer

Jornalismo e tradição científica


Se você é um jornalista, ou pensa em se tornar um, talvez já tenha percebido isso: eles
estão aumentando a expectativa sobre o que é preciso para ser jornalista.

Houve um tempo em que tudo que demorou foi uma dedicação à verdade, muita energia e
algum talento para a escrita. Você ainda precisa dessas coisas, mas elas já não são
suficientes. O mundo tornou-se tão complicado, o crescimento da informação disponível
tão explosivo, que o jornalista precisa ser um filtro, bem como um transmissor, um
organizador e intérprete, bem como aquele que reúne e entrega fatos. Além de saber como
obter informações na impressão ou no ar, ele ou ela também deve saber como entrar na
cabeça do receptor.Em suma, um jornalista deve ser um gerenciador de banco de dados,
um processador de dados e um analista de dados.

É preciso treinamento especial. Nos bons velhos tempos, havia uma dúvida séria nos
círculos profissionais sobre se o jornalismo, como disciplina, incluía todo o
conhecimento. O jornalismo, nesta visão, é todo procedimento, não substância.1Quando
James Bryant Conant teve que lidar com um legado inesperado para Harvard para
"melhorar os padrões do jornalismo", ele escolheu treinamento substantivo para jornalistas
de meados da carreira. "O Sr. Conant sentiu que não havia uma base de conhecimento
suficiente para justificar uma escola de jornalismo ... essa conclusão levou a um programa
extraordinariamente bem sucedido que não desejamos alterar", lembrou o presidente da
Harvard, Derek Bok, cinquenta anos depois.2

Em um mundo mais simples, os programas de jornalismo que ignoraram o jornalismo


podem ter sido justificados.Na sociedade da informação, as necessidades são mais
complexas. Leia qualquer um dos periódicos populares da crítica de mídia e você
encontrará uma longa ladainha de queixas repetidas sobre o jornalismo moderno. Perdeu
histórias importantes, é muito dependente dos comunicados de imprensa, é facilmente
manipulada por políticos e interesses especiais, e não comunica o que sabe de maneira
efetiva. Todas essas queixas são justificadas.Sua causa não é tanto a falta de energia, nem
o talento ou a dedicação à verdade, como os críticos às vezes implicam, mas um simples
atraso na aplicação da ciência da informação - um conjunto de conhecimento - para os
enormes problemas de relatar a notícia em Um tempo de sobrecarga de informações.

O programa Nieman de Harvard, que oferece aos jornalistas selecionados de meio período
de carreira um ano acadêmico para reparar quaisquer lacunas educacionais que eles
percebem, é usado por alguns para ampliar seu escopo como generalistas. Mas cada vez
mais estão usando isso para se adaptar às novas demandas, tornando-se mais
especializados. Em um mundo onde a quantidade de informação está dobrando a cada
cinco anos,3É preciso um especialista para entender, e muito menos se comunicar, muito
disso. O corpo periodístico jornalístico, portanto, deve incluir esses elementos:

1. Como encontrar informações;

2. Como avaliar e analisar;

3. Como comunicá-lo de uma forma que irá perfurar o balbucio da sobrecarga de


informações e alcançar as pessoas que precisam e desejam.

Na medida em que os jornalistas aprendem a fazer essas coisas, estão cumprindo um dos
elementos de uma profissão: o acesso a um corpo de conhecimento esotérico. Estamos
aprendendo, e o jornalismo está se tornando mais profissionalizado, mas, como acontece
com qualquer mudança radical, está acontecendo insegura e a diferentes taxas em
diferentes lugares.

Onde o artesanato atende a teoria

Nas escolas de jornalismo, o conceito de jornalismo de precisão - a aplicação de métodos


de pesquisa de ciências sociais e comportamentais à prática do jornalismo - encontrou um
mercado pronto. A aceitação pronta deste conceito na academia deveu-se, em parte, ao seu
contributo para a cura da violação entre as aparências verdes e as facetas do qui-
quadrado. Ele demonstrou a aplicabilidade dos métodos de pesquisa em ciências sociais
para os problemas muito reais do agrupamento de notícias em uma sociedade cada vez
mais complexa. Produziu trabalhos que os pesquisadores e as pessoas artesãs podiam
apreciar. As ferramentas de amostragem, análise computacional e inferência estatística
aumentaram o poder tradicional do repórter sem alterar a natureza de sua missão -
encontrar os fatos, compreendê-los e explicá-los sem perder tempo.

Na profissão, no entanto, as barreiras foram maiores. O jornalismo de precisão ameaçou as


tradições gêmeas da passividade jornalística e da inocência jornalística. A antiga tradição
sustenta que a mídia deve reportar notícias, não fazer novidades. O envolvimento da mídia
em pesquisas de opinião pública tem sido criticado com o argumento de que a mídia não
deve fazer pesquisas, mas deve esperar passivamente até que outras pessoas as façam e,
em seguida, informe sobre elas.4Pesquisas de mídia também violam a regra da
inocência. Um repórter deve ser uma pessoa que lança um novo olho em tudo, algo que
ele ou ela não pode fazer se sobrecarregado por muito conhecimento especializado. Um
jornalista, Vermont Royster, disse à classe 1967 de Nieman Fellows, deveria ser "um
profissional amador". O caso extremo é um correspondente estrangeiro que uma vez soube
quem riu quando perguntei se ele estava aprendendo a língua do país para o qual ele foi
designado. Na sua opinião, não era necessário, poderia até ser um obstáculo. Seus leitores
não conheciam o idioma, e seu trabalho era apenas observar o que eles observariam se
estivessem lá e informar o que viu. Se ele aprendeu uma língua estrangeira, ele poderia
começar a pensar como um estrangeiro e perder contato com esses leitores.

O problema de ser um jornalista passivo e inocente é que, como qualquer pessoa passiva e
inocente, pode ser facilmente aproveitado. O tema subjacente na crítica mais moderna do
jornalismo é que a mídia é muito facilmente dominada por políticos poderosos e seus
"roteadores" habilidosos, cujos desejos facilmente determinam o que é definido como
notícias e o que não é. Para se defender contra ser manipulado, a mídia precisa de mais
autoconfiança e os melhores O caminho para a autoconfiança é através do
conhecimento. As pesquisas de mídia proliferaram na década de 1980, precisamente
porque os editores já não confiavam nas pesquisas que os políticos tentavam dar a eles e
armaram-se com suas próprias operações de coleta de dados por autodefesa.Assim, a
votação não se tornou uma maneira de tornar a notícia como uma ferramenta melhorada
do próprio processo de criação de notícias - desde que, claro, os jornalistas sejam
responsáveis por todo o processo, desde a concepção, até o design de pesquisa, a análise e
a interpretação. O jornalista de precisão não contrata um pesquisador para criar um evento
de notícias; O jornalista se torna o pesquisador. Jim Norman dos USA Today , Rich Morin
do WashingtonPost e IA (Bud) Lewis do Los Angeles Times estavam entre os protótipos.

Além da objetividade
O modelo do jornalista como inocente passivo tinha pelo menos uma virtude:
proporcionava uma espécie de disciplina. Era consistente com a tradição de objetividade,
uma tradição que impede o jornalista de impor pontos de vista pessoais aos leitores. Mas o
modelo de objetividade foi concebido para um mundo mais simples, onde os fatos sem
adornos podem falar por si mesmos. A frustração sobre o ideal de objetividade insatisfeito
levou alguns dos meios de comunicação social na década de 1960 a abraçar algo chamado
de "novo jornalismo", que libertou os jornalistas das restrições da objetividade
concedendo-lhes licença artística para se tornarem narcisistas. Jimmy Breslin e Tom
Wolfe estiveram entre os primeiros profissionais bem-sucedidos, e seus métodos
funcionaram até chegarem a um ponto em que deixaram de ser jornalistas. As ferramentas
literárias de ficção, incluindo detalhes requintados, monólogo interior (o que uma pessoa
notável está pensando, bem como o seu comportamento aberto), e estrutura curta, com um
personagem, um problema e uma resolução em um curto espaço de tempo de Palavras,
podem produzir produtos jornalísticos que são uma alegria para ler. Infelizmente, o
processo de coleta de dados é extremamente difícil. Para que a vida pareça ser uma
história curta, é preciso ser extremamente seletivo, e isso exige reunir uma grande
quantidade de fatos a partir dos quais selecionar. As restrições do jornalismo diário não
suportarão esse nível de esforço dia após dia. Alguns praticantes do "novo jornalismo"
levaram a fazer Seus fatos para acompanhar as pressões do prazo. Outros não conseguiram
inventar as coisas, mas combinaram fatos de diferentes casos para escrever retratos
compostos de realidade que passaram como casos reais.5

Apesar dos problemas, a nova não ficção continua sendo um esforço interessante para
lidar com a complexidade da informação e encontrar uma maneira de comunicar a verdade
essencial. Empurra o jornalismo em direção ao art. O problema é que o jornalismo exige
disciplina, e a disciplina da arte pode não ser o tipo mais apropriado.Uma solução melhor
é empurrar o jornalismo para a ciência, incorporando as poderosas ferramentas de análise
e coleta de dados da ciência e sua busca disciplinada por uma verdade verificável.

Esta não é uma ideia nova. Walter Lippmann observou há setenta anos que o jornalismo
depende da disponibilidade de fato objetivável. "Mais pontos, então, em que qualquer
evento pode ser consertado, objetivado, medido, nomeado, mais pontos existem em que as
notícias podem ocorrer".6 O método científico oferece uma maneira de fazer
acontecimentos objetivados, medidos e nomeados.

Jornalismo como ciência


Você pode pensar que os cientistas se opõem a tal esforço como uma pretensão absurda
por parte dos jornalistas.Não tão. A primeira publicação do Precision Journalismem 1973
foi possível graças a uma base dedicada ao apoio das ciências sociais. Em 1989, o físico
Lawrence Cranberg argumentou que "o próprio jornalismo é uma ciência, e ... um
jornalista devidamente qualificado e responsável é um cientista praticante". Ambos
cientistas e jornalistas, disse ele, "marcham para as mesmas ordens e atendem a
necessidade comum da humanidade por conhecimento e compreensão compartilhados".7

Se os jornalistas só admitirem essa responsabilidade compartilhada, disse Cranberg,


abriria o caminho para um melhor treinamento em métodos de investigação, menos
tolerância para a superstição (a astrologia era uma questão morta até os jornais revivê-lo
após a Primeira Guerra Mundial) e um compromisso com um mais Ordem social racional
e pacífica. Os jornalistas estão tão imersos no ideal de objetividade e abertura de espírito
que qualquer tipo de declaração de É provável que os objetivos sociais nos tornem
desconfortáveis, mesmo quando os objetivos são tão benignos quanto a redução da
superstição e a construção de uma sociedade mais racional. Mas o pedido de ferramentas
de investigação mais poderosas ressoa bem conosco. A capacidade de encontrar
informações é, afinal, a fonte do poder que possuímos.

Mais um benefício de uma abordagem científica do jornalismo, não mencionado por


Cranberg, deve se sentar bem com a maioria de nós. As ciências da informação estão
agora suficientemente desenvolvidas para que possamos prestar atenção sistemática às
formas das mensagens que preparamos e às melhores formas de compor e enviá-las para
que elas sejam recebidas e compreendidas. Esse corpo de conhecimento nos permite
descobrir como receber mensagens nas cabeças da audiência, e não apenas nas mãos. Os
cursos nos processos e efeitos da comunicação de massa tornaram-se padrão nas melhores
escolas de jornalismo na década de 1960. E na década de 1980, os líderes na indústria
poderiam ver a necessidade de obter esses conceitos básicos. James K. Batten, diretor
executivo da Knight-Ridder Inc., contou a história de um jovem jornalista, que de outra
forma prometeu, que não conseguiu ser contratado no prestigiado grupo de jornal depois
de declarar desdenhosamente na entrevista de emprego que ele escreveu para se agradar,
não o Leitores.

"Ao longo dos anos, todos nós contratamos pessoas como ele - e tornamos nossos jornais
menos centrados nos leitores no processo", disse Batten. "Chegou o momento de parar. E
nossos aliados nas faculdades e universidades que educam jovens jornalistas precisam
entender essa verdade - e nos envie as pessoas com vontade de se comunicar com os
leitores".8
O novo jornalismo de precisão é o jornalismo científico.(Em França, o termo "jornalismo
de precisão" foi traduzido como "le journalisme scientifique"). Significa tratar o
jornalismo como se fosse uma ciência, adotando método científico, objetividade científica
e ideais científicos para todo o processo de comunicação de massa. Se isso soa
absurdamente pretensioso, lembre-se de que a própria ciência é restrita sobre suas
realizações e suas possibilidades e tem suas próprias sanções contra a pretensão. "Sempre
há fatos escondidos, e as verdades são evasivas em todos os domínios da investigação
humana", escreveu o físico de Cranberg. "O que é necessário para descobrir fatos ocultos e
chegar a verdades difíceis é uma determinação qualificada para obter Eles, e essa é uma
determinação que é apropriada para um jornalista devidamente treinado quanto a um físico
devidamente treinado ".

A partir da década de 1970, o jornalismo começou a se dirigir para uma posição mais
científica ao longo de dois caminhos separados. A crescente disponibilidade de
computadores disponibilizou grandes cadáveres de dados aos jornalistas de uma forma que
não era possível antes.E no escritório de negócios, o fracasso da circulação do jornal em
acompanhar o crescimento do número de domicílios fez com que os editores pagassem
atenção mais sistemática ao mercado e os fatores que motivavam os leitores a gastar
tempo e dinheiro com os produtos dos editores. A noção de que um jornal é um produto e
que um leitor é uma criatura racional que faz uma escolha sobre se pagar o custo de usar o
produto tornou-se respeitável. E assim as forças do mercado estavam empurrando o
jornalismo como um todo, e não apenas alguns jogadores isolados no campo, para uma
posição mais científica.

O progresso sempre tem seus detratores e não crentes.Recentemente, em 1989, em uma


conferência de cúpula de jornalistas que se propõe a descobrir as causas da perda de
leitores, um editor de um jornal metropolitano ainda denunciou publicamente a principal
descoberta de duas décadas de pesquisas de leitores: a razão mais freqüente para não ler o
artigo É falta de tempo. "Eu não comprei", disse ele, argumentando que, se os jornais
apenas fariam um melhor trabalho de prestar seus serviços fundamentais, como obter o
papel entregue a tempo, as coisas seriam melhores.9 A sua não era uma visão isolada, e
muitos relatórios de pesquisa foram escritos no esforço para explicar o que "não há tempo
para ler" realmente significa. Christine Urban, falando com a American American
Journalpaper Association em 1986, teve a melhor resposta. O que os leitores estão nos
dizendo, ela disse, é "Veja meus lábios - eu não tenho tempo para ler o jornal todos os
dias".10 Na agitação e no balbuciar da era da informação, o custo no tempo de extrair
informações do relatório de um jornalista deve ser uma das considerações na elaboração
desse relatório. Ocontributo dos EUA de hoje na década de 1980 foi que mostrou como
um jornal poderia ser posicionado como um poupador de tempo. Isso fez isso editando e
formateando o jornal com tanta atenção e precisão que poderia atender às necessidades de
vigilância do leitor - escaneando o mundo por perigos pessoais E oportunidades - com um
compromisso mínimo de tempo.Ele entregou dados que foram processados de forma
extensiva e econômica.

O que fazer com os dados

Saber o que fazer com os dados é a essência do novo jornalismo de precisão. O problema
pode ser pensado como tendo duas fases: a fase de entrada, onde os dados são coletados e
analisados e a fase de saída, onde os dados estão preparados para entrar na mente do
leitor.Este livro é sobretudo sobre a primeira fase, mas os dois estão tão interligados que
também irá negociar até certo ponto com o lado da saída.

O objetivo principal do que se segue será dizer-lhe como fazer essas coisas com dados:

1. Colecione. Seja ou não alguma vez tentar imitar os cientistas em seus métodos de coleta
de dados, você pode aproveitar o conhecimento de alguns de seus truques.Sempre vale a
pena lembrar, como o professor H. Douglas Price me disse em Harvard, na primavera de
1967, que "os dados não são provenientes da cegonha".

2. Armazene-o. Jornalistas de longa data armazenam dados em pilhas de papel em suas


mesas, nos cantos de seus escritórios e, se eles estão realmente bem organizados, em
arquivos de clipe. Os computadores são melhores.

3. Recupere-o. As ferramentas do jornalismo de precisão podem ajudá-lo a recuperar os


dados que você coletou e armazenou, os dados que alguém guardou com um usuário como
você em mente, ou dados que alguém armazenou por motivos completamente não
relacionados ao seu interesse, talvez sem uma idéia terrena de que Um jornalista ou
usuário público estaria interessado nisso.

4. Analise-o. A análise jornalística geralmente consiste apenas em ordenar para encontrar


e listar os desvios interessantes. Mas também pode envolver pesquisas de causalidade
implícita, por padrões que sugerem que diferentes fenômenos variam em conjunto por
razões interessantes.

5. Reduza-o. A redução de dados tornou-se uma habilidade tão importante no jornalismo


como a coleta de dados. Uma boa notícia é definida pelo que deixa fora, bem como o que
ela inclui.
6. Comunique-se. Um relatório não lido ou não compreendido é um relatório
desperdiçado. Você pode fazer um caso filosófico que, como o som de uma árvore que cai
na floresta, não existe.

Modelos teóricos

Em uma manhã de primavera, correndo ao longo de uma rua enevoada de Chapel Hill,
coloquei uma colina baixa e vi na distância uma figura amarela agachada de cerca de 18
centímetros de altura. Parecia tenso, pronto para a primavera, presas presas, visando um
ponto ao longo do meu caminho à frente. Quando me aproximei e meus olhos
conseguiram resolver a figura com mais clareza, eu vi o que realmente era: uma lâmpada
de fogo comum. A imagem do cachorro tinha sido a criação do meu próprio cérebro,
impondo uma ordem e um padrão próprio sobre os dados ambíguos transmitidos pelos
olhos.

Os dados brutos sozinhos nunca podem ser suficientes.Para ser útil, para ser entendido, os
dados devem ser processados, abstraídos, enquadrados em algum tipo de estrutura. Você
deve colocar o material em um quadro mental que auxilia na interpretação e na
compreensão.Esta obviedade aplica-se igualmente aos dados da percepção diária e às
cordas dos números nos computadores. Para pensar neles, você precisa de um quadro
perceptual. Se você não fornecer um conscientemente, sua mente inconsciente, talvez
motivada por ansiedade como a de um basculador em um bairro de donos de cachorros,
pode fornecer o que é errado para você.

Escritores diferentes em diferentes campos deram nomes diferentes a essas estruturas


perceptivas. Os psicólogos as chamam de "esquema". Eles também são conhecidos como
construções, hipóteses, expectativas, princípios organizacionais, quadros, scripts, planos,
protótipos ou mesmo (este da psicologia) "moléculas implicacionais".11Walter Lippmann
os chamou de "estereótipos".12 Em geral, ele disse: "a maneira como vemos as coisas é
uma combinação do que está lá e o que esperávamos encontrar. Os céus não são o mesmo
para um astrônomo quanto a um par de amantes ... a bela taitiana é uma Melhor aparência
para o seu pretendente taitiano do que para os leitores da National Geographic
Magazine ".13 E se você vê um cachorro ou uma lâmpada depende do que você espera ver.

Na sua forma mais sofisticada e consciente, o esquema, a construção ou o estereótipo se


tornam um modelo teórico.Um modelo formal descreve as partes essenciais de um
processo, natural ou artificial, de forma a que as conclusões tiradas do modelo sejam
testadas por experiência ou observação ou ambas. Mas na maioria dos casos, nosso uso de
modelos ou construções não é Que sofisticado e não tão cuidadoso. Nós os usamos
simplesmente porque precisamos deles para pensar. Os dados da vida cotidiana, deixados
sem adaptação a qualquer modelo, levam muito esforço para processar e interpretar no
bruto. Nossos sentidos ocupam muito disso.

Testando o modelo

O problema com os modelos teóricos - tanto do tipo cotidiano quanto do formal da


ciência - é que tendemos a ficar presos com eles. Dois estudos nacionais de credibilidade
de jornal publicados em 1985 e 1986 oferecem um exemplo. Um estudo (que chamaremos
de Estudo Y por enquanto) mostrou que 53 por cento do público acreditava que as
organizações de notícias preferem um lado ao apresentarem notícias sobre questões
políticas e sociais, enquanto apenas 34 por cento achavam que a mídia era justa para todos
os lados. E por 73 a 21 por cento, as organizações de notícias mais pensadas muitas vezes
invadem a privacidade das pessoas.

O outro estudo (Study X) perguntou sobre os mesmos problemas com uma escala de cinco
pontos, e mostrou que em 52 a 10 por cento, mais pessoas chamavam de jornal justo do
que injusto. E o público estava quase dividido na questão da privacidade: 32 por cento
pensavam que os jornais invadem a privacidade e 30 por cento pensavam que respeitavam
a privacidade. Os dois estudos foram realizados apenas seis meses de intervalo, entre
dezembro de 1984 e maio de 1985.

Como você poderia esperar, um foi apresentado como um estudo de "boas notícias" cheio
de otimismo sobre as atitudes do público em relação à mídia. O outro resultou em um
relatório cheio de tristeza e presságio. Agora, esta é a surpresa: o relatório ensolarado foi
escrito pelas pessoas que produziram Study Y, aquele com as atitudes desfavoráveis
citadas acima. E o relatório sombrio foi baseado nos números no Estudo X, aquele que
descobriu que a maioria das pessoas confia nos jornais.

Os fios no computador foram cruzados? Não. Os dois grupos de pesquisa estavam


trabalhando a partir de um esquema diferente. O estudo X foi patrocinado pelo comitê de
credibilidade da American Society of Newspaper Editors. Seu presidente, David Lawrence,
queria usar o estudo como terapia de choque para despertar os editores para um problema
e agitar a ação.14 estudo Y foi Patrocinado pela Times Mirror, que queria alguma
visibilidade corporativa e a chance de fazer algumas novidades. Os resultados da
publicação "que são contrários à sabedoria convencional" são uma boa maneira de fazer
isso.15
Ambos os grupos de pesquisadores queriam dizer a verdade, mas se eles viam um cão ou
uma lâmpada de fogo dependeram do esquema com o qual se aproximavam do
inquérito. Para o jornalista treinado em objetividade, pode parecer que o problema era
começar com qualquer estrutura estrutural. O ideal jornalístico é ser de mente aberta,
entrar em uma investigação com uma ardósia limpa, livre de qualquer preconceito. Ter
uma hipótese parece muito ser prejudicado. Essa visão, embora bem intencionada, não é
prática. Você não pode começar a pensar em um problema sem algum tipo de quadro
teórico. E você terá um, se você está consciente disso ou não. O processo de formulação
de hipóteses em método científico força a estrutura para o nível consciente, onde pode ser
avaliado de forma fria e objetiva.

Agora, é verdade que existe algum perigo de que a avaliação não seja fria e objetiva o
suficiente. Os dois estudos de jornal citados acima são uma boa ilustração. A cura para
esse problema não é abandonar o processo de fazer hipóteses, mas indicar sua hipótese e
avaliá-la em plena visão pública para que outros investigadores possam verificar seu
trabalho. Tanto o Times Mirror quanto os pesquisadores da ASNE fizeram exatamente
isso.Nenhum dano a longo prazo foi feito, porque ambos deixaram uma trilha de papel que
descrevia seu método, suas descobertas e a rota para suas conclusões. Ainda melhor, eles
disponibilizaram seus dados para análise secundária por outros estudiosos. Suas
publicações estimularam muitas análises e discussões sobre o próximo passo na
compreensão do relacionamento peculiar entre um meio de notícias e seus leitores,
ouvintes ou espectadores. Uma das características da ciência é que ela está sempre sujeita
a tais verificações e revisões. Essa é uma das lições do caso dos dois estudos de
credibilidade.O outro é que é extremamente importante pensar cuidadosamente sobre a
estrutura teórica com a qual se aborda um problema e apreciar as conseqüências da
escolha de um modelo esquemático.

Testes de realidade

Uma vez que você escolhe um modelo, você pode estar preso com ele por um longo
tempo. Um modelo que funciona bem o suficiente para o propósito em breve logo se torna
confortável, como um sapato antigo, e é abandonado relutantemente. Modelos
inadequados, agarrados após a sua utilidade desapareceram, são fonte de superstição,
sabedoria convencional e mentes fechadas. Herbert Butterfield, historiador da ciência
moderna, argumentou que o desenvolvimento de novos modelos era mais importante na
criação da física moderna do que na coleta de novos dados. Um cientista bem sucedido
precisa "da arte de lidar com o mesmo pacote de dados do que antes, colocando-os em um
novo sistema de relações entre eles, dando-lhes um quadro diferente, o que praticamente
significa colocar um tipo diferente de pensão para o momento."16 O método científico
moderno fornece um incentivo para colocar esse tampão de pensamento diferente, levando
a um teste contínuo dos modelos antigos e a uma busca perpétua de melhores.Aristóteles,
cujo modelo para a mecânica do movimento sustentava que um corpo em movimento
continuava em um determinado caminho apenas enquanto algo o estava empurrando,
estava errado. E, no entanto, seu modelo era dominante durante séculos, em parte porque a
ciência ainda não estava condicionada ao desafio e à experimentação. (Um problema que
agrava Aristóteles e seus contemporâneos gregos foi a distinção nítida entre filósofos e
pessoas trabalhadoras. Realizar um experimento envolveria sujar as mãos. Essa falta de
vontade para fazer mais do que pensar persistiu até o tempo de Galileu, que preferia
"pensamento Experiências "para o real.)

O método científico moderno fornece testes de realidade agressiva. Os jornalistas também


estão interessados em testar a realidade. A principal diferença - além do óbvio que os
jornalistas estão com muita pressa - é que os jornalistas são mais passivos sobre isso. Em
vez de testar a realidade diretamente com suas próprias observações, deduções e
experiências, eles normalmente se contentam em fazer suas verificações cruzadas
consultando diferentes autoridades com diferentes pontos de vista e interesses
diferentes. A falha nesta metodologia é que o jornalista pode não ter uma boa base para
avaliar as fontes conflitantes e pode ser forçado a uma posição objetivista tradicional
que Exige a suposição improvável de que todas as vozes têm uma reivindicação igual à
verdade. O jornalista que adapta as ferramentas do método científico ao seu próprio
comércio pode estar em condições de fazer avaliações úteis com a objetividade mais
poderosa da ciência.

Os jornalistas já compartilham algumas das características dos cientistas, muitas vezes


sem saber disso. Entre eles:

1. Ceticismo. "Se sua mãe diz que ela o ama, confira", é um aforismo da cultura do
jornalismo, e não da ciência, mas também se encaixa. Nem os jornalistas nem os cientistas
se contentam em descansar com o que a opinião popular ou a afirmação da autoridade é
verdadeira. A verdade é sempre tentativa, sempre tem espaço para a nitidez e a melhoria.

2. Abertura. A palavra-chave é "replicabilidade". Um bom repórter investigativo


documenta sua busca pela verdade, fazendo uma trilha de papel que outros investigadores
podem seguir para chegar às mesmas conclusões.
3. Um instinto de operacionalização. Para testar um modelo, um cientista pensa sobre os
processos que o modelo representa e onde lideram. Então ele ou ela procura um lugar no
mundo observável onde aspectos desse processo podem ser medidos de forma a confirmar
ou refutar o modelo. Esse processo de encontrar a peça observável e testável é chamado de
operacionalização. Ambos cientistas e jornalistas de investigação dependem disso. A
confirmação de uma teoria é seu poder para prever os resultados de uma medida
operacional.

4. Um sentido da tentatividade da verdade.No antigo argumento entre absolutismo e


relativismo, a ciência é mais confortável com o relativismo. As verdades que descobre são
bem-vindas quando melhoram a nossa compreensão ou a nossa tecnologia, mas com o
reconhecimento de que elas podem ser substituídas por verdades mais fortes no
futuro. Esse conceito não é fácil para os jornalistas, cuja busca de simplicidade e certeza
torna o absolutismo atraente.

5. Parsimonia. Dada a escolha entre teorias rivais, geralmente preferimos a mais


simples. A melhor teoria explica mais com o mínimo. A teoria copernicana do universo
prevaleceu sobre o antigo sistema de Ptolomeu porque era mais simples. Para dar conta do
movimento dos planetas, Ptolomeu propôs um sistema de "epiciclos" em que cada planeta
se movia em órbitas dentro das órbitas ao redor da Terra. À medida que a instrumentação
melhorava, os astrônomos detectaram movimentos que a teoria não poderia explicar a
menos que fossem postulados mais epículos dentro de epícaras. Colocar o sol no centro do
sistema eliminou a necessidade de epiciclos.

A importância da humildade

É irônico que a defesa jornalística da Primeira Emenda hoje seja frequentemente discutida
a partir de uma posição absolutista. O pensamento político do século XVIII subjacente à
constituição dos Estados Unidos, em particular a Primeira Emenda, baseia-se na rejeição
do absolutismo. No início da era científica, a futilidade de atrair qualquer crença particular
era clara porque novos dados ou uma nova interpretação de dados antigos sempre surgiam
para desafiar as antigas crenças. E então fazia sentido tolerar as crenças pouco ortodoxas e
protegê-las sob a lei básica da terra. A heresia de hoje pode ser a sabedoria de amanhã.

Então, um pouco de humildade é bom para todos, especialmente para cientistas e


jornalistas. O juiz Oliver Wendell Holmes observou que o que pensamos como verdade
pode ser chamado de "não pode ajudar":
Quando digo que uma coisa é verdadeira, quero dizer que não posso deixar de
acreditar. . . . Mas . .. Não me atrevo a assumir que minhas inabilidades no pensamento são
inabilidades do universo. Eu, portanto, defino a verdade como o sistema de minhas
limitações e deixo a verdade absoluta para aqueles que estão melhor equipados. . . . A
certidão não é o teste da certeza. Nós fomos convencidos de muitas coisas que não eram
assim.17
Essa despretensão pode dar ao cientista e ao jornalista uma certa liberdade. Você não
precisa esperar para verificar se você encontrou verdade certa, absoluta e inatacável antes
de compartilhar a descoberta. Se você cometeu um erro, e tenha sido aberto sobre o
processo que o conduziu, alguém o descobrirá e publicará, e a causa da verdade terá
avançado outro ponto. Pluralismo democrático, que A verdade surge do combate de
muitas vozes, é um bom ambiente para cientistas e jornalistas.

Uma das vantagens de adotar um modelo teórico para uso jornalístico é que ele mantém
você e seus leitores focados no relevante. Muitas informações nos assuntos públicos são
arcanas e complicadas. O jornalista que se torna um especialista no campo coberto pode
rapidamente perder o caminho em detalhes irrelevantes.

Minha primeira grande história de pesquisa como repórter de um jornal foi sobre o
desperdício de compra de seguro de incêndio e tempestade de vento em edifícios escolares
em Dade County, Flórida. Sob o plano em vigor, o programa de seguro foi controlado por
um agente cuja remuneração era uma participação das comissões. Quanto mais custo do
seguro, mais dinheiro ele ganhou. Os debates nas reuniões do conselho escolar sobre o
assunto eram obscuros em seus detalhes e impossíveis de seguir.Em frustração, o
superintendente das escolas perguntou ao seu conselho para um estudo de US $ 10.000
para resolver as complexidades técnicas. O pedido foi apresentado e eventualmente
morreu.

O que era necessário para entender a situação era um modelo teórico que poderia ser
operacionalizado. O meu era um modelo básico de rolo de registro ou retrocesso.Isso
levou às seguintes hipóteses:

1. A auto-negociação do agente de manutenção de seguros tornaria o seguro mais caro do


que para órgãos similares sem conflito de interesse.

2. Se o conselho acompanhar esse custo, seus membros devem receber algo de valor: por
exemplo, o poder de recompensar seus amigos no negócio de seguros.
3. Se eles estão recompensando seus amigos, os membros do conselho devem novamente
receber algo em troca.

Cada uma dessas proposições é simples. Você não precisa de uma compreensão detalhada
do negócio de seguros ou de sua regulamentação para entender qualquer um deles.E cada
um poderia ser operacionalizado.

A primeira proposição foi testada comparando os custos do seguro de propriedade das


escolas do Condado de Dade com as do Governo Metropolitano do Condado de Dade,
uma unidade política separada com a mesma definição geográfica. O Governo
Metropolitano custa, por dólar de valor de construção, um terço das Escolas do Condado
de Dade. Além disso, o índice de perda para o seguro escolar era bastante baixo pelos
padrões da indústria. Durante a longa história do programa, apenas 15% do dinheiro
premium voltou ao sistema escolar em reivindicações.

O questionamento direto dos membros do conselho da escola e dos agentes de seguros


beneficiários verificou que o sistema tinha as referências do patrocínio político. Para
manter os outros agentes de seguros na comunidade felizes com o sistema, o agente de
manutenção do sistema escolar compartilhou uma parte de suas comissões com eles. Os
membros do conselho escolar decidiram como essa partilha seria alocada. Agora, tudo o
que era necessário era fechar o loop lógico mostrando que os membros do conselho
obtiveram algo em troca.

A Flórida foi pioneira nas leis de relatórios eleitorais, e as contribuições da campanha de


cada membro foram arquivadas no tribunal. Cada entrada mostrou o nome de um doador,
o nome do candidato e um montante em dólares. A confirmação da terceira hipótese
exigiu uma ligação entre os doadores e o negócio de seguros.Participaram 181 agências no
programa de seguro escolar.De um diretório da indústria, obtive os nomes de seus oficiais
e fiz um índice de cartão, um nome por cartão e alfabetizou-o. Então eu verifiquei cada
nome nas listas de contribuintes da campanha contra o índice do cartão.Bingo! As pessoas
seguradoras foram contribuintes importantes para os cinco membros da diretoria da escola
que haviam concorrido nas eleições anteriores. O presidente do conselho recebeu 65% de
suas contribuições totais de pessoas seguradoras. Dois outros receberam mais da metade
das mesmas fontes. A série resultante de três partes levou a página local.18 A diretoria da
escola rapidamente reformou o sistema e, eventualmente, deu aos professores um aumento
com o dinheiro que foi salvo.

Um repórter que trabalha nessa história hoje, obviamente, usará um computador em vez de
três fichas de índice para verificar os nomes. Mas a mecânica é menos importante do que o
conceito. Um modelo que aponta para os fatos relevantes e sugere uma operacionalização
é muito mais importante para aumentar seu poder como repórter do que a máquina Isso faz
parte do clérigo. As máquinas tornam possíveis as coisas que não poderiam ser feitas antes,
mas para tirar o máximo proveito delas, precisamos pensar da maneira que os cientistas
pensam, construindo os modelos que nos permitem usar o novo poder de computação.

Os jornalistas tendem a ser pessoas práticas e, como tal, às vezes somos rápidos demais
para desprezar as pessoas que lidam com o que nos parece ser uma teoria vazia que não
possui nenhuma aplicação do mundo real. Mas, sem teoria, não temos nada além de dados
brutos não ordenados, e nós sufocamos nele. O computador pode alfabetizá-lo para nós,
pode nos dar listas ordenadas por qualquer dimensão encontrada nos dados, mas ainda
temos que ter uma teoria para dar uma lista à lista.

Fontes de teorias

De onde vêm as teorias? A gama de fontes é ampla, do folclore aos produtos das mentes
mais criativas e sofisticadas da ciência. Uma boa teoria é aquela que tem consequências
que podem ser testadas e usadas como blocos de construção para mais descobertas e mais
teorias. A ciência é tão dependente da abertura como o jornalismo. Michael Polyani, um
químico que trabalhou no início da era nuclear, comparou o processo científico com um
grupo de trabalhadores que montava um quebra-cabeça gigante. Um grupo não pode fazê-
lo de forma eficiente, a menos que cada membro saiba o que os outros membros estão
fazendo. "Deixe-os trabalhar para juntar o quebra-cabeça à vista dos outros, de modo que
cada vez que um pedaço é encaixado por um, todos os outros imediatamente prestarão
atenção para o próximo passo que se torna possível em conseqüência", disse ele. .19 A
metodologia dos jornalistas que cobrem os assuntos públicos é exatamente a mesma,
mesmo que o processo seja menos autoconsciente. Os repórteres, como os cientistas, estão
no negócio dos testes de realidade, examinando as teorias existentes, pensando em suas
conseqüências, desenvolvendo hipóteses relacionadas que podem ser operacionalizadas
(ou seja, testadas) e colocá-las à prova.

O caso da revolta de Detroit

Períodos de convulsões sociais oferecem oportunidades especialmente boas para testar


teorias. Quando começaram os distúrbios da raça da década de 1960, primeiro na área
Watts de Los Angeles, depois em Newark E Detroit, havia várias teorias populares para
explicar a causa. Uma teoria, popular entre editores editoriais, era que os rebeldes eram os
casos mais frustrados e sem esperança no fundo da escada econômica que se
desencadeavam porque não tinham outros meios de avanço ou expressão. Esta teoria pode
ser testada com pesquisa de pesquisa. Se você pode identificar os rebeldes e compará-los
com os não-provocadores, você encontrará, se a teoria é verdadeira, que os menos
educados são mais propensos a ser participantes de motim. O DetroitFreePress realizou
uma pesquisa desse tipo em 1967 e descobriu que as pessoas que freqüentavam a
faculdade eram tão propensas a participar dos tumultos como aqueles que não
conseguiram terminar o ensino médio. A teoria não foi suportada pelos dados.20

Educação

Abandonos Colegial Faculdade

Rioters 18% 15% 18%

Não- 82% 85% 82%


provocadores

Total 100% 100% 100%

Outra teoria popular da época era que a causa fundamental dos tumultos era a dificuldade
que os negros do sul tinham em ser assimilados na cultura do norte.Forçados pela
repressão do sul e os efeitos da escravidão em um papel passivo, eles encontraram uma
saída para uma agressão prolongada depois de deixarem o Sul. Essa teoria, também, é
facilmente operacionalizada. Se for verdade, os tumultos devem ser um comportamento
mais frequente para os imigrantes do Sul do que os negros criados no Norte. A pesquisa
da Free Press produziu um resultado diferente. Outra teoria submetida ao teste de
realidade e achou falta!

Onde você foi


criado quando
criança?

Sul Norte

Rioters 8% 25%

Não- 92% 75%


provocadores

Total 100% 100%


Outra oportunidade veio após o assassinato de Martin Luther King em 1968. A teoria
imediatamente popular era que seu movimento não-violento morreu com ele e aquilo Os
negros se voltariam para a liderança para os defensores da violência. O Miami Herald ,
que havia feito uma pesquisa de atitude entre sua população negra antes do assassinato,
voltou aos mesmos entrevistados e descobriu que os ideais de King eram mais fortes do
que nunca.21

As relações raciais provaram ser um campo fértil para os testes de realidade jornalística
mais recentemente. Os prêmios Pulitzer foram conquistados para as histórias publicadas
no Dallas Morning News em 1985 e aConstituição de Atlanta Em 1988, mostrou como os
programas do governo federal estavam sendo utilizados para perpetuar a discriminação
racial. O caso do Texas envolveu segregação em habitação pública. A história de Atlanta
documentou a discriminação em empréstimos hipotecários segurados pelo governo
federal. Ambos os projetos basearam-se em análises computacionais de grandes bancos de
dados governamentais. Ambos começaram com um quadro teórico: um governo com um
compromisso com a igualdade racial deve produzir resultados mensuráveis que reflitam
essa igualdade. A medição e a análise mostraram que, na realidade, os resultados dos
programas governamentais não refletiam a igualdade.22 Para decidir o que medir, os
repórteres tiveram que ter uma teoria e uma hipótese operacional.Em outras palavras, eles
estavam pensando como cientistas.

Aqui está o que Julia D. Wallace, editor-executivo dosEUA para projetos especiais, teve
que dizer depois de seus primeiros meses de luta com jornalismo de precisão: "Eu acho
que a linha de fundo aqui é que vai levar mais para ser um jornalista no Futuro. Não basta
ter habilidades de escrita, boas fontes e muita energia. Repórteres e editores precisarão
saber algo sobre estatísticas e software.

"Não é fácil. Mas, no final, com certeza é divertido".23

Notas

1. Por exemplo, Ron Lovell, The Quill , outubro de 1987, pp. 22-24: "Não há um corpo substantivo de
conhecimento para o campo". Retornar ao texto

2. Derek Bok, comunicação pessoal, 27 de fevereiro de 1990. volte ao texto

3. "Em breve vai dobrar a cada quatro". Richard Saul Wurman,Information Anxiety (Nova York:
Doubleday, 1989), p. 32. retornar ao texto
4. Veja, por exemplo, Nicholas Von Hoffman, "Opiniões de opinião pública: jornais fazendo suas
próprias novidades?" Public Quarterly, 44: 4 (Winter 1980), 572. retornar ao texto

5. Para alguns exemplos, veja a discussão sobre "a nova não ficção" em Philip Meyer, Jornalismo
ético: um guia para estudantes, praticantes e consumidores (New York: Longman, 1987). Retornar
ao texto

6. Walter Lippmann, Public Opinion (Nova York: The Free Press, Paperback Edition, 1965, primeira
publicação, 1922), p. 216. retornar ao texto

7. Lawrence Cranberg, "Plea for Recognition of Scientific Character of Journalism", Journalism


Educator , Winter 1989, pp. 46-49. Retornar ao texto

8. James K. Batten, Press-Enterprise Lecture, Riverside, Califórnia. 3 de abril de 1989. Miami:


Knight-Ridder, Inc. retorna ao texto

9. Michael J. Davies, citado em Keys to Success: estratégias para o Marketing de jornais nos anos
90 (Reston, Va .: American Newspaper Publishers Association, 1989), p. 5. retornar ao texto

10. Christine D. Urban, "Expectativas do leitor - O que eles pensam de nós", endereço para American
Newspaper Publishers Association, San Francisco, abril de 1986. retornar ao texto

11. Reid Hastie, "Princípios esquemáticos na memória humana", em N. Cantor e JF Kihlstrom


(eds.), Personalidade, Cognição e Interações Sociais (Hillsdale, NJ: Erlbaum, 1981), pp. 39-
40. Retornar ao texto

12. Lippman, opinião pública , pp. 53-68. Retornar ao texto

13. Ibid., P. 76. retornar ao texto

14. "Credibilidade do jornal: Building Reader Trust" (Reston, Va .: American Society of Newspaper
Editors, 1985). Retornar ao texto

15. "The People & The Press: uma investigação espelhada de tempos das atitudes públicas para as
mídias de notícias conduzidas pela Organização Gallup" (Los Angeles: Times Mirror, 1986),
p. 4. retornar ao texto

16. Herbert Butterfield, The Origins of Modern Science , Revised Edition (Nova York: The Free Press,
Paperback Edition, 1965, primeira publicação, 1957), p. 13. retornar ao texto

17. Oliver Wendell Holmes. Citado por Arthur Schlesinger, Jr., "The Opening of the American
Mind", New York Times Book Review ; 23 de julho de 1959, p. 27. retornar ao texto

18. "Os Seguros Freeloading obtêm seus $ 59,000", Miami Herald , 27 de setembro de 1959,
p. 1B. Retornar ao texto
19. Citado em Richard Rhodes, The Making of the Atomic Bomb(Nova York: Simon & Schuster,
1986), p. 34. retornar ao texto

20. Philip Meyer, "The People Beyond 12th Street: Uma Pesquisa de Atitudes de Negros de Detroit
Após o Motim de 1967" , reimpressão de Detroit Free Press , 1967. retornar ao texto

21. Philip Meyer, "As consequências do martírio: militância negra e a morte de Martin Luther King",
" Public Opinion Quarterly , TK. Retornar ao texto

22. Craig Flournoy e George Rodrigue, "Separados e desiguais: a segregação ilegal permeia a
habitação subsidiada da nação", Dallas Morning News , 10 de fevereiro de 1985, p. 1. retornar ao
texto

23. Julia D. Wallace, observações ao Congresso da Primeira Emenda, Washington, DC, 27 de outubro
de 1989. retorno ao texto

2
Alguns elementos de análise de dados
Às vezes, muitas novidades podem ser empacotadas em apenas um número. Suponhamos
que o Supremo Tribunal de Justiça decida se anular um precedente de longa data. Um
relatório sobre o que o Tribunal decidiu poderia consistir apenas no seguinte:

Se você já conhecesse os antecedentes do caso, sabia que a Corte tinha nove juízes, o fato
de que cinco votaram para anular o precedente anterior lhe daria todas as informações
adicionais que você precisava. Essas histórias quantitativas de um número são bastante
comuns no negócio de notícias.

Geralmente, no entanto, um número em pé sozinho não transmite muito significado. Deve


ser comparado com outro número ou mesmo uma série de números antes que muito
sentido possa ser feito dele.Quando as comparações são feitas, é preciso ter cuidado para
que os números sejam comparados em uma base de maçãs para maçãs. No jornalismo,
muitos erros são feitos na tentativa de fazer essa coisa simples, e então este capítulo vai se
tornar muito básico em sua explicação de como comparar números.
As estratégias para análise variam consoante se trate de dados contínuos ou dados
categóricos. Lugares de dados contínuos, para fins práticos, sem limites de valores, e por
isso preserva diferenças finas, por exemplo, a diferença entre uma renda anual de US
$ 32.456 e uma de US $ 32.460. Dados categóricos classificam as coisas em
caixas. Pesquisas de opinião pública, Por exemplo, geralmente use apenas quatro ou cinco
categorias para representar todos os rendimentos possíveis. Os dados categóricos são
geralmente mais fáceis de manipular, mas a conveniência vem ao custo de perder alguma
informação.

Para começar, assumiremos dados contínuos, mais comumente encontrados em relatórios


governamentais, como o recenseamento e as estatísticas econômicas. Capítulos posteriores
abordarão dados categóricos, mais comumente encontrados em pesquisas de opinião
pública.

Figurando uma taxa

Uma maneira de construir uma comparação em um número é convertê-lo em uma


taxa. Esse procedimento fornece automaticamente uma comparação em relação a uma
linha de base facilmente reconhecida. O número de mortes por AIDS para cada nação não
é tão significativo quanto o número de mortes por 100.000 habitantes. Ao converter o
número bruto em uma taxa, você avalia o impacto sobre a população e você fornece uma
maneira de comparar o impacto relativo de um país para outro independentemente das
diferenças no tamanho da população.

A taxa mais utilizada é a taxa por cem ( por cento, em latim) ou por cento. Um percentual
é o equivalente decimal de uma fração, mas com o ponto decimal movido dois lugares
para a direita. Portanto:

1/2 = .5 = 50%

A primeira regra de porcentagens é esta:

Nenhuma porcentagem faz sentido a menos que você conheça sua base.
A maneira de calcular uma porcentagem sem perder o controle da base é obter a fração
primeiro. Se 11 membros da equipe de futebol de 42 homens 1986 se formaram em quatro
anos, a taxa de graduação de quatro anos do esquadrão é 11/42. O 11 na fração é o número
que se formou e 42 é a base para a qual o número que se formou está sendo comparado. A
base é a parte inferior da fração.Eu sei, isso soa elementar, mas você ficaria surpreso com
a quantidade de estudantes que têm dificuldade em lembrar disso.(Quando eu explico isso
aos alunos, peço-lhes que visualizem uma estátua no campus: por exemplo,
Silencioso Sam na Carolina ou Tommy Trojan no sul da Califórnia. A base está na parte
inferior.Isso parece ajudar.)
Ser capaz de identificar a base é importante, por causa da próxima regra:
Quando você compara duas porcentagens, você precisa ter certeza de que eles têm a
mesma base.
Alguns escritores de notícias, evidentemente, pensam que é aborrecido manter a base
constante ao fazer comparações percentuais. Eu vi histórias de jornal onde a base foi
mudada na metade: "Noventa por cento dos negros no condado de Baxter votaram em
Dukakis, mas 95 por cento dos apoiantes de Bush eram brancos". Em um caso, a base é
negra, na outra é apoiadores de Bush. Essa comparação não faz sentido, embora você
possa enganar algo significativo se você conhecesse o percentual negro no
eleitorado. Quanto melhor dizer, "Dukakis recebeu 90% do voto negro e 40% do voto
branco".
Quando você tem a base firmemente em mente, você pode converter a fração para uma
decimal por divisão. Não se esqueça do movimento de dois lugares do ponto decimal
implícito no conceito de porcentagem:

.5 = cinco décimos = .50 = 50 centésimos

Cinquenta por cento é outra maneira mais fácil de dizer 50 centésimos. Se deixássemos a
casa decimal e dissesse .50 centésimos ou 0,5 por cento, teríamos mais do que uma
redundância, teríamos um número completamente diferente (metade de um por cento). Às
vezes, você verá em expressões impressas como .50 por cento, onde o escritor realmente
significa 50 por cento. O ponto decimal foi evidentemente lançado apenas para a
ênfase. Então, aqui está outra regra da vida:

Os pontos decimais são para o significado, não para a ênfase.


Às vezes, a taxa que você descreve será tão pequena que precisa ser expressa em frações
de ponto percentual. Nesse caso, considere expressá-lo como uma taxa por 1.000 Ou taxa
por 100.000, o que quer que você deixe com números inteiros para comparar. Isso reduzirá
a chance de erros tipográficos, bem como de mal-entendidos.

Diferença percentual

Talvez você pensou que usar a imagem de uma estátua para reforçar o conceito de uma
base percentual era bobo. Mas quando você tenta encontrar uma diferença percentual,
você realmente apreciará a importância de manter a base identificada.
Em 12 de outubro de 1989, a Média Industrial Dow Jones fechou em 2759,84. No dia
seguinte, sexta-feira, 13 de outubro de 1989, fechou em 2568,26. Pergunta: qual foi a
queda percentual?

A diferença percentual significa exatamente o que diz: a diferença entre dois valores
tomados como uma porcentagem do valor que você está usando como base. Se você quiser
a alteração percentual do Tempo 1 para o Tempo 2, então o valor do Tempo 1 é a base.

Então, primeiro obtenha o valor absoluto da diferença. Subtrair 2668.26 de 2759.84, e


você acha que o Dow caiu 190.58 pontos.Agora você pode configurar a
fração. (Certifique-se de usar a base direita.) O declínio percentual é:

190,58
= .0690547 = 6,91%
2759.84
Observe que, para passar do decimal para a porcentagem, movemos os dois locais
decimais para a direita e adicionamos um sinal de porcentagem. Também arredondamos
para duas casas decimais, o que provavelmente é mais precisão do que precisamos, mas
nos inclinamos para o estilo do Wall Street Journal .
Observe também que o arredondamento não é o mesmo que o truncado. Se estivéssemos
truncados, sairíamos com 6,90 por cento.Mas, uma vez que o valor caído é mais da metade,
arredondamos para 6,91. Para avaliar os dígitos descartados, coloque um decimal
imaginário na frente deles. Neste caso, .547 é maior do que .5, e assim você se
arredonda. Se fosse inferior a .5, você truncaria (ou seja, deixaria cair os dígitos
excedentes). E se fosse exatamente .5?Isso não faz muita diferença, mas, por razões de
consistência, eu arredundo nesse caso - na teoria de que se eu realizasse meu Divisão para
mais casas decimais, pode haver um valor lá fora, que daria para maior que .5.

Assim, o mercado caiu 6,91 por cento na sexta-feira 13.

Agora, tente esta questão: qual o ganho percentual que o mercado deve fazer desde o
fechamento de sexta-feira para recuperar seu status no fechamento de quinta-feira? Talvez
você pense que, uma vez que caiu 6,91 por cento, ele deve subir 6,91 por cento para voltar
para onde estava. Não tão! Deve voltar os mesmos 190.58 em pontos absolutos, mas ao
enquadrar esta questão mudamos a base percentual. A base está agora fechada de sexta-
feira, e assim:
190,58
= .0741603 = 7,42%
2569,84
Para recuperar a perda de 6.91 por cento, o mercado teve que ganhar 7.42 por cento.
Depois daquela queda da sexta-feira 13, eu ouvi um apresentador de televisão se referir a
ele como a segunda maior queda na história.Isso era verdade em pontos absolutos, mas em
termos percentuais era apenas o 12º. Aqui está o registro, tirado do Wall Street Journal:1

Encontro Fechar Mudança de Mudança


Ponto percentual

19 de outubro de 1738.74 -508,00 -22,61


1987

28 de outubro de 260,64 -38,33 -12,82


1929

29 de outubro de 230.07 -30,57 -11,73


1929

6 de novembro 232.13 -25,55 -9,92


de 1929

12 de agosto de 63,11 -5,79 -8.40


1932

26 de outubro de 1793.93 -156.83 -8,04


1987

21 de julho de 88.71 -7,55 -7,84


1933

18 de outubro de 125.73 -10,57 7.75


1937

5 de outubro de 66.07 -5,09 -7.15


1932

24 de setembro 107,79 -8,20 -7.07


de 1931

20 de julho de 96,26 -7,32 -7.07


1933

13 de outubro de 2569.26 -190.58 -6,91


1989
É óbvio que a comparação relevante é a mudança percentual, e não a mudança
absoluta. Uma queda de 100 pontos nos anos de depressão precoce teria eliminado todo o
mercado. Hoje, ele soltou, mas dificilmente é como um desastre. E, no entanto, os meios
de comunicação tendem a se concentrar na mudança absoluta quando Fazendo
comparações históricas, como se não houvesse diferença em um Dow de 200 e um de
2.000. Em 1986, quando as mudanças acentuadas induzidas pelo intercâmbio de
programas começaram a pisar o mercado, as histórias de "declínios recorde" eram
rotineiras. A televisão era o pior ofensor, mas até mesmo os escritores de serviços de fio
nem sempre tinham o cuidado de especificar que eles estavam falando sobre declínios
pontuais e não diminui em porcentagem quando eles fizeram comparações. Por exemplo,
uma ligação da Associated Press em 18 de novembro de 1986, disse: "As preocupações
com o escândalo de insider trading de Wall Street enviaram os preços das ações
cambaleando a terça-feira e a média industrial Dow Jones gravou sua quarta maior
queda". Não até o oitavo parágrafo, o escritor confessou que, em termos relativos, a queda
foi de apenas 2,3 por cento, o que é de pouca importância histórica e nada perto do quarto
maior jamais, que naquela época era a queda de 8,4 por cento em 1932.2
Esse padrão, hipnotizando a história, enfocando o declínio do ponto e, em seguida, o
backpedaling para dizer o que realmente aconteceu em termos percentuais, foi o padrão
para o AP e outras mídias impressas em 1986 e 1987 até um acidente realmente histórico
ocorreu em 19 de outubro de 1987. Quando o mercado realmente experimentou um
declínio recorde - 22,61 por cento - não havia nenhuma maneira de liderar mais forte do
que aqueles que haviam superado o recorde de pontos recuam ao longo de 1986 e 1987.
Depois disso, o relatório ficou mais realista, mas Muitos escritores ainda preferem dar
prioridade à comparação de pontos menos importante simplesmente porque produz um
número maior. Que é um número enganador não parece ser importante para eles.

Os motivos para que o Dow fosse muito maior agora do que era na década de 1930 são
diretos. A economia cresceu e as empresas valem mais. Parte do crescimento é real e parte
é a inflação. Estas são tendências seculares , o que significa que elas afetam quase tudo na
sociedade. Se você for fazer comparações ao longo do tempo, você deve filtrar esse efeito
secular para ver o que está acontecendo especificamente com o fenômeno que você está
investigando. Em outras palavras, você precisa diminuir os números, usar um termo
favorecido por Cook e Campbell.3 Exprimir mudanças em termos percentuais é uma
maneira de se detrender, mas não é a única maneira. Ajudar o Dow Jones pela inflação
seria outro. Os analistas e contadores financeiros não fazem rotineiramente isso, mas, se o
fizerem, o efeito sobre a Dow Jones Industrial Average seria a abertura dos olhos. Seu
crescimento a longo prazo, embora ainda real, não seria quase tão impressionante.

"Vence mais" v. "Vezes como"


Antes de deixar o problema de calcular uma diferença percentual, precisamos considerar o
caso de uma diferença percentual maior que 100.

Os industriais Dow Jones fecharam em 2759.84 em 12 de outubro de 1989 e em 230.07


em 29 de outubro de 1929. Quanto o Dow aumentou durante esse período de sessenta
anos? A mesma fórmula se aplica. Para obter a diferença percentual, use a subtração para
obter a diferença absoluta e dividir pelo valor para o ano base.Portanto:

% De diferença = (2759,84 - 230,07) /230,07

Algumas pessoas usam a regra "Divida o pequeno número pelo grande número". Essa é a
regra errada. Isso só funciona se a diferença percentual for inferior a 100. Em nossa
comparação de sessenta anos, onde o valor para o ano base é menor do que o valor para o
ano de comparação, a média industrial Dow aumentou 1100%.

O que significa um aumento de 1100 por cento?

Outra maneira de expressá-lo seria dizer que a média industrial foi "11 vezes maior" em
outubro de 1989 do que em outubro de 1929. Não recomendo esse uso porque é muito
facilmente confundido com "11 vezes maior". Neste caso, o Dow de 1989 é 12 vezes tão
grande quanto o Dow de 1929.

Existe uma explicação simples para essa confusão. "Times greater" compara o valor base
com a diferença (a quantidade "maior"). E "times as great" compara o valor base com o
novo valor. O número de 1989, 2759.84 é 12 vezes o valor de 230.07 de 1929. É apenas
11 vezes a diferença.

Isso é bastante claro quando você pensa sobre isso. Infelizmente, muitos escritores de
notícias não pensam nisso e usam "times greater" e "times as" como se elesSignificava o
mesmo. Eles não! Considere este exemplo do Atlanta Journal-Constitution:

Washington - Uma arma de assalto tem 20 vezes mais chances de ser usada no crime do
que uma arma de fogo convencional, de acordo com um estudo do Atlanta Journal-
Constitution Washington Bureau.
Enquanto as armas de assalto representam 1 milhão - ou 0,5 por cento - dos 200 milhões
de armas de fogo de propriedade privada nos Estados Unidos, eles foram usados em um
dos 10 crimes que resultaram em um registro de armas de fogo no ano passado, mostra o
estudo.
A comparação da incidência de armas de assalto com a incidência esperada é
perfeitamente razoável. Mas 10 por cento são 19 vezessuperiores a meio por cento, não 20
vezes maiores. No entanto, é 20 vezes tão grande, o que provavelmente é o que os
escritores queriam dizer.4
Esse erro leva você a ter mais problemas quando você está falando de mudanças menores,
duas ou três vezes. Se você tem 20 anos, e eu tenho três vezes mais velho que você, eu
devo ter 60 anos. Mas se eu for três vezes maior do que você, eu tenho 80 anos. Tento
mantê-lo direto para o meu bem.

Ajustando pela inflação

Quando os montantes em dólares são comparados ao longo do tempo, geralmente é uma


boa idéia desvirtuar os valores retirando o efeito da inflação. Uma barreira para fazer isso
é a falta de um bom indicador estatístico da inflação. O mais comum é o Índice de Preços
ao Consumidor do Bureau of Labor Statistics. Foi criado durante a Primeira Guerra
Mundial quando os preços desenfreados, especialmente nos centros de construção de
navios, tornaram necessário fazer ajustes freqüentes no custo de vida nos salários. O CPI
mostra o valor relativo do poder de compra de um dólar de ano para ano. Isso faz isso
verificando o preço de uma "cesta de mercado" de bens e serviços que é mantida
relativamente constante ao longo do tempo. A cesta de mercado inclui alimentos, roupas,
abrigo, combustíveis, transporte, serviços médicos e outras coisas que as pessoas
compram para a vida diária. O problema vem em tentar definir uma cesta de mercado que
significa a mesma coisa em 1990, por exemplo, em 1952. Alguns bens e serviços que são
relevantes e Considerado necessário em 1990 não existia em 1952: equipamentos
antipoluentes para carros, por exemplo. A Mesa tenta resolver esse problema redefinindo a
cesta de mercado de tempos em tempos para mantê-lo a par da mudança dos estilos de
vida e da tecnologia.5

Mesmo assim, não é possível criar uma cesta de mercado que se aplique igualmente a
todos os grupos. Por exemplo, os aposentados que possuem suas casas não são afetados
por mudanças nos valores de aluguel ou de casa. Para os aposentados em casa do governo
federal, cujas pensões são indexadas ao CPI, a indexação cria uma ganância
inesperada. Os seus rendimentos aumentam automaticamente mais do que os seus próprios
custos normais de vida.

Essa indexação é, é claro, uma forma de destruição, espremendo a tendência secular da


inflação para que você possa ver o significado real. Fazê-lo apenas aproximadamente é
melhor do que não fazê-lo, já que os milhões de aposentados que vivem em pensões
privadas não indexadas, cujo valor real diminui ano a ano, concordarão.
E, no entanto, os contadores não gostam de indexar ou de desvendar por causa do
elemento de incerteza que introduz no seu trabalho. Os balanços corporativos raramente
mostram o efeito da inflação. Os comunicados de imprensa, com lucros recorde, às vezes
mostram lucros que seriam abaixo dos níveis históricos, se fossem feitas comparações
constantes do dólar. Os líderes trabalhistas fizeram o mesmo ocioso, tomando crédito por
ganhos que são realmente perdas quando são desconsiderados pela inflação.

O procedimento para desconsiderar a inflação é simples. Quando você compara montantes


em dólares ao longo do tempo, expressa-os nos dólares constantes de um de seus anos de
comparação. Quando um dos anos que está sendo comparado é o ano atual, a prática usual
é converter os valores mais antigos em seus equivalentes atuais ou dólares constantes. Mas
pode ser feito com facilidade de outra maneira.

Aqui está um exemplo perto de casa. David H. Weaver e G. Cleveland Wilhoit relataram
em 1986 que a renda média dos jornalistas aumentou de US $ 11.113 em 1970 para US
$ 19.000 em 1981. Isso foi uma má notícia para os jornalistas, ressaltaram, porque o
período intermediário era uma inflação furiosa, E os jornalistas realmente perderam cerca
de US $ 7.000 por ano No poder de compra.6 Para verificar seu cálculo, você precisa do
IPC para 1970 e para 1981. De acordo com o Resumo Estatístico dos Estados
Unidos, publicado anualmente pelo Escritório de Impressão do Governo dos EUA, foi
38,8 e 90,9, respectivamente (o índice usa os preços para o Período 1982-1984 como base
de 100). Em seguida, converta a renda média diária para 1970 em dólares constantes de
1981. Use a fórmula para equivalentes de fração que você aprendeu na escola secundária:

38,8 90,9
=
11,133 X
Talvez você esteja mais confortável com uma frase em inglês do que uma equação: 38,8 é
de US $ 11,133 como 90,9 é para a quantidade desconhecida (renda de 1970 expressa em
dólares constantes de 1981). Seguindo a regra de multiplicação cruzada da álgebra da
escola secundária, você acha que:
38,8 * X = 11,133 * 90,9

Dividindo cada lado da equação em 38,8 rendimentos:

X = (11,133 * 90,9) / 38,8

Fórmulas neste livro usam notação de computador: o sinal de "tempos" é um asterisco (*) ao invés do antigo
"X". Isso liberta "X" para representar um desconhecido. Um slash (/) significa "dividido por".
Punch ele em sua calculadora, e 1970 $ 11,133 resulta ser igual a $ 26,082.21 em dólares
constantes de 1981. Assim, os salários do jornalismo realmente diminuíram 27 por cento
durante esse período.Por quê? Duas coisas aconteceram. O desempenho de dois
jovensrepórteres do Washington Post no escândalo do Watergate motivou muitos jovens
para se tornarem jornalistas. Ao mesmo tempo, as barreiras às mulheres na profissão
foram reduzidas. Ambos os eventos aumentaram consideravelmente o grupo de
trabalhadores disponíveis no jornalismo. Essa inesperada juventude idealista e motivada
deu aos proprietários da mídia uma escolha maravilhosa.Opção 1: elevar os padrões do
jornalismo, aproveitando o melhor do grupo ampliado e recebendo o melhor e mais
brilhante no jornalismo.Opção 2: escolha a próxima geração de Jornalistas selecionando
aqueles que trabalhariam pela menor quantidade de dinheiro e levando as economias para
a linha inferior. Graças a Weaver e Wilhoit, agora sabemos como esse saiu.
(Se você é um estudante que contempla uma carreira no jornalismo, não se desanime. Os
efeitos do Watergate e da feminização tiveram que seguir seu curso no final da década de
1980 e os salários começaram a subir mais rápido que a inflação.)

Mais dicas para usar o CPI: livros mais antigos que este usam figuras CPI que têm 1967 =
100 como base. O Bureau of Labor Statistics recentemente converteu-se para a nova base
onde o período 1982-1984 = 100. Por algum tempo eles vão publicar ambos os
números.Atualize seu Resumo Estatístico todos os anos para se manter atualizado. A partir
desta escrita, o Resumo Estatístico dá um IPC para todos os anos de volta a 1950. Para
anos anteriores, veja um conjunto bonito de volumes chamado Estatística Histórica dos
Estados Unidos.7 Ele fornece todos os números BLS de volta ao início da Primeira Guerra
Mundial e, em seguida, usa estimativas de outras fontes históricas para produzir CPIs
anuais de volta para 1800.

Se você precisar da figura mensal mais recente, ligue para este número: (202) 523-
9658. Uma voz gravada lhe dará o IPC no mês mais recente. Os números mensais vêm em
duas categorias, o CPI-U e o CPI-W. O CPI-U é para todos os consumidores urbanos e
cobre cerca de 80 por cento da população. O CPI-W é para assalariados urbanos e
trabalhadores clericais. Eles são coletados separadamente para que os diferentes efeitos
sobre a inflação possam ser rastreados para os dois grupos (embora se sobrepõem
consideravelmente). Para a maioria dos propósitos de política pública, o CIP-U mais
abrangente é usado para fazer ajustes de inflação.

Ajustando o crescimento populacional

As tendências fazem novidades, quer porque tenham andado em silêncio e que nem
muitos tenham notado ou por causa de uma interrupção repentina de uma tendência. Para
se concentrar na tendência da notícia, você deve separá-la de todas as tendências paralelas
em segundo plano. O crescimento da população é uma tendência secular que, como a
inflação, pode fazer outras tendências mais do que parecem.

A American American Journal Publishers Association a cada O ano emite um livreto de


tendências estatísticas no negócio de notícias.Isso mostra que a circulação de jornal cresce
um pouco a cada ano nos Estados Unidos. Isso parece uma boa notícia para os jornais,
mas não é, porque a população e o número de famílias está crescendo muito mais
rápido. A penetração da circulação, definida como a circulação dividida pelas famílias,
tem vindo a cair de forma constante ao longo dos anos, e esse é o número que ANPA
realmente se preocupa, mesmo que não a publique em seu folheto.

É um número que é fácil de entender no nível intuitivo. Quando a penetração era de 100%
em um determinado mercado, um jornal foi vendido para cada casa. Quando estava acima
de 100 por cento, mais jornais foram vendidos do que famílias - comum na década de
1950. Hoje, o número é muito menor e ainda está caindo, com alguns jornais
metropolitanos experimentando penetração doméstica de menos de 50%. Expressando a
circulação do jornal como proporção para as famílias (porque a circulação entregues em
casa é vendida para Famílias em vez de indivíduos) torna a tendência real mais fácil de ver
(veja a Figura 2A).
Para um exemplo extremo de crescimento da população como fator de confusão, eu gosto
de mostrar aos alunos um mapa de dispersão que mostra a adesão à igreja e o consumo de
álcool ano a ano. Um diagrama de dispersão mostra cada ponto de dados em um espaço
bidimensional. Neste caso, a dimensão vertical representa a adesão à igreja (maior é mais)
e a dimensão horizontal representa as vendas de licor (para a direita é mais). Cada ponto
de dados é um ano, representado por um ponto colocado de acordo com a participação da
igreja e as vendas de bebidas alcoólicas nesse ano.

Apenas observando o diagrama de dispersão (Figura 2B), você pode ver que quanto maior
a participação da igreja, maiores as vendas de bebidas alcoólicas. Na verdade, a correlação
é quase perfeita. A parte divertida está produzindo teorias para explicá-lo - por exemplo, a
igreja libera pessoas de culpa, e assim eles se sentem livres para beber; Ou beber faz com
que as pessoas se sintam culpadas, e então vão à igreja. Claro, ambos são explicados pelo
crescimento populacional, e Quando desentendemos os números, expressando-os como
rácios de população, a associação desaparece.
Onde você obtém números de população para usar em detrending? O recenseamento dos
EUA é coletado apenas a cada dez anos, mas muitas organizações produzem estimativas
provisórias para os anos intermediários. O serviço de taxa e dados padrão produz estudos
de audiência de mídia e estimativas de população, e seus relatórios estão disponíveis em
bibliotecas maiores e nos departamentos de marketing de organizações de mídia. O Audit
Bureau of Circulations tem estimativas domésticas a nível do condado ano a ano. A
maioria dos jornais e muitas escolas de jornalismo são membros do ABC e têm acesso aos
seus dados, tanto na forma impressa como no disquete de PC.

Ajuste de curva

Às vezes, tendências interessantes são confundidas por uma variedade de fatores,


incluindo erros aleatórios. A pesquisa de pesquisa baseada em dados de amostra está
sujeita a erros aleatórios, particularmente quando pequenos subgrupos são
examinados. Uma maneira de obter uma imagem mais clara de uma tendência é tentar
ajustá-la a uma linha suave.

Um ajuste direto funciona para muitos tipos de dados de tendências.Você pode usar sua
calculadora ou um programa estatístico, como SPSS (Pacote Estatístico para Ciências
Sociais), para fazer uma regressão e diagrama de dispersão com o tempo como variável
independente ou X. O coeficiente de correlação (capítulo 4) informará o quão bem seus
dados se encaixam no modelo de linha direta. Se é um bom ajuste, você pode até tentar
prever o futuro, desenhando a linha reta mais adequada e estendendo-a com uma ponta
rápida. Essa projeção linear diz o que acontecerá se as tendências atuais continuarem
inalteradas - o que, é claro, pode não fazer.

A natureza, infelizmente, não gosta de linhas retas. Não se preocupe.Você pode usar o
mesmo programa de regressão para se adequar a uma linha curva. Primeiro, examine o
diagrama de dispersão e use sua imaginação para ver que tipo de linha pode caber. Se é
uma curva simples, que não se torce em uma nova direção em algum ponto ao longo do
seu comprimento, às vezes pode ser endireitada reexpressando uma das variáveis em
termos de função não-linear.

Se sua curva for oca para cima, para usar o termo de Tukey, experimente uma expressão à
direita de Y. Se for oco para baixo, mova para a esquerda. Faça o contrário para
reexpressar a variável independente ou X. Verifique seu diagrama de dispersão cada vez
que você tentar uma dessas conversões para ver se a curva está se endireitando. Se isso
funciona, e se você tentar prever o futuro com a técnica de "straightedge", lembre-se de
que é uma previsão baseada em uma transformação de Y ou X, e você terá que convertê-la
de volta antes de sua previsão produzir qualquer sentido.

Aqui está um exemplo. David Arant e eu nos perguntamos se os papéis que ganham o
maior número de Prêmios Pulitzer também são os melhores editados. Nós criamos um
método para medir a qualidade da edição básica de um documento e planejamos isso
contra os recados Pulitzer para uma amostra de 58 organizações de jornal. Encontramos
um forte efeito para os primeiros Pulitzers, mas caiu rapidamente depois disso. Em outras
palavras, o efeito não era linear. Você pode vê-lo na Figura 2C (1). Os pontos formam
uma curva em vez de uma linha reta. Para endireitar a curva, precisávamos esticar a escala
de Pulitzer na parte inferior, e a melhor maneira de fazer isso acabou por usar a raiz
quadrada da pontuação de Pulitzer em lugar da pontuação em bruto como independente ou
X variável. Outro endireitamento foi obtido eliminando um "outlier".A Associated Press,
com sua alta taxa de má ortografia e alta taxa Pulitzer, estava claramente em uma classe
por si só. Ao limitar o estudo aos jornais, obtivemos uma aproximação mais próxima de
uma linha reta. O resultado é na Figura 2C (2). Isso nos deu uma correlação
estatisticamente significante. A moral é que é uma boa idéia olhar sempre o diagrama de
dispersão antes de lidar com a correlação.

Suavização

Se a natureza não gosta de linhas retas, ela também não gosta muito de curvas
logaritmicas lisas. As tendências mais interessantes são muitas vezes as que se torcem e se
tornam mais exóticas. Tukey tem um procedimento para lidar com dados tão complicados
que ele chama de "suavização". A teoria por trás do suavização é que o erro de medição é
em si uma tendência secular e pode ser retirado usando cada ponto como um controle nos
pontos vizinhos. Uma média móvel é um método de alisamento bastante familiar. Se você
tiver dados mensais que precisam ser suavizados, expresse janeiro como a média de
dezembro, janeiro e fevereiro. Então, para fevereiro, use a média de janeiro, fevereiro e
março.

A recomendação de Tukey é usar medianas rolantes de três em vez de meios. Veja como
fazer isso: compare cada ponto de dados com aqueles de cada lado e, em seguida,
substitua-o pelo meio dos três.Por exemplo, na série 324, os dois seriam alterados para três
porque três são a mediana do conjunto. Dessa forma, os pontos descontroladamente fora
do alcance serão enterrados. Isso é bom, diz Tukey, porque esses pontos estranhos
chamam a atenção e tornam difícil ver o que está acontecendo realmente. "O valor do
alisamento", ele diz, "... é a visão mais clara do geral, uma vez que está livre de
detalhes".8 Em outras palavras, é exatamente o que um jornalista precisa. E se um liso de
executar medianas de três deixa alguns lugares irregulares, Tukey recomenda fazê-lo
novamente - e novamente - até que o alisamento não mude mais as coisas. Existem
maneiras mais complicadas de suavizar, e estão além do escopo deste livro. Consulte o
trabalho da Tukey para obter detalhes ou tente uma das rotinas de suavização no SYSTAT,
um pacote de software popular para rotinas estatísticas.9 A Figura 2C (1) mostra um lote de
leitores de jornais diários por idade exata. Seu objetivo é ver como o leitor muda de
acordo com o estágio da vida. A versão suavizada, 2C (2), torna isso mais claro.
Números de índice

Outra maneira de obter clareza para análise e comunicação é usar números de índice. O
CPI é um bom exemplo de um número de índice. Com 1982-1984 estabelecido em 100 e
setembro 1989 às 125, você sabe que os preços subiram 25% do período base.

As pessoas de vendas de publicidade de jornal às vezes usam números de índice para


comparar a audiência de um jornal com seu mercado. Se 35 por cento dos adultos no
mercado tiveram diplomas universitários e 47 por cento dos leitores têm diplomas
universitários, o índice é 134. Esta é outra maneira de dizer que a taxa de graduação da
faculdade é 34 por cento maior entre os leitores do que no mercado como um todo. Ao
aplicar esta indexação a uma variedade de meios de comunicação concorrentes, o
vendedor de anúncios pode argumentar que o público de seu papel é mais sofisticado e
tem mais poder de compra do que os números de circulação bruta indicariam.

Ajuste sazonal

Outra forma de destruição é o ajuste sazonal. Quando o Bureau of Labor Statistics emite
seus números de desemprego mensais, nos dá números que podem ser comparados
diretamente de um mês para o próximo para que possamos ver de imediato se as coisas
estão melhorando ou piorando.
Mas o desemprego é sazonal. As aberturas e fechamentos escolares e as condições
climáticas podem afetar o número de pessoas que procuram trabalho em diferentes épocas
do ano. Para avaliar a saúde da economia, estamos interessados nas mudanças mês a mês
que não podem ser atribuídas à variação sazonal. Os estatísticos do BLS realizam essa
destruição ao analisar as mudanças sazonais passadas e assumindo que o ano atual não
será muito diferente. Então, eles subtraem a parcela atribuível à mudança de estação e
relatam o resto.Existe algum risco nisso, é claro, porque as variações sazonais não são
uniformes de ano para ano. Mas é melhor do que não fazê-lo. Se a Casa Branca derruba
números de desemprego no outono de um ano eleitoral que mostram uma queda dramática
no desemprego, os repórteres cuidadosos verificarão se o ajuste sazonal não foi omitido.Se
houver, o declínio pode ser meramente o resultado de grande parte da força de trabalho
adolescente voltando para a escola.

Residuais de regressão

Uma técnica estatística para destruição é útil Quando você precisa controlar alguma
variável contínua que ocorra a maior parte do que você está interessado. Andrew Brack
estava estudando a qualidade editorial dos jornais na Carolina do Norte, mas ele foi
prejudicado pelo fato de que o tamanho da circulação explica a maior parte da
variância. Os papéis maiores têm mais recursos, e assim eles dão aos seus leitores mais
por seu dinheiro. A Brack, no entanto, reuniu uma amostra de papéis grandes e pequenos,
mediu-os em vários indicadores de qualidade editorial, combinou os indicadores em um
índice e os traçou em um gráfico. Veja a Figura 2E para o resultado.O eixo vertical
representa a qualidade e o eixo horizontal representou a circulação. Quando cada papel é
plotado no gráfico, sua distribuição se aproxima de uma linha reta.
Usando o modelo linear geral (GLM) para traçar a linha reta mais adequada para
descrever o efeito da circulação na qualidade, Brack voltou sua atenção para os desvios
dessa linha. Alguns papéis foram muito maiores em qualidade do que Seria previsto pelo
seu tamanho de circulação, e outros eram muito menores. Ao medir esses desvios do que a
circulação previria, ele obteve uma medida de qualidade deprimida que eliminou o efeito
do tamanho da circulação. O termo técnico para esta técnica é a análise residual, pois
considera a variação residual, ou a variância que resta após o tamanho da circulação
explica o que pode. (O Capítulo 4 terá uma explicação mais completa).

Pontuações padronizadas

Outra maneira de colocar maçãs e laranjas em uma base comparável é


usar escores padronizados ou z, que reexpressam cada medida em termos de quanto ele se
desvia da média do grupo. É útil se você tem uma série de medidas para combinar em um
índice, mas não pode usar adição simples porque cada medida está em uma escala
diferente. Um escore z é uma medida de peculiaridade relativa. O cálculo exige algum
conhecimento das estatísticas, e também será discutido mais detalhadamente no capítulo
4.

Notas

1. Wall Street Journal , 16 de outubro de 1989, p. C14. Retornar ao texto

2. Associated Press, marca de horário 2026EST, 18 de novembro de 1986.retornar ao texto

3. Thomas D. Cook e Donald T. Campbell, Quasi-Experimentação: Problemas de Design e Análise


para Configurações de Campo (Boston: Houghton Mifflin, 1979), p. 323. retornar ao texto

4. Jim Stewart e Andrew Alexander, "Assault Guns Muscling In On Front Lines of Crime", Atlanta
Journal-Constitution, 21 de maio de 1989, p. 1. retornar ao texto

5. BLS Manual de Métodos: Vol. II, Índice de Preços ao Consumidor(Washington: US Government


Printing Office, 1984). Retornar ao texto

6. David H. Weaver e G. Cleveland Wilhoit, jornalista norte-americano: um retrato de pessoas dos


EUA e seu trabalho (Bloomington: Indiana University Press, 1986), p. 82. retornar ao texto

7. Estatísticas históricas dos Estados Unidos: Colonial Times to 1970 , Bicentennial Edition
(Washington: US Government Printing Office, 1975), p. 211.retornar ao texto

8. John W. Tukey, Exploratory Data Analysis (Boston: Addison-Wesley, 1977), p. 205. retornar ao
texto
9. Leland Wilkinson, SYSTAT: o sistema de estatística (Evanston, Ill .: SYSTAT, Inc.,
1988). Retornar ao texto

Alguns elementos de análise de dados


Às vezes, muitas novidades podem ser empacotadas em apenas um número. Suponhamos
que o Supremo Tribunal de Justiça decida se anular um precedente de longa data. Um
relatório sobre o que o Tribunal decidiu poderia consistir apenas no seguinte:

Se você já conhecesse os antecedentes do caso, sabia que a Corte tinha nove juízes, o fato
de que cinco votaram para anular o precedente anterior lhe daria todas as informações
adicionais que você precisava. Essas histórias quantitativas de um número são bastante
comuns no negócio de notícias.

Geralmente, no entanto, um número em pé sozinho não transmite muito significado. Deve


ser comparado com outro número ou mesmo uma série de números antes que muito
sentido possa ser feito dele.Quando as comparações são feitas, é preciso ter cuidado para
que os números sejam comparados em uma base de maçãs para maçãs. No jornalismo,
muitos erros são feitos na tentativa de fazer essa coisa simples, e então este capítulo vai se
tornar muito básico em sua explicação de como comparar números.

As estratégias para análise variam consoante se trate de dados contínuos ou dados


categóricos. Lugares de dados contínuos, para fins práticos, sem limites de valores, e por
isso preserva diferenças finas, por exemplo, a diferença entre uma renda anual de US
$ 32.456 e uma de US $ 32.460. Dados categóricos classificam as coisas em
caixas. Pesquisas de opinião pública, Por exemplo, geralmente use apenas quatro ou cinco
categorias para representar todos os rendimentos possíveis. Os dados categóricos são
geralmente mais fáceis de manipular, mas a conveniência vem ao custo de perder alguma
informação.
Para começar, assumiremos dados contínuos, mais comumente encontrados em relatórios
governamentais, como o recenseamento e as estatísticas econômicas. Capítulos posteriores
abordarão dados categóricos, mais comumente encontrados em pesquisas de opinião
pública.

Figurando uma taxa

Uma maneira de construir uma comparação em um número é convertê-lo em uma


taxa. Esse procedimento fornece automaticamente uma comparação em relação a uma
linha de base facilmente reconhecida. O número de mortes por AIDS para cada nação não
é tão significativo quanto o número de mortes por 100.000 habitantes. Ao converter o
número bruto em uma taxa, você avalia o impacto sobre a população e você fornece uma
maneira de comparar o impacto relativo de um país para outro independentemente das
diferenças no tamanho da população.

A taxa mais utilizada é a taxa por cem ( por cento, em latim) ou por cento. Um percentual
é o equivalente decimal de uma fração, mas com o ponto decimal movido dois lugares
para a direita. Portanto:

1/2 = .5 = 50%

A primeira regra de porcentagens é esta:

Nenhuma porcentagem faz sentido a menos que você conheça sua base.
A maneira de calcular uma porcentagem sem perder o controle da base é obter a fração
primeiro. Se 11 membros da equipe de futebol de 42 homens 1986 se formaram em quatro
anos, a taxa de graduação de quatro anos do esquadrão é 11/42. O 11 na fração é o número
que se formou e 42 é a base para a qual o número que se formou está sendo comparado. A
base é a parte inferior da fração.Eu sei, isso soa elementar, mas você ficaria surpreso com
a quantidade de estudantes que têm dificuldade em lembrar disso.(Quando eu explico isso
aos alunos, peço-lhes que visualizem uma estátua no campus: por exemplo,
Silencioso Sam na Carolina ou Tommy Trojan no sul da Califórnia. A base está na parte
inferior.Isso parece ajudar.)
Ser capaz de identificar a base é importante, por causa da próxima regra:
Quando você compara duas porcentagens, você precisa ter certeza de que eles têm a
mesma base.
Alguns escritores de notícias, evidentemente, pensam que é aborrecido manter a base
constante ao fazer comparações percentuais. Eu vi histórias de jornal onde a base foi
mudada na metade: "Noventa por cento dos negros no condado de Baxter votaram em
Dukakis, mas 95 por cento dos apoiantes de Bush eram brancos". Em um caso, a base é
negra, na outra é apoiadores de Bush. Essa comparação não faz sentido, embora você
possa enganar algo significativo se você conhecesse o percentual negro no
eleitorado. Quanto melhor dizer, "Dukakis recebeu 90% do voto negro e 40% do voto
branco".
Quando você tem a base firmemente em mente, você pode converter a fração para uma
decimal por divisão. Não se esqueça do movimento de dois lugares do ponto decimal
implícito no conceito de porcentagem:

.5 = cinco décimos = .50 = 50 centésimos

Cinquenta por cento é outra maneira mais fácil de dizer 50 centésimos. Se deixássemos a
casa decimal e dissesse .50 centésimos ou 0,5 por cento, teríamos mais do que uma
redundância, teríamos um número completamente diferente (metade de um por cento). Às
vezes, você verá em expressões impressas como .50 por cento, onde o escritor realmente
significa 50 por cento. O ponto decimal foi evidentemente lançado apenas para a
ênfase. Então, aqui está outra regra da vida:

Os pontos decimais são para o significado, não para a ênfase.


Às vezes, a taxa que você descreve será tão pequena que precisa ser expressa em frações
de ponto percentual. Nesse caso, considere expressá-lo como uma taxa por 1.000 Ou taxa
por 100.000, o que quer que você deixe com números inteiros para comparar. Isso reduzirá
a chance de erros tipográficos, bem como de mal-entendidos.

Diferença percentual

Talvez você pensou que usar a imagem de uma estátua para reforçar o conceito de uma
base percentual era bobo. Mas quando você tenta encontrar uma diferença percentual,
você realmente apreciará a importância de manter a base identificada.

Em 12 de outubro de 1989, a Média Industrial Dow Jones fechou em 2759,84. No dia


seguinte, sexta-feira, 13 de outubro de 1989, fechou em 2568,26. Pergunta: qual foi a
queda percentual?

A diferença percentual significa exatamente o que diz: a diferença entre dois valores
tomados como uma porcentagem do valor que você está usando como base. Se você quiser
a alteração percentual do Tempo 1 para o Tempo 2, então o valor do Tempo 1 é a base.
Então, primeiro obtenha o valor absoluto da diferença. Subtrair 2668.26 de 2759.84, e
você acha que o Dow caiu 190.58 pontos.Agora você pode configurar a
fração. (Certifique-se de usar a base direita.) O declínio percentual é:

190,58
= .0690547 = 6,91%
2759.84
Observe que, para passar do decimal para a porcentagem, movemos os dois locais
decimais para a direita e adicionamos um sinal de porcentagem. Também arredondamos
para duas casas decimais, o que provavelmente é mais precisão do que precisamos, mas
nos inclinamos para o estilo do Wall Street Journal .
Observe também que o arredondamento não é o mesmo que o truncado. Se estivéssemos
truncados, sairíamos com 6,90 por cento.Mas, uma vez que o valor caído é mais da metade,
arredondamos para 6,91. Para avaliar os dígitos descartados, coloque um decimal
imaginário na frente deles. Neste caso, .547 é maior do que .5, e assim você se
arredonda. Se fosse inferior a .5, você truncaria (ou seja, deixaria cair os dígitos
excedentes). E se fosse exatamente .5?Isso não faz muita diferença, mas, por razões de
consistência, eu arredundo nesse caso - na teoria de que se eu realizasse meu Divisão para
mais casas decimais, pode haver um valor lá fora, que daria para maior que .5.

Assim, o mercado caiu 6,91 por cento na sexta-feira 13.

Agora, tente esta questão: qual o ganho percentual que o mercado deve fazer desde o
fechamento de sexta-feira para recuperar seu status no fechamento de quinta-feira? Talvez
você pense que, uma vez que caiu 6,91 por cento, ele deve subir 6,91 por cento para voltar
para onde estava. Não tão! Deve voltar os mesmos 190.58 em pontos absolutos, mas ao
enquadrar esta questão mudamos a base percentual. A base está agora fechada de sexta-
feira, e assim:

190,58
= .0741603 = 7,42%
2569,84
Para recuperar a perda de 6.91 por cento, o mercado teve que ganhar 7.42 por cento.
Depois daquela queda da sexta-feira 13, eu ouvi um apresentador de televisão se referir a
ele como a segunda maior queda na história.Isso era verdade em pontos absolutos, mas em
termos percentuais era apenas o 12º. Aqui está o registro, tirado do Wall Street Journal:1
Encontro Fechar Mudança de Mudança
Ponto percentual

19 de outubro de 1738.74 -508,00 -22,61


1987

28 de outubro de 260,64 -38,33 -12,82


1929

29 de outubro de 230.07 -30,57 -11,73


1929

6 de novembro 232.13 -25,55 -9,92


de 1929

12 de agosto de 63,11 -5,79 -8.40


1932

26 de outubro de 1793.93 -156.83 -8,04


1987

21 de julho de 88.71 -7,55 -7,84


1933

18 de outubro de 125.73 -10,57 7.75


1937

5 de outubro de 66.07 -5,09 -7.15


1932

24 de setembro 107,79 -8,20 -7.07


de 1931

20 de julho de 96,26 -7,32 -7.07


1933

13 de outubro de 2569.26 -190.58 -6,91


1989
É óbvio que a comparação relevante é a mudança percentual, e não a mudança
absoluta. Uma queda de 100 pontos nos anos de depressão precoce teria eliminado todo o
mercado. Hoje, ele soltou, mas dificilmente é como um desastre. E, no entanto, os meios
de comunicação tendem a se concentrar na mudança absoluta quando Fazendo
comparações históricas, como se não houvesse diferença em um Dow de 200 e um de
2.000. Em 1986, quando as mudanças acentuadas induzidas pelo intercâmbio de
programas começaram a pisar o mercado, as histórias de "declínios recorde" eram
rotineiras. A televisão era o pior ofensor, mas até mesmo os escritores de serviços de fio
nem sempre tinham o cuidado de especificar que eles estavam falando sobre declínios
pontuais e não diminui em porcentagem quando eles fizeram comparações. Por exemplo,
uma ligação da Associated Press em 18 de novembro de 1986, disse: "As preocupações
com o escândalo de insider trading de Wall Street enviaram os preços das ações
cambaleando a terça-feira e a média industrial Dow Jones gravou sua quarta maior
queda". Não até o oitavo parágrafo, o escritor confessou que, em termos relativos, a queda
foi de apenas 2,3 por cento, o que é de pouca importância histórica e nada perto do quarto
maior jamais, que naquela época era a queda de 8,4 por cento em 1932.2
Esse padrão, hipnotizando a história, enfocando o declínio do ponto e, em seguida, o
backpedaling para dizer o que realmente aconteceu em termos percentuais, foi o padrão
para o AP e outras mídias impressas em 1986 e 1987 até um acidente realmente histórico
ocorreu em 19 de outubro de 1987. Quando o mercado realmente experimentou um
declínio recorde - 22,61 por cento - não havia nenhuma maneira de liderar mais forte do
que aqueles que haviam superado o recorde de pontos recuam ao longo de 1986 e 1987.
Depois disso, o relatório ficou mais realista, mas Muitos escritores ainda preferem dar
prioridade à comparação de pontos menos importante simplesmente porque produz um
número maior. Que é um número enganador não parece ser importante para eles.

Os motivos para que o Dow fosse muito maior agora do que era na década de 1930 são
diretos. A economia cresceu e as empresas valem mais. Parte do crescimento é real e parte
é a inflação. Estas são tendências seculares , o que significa que elas afetam quase tudo na
sociedade. Se você for fazer comparações ao longo do tempo, você deve filtrar esse efeito
secular para ver o que está acontecendo especificamente com o fenômeno que você está
investigando. Em outras palavras, você precisa diminuir os números, usar um termo
favorecido por Cook e Campbell.3 Exprimir mudanças em termos percentuais é uma
maneira de se detrender, mas não é a única maneira. Ajudar o Dow Jones pela inflação
seria outro. Os analistas e contadores financeiros não fazem rotineiramente isso, mas, se o
fizerem, o efeito sobre a Dow Jones Industrial Average seria a abertura dos olhos. Seu
crescimento a longo prazo, embora ainda real, não seria quase tão impressionante.

"Vence mais" v. "Vezes como"

Antes de deixar o problema de calcular uma diferença percentual, precisamos considerar o


caso de uma diferença percentual maior que 100.

Os industriais Dow Jones fecharam em 2759.84 em 12 de outubro de 1989 e em 230.07


em 29 de outubro de 1929. Quanto o Dow aumentou durante esse período de sessenta
anos? A mesma fórmula se aplica. Para obter a diferença percentual, use a subtração para
obter a diferença absoluta e dividir pelo valor para o ano base.Portanto:
% De diferença = (2759,84 - 230,07) /230,07

Algumas pessoas usam a regra "Divida o pequeno número pelo grande número". Essa é a
regra errada. Isso só funciona se a diferença percentual for inferior a 100. Em nossa
comparação de sessenta anos, onde o valor para o ano base é menor do que o valor para o
ano de comparação, a média industrial Dow aumentou 1100%.

O que significa um aumento de 1100 por cento?

Outra maneira de expressá-lo seria dizer que a média industrial foi "11 vezes maior" em
outubro de 1989 do que em outubro de 1929. Não recomendo esse uso porque é muito
facilmente confundido com "11 vezes maior". Neste caso, o Dow de 1989 é 12 vezes tão
grande quanto o Dow de 1929.

Existe uma explicação simples para essa confusão. "Times greater" compara o valor base
com a diferença (a quantidade "maior"). E "times as great" compara o valor base com o
novo valor. O número de 1989, 2759.84 é 12 vezes o valor de 230.07 de 1929. É apenas
11 vezes a diferença.

Isso é bastante claro quando você pensa sobre isso. Infelizmente, muitos escritores de
notícias não pensam nisso e usam "times greater" e "times as" como se elesSignificava o
mesmo. Eles não! Considere este exemplo do Atlanta Journal-Constitution:

Washington - Uma arma de assalto tem 20 vezes mais chances de ser usada no crime do
que uma arma de fogo convencional, de acordo com um estudo do Atlanta Journal-
Constitution Washington Bureau.
Enquanto as armas de assalto representam 1 milhão - ou 0,5 por cento - dos 200 milhões
de armas de fogo de propriedade privada nos Estados Unidos, eles foram usados em um
dos 10 crimes que resultaram em um registro de armas de fogo no ano passado, mostra o
estudo.
A comparação da incidência de armas de assalto com a incidência esperada é
perfeitamente razoável. Mas 10 por cento são 19 vezessuperiores a meio por cento, não 20
vezes maiores. No entanto, é 20 vezes tão grande, o que provavelmente é o que os
escritores queriam dizer.4
Esse erro leva você a ter mais problemas quando você está falando de mudanças menores,
duas ou três vezes. Se você tem 20 anos, e eu tenho três vezes mais velho que você, eu
devo ter 60 anos. Mas se eu for três vezes maior do que você, eu tenho 80 anos. Tento
mantê-lo direto para o meu bem.
Ajustando pela inflação

Quando os montantes em dólares são comparados ao longo do tempo, geralmente é uma


boa idéia desvirtuar os valores retirando o efeito da inflação. Uma barreira para fazer isso
é a falta de um bom indicador estatístico da inflação. O mais comum é o Índice de Preços
ao Consumidor do Bureau of Labor Statistics. Foi criado durante a Primeira Guerra
Mundial quando os preços desenfreados, especialmente nos centros de construção de
navios, tornaram necessário fazer ajustes freqüentes no custo de vida nos salários. O CPI
mostra o valor relativo do poder de compra de um dólar de ano para ano. Isso faz isso
verificando o preço de uma "cesta de mercado" de bens e serviços que é mantida
relativamente constante ao longo do tempo. A cesta de mercado inclui alimentos, roupas,
abrigo, combustíveis, transporte, serviços médicos e outras coisas que as pessoas
compram para a vida diária. O problema vem em tentar definir uma cesta de mercado que
significa a mesma coisa em 1990, por exemplo, em 1952. Alguns bens e serviços que são
relevantes e Considerado necessário em 1990 não existia em 1952: equipamentos
antipoluentes para carros, por exemplo. A Mesa tenta resolver esse problema redefinindo a
cesta de mercado de tempos em tempos para mantê-lo a par da mudança dos estilos de
vida e da tecnologia.5

Mesmo assim, não é possível criar uma cesta de mercado que se aplique igualmente a
todos os grupos. Por exemplo, os aposentados que possuem suas casas não são afetados
por mudanças nos valores de aluguel ou de casa. Para os aposentados em casa do governo
federal, cujas pensões são indexadas ao CPI, a indexação cria uma ganância
inesperada. Os seus rendimentos aumentam automaticamente mais do que os seus próprios
custos normais de vida.

Essa indexação é, é claro, uma forma de destruição, espremendo a tendência secular da


inflação para que você possa ver o significado real. Fazê-lo apenas aproximadamente é
melhor do que não fazê-lo, já que os milhões de aposentados que vivem em pensões
privadas não indexadas, cujo valor real diminui ano a ano, concordarão.

E, no entanto, os contadores não gostam de indexar ou de desvendar por causa do


elemento de incerteza que introduz no seu trabalho. Os balanços corporativos raramente
mostram o efeito da inflação. Os comunicados de imprensa, com lucros recorde, às vezes
mostram lucros que seriam abaixo dos níveis históricos, se fossem feitas comparações
constantes do dólar. Os líderes trabalhistas fizeram o mesmo ocioso, tomando crédito por
ganhos que são realmente perdas quando são desconsiderados pela inflação.
O procedimento para desconsiderar a inflação é simples. Quando você compara montantes
em dólares ao longo do tempo, expressa-os nos dólares constantes de um de seus anos de
comparação. Quando um dos anos que está sendo comparado é o ano atual, a prática usual
é converter os valores mais antigos em seus equivalentes atuais ou dólares constantes. Mas
pode ser feito com facilidade de outra maneira.

Aqui está um exemplo perto de casa. David H. Weaver e G. Cleveland Wilhoit relataram
em 1986 que a renda média dos jornalistas aumentou de US $ 11.113 em 1970 para US
$ 19.000 em 1981. Isso foi uma má notícia para os jornalistas, ressaltaram, porque o
período intermediário era uma inflação furiosa, E os jornalistas realmente perderam cerca
de US $ 7.000 por ano No poder de compra.6 Para verificar seu cálculo, você precisa do
IPC para 1970 e para 1981. De acordo com o Resumo Estatístico dos Estados
Unidos, publicado anualmente pelo Escritório de Impressão do Governo dos EUA, foi
38,8 e 90,9, respectivamente (o índice usa os preços para o Período 1982-1984 como base
de 100). Em seguida, converta a renda média diária para 1970 em dólares constantes de
1981. Use a fórmula para equivalentes de fração que você aprendeu na escola secundária:

38,8 90,9
=
11,133 X
Talvez você esteja mais confortável com uma frase em inglês do que uma equação: 38,8 é
de US $ 11,133 como 90,9 é para a quantidade desconhecida (renda de 1970 expressa em
dólares constantes de 1981). Seguindo a regra de multiplicação cruzada da álgebra da
escola secundária, você acha que:
38,8 * X = 11,133 * 90,9

Dividindo cada lado da equação em 38,8 rendimentos:

X = (11,133 * 90,9) / 38,8

Fórmulas neste livro usam notação de computador: o sinal de "tempos" é um asterisco (*) ao invés do antigo
"X". Isso liberta "X" para representar um desconhecido. Um slash (/) significa "dividido por".
Punch ele em sua calculadora, e 1970 $ 11,133 resulta ser igual a $ 26,082.21 em dólares
constantes de 1981. Assim, os salários do jornalismo realmente diminuíram 27 por cento
durante esse período.Por quê? Duas coisas aconteceram. O desempenho de dois
jovensrepórteres do Washington Post no escândalo do Watergate motivou muitos jovens
para se tornarem jornalistas. Ao mesmo tempo, as barreiras às mulheres na profissão
foram reduzidas. Ambos os eventos aumentaram consideravelmente o grupo de
trabalhadores disponíveis no jornalismo. Essa inesperada juventude idealista e motivada
deu aos proprietários da mídia uma escolha maravilhosa.Opção 1: elevar os padrões do
jornalismo, aproveitando o melhor do grupo ampliado e recebendo o melhor e mais
brilhante no jornalismo.Opção 2: escolha a próxima geração de Jornalistas selecionando
aqueles que trabalhariam pela menor quantidade de dinheiro e levando as economias para
a linha inferior. Graças a Weaver e Wilhoit, agora sabemos como esse saiu.
(Se você é um estudante que contempla uma carreira no jornalismo, não se desanime. Os
efeitos do Watergate e da feminização tiveram que seguir seu curso no final da década de
1980 e os salários começaram a subir mais rápido que a inflação.)

Mais dicas para usar o CPI: livros mais antigos que este usam figuras CPI que têm 1967 =
100 como base. O Bureau of Labor Statistics recentemente converteu-se para a nova base
onde o período 1982-1984 = 100. Por algum tempo eles vão publicar ambos os
números.Atualize seu Resumo Estatístico todos os anos para se manter atualizado. A partir
desta escrita, o Resumo Estatístico dá um IPC para todos os anos de volta a 1950. Para
anos anteriores, veja um conjunto bonito de volumes chamado Estatística Histórica dos
Estados Unidos.7 Ele fornece todos os números BLS de volta ao início da Primeira Guerra
Mundial e, em seguida, usa estimativas de outras fontes históricas para produzir CPIs
anuais de volta para 1800.

Se você precisar da figura mensal mais recente, ligue para este número: (202) 523-
9658. Uma voz gravada lhe dará o IPC no mês mais recente. Os números mensais vêm em
duas categorias, o CPI-U e o CPI-W. O CPI-U é para todos os consumidores urbanos e
cobre cerca de 80 por cento da população. O CPI-W é para assalariados urbanos e
trabalhadores clericais. Eles são coletados separadamente para que os diferentes efeitos
sobre a inflação possam ser rastreados para os dois grupos (embora se sobrepõem
consideravelmente). Para a maioria dos propósitos de política pública, o CIP-U mais
abrangente é usado para fazer ajustes de inflação.

Ajustando o crescimento populacional

As tendências fazem novidades, quer porque tenham andado em silêncio e que nem
muitos tenham notado ou por causa de uma interrupção repentina de uma tendência. Para
se concentrar na tendência da notícia, você deve separá-la de todas as tendências paralelas
em segundo plano. O crescimento da população é uma tendência secular que, como a
inflação, pode fazer outras tendências mais do que parecem.

A American American Journal Publishers Association a cada O ano emite um livreto de


tendências estatísticas no negócio de notícias.Isso mostra que a circulação de jornal cresce
um pouco a cada ano nos Estados Unidos. Isso parece uma boa notícia para os jornais,
mas não é, porque a população e o número de famílias está crescendo muito mais
rápido. A penetração da circulação, definida como a circulação dividida pelas famílias,
tem vindo a cair de forma constante ao longo dos anos, e esse é o número que ANPA
realmente se preocupa, mesmo que não a publique em seu folheto.

É um número que é fácil de entender no nível intuitivo. Quando a penetração era de 100%
em um determinado mercado, um jornal foi vendido para cada casa. Quando estava acima
de 100 por cento, mais jornais foram vendidos do que famílias - comum na década de
1950. Hoje, o número é muito menor e ainda está caindo, com alguns jornais
metropolitanos experimentando penetração doméstica de menos de 50%. Expressando a
circulação do jornal como proporção para as famílias (porque a circulação entregues em
casa é vendida para Famílias em vez de indivíduos) torna a tendência real mais fácil de ver
(veja a Figura 2A).

Para um exemplo extremo de crescimento da população como fator de confusão, eu gosto


de mostrar aos alunos um mapa de dispersão que mostra a adesão à igreja e o consumo de
álcool ano a ano. Um diagrama de dispersão mostra cada ponto de dados em um espaço
bidimensional. Neste caso, a dimensão vertical representa a adesão à igreja (maior é mais)
e a dimensão horizontal representa as vendas de licor (para a direita é mais). Cada ponto
de dados é um ano, representado por um ponto colocado de acordo com a participação da
igreja e as vendas de bebidas alcoólicas nesse ano.
Apenas observando o diagrama de dispersão (Figura 2B), você pode ver que quanto maior
a participação da igreja, maiores as vendas de bebidas alcoólicas. Na verdade, a correlação
é quase perfeita. A parte divertida está produzindo teorias para explicá-lo - por exemplo, a
igreja libera pessoas de culpa, e assim eles se sentem livres para beber; Ou beber faz com
que as pessoas se sintam culpadas, e então vão à igreja. Claro, ambos são explicados pelo
crescimento populacional, e Quando desentendemos os números, expressando-os como
rácios de população, a associação desaparece.

Onde você obtém números de população para usar em detrending? O recenseamento dos
EUA é coletado apenas a cada dez anos, mas muitas organizações produzem estimativas
provisórias para os anos intermediários. O serviço de taxa e dados padrão produz estudos
de audiência de mídia e estimativas de população, e seus relatórios estão disponíveis em
bibliotecas maiores e nos departamentos de marketing de organizações de mídia. O Audit
Bureau of Circulations tem estimativas domésticas a nível do condado ano a ano. A
maioria dos jornais e muitas escolas de jornalismo são membros do ABC e têm acesso aos
seus dados, tanto na forma impressa como no disquete de PC.

Ajuste de curva

Às vezes, tendências interessantes são confundidas por uma variedade de fatores,


incluindo erros aleatórios. A pesquisa de pesquisa baseada em dados de amostra está
sujeita a erros aleatórios, particularmente quando pequenos subgrupos são
examinados. Uma maneira de obter uma imagem mais clara de uma tendência é tentar
ajustá-la a uma linha suave.

Um ajuste direto funciona para muitos tipos de dados de tendências.Você pode usar sua
calculadora ou um programa estatístico, como SPSS (Pacote Estatístico para Ciências
Sociais), para fazer uma regressão e diagrama de dispersão com o tempo como variável
independente ou X. O coeficiente de correlação (capítulo 4) informará o quão bem seus
dados se encaixam no modelo de linha direta. Se é um bom ajuste, você pode até tentar
prever o futuro, desenhando a linha reta mais adequada e estendendo-a com uma ponta
rápida. Essa projeção linear diz o que acontecerá se as tendências atuais continuarem
inalteradas - o que, é claro, pode não fazer.

A natureza, infelizmente, não gosta de linhas retas. Não se preocupe.Você pode usar o
mesmo programa de regressão para se adequar a uma linha curva. Primeiro, examine o
diagrama de dispersão e use sua imaginação para ver que tipo de linha pode caber. Se é
uma curva simples, que não se torce em uma nova direção em algum ponto ao longo do
seu comprimento, às vezes pode ser endireitada reexpressando uma das variáveis em
termos de função não-linear.

Se sua curva for oca para cima, para usar o termo de Tukey, experimente uma expressão à
direita de Y. Se for oco para baixo, mova para a esquerda. Faça o contrário para
reexpressar a variável independente ou X. Verifique seu diagrama de dispersão cada vez
que você tentar uma dessas conversões para ver se a curva está se endireitando. Se isso
funciona, e se você tentar prever o futuro com a técnica de "straightedge", lembre-se de
que é uma previsão baseada em uma transformação de Y ou X, e você terá que convertê-la
de volta antes de sua previsão produzir qualquer sentido.

Aqui está um exemplo. David Arant e eu nos perguntamos se os papéis que ganham o
maior número de Prêmios Pulitzer também são os melhores editados. Nós criamos um
método para medir a qualidade da edição básica de um documento e planejamos isso
contra os recados Pulitzer para uma amostra de 58 organizações de jornal. Encontramos
um forte efeito para os primeiros Pulitzers, mas caiu rapidamente depois disso. Em outras
palavras, o efeito não era linear. Você pode vê-lo na Figura 2C (1). Os pontos formam
uma curva em vez de uma linha reta. Para endireitar a curva, precisávamos esticar a escala
de Pulitzer na parte inferior, e a melhor maneira de fazer isso acabou por usar a raiz
quadrada da pontuação de Pulitzer em lugar da pontuação em bruto como independente ou
X variável. Outro endireitamento foi obtido eliminando um "outlier".A Associated Press,
com sua alta taxa de má ortografia e alta taxa Pulitzer, estava claramente em uma classe
por si só. Ao limitar o estudo aos jornais, obtivemos uma aproximação mais próxima de
uma linha reta. O resultado é na Figura 2C (2). Isso nos deu uma correlação
estatisticamente significante. A moral é que é uma boa idéia olhar sempre o diagrama de
dispersão antes de lidar com a correlação.

Suavização

Se a natureza não gosta de linhas retas, ela também não gosta muito de curvas
logaritmicas lisas. As tendências mais interessantes são muitas vezes as que se torcem e se
tornam mais exóticas. Tukey tem um procedimento para lidar com dados tão complicados
que ele chama de "suavização". A teoria por trás do suavização é que o erro de medição é
em si uma tendência secular e pode ser retirado usando cada ponto como um controle nos
pontos vizinhos. Uma média móvel é um método de alisamento bastante familiar. Se você
tiver dados mensais que precisam ser suavizados, expresse janeiro como a média de
dezembro, janeiro e fevereiro. Então, para fevereiro, use a média de janeiro, fevereiro e
março.

A recomendação de Tukey é usar medianas rolantes de três em vez de meios. Veja como
fazer isso: compare cada ponto de dados com aqueles de cada lado e, em seguida,
substitua-o pelo meio dos três.Por exemplo, na série 324, os dois seriam alterados para três
porque três são a mediana do conjunto. Dessa forma, os pontos descontroladamente fora
do alcance serão enterrados. Isso é bom, diz Tukey, porque esses pontos estranhos
chamam a atenção e tornam difícil ver o que está acontecendo realmente. "O valor do
alisamento", ele diz, "... é a visão mais clara do geral, uma vez que está livre de
detalhes".8 Em outras palavras, é exatamente o que um jornalista precisa. E se um liso de
executar medianas de três deixa alguns lugares irregulares, Tukey recomenda fazê-lo
novamente - e novamente - até que o alisamento não mude mais as coisas. Existem
maneiras mais complicadas de suavizar, e estão além do escopo deste livro. Consulte o
trabalho da Tukey para obter detalhes ou tente uma das rotinas de suavização no SYSTAT,
um pacote de software popular para rotinas estatísticas.9 A Figura 2C (1) mostra um lote de
leitores de jornais diários por idade exata. Seu objetivo é ver como o leitor muda de
acordo com o estágio da vida. A versão suavizada, 2C (2), torna isso mais claro.
Números de índice

Outra maneira de obter clareza para análise e comunicação é usar números de índice. O
CPI é um bom exemplo de um número de índice. Com 1982-1984 estabelecido em 100 e
setembro 1989 às 125, você sabe que os preços subiram 25% do período base.
As pessoas de vendas de publicidade de jornal às vezes usam números de índice para
comparar a audiência de um jornal com seu mercado. Se 35 por cento dos adultos no
mercado tiveram diplomas universitários e 47 por cento dos leitores têm diplomas
universitários, o índice é 134. Esta é outra maneira de dizer que a taxa de graduação da
faculdade é 34 por cento maior entre os leitores do que no mercado como um todo. Ao
aplicar esta indexação a uma variedade de meios de comunicação concorrentes, o
vendedor de anúncios pode argumentar que o público de seu papel é mais sofisticado e
tem mais poder de compra do que os números de circulação bruta indicariam.

Ajuste sazonal

Outra forma de destruição é o ajuste sazonal. Quando o Bureau of Labor Statistics emite
seus números de desemprego mensais, nos dá números que podem ser comparados
diretamente de um mês para o próximo para que possamos ver de imediato se as coisas
estão melhorando ou piorando.

Mas o desemprego é sazonal. As aberturas e fechamentos escolares e as condições


climáticas podem afetar o número de pessoas que procuram trabalho em diferentes épocas
do ano. Para avaliar a saúde da economia, estamos interessados nas mudanças mês a mês
que não podem ser atribuídas à variação sazonal. Os estatísticos do BLS realizam essa
destruição ao analisar as mudanças sazonais passadas e assumindo que o ano atual não
será muito diferente. Então, eles subtraem a parcela atribuível à mudança de estação e
relatam o resto.Existe algum risco nisso, é claro, porque as variações sazonais não são
uniformes de ano para ano. Mas é melhor do que não fazê-lo. Se a Casa Branca derruba
números de desemprego no outono de um ano eleitoral que mostram uma queda dramática
no desemprego, os repórteres cuidadosos verificarão se o ajuste sazonal não foi omitido.Se
houver, o declínio pode ser meramente o resultado de grande parte da força de trabalho
adolescente voltando para a escola.

Residuais de regressão

Uma técnica estatística para destruição é útil Quando você precisa controlar alguma
variável contínua que ocorra a maior parte do que você está interessado. Andrew Brack
estava estudando a qualidade editorial dos jornais na Carolina do Norte, mas ele foi
prejudicado pelo fato de que o tamanho da circulação explica a maior parte da
variância. Os papéis maiores têm mais recursos, e assim eles dão aos seus leitores mais
por seu dinheiro. A Brack, no entanto, reuniu uma amostra de papéis grandes e pequenos,
mediu-os em vários indicadores de qualidade editorial, combinou os indicadores em um
índice e os traçou em um gráfico. Veja a Figura 2E para o resultado.O eixo vertical
representa a qualidade e o eixo horizontal representou a circulação. Quando cada papel é
plotado no gráfico, sua distribuição se aproxima de uma linha reta.

Usando o modelo linear geral (GLM) para traçar a linha reta mais adequada para
descrever o efeito da circulação na qualidade, Brack voltou sua atenção para os desvios
dessa linha. Alguns papéis foram muito maiores em qualidade do que Seria previsto pelo
seu tamanho de circulação, e outros eram muito menores. Ao medir esses desvios do que a
circulação previria, ele obteve uma medida de qualidade deprimida que eliminou o efeito
do tamanho da circulação. O termo técnico para esta técnica é a análise residual, pois
considera a variação residual, ou a variância que resta após o tamanho da circulação
explica o que pode. (O Capítulo 4 terá uma explicação mais completa).

Pontuações padronizadas

Outra maneira de colocar maçãs e laranjas em uma base comparável é


usar escores padronizados ou z, que reexpressam cada medida em termos de quanto ele se
desvia da média do grupo. É útil se você tem uma série de medidas para combinar em um
índice, mas não pode usar adição simples porque cada medida está em uma escala
diferente. Um escore z é uma medida de peculiaridade relativa. O cálculo exige algum
conhecimento das estatísticas, e também será discutido mais detalhadamente no capítulo
4.

Notas

1. Wall Street Journal , 16 de outubro de 1989, p. C14. Retornar ao texto

2. Associated Press, marca de horário 2026EST, 18 de novembro de 1986.retornar ao texto

3. Thomas D. Cook e Donald T. Campbell, Quasi-Experimentação: Problemas de Design e Análise


para Configurações de Campo (Boston: Houghton Mifflin, 1979), p. 323. retornar ao texto

4. Jim Stewart e Andrew Alexander, "Assault Guns Muscling In On Front Lines of Crime", Atlanta
Journal-Constitution, 21 de maio de 1989, p. 1. retornar ao texto

5. BLS Manual de Métodos: Vol. II, Índice de Preços ao Consumidor(Washington: US Government


Printing Office, 1984). Retornar ao texto

6. David H. Weaver e G. Cleveland Wilhoit, jornalista norte-americano: um retrato de pessoas dos


EUA e seu trabalho (Bloomington: Indiana University Press, 1986), p. 82. retornar ao texto

7. Estatísticas históricas dos Estados Unidos: Colonial Times to 1970 , Bicentennial Edition
(Washington: US Government Printing Office, 1975), p. 211.retornar ao texto

8. John W. Tukey, Exploratory Data Analysis (Boston: Addison-Wesley, 1977), p. 205. retornar ao
texto

9. Leland Wilkinson, SYSTAT: o sistema de estatística (Evanston, Ill .: SYSTAT, Inc.,


1988). Retornar ao texto
Aproveitando o poder das estatísticas
São as coisas que nos interessam. As coisas que não variam são inerentemente chatas. O clima de inverno em Mia
Center, com suas variações de vento, precipitação e temperatura, tem muito mais em sua atmosfera. Ou faça um c
humano típico. Uma vez que somos todos de cabeça única e não há variação para refletir ou explicar ou analisar, a
número inesperado de pessoas de duas cabeças na população seria interessante. O número de cabeças se tornaria u

Por outro lado, considere a inteligência humana medida pelo, digamos, o teste de QI de Stanford-Binet. Isso varia
perguntando quanto da variação é causada pela hereditariedade e quanto pelo ambiente, se pode ser mudado, e se
Variáveis.

A diferença, então, faz novidades. E em qualquer análise estatística, a primeira coisa que geralmente queremos sa
varia. Uma vez que descobrimos isso, geralmente estamos interessados em encontrar as fontes da variância. Idealm
contentar em descobrir o que correlaciona ou covaries com a variável em que estamos interessados.Como a causa
bem - a mesma coisa. Se dois fenômenos interessantes covirarem (o que significa que eles variam juntos), eles diz
mas deixam de ser insuficientes, e com razão. Por exemplo, o quão bem você executa na faculdade pode depende
simplesmente ajudam a explicar isso, indicando o nível de habilidade subjacente que é a causa dos resultados dos

As aplicações estatísticas, tanto no jornalismo como na ciência, visam encontrar causas, mas é necessário muito c
modéstia está se tornando, então pense em estatísticas como uma busca pela variância inexplicada. É um conceito

Variação de medição

Existem duas maneiras de usar as estatísticas. Você pode fazer um livro de receitas, aplicando fórmulas sem enten
acontecendo. A rota do livro de receitas pode ser fácil e rápida, mas para realmente melhorar sua compreensão, vo
a pena gastar algum tempo para obtê-lo no nível intuitivo. Se você vê a diferença entre variância baixa (número d
em algumas maneiras de medir a variação.

Uma medida deve começar com uma linha de base. (Lembre-se do comediante perguntado: "Como é sua esposa?"

Ao medir a variância, o "em comparação com o que" é a tendência central, e a medida conveniente da tendência c
usar ovalor esperado .

Comece com a variável mais simples possível, que varia em apenas duas condições: zero ou uma, branca ou preta
real, que os estatísticos têm um termo para elas. Eles são chamados devariáveis dicotômicas . Outra palavra descr
Uma variável dicotômica interessante na atual sociedade americana é um estatuto de minoria. As políticas destina
minoria.(Saltejamos, por enquanto, as possíveis complicações de fazer isso.) Agora imagine duas cidades, uma no
a maior variação?

Com apenas um pouco de reflexão, você verá que a cidade do meio oeste não tem muita variação em sua maquiag
variância racial.

Aqui está outra maneira de pensar sobre a diferença. Se você soubesse a distribuição racial na cidade do meio-oes
98% de chance de estar certo. Na cidade do sul, você faria o mesmo palpite, mas seria muito menos certo de estar
considerarmos a aritmética da amostragem.

Por enquanto, o que você precisa saber é que

1. A diferença é interessante.
2. A diferença é diferente para diferentes variáveis e em diferentes populações.

3. A quantidade de variância é facilmente quantificada. (Nós logo veremos como.)

Uma variável contínua


Agora, para além do caso dicotômico. Vamos dar um grande salto e considerar uma variável que pode ter um núm
um número infinito de divisões dentro do intervalo finito. Fazer essas coisas é muito difícil, então vamos usar dad
prestigiadas arquivadas nas bases de dados de computadores VU / TEXT e NEXIS para a primeira metade do cale

Miami Herald
Los Angeles Times
Philadelphia Inquirer
Washington Post
Boston Globe
New York Times
Chicago Tribune
Newsday
Detroit Free Press
Apenas ao examinar a lista, você pode ver muita variação lá. O artigo com a pior expressão na lista tem mais de d
proporção dos extremos, é de um modo intuitivamente satisfatório. Mas é uma medida difícil porque não usa toda
ponto de referência (um comparado com o que) calculando a média, que é a soma dos valores divididos pelo núm
errado 11,6 por cento do tempo. Quando falamos de variação, estamos realmente falando de variância em torno (o
1. Tome o valor de cada caso e subtrai a média para obter a diferença.
2. Marque essa diferença para cada caso.

3. Adicione para obter a soma de todas essas diferenças ao quadrado.

4. Divida o resultado pela quantidade de casos.

Essa é uma lista bastante longa e detalhada. Se este fosse um texto estatístico, você teria uma equação. Você gosta
Então, faça tudo acima, e o resultado é a variância neste caso. Isso funciona para cerca de 100, dar ou dar um pon
dar a este número alguma utilidade intuitiva? Bem, a primeira coisa a lembrar é que a variância é um conceito abs
chegando perto de uma maneira de fazer isso. Se tomarmos a raiz quadrada da variância (razoavelmente suficient
chamada de desviopadrão da média. Ou apenas desvio padrão para baixo. E o número que você compara é o meio

Neste caso, a média é 11,6 eo desvio padrão é 10, o que significa que há muita variação em torno dessa média. Em
casos cairão dentro de um desvio padrão da média. Então, se o desvio padrão é um valor pequeno em relação ao v
da média. Se o desvio padrão for um grande valor em relação à média, então a variância é relativamente grande.

No caso em questão, a variação na taxa de erro de "minúsculo", a variância é bastante grande, com apenas um cas
variância!

Por contraste, consideremos o tamanho da circulação de cada um desses mesmos jornais.1

Miami Herald
Los Angeles Times
Philadelphia Inquirer
Washington Post
Boston Globe
New York Times
Chicago Tribune
Newsday
Detroit Free Press

A circulação média para este grupo de nove é 708.678 e o desvio padrão em torno dessa média é 238.174. Então,
terços ficariam bastante próximos da média - dentro de um terço do valor da média.

Uma maneira de obter uma boa imagem da forma de uma distribuição, incluindo a quantidade de variância, é com
padrão, tem uma média de 100 e um desvio padrão de 16. Então, imagine um campo de trigo de Kansas com o res
conhece o seu Índice de QI, e há uma linha reta no campo marcado com números a intervalos de um metro de 0 a
seu QI. Olhe para a Figura 3A. Um histograma vivo! Como o QI é normalmente distribuído, a linha mais longa se

Você também pode gostar