O Som No Documentário - Renan P. Chaves

Renan Paiva Chaves
O som no documentário: a trilha sonora e suas transformações nos principais movimentos e

momentos da tradição documentária, dos anos 1920 aos 1960
Campinas
2015
i
ii
Universidade Estadual de Campinas
Instituto de Artes
Renan Paiva Chaves
O som no documentário: a trilha sonora e suas transformações nos principais movimentos e

momentos da tradição documentária, dos anos 1920 aos 1960
Dissertação de Mestrado apresentada ao Instituto

de Artes da Universidade Estadual de Campinas
para obtenção do Título de Mestre em Multimeios.
Orientador: Prof. Dr. Claudiney Rodrigues

Carrasco
Este exemplar corresponde à versão final da

dissertação defedida pelo aluno Renan Paiva
Chaves e orientada pelo Prof. Dr. Claudiney
Rodrigues Carrasco
Campinas
2015
iii
iv
v
vi
Resumo
Nossa pesquisa dedica-se à trilha sonora do cinema documentário. Nossa abordagem

privilegiou uma perspectiva panorâmica que percorre a produção documentária em momentos-
chave de sua tradição desde os anos 1920 até os anos 1960. Perpassamos pelas produções dos
anos 1920 e 1930 que começaram a solidificar o campo do cinema documental, pelas escolas
britânica, norte-americana e canadense de documentário entre os anos 1930 e 1950 e pelo free
cinema, cinema direto, cinema verdade e cinema do vivido nas décadas de 1950 e 1960. Nesse
trilho, e na visita aos seus arredores, empreendemos nossos esforços em entender as principais
configurações sob as quais a trilha sonora do cinema documentário se estabeleceu e se
transformou.
Abstract
Our research focuses on the soundtrack of the documentary film. Our approach privileged a
panoramic perspective that runs through the documentary production at key moments of its
tradition from the 1920s to 1960s. We spanned the productions of the 1920s and 1930s that
began to solidify the documentary film field, the British, American and Canadian documentary
schools between the 1930s and 1950s, and the free cinema, direct cinema, cinema vèritè and
living cinema in the 1950s and 1960s. In this track, and in its surroundings, we undertook our
efforts on understanding the main settings under which the documentary film soundtrack is
established and how it transforms itself.
vii
viii
Sumário
Introdução ..................................................................................................................... 13
1 O nascimento do documentário sonoro: a dimensão autoral e o suporte uno ..... 19
2 A presença e a tomada do som: sons-gravador e sons animados .......................... 27
3 As vozes no documentário......................................................................................... 31
3.1 As vozes no documentário clássico: para além da “voz de Deus”................. 31
3.1.1 Por que “voz invisível”? Por uma fenomenologia da voz que não vemos
..................................................................................................................... 31
3.1.2 A voz visível ........................................................................................ 50
3.2 As vozes no documentário moderno: para além do sincronismo portátil ...... 56
3.2.1 A voz fabuladora ................................................................................. 58
3.2.2 A voz do mundo ................................................................................... 77
4 A música no documentário ....................................................................................... 91
4.1 A (falsa) polêmica da presença da música no documentário ......................... 91
4.2 As sinfonias metropolitanas, sua música e a metáfora sinfônico-musical...... 98
4.3 Breve consideração sobre a textura homofônica da música no documentário
............................................................................................................................. 113
4.4 A tomada da música: sua relação com a tomada visual e com a circunstância
de mundo ............................................................................................................. 114
5 Os outros elementos sonoros do documentário ..................................................... 129
5.1 A indiscernibilidade entre as pistas de música, voz e ruídos no documentário
do período clássico ............................................................................................. 129
5.2 Os ruídos no documentário ........................................................................... 154
Considerações finais ................................................................................................... 167
Referências .................................................................................................................. 171
Filmes citados .............................................................................................................. 181
Anexo I: Script musical de Dziga Vertov para o filme O homem com a câmera ... 187
ix
x
Agradecimentos
Pensar nos meus agradecimentos foi um exercício de memória. Uma memória que
me lançou para o refletir da minha trajetória até o presente. Foi prazeroso lembrar de momentos
da infância e da adolescência com a perspectiva de que o passado e suas nuances, seja por obra
do acaso ou do destino, foram fundamentais no rumo que minha vida seguiu e se encontra hoje.
E o mais interessante foi lembrar desse passado com o sentimento de gratidão, independente
dos maus ou bons acontecimentos. Agradeço aqui aos amigos de Santa Isabel-SP e do CEFET-
SP por estarem vivos e atuantes nesse exercício da memória.
Agradeço ao meu orientador Ney Carrasco que me acolheu já nos primeiros anos
da graduação na Unicamp, sendo figura central na minha trajetória acadêmica. Nossos
encontros, o fácil trato e a disposição em ajudar foram, ao longo do mestrado, fundamentais
para dois anos e meio agradáveis, determinantes de um primeiro amadurecimento intelectual.
Agradeço aos professores membros da banca de qualificação e defesa, Fernão
Ramos e Eduardo Mendes, pelas críticas e conselhos.
Agradeço aos professores da pós-graduação com os quais tive aula, Francisco
Elinaldo Teixeira, Gilberto Sobrinho e Marcius Freire (e, também, Fernão Ramos e Ney
Carrasco), decisivos no meu desenvolvimento teórico no âmbito do cinema documentário.
Agradeço aos amigos e talentosos pesquisadores cujos laços se fortaleceram ao
longo dos anos do mestrado e que colaboraram diretamente com meu trabalho, especialmente
Andre Checchia, Felipe Bomfim, Gabriel Tonelo, Lucas Bonetti e Nelson Pinton. Agradeço
também aos demais amigos da pós-graduação pelas conversas, viagens e convivência.
Agradeço aos queridos amigos do dia a dia de Campinas-SP que me ajudaram, me
formaram e me divertiram nesses últimos anos.
Agradeço aos meus pais, Angélica e Benedito, e meus irmãos, William e Thiago,
por tudo que fizeram e fazem por mim. O mestrado sem o suporte deles seria inviável.
Agradeço à minha companheira Maíra Guimarães Paschoal por tudo aquilo que é
fruto de um relacionamento de cumplicidade e pelas revisões e discussões que contribuíram
diretamente com a dissertação.
xi
Agradeço à Fundação de amparo à pesquisa do estado de São Paulo (FAPESP) que,
por meio do processo 2013/09996-1, deu o auxílio financeiro necessário ao desenvolvimento
do meu projeto de mestrado.
xii
Introdução
O campo de debate sobre o cinema documentário encontrou um novo fôlego a partir

dos anos 1970, seja na perspectiva mais historiográfica de Erik Barnouw, na perspectiva mais
crítico-analítica de Richard Barsam ou na perspectiva mais teórica de Bill Nichols. No caminhar
dos anos 1970 para os anos 1980, os estudos do som fílmico também começaram a surgir de forma
mais consistente, nas perspectivas teóricas de, por exemplo, Claudia Gorbman, Michel Chion e
Rick Altman, que, embora tenham deixado importante lastro conceitual para o campo, não se
dedicaram ao cinema documentário. A aproximação ou união dessas duas temáticas – cinema
documentário e som fílmico –, com a qual lidamos em nossa dissertação, apenas começaria a
ocorrer na produção acadêmica, de forma mais consistente, a partir dos anos 1990.
Entre os trabalhos mais relevantes, temos: a dissertação de mestrado The classical
documentary score in American films of persuasion: contexts and case studies, 1936-1945 de Neil
Lerner (1997), que se debruça em filmes norte-americanos realizados entre 1936 e 1945 e que se
enquadram na categoria “persuasivo”; a dissertação Polifonias do documentário: linguagens
sonoras e plasticidades documentais (1930-1940) de José Alberto Pinto (2007), que esboça uma
perspectiva sobre o documentário britânico e norte-americano dos anos 1930 e 1940 e também do
cinema português; a dissertação Música, futurismo e a trilha sonora de Dziga Vertov de Michelle
Magalhães (2005), na qual um estudo minucioso da trilha sonora de Entusiasmo (1930), de Dziga
Vertov, é realizado; a tese de doutorado The kinetic and temporal interaction of music and film:
three documentaries of 1930’s America de Claudia Widgery (1990), que se detém à análise dos
filmes The river (1937), de Pare Lorentz, The City (1939), de Ralph Steiner e Willard Van Dyke,
e Valley Town (1940), de Willard Van Dyke; a tese The incidental music of Benjamin Britten de
Philip Reed, defendida ainda em 1987, cuja ênfase é dada aos filmes em que Benjamin Britten
compôs a trilha musical; a tese Música em cena: à escuta do documentário brasileiro de Cristiane
Lima (2015), que se dedica ao dito documentário musical; o artigo “Conventions of sound in
documentary” de Jeffrey Ruoff (1992), que, apesar de citar documentários de diferentes épocas,
foca naquilo que chama de observational films dos anos 1960 e 1970 e, em especial, na série An
American Family, de 1973; o artigo “Historicising the ‘voice of God’: the place of vocal narration
in classical documentary” de Charles Wolfe (1997), que se dedica ao tema da voz no documentário
13
clássico, em especial ao filme Spanish Earth (1937) de Joris Ivens; o artigo “The audio-visual
rhythms of modernity: Song of Ceylon, sound and documentary filmmaking” de Jamie Sexton
(2004), que, apesar de esboçar uma perspectiva sobre as primeiras décadas do som no
documentário, foca a análise em documentários britânicos, em especial em Song of Ceylon (1934)
de Basil Wright; o artigo “Damming Virgil Thomson’s music for The River” de Neil Lerner (1999),
fruto de sua dissertação; o artigo “Sounds real: music and documentary” de John Corner (2002),
que dá ênfase aos documentários da televisão britânica; o artigo “Britten in the cinema: Coal face”
de Philip Reed (1999), fruto de sua tese de doutorado; o artigo “Music and soundtrack in Joris
Iven’s films” de Claude Brunel (1999), que se dedica à análise do som nos filmes de Joris Ivens,
em especial Song of heroes (1932), La seine a rencontré Paris (1957) e Valparaíso (1962); o artigo
“Musical texture as cinematic signifier: the politics of polyphony in selected documentary film
scores by Virgil Thomson and Aaron Copland” de Neil Lerner (2004), que analisa trechos de fuga
nos filmes The plow that broke the plains (1936) e The River (1937) de Pare Lorentz e The
cummington story (1945) de Helen Grayson e Larry Madison; o artigo “The sounds of music and
war: Humphrey Jennings’s and Stewart McAllister’s Listen to Britain (1942)” de David Rosen
(2009), que faz uma análise esmiuçada da música de Listen to Britain (1942) de Humphrey
Jennings e Stewart McAllister; o artigo “Aspectos da música no documentário brasileiro
contemporâneo: algumas reflexões sobre o fazer e o pensar” de Guilherme Maia (2012), que
apresenta uma discussão teórica sobre as questões que envolvem a presença da música no
documentário e discorre sobre algumas práticas de uso da música no documentário brasileiro
contemporâneo; o artigo “O som no documentário clássico: as tecnologias da intimidade na escola
britânica” de Fernando Weller (2013), que articula a ideia de intimidade nos filmes Night mail
(1936) de Harry Watt e Basil Wright e Housing problems (1935) de Arthur Elton e Edgar Anstey
a partir da discussão dedicada ao som e a seu modo de ser captado e sincronizado; os subcapítulos
“Music in documentaries” e “Music and non-performance-based documentaries” do livro Twenty
four frames under: a buried history of film music de Russell Lack (1997); o subcapítulo “The
documentary film” do livro A history of film music de Mervyn Cooke (2008); o livro Playing to the
camera de Thomas Cohen (2012), que se dedica àquilo que tem se convencionado chamar de
documentário musical; o livro Music and sound in documentary film, editado por Holy Rogers
(2015), a mais completa obra sobre a temática, abarcando textos sobre as mais diferentes épocas e
14
perspectivas teóricas, escritos por Carolyn Birdsall, James Deaville, Julie Hubbert, Thomas Cohen,
Orlene McMahon, Mervyn Cooke, John Corner, Kevin Donnelly, Jamie Sexton, Marion Leonard
e Robert Strachan e Selmin Kara e Alanna Thain.
Antes dos anos 1990, embora escassos, existem alguns relevantes textos, artigos e
livros. Entre os trabalhos mais antigos, o livro Sound and the documentary film, inteiramente
dedicado ao som no documentário, de Ken Cameron (1947), em termos teóricos, historiográficos
e técnicos, figura como um dos mais relevantes. Há também o capítulo “O som” do livro Filme e
realidade de Alberto Cavalcanti (1957 [1953]), assim como seu também relevante artigo “Sound
on films” de 1939, nos quais são discutidos tanto o cinema ficcional como o documental. Nos anos
1930, encontram-se nos periódicos Sight and Sound, Cinema Quarterly e World Film News and
Television Progress alguns artigos que se dedicam ao som no documentário, diretamente ou
tangencialmente. O subcapítulo “Sound” do livro Documentary film de Paul Rotha (1939) também
é bastante relevante, sendo, talvez, a primeira abordagem mais detalhada sobre a trilha sonora no
documentário. Em 1953, Karel Reisz, que ficaria conhecido pela sua produção no free cinema,
lançou o livro The technique of film editing, no qual dedica o capítulo “The documentary and the
use of sound” ao tema do som no documentário. W. Hugh Baddeley, em seu livro The technique
of documentary film production de 1963, dedica dois capítulos à temática, um sobre gravação de
som em locação e em estúdio, métodos de gravação e sincronização (“Sound recording”), e outro
sobre os aspectos ligados mais diretamente à produção e à pós-produção da trilha sonora (“The
sound track”). Ainda nos anos 1960, Edgar Anstey, uma das principais figuras do documentário
britânico, escreve a pedido da Organização das Nações Unidas para a educação, a ciência e a cultura
(Unesco), para o congresso “The sound-track in the cinema and television” de 1966, o artigo “Some
origins of Cinéma vérité and The sound-track in British documentary”, detalhando aspectos
conceituais da tradição documentária entre os anos 1920 e 1960 e fazendo uma abordagem sobre
as diferentes construções de trilha sonora no documentário, sobretudo, no britânico. Nos anos 1970,
temos o texto “Documentary music” de Louis Applebaum (1974), dedicado ao debate da música
no documentário norte-americano, britânico e canadense do período clássico.
De forma geral, os estudos do som no cinema documentário sofrem de mal semelhante
ao dos estudos do som no cinema ficcional. Entre os (não abundantes) trabalhos, existe uma
predominância daqueles dedicados apenas a um dos elementos da trilha sonora, a música – embora
15
se note, em alguns dos trabalhos citados, discussões sobre os outros elementos da trilha sonora
(sendo a voz o segundo elemento mais privilegiado). De qualquer forma, mesmo o debate sobre a
música no cinema documentário sendo o mais numeroso, ainda é notável seu estado incipiente,
assim como o é a discussão sobre a voz e os outros elementos sonoros.
Em nossa dissertação, tentamos contribuir com o debate do som no documentário
buscando nos dedicar a todos os elementos sonoros da trilha sonora.
Nossa abordagem privilegiou uma perspectiva panorâmica que percorre a produção
documentária de porte autoral em momentos-chave de sua tradição, desde os anos 1920 até os anos
1960. Assumimos que o documentário começa a se formar nos anos 1920 e a se estabelecer no
princípio dos anos 1930 sob o nome de importantes realizadores, como Alberto Cavalcanti, Dziga
Vertov, John Grierson, Joris Ivens, Robert Flaherty e Walther Ruttmann; entre os anos 1930 e 1950
vemos surgir as relevantes escolas documentárias britânica, norte-americana e canadense (que
conformam, genericamente, aquilo que convencionamos chamar de documentário clássico); e no
decorrer do pós-guerra, em especial a partir de meados dos anos 1950, um novo momento do
documentário começa a emergir: o free cinema (Inglaterra), o cinema do vivido (Canadá), o cinema
direto (Estados Unidos) e o cinema verdade (França) (que conformam, genericamente, aquilo que
convencionamos chamar de documentário moderno).
Perpassando por esse trilho, e visitando seus arredores, empreendemos nossos esforços
em entender as principais configurações sob as quais a trilha sonora do cinema documentário se
estabeleceu e se transformou.
No capítulo 1, “O nascimento do documentário sonoro: a dimensão autoral e o suporte
uno”, fazemos uma incursão no domínio não ficcional dos anos 1910 e 1920, traçando uma
perspectiva sobre o nascimento do documentário sonoro.
No capítulo 2, “A presença e a tomada do som: sons-gravador e sons animados”,
apresentamos as bases ferramentais que guiaram a abordagem dos filmes analisados, que, de forma
geral, privilegiam e dão destaque para as configurações sob as quais a tomada do som ocorre.
No capítulo 3, “As vozes no documentário”, dedicamo-nos às diversas características
com as quais a voz se apresenta no documentário clássico e no documentário moderno. Sob quatro
grandes tipos gerais de voz – invisível, visível, fabuladora, do mundo – buscamos especificar
16
variadas formas da voz se fazer presente no filme, observando as preponderâncias e as
transformações operadas ao longo das décadas.
No capítulo 4, “A música no documentário”, abordamos, inicialmente, um tema que
recorrentemente aparece e que envolve julgamento e noções de validade ética em relação à
presença da música na narrativa documental. Em seguida, dedicamos um item às sinfonias
metropolitanas e outro à característica homofônica da música que se faz presente no documentário.
Por último, tal como fizemos com a voz, buscamos verificar as principais configurações sob as
quais a música se fará presente ao longo das décadas analisadas.
No capítulo 5, “Os outros elementos sonoros do documentário”, dedicamo-nos a uma
discussão que, cada vez mais, tem aparecido nos estudos do som fílmico e que tem relação com as
indiscernibilidades – tanto do ponto de vista teórico, como de organização produtiva, como de
perspectiva espectatorial – operadas pela diluição de uma inequívoca divisão entre voz, música e
ruído como distintos elementos da trilha sonora. Em seguida, tal como fizemos com a voz e com a
música, abordamos aquilo que se convenciona chamar de ruído.
Após as “Considerações finais” e as “Referências”, elencamos todos os filmes citados
na dissertação e reproduzimos, como anexo, o script musical de Dziga Vertov para o filme O
homem com a câmera (1929).
17
18
1 O nascimento do documentário sonoro: a dimensão autoral e o suporte uno
Os indícios do processo de consolidação do formato sonoro no cinema não ficcional

sugerem que houve, tal como no domínio ficcional, uma diversidade e irregularidade nas práticas
de sonorização fílmica, que implicam uma complexidade em torno da temática do som no domínio
documental nas primeiras décadas do século XX, ainda a ser investigada1.
Independente da diversidade e irregularidade das práticas, preocupações específicas
com o som no domínio não ficcional já podem ser notadas nas décadas de 1910 e 1920.
A famosa antologia de acompanhamento musical Sam Fox moving picture music de
John Stepan Zamecnik (1913), por exemplo, dedica toda uma seção de partituras, “Weekly (Pathé,
Gaumont etc.)”, aos cinejornais (Figura 1). Samuel “Roxy” Rothapel, importante empresário e
produtor do setor de teatros de exibição norte-americano, no artigo “Dramatizing music for the
pictures” de 1914, também revela a especial atenção dada às músicas que acompanham os
cinejornais:
Para o “Topical Special”, ou como é melhor conhecido, o “Weekly”, nós tocamos
absolutamente de acordo com as cenas utilizadas, árias nacionais de diferentes
países e pequenos trechos de marchas e valsas que se encaixam à cena [...]. Nós
damos bastante atenção a essa porção do nosso programa e eu atribuo o
maravilhoso sucesso de nosso “Topical Review” ao acompanhamento musical
(ROTAPHEL, 1914, p. 23 apud DEAVILLE, 2015, p. 43)2.
Na década seguinte, preocupação e atenção semelhantes parecem se manter. Escritos
aferem, inclusive, as especificidades do acompanhamento musical para o filme não ficcional. No
capítulo “The editing of the newsreel” da Encyclopedia of music for pictures de 1925, outra
importante antologia do começo do século, o autor, Ernö Rapée, escreve sobre as especificidades
dos cinejornais, do intricado processo de acompanhá-los, de acompanhamentos musicais
apropriados, dos melhores caminhos a se tomar quando há uma sequência, por exemplo, de batalha,
de caráter diplomático e político ou ainda quando se mostra um presidente. No manual de
acompanhamento Musical presentation of motion pictures (1921), o autor, George Beynon,
também não deixa o assunto passar em branco e critica algumas maneiras que julga como
1
Sobre a diversidade e irregularidade das práticas de sonorização fílmica nas primeiras décadas do século XX, conferir
The silence of the silents (1996) e Silent film sound (2004) de Rick Altman; para o caso mais específico do cinema
brasileiro, conferir O som no cinema brasileiro (2008) de Fernando Costa; para o caso mais específico dos cinejornais
norte-americanos conferir The American newsreel: a complete history, 1911-1967 (2006) de Raymond Fielding.
2
Assim como esta, todas as citações de escritos em língua estrangeira foram por nós traduzidas.
19
equivocadas de se acompanhar um cinejornal, apontando as melhores soluções a se tomar.
Figura 1 – Sumário do volume 2 da antologia Sam Fox moving picture music
Fonte: Zamecnik (1913).
20
Se podemos dizer que o cinema ficcional nunca foi mudo, podemos dizer algo
semelhante sobre o cinema não ficcional: as práticas de sonorização o acompanharam ao longo do
período silencioso. Quando o cinema não ficcional se torna sonoro no final da década de 1920, já
existe um respaldo prático e, por mais que limitado, teórico, de forma semelhante ao que ocorreu
no domínio ficcional.
Como marco simbólico da era sonora do cinema não ficcional, podemos citar a
entrevista com Charles Lindebergh de 20 de maio de 1927 gravada pela Fox Movietone News, que,
como The jazz singer (16 de outubro de 1927) no domínio ficcional, fez enorme sucesso com o
público. Podemos citar também a curta sequência dos cadetes de West Point exibida em 30 de abril
de 1927 no Roxy Theater em Nova York; a sessão de cinejornais, que incluía sequências sobre a
cataratas de Niagara e um rodeio em Nova York, exibida em 28 de outubro de 1927 no Roxy
Theater também; e a produção da Fox Movietone News que tratava do coral do Vaticano, da
explosão de uma ponte e de um jogo da marinha, exibido em 3 de dezembro de 1927 (DEAVILLE,
2015, p. 44-45).
A edição sonora era rara e as produções tinham como centralidade o exibicionismo
sonoro (ou, em outros termos, fetiche sonoro) que atraía grande quantidade de público. Segundo
James Deaville (2015, p. 46-52), o fim da década de 1920 e os primeiros anos da década de 1930
se viram tomados por três principais tipos de produção (que privilegiavam o exibicionismo sonoro):
talking celebrities (entrevistas e discurso de famosos); soundscapes (demolições, aglomerações,
esportes, eventos) e musical performance (apresentações musicais)3.
Contudo, apesar de existir um certo consenso acadêmico sobre a existência de um
cinema não ficcional silencioso e outro sonoro, sinto necessidade de aclarar aquilo que considero
o nascimento do documentário sonoro, que se consolidará como um nicho específico do domínio
não ficcional, diferenciável, por exemplo, dos cinejornais. E nesse sentido, prezo principalmente
pela confluência de duas concepções.
A primeira (e mais mencionada) é a que se liga ao formato de distribuição das obras:
tanto a parte sonora quanto a visual serem distribuídas como um único produto é um dado relevante
a se considerar quando pensamos o filme como unidade sonoro-visual, fechada e una.
3
Verificar acervo online “Moving image research collections” da University of South Carolina: <http://mirc.sc.edu/>.
21
Práticas deste tipo de distribuição dão seus primeiros passos num momento anterior
àquele atribuído como o começo do período sonoro: nas décadas de 1900 e 1910 já se registram
casos de cilindros sonoros, discos, partituras e indicações sonoras distribuídas com as imagens
fílmicas. Assim como já se registram as tentativas de sincronização mecânica entre projetor fílmico
e fonógrafos, gramofones e variantes e, também, as sincronizações artesanais (acompanhadores
musicais, sonoplastas, comentadores, dubladores) desde o começo do século XX4. Podemos citar,
por exemplo, no campo do não ficcional, as produções da Pathé Gazette, Hearst, Universal e Fox
na década de 1910, que eram usualmente acompanhadas por músicos residentes dos teatros de
exibição, com tratamento equiparável ao das produções ficcionais (ALTMAN, 2004, p. 382).
Contudo, a consolidação dos formatos comercialmente estáveis do filme sonoro-visual
tomaria corpo a partir dos anos 1920, junto com a solidificação do domínio documental no cinema,
num complexo de aperfeiçoamento da sincronização sonoro-visual em seu suporte fílmico e da
amplificação sonora, que confluem com um momento relevante de uma segunda concepção.
Esta segunda se liga àquilo que podemos entender, avant la lettre, como
desenvolvimento da dimensão autoral da composição, captação e edição do som fílmico, que
começaria a se estabelecer no domínio documental no final dos anos 1920.
Filmes representativos da história do documentário, como Nanook of the North (1922)
e Moana (1925) de Robert Flaherty, por exemplo, ainda não eram concebidos nem montados como
obra sonoro-visual.
Nanook teve uma partitura composta ainda em 1922 por William Axt (COOKE, 2008,
p. 267), que era músico contratado da Capitol Theatre, teatro no qual ocorreu o lançamento norte-
americano do filme. William Axt foi responsável por muitos acompanhamentos musicais nesse
teatro. Acompanhamentos estes que eram geralmente compostos sob um padrão, por compilação
e/ou por trechos originais de música, não contemplando a ideia da dimensão autoral do som fílmico.
Tanto é que o filme recebeu diversas sonorizações ao longo da história, não sendo uma obra fechada
em aspectos sonoros, com um projeto sonoro específico.
Algo semelhante ocorreu com Moana, que recebeu em seu lançamento música de
James C. Bradford (COOKE, 2008, p. 267), músico que compôs centenas de cue sheets ao longo
4
O Museu da Capitol Theatre ainda mantém muitas das partituras, indicações e orquestrações desses primeiros anos
do século XX.
22
da década de 1920 pela Cameo Service Music Corporation, que as distribuía pelos teatros de
exibição. Há também os casos semelhantes dos documentários Grass: a nation’s battle of life
(1925) e Chang: a drama of the wilderness (1927) produzidos por Ernest B. Schoedsack e Merian
C. Cooper5, que receberam em seus lançamentos música de Hugo Riesenfeld (COOKE, 2008, p.
267), outro músico que trabalhou para teatros de exibição, mais especificamente os da Broadway.
Ou seja, em linhas gerais, essas composições não advinham de um projeto fílmico sonoro, mas de
uma sonorização estipulada e executada por músicos contratados pelos teatros de exibição ou por
empresas distribuidoras de partituras, de forma desprendida dos processos de criação e produção
das imagens fílmicas, geradas por seus realizadores.
Enfim, o que aqui considero como dimensão autoral dos aspectos sonoros do filme no
domínio documental começa a se figurar, de forma representativa, em obras como Berlim: sinfonia
de uma metrópole (1927) de Walther Ruttmann e O homem com a câmera (1929) de Dziga Vertov.
Apesar de que as exibições desses filmes estiveram condicionadas a diferentes sonorizações (ou à
não sonorização) de cada sala de exibição, ambos os filmes contaram com preocupação e
planejamento efetivo de suas respectivas partes sonoras.
Berlim contou com a partitura minuciosa de Edmund Meisel, que trabalhou em
proximidade com Walther Ruttmann em seu processo de produção6. Já Vertov escreveu instruções
detalhadas para os sons (com divisões de planos, sequências e partes) de O homem com a câmera7.
Para além disso, a preocupação, tanto de Ruttmann quanto de Vertov, com os aspectos sonoros do
filme pode ser notada em seus artigos publicados ao longo das décadas de 1910 e 1920,
evidenciando-se a efetiva importância que o som alcançaria em suas obras8.
5
Ernest B. Schoedsack e Merian C. Cooper foram os realizadores do King Kong (1933), um dos marcos da
consolidação do formato da trilha sonora no cinema ficcional.
6
A partitura original sobrevivente de Edmund Meisel para Berlim, que é uma redução para piano, encontra-se no
Deutsche kinemathek – Museum für Film und Fernsehen. Orquestrações dela foram lançadas pela editora Ries & Erler,
de Berlim. Existe uma cópia no setor de partituras da biblioteca do Instituto de Artes da Universidade Estadual de
Campinas da versão orquestrada de Mark-Andreas Schlingensiepen (1987).
7
O script pode ser encontrado no artigo “Dziga Vertov’s Frozen Music: Cue Sheets and a Music Scenario for The
Man with the Movie Camera” de Yuri Tsivian (Griffithiana, n. 54, outubro de 1995, p. 92-121). Reproduzo no “Anexo
I” versão traduzida para o inglês.
8
A respeito de Walther Ruttmann, verificar os seguintes textos Malerei mit Zeit (1919), “Wie ich meinen Berlin-Film
drehte?” (1927), “Die absolute Mode” (1928), “Sound films? - !” (1929), “Die Symphonie der Welt” (1930). A
dedicação de Vertov sobre a temática do som no cinema pode ser verificada em seus textos presentes na coletânea
Artículos, proyectos y diarios de trabajo (1974).
23
Há que se mencionar também o filme Rien que les heures (1926) de Alberto Cavalcanti
com música composta por Yves de la Casinière, da qual não encontramos a partitura. Contudo,
conforme relata a historiadora de arte Marian Winter (1941, p. 150-151), ela está entre as
composições originais notáveis do período silencioso, a qual a historiadora ainda se refere como
“encantadora”. Em 1926, também temos o caso do documentário francês Un tour au large de Jean
Grémillon, que, além de dirigir, compôs uma música original para pianola, que foi sincronizada
com o projetor de imagens, sendo um dos diversos experimentos de sincronização entre imagem e
som da década de 1920. Segundo o crítico André Cœuroy (1927 apud WINTER, 1941, p. 150), a
música e as imagens não combinaram, e a experiência acabou por não ser bem-sucedida.
Esses exemplos contradizem, de certa forma, a afirmação de Bill Nichols em seu artigo
“Documentary and the coming of sound” (1995, p. 273) de que nenhum dos documentários
importantes dos anos 1920 citados por Jack C. Ellis e Lewis Jacobs9 fazem uso do som10.
De qualquer forma, esta dimensão autoral, na qual os sons estão inseridos em conjunto
com as imagens no processo criativo e de produção do filme, fortaleceria-se no domínio
documental a partir dos últimos anos da década de 1920 com os representativos filmes Melodia do
mundo (1929) de Ruttmann, Entusiamo (1930) de Vertov e Philips radio (Industrial Symphony)
(1931) de Joris Ivens, numa conjuntura em que o som óptico começava a se estabilizar nos
esquemas de distribuição fílmica, figurando agora o som no mesmo suporte físico que a imagem.
Isso, de certa forma, possibilitou um processo de uniformização dos formatos sonoro-visuais e o
nascimento de uma concepção, finalmente, de documentário sonoro, que abarcaria a noção do filme
sonoro-visual como objeto uno (tanto conceitualmente quanto materialmente) e a noção de uma
dimensão autoral da parte sonora, que partilha com as imagens o estatuto da arte fílmica desde seu
processo criativo e de produção, passando então, tal qual as imagens, pelos processos de captação
e edição por parte do grupo realizador, figurando, também, como uma constante nos créditos
originais dos filmes.
9
Nos livros de Lewis Jacobs (The documentary tradition, de 1979) e de Jack. C. Ellis (The documentary idea: a critical
history of English-language documentary film and video, de 1989), citados por Nichols, são elencados, por exemplo,
os seguintes filmes: Berlim: sinfonia de uma metrópole, The Bridge (1927) de Joris Ivens, Chang, Melodia do mundo,
Moana, O homem com a câmera, Grass, Rien que les heures e A sexta parte do mundo (1926) de Dziga Vertov.
10
“It is also noteworthy that not a single one of these films from the 1920s makes use of sound” (NICHOLS, (1995,
p. 273).
24
As sinfonias metropolitanas, entendidas no entrecruzamento de um cinema não
ficcional e de vanguarda, configuram-se como as primeiras obras de grande expressão da tradição
documentária a dedicarem esforço, por parte do grupo realizador, na concepção e execução da
trilha sonora. Esforço este que já podemos identificar nos ainda silenciosos Berlim: sinfonia de
uma metrópole e O homem com a câmera.
Nos primeiros anos do formato sonoro, as sinfonias Melodia do mundo, Entusiasmo e
Philips radio configuram-se como marcos representativos da efetiva prática sonora no domínio
documental.
Melodia do mundo, que teve a trilha musical composta por Wolfgang Zeller, lida com
uma confluência rítmica entre o visual e o musical (próxima à ideia de mickeymousing), além de
construir ambientes sonoros e sons referenciais a corpos específicos (como navio a vapor e ondas
do mar) a partir de instrumentos musicais, de usar a música como inflexão emotiva e de trabalhar
os ruídos criativamente, fazendo uso ainda, por mais que pouco, do diálogo sincronizado,
colocando em jogo as funções da trilha sonora que iriam permear a produção hollywoodiana
clássica dos anos 1930 – fazendo-se notar que o som não era mais mero acompanhamento, mas
sim um dos componentes fundamentais da construção fílmica. Com uma estrutura musical próxima
à de Melodia do mundo, podemos mencionar o filme The oil symphony (1933) de Boris
Pumpiansky, com trilha musical composta por Sergei Paniev, que é uma sinfonia metropolitana
raramente citada na literatura da área do cinema, mas que se coaduna às outras sinfonias em seu
formalismo estético. Num veio sonoro experimental, temos Entusiasmo, que contou com o trabalho
sonoro de Pjotr Shtro, com uma música composta por Nikolai Timofeev para o filme e com um
suposto trecho musical compilado da 3ª sinfonia (“O primeiro de maio”) de Dmitri Shostakovich11,
e que coloca em questão, precocemente, noções de montagem sonora, de menor unidade sonora,
de uso criativo dos ruídos e de coleta de sons em locação. O filme ainda despolariza o debate, então
em voga, sobre o futuro do som no cinema, que variava entre a defesa do som sincronizado e não
sincronizado: em Entusiasmo existe o uso equilibrado do som nos dois casos. Caso semelhante a
Entusiasmo é Philips radio, que contou com música de Lou Lichtveld e edição sonora (e visual)
de Helen van Dongen.
11
Em verdade, tal trecho gravado da sinfonia parece nunca ter sido escutado por ninguém após a primeira restauração
do filme. Existem trechos da gravação sonora que foram perdidos e supõe-se que tal trecho possa estar entre os
perdidos. Verificar “The ear against the eye: Vertov’s symphony” de Oksana Bulgakowa (2006, p. 234 e 239).
25
26
2 A presença e a tomada do som: sons-gravador e sons animados
Tomando por base as definições de imagem-câmera, imagem animada e circunstância

de tomada de Fernão Ramos (2008, p. 71-90; 2012), podemos, de forma didática, definir três tipos
gerais sob os quais o som se faz presente no cinema documentário – os quais iremos detalhar ao
longo do texto.
Dois deles, a tomada de locação e a tomada de estúdio, ocorrem somente com a
mediação do gravador, que registra o som de uma circunstância de mundo para que o espectador,
em outra circunstância de mundo, frua-o. A situação na qual a imagem e/ou o som de uma
circunstância de mundo deixa seu traço num suporte maquínico configura o que se pode chamar
de tomada; e as configurações, sejam éticas ou estilísticas (ou de outra categoria), nas quais esta
situação ocorre, determinam aspectos da circunstância de tomada na qual a imagem e o som
ocorrem para e pelo espectador. A este tipo de imagem e som, Ramos atribui a expressão imagem-
câmera, já que sua existência depende da mediação do suporte maquínico (a câmera). Dessa
expressão podemos extrair, por analogia, a expressão som-gravador12.
A diferença entre os sons-gravador da tomada de locação e da tomada de estúdio é
determinada, sobretudo, pelo local e circunstância na qual a tomada do som é realizada.
Ao som coletado em locação, podemos atribuir, tomando por base o conceito de
encenação13 trabalhado por Fernão Ramos (2008, p. 39-48), a ideia de homogeneidade entre a
12
Entendemos aqui o “gravador” como um objeto maquínico genérico pelo qual a materialidade sonora do mundo é
captada e registrada.
13
“A encenação é um procedimento antigo e corriqueiro em tomadas de filmes documentários” (RAMOS, 2008, p.
40). Ramos (2008, p. 40-48), para efeito de exposição, distingue três principais tipos de encenação: a) encenação-
construída: “é inteiramente construída, com utilização de estúdios e, geralmente, atores não-profissonais. A
circunstância da tomada está completamente separada (espacial e temporalmente) da circunstância do mundo cotidiano
que circunda a tomada. A relação entre espaço-dentro-de-campo e espaço-fora-de-campo é de heterogeneidade
radical”; b) encenação-locação: “feita em locação, no local onde o sujeito-da-câmera sustenta a tomada. O diretor, ou
o sujeito-da-câmera, pede explicitamente ao sujeito filmado que encene. Em outras palavras, que desenvolva ações
com a finalidade prática de figurar para a câmera um ato previamente explicitado. A encenação-locação distingue-se
da encenação-construída pelo fato de a tomada ser realizada na circunstância de mundo onde o sujeito que é filmado
vive a vida. A decalagem espacial entre espaço in/off é mais situada em sua homogeneidade [...]”; c) encenação-atitude
(encen-ação): “a encenação-atitude não existe, por isso podemos chamá-la de encen-ação: trata-se de um
comportamento cotidiano, flexionado em expressões e atitudes pela presença da câmera. Diferentemente, as
encenações construídas e locação envolvem procedimentos que isolam por completo a ação do sujeito na tomada de
seu transcorrer cotidiano. Tais encenações são modos de agir que afunilam a alteridade que se oferece ao sujeito-da-
câmera, retorcendo-o para o leque do outrem espectatorial: jogam assim à circunstância da tomada no funil da
circunstância da fruição”.
27
circunstância de tomada (ou espaço fílmico, no qual o som é captado) e a circunstância do mundo
cotidiano que a circunda (ou espaço fora-de-campo, que está no entorno do lugar no qual o som foi
captado).
Em relação ao som coletado em estúdio, podemos atribuir a ideia de heterogeneidade
entre estes dois campos, já que “a circunstância de tomada está completamente separada (espacial
e temporalmente) da circunstância do mundo cotidiano que circunda a tomada” (RAMOS, 2008,
p. 40).
Contudo, a tomada sonora em locação não ocorre sempre na mesma circunstância
temporal e espacial da tomada visual, que se unem em imagem e som para o espectador. Ou seja,
a tomada sonora em locação não se restringe a uma homogeneidade com a tomada visual – cabe
ressaltar que “som direto” não significa “som direto sincronizado (com a imagem)”: existem sons
coletados sem captação de imagem (sendo o som e a imagem ancorados um ao outro apenas na
pós-produção) e sons e imagens que são captados na mesma circunstância, nascendo ambos num
mesmo presente. Da mesma forma, não podemos afirmar que a tomada sonora de estúdio se firme
sempre numa heterogeneidade com sua respectiva imagem. Ou seja, existe tanto o som de estúdio
que se ancora numa imagem de locação – numa diferente temporalidade e espacialidade – quanto
o que se ancora numa imagem de estúdio, sejam eles (os sons e as imagens) feitas ou não numa
mesma circunstância temporal e/ou espacial de tomada.
A outra forma do som se fazer presente no documentário se aproxima daquilo que
Ramos (2008, p. 72) entende como imagem animada:
No caso da imagem animada, a relação com a circunstância da tomada muitas
vezes está ausente. A imagem de animação pode ser inteiramente construída em
computador, ou ser conformada através de procedimentos diversos de animação
do movimento, ou ainda distorcendo, com recursos digitais ou não, a forma
reflexo-perspectiva original da imagem-câmera obtida da circunstância da
tomada.
Da mesma forma que a imagem animada, existem sons que podemos chamar, por analogia, de som
animado. O artigo “Sinthetic sound”, publicado em 1933 no periódico Sight and Sound por Paul
Popper, ilustra bem essa ideia. Nele é discutido um método de produção sonora que não depende
da existência material do som: os sons são desenhados e pintados diretamente na película e
reproduzidos pelos leitores de sound-on-film, como usualmente se fazia com os sons gravados. Há
o interessante relato neste artigo de que em 1931 um inglês chamado E. A. Humphries conseguiu,
por esse método, fazer soar a frase “all of a tremble”, criando, precocemente, o que poderíamos
28
chamar de voz animada. No artigo é citado o desenho animado Pitch und Patch, que possui diálogo
e música, mas que não contou com a voz de atores nem com instrumentos musicais. É ainda
discutido no artigo a possibilidade de se criar uma sound-wave typewriter (máquina de escrever
ondas sonoras), que seria capaz, além de reproduzir timbres conhecidos, de criar novos e
inesperados sons, o que poderia ser associado aos princípios de um sintetizador sonoro, que
começaria a tomar forma comercial apenas três décadas mais tarde (Figura 2).
Figura 2 – Representação gráfica de sons
Fonte: Popper (1933, p. 84).
Podemos citar também o caso do músico Arseny Avraamov, responsável pela parte
sonora do documentário The plan of the great Works (1930) de Abram Room (dado como perdido),
que também se aventurou pelo som animado, sendo um de seus percursores (Figura 3).
Cabe, contudo, pontuar que, se entendermos toda e qualquer mixagem e edição como
distorção do som original obtido da circunstância de tomada, entramos num labirinto teórico no
qual temos que encarar grande parte dos sons cinematográficos como som animado ou como sons
flexionados pelo som animado, já que grande parte dos sons cinematográficos, desde os primeiros
anos do cinema sonoro, são remodelados na pós-produção. Desta forma, prefiro chamar de som
animado apenas aqueles sons que tiveram sua origem na ausência do gravador de som, não levando
29
em conta as distorções; sem negar, contudo, a possibilidade de coexistência de sons-gravador e
sons animados, que podem acabar gerando uma distorção perceptiva do som-gravador.
Figura 3 – Representação gráfica de sons de Arseny Avraamov
Fonte: Smirnov (2013, p. 179).
30
3 As vozes no documentário
Não nos dedicaremos às vozes que se caracterizam como sons animados, já que nos
filmes que nos serviram de fonte esse tipo de voz se ausenta. Dentro de cada uma das rotulações
anteriormente feitas, existem variedades da voz que podem ser entendidas sob dois âmbitos gerais
e que serão de grande valia para a discussão do documentário clássico: a voz invisível e a voz visível.
Sem deixar para trás a voz invisível e visível, mais adiante, utilizaremos as ideias de voz fabuladora
e voz do mundo para discutir o documentário moderno.
3.1 As vozes no documentário clássico: para além da “voz de Deus”
3.1.1 Por que “voz invisível”? Por uma fenomenologia da voz que não vemos
A presença do som nos primeiros anos do cinema sonoro – em seu formato sonoro-
visual comercialmente estável, a partir do final dos anos 1920 – foi alvo de debate numa vasta
quantidade de escritos. Neles, um dos temas centrais foi a voz e os limites que sua presença impôs
à articulação das imagens nas etapas de pré-produção, tomada e montagem fílmica. No horizonte
destas discussões estavam sobretudo os talking films e a presença da voz em formato de diálogo.
Desde textos clássicos da literatura cinematográfica até textos mais recentes – como “The art of
sound” de René Clair (1985 [1929]), “Manifesto: dialogue on sound” de Basil Wright e Vivian
Braun (1985 [1934]), “A new Laocoön: artistic composites and the talking films” de Rudolf
Arnheim (1985 [1938]), “Sound in films” de Alberto Cavalcanti (1985 [1939]), “Dialogue and
sound” de Siegfried Kracauer (1985 [1960]), “Technology and aesthetics of film sound” de John
Belton (1985), “The evolution of sound technology” de Rick Altman (1985) e “The voice in the
Cinema: the articulation of body and space” de Mary Ann Doane (1985) –, é notável como essa
temática assume um lugar especial na construção da teoria fílmica e no debate sobre a essência
cinematográfica.
Contudo, num outro horizonte de referência fílmica – nas produções do domínio
documental –, podemos notar que a voz desempenha, nesses primeiros anos de cinema sonoro, um
31
papel mais libertador que limitante da articulação das imagens, ou, ao menos, as imposições e os
limites impostos impulsionaram o desenvolvimento de diferentes estratégias do uso da voz.
Ao falarmos de documentário clássico, numa tentativa de pensá-los em termos
estilísticos e éticos, dificilmente conseguimos fugir das expressões “voz over” e “voz de Deus”.
Isso porque elas estão na base de valiosas ideias seminais da teoria do cinema documentário que
caracterizam o documentário clássico dos anos 1930 e 1940 como educativo, propagandístico,
persuasivo ou expositivo.
Pela força que essas expressões ganharam na teoria do cinema documentário, sobretudo
em sua menção ao período clássico, somos impelidos a acreditar que as vozes do documentário
clássico, em sua perspectiva semântica e expressiva, lidam com uma rigidez que se preocupa
apenas com o ensinamento e a transmissão de conhecimento a partir de uma pretensão – com
respaldo ético em sua contemporaneidade – de irrefutabilidade e de convencimento.
Essa perspectiva não está equivocada: em muitos dos cânones que fizeram parte de
análises fundadoras das teorias do cinema documentário – como alguns dos documentários
britânicos e norte-americanos –, tais características são perceptíveis e dominantes. O problema
ocorre quando essa perspectiva se torna um estigma que nos impede de ver as nuances, inovações
e usos criativos das vozes no documentarismo clássico, inibindo-nos, muitas vezes, de voltarmos
nossa atenção a ele, considerando-o teoricamente e historiograficamente superado.
Enfim, existem alguns estigmas decorrentes do uso quase exclusivo dessas expressões-
chave – “voz over” e “voz de Deus” – nas considerações teóricas e históricas a respeito das
características da voz no documentário clássico que se reproduzem um tanto quanto
inconscientemente.
A expressão “voz over” designa usualmente à voz um lugar que é ao mesmo tempo
espacial e hierárquico. No que concerne ao espaço, está implícita a ideia de que a “voz over” se
localiza num espaço desconhecido, que não é o das imagens, ou melhor, num não lugar, livre de
uma materialidade espacial, que a exime de uma possível circunstância de tomada sonora. No
tocante ao hierárquico, fica implícita a ideia de superioridade coerciva em relação aos outros
elementos da articulação fílmica, sejam eles sonoros ou visuais, estando metaforicamente acima14.
E essa é uma das maneiras recorrentes de pensar a voz do documentário clássico.
14
Para um debate mais aprofundado da usual acepção de voz over, conferir artigo de Charles Wolfe “Historicising the
32
Quanto mais “acima” está – ou seja, quanto mais próxima de uma ideia de inexistência
de circunstância de tomada e quanto mais elevada for sua capacidade coerciva ante os outros
elementos fílmicos –, mais a voz se aproxima da “voz de Deus”.
No tocante à voz do documentário clássico, “voz over” e “voz de Deus” são comumente
tomadas como sinônimos, embora a expressão “voz de Deus”, que, em verdade, é um caso
específico de “voz over”, ligue-se mais diretamente à ideia de onipresença, onipotência e
onisciência da voz em sua assertividade, que se encaixa na ideia de documentário educativo,
propagandístico, persuasivo e expositivo, sendo esse o prisma dominante sob o qual entendemos a
voz do documentário clássico.
Mas se essas características são verificadas vastamente na fortuna crítica, qual seria o
problema?
Fazendo coro ao pesquisador Charles Wolfe (1997, p. 149), se a noção de “voz de
Deus” – aceita, rejeitada, defletida ou dispersada – desempenhou papel fundamental na construção
e na escrita da teoria e história do documentário, ela também pode mascarar outros elementos
sonoros que são intrigantes e instrutivos. Intrigantes e instrutivos porque nos contam algo sobre
diferenças conceituais da estilística e ética documental e nos ajudam a desvendar um campo de
referências históricas cruzadas no qual o espectador moderno pode se perder.
Quando comecei a me dedicar ao estudo do som no documentário clássico notei que a
quantidade de filmes canônicos que fogem desses estigmas é surpreendentemente grande. E tornou-
se nítido que as referidas expressões superestimam tanto o poder quanto a uniformidade do uso da
voz no documentário clássico. Como uma primeira solução para a incursão nessa temática decidi
evitar, quase como um exercício, o uso das expressões “voz over” e “voz de Deus” para os casos
em que há a presença de uma voz cujo corpo não se vê (e que, tampouco, se caracteriza como “voz
off[screen]”)15.
E, com o decorrer das análises, pareceu-me mais conveniente chamá-la de “voz
invisível” por dois principais motivos.
‘Voice of God’: the place of vocal narration in classical documentary” (1997).

15
Não se caracteriza como voz off porque essa categoria pressupõe uma presença homogênea com o campo do filmado
(mesmo que construída numa pós-produção). No documentário clássico e na tradição documentária como um todo, a
voz que não vemos ao longo do filme se funda, usualmente, numa heteregoneidade espacial e temporal em relação à
tomada visual (ou ao menos numa construção que não deixa traços de homogeneidade).
33
O primeiro deles foi a possibilidade de tirar da expressão que a determina a conotação
de não lugar: não se vê o corpo que a emite, mas seu espaço de emissão, por mais que invisível,
existe e pode ser analisado segundo sua materialidade e sob a ideia de uma circunstância de tomada
sonora, ou, ao menos, como um som que advém de um presente diferente daquele da tomada visual,
cujo ambiente proporciona, por exemplo, outro tipo de intensidade à imagem e ao som16.
O segundo motivo foi tirar a conotação de superioridade e de capacidade coerciva em
relação aos outros elementos fílmicos e de articulação fílmica, em especial os visuais, carregada
pelas expressões “over” e “Deus”, evitando, de certa forma, a caracterização geral que Bill Nichols
(1983, p. 17), e um certo consenso acadêmico, coloca em jogo quando o assunto é o documentário
clássico, de tradição griersoniana:
O estilo de discurso direto da tradição griersoniana (ou, na sua mais excessiva
forma, a voz de Deus de The march of time) foi a primeira forma acabada de
documentário. Como convém a uma escola cujos propósitos foram
esmagadoramente didáticos, empregava uma voz fora-de-campo supostamente
autorizada, contudo, frequentemente presunçosa. Em muitos casos essa narração
dominava efetivamente os elementos visuais, embora pudesse ser, em filmes
como Night mail ou Listen to Britain, poética e evocativa.
Considerações nesse trilho, apesar de exageradas17, são recorrentes no pensamento sobre voz no
documentário clássico (tanto em debates, como artigos, conferências, palestras, cursos etc.), tal
como se pode notar em textos referenciais como o de Consuelo Lins (2006):
Desde que o documentário tornou-se falado no final dos anos 20, desde que as
imagens tornaram-se meras ilustrações de um comentário, que a voz que narra é
uma voz masculina, desencarnada, “voz de Deus”, que tudo vê e tudo sabe18.
16
A ideia de se ter uma voz cujo corpo não se vê, mas que, ao mesmo tempo, se faz presente em algum lugar é
trabalhada por Michel Chion (1994, 1999) pelo conceito acousmêtre, uma junção de être (ser) com acousmatique (som
invisível, ou aquilo que escutamos e não vemos/sabemos a fonte), que poderia ser pensado como um corpo que tem
uma presença sonora (vocal) invisível. Contudo, o conceito de Chion se restringe a tipos específicos do cinema
ficcional, como a voz de Mabuse em O testamento do Dr. Mabuse (1933), a voz do mágico no Mágico de Oz (1939),
a voz da “mãe” em Psicose (1960), a voz do computador Hal em 2001: uma odisséia no espaço (1968). Para Chion
(1999, p. 224), a voz do comentador é de outra categoria, ela ocupa uma estância fílmica removida, ela, diferente da
voz acousmêtre, não “tem um pé na imagem, no espaço do filme”, ela não “visita”, diferente da voz acousmêtre, “as
fronteiras, que não são nem o interior do espaço fílmico nem o proscênio – um lugar que não tem nome, mas que o
cinema sempre põe em jogo”. Para Chion, a voz da narração é entendida como aquela que fala como um observador.
17
Em relação a Listen to Britain, ao qual Nichols se refere na citação, é, inclusive, complicado afirmar a presença de
narração. No começo do filme vemos e ouvimos a pessoa que nos introduz ao filme, e, ao longo do filme, as vozes que
se aproximariam de uma ideia de narração são associáveis a ou identificáveis como trechos de transmissão de
programas de rádio.
18
Com exceção à questão da voz masculina, que, de fato, é a que se faz presente e que, portanto, não se configura
como exagero.
34
E o que está em jogo nesses pontos é arrancar do fosso do não diegético essa voz que
não se vê e trazer à tona sua presença num lugar que não é apenas aquele das ferramentas de
articulação fílmica. É dar uma dimensão espacial e temporal mundana, uma materialidade física
que ocorre no espaço-tempo, encarná-la, evidenciar que nem tudo sabe e nem tudo vê.
Dessa mudança de perspectiva, o estudo que não apenas semântico da voz – ou seja,
seu estudo recitativo e tímbrico, de circunstância de tomada, de montagem, de meios e modos de
produção etc. – e o estudo das diversas possibilidades de relação da voz com a imagem – e não
apenas aquela que entende a voz como determinadora das significações da imagem ou como
articuladora fílmica – tornam-se mais palpáveis.
Em Noite e neblina (1955) de Alain Resnais, por exemplo, a heterogeneidade espaço-
temporal entre a tomada da voz invisível e das imagens de arquivo é flagrante. A dimensão da
história e da memória que vemos emergir da imagem e do som só são possíveis devido à diferença
de circunstância de tomada que lhes são implícitas. O cruzamento de uma voz que fala de um
passado com a carga de quem o conhece (com traços de uma escrita historiográfica) com a voz que
no presente não muito distante daquelas imagens de arquivo fala de um passado (com a carga da
memória que salta no presente) só é possível porque a diferença temporal da circunstância de
tomada do som e da imagem não é tão grande e nem tão pequena (entre uma e duas décadas,
aproximadamente)19. Ou melhor, aquela voz é fruto de uma década de digestão, não apenas
individual, mas também coletiva, de acontecimentos do passado. A isso se adiciona o fato de o
escritor da voz invisível ser o poeta Jean Cayrol, que foi prisioneiro de campo de concentração
nazista (tema central do filme). E essa informação é valiosa para entender a voz e seu lugar de fala
no filme tanto no que concerne ao estilo de escrita, que é oralizada, quanto à ética da produção do
filme.
A diferença espacial também não é menos importante. A voz que não se altera muito
ao longo do filme, naquilo que concerne à tessitura e timbre, nos traz uma carga contemplativa que
é própria daquela que contém uma diferença brutal em relação à intensidade e ao risco do presente
da circunstância de tomada das imagens que chegam ao espectador. Ou seja, o choque entre uma
voz cuja tomada é feita na segurança do estúdio e uma imagem que é tomada em locação em uma
19
Mesmo quando as imagens não são de arquivo, elas são, sobretudo, de ruínas, repletas de rastros, restos, escombros
etc., jogando-nos sempre a um passado imaginável, mais do que a um presente possível.
35
dimensão inefável só é possível devido à heterogeneidade de circunstância de tomada entre som e
imagem.
Na série de documentários Why we fight (1942-1945), as imagens do inefável também
chegam ao espectador, mas a diferença temporal entre tomada visual e tomada sonora não é
suficiente para que uma carga, nas proporções de Noite e neblina, de história e memória, ou
contemplativa, se sobressaia. A diferença temporal entre imagem e som é, em boa parte do tempo,
de um, dois ou três anos (apesar de contar com imagens de arquivo dos anos 1930, por exemplo).
Fala-se de e mostra-se uma guerra ainda em curso. A característica da voz que nos salta é a daquela
que se adere ao presente, ou melhor, que tem o potencial de mudar o futuro. Ela toma partido não
sobre um passado (apesar de falar de acontecimentos de um passado recente), mas sobre um futuro
que pode ser flexionado pelas ações de um presente, que se não é o mesmo da voz, é muito próximo
dele. Ao tratar do Holocausto, Noite e neblina não consegue mudar o curso daquilo que foi, apenas
consegue construir uma perspectiva daquilo que foi, potencialmente mudando o presente daquele
que assiste ao filme, que está numa temporalidade outra. Why we fight, ao tratar da Segunda Guerra,
pode potencialmente mudar o seu curso, pois a voz emerge de um presente compartilhado, um
presente cujo tema, imagem e som compartilham.
Se pensarmos, sem muitos detalhes, no triplo presente trabalhado por Paul Ricoeur
(2010) em Tempo e narrativa (presente preterita, presente praesentia e presente futura) notaremos
que em Noite e neblina, a narrativa, em especial a voz, infla-se de um presente preterita, uma voz
presente que fala e age por um passado, que já é memória, ou resgate de memória, devido às
imagens de um presente anterior (ou que a ele remetem) – ela é diminuída de expectativa e
carregada de memória; já em Why we fight, a narrativa e sua voz inflam-se mais de presente futura,
elas aderem ao presente com uma carga de expectativa e previsão em relação ao futuro, que não se
esgota porque seu tempo não acabou, ou seja, a expectativa ainda não se tornou memória, a guerra
ainda não acabou. Nesse sentido, torna-se plausível considerar que a narrativa só se torna inteligível
quando pensada segundo sua mediação entre diferentes momentos, ou seja, quando consideramos
que ela possui um lugar e tempo de partida e um outro lugar e tempo de chegada no mundo.
Ao pensar em “voz de Deus” nesses casos, essa ideia de temporalidade nos é roubada.
A voz de um Deus, tal como seu nascimento, vem do eterno. O tempo é mundano. Deus é eterno
porque não se adere ao tempo; ele é universal, onipresente, onipotente e onisciente por esse motivo.
36
A voz de Deus é o verbo, sem corpo, a voz do documentário é humana e sua dimensão temporal é
essencial para entender a narrativa.
As implicações dessa perspectiva não excluem a existência da “voz over” e da “voz de
Deus”; pelo contrário, comportam-nas e abrem uma gama maior de possibilidades na análise, que
nos livra da inevitabilidade de considerar tudo aquilo que foge dos limites dessas duas expressões
como experimentações isoladas, que pouco teriam a ver com o suposto verdadeiro documentário
clássico. Há ponderação entre o verbum e a vox, ou seja, existem vozes que se aproximam mais de
Deus, da eternidade, tal como existem vozes que se aproximam mais do humano, mundano, de sua
temporalidade. A universalização, característica de uma voz poética, afasta-se da particularização
de uma crônica, por exemplo. Uma tende ao eterno, por tratar de essências, e outra ao tempo
(mundano), por tratar de acontecimentos efetivos localizados no passar do tempo. Contudo, ao se
tratar de documentário, não se pode perder de vista que as universalizações “não são ideias
platônicas. São universais parentes da sabedoria prática, portanto da ética e da política”
(RICOEUR, 2010, p. 74).
Cabe também lembrar que nos anos 1930 não se usava a expressão “voz over” e que
“voz de Deus” foi raramente utilizada para fazer referência ao tipo de voz que aqui discutimos20.
Entre os realizadores do documentário britânico e norte-americano, por exemplo, as duas
expressões mais comuns eram narration e commentary, como se pode verificar vastamente nos
créditos dos filmes, que dividiam nos escritos espaço com expressões como canned monolog,
running monolog, running comment, running commentary, descriptive talks, off-stage lecture e off-
screen interlocutor, off-screen narration, off-stage voice21. Nenhuma delas continha em seu sentido
o fardo da voz de autoridade, de supremacia, de Deus.
20
Em nossas fontes dos anos 1930, encontramos três textos que usam a expressão “voz de Deus” ao falar de cinema.
No artigo “Propaganda: a problem for educational theory and cinema” de John Grierson (Sight and Sound, v. 2, n. 8,
winter, 1933/1934, p. 120), a expressão é utilizada no sentido do provérbio “Vox Populi, vox Dei” (A voz do povo é a
voz de Deus): “he is, indeed, bound in one sense or another, to the doctrine of democracy, and the proposition that the
voice of the people may, under his proper guidance, become the voice of God”. No artigo “Introduction to a new art”
de John Grierson (1934b, p. 104), a expressão “voz de Deus” é usada numa acepção próxima à nossa: “Notice how a
commentator - a voice of God in the last instance - may be used effectively even in a story film”. No livro Documentary
film de Paul Rotha (1939, p. 209), originalmente lançado em 1936, a expressão “voz de Deus” é usada em contexto
pejorativo: “There is room, also, for experiment in relating more intimately the voice with the screen, perhaps to be
achieved with less formality and more spontaneity, so that the speaker becomes a part of the film rather than the
detached ‘Voice of God’ which seems so dear to some producers of documentary”.
21
Verificar, por exemplo, as críticas fílmicas “The break up” (Variety, 6 ago. 1930, p. 35), “Explorers of the world”
(Variety, 22 dez. 1931, p. 19), “Bring’en back alive” (Variety, 21 jun. 1932, p. 14), “Igloo” (Variety, 26 jul. 1932, p.
17), “Taming the jungle” (Variety, 6 jun. 1933, p. 14), “Hell’s holiday” de Frank S. Nugent (New York Times, 15 jul.
37
Inclusive, era recorrente a crítica negativa às vozes que “falavam muito”, em tons
acadêmicos e professorais, nas resenhas de documentários nos periódicos britânicos Sight and
Sound, Cinema Quarterly e World Film News and Television Progress nos anos 1930. Essa crítica
era recorrente porque, de fato, existiam vastos exemplos em que a “voz de Deus”, mesmo não
sendo assim referida, fazia-se presente. Contudo, ao pesquisar a que filmes os textos desses
periódicos dirigiam suas ressalvas, notamos que eram, sobretudo, cinejornais e filmes produzidos
especificamente para a exibição em escolas, figurando fora da dimensão autoral do documentário
sobre a qual o esforço acadêmico se debruça e sobre a qual se fundamenta o grosso da produção
historiográfica e teórica do documentário. Concomitantemente, os filmes que hoje são canônicos
para a teoria do cinema documentário eram, nesses periódicos, criticados positivamente pelo
afastamento que muitas das vezes mantinham dessa ideia de “voz de Deus”.
E o que, de forma geral, era levantado nos textos desses periódicos dos anos 1930 no
que diz respeito à voz?
O mais recorrente era a crítica aos comentários excessivos, em tons professorais,
distantes das imagens. No texto “And now Rawtenstall” da Sight and Sound (1936-7, p. 155), por
exemplo, o autor anônimo escreve que “pouco esforço foi ainda feito para produzir filmes
educativos nos quais o som emerge como concomitante natural das imagens visuais” e lamenta,
escrevendo que “o método bruto de adicionar comentário a uma série de imagens ainda persiste”.
Na crítica “The face of Britain” presente na Sight and Sound (1935, p. 127), o autor anônimo chega
a dizer que “comentário é sempre um problema” a ser resolvido. Na crítica “Industrial Britain”
presente na Sight and Sound (1934, p. 145), o autor anônimo afirma que “ele [Industrial Britain] é
somente estragado pelo comentário, que explica muito e é falado numa voz acadêmica que está
fora de sintonia com as realidades da imagem” (INDUSTRIAL..., 1934, p. 145). Mesmo se tratando
de um cânone, Industrail Britain não pode ser considerado, segundo John Grierson (1934a, p. 215),
sob nenhum ponto de vista, algo representativo em relação à arte e à prática sonora, sendo esse
filme um exemplo típico no qual podemos encontrar a “voz de Deus” e no qual a teoria consolidada
encontra respaldo.
1933, p. 14), “Hei Tiki” (Variety, 5 fev. 1935, p. 31), “Land of promise” de Bige (Variety, 27 nov. 1935, p. 30), ou
ainda os volumes dos anos 1930 do periódico Sight and Sound.
38
Thomas Bird e William Farr, no texto “The world we live in” da Sight and Sound (1937,
p. 146), inferem que o caráter persuasivo dos filmes não é alcançado necessariamente pelas
informações que emergem do filme: enquanto informativo, parte dos documentários britânicos não
necessariamente arremessam informações às nossas cabeças e, por esse motivo, concluem os
autores, eles são persuasivos e também mais poéticos que científicos e dificilmente estatísticos. No
mesmo texto, os autores ainda escrevem:
[...] o comentário na maioria dos casos [da produção não ficcional norte-
americana] tentou carregar todo o tema e a imagem foi deixada como ilustrativa,
com planos de cinejornais e cortes de outros filmes. O próximo passo é,
obviamente, que se faça com que as imagens carreguem algo do tema e a maior
parte das ações. Uma realização nesse sentido foi aparente em The plow that broke
the plains [...] (BIRD; FARR, 1937, p. 146).
No texto “Producing an educational film” de Woolfe Bruce na Sight and Sound (1933,
p. 106-109), o autor deixa evidente que mesmo nos filmes produzidos com fins pedagógicos para
escolas, o uso do comentário não era unanimidade no que diz respeito à eficácia educativa e que,
na maioria dos casos, depois das imagens já editadas é que se avaliava a possibilidade de incluir
comentário. O questionamento do comentário como ferramenta educativa se faz presente em outros
tantos textos, como em “Films for school” de autor anônimo da Sight and Sound (1936, p. 98-99)
e “Sound or silent film in teaching” de C. Ford e J. Fairgrieve da Sight and sound (1935, p. 26-30).
Ao passo que a crítica negativa ia por esse caminho, afloravam abundantemente os
elogios aos filmes que empregavam estratégias diversas do uso da voz. No artigo “Camera on
nature” da World Film News and Television Progress (1938, p. 125), o autor anônimo, ao falar dos
êxitos da série Secrets of Nature (1922-1933), cita o uso inovador, por exemplo, do alongamento e
do encurtamento silábico da emissão vocal do comentador, que imprimia nos filmes perspectivas
rítmicas diversas. Ao se referir a um episódio específico da série, Plants of the underworld (1930),
o autor se refere positivamente ao esforço dos realizadores em empregarem “versos brancos”,
especialmente escritos para o filme. Charles Davy (1935, p. 110) na resenha “The Song of Ceylon”
da Cinema Quarterly, refere-se ao comentário de Song of Ceylon (1934) como “uma brilhante
ideia” e ressalta o interessante uso do texto de Robert Knox de 1680 como comentário, proferido
num tom arcaico por Lionel Wendt, que “se encaixa exatamente na atmosfera do filme”, delegando
à voz, mais que um caráter informativo, um elemento de construção de percepções.
39
Outro aspecto interessante de se notar nesses periódicos é que a ideia do comentário
ser proferido por aqueles que eram filmados era bem vista pela crítica e incentivada. Grierson
(1934a, p. 216), no artigo “The G.P.O. gets sound” da Cinema Quarterly, diz que
[...] quando estamos mostrando um trabalhador em seu trabalho, nós devemos
pegar o trabalhador para fazer, então, seu próprio comentário, com idioma e
sotaque completo. Isso traz intimidade e autenticidade e nada do que fizéssemos
seria tão bom.
Exemplo disto são os filmes Cable Ship (1933) e Under the city (1934). Aspecto que é exaltado
também por J. B. Holmes em seu texto “G.P.O. films” na Sight and Sound (1937, p. 159).
Outro tema bastante citado nesses periódicos, quando se falava de comentário, é a
poesia. Representativamente, Winifred Holmes (1936, p. 9), no texto “The new Renaissance”
presente na Sight and Sound, diz: “Existe um outro ramo da literatura que pode não apenas
encontrar um frescor de saída nos filmes, mas pode também modificá-los e influenciá-los. E é a
poesia”. Grierson (1934a, p. 221) compartilha com Holmes essa perspectiva quando fala, por
exemplo, que a poesia nos filmes podia trazer novos elementos ao “arranjar alguma história
essencial sobre os murmúrios das janelas, balcões de bares e transeuntes”. Alguns cânones, por
exemplo, que lançam mão desse recurso são Coal Face (1935), Night Mail (1936) e The River
(1937).
Outro recurso, para além do comentário, recorrentemente elogiado no que concerne à
voz, é aquele chamado de “voz desencorpada” (disembodied voice). Trata-se de um recurso em que
a voz que ouvimos, apesar de não ser comentário, não tem um referente visual imediato em
sincronia, mas que pode ser associado àqueles que vemos nas imagens. Arthur Vesselo (1936, p.
28-29) na crítica “Night Mail” da Sight and Sound, Charles Davy (1935, p. 110) na resenha “The
Song of Ceylon” da Cinema Quarterly e o texto “B.B.C.: The voice of Britain” da Sight and Sound
(1935, p. 125), por exemplo, usam essa expressão ao se referirem a opções interessantes do uso da
voz.
Outras expressões interessantes que permearam as páginas dos já citados periódicos
são “monólogo”, “comentário humorístico” e “coro” – recursos que vão permear as produções
canônicas do documentário clássico.
Enfim, o que podemos afirmar com esses exemplos não é que o documentário clássico
passa longe de ser educativo, propagandístico, persuasivo ou expositivo ou que a “voz de Deus” é
uma invenção teórica descabida, mas sim que, com o que já temos de filmes restaurados e com o
40
acesso a documentos da época, é possível se cogitar que a generalização no tocante à “voz de Deus”
já não suporta a variada gama de recursos e estratégias empregadas no documentário clássico.
Informações importantes para o entendimento da história do documentário podem aí estar
escondidas, sobretudo quando lidamos com aquele documentário de porte mais autoral, que é foco
nesse texto.
E aqui levanto dois sucintos pontos em tom de exemplo.
Primeiro ponto: a preocupação em dar a voz ao filmado, por mais que em vias distintas
daquelas que vemos no documentário moderno, já pode ser notada nesses escritos produzidos por
pessoas envolvidas na produção documental dos anos 1930. Por mais que do ponto de vista
quantitativo não seja tão relevante, podemos notar essa preocupação, para além dos já citados
textos, em documentários como Cable Ship e Under the city – e também no documentário Shipyard
(1935), que contou inicialmente com o comentário de um trabalhador local, relacionado com a
temática do filme, mas que, contudo, a produtora do filme, Gaumont British Instructional,
substituiu o comentário falado pelo trabalhador por um comentário falado por E. V. H. Emmett,
comentador profissional da Gaumont British News (THOMPSON, 1935; STOLLERY, 2013). Isso
implica que o “dar a voz ao filmado” não surge apenas com a chegada do documentário moderno;
e por mais que se considere que só chegue de fato com ele, há que se revisitar o documentário
clássico para saber sob que condições distintas esse diferente “dar a voz ao filmado” emerge.
Segundo ponto: será que o comentário, no estilo da “voz de Deus”, foi um caminho
sem pedras assumido na produção documental dos anos 1930? A “voz de Deus” se encaixou e se
naturalizou sem problemas nas preocupações educativas, propagandísticas, persuasivas e
expositivas do documentário clássico? Nas páginas dos periódicos citados e em muitos exemplos
fílmicos parece que não.
A pesquisadora Stella Bruzzi (2000, p. 40) pergunta-se “como e por que a narração
documentária adiquiriu sua mísera reputação”, enquanto Jamie Sexton (2015, p. 160) diz que “o
ato de evitar a narração em voz over é fruto de uma duradoura hostilidade em direção a essa técnica
por parte de críticos, realizadores e teóricos”. Bruzzi (2000, p. 41) nota que a voz over é encarada
como o “mal desnecessário do documentário” e afirma, talvez com um pouco de exagero, que
muito da culpa dessa visão negativa vem de Robert Drew e Bill Nichols:
Robert Drew, pioneiro do cinema direto, num artigo combativamente intitulado
“A narração pode ser uma assassina” [“Narration can be a killer”], alega que
41
apenas os documentários que evitam narração como um dispositivo de
estruturação podem “funcionar, ou estar começando a funcionar, ou poderiam
funcionar, nos princípios dramáticos/fílmicos”, que apenas os filmes que contam
uma história diretamente (sem voz over) podem “elevar-se” ao campo utópico do
“Além da razão. Além da explicação. Além das palavras”. Drew dogmaticamente
conclui, “palavras fornecidas do exterior não podem fazer um filme elevar-se”,
assim, “narração é aquilo que você faz quando você falha” (Drew 1983:271-3). A
objeção de Drew com a narração ecoou pela grande parte dos escritos teóricos
sobre documentário, que, juntamente com certos realizadores, cimentou a visão
acima expressada, promovendo a ideia de que o termo “voz over” quando aplicado
ao documentário, refere-se ao didatismo, ao branco e aos tons masculinos da voz
de The March of time. E aos seus arrependidos derivados. A maior parte da culpa
dessa percepção negativa da voz over é debitária da “árvore genealógica” de Bill
Nichols, representando a genealogia do documentário como iniciando-se com o
modo expositivo (encabeçado pelo comentário, pelo didático), a mais velha e
primitiva forma do filme não ficcional.
Apesar de a autora esquecer de ponderar a posição de Robert Drew – como realizador,
defensor de uma nova proposta cinematográfica, num contexto ideológico distante daquele que
dominava o entreguerras – e de Bill Nichols – professor e teórico que lida, mais do que com a
história do documentário, com um quadro conceitual que funciona, mais que tudo, como ferramenta
de entendimento e de análise –, há significativos indícios de que não podemos mais negligenciar a
temática da voz no documentário clássico.
Enfim, caracterizar as vozes do documentário clássico coletivamente como “voz de
Deus” ou “voz over” é, de certa forma, obscurecer o espectro de estratégias vocais empregadas
durante os anos 1930 e 1940 e esquecer que foram décadas de preocupação saliente em relação à
dimensão social da arte, nas quais muitas das colaborações entre cineastas, escritores, compositores
e atores centraram seus esforços na voz invisível como ingrediente-chave do emergente formato
cinematográfico (sonoro-visual). Muitos dos mais celebrados realizadores do período – Pare
Lorentz, Willard Van Dyke, Ben Maddow, John Grierson, Alberto Cavalcanti, Paul Rotha e
Humphrey Jennings – viram na voz uma valiosa oportunidade de inovação22.
Alberto Cavalcanti (1985 [1939]), por exemplo, em “Sound in films” nota que o
comentário foi relegado pela produção ficcional, que menosprezou as potencialidades desse tipo
22
Ver Willard Van Dyke, “The interpretive camera in documentary film”, Hollywood quarterly, v. 1, n. 4 p. 405-409,
1946; Ben Maddow, “The writer’s function in documentary film”, Writer’s Congress, University of California Press,
p. 98-103, 1944; Pare Lorentz, FDR’s movie maker: memoirs and scripts. Reno: University of Nevada Press, 1992;
John Grierson, “The GPO gets sound”, Cinema Quarterly, v. 2, n. 4, p. 215-221, 1934 e “Two paths to poetry”, Cinema
Quarterly, v. 3, n. 4, p. 194-196, 1935; Alberto Cavalcanti, “Sound in films”. In: WEIS, E.; BELTON, J. (Eds.). Film
sound: theory and practice. New York: Columbia University Press, 1985 [1939]. p. 98-111; Paul Rotha, Documentary film.
London: Faber & Faber, 1939. p. 201-223.
42
de uso da voz, encontrando seu desenvolvimento essencialmente nos travelogues, cinejornais e
documentários.
Para notar isso, não precisamos buscar documentários desconhecidos, à margem da
teoria e historiografia já consolidada. Podemos notar estratégias variadas do uso, alcance e
endereçamento da voz que se distanciam da ideia de “voz de Deus” em cânones da história do
documentário, como Song of Ceylon (1934) de Basil Wright, Coal face (1935) de Alberto
Cavalcanti, Night mail (1936) de Harry Watt e Basil Wright, People of Britain (1936) de Paul
Rotha, The plow that broke the plains (1936) de Pare Lorentz, Spanish Earth (1937) de Joris Ivens,
Terra sem pão (1933-1937) de Luis Buñuel, The river (1937) de Pare Lorentz, Olympia (1938) de
Leni Riefenstahl, People of the Cumberland (1938) de Sidney Meyers e Jay Leyda, Valley Town
(1940) de Willard Van Dyke, Power and the Land (1940) de Joris Ivens, The Forgotten Village
(1941) de Hebert Kline, The land (1941) de Robert Flaherty, A place to live (1941) de Irving Lerner,
The Battle of Midway (1942) de John Ford, Native Land (1942) de Leo Hurwitz e Paul Strand,
Tunisian victory (1944) de Frank Capra e Hugh Stewart, The Battle of San Pietro (1944) de John
Huston, Hôtel des invalides (1952) de Georges Franju, entre inúmeros outros.
Um caso interessante de se mencionar, por exemplo, é o do filme The river. Pare
Lorentz, realizador do filme e responsável pela voz invisível, foi indicado em 1938 ao Pulitzer
Prize na categoria poesia, pela narração poética composta para o filme, construída em versos, rimas
e diversos recursos de linguagem, de forma semelhante ao que ocorre em The plow that broke the
plains, do mesmo realizador. Em Power and the land, a narração, escrita pelo poeta Stephen
Vincent Benet, também é poética e em certos trechos é cadenciada, construída em versos. Ela se
coaduna à música fílmica em ritmo e melodia, construindo aquilo que Wolfe (1997, p. 154) chamou
de folk-verse commentary, numa analogia, provavelmente, à folk song. Em People of Britain é
também notável a ritmização da voz e de outros recursos de linguagem, tal como a repetição de
frases emblemáticas na perspectiva política do filme – a frase “There is no defense against air
attack” sendo repetida por três vozes distintas – ou na construção de versos com três vozes – gas
burns (voz 1)/gas blinds (voz 2)/gas chokes (voz 3)/gas paralyses (voz 1, 2 e 3).
Esses casos nos fazem lembrar de Paul Robeson, renomado cantor e ativista político
dos direitos civis, que, além de fazer a narração, canta em Native Land, um filme que tematiza os
direitos civis.
43
No filme Tunisian victory existem dois narradores, que se associam, cada um, ao
exército britânico e ao exército norte-americano. Uma estratégia interessante para um filme que
tematiza a aliança de ambos exércitos numa campanha no norte da África e que foi coproduzido
pelos Estados Unidos e Grã-Bretanha. Para além disso, a narração é feita em forma de uma
rememoração da experiência das campanhas, estando cada narrador separado espacialmente na
história do filme, cada um com seu exército. Ao fim do filme, após a vitória retratada, as duas vozes
da narração dialogam no plano sonoro, mantendo-se invisíveis, porém num estilo de voz visível.
De forma semelhante, em The Battle of Midway, John Ford dirige quatro vozes invisíveis distintas,
que desempenham personalidades e características distintas. Por vezes uma é mais cadenciada,
outra mais solene e formal, outra mais acolhedora e outra mais tagarela; cada uma delas com
poderes distintos dentro da articulação fílmica, uma mais ligada à capacidade de falar sobre eventos
do passado, trazendo relações espaciais, temporais e causais, outra capaz de interpretar coisas para
além da imagem, as outras mais circunscritas nos eventos imediatos das imagens. Duas das vozes
também travam diálogos entre elas, sendo vozes invisíveis dentro de uma estilística de voz visível.
Em Spanish Earth, a voz de Ernest Hemingway23, apesar de não abrir mão dos recursos
da voz de Deus (ela se locomove livremente nos espaços visuais de locação, ela vai e volta no
tempo, ela interpreta as imagens, explica coisas que não se vê nas imagens etc.), é rica em suas
variadas estratégias. Ela, por exemplo, põe-se no lugar das personagens que vemos mas não
ouvimos, tentando articular seus possíveis pensamentos e falas; ela muda seu endereçamento
quando, por exemplo, ao termos um close-up de uma placa de identificação em alemão de um avião
abatido, a voz diz “I can’t read German either” (“Eu também não consigo ler alemão”), alinhando-
se culturalmente ao espectador comum norte-americano, de maneira semelhante quando deixa de
lado a terceira pessoa para emitir frases em primeira pessoa, engajando-se com perspectivas
23
A primeira versão contou com a voz de Orson Welles na narração, mas foi substituída. Segundo Joris Ivens (apud
CAMPBELL, 1978, p. 356-7), “Como proposto por Archibald MacLeish, nós pedimos a Orson Welles para ler [o texto
de Hemingway] e pareceu como um bom trabalho; mas havia alguma coisa na característica de sua voz que a separava
do filme, da Espanha, da realidade do filme... De qualquer forma, quando eu levei o filme para Hollywood, outras
pessoas – Herman Shumlin, Lillian Hellman e Dorothy Parker – perceberam o que estava errado e sugeriram que
Hemingway tentasse ler ele mesmo o texto. E eles estavam certos. Durante a gravação, seu comentário soou como
aquele de um repórter sensível, que esteve na locação e que queria falar sobre isso – um sentimento que nenhuma outra
voz poderia comunicar”.
44
socialmente compartilhadas, no caso, a causa republicana – “The bridge is ours. The road is saved”
(“A ponte é nossa. A estrada está segura”), referindo-se à estrada que liga Valência a Madrid24.
A voz de Terra sem pão é deliberadamente etnocêntrica, intencionalmente
contraditória e enganosamente humorística: ela explora nossa credulidade e descrença (RUOFF,
1998, p. 55). Na versão inglesa, frases representativas dessa perspectiva se fazem vastamente
presentes, como, “Na entrada da cidade somos recebidos por um coro de idiotas” e, enquanto nas
imagens se vê um bebê decorado com joias cristãs, “Nós apenas podemos compará-los com aqueles
desgastados [enfeites] feitos nas tribos bárbaras da África e Oceania”25. A vozes de The Battle of
San Pietro e Hôtel des invalides26, num sentido parecido, lançam mão da incerteza, de uma postura
variável entre o oficial e o não oficial, da intimidade, da contradição, construindo narrações
acentuadamente irônicas.
Recursos advindos dos dramas de rádio podem ser notados em filmes como The land,
quando o narrador fala pelas personagens “sem voz”, em People of the Cumberland e Valley Town,
quando vozes invisíveis expressam pensamentos e sentimentos das personagens. Em Valley Town
há ainda dois outros pontos importantes: o narrador se apresenta como prefeito da cidade cujo filme
tematiza27, dando um lugar, ao menos social, à voz e tirando-a da posição divina; ao fim do filme,
a voz do narrador responde a um diálogo entre personagens, confundindo o espaço dessas vozes na
dramatização, na articulação fílmica, suas relações e interdependências. Caso interessante também
é o do filme A place to live, no qual duas vozes são responsáveis pela narração: uma cujo dono não
sabemos quem é e outra que pertence a uma personagem do filme. Esta última, além de se
relacionar semanticamente com a narração da outra voz, ainda se faz presente corporificada e em
diálogos com a personagem que representa o filho. Em Forgotten village é interessante notar que
a narração se aproxima bastante do discurso indireto livre, com falas e pensamentos de personagens
inseridos dentro do discurso do narrador, havendo recorrentes mudanças entre primeira e terceira
pessoa.
24
Para uma análise aprofundada de Spanish Earth, conferir artigo de Charles Wolfe “Historicising the ‘Voice of God’:
the place of vocal narration in classical documentary” (1997).
25
O filme é originalmente silencioso. Em sua primeira exibição o próprio Buñuel fez a narração. Depois o filme ganhou
versões em francês, espanhol e inglês da narração. Posteriormente, Buñuel adicionou música de Johannes Brahms
(quarta sinfonia) ao filme.
26
Sobre Hôtel des Invalides é interessante notar, também, que vozes de guias do Museu do Hôtel des Invalides se
inserem na narração, tomando, por vezes, o lugar do narrador “oficial”.
27
O narrador não é, em verdade, o prefeito. É um ator de rádio.
45
Em Olympia, de Leni Riefenstahl, em vez do anonimato da voz over, Paul Laven, o
narrador esportivo mais famoso da rádio alemã, com seus colegas Rolf Wernicke, Henri Nannen e
Johannes Pagels, reencenam para o filme a cobertura que haviam feito para as Olimpíadas de 1936
no rádio (GRAHAM, 2001, p. 165). Os narradores aparecem algumas vezes nas imagens, que
foram feitas depois das tomadas dos jogos olímpicos propriamente ditas, fazendo transparecer a
preocupação com a mise-en-scène da voz invisível. Essa estratégia faz-nos ver os narradores como
personagens dentro dos jogos olímpicos. Dessa forma, os narradores conseguem cumprir o caráter
informativo e assertivo da voz ao mesmo tempo em que dão uma dimensão espacial, pessoal e
social à enunciação. Se a autoridade da voz, nos termos de uma voz over ou voz de Deus, existe aí,
ela vem travestida de uma locução esportiva usual, com as mesmas formas e vozes escutadas nas
rádios alemãs no dia a dia.
Três dos casos mais discutidos são Song of Ceylon, Coal face e Night mail. Em Song
of Ceylon, por exemplo, a voz invisível é tirada de um caderno de viagem de 1680, “An historical
relation of the island Ceylon” de Robert Knox, num lapso temporal de 254 anos em relação às
imagens. Segundo William Guynn (1998, p. 93), o sotaque e os padrões de entoação da voz são
marcadamente arcaicos e reforçam, mais que uma voz de autoridade, uma perspectiva de
enunciação histórica. Apesar da voz desempenhar papéis de uma “voz de Deus”, explicando as
imagens e ancorando seus significados, ela resiste em ser atribuída ao projeto deliberado pelo
realizador: é como se a justaposição de imagem e som produzisse um discurso crítico sem a
manipulação flagrante de um enunciador.
Em relação a Coal face, o aspecto que mais salta aos olhos é, sem dúvida, o tratamento
das vozes. Elas foram pensadas e escritas musicalmente na partitura de Benjamin Britten para o
filme com a participação do poeta W. H. Auden, dando uma dimensão lírica ao texto falado,
recitado e cantado, que se divide em verso e prosa.
Em Night mail, na famosa sequência no final do filme temos o comentário/poema
musicado composto por Auden (presente na partitura original do filme) que, além de cumprir seu
papel informativo e musical, coaduna-se aos outros elementos sonoros para compor, sobretudo
ritmicamente, a sonoridade que se associa aos sons do trem.
Enfim, análises mais detidas dos usos da voz no documentário clássico podem revelar
um variado leque de estratégias que fogem dos limites e estigmas da “voz over” e “voz de Deus”.
46
Estratégias que lidam com vozes localizáveis no tempo e no espaço, frutos de tomadas que captam
a materialidade e a imaterialidade da voz mundana que se mostra e revela para o microfone e para
o espectador. Os resultados dessas análises podem mudar algumas perspectivas que temos a
respeito da estilística e ética do documentário clássico, que, ao meu ver, está longe de se esgotar
teoricamente e historiograficamente como fonte de pesquisa.
A voz invisível é, de fato, a mais imperativa no documentário clássico, tendo em vista
o conjunto de filmes aqui analisado – mesmo com a presença cada vez mais constante da voz visível
a partir da Segunda Grande Guerra e de seu questionamento ético que cresce conforme começa a
se formar o documentário moderno, como veremos mais adiante. Cabe pontuar que a narração não
é o único modo no qual a voz invisível existe: a voz, em suas diversas maneiras de ocorrer, pode se
fazer presente sem corpo, mas também sem as características da narração, como em vozes de
arquivo, vozes que compõem um ambiente sonoro, vozes de rádio etc., mas aqui, dada a
predominância da narração dentro do recorte feito, trabalhamo-la com mais atenção.
A narração foi uma variável constante e centralizadora no documentário clássico.
Variável constante porque sua presença é assídua e oscilou entre vieses líricos e assertivos –
independentemente se a narração fala sobre as imagens ou se as imagens tendem a coadunar a fala
–, sem negar, em ambos os casos, uma característica fundamental: informar e falar do outro e pelo
outro. Evidentemente, existem produções do período clássico que não fazem uso da narração, como
é o caso das sinfonias metropolitanas, tais como Melodia do Mundo, Entusiasmo e The oil
symphony, e de alguns filmes importantes da tradição documentária, como Song of heroes, Os
pescadores de Aran (1934) de Robert Flaherty e Triunfo da Vontade.
Quatro principais modos de produção da escrita da narração foram identificados nos
documentários clássicos aqui analisados: (1) narração escrita por um escritor ou poeta, (2) narração
escrita pelo diretor ou produtor do filme, (3) narração pautada em escritos antropológicos e
historiográficos anteriores ao da produção do filme, (4) narração escrita por acadêmico, jornalista
ou especialista no assunto.
Ao primeiro modo podemos mencionar, por exemplo, os filmes Coal face, Night mail
e The way to the sea (1936), este último de Paul Rotha, que tiveram a participação do escritor e
poeta W. H. Auden, Spanish Earth, que teve a narração escrita e oralizada pelo escritor Ernest
Hemingway, com colaboração de John Dos Passos, A diary for Timothy (1946) de Humphrey
47
Jennings, com narração feita pelo escritor E. M. Forster, Desert victory (1943) de Roy Boulting,
com narração do escritor J. L. Hodson, Power and the land com narração do escritor e poeta
Stephen Vincent Benet, The Forgotten village, com narração do escritor e nobel da literatura John
Steinbeck, Child went forth (1942) de Joseph Losey e John Ferno, com narração do escritor de
literatura infantil Munro Leaf, e Noite e neblina, com comentário escrito pelo poeta Jean Cayrol.
Ao segundo modo podemos relacionar, por exemplo, os filmes Industrial Britain,
produzido e escrito por John Grierson e Robert Flaherty, The voice of Britain (1935), dirigido e
escrito por Stuart Legg, The plow that broke the plains e The river, escritos e dirigidos por Pare
Lorentz, New Earth (1934), dirigido e escrito por Joris Ivens, White flood (1940) de Lionel Berman,
David Wolff e Robert Stebbins, escrito pelo correalizador do filme David Wolff, e The Battle of
San Pietro (1944), dirigido e escrito por John Huston.
À terceira categoria podemos relacionar os filmes Song of Ceylon, com narração
pautada nos escritos “An historical relation of the island Ceylon” do século XVII, de Robert Knox,
Terra sem pão de Luis Buñuel, pautado nos escritos antropológicos “Las Jurdes: étude de
géographie humaine” de Maurice Legendre, publicado em 1927, e, também, The Land, cujo script
foi baseado no livro Behold our Land de Russel Lord, publicado em 1938.
Ao quarto modo podemos relacionar, por exemplo, Face of Britain (1935) de Paul
Rotha, que foi escrito e falado pelo crítico e jornalista A. J. Cummings, Housing problems (1935)
de Arthur Elton e E. H. Anstey, que conta com a voz invisível do Councillor Lauder, presidente da
Stepney Housing Committee, People of Britain, que teve a participação do acadêmico e também
escritor Ritchie Calder, Children at School, escrito pelo jornalista Wilson Harris, The City (1939)
de Ralph Steiner e Willard Van Dyke, com narração escrita pelo intelectual Lewis Mumford,
London can take it (1940) de Humphrey Jennings, com narração feita pelo jornalista Quentin
Reynolds, e Valley Town, com narração escrita por Spencer Pollard, economista da Universidade
de Havard.
A oralização da narração ficava a cargo geralmente de atores, cantores, do diretor do
filme ou da própria pessoa que escreveu a narração, e esses dados são importante ponto de partida
para pensar as inflexões muitas vezes musicais, líricas e assertivas das vozes. A análise destas
inflexões é merecedora de uma pesquisa com profundidade ainda a ser realizada. Contudo, em
apontamentos gerais, podemos afirmar que a escolha da sonoridade das palavras, as tonificações,
48
as escolhas prosódicas, as rimas, a poetização do discurso etc. foram questões constantes no
documentário clássico. Traços líricos podem ser evidenciados claramente nos filmes supracitados,
porém há diferenças e preponderâncias e, no final, nem a assertividade e nem o lirismo se ausentam
completamente no documentário clássico.
Há que se pesquisar ainda os conflitos e confluências, por exemplo, de uma semântica
assertiva ou lírica ou de uma estruturação da fala assertiva ou lírica, e como esses pesos se
equilibram, tendo no horizonte as questões éticas relevantes para o período e grupo de realização
das respectivas produções.
Além do lugar social da produção da voz, a relação temporal, espacial e factual que ela
estabelece com aquilo que é tematizado no filme – se fala de um passado, de um presente, a partir
de estúdio ou de locação, se ela sofreu ou sofre cargas de inflexão devido à sua presença ou
engajamento na temática fílmica –, com a diferença temporal em relação à tomada das imagens –
se as vozes foram gravadas numa temporalidade semelhante ou distinta em relação às imagens, se
são imagens de arquivo ou não –, assim como sua diferença espacial com a tomada das imagens,
são chaves, como apontado anteriormente, para o aprofundamento do debate sobre as vozes do
documentário clássico ou, ao menos, para identificarmos, dentro do bolo rotulado de voz over e
voz de Deus, estratégias do uso da voz que se diferenciam em termos estilísticos. De certa forma,
essas são relações analíticas que muitas vezes estabelecemos com as imagens, mas que
negligenciamos ao falar sobre os sons.
De qualquer forma, um dado relevante, e que aqui nos importa sobremaneira, é que
essas vozes invisíveis se assentam numa constante nos filmes analisados (porém não exclusiva, tal
como podemos notar quando a assertividade se rarefaz): informar e falar do outro e pelo outro a
partir de um lugar majoritariamente privilegiado socialmente, como podemos notar verificando os
criadores e oradores destas narrações. Lugar e modo de fala que cederão crescentemente espaço às
vozes visíveis a partir do final dos anos 1930, como apontaremos no item seguinte. O que podemos
inferir é que esse lugar de fala só começa a ser efetivamente problematizado e transformado a partir
do documentário moderno, que, não pode se perder de vista, deixará cada vez mais de lado as
temáticas relacionadas às políticas do Estado em favor das temáticas institucionais, regionais,
efêmeras, cotidianas e de valorização do sujeito. Contudo, o documentário clássico percorre, ainda
que de maneira modesta, um caminho que crescentemente questiona essa voz da narração,
49
invisível. As críticas presentes nos próprios anos 1930 e 1940, como tentamos demonstrar, já
indicam um incômodo que, se não é epistemológico, se faz presente ideologicamente em alguns
grupos relacionados à produção documental. Os documentários que se estruturam mais no diálogo
do que na narração a partir da Segunda Guerra, como veremos adiante, também são exemplos disto.
A narração mais flexibilizada e os monólogos interiores no filme Valley Town – que se localizam
no limítrofe entre voz invisível e visível – e o discurso indireto livre em The Forgotten Village ou
a revelação da figura daquele que informa e fala do outro e pelo outro, como no filme Britain Can
Make It (1946) de Francis Gysin (quando Stafford Cripps, presidente do Board of Trade britânico,
comenta alguns aspectos anteriormente tratados no filme) também são exemplos disso.
3.1.2 A voz visível
As vozes que estão ancoradas na imagem, na presença de um referente visual que se

localiza, entende-se ou supõe-se como fonte sonora, fazem-se presentes desde os primeiros
documentários sonoros aqui analisados, mesmo que ocupando uma dimensão menor que no
domínio ficcional, tanto em termos quantitativos quanto de estrutura narrativa. E podemos notá-las
nas tomadas de locação e nas tomadas de estúdio. A voz visível não está necessariamente
sincronizada com os corpos e nem necessariamente vemos a boca do corpo que a emite, mas são
associados, de alguma forma, com a voz que escutamos ou são imaginados como sua fonte sonora,
mesmo que o espaço-tempo de tomada do corpo não seja o mesmo da tomada da voz.
Um primeiro exemplo a se considerar para encaminhar a discussão é o filme
Entusiasmo de Dziga Vertov, especialmente a partir de dois aspectos. O primeiro deles diz respeito
à pesquisa tecnológica desenvolvida para criar um aparato capaz de filmar satisfatoriamente em
locação. Uma investida substancial para o período, que permitiu que Vertov coletasse e montasse
sons “reais”. A concatenação e transformação destes documentos sonoros do mundo histórico
dentro da articulação fílmica se coloca em pauta numa questão atualmente cara para a teoria do
som fílmico que lida com as confluências, indiscernibilidades e fronteiras entre as pistas de música
e ruído da trilha sonora28. O segundo aspecto interessante é que o planejamento sonoro do filme
28
Claudiney Carrasco, por exemplo, desenvolve esta temática em sua atual pesquisa “Música experimental e sound
design no cinema: a emergência de um novo conceito de trilha sonora”, com bolsa de Produção em Pesquisa CNPq.
50
foi feito antes do visual (1929 e 1930, respectivamente)29. Ou seja, numa concepção invertida do
que se tem como consenso (o som, de forma geral, é concebido conjuntamente ou posteriormente
às imagens, com exceção das falas), evidenciando a relevância do sonoro na construção autoral da
obra.
Nesse filme já podemos notar alguns aspectos que são relevantes para pensar a tradição
documentária. A valoração do som fílmico e de sua coleta em locação, em ambientes abertos, indica
a importância que o som potencialmente toma como referente do mundo histórico e de indicialidade
em uma composição fílmica. Importância dada, até então e sobretudo, às imagens.
Apesar de já haver sons coletados em locação em Entusiasmo, a valoração desse tipo
de tomada sonora apenas alçaria larga importância no documentário moderno, em suas perspectivas
observativas, interativas e reflexivas – com claras diferenças éticas e estilísticas em relação a
Entusiasmo, que se ancora mais numa (re)construção do mundo histórico, pautada fortemente na
sua (re)montagem, numa ressignificação dos dados indiciais através do choque entre planos. A voz
do documentário moderno se aproximaria daquilo que Fernão Ramos chama de encenação direta
(cinema direto) e encenação interativa (cinema verdade), numa valorização ainda maior da
indicialidade que aflora de dentro do plano, seja a partir do recuo do cineasta ou na sua
interatividade com o filmado, no diálogo, na entrevista ou no depoimento. Contudo, se pensarmos
numa espécie de genealogia da voz direta e interativa no documentário, já podemos encontrar em
Entusiasmo vozes coletadas em locação, assim como no filme Housing problems, People of Britain
de Paul Rotha e Children at school (1937) de Basil Wright, assim como nas falas de Triunfo da
vontade (1935) e Olympia de Leni Riefenstahl30, no filme Pedra fundamental do edifício do
Ministério de Educação e Saúde (1937) do Instituto Nacional de Cinema Educativo (Ince), dirigido
por Humberto Mauro, na série Why we fight (1942-1945) produzida por Frank Capra; ou ainda, nas
inúmeras produções não ficcionais da Fox Movietone News a partir de 192731. Há também o caso
interessante de The voice of Britain (1935) de Stuart Legg, com falas gravadas em sincronia com a
imagem em estúdios que eram, em verdade, a própria locação – os estúdios da B.B.C.
29
Verificar Artículos, proyectos y diarios de trabajo de Dziga Vertov (1974, p. 306-311) e “Música, futurismo e a
trilha sonora de Dziga Vertov” de Michelle Magalhães (2005, p. 96).
30
Em Triunfo da vontade e Olympia existe tanto tomada em locação como tomada em estúdio. Importante aclarar
também que a circunstância de mundo aí foi flexionada/criada de antemão tendo em vista (e para coincidir com) a
mise-en-scène da circunstância de tomada.
31
Verificar acervo online “Moving image research collections” da University of South Carolina: <http://mirc.sc.edu/>.
51
Dentro de uma perspectiva diacrônica da história do documentário, podemos dizer que
a tomada de voz em locação se fortifica nos princípios éticos e estilísticos do fazer documentário
conforme a voz invisível é questionada sobre sua validade em informar e falar do outro e pelo outro
(independentemente de sua tendência lírica ou assertiva) e conforme a gênese do som filmado e
seus aspectos indiciais ganham valor.
Contudo, neste trilho, no qual existe a valorização do espaço homogêneo entre os sons
do mundo cotidiano e os do campo do filmado, é importante notar, além da voz invisível e da voz
visível de locação, o lugar da voz visível coletada em estúdio, que se interpõe no caminho do
documentário clássico ao moderno.
As vozes com referentes visuais coletadas em estúdio32 são mais frequentes que as de
locação nos primeiros anos do documentário sonoro, mesmo que com inflexões próprias de cada
filme, sem uma regularidade e convencionalidade exacerbada. Inflexões que variam do lírico ao
assertivo, da sincronização gestual à labial, da inexata à exata, mas que dificilmente fogem daquilo
que Fernão Ramos chama de encenação construída. Pode-se dizer também que essas vozes, até
então, não exercem papel semântico fundamental na narrativa documentária, como se pode notar,
por exemplo, em Melodia do mundo de Walther Ruttmann, Song of heroes (1932) de Joris Ivens,
Os pescadores de Aran (1934) de Robert Flaherty, Song of Ceylon de Basil Wright, Coal face de
Alberto Cavalcanti33 e Spanish Earth de Joris Ivens34.
A importância que elas ativam é de uma categoria que não é semântica. Em Os
pescadores de Aran, por exemplo, as falas, que ocorrem tanto em inglês quanto em irlandês,
cumprem, mais que tudo, uma função fática – ou seja, um tipo de fala que se foca no próprio canal
de comunicação, estabelecendo ou criando um canal de comunicação entre aquele que fala e aquele
que escuta sem a transmissão ou elaboração de ideias ou mensagens importantes. Apesar de haver
existido no filme a preocupação de gravar as vozes dos nativos das Ilhas de Aran no estúdio, depois
32
No começo dos anos 1930, no cinema ficcional sobretudo, a captação era preponderantemente em tomada direta
(com sincronia desde o momento da captação da imagem), mesmo sendo em estúdio, aspecto que foi mudando no
decorrer dos anos 1930, com o desenvolvimento do double system e das técnicas de edição e mixagem sonora.
33
Em Coal face existem vozes importantes à narrativa, mas elas nos são apresentadas em formas mais musicais, numa
função não corriqueira às vozes do cinema de então.
34
Apesar de estes filmes terem tomadas visuais em locação e em estúdio, as tomadas da voz são feitas em estúdio. Por
este motivo podemos dizer que as vozes destes filmes mantêm uma heterogeneidade entre a circunstância da tomada
e a circunstância do mundo que a cerca, mesmo se pensarmos que em Song of Ceylon e em Os pescadores de Aran as
vozes gravadas em estúdio, já na fase de pós-produção, são de nativos dos lugares filmados.
52
das imagens já editadas, a preocupação não ocorreu devido aos aspectos semânticos, nem com a
preocupação em criar diálogos e conversas que compusessem pilares para a narrativa e sua
estrutura. Kevin Donnelly (2015, p. 140), em seu estudo sobre Os pescadores de Aran, afirma que
a voz dos personagens cumpre, mais que uma função semântica, uma função estética, sendo um
componente essencial do senso de autenticidade e da representação da cultura das Ilhas de Aran.
Em Song of Ceylon, num exemplo parecido, as vozes visíveis também se afastam da função
semântica mais corriqueira e funcionam mais como senso de autenticidade e referente cultural
daquilo que é filmado (ou ainda numa função mais musical, como veremos mais adiante).
Contudo, no decorrer da década de 1930 já notamos a voz, até então mais “fática” e
“estética”, ganhar contornos de função semântica, ocupando um lugar de maior destaque na
narrativa fílmica. Em The King’s stamp (1935) de William Coldstream e Night Mail, por exemplo,
o diálogo, em voz visível, em sua tomada de estúdio e em forma de encenação construída, já toma
uma larga importância para a narrativa fílmica – as conversas são fundamentais para as tomadas,
elas informam e direcionam o entendimento da narrativa. Pett and Pott (1934) de Cavalcanti e The
voice of Britain (1935) de Stuart Legg são dois casos importantes também em que esse tipo de voz
já se faz presente. Importância de proporções parecidas na narrativa que começaremos a notar mais
frequentemente no documentário do período da Segunda Guerra e do pós-guerra – por exemplo,
nos filmes North sea (1938) de Harry Watt, Valley Town de Willard Van Dyke, Target for tonight
(1941) de Harry Watt e Basil Wright, Native land (1942) de Leo Hurwitz e Paul Strand, Listen to
Britain (1942) de Humphrey Jennings e Stewart McAllister, Farrebique (1946) de Georges
Rouquier, A diary for Timothy (1946) de Humphrey Jennings e Louisiana story (1948) de Robert
Flaherty, num nível de encenação construída e dentro de uma articulação fílmica que se aproxima,
guardadas as distinções, da condução narrativa dramática do domínio ficcional. Num trajeto em
que a voz visível, de dentro do campo, com seu potencial referente visual, ganha valiosa importância
na narrativa fílmica, mesmo quando dividindo espaço com a voz invisível.
Ken Cameron (1947, p. 5-6), sound supervisor da Crown Film Unit, afirma que no
momento do pós-guerra há que se aceitar a existência de duas classes de documentários: uma que
faz uso do comentário, de alguma música e efeitos, na qual “existe uma franca descrição de um
incidente ou de um processo ou um estilo de vida”, como em London can take it; e outra que se
aproxima do filme comum, comercialmente produzido, e de seus diálogos, que lida com a
53
“imaginação, ou humanidade ou simplesmente com o conhecimento e observação de como as
pessoas comuns deste país [Inglaterra] vivem, trabalham, pensam e agem”, como em Target for
Tonight e Listen to Britain.
Pode-se notar o espaço que a voz visível ganha no pós-guerra mesmo nos filmes em
que a voz invisível é preponderante, como nos curtas, de produção já descentralizada (ou melhor,
mais diversificada), como A plan to work on (1948) de Kay Mander, Mining review 2nd year Nº
11 (1949) de Peter Pickering, From the ground up (1950) da Crown Film Unit (sem crédito para
diretor), The undefeated (1950) de Paul Dickson e Transport (1950) de Peter Bradford.
O que de certa forma iremos notar com mais frequência são relações, conflitos,
questionamentos, esclarecimentos etc. sendo articulados em forma de diálogo na narrativa.
Características que irão ganhar mais força no documentário moderno.
Apesar da ligação que essas vozes (visíveis e de estúdio), de forma geral, mantêm com
as imagens, devemos pensá-las segundo sua heterogeneidade em relação às imagens e também ao
mundo que as circunda. E esses aspectos são importantes para demarcar distinções em relação à
voz visível do documentário moderno. Uma das marcas do documentário moderno, como veremos
mais adiante, é a homogeneidade da voz com a imagem e também com o mundo que a circunda.
Neste tipo de presença, a voz infla-se de um presente praesentia, ou seja, infla-se de seu próprio
ato no presente, valorizando sua própria emissão e materialidade, flexionada equilibradamente
pelas memórias e expectativas do tempo que passa e está por chegar no presente, deixando
registrado um acontecimento do mundo histórico em sua homogeneidade com a circunstância de
tomada e com a tomada visual que a acompanha.
No documentário clássico, a voz visível de estúdio encontra um lugar entre a voz
invisível do documentário clássico e a voz visível de locação do documentário moderno. Se, por
um lado, já notamos a valoração da voz visível em forma de diálogo e conversa, tal como no
documentário moderno, por outro lado, ela ainda se distancia dos valores éticos e estilísticos de
tomada dos anos 1960. Ela não preza pela homogeneidade. Antes disso, ela se preocupa com a
reconstrução, encenação ou representação de relações pessoais e sociais com referente num
passado e num outro lugar que serve de molde (por mais que seja um passado muito curto em
relação ao presente da tomada ou mesmo um presente que vira recorrentemente passado, por ser
atual para o presente da tomada, como é o caso de relações de trabalho em instituições ainda
54
existentes na época do filme, como vemos, por exemplo, em Night mail; e mesmo que a tomada
ocarra num misto de locação com estúdio). Podemos dizer, assim, que a heterogeneidade temporal
entre o que é visto e ouvido e seu referente no passado é marca da voz visível do documentário
clássico, assim como a heterogeneidade espacial. Nesse sentido, a voz não é matéria em si, ou
melhor, ela é um dos coadjuvantes da dramatização com diálogo, que passará a ser mais costumeira
a partir da Segunda Guerra; diferente do que acontece com a voz do documentário moderno, que
ganha valor em si, fundando-se sobretudo na inflação do presente praesentia, numa
homogeneidade com o mundo histórico que a circunda.
Podemos dizer que a voz visível do documentário clássico, em linhas gerais, tem o
passado – que é heterogêneo ao presente da tomada – como referência forte para a encenação da
tomada no presente – mas que, contudo, não se apaga de expectativa, que é valorizada
principalmente na articulação fílmica, que foca na perspectiva social da intenção fílmica, que é,
sobretudo, educativa ou propagandística, ou seja, pensada para o futuro.
O que de certa forma iremos notar com mais frequência a partir da Segunda Guerra, é
a tomada que evidencia as relações de trabalho e pessoais, as decisões políticas e ideológicas, as
perspectivas, os julgamentos e a observação sobre o mundo a partir da ação e dramatização
construída para a tomada, com personagens dialogando e agindo um sobre o outro em suas relações,
simulando, tentando simular ou tangenciando o espaço-tempo mundano.
Cabe apontar que a voz visível do documentário clássico não tem a mesma mobilidade
da voz invisível do documentário clássico, que consegue lançar mão de uma extensão maior de
passado para engajar, a partir do presente, o futuro. A voz visível, tendo em perspectiva nossas
fontes fílmicas, não lida com um passado muito distante, apesar de potencialmente poder encená-
lo, ao passo que a voz invisível consegue, por exemplo, retomar questões históricas antigas para
argumentar sobre questões de um passado curto ou do presente. Contudo, é interessante notar que
ambas irão se engajar no futuro numa perspectiva equivalente, que é, sobretudo, a da intenção
educativa ou propagandística.
Podemos, assim, notar nas preponderâncias da diacronia da história do documentário
um percurso no qual a voz invisível começa a ceder espaço para a voz visível de estúdio, por mais
que modestamente, sobretudo a partir da Segunda Guerra (em um primeiro momento a voz visível
possui uma função mais fática e estética e num segundo momento ganha função semântica), que,
55
por sua vez, cede espaço à voz visível de locação com o documentário moderno. Em outras palavras,
um percurso no qual o informar e falar do outro e pelo outro (documentário clássico, em especial
de 1929 a 1937) cede um modesto, porém crescente, espaço à (re)construção de fenômenos e
eventos em formas de diálogos, em condução dramática (documentário clássico, em especial o da
Segunda Guerra e do imediato pós-guerra), que, por sua vez, cede lugar a uma voz indicial, à
evidência oral, revelada na homogeneidade entre a tomada e o mundo histórico (documentário
moderno), numa valorização do ver o filmado falar por ele mesmo e da articulação fílmica valorizar
este aspecto na montagem e em sua observação ou em sua provocação, intervenção e interação do
cineasta com o filmado, como discutiremos mais adiante.
O que não se sabia, e tampouco estava em pauta – quando apontamos dentro do
documentário clássico essas variedades de tipo de voz –, é que o lugar de fala não estava sendo
efetivamente transformado numa perspectiva de valorização da alteridade ou nos trilhos da
“história vista de baixo” em detrimento da “história vista de cima”, ou ainda nos rumos de uma
“heteroglossia” em detrimento de uma voz que emana de um lugar social, político ou econômico
uno; a fala e seu lugar só estava mudando de roupagem. Problematização de cunho parecido que
também foi feita pelos defensores do cinema verdade aos realizadores do cinema direto norte-
americano35.
3.2 As vozes no documentário moderno: para além do sincronismo portátil
O documentário moderno dos anos 1960 tem como característica marcante de seus
vieses estilísticos e éticos uma nova maneira de capturar as imagens e os sons do mundo. Essa nova
maneira está diretamente ligada àquilo que Mario Ruspoli (1963), ainda no calor do momento,
chamou de “grupo sincrônico cinematográfico ligeiro” (groupe synchrone cinématographique
léger), que consistia, sobretudo, em uma câmera e um gravador, portáteis e sincronizados. Esse
grupo, operado por uma equipe mínima, pôde interferir, observar, flagrar, provocar, inibir etc. o
mundo e seus elementos na conformação da imagem e do som cinematográfico de uma maneira
que deixou cicatrizes permanentes nos determinantes estilísticos e éticos da tradição documentária.
35
Verificar o artigo “The documentary film as scientific inscription” de Brian Winston (1993).
56
Como é sabido, a questão tecnológica caminhou nesse momento de mãos dadas com
transformações de âmbitos ideológicos e epistemológicos que começaram a amadurecer após a
Segunda Guerra e que derivaram em distintas diretrizes cinematográficas, não apenas no domínio
documental, mas, também, no ficcional.
Mesmo antes do desenvolvimento mais maduro do “grupo sincrônico cinematográfico
ligeiro” no decorrer dos anos 1960, o documentário moderno já trilhava seu caminho, um caminho
tomado por bifurcações. Nos anos 1950, as produções do free cinema, do candid eye e da TV
britânica – que variavam entre captação portáil e sincrônica, portártil e não sincrônica e não portátil
e sincrônica36 e que, de uma forma ou de outra, começavam a se inserir no transcorrer e na
imprevisibilidade mundana, na abertura para o acontecer –, por exemplo, já começavam a imprimir
as novas marcas das transformações que se afirmariam na década seguinte em figuras emblemáticas
como Robert Drew, irmãos Maysles, Jean Rouch e Pierre Perrault.
Há que se pontuar também que as produções, tanto dos anos 1950 quanto dos anos
1960, não foram homogêneas, nem no âmbito tecnológico37, nem no estilístico e ético.
Com foco nas diferentes formas da voz se fazer presente é que tentamos, a seguir,
identificar diferentes recursos e estratégias que foram empregados nesse novo momento da tradição
documentária.
É importante ter em mente também que no documentário moderno e em seus
precursores – mesmo que com diferenças em relação ao tipo de presença que ocorre no
documentário clássico – há voz invisível, há música invisível, há som e imagem não sincronizados
e mesmo quando voz e imagem são sincronizados, uma variedade grande de tomadas pode se
estabelecer.
36
O free cinema, por exemplo, não contou com gravador sincrônico, a não ser os filmes produzidos no final da década
de 1950, como March to Aldermaston (1959) e We are the Lambeth boys (1959). A produção do Candid eye, apesar
de lidar com o portátil sincronizado, lançava mão de substanciais tomadas visuais que não eram acompanhadas de seus
sons, inclusive a presença da voz invisível é bastante significativa, como podemos notar em The days before Christmas
(1958) e The Back-breaking Leaf (1959). No caso da televisão britânica, as produções de Denis Mitchell e John
Boorman, que apesar de poderem lançar mão do recurso portátil e sincronizado, deixavam de lado, por preferência, o
sincronizado em relevante quantidade.
37
Verificar o artigo “Pour un nouveau cinema dans les pays en voice de dévéloppement: le groupe synchrone
cinématographique léger” de Mario Ruspoli (1963).
57
3.2.1 A voz fabuladora
Neste momento, fujo rapidamente da abordagem fenomenológica debitária aqui

sobretudo das perspectivas de Fernão Ramos para pensar um dos vieses do documentário moderno,
aquele que Giles Deleuze atribui, entre outros, a Jean Rouch e Pierre Perrault. E o faço por entender
como ponto crucial da voz a fabulação que emana da interação/intervenção do cineasta com o
filmado, por exemplo, nos filmes Eu, um negro (1958), A pirâmide humana (1959) e Crônica de
um verão (1960), de Jean Rouch, e Pour la suite du monde (1962), Le règne du jour (1967) e Les
voitures d’eau (1968), de Pierre Perrault.
Faço aqui uma pequena digressão teórica antes de voltar a discutir sobre a voz
propriamente dita. No item seguinte, no qual há uma apreciação mais detalhada dos filmes de Jean
Rouch, esforço-me para me fazer entender ante uma potencial contradição teórica que adoto: uma
possível convergência entre a ideia de ato de fabulação com a existência determinadora do sujeito-
da-câmera, que não nos deixa confundir ou equiparar o sujeito no mundo com o sujeito que se
funda numa tomada. Por esse motivo, tal digressão se justifica.
Cerca de uma década após a Segunda Guerra, vemos emergir no documentário as
transformações do regime da imagem cinematográfica apontadas por Deleuze. Trata-se da
passagem da imagem-movimento, do dito cinema clássico, para a imagem-tempo, fundadora de um
cinema moderno. Era a passagem de um regime no qual as imagens fundavam-se em
acontecimentos expressos em conexões causais e relações sensório-motoras do homem com o
mundo para um regime que rompe com as relações que guiam a expressão em termos de
movimento, abrindo-se diretamente sobre o tempo, irrompendo em espaços quaisquer, vazios ou
desconectados, e em fragmentos que rompem com a linearidade forjada dos acontecimentos,
conformando-se em constantes bifurcações. “É essa reversão que faz, não mais do tempo a medida
do movimento, mas do movimento a perspectiva do tempo [...]” (DELEUZE, 1990, p. 33). Em
outras palavras: o movimento deixa de subordinar o tempo para passar a ocorrer dentro do tempo.
Dentro desse novo regime, Deleuze inclui, pensando no campo documentário, aquilo
que chamamos de cinema verdade (especialmente Jean Rouch) e cinema do vivido (especialmente
Pierre Perrault)38, caracterizado por Ramos (2008, p. 37-38), numa linha teórica diferente, pela
38
Deleuze, quando da argumentação da imagem-tempo, faz referência também ao cinema direto de Shirley Clarke e
58
ética da interatividade/reflexividade e por Bill Nichols (2008, p. 153-162) como operante do modo,
principalmente, participativo, mas também reflexivo.
Conformando-se com essa imagem-tempo, temos a subjetiva indireta livre, que
caracterizaria de forma definitiva o novo regime, dito moderno. No antigo regime, dito clássico,
segundo Deleuze, a câmera trabalha sob dois parâmetros: o da objetiva indireta, ou aquilo que a
câmera vê; o da subjetiva direta, ou aquilo que a personagem vê.
[...] num filme os dois tipos de imagens, objetivas e subjetivas, começam a se
desenvolver na base de uma distinção, podendo chegar até ao antagonismo, mas
terminam no reconhecimento de sua identidade. Afinal, por trás da visão subjetiva
do personagem, é a visão objetiva do cineasta-câmera que orquestra o conjunto
das relações sensório-motoras com o mundo, é a narrativa indireta da câmera que
articula e comanda a narrativa direta do personagem. Essa foi uma das condições
que franquearam ao cinema clássico, ficcional ou documental, a narrativa de
grandes acontecimentos sustentados por personagens exemplares, heróis
civilizadores, portadores de visões totalizantes do mundo lançadas como verdades
universais (TEXEIRA, 2008, p. 255-256).
No documentário moderno, a distinção entre o que a câmera objetivamente vê e o que
a personagem subjetivamente vê dá passagem à câmera subjetiva indireta livre:
A narrativa não se refere mais a um ideal de verdade a constituir sua veracidade,
mas torna-se uma “pseudo-narrativa”, um poema, uma narrativa que simula ou
antes uma simulação de narrativa. As imagens objetivas e subjetivas perdem sua
distinção, mas também sua identidade, em proveito de um novo circuito onde se
substituem em bloco, ou se contaminam, ou se decompõem e recompõem
(DELEUZE, 1990, p. 183).
O circuito da subjetiva indireta livre, do documentário moderno, se contrapõe ao
circuito da objetiva indireta e subjetiva direta do documentário clássico, no qual os propósitos nos
impeliam a ver objetivamente situações, personagens reais e as maneiras de ver das próprias
personagens em suas situações e problemas. No circuito clássico, os tipos de imagem se resolvem
numa identidade do tipo “Eu=Eu”: a “identidade da personagem vista e que vê, mas também
identidade do cineasta-câmera, que vê a personagem e o que a personagem vê” (DELEUZE, 1990,
p. 180). É como se o filme trabalhasse sob a certeza, a partir de uma preexistência do mundo em
relação à imagem cinematográfica, de que “sabemos quem somos e quem filmamos”. No circuito
moderno essa certeza dá passagem a uma insinuação de que “eu é outro”, numa identidade em
constante construção, localizada no devir, na multiplicidade, na não preexistência, na
indiscernibilidade entre o real e o imaginário, enfim, no ato de fabulação, tornando-se sempre um
John Cassavetes (DELEUZE, 1990, p. 179-188).
59
presente que ainda está por vir, no qual tanto o cineasta quanto a personagem estão em formação,
transformando-se, intervindo-se.
Sob essas perspectivas principais, Deleuze nos apresenta a grande transformação do
cinema que defende, do dito clássico ao dito moderno, sendo o cinema verdade e o cinema do
vivido (e também o cinema direto de Clarke e Cassavetes) exemplos centrais de sua argumentação,
que deixaram para trás o cinema ficcional e documental clássicos.
Se pensarmos nas teorias de Ramos e Nichols, lembraremos que no decorrer do pós-
guerra víamos surgir dois tipos de documentário: (1) o da ética da imparcialidade/recuo para
Ramos (2008, p. 36) e o do modo observativo para Nichols (2008, p. 146-153), que se relacionavam
com o cinema direto39 (livingcamera), principalmente; e (2) o da ética interativa/reflexiva e o do
modo participativo (e também reflexivo), relacionados ao cinema verdade. Esses dois tipos de
documentário deixariam para trás a ética educativa e o modo expositivo, superando (e até rompendo
com) a tradição flaherty-griersoniana do documentário.
Deleuze não atribuía ao cinema da ética da imparcialidade/recuo e do modo
observativo tons de novidade. Para o filósofo, o cinema direto40 – pertencente às tradições fundadas
por percursores do documentário como Robert Flaherty, John Grierson e Joris Ivens –, ao qual
podemos incluir, entre outros, os filmes de Robert Drew, Albert e David Maysles, D. A. Pennebaker
e Richard Leacock, não trazia nenhuma grande transformação ao já existente cinema clássico, já
que nele a câmera continuava a se dirigir a um real preexistente de maneira objetiva e subjetiva,
pautado ainda em um “Eu=Eu”, com as identidades do cineasta e da personagem definidas. Como
reforça André Parente (2000, p. 177), “[o cinema direto] continua estreitamente ligado ao cinema
de ação41. O que liga esses realizadores42 entre si é que se trata sempre de exprimir as relações
sensório-motoras entre o homem e o mundo”.
Em discordância, acredito que, do ponto de vista da circunstância da tomada, é nítido
que o cinema direto traz enormes novidades ao cinema, em proporções equiparáveis ao cinema
39
Aqui não se trata do cinema direto que Deleuze atribui a Clarke e Cassavetes.
40
Cinema direto como anteriormente definido quando falávamos de Ramos e Nichols.
41
Cinema de ação é o cinema da imagem-movimento, o cinema clássico.
42
Parente se refere explicitamente aos seguintes realizadores: L. Anderson, K. Reiz, T. Richardson, T. Marcatney-
Felgate, W. Koenig, R. Kroitor, M. Brault, R. Drew, D. A. Pennebaker, Albert e David Maysles, M. Ruspoli, F.
Reinchenbach, R. Flaherty, J. Grierson e J. Ivens.
60
moderno de Deleuze. É um cinema rico e ainda pouco valorizado em suas nuances éticas e
estilísticas, ainda a ser mais estudado.
As considerações engendradas por Deleuze no que tange ao cinema documentário
clássico não são de razoável precisão pela falta de fontes fílmicas citadas, que se assentam quase
totalmente no cinema ficcional. Contudo, o que me interessa aqui mais pontualmente é a ideia de
fabulação nos filmes de Jean Rouch e Pierre Perrault.
Enfim, essa voz, em ato de fabulação, que encontramos nos documentários
supracitados de Jean Rouch e Pierre Perrault, não foge, no limite, de uma possível rotulação como
voz visível ou invisível, e parece-me relevante, tendo no horizonte uma perspectiva diacrônica da
história do documentário, não a separar completamente das vozes do documentarismo clássico, ao
mesmo tempo em que devemos reconhecer as profundas diferenças entre elas.
Em que aspectos gerais, portanto, as vozes visíveis e invisíveis do documentarismo
moderno se aproximam e diferenciam do documentarismo clássico? Como apontado
anteriormente, nota-se na tradição documentária uma presença cada vez mais abundante da voz
visível, que caminha junto com mudanças éticas, sobretudo aquelas que se preocupam em “dar a
voz ao filmado”, que se fazem segundo novos métodos de tomada. Se a voz visível do documentário
clássico dava um passo nesse sentido, ficava longe de fazê-lo como no documentário moderno: se
com os diálogos, monólogos interiores e discursos livres indiretos do documentário clássico dava-
se um passo significante no sentido do questionamento ético e estilístico da voz invisível, eles
ficavam, ao mesmo tempo, distantes de um “dar a voz ao filmado” efetivo, já que as questões em
pauta do filme continuavam a ser a do “outro”, seja este “outro” o Estado e suas empresas ou os
cineastas em suas preocupações. Em Eu, um negro de Jean Rouch, já notamos uma outra dimensão
dessa voz visível, ou seja, uma voz fabuladora, que, por mais que esteja sob um controle final da
equipe realizadora e numa indiscernibilidade entre o real e o imaginado, coaduna-se às memórias,
às angústias, aos desejos, ao presente e ao devir daquele que é filmado. E é importante notar este
traço moderno num documentário que ainda não trabalha com aparatos de captação direta
sincronizada portátil, como é o caso de Eu, um negro e A pirâmide humana, evidenciando-se que,
ao menos, alguns traços modernos no documentário não são debitários desses aparatos. Contudo,
não se pode dizer que as diferentes circunstâncias de tomada condicionadas por diferentes aparatos
não impelem novidades: em Crônica de um verão (e nos filmes supracitados de Perrault), já com
61
aparatos de captação direta sincronizada portátil, vemos a voz ser captada em seu vagar pelo
mundo, lidando com suas imprevisibilidades, privilégio este até então praticamente exclusivo das
imagens. Esse aspecto, sem dúvida, engrandece as possibilidades discursivas do documentário, e
não é à toa que a captação da voz em locações, em movimento e nas imprevisibilidades do mundo
são paradigmáticas até hoje: esses aparatos oferecem a possibilidade de filmar os gritos do mundo
em seu momento de irrupção.
Deixando um pouco de lado os aspectos da fabulação, não podemos deixar de notar
que se traçássemos uma genealogia das vozes no documentário, teríamos que dizer que a voz
invisível diminuída e de caráter contextualizador da obra, tal como notamos nos filmes supracitados
de Jean Rouch, já se faz presente no documentário clássico, assim como diálogos alongados e
monólogos de personagens. Por esse motivo, não podemos perder de vista a perspectiva diacrônica
da história do documentário, já que é desta forma que é possível apontar as mudanças e
transformações pelas quais passou.
Enfim, o que notaremos como traço bastante forte do documentário moderno é que não
são mais apenas as formas visuais que podem ser captadas em seu vagar no mundo, em seus atos
ordinários e catárticos. A voz e os outros sons começam a ser encarados como materialidade em si
do mundo e, agora, tal como as formas visuais, fundam com autonomia o presente em seu
transcorrer, soltos no mundo histórico.
Ao mesmo tempo em que a voz se liberta, liberta também a imagem, que agora, além
de ter o som como seu componente ou de ser livre dele, pode, também, tornar-se componente do
som, livrando-se ela (a imagem) da carapuça que a determinou em inúmeros documentários
clássicos como a matéria essencial e fundamental de uma comprovação da verdade fílmica em seus
momentos de modo expositivo, de ética educativa e de imagem-movimento, podendo agora dividir
plenamente a responsabilidade do filme com a voz.
A voz fabuladora vem ocupar um lugar privilegiado na ética deste viés de
documentarismo moderno (cinema verdade). Uma voz que não representa necessariamente algo,
em vez disso, uma voz que se forja no devir instigado e flexionado profundamente pelo grupo
realizador do filme e sua presença na circunstância da tomada, mesmo quando esta presença é
reduzida a uma única pessoa e seus aparatos. Além disso, podemos dizer, para usar um valioso
conceito da antropologia fílmica disseminado por Claudine de France (1998, p. 412), que a voz
62
desse viés de documentário moderno se forja sob o manto da profilmia43: soa exagerado dizer que
predomina o “endereçamento direto” (direct-address), em termo estrito, da voz, contudo, não se
pode perder de vista que a voz fabuladora existe, sobretudo, devido ao grupo realizador do filme,
numa situação que não existiria no mundo histórico a priori, e, nesse sentido, podemos dizer que
é uma voz que fala para a câmera e, portanto, uma voz que dificilmente perde de vista que será
escutada pelo espectador. Por esses motivos, tenho como hipótese que estas vozes pretendem ser,
em termos vagos, reflexivas, existenciais e filosóficas, ou melhor, pretendem formular dúvidas,
verdades e generalidades sobre a vida e o mundo. Por consequência, um tipo de voz bastante rica
nas definições dos contornos psicossociais do sujeito que a enuncia. Esses traços não estão ausentes
no cinema direto norte-americano, mas o modo a partir dos quais surgem e suas características são
distintos, como veremos mais adiante.
3.2.1.1. Eu, um negro (1958), A pirâmide humana (1959) e Crônica de um verão (1960): do
pós-produzido ao direto sincronizado
A motivação principal da análise que segue encontra-se na vontade de compreender

algumas características das vozes no nascimento do documentário moderno e o papel delas nas
transformações que imprimiraim uma forte marca na tradição documetária.
É comum encontrar na literatura do cinema documentário e do som fílmico (e mesmo
nos relatos dos próprios realizadores fílmicos) referências aos impactos definitivos impelidos pelo
som direto sincronizado portátil no documentário moderno, especialmente no cinema direto,
cinema verdade, cinema do vivido e nos filmes antropológicos. Todavia, ainda é escasso um
esclarecimento advindo de análises que foquem nos aspectos sonoros.
É quase consensual apontar os aparatos de som direto sincronizado portátil como um
elemento fundamental e propiciador da transformação no domínio documental que veio a se
estabelecer nos anos 1960. E, de fato, novas possibilidades de circunstância da tomada surgem.
43
Profilmia é a “Maneira mais ou menos consciente com que as pessoas filmadas se colocam em cena, elas próprias e
o seu meio, para o cineasta ou em razão da presença da câmera. Ficção inerente a qualquer filme documentário que
adquire formas mais ou menos agudas e identificáveis. Noção cunhada por Etienne Souriau (1953) mas que, estendida
ao filme documentário, diz respeito não somente os elementos do ambiente intencionalmente escolhidos e arranjados
pelo realizador com vistas ao filme, mas também a qualquer forma espontânea de comportamento ou de auto-mise en
scène suscitada, nas pessoas filmadas, pela presença da câmera” (FRANCE, 1998, p. 412).
63
Contudo, instigado pelo outro lado da moeda, ou seja, por tentar entender o que não é fruto direto
desses novos aparatos, e sim de uma transformação epistemológica (ética, representativa, de
alteridade etc.) mais ampla calcada num passado próximo, é que partimos para as análises que mais
adiante apresentamos.
Aqui nos limitaremos à análise de três filmes de Jean Rouch, com foco na produção e
captação das vozes: Eu, um negro (1958), A pirâmide humana (1959) e Crônica de um verão
(1960). A escolha recai na ideia de que são marcos de um cinema moderno que estava sendo
fundado e que, ao mesmo tempo, utilizam diferentes aparatos e formas de captação das vozes entre
si, além de serem produções cronologicamente próximas e sequenciais de Rouch, o que nos dá uma
considerável margem para comparações advindas do campo do sonoro.
Cabe também esclarecer outro ponto de convergência entre essas obras: esses filmes
são classificados, usualmente, como filmes de improvisação ou psicodrama. Nas palavras de
Marcius Freire (2007, p. 60),
É nessa modalidade que o “outro” deixa de ser apenas objeto do registro, mesmo
que contribuindo para que este aconteça – como nos filmes de “registro
etnográfico” – e passa a ser “inventado”, construído pelo cineasta e por ele
próprio. Não é preciso dizer que, tanto num quanto noutro existe construção de
uma realidade fílmica, uma realidade que não é propriamente aquela do mundo
histórico. A diferença entre os dois está justamente na explicitação dessa
invenção, na eleição dessa invenção como condição prévia para a existência
mesma do filme.
Enfim, considerando a importância do cinema verdade e de Jean Rouch como um
divisor de águas na história do documentário e de uma antropologia fílmica, acreditamos que a
discussão possa contribuir em alguns aspectos com o entendimento das diferentes formas das vozes
se fazerem presentes.
Eu, um negro: a indiscernibilidade entre o real e o fictício das vozes
Eu, um negro é um filme que trabalha essencialmente com som pós-produzido em

relação à imagem. Da trilha sonora há que se destacar as vozes, que foram gravadas pelas
personagens durante a projeção das imagens anteriormente produzidas e já editadas. A partir delas,
pode-se enxergar as personagens reais em suas invenções, ficcionalizações e fabulações. Elas
remetem-se ao
mundo interior dos personagens, aos seus sonhos, ambições, desejos, à sua
64
mentalidade. Desse processo, desse encontro entre o mundo vivido mostrado pelas
imagens e o mundo interior dito pelo comentário, aflora a realidade sócio-cultural
imposta pelo colonialismo (FREIRE, 2007, p. 61).
Caberia, portanto, cindir as personagens do filme entre aquilo que são e aquilo que
inventaram ser? Haveria nitidamente um passado de cada personagem anterior à imagem
cinematográfica que as definisse e um presente da imagem no qual elas atuam como outra
personagem? Afinal, são personagens reais ou fictícias?
De acordo com Deleuze, não se trata mais de personagens reais ou fictícias. Por um
lado, “É preciso que a personagem seja primeiro real, para afirmar a ficção como potência e não
como modelo”, por outro lado, “é preciso que ela comece a fabular para se afirmar ainda mais
como real, e não como fictícia. A personagem está sempre se tornando outra, e não é mais separável
desse devir que se confunde com um povo” (DELEUZE, 1990, p. 185).
O que de mais concreto deve-se tirar dessa ideia é que, ao ver o filme, o mais
interessante não seria esforçar-se para separar o que há de real e o que há de fictício nas falas (e
nas imagens). Não que as duas categorias (real e fictícia) sejam abstratas, mas mais interessante
seria observar que há o real da fabulação e que há a fabulação do real. Desse meandro, já não
importa a mentira ou a verdade: não há personagem que é vista objetivamente, com a certeza de
saber quem ela é, e nem personagem que vê subjetivamente, evidenciando aquilo que de fato ela
vê e sabe do mundo (em contrapartida, seria exagerado afirmar que não há um “Eu” e um “Outro”
definidos e cindidos também entre um real e um fictício, ao menos em alguma instância – Jean
Rouch, o cineasta-antropólogo, e africanos, as personagens filmadas).
Nesse sentido, pode-se notar que há um problema em falar do documentário moderno
a partir de um referencial da representação: como imaginar que algo está sendo representado se a
imagem cinematográfica parte de um Eu que está constantemente, no presente, transformando-se
em Outro que não é localizável num passado puro?
Enfim, é a partir das falas do filme que se pode notar tais observações de maneira mais
clara. O primeiro a falar no filme é Jean Rouch. A voz invisível dele apresenta a partir de quais
pressupostos o filme foi feito (haveria pessoas reais fazendo uma ficção com suas próprias vidas,
liberados para fazer e dizer tudo), fala de onde são as personagens (Nigéria) e onde estarão no filme
(Treichville, comunidade de Abidjan, capital de Costa do Marfim) e apresenta alguns temas que
serão abordados ao longo do filme (boxe, cinema, álcool, islamismo). Até aí está tudo claro, mas,
a partir de então, após a voz primeira de Jean Rouch cessar e a das personagens (e das posteriores
65
falas de Jean Rouch) começarem, inicia-se uma operação de indiscernibilidade em relação às
certezas de um real e de um fictício, que recai na pergunta que deve ser esquecida: “O que é verdade
e o que é mentira?”.
A articulação das vozes do filme, que nos trazem os indícios desta indiscernibilidade,
conjuga-se em quatro principais modalidades palpáveis que se permeiam constantemente: (1) a
dublagem que se sincroniza com a imagem, ou seja, o que escutamos é também articulado pela
boca da personagem nas imagens; (2) a “dublagem” que se sincroniza com as imagens como um
todo, mas não se fazem presentes no movimento da boca da personagem das imagens; (3)
comentários e reflexões a respeito do que há nas imagens ou por impulso das imagens, abrindo-se
para um além do que se pode inferir pela imagem; (4) comentários ou falas que se ligam às imagens,
mas, ao mesmo tempo, extrapolam-nas e parecem compartilhar uma dimensão de um presente que
não aquele da imagem, um presente da pós-produção, afrouxando as amarras de um extracampo
nítido.
De maneira sintética, pode-se atribuir à primeira modalidade a nomenclatura de
discurso direto visível, à segunda de discurso direto invisível, à terceira de monólogo e à quarta de
monólogo compartilhado.
Há que se pontuar que o que escutamos no filme foi lá posto depois das imagens. Por
mais que as imagens não sejam desprovidas de sons e de seus índices no momento e na presença
do sujeito-da-câmera, o som é fruto de um trabalho e de um momento posterior. Porém, não se
pode negar que os sons mudos desse tipo de imagem cinematográfica possam ser carregados pela
memória dos participantes do filme para o momento de sua sonorização, inflexionando sua maneira
de fazer-se presente. Por esse motivo, podemos afirmar que o sujeito-da-câmera, mesmo sendo
objetivamente surdo ao que capta, pode carregar para um segundo momento as “cicatrizes” sonoras
da “circunstância da tomada”.
O discurso direto visível é o de menor incidência no filme. Dele pode-se afirmar que é
a modalidade de voz que mais se prende a uma determinação dos movimentos da imagem, mas
que, ao mesmo tempo, é a voz que se funda junto com o movimento, carregando uma autonomia
que é interdependente do visual. No momento da dublagem, pode-se variar as inflexões prosódicas,
mas sua essência, a das palavras, mantém a compatibilidade entre os dois momentos, o da filmagem
e o da dublagem como espaço-tempo uno. É a voz que pode ser entendida em união à imagem em
66
ato de fabulação: imagem e som sendo percebidos como uma coisa só. Ela é como uma prova de
que a fabulação ocorreu de maneira concreta no campo do filmado.
O discurso direto invisível se caracteriza por não estar tão atrelado às imagens quanto
o discurso direto visível. Há sim conexão entre os movimentos da imagem e da voz, mas ela se
comporta, no momento da gravação da voz, conforme uma preexistência das imagens visuais: fala-
se (grava-se) conforme a determinação ou impulso dos movimentos da imagem. Contudo, estes
não são seus limitantes. É nesse ponto que a indiscernibilidade entre real e fictício vem à tona e
mostra-se mais forte que no discurso direto visível: a voz que fala pode fabular sobre e para além
da própria fabulação constituinte das imagens, trazendo uma dupla carga: a da fabulação em ato,
na presença do sujeito-da-câmera, e a da fabulação do momento da gravação da voz. Pode-se, por
exemplo, fabular um diálogo a partir, e diferente, de um diálogo já fabulado (visível, mas inaudível)
presente na imagem. Uma mesma personagem pode, por exemplo, forjar um diálogo, no qual ela
pergunta e ela mesma responde.
O monólogo caracteriza-se por desprender-se da imagem visual mais que o discurso
direto invisível. Porém, seu caminho não é o mesmo. É como se num primeiro instante, imediato,
a imagem fosse a agenciadora por excelência da voz que fala, sendo debitário da imagem o impulso
necessário para o monólogo fluir. Em contrapartida, ela pode extrapolar o campo do visível,
rompendo o cordão umbilical que a ligava à imagem, quando a personagem passa a falar consigo
mesma ou dirigindo-se ao espectador em expressões de pensamento, com suspiros de remorsos,
traumas e desejos. A indiscernibilidade entre o real e o fictício é enorme, por mais que as situações
sejam ficcionalizadas e inventadas, a personagem fala com uma profundidade que é própria daquele
que carrega um conhecimento e um passado que afloram no presente. Nesse sentido, percebe-se
que quanto mais fabuladora mais real é a fala.
No monólogo compartilhado as vozes de um real e um fictício são momentânea e
aparentemente resgatadas quando a voz que fala aponta para dois tipos de opinião a respeito de
algum tema que podem remeter-se a um Eu rachado em dois. O primeiro emitindo o que o Eu-
ficcionalizante seria (ou faria, ou pensaria) na pele do Eu-personagem ficcionalizado – o Eu
fictício; e o segundo o que Eu seria (ou faria, ou pensaria) na pele do Eu – o Eu real. Mas esse
racha não se sustenta, quase que instantaneamente se torna indiscernível, não passando de um lapso.
O que essa voz traz, mais forte que o monólogo do parágrafo anterior, é a voz daquele que, para
67
além da presença na circunstância da tomada visual, faz-se presente em transformação no momento
da gravação da voz da pós-produção. Nas outras três categorias também há essa marca da presença
da pós-produção, mas é no monólogo compartilhado que essa presença se evidencia.
Contudo, tais categorias não são estanques, elas se entrelaçam ao longo do filme.
Porém, ajudam a perceber como a indiscernibilidade entre o real e o fictício atinge patamares
diferentes e que estão parcialmente condicionadas a dois momentos de realização do filme: à
filmagem das imagens com a presença do “sujeito-da-câmera” surdo e à gravação das vozes numa
pós-produção – em ausência de aparatos que permitissem a captação do som direto sincronizado
na circunstância das tomadas. O jogo de indeterminação e imprevisibilidade do presente, em meio
à improvisação da filmagem, não está determinado pela presença desses novos aparatos (de som
direto sincronizado) neste filme. Mas, conforme tentaremos mostrar mais adiante, este jogo lida
com diferenças condicionadas por esses novos aparatos e pela não existência de dois presentes de
realização do filme, naquilo que concerne aos aspectos semânticos das vozes visíveis.
A pirâmide humana: entre o som pós-produzido e o direto sincronizado portátil – novos

horizontes da voz que fabula
As regras do jogo em A pirâmide humana são semelhantes às de Eu, um negro. No

começo do filme, a voz de Jean Rouch explica como vai funcionar o filme: as personagens irão
ficcionalizar, desempenhar papéis, improvisando as situações. Porém, existem duas diferenças
relevantes entre os filmes: em A pirâmide humana, Jean Rouch se fará mais presente, intervindo e
fabulando mais (inclusive aparece nas imagens); e, também nele, o número de personagens que
tem voz é bastante maior. Em meio a essas diferenças tem-se em A pirâmide humana tanto o uso
do som pós-produzido, captado no momento da projeção das imagens, quanto o uso da captação
sonora direta sincronizada. Decorre desses pontos que as vozes que (se) inventam estabelecem
relações distintas de Eu, um negro com a fabulação.
Cabe ressaltar que em A pirâmide humana ainda não há a captação do som direto
sincronizado portátil. Há aparatos de som direto sincronizado não portáteis, muito mais pesados e
de menor qualidade. Seu uso comum ocorre em estúdios e não permite a mobilidade necessária
para gravar o presente improvisado e imprevisto em locações.
68
Apesar de o filme ser também improvisado, Rouch condiciona notavelmente as
situações que ocorrem frente à câmera, dirigindo e guiando uma história que é desempenhada pelas
personagens. Ou seja, as personagens improvisam e fabulam, porém, as situações em A pirâmide
humana são bastante controladas pelo cineasta. Talvez esta necessidade de controle decorra do
número maior de personagens, já que os rumos da história sem a intervenção firme do cineasta,
que une as personagens em caminhos convergentes de ficcionalização, poderia levar o filme a
lugares não desejados.
As modalidades do discurso direto invisível, monólogo e monólogo compartilhado,
debatidas anteriormente, continuam a ocorrer, assim como em Eu, um negro. Entretanto, o emprego
dessas modalidades em A pirâmide humana é mais modesto, sem grandes novidades em relação ao
Eu, um negro, ganhando destaque uma modalidade que se torna possível apenas com o som direto
sincronizado não portátil.
Ela se aproxima do discurso direto visível, mas o extrapola e abre novos horizontes
para a fabulação. Podemos chamá-la de discurso direto sincronizado. O discurso direto visível se
dá pelo som pós-produzido, captado no momento da projeção das imagens já editadas, e pelo
resgate da circunstância da tomada daquilo que já havia sido dito na presença do sujeito-da-câmera
surdo; o discurso direto sincronizado, além de se fundar no mesmo momento da imagem, é também
captado na mesma circunstância de tomada visual. Até aí o que temos são, sobretudo, diferenças
técnicas e semelhantes resultados. Entretanto, daí, duas importantes distinções podem ser
observadas: a primeira em relação à articulação das imagens com as vozes e das vozes com as
imagens, ou melhor, em relação ao destaque e autonomia que elas (imagens e sons) tomam em
cada circunstância; a segunda em relação ao novo horizonte e presente da fabulação, que se abre
fortemente para o presente das imagens.
No discurso direto visível as vozes que falam para o sujeito-da-câmera são essenciais,
em diversos momentos, para provocar as novas situações das imagens por vir, que podem elas
mesmas (as novas situações) sofrerem a carga de uma dupla fabulação ao serem fabuladas
novamente por outras modalidades da voz no momento da captação do som da pós-produção. As
duas maneiras de se fazer o discurso direto visível é resgatando a fala da circunstância da tomada
pela memória ou escrevendo as falas, antes de elas serem pronunciadas na presença do sujeito-da-
câmera, retomando o escrito pela memória ou por leitura no momento da captação pós-produzida.
69
Com o sujeito-da-câmera surdo, as imagens (flexionadas ou não pelas vozes mudas da
tomada) que chegam da circunstânia da tomada são aquilo de mais forte que se traz do presente da
tomada: as vozes trabalhadas posteriormente por uma das quatro modalidades de voz pós-
produzida observadas anteriormente podem perder ou não, em graus diferentes, o vínculo com o
presente do momento da tomada visual, extrapolando-o ou não. Para o sujeito-da-câmera que ouve,
tanto as imagens quanto os sons do momento da circunstância da tomada são importantes e suas
inflexões se dão, de qualquer maneira, a partir do mesmo presente, quando se trata do discurso
direto sincronizado.
Em Eu, um negro o discurso direto visível é o de menor incidência e é também o que
atinge o patamar mais superficial da fabulação, deixando as camadas mais profundas para as outras
três modalidades. O que o discurso direto sincronizado traz de novidade é a possibilidade de uma
fabulação de camadas profundas advindas diretamente da homogeneidade entre circunstância de
tomada visual e tomada sonora. O discurso direto visível não é prático num filme de improvisação,
dadas as suas dificuldades de ocorrência (que dependem basicamente da memória da circunstância
da tomada visual) e de se limitarem basicamente à correspondência de uma ou duas personagens,
já que evocar uma memória coletiva factual que permita a reprodução idêntica de um momento
não é, há de se concordar, a atividade mais trivial, fácil e óbvia. Em contrapartida, o discurso direto
sincronizado, num filme de improvisação, ganha destaque. Entretanto, com o som direto
sincronizado não portátil, a liberdade dos movimentos é diminuída, ganhando a oralidade um
grande destaque em relação aos movimentos da imagem, permitindo que a voz fundada e captada
no presente da tomada extrapole, assim como os monólogos, os conteúdos da imagem. No nível
mais superficial, o discurso direto sincronizado se aproxima em resultado, e não em processo, do
discurso direto visível, já que ambos trazem a voz do presente da tomada; todavia, o discurso direto
sincronizado abre a possibilidade da voz se estender em duração e se complexificar, permitindo
que as vozes do presente advenham de inúmeras fontes de fabulação e que alcem voo para uma
prática efetiva da oralidade na circunstância da tomada, num mesmo presente do sujeito-da-câmera
que capta imagem (e, agora, também, o som).
Se sem o som direto sincronizado as camadas mais profundas da fabulação advinham
de um segundo presente, o da pós-produção, com sua chegada, a fabulação que se funda no mesmo
presente da tomada das imagens pode, então, atingir também seus níveis profundos, o que não era
70
possível com o discurso direto visível, provocando novas relações de articulação entre o som e a
imagem. Se na pós-produção o som (no discurso direto visível) que escutamos como espectador
pode se flexionar com a imagem (mas não o contrário), com o som direto sincronizado, tanto a
imagem quanto o som improvisados podem flexionar-se entre si no momento de seu nascimento,
por fundarem-se num mesmo presente. Esta é a nova possibilidade de fabulação que os aparatos de
som direto sincronizado podem trazer: tanto o som quanto a imagem podem fundar-se e lançar-se
no transcorrer de um mesmo presente.
Crônica de um verão: articulação e liberdade das imagens e das vozes
As regras em Crônica de um verão são um pouco diferentes dos outros dois filmes (Eu,
um negro e A pirâmide humana). Nele, Jean Rouch não pede que as pessoas atuem papéis
específicos (como o “racista”, em A pirâmide humana) em lugares e em situações muito diferentes
daquelas em que as personagens costumam viver (como se pode notar em Eu, um negro). Em
contrapartida, há mais participação, intervenção, reflexão e direcionamento das vozes e dos
movimentos por parte dos realizadores (Jean Rouch e Edgar Morin) no campo do filmado. Como
é dito por Jean Rouch no início do filme, “Este filme não foi feito [ou atuado] por atores, mas
vivido por homens e mulheres que deram uns poucos momentos de suas vidas para um novo
experimento em cinéma-vérité”.
A personagem que fabula não é assumida como real primeiramente para, então, ser
assumida como fictícia, fundando assim uma indiscernibilidade entre o real e o fictício. Em
Crônica de um verão, assume-se que desempenhamos papéis na vida. O real e o fictício da
fabulação, de certa forma, são sempre indiscerníveis. É como se a vida estivesse entre a “imagem-
qualquer” e a “imagem-intensa”, ou seja, entre o nada, que está à espera de algo, e a morte, que
espera o último suspiro do ser para aflorar: fora desses limites o real e o fictício são indiscerníveis.
Apesar das diferenças, as prerrogativas da improvisação valem para os três filmes.
Contudo, a ficcionalização e a fabulação tomam outros caminhos, que revelam novas relações entre
o que se vê e o que se ouve e novas possibilidades da imagem cinematográfica que se funda em
som e em imagem num mesmo presente do sujeito-da-câmera. Em Eu, um negro, vimos que as
fabulações das vozes dependem, em graus diferentes, de dois presentes: o da filmagem e o da
71
captação das vozes na pós-produção (discurso direto visível, discurso direto invisível, monólogo,
monólogo compartilhado). Em A pirâmide humana, vimos que, na fabulação, tanto o som quanto
a imagem podiam fundar-se e lançar-se no transcorrer (limitado) de um mesmo presente (discurso
direto sincronizado). Em Crônica de um verão, a nova modalidade que protagoniza é da mesma
ordem da do discurso direto sincronizado, porém, pode-se notar que a articulação entre as imagens
e as vozes ganha novos atributos e que a liberdade entre elas estabelece diferentes parâmetros de
coexistência. A nova modalidade é debitária da chegada do captador de som direto sincronizado
portátil e, também, de uma mudança da episteme que já podemos notar nos filmes Eu, um negro e
A pirâmide humana. Pode-se denominar esta nova modalidade de discurso direto pontencialmente
não sincronizado: parece que o som e a imagem fundados num mesmo presente esperaram sua
definitiva união (com o som direto sincronizado portátil) para tornarem-se, com toda força,
potencialmente autônomos.
No discurso direto sincronizado o aparato de captação não era portátil, ou melhor, não
era prática sua locomoção. Decorria disso que, mesmo dentro de uma improvisação, a situação
deveria ser planejada: havia que se preocupar, pelo menos, com o isolamento acústico
(principalmente em locação e em estúdios improvisados) e com o posicionamento das personagens,
tanto para a captação sonora quanto para a visual. Devendo-se ter assim, pelo menos, um local
(limitado espacialmente) ou um começo de tomada programado. Dessa forma, tem-se um sujeito-
da-câmera limitado em termos de locomoção, que acaba se fechando, em certo grau, para uma
imprevisibilidade e um transcorrer do presente, que só seriam alcançados com o som direto
sincronizado portátil. Essa liberdade alcançada pela imagem e pelo som já havia sido alcançada
pela imagem que não se preocupava com o som direto: em Eu, um negro pode-se notar a grande
mobilidade da câmera. Ao não se preocupar com o som direto, a imagem cinematográfica já
continha uma imagem bastante livre, mas o som ainda continuava preso em seus limites espaciais.
O som direto sincronizado portátil trouxe a possibilidade da voz que chega ao espectador abrir-se
para o transcorrer do presente do mundo vivido filmado, que antes era essencialmente
monopolizado pela imagem cinematográfica: a voz presente e viva em ato, agora, poderia sair
correndo pelo mundo e ser captada. É essa possibilidade, principalmente espacial (mas não apenas,
já que o transcorrer do presente com seus limites espaciais extrapolados lida com um grau maior
72
de imprevisibilidade, abrindo-se para novas possibilidades), que o som direto sincronizado portátil
traz, mais que o som direto sincronizado não portátil.
Nesse aspecto, a voz ganha uma autonomia, ela pode ser o agente protagonista do
primeiro presente. Autonomia diferente da das modalidades do discurso direto invisível, monólogo
e monólogo compartilhado, fundadas no segundo presente: elas são livres da sincronia e, portanto,
naturalmente separadas da imagem, podendo facilmente extrapolá-la, porém, no presente em que
o sujeito-da-câmera surdo filma ela é ainda secundária perante à imagem e, pode-se dizer, é
inexistente para o espectador. Enfim, a voz, agora, tal como os elementos visuais, está sujeita às
intempéries do mundo.
A voz que se funda com a imagem num mesmo presente lida ainda, em seu nascimento,
com outras dependências. O som direto sincronizado resiste em livrar-se da imagem, sua presença
busca a imagem, apesar de sua potencial autonomia. O som que é captado em ato de fabulação, no
mesmo presente do corpo que a enuncia, insiste em ancorar-se nos movimentos da imagem: a voz
que fala vem da boca do corpo que vemos. É como se a voz que se faz presente em ato de fabulação,
junto à imagem, estivesse fadada a nascer e morrer com o corpo que a enuncia. Aí temos um limite
que não é tecnológico: o som direto sincronizado portátil (e também não portátil) não tem a
obrigação de coincidir com a imagem vista pelo espectador apenas porque se funda num mesmo
presente que ela (imagem), ou seja, potencialmente a imagem pode ser excluída da captação do
sujeito-da-câmera, que em vez de surdo, pode ser cego.
Apesar de acontecer em baixa incidência, o presente captado pelo sujeito-da-câmera
cego, que é o presente captado essencialmente pelo microfone e que tem a fundação da imagem
num segundo presente, ocorre em Crônica de um verão de forma nítida. Há uma sequência
importante no filme, na qual se pode notar que o presente do sujeito-da-câmera ancora-se na voz,
e é a imagem que se separa da voz e que vem de um segundo presente, anterior ou posterior,
invertendo, de certa forma, os papéis costumeiros da imagem e da voz: há um close-up de Shopie
enquanto ela começa a falar suas primeiras palavras, então sua voz continua a fundar o presente,
enquanto a imagem vai para um outro presente, no qual aparece Shopie caminhando, atravessando
um terraço e mergulhando seus pés na água. Nota-se aí que a liberdade entre voz e imagem visual
não é a mesma da das modalidades anteriormente debatidas: não é a voz que se coloca num segundo
presente, e sim a imagem que se desancora deste presente compartilhado e torna-se a fabulação da
73
pós-produção. Em Pour la suite du monde, notaremos vários trechos que se assemelham a esse.
Tal situação poderia já ocorrer com o som direto sincronizado não portátil, mas parece que o
impulso para que ela acontecesse dependia dos aparatos portáteis, um impulso que gerasse o
potencial da não sincronização. Por isso que, apesar de a voz ser majoritariamente sincronizada e
portátil, podemos chamá-la de discurso direto potencialmente não sincronizado, já que a
prerrogativa de autonomia e liberdade da voz, que emerge do mudo em seu transcorrer, ganha
destaque. Não é demais ressaltar que esta voz mais autônoma já ocorria em Eu, um negro, sem o
som direto sincronizado: trata-se aqui, apenas, de uma nova categoria dessa autonomia. Uma
autonomia que pode ser, ao mesmo tempo, espacial e conteudística, fundada no primeiro presente
do ato de fabulação, na presença de um sujeito-da-câmera que pode (ou não) ser ou se fazer de
cego. Autonomia (potencialmente espacial e conteudística) que já se notava no campo das imagens.
Breves considerações sobre a análise dos três filmes
Nossos objetivos foram (1) compreender como a voz se faz presente nos filmes de
improvisação de Jean Rouch aqui utilizados como fonte, (2) comparar as análises sonoro-
tecnológicas de cada filme entre si, verificando semelhanças e diferenças, (3) articular o estudo do
som fílmico com teorias mais abrangentes do documentário, ponderando, sobretudo, o debate entre
o fetiche da tecnologia, que sugere que a chegada da captação sonora direta sincronizada foi
elemento fundamental para o surgimento do documentário moderno, e a desvalorização da
inovação tecnológica como propulsora de novos fazeres. Pôde-se, assim, verificar as novidades que
o cinema verdade de Jean Rouch traz no âmbito da captação das vozes e de sua articulação com as
imagens, compreendendo o lugar do som pós-produzido, do som direto sincronizado não portátil e
do som direto sincronizado portátil na composição da trilha sonora.
Num primeiro momento, vimos que Eu, um negro, mesmo sem os aparatos de captação
direta sincronizada, trabalha com articulações sofisticadas no que diz respeito às vozes. Com as
modalidades do discurso direto visível, discurso direto invisível, monólogo e monólogo
compartilhado, diferentes patamares e camadas de fabulação são atingidas. Mas também notamos
que essas modalidades dependem essencialmente de um segundo presente, o da captação sonora
da pós-produção, quando as imagens visuais do sujeito-da-câmera já foram captadas e editadas.
74
São modalidades de vozes que estão naturalmente separadas da imagem captada pelo sujeito-da-
câmera surdo e que, por consequência, têm a potencialidade de extrapolá-la em conteúdo, contudo
são modalidades que se ancoram, de forma geral e em graus diferentes, na égide do transcorrer do
presente da imagem e se limitam espacialmente (as vozes são tomadas em estúdio). No balanço da
análise vimos que os usos das vozes presentes no filme contemplam muitos dos aspectos que são
atribuídos ao documentário moderno: a fabulação, a participação e a intervenção do cineasta na
circunstância da tomada e a reflexividade, podendo-se verificar que o cinema verdade não é
debitário exclusivamente, em príncipio, do som direto sincronizado.
Já o diferencial de A pirâmide humana em relação a Eu, um negro localiza-se
fundamentalmente na modalidade do discurso direto sincronizado, voz que se funda no mesmo
presente da imagem captada e vista pelo espectador, possibilitando uma fabulação de camadas
profundas advindas diretamente da circunstância da tomada. A fabulação profunda que já acontecia
nas vozes nas modalidades do discurso direto invisível, monólogo e monólogo compartilhado,
fundadas num segundo presente, pode, agora, ser atingida pela voz que transcorre no mundo na
presença do sujeito-da-câmera que vê e que ouve ao mesmo tempo. Com a captação do som direto
sincronizado, a imagem e o som improvisados podem flexionar-se entre si no momento de seu
nascimento, por fundarem-se num mesmo presente. Essa é a nova possibilidade de fabulação que
os aparatos de som direto sincronizado podem trazer: tanto o som quanto a imagem podem fundar-
se e lançar-se no transcorrer de um mesmo presente, por mais que limitado espacialmente.
Em Crônica de um verão, as novidades revelam-se nas diferentes possibilidades de
articulação e relação entre imagem e som, e também na liberdade espacial que a voz que fala ganha
no transcorrer do presente. As relações podem ser outras porque a voz ganha autonomia, pode
caminhar em meio às imprevisibilidades do transcorrer do primeiro presente, fundada junta à
imagem. Esse aspecto é debitário dos aparatos de captação sonora direta sincronizada portátil, já
que apenas agora o sujeito-da-câmera pode sair correndo atrás da voz que perambula, tanto quanto
a imagem, no mundo fílmico. Vimos também que a voz continua presa à imagem, ela resiste,
continua a sair da boca que vemos como espectadores do filme. Em contrapartida, temos em
Crônica de um verão um interessante exemplo no qual a voz se torna o elemento fundamental do
presente filmado pelo sujeito-da-câmera, com a imagem tornando-se, por ora, um componente do
som. Nesse sentido, vimos que, com o som direto sincronizado não portátil, algo semelhante já
75
poderia ocorrer, ou seja, a inovação tecnológica não era fundamental, mas foi a propulsora principal
para abrir este novo modo da voz fazer-se presente, o discurso direto potencialmente não
sincronizado, que confere potencial autonomia e liberdade. Essa potencialidade é relevante pois
entrará em jogo no captar do mundo – por mais que, majoritariamente, a voz continue presa a seu
corpo.
Do balanço das três análises, podemos inferir que as bases de mudança que
possibilitaram o nascimento do cinema verdade não foram debitárias das novas tecnologias de
captação sonora que chegavam. Entretanto, podemos notar que elas inflexionaram ou trouxeram
novas maneiras do som fazer-se presente e que, por conseguinte, transformaram métodos, modos
de produção e resultados fílmicos.
Com o som captado essencialmente na pós-produção, temos necessariamente um
segundo presente para que haja a fabulação da voz, assim, temos também uma imagem que se
mostra fundamentalmente mais importante que o som no primeiro transcorrer do presente, ao
mesmo tempo em que a voz pode extrapolar com facilidade o conteúdo daquilo que é visto, por
nascerem (a imagem visual e a voz) separadas. Com a captação do som direto sincronizado, a
fabulação da voz abre-se também para suas inflexões do presente compartilhado com a imagem,
podendo ambas interferir-se definitivamente no transcorrer do presente, já que nascem e fundam-
se juntas na presença de um sujeito-da-câmera que vê e ouve ao mesmo tempo. Assim a voz ganha
uma autonomia que ainda não lhe pertencia: ela pode determinar o primeiro presente. Com o som
direto sincronizado portátil a voz pode potencialmente vagar pelo mundo; e também se descobre
que a voz não precisa se preocupar com a imagem, ela ganha potencialmente a liberdade de fundar
sozinha, com o sujeito-da-câmera cego, o presente.
Num primeiro momento, temos o som como componente ou dependente do impulso da
imagem, mesmo podendo extrapolá-lo. Num segundo momento, vemos que o som pode também
se fundar junto com a imagem, havendo uma forte relação de interdependência. Num terceiro
momento, vemos surgir o som que potencialmente pode atingir a mesma autonomia e liberdade da
imagem, dividindo plenamente com ela a responsabilidade do resultado fílmico.
76
3.2.2 A voz do mundo
Se podemos afirmar que aquilo que é filmado no cinema verdade existe, em grande
parte, devido à presença, interação, participação, intervenção etc. do grupo realizador, podemos
dizer que no cinema direto aquilo que é filmado aconteceria no mundo histórico mesmo na ausência
do grupo realizador do filme. Isto não significa dizer que o grupo realizador no cinema direto não
flexione a circunstância de mundo quando se estabelece a circunstância de tomada, mas seus
valores éticos são da imparcialidade e do recuo (RAMOS, 2008, p. 36), ou seja, a intervenção
explícita do grupo realizador, diferentemente do cinema verdade, é reduzida e vista com maus
olhos.
Dessa forma, as vozes do cinema direto mantêm certa independência das imposições
advindas da existência de uma circunstância de tomada, pois se reportam mais imediatamente às
coisas do mundo histórico, que existiriam mesmo sem a presença do grupo realizador do filme, por
mais que com possíveis diferenças, dependendo do grau de extraordinário e de intensidade do
ocorrido44.
No filme Primárias (1960) de Robert Drew, um dos marcos do cinema direto, por
exemplo, os momentos de tensão pré-eleitoral, eventos, reuniões, discursos etc., é possível de se
afirmar, reportam-se muito mais às causas e consequências exteriores ao filme. De certa forma,
podemos dizer que o filme não é importante o suficiente para modificar em grandes proporções
aquilo que é filmado: as emergências do mundo histórico o superam. O mesmo podemos dizer da
histeria das fãs de Paul Anka em Lonely boy (1961) de Roman Kroiter e Wolf Koenig; das
discussões, indagações, dúvidas e conversas presentes na tensão figurada pelo governador do
Alabama George Wallace, o procurador geral do Estados Unidos Robert Kennedy e os estudantes
Vivian Malone e James Hood, admitidos na Universidade do Alabama no filme Crisis: behind a
presidential commitment (1963) de Robert Drew; do assédio e exploração da imprensa sobre a mãe,
e sua família, que gestou filhos quíntuplos em Happy mother’s day (1963) de Richard Leacock e
Joyce Chopra; da morte de Dorothy e da reação das crianças frente ao fato em Warrendale (1967)
44
Verificar Mas afinal... O que é mesmo documentário?, p. 90-93, de Ramos (2008), e o ensaio “A cicatriz da tomada:
documentário, ética e imagem-intensa”, de Ramos (2005).
77
de Allan King; do assédio e do abuso cotidiano sofrido pelos reclusos em Titicut folies (1967) de
Frederick Wiseman; da crise de vendas de Paul Brennan em Salesman (1968) dos irmãos Maysles.
Fazer esse tipo de consideração, não significa dizer que a câmera passa despercebida
no cinema direto ou que não catalisa ações. Em Crisis, por exemplo, George Wallace, um
personagem bastante exibicionista, reporta-se inúmeras vezes diretamente à câmera e ao
microfone. Em Lonely boy e Happy mother’s day vemos e ouvimos depoimentos que se reportam
diretamente à câmera e ao microfone. Em Warrendale, a presença da equipe é trazida à tona tanto
por parte das crianças quanto por partes dos responsáveis pela instituição sobre a qual o filme se
dedica. Situações semelhantes também ocorrem em The Beatles USA (1964) dos irmãos Maysles.
Contudo, essa “intervenção” do sujeito-da-câmera é fruto mais direto da própria atitude do
filmado, que se liga mais diretamente a uma situação mundana do que a uma situação criada pela
equipe realizadora, diferente do sujeito-da-câmera do cinema verdade, que, antes de esperar a
atitude do personagem e uma situação mundana pré-estabelecida, coloca-o numa situação
inventada/provocada/instigada para o filme.
Ou seja, as vozes do cinema direto distanciam-se da voz fabuladora do cinema verdade,
que se reportam também, obviamente, ao mundo, mas que são extremamente instigadas e
flexionadas pela presença da câmera. Ou, em outras palavras: no cinema verdade o filme em si é
mais importante e responsável perante o ocorrido do que nestes filmes do cinema direto.
Num primeiro momento do cinema direto, do qual podemos citar Primárias, Lonely
boy, Happy mother’s day, Crisis, The Beatles USA e Meet Marlon Brando (1966), dos irmães
Maysles, os filmes buscam filmar, sobretudo, pessoas famosas ou pessoas em casos relevantes para
a mídia em eventos e marcos significativos. Num segundo momento, do qual podemos citar, por
exemplo, Warrendale (1967), de Allan King, Titicut Follies (1967), de Frederick Wiseman, Don’t
look back (1967), de D. A. Pennebaker, e Salesman (1968), de Albert Maysles, David Maysles e
Charlotte Mitchell Zwerin, existe uma maior valorização de sujeitos e instituições em seus
cotidianos – o que ocorre concomitantemente ao aperfeiçoamento do “grupo sincrônico
cinematográfico ligeiro”. Nesses filmes existe uma flexibilização maior do grupo realizador em
relação àquilo que ocorre diante à câmera. São filmes nos quais as câmeras estão próximas das
pessoas, abertas para o cotidiano e o desenrolar mundano diminuído de interferência. A influência
78
da câmera no porvir não se aproxima nem em termos éticos e nem estilísticos daquilo que notamos
no cinema verdade.
E, em maior e menor grau, iremos notar que as vozes reflexivas, existenciais e
filosóficas do cinema verdade também se fazem presentes no cinema direto, mas de outra forma.
Se no cinema verdade os filmados são instigados a desenvolver a oralidade, em suas fabulações,
no cinema direto estas vozes surgem mais como a escolha do que filmar e selecionar, de saber
montar personagens e momentos e de eleger as vozes do mundo. Aquilo que Bob Dylan, em Don’t
look back, fala em suas declarações, conversas e entrevistas, assim como Paul Brennan, em
Salesman, em suas vendas e conversas com colegas de trabalho, mostra que o cinema direto, além
de não tratar simplesmente de personalidades e de momentos únicos, é capaz de revelar as
angústias, felicidades, dúvidas, formulações etc. dos sujeitos filmados.
3.2.2.1 Diferentes maneiras da voz se fazer presente no cinema direto
No cinema direto temos um rico leque de tomadas sonoras da voz. A discussão é ampla,
mas pretendo focá-la em poucas perspectivas, entendidas sob o manto da presença na tomada, e
que não se separam completamente: o protagonismo da voz; o não controle da emissão da voz; a
separação da voz e da imagem; evento versus cotidiano.
Richard Leacock (1961, p. 22), no primeiro parágrafo do artigo “For an uncontrolled
cinema”, infere sobre a importância que a fala tem na gravação das relações humanas:
Em 1908, um cinejornal foi feito mostrando Tolstoi conversando com
peticionários na varanda de sua casa em Yasnaya Polyana [nome da residência de
Tolstoi]. E embora seja uma notável visão, é frustrante não poder ouvir o que ele
está dizendo a essas pessoas! E aí está o problema. Como você poderia gravar as
relações humanas sem aquele meio de comunicação exclusivamente humano – a
fala?
Uma das novidades do cinema direto, podemos dizer, viria da possibilidade de gravar
aquilo que era dito pelo corpo filmado – ou, ao menos, que se localizava num extracampo bastante
homogêneo em termos de espaço e tempo com o filmado. Ou seja, uma novidade que viria da
superação da frustração apontada por Leacock.
Essa perspectiva – na qual a voz exerce um papel fundamental na observação das
relações humanas – marcaria a produção do cinema direto. Um cinema que transborda em voz e
que impele, na maior parte do tempo, a música – que sempre teve sua cadeira cativa na tradição
79
documentária – para os espaços vazios da banda sonora, deixados pela voz em seus momentos de
silêncio ou inexistência. No documentário clássico, a voz já exercia, por vias distintas, uma
importância notável, mas havia espaço suficiente para música e voz caminharem em paralelo,
sobrepondo-se (por mais que fosse comum a fatia musical estar mais baixa, em termos de volume,
quando ambas eram levadas concomitantemente ao espectador). A música não vai desaparecer no
cinema direto – nem em termos de articulação fílmica e nem como matéria indicial –, mas o intuito
em produzir uma obra cuja circunstância de tomada se assemelhe ao máximo, ao menos em termos
visuais e sonoros, à circunstância de mundo no qual o sujeito-da-câmera se faz presente inibe a
sobreposição de elementos sonoros advindos de uma exagerada heterogeneidade espacial e
temporal.
Nos filmes supracitados, iremos notar essa marca, que pode ser entendida sob o
seguinte prisma: observar e captar as relações humanas, não a partir do silêncio, mas a partir do
protagonismo da voz. (Mais adiante falaremos sobre os casos nos quais os corpos filmados não
falam e sobre os casos nos quais o microfone e a câmera não focam nos mesmos objetos ou numa
mesma direção.)
Esse protagonismo pode ser notado na atração que a voz exerce sobre a câmera, que
obviamente varia de filme para filme, senão de tomada para tomada. No Primárias, por exemplo,
são raros os momentos em que o espaço filmado não envolve uma situação que privilegie a voz,
seja nos discursos, nas conversas pelo telefone, nos inúmeros “thank you” de John Kennedy em
meio a volumosos grupos de eleitores. Algo semelhante ocorre também em Lonely boy: os espaços
e momentos eleitos para serem gravados pelo sujeito-da-câmera são aqueles em que a voz é
determinante no tipo de relação humana que se estabelece e que, de certa forma, ditará o porvir dos
elementos do mundo e da circunstância de tomada. E quando, no caso de Lonely boy, a voz não é
fruto de uma conversa, depoimento ou histeria, aparece na forma de canto, nos momentos em que
vemos e ouvimos Paul Anka, o protagonista do filme, cantar45. Situação que irá, de forma
semelhante, reaparecer em Don’t look back com Bob Dylan. No Crisis, há situações em que a voz
exerce ainda mais atração: a câmera busca frequentemente a voz fora de campo – eleita na situação
45
Em Lonely boy existem tanto trechos com captação sincrônica de som e imagem das performances de Paul Anka
quanto performances cujo o som que escutamos foi gravado em estúdio.
80
para ser gravada pelo sujeito que capta o som – até conseguir localizar o corpo, rosto ou boca de
quem a emite, unindo-os como se fosse um elemento uno.
Happy mother’s day, ao menos nos primeiros dez minutos de filme e nos últimos dois,
escapa um pouco das tomadas cuja voz do filmado exerce uma centralidade determinadora,
sobretudo em sua característica semântica. Um dos motivos é que, nessa primeira parte do filme, a
voz invisível aproveita as tomadas das personagens centrais do filme para apresentá-las segundo
os interesses da narrativa. Outro motivo é que há uma curiosidade aparente por parte dos
realizadores – próximo de um interesse pelo exótico – de saber como a família dos filhos quíntuplos
passa os dias. Esse tipo de interesse não foca exclusivamente na voz, pois envolve uma preocupação
em observar a maneira que os membros da família se comportam no espaço e a materialidade que
os envolve a partir de um olhar mais distante. Há também a curiosidade de filmar os quíntuplos,
que, no momento da filmagem, possuem aproximadamente duas semanas, e aí o interesse da
tomada, pode-se dizer, é mais próximo de uma comprovação visual de que os bebês existem do
que de entendê-los segundo a voz daqueles que os circundam no hospital. Algumas situações
semelhantes a essa também ocorrerão em Warrendale, quando a contenção física, os gritos e os
choros das crianças são mais importantes que a voz em seu âmbito semântico. Contudo, podemos
dizer que a voz, assim como nos documentários supracitados, ainda exerce semelhante atração no
restante do filme. Como acontece no The Beatle USA, que contém, também, diversos momentos
em que a voz não é a protagonista: planos em que o interesse se localiza na feição, na atitude e no
movimento daquele que é filmado, mais do que na sua fala.
As tomadas de máquinas, de trabalhadores em exercício, da natureza, de prédios, de
aglomerações à distância e as master shots das sinfonias metropolitanas e do documentário clássico
vão cedendo espaço às tomadas em que o sujeito-da-câmera está mais próximo dos corpos,
buscando filmar os seres humanos nos momentos em que estabelecem relações com o mundo e
entre si a partir da fala.
O documentário, a partir da Segunda Guerra, já dá indícios de uma nova preocupação
de tomada. Como discutido anteriormente, a voz visível começa a ganhar destaque e com ela as
tomadas em que as relações humanas são mediadas pela fala. Dois exemplos centrais disso são
Louisiana story e Farrebique, ambos da década de 1940. Os seres humanos antes da chegada do
documentário moderno eram encarados, muitas vezes, pelo seu papel e lugar social ou como
81
representantes de determinados grupos, de uma forma menos individualizada; a mudança de foco
do ser social para o ser detentor de especificidades (por mais que cumprindo, por vezes, um papel
simbólico) ocorre progressivamente ao longo das décadas de 1930, 1940, 1950 e 1960 na tradição
documentária. E um dos caminhos eleitos para evidenciar as especifidades dos seres presentes nos
filmes é a fala.
É no caminho dessa individualização que também podemos notar as diferenças entre a
voz invisível do documentário clássico e do documentário moderno. Raros foram os casos no
documentário clássico em que aquele que era filmado tinha seu nome revelado pelo narrador. Nos
filmes que são foco nesse item, por exemplo, um dos papéis mais evidentes da voz invisível é
revelar a identidade das personagens principais, onde e quando estão e a trama ou situação na qual
estão envolvidas. Nesse sentido, não é nada conflituoso pensar a existência da voz invisível no
cinema direto, que, por sinal, é bastante abundante na primeira metade da década de 1960. Da
mesma forma que não é conflituoso pensar a edição e a montagem. Os recursos de articulação
fílmica, assim como a maneira do sujeito-da-câmera se portar na tomada, parece querer previlegiar
a individualidade ou as especificidades das personagens, ou, ao menos, das situações das quais
fazem parte.
A voz moderna do cinema direto vem se conformar, além desses contornos, pelo tipo
de tomada ao qual o sujeito-da-câmera se condiciona a captar, marcadamente distinto daquele do
documentário clássico (mesmo aquele que já tende a valorizar a voz visível). E podemos entender
a diferença a partir da discussão sobre encenação que Fernão Ramos desenvolve. Do lado do
documentário clássico a balança pesa para o lado da encenação construída, e do lado do cinema
direto a balança pesa para o lado da encen-ação. De forma derivada, podemos pensar esses pesos
a partir, também, de uma ideia de controle e não controle sobre a emissão da voz na tomada.
A marca ética do cinema direto, para além do “dar a voz ao filmado”, preza pelo não
controle da emissão da voz, que vai depender, em última instância, da atitude do próprio filmado
em sua circunstância de mundo – flexionada pela presença do sujeito-da-câmera. E esse não
controle imprime duas situações bastante particulares para a tomada e para a pós-produção. O não
controle ocorre tanto do ponto de vista do conteúdo semântico, do volume, das características
tímbricas, da histeria, da tranquilidade da voz etc. quanto da irrupção da voz em si, do não controle
sobre o momento em que ela emerge no mundo e para o sujeito-da-câmera. Obviamente esse não
82
controle pode ser ponderado, e aí notaremos a importância do sujeito-da-câmera na tomada: saber
o momento e a situação de ligar a câmera, sua capacidade de tirar proveito da circunstância,
operando, de certa forma, uma edição no próprio filmar. Mas essa edição não é suficiente para
transformar o filmado numa narrativa fílmica, a pós-produção é valiosa e a variedade e quantidade
de tomadas requer um trabalho árduo na conexão e articulação de todo material no caminho eleito
para a narrativa.
Essa ideia de não controle se tornará uma marca de autenticidade do real paradigmática
na tradição documentária, ao menos em sua crítica. Podemos dizer que o que está embutido no não
controle é o potencial dos extremos, aberto para os acontecimentos de ordem mundana. Localizado
num espaço-tempo que está para além do controle do grupo realizador, aquilo que é filmado pode
potencialmente variar entre uma situação qualquer e uma situação intensa. E uma das grandes
chaves do cinema direto está na administração desse potencial.
O não controle é contrabalanceado pela capacidade de previsão do sujeito-da-câmera.
Se repararmos bem, o grosso das imagens e dos sons da produção do cinema direto, em algum
âmbito, perpassa o previsível – que não é comparável ao controle e previsibilidade que ocorre no
documentário clássico, caracterizado pela encenação-construída.
Tomemos, por exemplo, um trecho de Crisis. No dia programado para a efetivação da
matrícula de Vivian Malone, que seria a primeira estudante negra a efetivar a matrícula na
Universidade do Alabama, o procurador adjunto de Robert Kennedy, Nicholas Katzenbach, tentará
garantir a matrícula da estudante, sob ordem judicial, caso o governador do Alabama, George
Wallace, impeça-a. O possível confronto tem seu espaço-tempo quase que precisamente
delimitado. O espectador, de antemão, sabe qual será a postura de Katzenbach e, com bastante
proximidade, sabe o que irá dizer, já que a estratégia foi evidenciada no filme, anteriormente. A
sequência do confronto estrutura-se, então, na previsibilidade do comportamento de Katzenbach,
de um lado, e na imprevisibilidade da atitude/resposta de Wallace (e as possíveis consequências),
do outro lado – apesar de existir duas resoluções prováveis, a aceitação ou o impedimento/negação
da matrícula por parte do governador. A situação localiza-se na esfera do não controle, no que diz
respeito ao comportamento dos filmados, já que respondem primordialmente ao mundo, e não à
câmera; ao mesmo tempo em que o sujeito-da-câmera, mesmo não tendo controle, sabe, em partes,
83
o que vai acontecer e sabe o que ainda está em aberto; um nó que só se resolverá no próprio
desenrolar da situação, um presente cujo sujeito-da-câmera compartilha46.
Outro exemplo, um pouco mais geral, pode ser tirado do Happy mother’s day. Andrew
Fischer, mãe dos quíntuplos, é alvo de observação e intromissão, não apenas da câmera de Leacock
e do microfone de Chopra, mas de toda uma imprensa e cidade curiosa. Existe um desconforto e
instabilidade nessa relação entre observadores/intrometidos/curiosos e Andrew Fischer, e, desde a
primeira tomada em que ela aparece, esse aspecto já pode ser notado: quando cercada por
repórteres, após duas breves respostas (“I don’t have many feelings” e “Wonderful”), muda sua
fisionomia, silencia-se inesperadamente ante as perguntas dos repórteres (sem sabermos o motivo
exatamente) e vai em direção ao carro. Andrew Fischer, como podemos notar em outras tomadas,
é uma personagem que no contato com o público, com a imprensa e com o sujeito-da-câmera pode
fugir do esperado e do protocolo: não sabemos se irá sorrir, entristecer-se, se falará normalmente
ou rispidamente, se não falará. Como personagem, ela traz a imprevisibilidade ordinária mundana
que tanto interessa ao cinema direto, que permite o exercício do não controle e, consequentemente,
valoriza e valida a perspectiva observativa. E as situações pontenciais nas quais esses aspectos
entram em jogo envolvem, sobretudo, a voz, seja nas perguntas que a ela dirigem, nas suas
respostas inesperadas, no silenciamento de sua voz etc. Essa imprevisibilidade ira se extrapolar em
filmes como Warrendale e Titicut folies, nos quais as personagens principais carregam em si, fruto
ou não dos problemas de saúde mental que as acomete, uma instabilidade emocional e
comportamental.
É nesse potencial também que os irmãos Maysles parecem investir em Meet Marlon
Brando, um filme repleto de respostas inesperadas, tal como anuncia a voz invisível no começo do
filme: “[...] os repórteres fazem-lhe várias perguntas previsíveis, mas ele [Marlon Brando] lhes dá
poucas repostas previsíveis”47.
O jogo que lida com essas esferas – a do não controle e da (im)previsibilidade –
caracteriza a tomada sonora do cinema direto em sua dimensão observativa como um todo. Lonely
boy, por exemplo, lida com circunstâncias de tomada potencialmente mais previsíveis que Crisis,
mas que, da mesma forma, não estão sob o controle decisivo da equipe realizadora, obedecem a
46
Esse exemplo é emblemático e figura dentro daquilo que Stephen Mamber (1972, p. 79-108) chama de crisis
structure.
47
“[…] the reporters ask many predictable questions but he [Marlon Brando] gives few predictable answers.”
84
uma ordem de outra grandeza – tal como as primárias que (provavelmente) não deixariam de
ocorrer caso o filme Primárias não existisse. De certa forma, é afirmar que a previsibilidade existe
virtualmente, já que o não controle pressupõe o imprevisível, e, ao mesmo tempo, afirmar que a
capacidade de prever – ou o interesse ou não em prever ou de se colocar numa situação
(im)previsível – determina parte dos traços estilísticos do grupo realizador. É desse meandro que a
riqueza da voz do cinema direto, em seu viés mais observativo, parece surgir para o espectador,
um tipo de voz que até então não figurava nas produções documentárias, que compartilha com o
sujeito-da-câmera e com a circunstância de tomada seu potencial de (im)previsibilidade
tipicamente mundano. É como a negociação de uma união: o mundo e suas vozes entram com sua
imprevisibilidade e o sujeito-da-câmera entra com sua capacidade de prever, num esquema de
regulação cujo não controle é o voto de honra que deve repercurtir no espectador. As diferentes
tomadas do cinema direto irão girar, em grande parte, em torno dessas três moedas
(imprevisibilidade, previsibilidade, não controle), como se, em cada tomada, a negociação
privilegiasse ou tendesse a alguns aspectos de cada uma delas no momento da conformação da
circunstância de mundo em circunstância de tomada, num contrato que a pós-produção também
deve fazer valer.
E, ao falar de pós-produção, temos que nos ater a um ponto muitas vezes negligenciado
quando o assunto é cinema direto: as vozes e as imagens, ou melhor, o microfone e a câmera nem
sempre coincidem na direcionalidade e no foco. E essa não coincidência pode ser fruto tanto do
processo de articulação e edição das imagens e dos sons quanto da “edição” operada pelo sujeito-
da-câmera (geralmente uma pessoa responsável pelo microfone e outra pela câmera) na própria
circunstância de tomada.
Sobre esse aspecto, cabe pontuar que, apesar de existir a ideia, principalmente por parte
dos norte-americanos, de que “qualquer tipo de ensaio [encenação] ou pós-sincronização era
imoral” (SHIVAS, 1963, p. 13 apud WINSTON, 1993, p. 45-46), sobretudo na primeira fase de
desenvolvimento do cinema direto, a pós-produção e suas ferramentas não foram abolidas, uma
vez que não é um cinema de “plano sequência infinito” e tampouco um cinema “panóptico”. Sob
a perspectiva ética, o ensaio (encenação) e a pós-sincronização eram evitadas, sobretudo, quando
a circunstância de mundo tendia a ser flexionada em grau elevado pela equipe realizadora na
conformação do filme para o espectador, fosse no presente da tomada ou na pós-produção; contudo,
85
na prática, a edição, a montagem e a pós-sincronização, por mais que evitadas, faziam-se presentes
e eram necessárias, em maior ou menor grau, como em qualquer outro tipo de filme, na concepção
da narrativa. Cabe frisar que isso não é uma acusação – nem uma questão, como bem nota Fernão
Ramos (2008, p. 293-294), “que tem no fundo a obsessão da ideologia dominante contemporânea
em fazer girar a desconstrução do trabalho discursivo para promover um ponto cego na ética do
direto”48 –, mas sim evidências deixadas pelas marcas inerentes às demandas éticas e estilísticas
da produção desse cinema direto.
Retornando ao assunto, a não coincidência entre imagem e voz (excluindo-se da
discussão a voz invisível) aparecerá, podemos dizer, entre dois extremos (às vezes mais próximo
de um, às vezes mais próximo de outro): a voz e a imagem são homogêneas entre si, tanto na
questão do espaço quanto do tempo, mas aquilo que vemos não é o foco de emissão do que
escutamos, estão ligadas pela intersecção do campo e extracampo da câmera e do microfone; a voz
e a imagem não são sincronizadas, são heterogêneas entre si no que diz respeito ao espaço e/ou
tempo de tomada.
Um dos pontos interessantes dos planos nos quais a não coincidência aparece é que a
voz, em seu momento de emissão e na construção fílmica, rebate e reflete o/no mundo e os/nos
seus elementos, podendo trazer à tona no plano uma dimensão contemplativa, emotiva, afetiva etc.
– principalmente no caso em que as vozes e as imagens ainda mantêm uma certa homogeneidade
entre si. No caso de manterem uma proximidade maior com a heterogeneidade, essa não
coincidência pode revelar também uma interpretação mais explícita da equipe realizadora, fundada
na sobreposição das imagens e vozes, sobre o transcorrer do mundo ou, simplesmente, a utilização
de uma imagem cujo som captado em sincronia (ou o contrário) não é de interesse, mas mesmo
assim é aproveitada.
Obviamente, os motivos, interesses e mesmo a identificação desses planos e suas
diferenças (que com toda certeza vão muito além do aqui exposto) não são evidentes e nem de fácil
aferição. Contudo, acredito ser relevante notar sua frequente presença, que se conforma com a
névoa do direto sincronizado portátil.
48
Ramos faz esse comentário ao referir-se à entrevista de Albert Maysles feita por João Moreira Salles, na qual Salles
conversa com Maysles sobre os recursos de reaction shot e cutaway utilizados na montagem de sua produção.
86
Meet Marlon Brando, por exemplo, é rico em planos cujos focos sonoro e visual não
recaem sobre o mesmo elemento. São inúmeros os planos em que, no âmbito sonoro, o foco está
na pergunta dos jornalistas, mas, no âmbito visual, o foco está no rosto de Marlon Brando. Essa
construção, operada na própria tomada, não busca a junção da voz ao corpo que fala; a relação
entre imagem e som, nesse tipo de construção, busca o efeito da voz no mundo. No caso específico,
revela a dimensão contemplativa, emotiva, afetiva etc. de Marlon Brando em silêncio frente ao que
é falado, que em muitos momentos do filme pode ser entendida como dimensão irônica e sarcástica
(que entra em acordo também com as respostas que dá aos jornalistas), revelada, por exemplo, por
um sorriso, por um olhar, por um franzir de rosto. Em Warrendale, a feição das crianças frente às
vozes que a circundam é, também, bastante privilegiada nas tomadas.
Na pós-produção do cinema ficcional esse tipo de recurso é recorrente e pode ser
chamado de forma geral de reaction shot, que, resumidamente, é a construção (que não envolve
necessariamente a voz), na montagem, de um plano que revela a reação de certos elementos ante a
ação de outros elementos. Em Meet Marlon Brando, essa “montagem” é operada no próprio
presente da tomada, circunscrita na presença do acontecer único, tal como em Warrendale. E é essa
a carga diferencial que o cinema direto irá manifestar nesse tipo de situação/construção, numa
escolha em que o sujeito-da-câmera não pode voltar atrás, que anda de mãos dadas com o tempo
mundano, que não retrocede. O mesmo recurso irá também aparecer como fruto do trabalho da
pós-produção no cinema direto, como podemos notar, por exemplo, ao longo das sequências dos
discursos de John Kennedy (e de sua esposa Jacqueline Kennedy) e de Hubert Humphrey em
Primárias. E a construção, nesse caso, será semelhante àquela presente no domínio ficcional –
apesar de ser relativamente homogênea, por estar circunscrita num mesmo lapso espaço-temporal,
é mais heterogênea do que aquela que ocorre em Meet Marlon Brando, devido à intervenção direta
da pós-produção, que une vozes e imagens que não ocorrem no mundo no mesmo exato momento,
apenas num mesmo lapso.
Em Primárias, também teremos diversos outros planos em que o foco sonoro e visual
não coincidem. Mas, diferentemente daquilo que sobressai em Meet Marlon Brando, teremos, em
alguns planos, uma dimensão que não é a da reação, ou seja, uma situação na qual a voz do foco
sonoro não rebate e nem reflete diretamente o/no mundo e o/nos seus elementos. O que irá
sobressair é a coexistência espaço-temporal dos elementos em uma certa independência, quando
87
mantida a homogeneidade entre som e imagem na circunstância de tomada (ou mesmo a
coexistência espaço-temporal no suporte fílmico, construída na pós-produção, quando mantida a
heterogeneidade entre som e imagem). Não estamos falando de independência absoluta, já que, de
uma forma ou de outra, as ações e a simples presença (e o porquê da presença simultânea) no
mesmo espaço-tempo afeta os elementos entre si e a percepção do espectador.
O interessante desse recurso é que iremos ter dois focos paralelos na narrativa, unidos
pela coexistência, mas distantes do reaction shot. Distantes porque em vez de se construir uma
relação de catarse direta entre os elementos para o espectador, deixa-se resvalar nele uma maior
carga de liberdade, mais próxima da liberdade observativa mundana, ou seja, caberá ao espectador
focar ou não sua percepção num elemento específico, interpretar/identificar/inventar ou não a
relação dos elementos.
Nos últimos quinze minutos de Primárias – especialmente nos momentos em que
Kennedy e sua equipe (e conhecidos próximos) se atualizam sobre o andamento das eleições
primárias, em meio a planos que se aproximam da ideia de reaction shot –, teremos alguns planos
em que a independência entre os elementos visuais e as vozes, do ponto de vista de foco narrativo,
é trazida à tona. Podemos notar tal característica quando, por exemplo, o foco, no âmbito sonoro,
está na voz de John Kennedy (e de outros homens) e, no âmbito visual, está em Jacqueline Kennedy
(e em outras mulheres), que agem e conversam sob uma demanda de ação não coincidente e que,
tampouco, se interferem e causam reações imediatas diretas entre si.
Em outro trecho, a sequência – que é fruto de trabalho de pós-produção, que dura mais
de um minuto e que também se faz presente nos últimos quinze minutos de Primárias – na qual
temos planos que enquadram pernas e sapatos enquanto, no âmbito sonoro, escutamos vozes que
falam sobre as primárias, é também um exemplo explícito desse tipo de construção – que se
aproxima da construção que denominamos, quando discutimos a voz em Crônica de um verão, de
discurso direto potencialmente não sincronizado. O que aí está em jogo é a autonomia que a voz e
a imagem ganham no seu existir. Autonomia que, dentro da estilística e ética do direto, transforma-
se em uma certa liberdade espectatorial, carregada das marcas da existência mundana.
Essas estratégias coexistem com aquela voz, já bastante debatida, que está presa ao
corpo que a emite, fruto direto das possibilidades criadas pelos aparatos da captação sincronizada
88
e portátil. E são todas elas que, apesar de suas diferentes maneiras de se fazerem presentes para o
espectador, trarão a carga do transcorrer mundano, que marca a produção do cinema direto.
Para além dessas diferentes formas da voz se fazer presente, existe uma última
característica que gostaria de discutir. Como mencionado anteriormente, podemos traçar, ao menos
na década de 1960, dois grupos de filmes do cinema direto. Um mais localizado na primeira metade
da década e outro na segunda metade. As estratégias existentes no primeiro grupo não são abolidas
pelo segundo, e tampouco existe um racha estilístico e ético que os separem definitivamente. Mas
a roupagem, determinada por outras peocupações do que e como filmar, fará surtir outras
características. Warrendale, Titicut follies e Salesman fornecem-nos, nesse sentido, um rico leque
de exemplos. Isso não significa dizer que exista uma barreira estanque entre esses dois grupos. A
separação é, mais que tudo, uma estratégia para pensá-los. Nos próximos parágrafos, buscaremos
ressaltar mais as diferenças do que as semelhanças, dado que nosso intuito é tentar identificar as
variadas estratégias que o cinema direto põe em jogo.
Primárias lida com o evento específico das eleições primárias presidenciais realizadas
em Wisconsin, da campanha ao resultado; Happy mother’s day lida com o evento em torno do
nascimento dos quíntuplos; Crisis lida com o evento da matrícula dos primeiros estudantes negros
da Universidade do Alabama; The Beatles USA lida com a primeira vez em que os Beatles vão para
os Estados Unidos; Meet Marlon Brando lida com a entrevista programada de Marlon Brando, que,
a princípio, tinha o intuito de promover seu novo filme.
Warrandale lida com o cotidiano de um centro de tratamento de saúde mental para
crianças; Titicut follies lida com o cotidiano de uma instituição de tratamento de criminosos com
problemas de saúde mental; Salesman lida com o cotidiano de um grupo (em especial, um
personagem) de vendedores de bíblia.
Aí podemos notar duas diferentes diretrizes que estão nos pressupostos dos filmes. Em
termos simples, podemos dizer que um grupo busca o evento, único por natureza, e o outro busca
o cotidiano, ordinário por natureza. Existem intersecções entre os grupos, dado que um evento de
caráter determinador para o transcorrer do mundo e do filme pode emergir do cotidiano ao longo
do processo de filmagem. Um exemplo nítido é a morte de Dorothy no Warrendale, que, a partir
do momento em que ocorre, determina muito daquilo que veremos e ouviremos até o final do filme.
89
Em contrapartida, a presença da equipe realizadora no dia a dia dos Kennedys, no desenrolar dos
eventos catárticos em Primárias e Crisis, pode fazer revelar traços do ordinário de suas vidas.
Contudo, em Warrendale, Titicut folies e Salesman veremos uma dimensão mais banal,
comum ou íntima, ligada a questões que partem mais dos indivíduos em suas situações, seja no seu
trabalho, nos lugares em que dorme e come ou nos espaços de lazer. No primeiro grupo, a ordem
de grandeza daquilo que é filmado supera o indivíduo, lida com questões e resoluções políticas ou
com temas de interesse midiático que afloram da voz dos próprios filmados no momento da tomada.
Titicut folies, um filme do segundo grupo, tem uma importância no debate de política pública, mas
mais por uma intenção fílmica do que devido à própria voz do filmado. Em outras palavras: as
questões que superam o indivíduo em grandeza vêm mais de uma articulação fílmica e de seu
contexto de produção e exibição do que da própria materialidade que aflora no presente da tomada
– é como dizer que a voz é ordinária e a causa fílmica é política.
Essa discussão encontra-se num terreno de difícil aferição, mas o que quero ressaltar é
que existem variações no tipo de fala dos filmados, que surgem devido ao desenrolar de um evento
de natureza única ou ao cotidiano de natureza ordinária ao qual a equipe realizadora propõe-se a
dedicar, que irá determinar situações distintas de circunstância de mundo e tomada e que, por
consequência, determinarão assuntos, temas, entoações etc. distintas.
A voz de conteúdos e tons mais banais, comuns e íntimos – ou aquelas que são
diminuídas em seu limite de ação, mais centradas no “eu” ou em grupos delimitados e na relação
do “eu” ou de um grupo delimitado com o mundo cotidiano – entra, no passar dos anos 1960, cada
vez mais em cena.
90
4 A música no documentário
A fronteira conceitual entre a música e os outros elementos sonoros no documentário

dos anos 1930, em especial no britânico, não esteve sempre bem demarcada do ponto de vista da
produção e, em alguns casos, tampouco do ponto de vista espectatorial. Entre as sinfonias
metropolitanas, nas produções de Vertov (em especial Entusiasmo), de Ruttmann (em especial
Weekend) e de Ivens (em especial Philips radio), também já era possível notar passos nesse sentido.
Deixamos essa discussão para o capítulo 5, no item “A indiscernibilidade entre as pistas de música,
voz e ruídos no documentário do período clássico”. Dessa forma, alguns espaços deixados em
branco nesse capítulo serão preenchidos mais adiante.
4.1 A (falsa) polêmica da presença da música no documentário
Ao falar de música no documentário é difícil escapar de debates que trazem à tona a

temática da validade ética da presença da música – sobretudo da música cujos corpos ou objetos
que a fazem soar não são vistos na tela, que podemos chamar de música invisível. E os pontos mais
tocados nesses debates giram em torno de ideias como “essa música manipula a realidade”, “a
música tira a objetividade”, “a música manipula as emoções”, “a música estetitiza a realidade”, “a
música adiciona percepções que não se aferem pelas imagens” etc.
As ideias dessa linha de debate não são falsas em si. O problema delas está na falsa
ideia de que existe um problema ontológico na relação da música com uma (suposta) essência
documentária – uma essência que, em verdade, é, mais do que tudo, se existente, transitória.
A música, acredito, é capaz de manipular uma suposta realidade, de gerar emoções, de
tirar a objetividade etc., mas essas questões não são óbvias quando o assunto é documentário.
Russel Lack (1997, p. 257), no seu livro sobre música no cinema Twenty four frames
under: a buried history of film music, busca nos conceitos de “percepção” e “estética” de Platão e
Aristóteles a ideia de que a “música tem a capacidade de mudar nossos sentimentos em relação ao
objeto ao qual acompanha”, afirmando que a presença da música no documentário é extremamente
ambígua e que a “música em si parece ameaçar a autenticidade dos documentários”. E, de fato,
como nota Donnelly (2015, p. 140),
Muitos documentários procederam a partir da posição de que a música não deveria
91
prejudicar, nem desafiar, a primazia das representações na tela. Assim, muitos
realizadores evitaram a música dramática incidental como acompanhamento das
imagens e dos sons diegéticos. Esses elementos [imagens e sons diegéticos]
sozinhos parecem transmitir a realidade diretamente enquanto a música não
diegética, particularmente no seu estilo hollywoodiano, parece ser a
personificação da manipulação emocional e a “adição” estetizante da realização
documentária.
Contudo, esse contorno, no sentido pejorativo, de “não realidade”, “não autenticidade”,
“manipuladora” etc. adquirido pela música no domínio documental, podemos dizer, é relativamente
jovem ou, como coloca Donnely (2015, p. 140), “é uma conceitualização relativamente moderna”.
Para julgar a validade, prejuízo, autenticidade etc. da presença da música no
documentário, é preciso pensar sob os preceitos da realização, da postura ética (ou não ética) – que
sabemos que em muito já mudou. Do contrário, restam-nos considerações descompassadas a
respeito de um grupo ou de uma maneira específica de se fazer documentário, creditando a alguns
o porte da essência documentária e desconsiderando as transformações epistemológicas do fazer
fílmico, que são caras para o entendimento da tradição documentária, ou, ainda pior, apagando as
fronteiras entre o ficcional e o não ficcional, acreditando que a música, ao manipular e emocionar,
ficcionaliza tudo aquilo que toca.
É importante ressaltar que a ideia de acesso direto, desimpedido e objetivo à realidade
ou à verdade não foi e nem é usualmente colocada em debate de forma ingênua pelos realizadores
da tradição documentária e nem sequer foi busca constante dos realizadores e personagens e,
mesmo quando almejada, variou significativamente segundo parâmetros éticos e estilísticos.
Tampouco esses termos (objetividade, realidade, verdade) são inequívocos e consensuais entre
realizadores, espectadores e personagens; não é em torno dessas expressões que se define o campo
documentário49.
Se nos atermos às sinfonias metropolitanas, que são marcos inaugurais da prática
musical autoral no domínio documental, como em Berlim: sinfonia de uma metrópole, notaremos,
com o apoio da partitura escrita para o filme, que a cidade de Berlim é pensada, articulada e levada
ao espectador de forma poética, por concatenações rítmicas e contrastes de cortes entre planos,
distantes de uma tentativa de observação direta do mundo. No caso de O homem com a câmera e
Entusiasmo, tendo no horizonte as indicações sonoras escritas para os filmes (e o próprio material
sonoro, no caso de Entusiasmo), podemos dizer que a realidade vista e ouvida de forma direta e
49
Verificar Mas afinal... O que é mesmo documentário?, p. 29-32, de Ramos (2008).
92
objetiva é uma forma alienada de se perceber o mundo. Assim, a realidade, que está oculta, deve
ser revelada pelas ferramentas narrativas dos filmes, das quais a música faz parte.
Se falarmos de documentários dos anos 1930 e 1940, sobretudo aqueles financiados
por instituições estatais, seja na Europa, América ou Ásia, notaremos que boa parte deles tinham
como pressuposto ético a missão educativa ou propagandística; e, para atingir seus objetivos, o uso
da música como ferramenta narrativa desempenhou função estratégica, fosse numa dimensão lírica
ou assertiva.
Se o questionamento da música invisível pode ser notado de forma mais contundente
no documentário, é a partir dos anos 1960, sobretudo no cinema direto norte-americano, que, de
forma geral, se apegava aos fenômenos advindos da circunstância de tomada homogênea à
circunstância de mundo e que prezava pela pouca influência do grupo realizador naquilo que era
filmado, vendo com maus olhos o trabalho de pós-produção naquilo que concerne à geração de
imagens e sons50. Vale ressaltar que esse questionamento não foi feito apenas para a música, mas
para todos os elementos sonoros que não eram captados em locação. E mesmo sob essa maneira de
pensar, a música não se ausentou completamente da filmografia do direto.
No que diz respeito a esse tipo de presença heterogênea da música em relação à tomada
visual – alvo central nos debates que lidam com a questão da presença potencialmente polêmica da
música invisível no documentário –, não podemos deixar de lado uma dimensão semelhante àquela
que ocorre com a voz invisível51 (que será parâmetro para pensarmos a música visível).
A música invisível, por mais que presa na teoria da música fílmica a conceitos que
tendem a impeli-la a um não lugar, a um não tempo ou a uma dimensão distante daquela das
imagens – tal como “não diegético”, “música incidental” e “música de fosso” –, não perde sua
dimensão espaço-temporal mundana, como materialidade em si, como elemento físico-auditivo do
mundo, com um lugar de partida e de chegada.
Uma maneira interessante de pautar essa perspectiva é a partir da discussão de
Claudiney Carrasco (1993) sobre a teoria dos gêneros literários aplicada ao entendimento da
música fílmica. O épico seria um gênero no qual o poeta conta os fatos, conservando um
distanciamento espaço-temporal com seu objeto. No gênero dramático, a relação poeta-objeto
50
E não necessariamente dos processos de edição e montagem.
51
Verificar item “3.1.1 Por que ‘voz invisível’? Por uma fenomenologia da voz que não vemos”.
93
tende a se enfraquecer em favor da valorização do espaço-tempo da ação, aquele que parece ocorrer
sem intermediação direta do poeta52.
Esse poeta, ao pensarmos em termos de cinema, deve ser entendido como narrador (no
caso mais específico do cinema documentário, podemos entender esse narrador a partir daquilo que
Bill Nichols chama de “voz do documentário” ou daquilo que Fernão Ramos tem chamado de
“mega-enunciador”). Para Carrasco, levando em conta que o cinema se constitui como forma
narrativa, o caráter épico torna-se marca determinante. Mesmo os aspectos dramáticos sendo
possivelmente o foco de atenção, a (encen)ação dos corpos “já chega para nós filtrada pelo ponto
de vista do narrador. É por isso que o dado dramático no cinema é adjetivo, posto que ele jamais
pode ser isolado do dado substantivo épico” (CARRASCO, 1993, p. 73). A articulação da trilha
musical estabelece-se, assim, com recursos que tendem a cumprir papéis ligados à dimensão
espaço-temporal da (encen)ação (funções dramáticas) e com recursos que tendem a estabelecer e
organizar a unidade narrativa fílmica (funções épicas). Assim, em relação ao cinema ficcional
industrial, Carrasco (1993, p. 74) afirma que
A música, enquanto fator da articulação fílmica, faz parte do conjunto de recursos
épicos. Na composição da narrativa ela é um instrumento do qual o narrador pode
dispor para montar o seu discurso. Mas, assim como os outros fatores do aparato
articulatório, ela tem que ser posta a serviço da progressão dramática do filme.
Assim, a música pode ser entendida como uma das vozes do narrador, que pode
manifestar-se como intervenção épica ou como parte da ação dramática.
E aí chegamos num ponto interessante para pensar o documentário: a música, que
inevitavelmente passa pelo narrador, pode estar desprendida do espaço-tempo de tomada visual e
funcionar tanto como elemento épico quanto dramático, ou pode estar ligada ao espaço-tempo de
tomada visual e funcionar, também, tanto como elemento dramático quanto épico. Num extremo,
poderíamos citar a trilha musical de Industrial Britain, que é composta por músicas compiladas,
notadamente de repertório romântico, distante do espaço-tempo de tomada visual; e, no outro
extremo, poderíamos citar a trilha musical de Lonely boy, em que certos trechos aquilo que
escutamos ocorre no mesmo presente da tomada visual, quando, por exemplo, escutamos e vemos
Paul Anka executando suas canções. Em ambos os casos, a música, independente da sua presença
52
Carrasco também discorre sobre o gênero lírico. Nele, o encontro do eu-poeta com o mundo (objeto) é o foco, esse
“eu subjetivo do poeta confunde-se com o próprio objeto da mensagem poética” (CARRASCO, 1993, p. 68). Contudo,
mais adiante o abordaremos.
94
homogênea ou heterogênea em relação à tomada visual, pode desempenhar papéis épicos e
dramáticos.
Essa perspectiva torna-se interessante quando a música invisível, por exemplo, não
parece se encaixar nesses extremos. Citemos dois exemplos distintos. Os pescadores de Aran, que
contou com uma trilha musical original baseada em canções irlandesas tradicionais
(especificamente das Ilhas de Aran); e Song of heroes, em que, no processo de realização, Joris
Ivens (realizador do filme) disse à Hanns Eisler (compositor da trilha musical): “Você não pode
escrever essa música se você não ver e escutar todo o ambiente sonoro e de trabalho e o espírito
revolucionário” (DÜMLING apud COOKE, 2008, p. 269). Algumas músicas do filme também
foram gravadas em locação, mas apresentadas em completa heterogeneidade espacial e/ou temporal
com as tomadas visuais. E apenas sabemos que foi gravada em locação, mais ou menos nos mesmo
lugares das tomadas visuais, devido a relatos de Hanns Eisler e de especialistas em sua obra53.
Por um lado, cabe perguntar se seria proveitoso do ponto de vista analítico, nesses
casos, dizer que a música é não diegética ou que não pertence ao mundo das imagens filmadas; e,
por outro lado, se seria proveitoso dizer que a música é diegética ou que pertence ao mundo das
imagens filmadas. Parece difícil encarar essas perguntas sem responder com contradições.
Contudo, talvez fosse mais interessante pensar que o mundo, seus elementos e a (encen)ação em
si, ou o aspecto dramático, são sempre filtrados/fabricados/compostos pelo narrador (ou “voz” ou
“mega-enunciador”, seja na produção ou pós-produção), ao mesmo tempo em que o aspecto épico,
definidor do narrador, existe em função de levar algo ao espectador – o mundo, seus elementos e a
(encen)ação. Assim, nesses casos, poderíamos dizer que a dimensão mundana (dramática) da
música se faz presente, tal como a dimensão instrumental e ferramental (épica) da música se faz
presente na edição e na montagem fílmica. O mundo se faz presente, em alguma instância, de forma
viva pela música, que habita ou já habitou o próprio objeto fílmico ou seu espaço-tempo, por mais
que pelo filtro da composição (do narrador). Ela pode estar a serviço de características do espaço
acústico e da cultura sonora do objeto fílmico, a serviço do indizível e do invisível, a serviço da
(encen)ação dos corpos, pode revelar a maneira de entender o mundo ou o objeto fílmico por parte
dos realizadores e a maneira que querem levá-lo ao espectador, pode ser as cicatrizes sonoras
53
Verificar o artigo “Music and soundtrack in Joris Iven’s Films” de Claude Brunel (1999).
95
grifadas e carregadas na pele do sujeito-da-câmera para e pelo espectador, pode ser fragmento do
mundo (se não de forma física, em forma de estrutura).
O que dizer também das músicas visíveis de Happy mother’s day, Crisis, Primárias e
Titicut folies etc. que navegam pelos ares da música invisível, transitando por diferentes esferas de
composição narrativa, cumprindo, por vezes, papéis épicos e, por vezes, papéis dramáticos?
Enfim, o que estaria em jogo, sobretudo, seria reconhecer os aspectos que se
aproximam do épico e os aspectos que se aproximam do dramático, assim, evitando o labirinto sem
saída que nos impele a julgar a validade, a veracidade, a autenticidade etc. da música no filme a
partir da ligação embrionária da música à diegese ou à não diegese, dando corpo à existência da
música no espaço-tempo mundano, tal como às imagens. Isso não quer dizer que as expressões
música diegética e música não diegética (e semelhantes) não sejam interessantes. Elas
desempenham, desde a virada da década de 1970 para a de 1980, por meio de escritos seminais de
David Bordwell e Kristin Thompson (2009 [1979]) e Claudia Gorbman (1980), papel fundamental
no desenvolvimento dos estudos do som fílmico. O problema reside no limite conceitual que está
circunscrito na noção da relatividade do tipo de presença do som ante um mundo determinado pela
espacialidade visual ou no pensar do som a partir daquilo que é visto no campo ou a partir do que
se imagina existir no extracampo. No domínio documental, essa maneira de pensar a música nos
impulsiona para um debate infrutífero e indesejado, que nos faz entrar numa falsa polêmica, na
qual a música, ou faz parte do mundo das imagens e é autêntica, ou não faz e é falsificada em sua
maneira de se fazer presente, deturpando o real, desfigurando o campo e a tradição documentária.
Com essas afirmações não estou deixando de dizer que a música surge, como os outros
elementos fílmicos, na circunstância de tomada para e pelo sujeito-da-câmera em função do
espectador, seja no estúdio ou em locação, em sua homogeneidade ou heterogeneidade com o
mundo e com o campo visual. O que quero dizer, sobretudo, é que a presença heterogênea da
música, tanto em relação ao mundo que a circunda no momento de sua tomada quanto ao campo
visual fílmico, se questionada e invalidada em nome de uma essência documentária, leva consigo
para o limbo boa parte das imagens da produção documental que lidam com estúdio e encenação
construída, e, em medidas menos drásticas, as imagens tomadas em locações mais ou menos
controladas, as imagens que contam com trabalho vigoroso de pré-produção, produção e pós-
produção etc. E, além disso, existe uma fluidez significativa no transitar da música entre os aspectos
96
épicos e dramáticos, seja a tomada da música homogênea ou heterogênea em relação ao espaço-
tempo mundano que a circunda e ao espaço-tempo da tomada visual, partilhada em fruição na
espectatorialidade.
Holly Rogers, na virada de 2014 para 2015, editou e lançou o livro mais completo, a
meu ver, sobre música e som no documentário (Music and sound in documentary film) – leitura
“obrigatória” para quem se dedica ao assunto. Acredito ser o primeiro livro inteiro escrito por
acadêmicos dedicado exclusivamente à essa temática. Trata-se de uma coletânea de artigos inéditos
escritos pelos principais pesquisadores internacionais que têm se dedicado ao tema. Rogers, na
introdução do livro, faz uma longa discussão em torno da polêmica aqui levantada, talvez a mais
completa discussão feita até agora. A autora, ao final, defende que a música pode potencialmente
apagar as fronteiras entre ficção e documentário, embora também reconheça que o documentário,
em sua tradição histórica, foi e ainda pode ser – para além de carregar um veio de “estética realista”
e “intenção de autenticidade” – persuasivo, subjetivo, emotivo, narrativo. Contudo, nas escolhas
desses trilhos, afirma a autora, a presença da “música não diegética” pode fazer a linha entre o não
ficcional e o ficcional se flexionar. Bill Nichols, que escreve o prefácio do livro, pensa numa
direção semelhante. Perspectiva que não compartilho, como explicitei anteriormente.
Carrasco (1993, p. 77-78), embora tratando de cinema ficcional, faz uma consideração
que é valiosa para essa discussão.
Uma das piadas clássicas da história da trilha musical de cinema originou-se
durante a produção do filme Um Barco e Nove Destinos [1943], dirigido por
Alfred Hitchcock. Conta-se que durante as filmagens, Hitchcock teria feito o
seguinte comentário: “Mas de onde supostamente vem a música no meio do
oceano?”. Ao qual o compositor David Raksin respondeu da seguinte maneira:
“Perguntem ao Sr. Hitchcock de onde vêm as câmeras”. [... David Raksin] já havia
percebido que a trilha musical obedece a leis similares àquelas que regem todos
os outros fatores responsáveis pela articulação fílmica. Poucas vezes alguém se
preocupa em saber onde a câmera foi colocada para a obtenção de um determinado
efeito. A pressuposição de que sem a câmera não existiria o filme é tão banal que
ninguém se preocupa em questioná-la. O mesmo se dá no que diz respeito à
montagem. [...] A pressuposição de que para se articular a narrativa fílmica é
preciso que haja cortes e junções de planos é tão clara para o profissional, e tão
sedimentada no referencial do público, que há muito já deixou de ser uma questão
relevante para a discussão teórica. A troca de “farpas” entre Hitchcock e Raksin
ilustra bem o fato de que o cinema demorou mais tempo para compreender que a
trilha musical faz parte do grupo de fatores articulatórios acima citados. Em
grande parte isso advém de um certo preconceito que data dos primeiros anos do
cinema sonoro, quando acreditava-se que a música interferia na ilusão de
97
realidade do filme, por isso ela deveria sempre ser justificada de alguma maneira
na ação filmada.
O que aí está em jogo é a ideia de que a música é um dos elementos articulatórios da
narrativa. E se a compreensão disso no cinema ficcional demorou para se firmar entre profissionais
e público, como afirma Carrasco, no domínio documental, parece ainda que as coisas não se
assentaram. De qualquer forma, parece-me contraditório, senão ingênuo, acreditar que o
documentário, sendo uma narrativa de características próprias identificáveis na história, possa
carregar uma pureza objetiva inequívoca sobre a realidade e a verdade a ponto de se dizer que a
música possa tirar a pureza supostamente presente de antemão nas imagens. De manipular uma
suposta realidade, verdade e de tirar a objetividade, a música é capaz, mas o é tal como todos os
outros elementos articulatórios da narrativa documentária. E não é por esse caminho que
fundamentaremos debates frutíferos sobre a música no documentário.
A introdução de Rogers, apesar de diferir em parte da minha opinião, fez uma primeira
base sólida para futuros desenvolvimentos dessa discussão, que, apesar de recorrente, foi ainda
pouco aprofundada.
4.2 As sinfonias metropolitanas, sua música e a metáfora sinfônico-musical
A dimensão autoral do som no documentário dá seus primeiros passos com as sinfonias

metropolitanas, em filmes como Berlim: sinfonia de uma metrópole, O homem com a câmera,
Melodia do mundo, Entusiasmo, Weekend, Philips radio e The oil symphony54.
E, nesse primeiro momento, a música desempenha um papel fundamental na estrutura
fílmica. Não só por cumprir uma demanda eventualmente estética, funcional, social, mercadológica
etc., mas também por constituir-se no pensamento cinematográfico. Walther Ruttman pode ser
considerado como um dos representantes máximos dessa perspectiva, para quem a música,
principalmente em sua dimensão temporal, funda de maneira ontológica com as imagens um
cinema que deve cumprir com as novas demandas da modernidade.
Uma digressão sobre seus pensamentos pode ser valiosa para o debate dos vieses mais
poéticos/líricos do domínio documental, sobretudo em seu momento de formação.
54
Verificar item “2 O nascimento do documentário sonoro: a dimensão autoral e o suporte uno”.
98
No texto “Malerei mit Zeit”, escrito entre 1919 e 1920, Ruttman, olhando para a
sociedade que lhe é contemporânea, afirma que existe uma inadequação entre a estrutura social e a
produção de arte, que demonstra o fato de não existir um honesto confronto entre o “homem
moderno” e o espírito de seu tempo (Zeitgeist) e a necessidade de mudanças. Reconhece duas
posturas comuns a seu tempo que refletem o descompasso: a visão cética, que pensa a arte como
coisa do passado e que não combina com a atual sociedade; e a visão reacionária, que acredita que
a produção recente da arte já não move e nem afeta mais o povo.
Para ele, os símbolos da modernidade do século XX, que chama de “era da velocidade”,
são as máquinas que se remetem à alta velocidade de produção das prensas, o telégrafo, a
taquigrafia e os trens expressos, responsáveis por um aumento incalculável da disseminação de
produtos intelectuais e da divulgação de ideias, inundando de material as pessoas no seu dia a dia.
Como consequência da velocidade, os acontecimentos do passado perderam os conteúdos e os
casos pontuais/individuais e tomaram as características de um desenrolar de eventos: o
desenvolvimento temporal tomou a fisionomia de uma curva, em oposição aos anos anteriores, nos
quais a série de momentos e experiências individuais presentes na memória marcavam
pontualmente as trajetórias dos indivíduos.
Ruttmann, ao trabalhar essa perspectiva com foco na arte, lida com os termos
“acomodação” e “associação”. Se antes os fatos históricos eram acomodados pela população, na
modernidade do século XX deixaram de ser devido à velocidade dos eventos. Uma arte, então, que
lide com os elementos tempo e velocidade é essencial: segundo Ruttmann, é óbvio que o
relacionamento que o indivíduo tem com o espírito de uma era não pode atingir o profundo desejo
de intimidade quando não existe toque entre a experimentação pessoal e a experiência (estética e
social). As artes que se fazem presentes nesse momento, como a pintura, não incorporam o
elemento tempo e, por consequência, são artes fixas, que levam o pensamento a trabalhar por
“associação”: a arte que é vista simboliza uma experiência. Na vida moderna, essa arte não vai ter
êxito, segundo Ruttmann, pois a vida já não se pauta em experiências, e sim num desenrolar por
inteiro de situações em que as pontualidades da vida se misturam numa curva: a relação efetiva da
experimentação pessoal e da experiência estética, portanto, só vai ocorrer no limite da analogia, de
uma analogia histórica em que o indivíduo se separa do mundo.
99
A nova arte, portanto, deve superar o descompasso entre a arte do passado e o século
XX. Nas palavras de Ruttmann, a nova arte deve “ser o tempo” (die Zeit sein). Essa arte que deve
incorporar a dimensão do tempo não será “encontrada (como nos quadros) em redenção de um
momento (real ou estilizado) em um evento ou fato, mas sim no desenvolvimento temporal (como
o da música) de sua forma” e, por isso, um de seus principais elementos será “o ritmo temporal dos
eventos visuais” (RUTTMANN, 1919-1920).
Ela deverá, segundo Ruttmann, ocupar um meio-termo entre pintura e música, no qual
a pintura ganha movimento conforme a dimensão temporal da música. Podemos resumir essas
ideias na expressão de Ruttmann que dá título ao texto aqui referido: pintura com o tempo (Malerei
mit Zeit). É assim que Ruttmann define a cinematografia como uma potencial técnica de
apresentação dessas propostas.
Interessante também notar que Ruttmann afirma que a composição dessa arte vai
depender extremamente da personalidade do artista envolvido no processo de realização. Essa
observação entra em concordância com aquilo que Bill Nichols apontou como o surgimento de
uma voz do documentário, no qual a dimensão poética desempenhou papel fundamental. Segundo
Nichols (2008, p. 123), o potencial poético do cinema esteve quase totalmente ausente até a década
de 1920, a “exibição” sempre teve prioridade sobre a “fala poética”.
De certa forma, existe uma compatibilidade entre o que Nichols denomina de poético
no cinema e no gênero lírico, no qual o eu (artista/poeta) encontra o mundo, e o produto artístico
desse encontro é carregado de impressões pessoais advindas da relação dialética entre o eu e o
outro (CARRASCO, 1993). A seguinte reflexão sobre o filme Koyaanisqatsi (1983), que
compartilha conceitualmente muitos planos e sequências com o filme In der Nacht (1931) de
Ruttmann, parece-nos importante para pensar muitos de seus filmes:
Nesse filme o narrador se utiliza de todos os recursos técnicos à sua disposição
para criar aquilo que poderia ser definido como: um quase poema lírico em forma
de filme... No subjetivismo do narrador reside o caráter lírico desse filme. Ele
perde a sua suposta imparcialidade e se insere poeticamente na narrativa,
mostrando o seu ponto de vista pessoal e subjetivo, valendo-se para isto, inclusive,
de seu poder de descaracterização do objeto da narração. Uma rua não é mais uma
rua, uma nuvem não é mais uma nuvem, todos os elementos são decompostos e
recriados poeticamente em imagem e som (CARRASCO, 1993, p. 126-127).
É com essa perspectiva que Ruttmann vai produzir seus primeiros filmes – Lichtspeil
Opus I - IV (1921-1925) – em sua companhia cinematográfica e alguns outros ao longo da década
de 1920 e de 1930. O que podemos notar resumidamente é que essas ideias, que num primeiro
100
momento motivaram produções de caráter abstrato, iriam também ajudá-lo a conceber seus
documentários poéticos/líricos de grande repercussão: Berlim e Melodia do mundo.
Pode-se notar uma compatibilidade da produção de Ruttmann com aquilo que Kracauer
(1988) apontou como uma mudança de caráter da produção cinematográfica alemã: a partir de
meados de 1920, o cinema alemão, em um período de certa estabilidade política e econômica,
começa a dar ênfase ao mundo exterior, nas suas aparências reais. Se a série Opus lida, sobretudo,
com abstração, Berlim e Melodia do mundo adotam um cinema mais pautado nas imagens do
mundo histórico, em seus documentos visuais montados, como se buscassem uma verdade, ou uma
noção de realidade, posterior aos primeiros turbulentos anos da República de Weimar, por uma via
poética/lírica.
Essa mudança que aponta Kracauer é reconhecida pelo próprio Ruttmann, quando da
realização de Berlim, ao afirmar que seu estudo sobre movimentos de formas abstratas estava
cedendo lugar a um desejo crescente de criar a partir dos movimentos vivos e da energia cinética
dos organismos das grandes metrópoles (RUTTMANN, 1927).
De maneira geral, percebemos nesse texto de Ruttman questões semelhantes com as
levantadas por Dziga Vertov, sobretudo naquilo que tange às necessidades clamadas por ambos
pelo surgimento de uma nova arte capaz de se imiscuir às novas maneiras de sociabilidade.
Todavia, eles parecem chegar à mesma conclusão de maneiras diferentes. Vertov via no cinema a
possibilidade de desvendar o mundo, iluminá-lo, mostrar a realidade com a reconstrução da
realidade sensível; Ruttmann já via nesse mundo a realidade fragmentada em seu cotidiano, a arte,
para ele, portanto, devia tentar seguir um caminho parecido ao desse mundo, que já não era o da
experiência linear, sendo o cinema a arte que o possibilitaria.
A particularidade que nos parece ter Ruttmann quando fala de montagem sonora é o
reconhecimento explícito de que a música perde a condição de música: não mais existe
separadamente o artista que concebe o visual e outro que concebe o sonoro, ambos devem se
encerrar num pensamento único, no qual o que é visto perde o relacionamento com a imagem em
movimento e o que é escutado perde a relação com o que é música, ou melhor, Ruttmann insiste,
mais que Vertov, numa arte que não se entende pela soma do sonoro com o visual, mas sim como
um produto sonoro-visual.
101
O que vemos nas primeiras produções da era sonora de Ruttmann e Vertov, apesar de
haver mais semelhanças do que diferenças em seus escritos, é uma concepção sonora relativamente
heterogênea, na qual, apesar de compartilharem muitos fundamentos, notam-se diferentes
tendências. Vertov trabalha preponderantemente com o documento sonoro, obtido no mundo
histórico, montado e editado com os documentos visuais. Ruttmann, em seu primeiro filme da era
sonora, Melodia do mundo, trabalha mais que Vertov com a música, ou melhor, lida menos com o
ruído (ou construção musical do ruído) e a fala, ou ainda, em vez de montagem sonora, Ruttmann
pensa mais em uma montagem musical.
Contudo, Ruttmann, em Weekend – que se aproxima bastante daquilo que Vertov
concebe como rádio-orelha –, mostra sua vertente mais futurista, ao dedicar-se à arte dos ruídos,
apresentando-nos poeticamente a sonoridade da cidade de Berlim: gravações de palavras e
fragmentos de ruídos e músicas coletadas em Berlim são reconstruídas com o intuito de se criar
uma perspectiva sobre Berlim. Apesar de não possuir imagens, essa produção de Ruttmann
tangencia, mais que Melodia do mundo, o que ocorre no plano sonoro de Entusiasmo,
principalmente por dar mais vazão à montagem sonora que à musical. Mas não percebemos esse
tipo de tendência como preponderante na filmografia de Ruttmann.
Um outro aspecto importante do pensamento de Ruttmann sobre a arte contemporânea
pode ser encontrado em “Die absolute Mode”, de 1928. Nesse texto, Ruttmann critica a arte
“absoluta” e esclarece seu ponto de vista sobre a arte cinematográfica. Em linhas gerais, para ele,
a arte não deveria ser pensada como algo superior, que forjasse uma fuga do mundo profano, que
se visse como arte pura (ou absoluta), em sentido da transcendência. Ela deveria operar não mais
como uma simples abstração, mas, sobretudo, como uma opinião, um comentário, um passo adiante
para o esclarecimento do mundo e de sua natureza. Em outro texto (“Die Symphonie der Welt”,
publicado na Revue du Cinéma, n. 8, em 1930), no qual Ruttmann discute seu filme Melodia do
mundo, há uma reafirmação dessa postura quando o cineasta classifica como um grande erro
acreditar que existe um “ver e ouvir” objetivos. Para Ruttmann, muitos filmes mentem quando
desejam, ou afirmam, mostrar uma realidade sem filtro, livre de uma visão anterior. Para ele, os
significados passam obrigatoriamente por uma consciência antes de serem reproduzidos: quando
um cineasta lida com a representação perceptiva do mundo, os conceitos de mundo que tem são
102
trabalhados para organizar as sequências do filme em um sentido pretendido, o que torna
imprescindível um ponto de vista e uma reflexão sobre o mundo.
Entretanto, quando Kracauer (1988) analisa o filme Berlim ressalta sua
superficialidade, sua falta de conteúdo, considera-o como um jogo rítmico vazio de conteúdo,
possuidor de uma neutralidade ambígua sintomática da paralisia política autoritária alemã em seus
períodos de relativa estabilidade. Há, portanto, um choque saliente no que Kracauer vê na arte de
Ruttmann e o que o cineasta encara como arte: Ruttmann parece defender o conteúdo, ou seja, a
face da arte que mostra a opinião e o comentário do artista em relação ao mundo, já Kracauer
enxerga um completo vazio conteudístico em Berlim. Essa visão de Kracauer foi e é extremamente
reproduzida nos textos que nos acompanham até os dias atuais.
Interessante, então, notarmos como Kracauer compara O homem com a câmera e
Berlim. Para ele, os dois filmes carregam extremas semelhanças do ponto de vista estético,
sobretudo naquilo que se refere à montagem e à concepção dos cortes rítmicos. Mas, ao mesmo
tempo, flagra a diferença entre as obras, “uma diferença de atitude”:
[Vertov] é o filho de uma revolução vitoriosa, e a vida que sua câmera surpreende
é a vida soviética – uma realidade convulsionada por energias revolucionárias que
penetram em cada elemento. Esta realidade tem uma forma significativa própria.
Ruttmann, por sua vez, focaliza uma sociedade que conseguiu evitar a revolução
e que agora, sob a República estável, é nada mais do que um conglomerado sem
substância de partidos e ideais. É uma realidade sem forma, que parece ter sido
abandonada por todas as energias vitais. O filme de Ruttmann reflete essa
realidade (KRACAUER, 1988, p. 216).
Podemos levantar dois pontos de sua análise que nos parecem questionáveis. O
primeiro se põe de uma forma mais histórica que analítica: assim como alguns autores das primeiras
décadas do século XX, algumas concepções de Kracauer a respeito da Revolução Russa nos
parecem datadas, o que ocorre naturalmente na perspectiva historiográfica. Faço essa consideração
porque o argumento que sustenta sobre Berlim é ainda hoje reproduzido sem muitos cuidados. Em
linhas gerais, Kracauer mostra-se cego a uma realidade devastadora da URSS, ressaltando os ideais
revolucionários presentes na sociedade e recusando as desgraças e o genocídio da era autoritária
de Stalin, que se inicia em meados da década de 1920. Kracauer (1988, p. 218) argumenta que
Berlim “fracassa em apontar qualquer coisa, porque não desvenda um único contexto
significativo”, por possuir uma “atitude formal para com uma realidade que pedia crítica,
interpretação”. Em contrapartida, Kracauer reconhece a realidade soviética como significativa por
si mesma, ou seja, a arte, ao representar essa realidade e ao reafirmar convicções revolucionárias
103
de outrora, já englobaria a noção de crítica e interpretação social, e tiraria-lhe a necessidade de
fazer uma reflexão sobre a realidade que mostra. Em outras palavras, para ele, a URSS não vivia
um momento social que clamava por críticas, ao contrário do que ocorria, segundo ele, na
Alemanha. Essa visão otimista em relação ao desenvolvimento da revolução soviética já foi há
muito superada.
Para Kracauer, aquilo que se mostra ambíguo, que não se posiciona explicitamente,
torna-se neutro, tal como afirma em relação a Berlim, quando considera que uma postura crítica de
Ruttmann poderia ser cunhada ao se evidenciar, por exemplo, minimamente, a anarquia inerente à
vida em Berlim. Com o apoio teórico de Peter Gay (1978), percebemos que a Alemanha não
poderia caminhar unilateralmente, seu complexo de contradições e ambiguidades não seria
comportado por uma arte de tons parecidos à de Vertov. Um posicionamento decisivo e único seria
uma postura política equivocada.
O ideal de Weimar era ao mesmo tempo antigo e novo. A impressionante mistura de
cinismo e confiança, a busca por novidade e por raízes, a solene irreverência dos anos 1920 eram
frutos de guerra, revolução e democracia, mas os elementos que lhe deram corpo vieram de ambos
os passados, o distante e o recente, recordado e vivido pela nova geração (GAY, 1978, p. 16).
A crítica que Kracauer faz a Berlim se parece muito à que Peter Gay (1978, p. 72) faz
em relação ao poeta Rilke:
Podia-se ler Rilke apenas por prazer, mergulhando em suas imagens; podia-se ler
Rilke como o poeta da alienação ou como o celebrante de um universo pagão, no
qual os sentimentos humanos e as coisas inanimadas, amor e sofrimento, vida e
morte, se compõe num conjunto harmonioso.
Para Peter Gay, Rilke era um dos muitos poetas alemães que, apesar de não pertencer
a nenhuma “escola”, englobava, sim, atitudes salientes. A diferença entre as críticas é que Peter
Gay não põe as ambiguidades, contradições e associações aparentemente vazias de conteúdo
presentes numa obra de arte como fator excludente de sua possibilidade de conter crítica, análise,
reflexão e compreensão de estruturas sociais, econômicas e políticas. Passa longe da crítica de
Kracauer considerar o artista como um consumidor de experiências, ou melhor, de vivências, e de
toda dedicação que isso exige e que inclui o conhecimento
das crianças e dos moribundos, de noites de amor e de ouvir-se o barulho do mar
[...,] em prol de um verso devemos ver muitas cidades, homens e coisas, devemos
conhecer os animais, sentir como voam os pássaros, e conhecer os gestos com os
quais as pequeninas flores se abrem ao amanhecer (RILKE apud GAY, 1978, p.
72).
104
Vale aqui lembrar algumas negligências lançadas em direção às obras das vanguardas
cinematográficas. A busca comum de uma temática ou forma “antiburguesa” implícita em tais
obras nos conduzem a uma visão desfocada. Quando não se nota uma atitude estigmatizada como
antiburguesa (ou anticapitalista, ou ainda, revolucionária), condena-se tal obra como vazia de
conteúdo, implicando uma análise que tacha a obra como estéril crítica e interpretativamente em
suas possibilidades de olhares ao mundo. Muito do que se escreveu sobre Berlim e O homem com
a câmera caminhou nesse sentido.
O segundo ponto que questionamos em relação à análise de Kracauer de Berlim refere-
se à inexistência de referências ao material sonoro relacionado à produção do filme, que se
evidencia importante, já que foi pensado em conjunto com os processos de gravação e montagem
das imagens e revelam muitos dos posicionamentos críticos do filme, uma vez que, no pensamento
de Ruttman, o cinema consituía-se ou deveria constituir-se do produto sonoro-visual, ou ainda, que
a música dá base temporal estrutural para as imagens.
Interessante notar que nas sinfonias metropolitanas, mesmo sem seu referente sonoro,
encontraremos respaldo para aquilo que Ruttmann pensa sobre cinema. Filmes como Rien que les
heures, À propos de Nice (1930) de Jean Vigo, tal como Berlim, O homem com a câmera,
Entusiasmo, Philips radio e The oil symphony, podem ser entendidos, como nota Carolyn Birdsall
(2015, p. 20), a partir da metáfora sinfônica:
Durante os anos 1920, como Kurt London observou [no livro Film music de 1936],
filmes europeus crescentemente adotaram a estrtura sinfônica, com a ação
dramática geralmente ocorrendo de acordo com a seguinte sequência: introdução
– tema principal e secundário – desenvolvimento – recapitulação – coda. Em
companhia da sinfonia, noções de melodia e ritmo valeram-se como metáforas
para experimentos no estilo e na ação cinematográfica [...].
A noção de “velocidade”, cara para Ruttmann e para se pensar as primeiras décadas do
século XX, parece encontrar na sinfonia e na música uma metáfora para a estrutura e para o
transcorrer dos elementos fílmicos55. É nesse caminho que conseguimos notar a fundamental
presença da música nos anos de formação do documentário sonoro. Seja como metáfora, seja como
materialidade em si, a música é, poeticamente dizendo, como a lente da câmera no captar das novas
formas de sociabilidade da modernidade. Seja por intrincar-se no próprio fazer fílmico, por penetrar
55
Vale conferir o artigo “Sound rhythm and the film” de Ernest Borneman (Sight and Sound, v. 3, n. 10, p. 65-67,
summer, 1934). Nele, o autor, em 1934, traça relações diretas entre som e imagem, apresentando-as através de gráfico,
relacionando movimento vertical e horizontal na tela com ritmo, tempo, melodia e tema.
105
e compor a estrura narrativa, seja por trazer à tona aferições e percepções do realizador sobre
fluxos, indústrias e suas máquinas, pessoas, trens, automóveis, trabalhadores e seu trabalho, enfim,
do mundo histórico no qual as narrativas se inserem, ou, como argumenta Andrei Tarkovski (1998,
p. 190), por poder “conferir ao material filmado uma inflexão lírica, nascida da experiência do
autor”56.
Do ponto de vista da estrutura fílmica, Berlim carrega ligações bastante evidentes com
a sinfonia e com a música (especialmente na perspectiva ritmo-temporal). Ele é organizado como
uma sinfonia, numa sucessão de movimentos, de cinco atos. Cinco atos, como uma sinfonia de
cinco movimentos. A música do filme também foi composta em cinco andamentos/movimentos57.
No primeiro ato, o andamento é allegro, no segundo é andante, no terceiro é allegro, no quarto é
adagio e no quinto é allegro. Allegro é um andamento considerado rápido, já andante e adagio são
andamentos mais lentos (o adagio é mais lento que o andante). De maneira geral, a velocidade de
cada um desses andamentos compartilha semelhanças com alguns movimentos da cidade em cada
um dos cinco atos. O primeiro ato é rápido, mostra a chegada do trem a Berlim. O segundo ato é
lento, a cidade está ainda adormecida. O terceiro ato é rápido, já passa das oito horas da manhã e a
cidade já funciona a plena velocidade. O quarto ato é mais lento, é a hora do almoço, do descanso
e do lazer. O quinto ato é rápido, mostra a agitada noite de Berlim.
A metáfora da sinfonia também esteve presente na produção de Vertov. Um
projeto/proposta d’O homem com a câmera escrito pelo Vertov (1974, p. 301-305) em 1928 carrega
no título a sinfonia: “O homem com a câmera (uma sinfonia visual)”. Entusiasmo, na cartela do
filme, também carrega nos parênteses do título a sinfonia: “Entusiasmo (sinfonia de Donbass)”.
Vertov (1974, p. 120-122), em repulsa à imprensa berlinense, que acreditava que sua
cinematografia era uma “extensão ‘fanática’ da teoria e prática de Ruttmann”, conta, mencionando
o termo sinfonia, que, mesmo antes de Berlim,
a maioria dos filmes cine-olho foram construídos como uma sinfonia do trabalho,
ou como uma sinfonia de toda a União Soviética ou como a sinfonia de uma
determinada cidade. Deve-se agregar que a ação nestes filmes se desenvolvem da
manhã até a noite.
56
Tarkovski (1998, p. 190) cita como exemplo seu filme O espelho: “Em O espelho, por exemplo, que é um filme
autobiográfico, a música é introduzida muitas vezes como parte do material da própria vida, da experiência espiritual
do autor, sendo, portanto, um elemento vital do universo do herói lírico do filme”.
57
Verificar versão orquestrada por Mark-Andreas Schlingensiepen (1987) no setor de partituras da biblioteca do
Instituto de Artes da Universidade Estadual de Campinas (IA/Unicamp).
106
Vertov arremata o assunto dizendo que a história ocorre diferentemente do que a imprensa
berlinense prega, tanto em termos de fato quanto de cronologia, já que, em verdade, os
experimentos de Ruttmann devem ser considerados como o resultado de anos de desenvolvimento
do cine-olho e não o oposto.
Oksana Bulgakowa (2006, p. 224-225), pesquisadora ucraniana (nascida na então
União Soviética), especialista na produção soviética de Eisenstein e Vertov, em um artigo que
detalha relações entre sinfonia/música e Entusiasmo, nos diz que
É notável que esse filme, que quebra com o “circuito limitado dos sons bem
temperados”, é estruturado como um sinfonia programática de quatro movimentos
na qual os leitmotivs e refrões desenvolvem uma narração musical. Os quatro
movimentos são os que seguem: Primeiro movimento: dessacralização da igreja
(overture, allegro). (Esse movimento é uma forma-sonata contruída no contraste
de um primeiro tema principal e de um segundo tema subdominante: o sino e o
apito da fábrica como tema principal e dominante no nível dos ruídos; a liturgia e
a marcha completam esses papéis no nível melódico); Segundo movimento: o
trabalho nas minas de carvão (moderato); Terceiro movimento: o trabalho na
fundição (Rondó, allegro vivace); Quarto movimento: a colheita no campo
(Pastoral; andante cantabile)
Philips radio, exibido em 1931, como Entusiasmo, é outra produção na qual relações
sinfônicas e musicais metafóricas irão permear a concepção fílmica. Ele foi concebido
primeiramente como um filme silencioso, como nos revela o contrato de produção assinado no dia
primeiro de setembro de 1930 entre Joris Ivens e a Philips. Contudo, entre fevereiro e maio de
1931, uma extensão do primeiro acordo foi feita. Joris Ivens solicitou “composição, edição e
produção de uma trilha sonora”, cuja sincronização deveria ocorrer no estúdio da Tobis em Paris
(DIBBETS, 1999, p. 77; p. 283). Joris Ivens teria começado a pensar na possibilidade do som
naquele que seria seu primeiro filme sonoro em dezembro de 1930, como nos conta Karel Dibbets.
Enquanto filmava no setor de vidraria da Philips, ele teria chamado a atenção de um repórter a
respeito da riqueza de som daquele espaço:
Lindo material para um filme sonoro. Sinfonias inumanas de tilintar de vidros
combinadas de todos os jeitos estranhos, soando como um carrilhão de acordes.
Sons graves, abafados, explosivos como as batidas de um tímpano escutadas à
distância, e entre isso, a voz do supervirsor do armazém, que fala alto pelos alto-
falantes (IVENS, 1930 apud DIBBETS, 1999, p. 77).
Lou Lichtveld58, compositor do filme, afirma que Philips radio
58
Lou Lichtveld compôs em 1932 uma música para acompanhar A chuva (1929) de Joris Ivens, antes da famosa versão
de Hanns Eisler, de 1941. As versões podem ser conferidas nos extras do disco 1 do box de DVD’s “Joris Ivens:
Weltenfilmer”, uma coletânea dos filmes de Joris Ivens, de 1912 a 1988.
107
Foi uma tentativa de tornar impressões meio musicais de sons de fábrica em um
um mundo auditivo complexo que vai da música absoluta aos ruídos documentais
puros da natureza. Nesse filme todo estágio intermediário pode ser encontrado: tal
como o movimento da máquina interpretado pela música, os ruídos da máquina
dominando o fundo musical, a música por si só é o documentário, tal como aquelas
cenas nas quais o som puro das máquinas vai só (LICHTVELD, 1932, p. 116 apud
DIBBETS, 1999, p. 85).
Joris Ivens, segundo pesquisa de arquivo de Dibbets (1999, p. 72; p. 282) no acervo da
Philips, ao finalizar a edição do Philips radio, enviou uma carta à Philips com um sumário no qual
pontua que o filme foi dividido em seis partes, com uma introdução e um epílogo. E, de fato, Philips
radio, que foi batizado de Symphonie industrialle (Sinfonia industrial) na França – sendo
considerado um dos marcos inaugurais da era sonora do “filme industrial” (ou “filme de fábrica”)
– foi organizado de forma evidente em três partes que se dividem, cada uma, em duas (lâmpadas
receptoras, lâmpadas transmissoras, comunicação radiofônica, trabalho no escritório e no
laboratório, montagem dos rádios, montagem dos alto-falantes) e que estão circunscritas entre uma
introdução e um epílogo, numa organização fílmica que nos lembra bastante uma estrutura básica
sinfônica: introdução, tema principal e secundário, desenvolvimento, recapitulação e coda.
The oil symphony, realizado na então República Socialista Soviética do Azerbaijão por
Boris Pumpyanski59, com composição de Sergei Paniyevin, também se estrutura de forma
semelhante: uma introdução (mar de ondas de petróleo), primeira parte (apresentação de Baku, a
“capital do petróleo”; e de LokBatan, o local de extração de petróleo), segunda parte (os
trabalhadores e a perfuração dos poços; os trabalhadores e a vultosa extração de petróleo), terceira
parte (trabalhadores depois do trabalho realizado e no momento de lazer; trabalhadores e a
construção de novos poços, sistema de extração e transporte) e coda (como a introdução).
Do ponto de vista do material musical propriamente dito – e das partituras e indicações
sonoras no caso das sinfonias metropolitanas silenciosas – há que se destacar algumas principais
características que se notam de forma recorrente nas sinfonias metropolitanas.
Uma delas é o emprego dos leitmotivs60, um dos recursos musicais mais recorrentes no
cinema. Sua presença pode indicar a importância de certos elementos, destacando-os
conceitualmente de outros na composição fílmica.
59
Nos anos 1940 foi o câmera chefe de Dziga Vertov nos fimes Kazakhstan for the Front (1942) e In the Mountains
of Ala-Tau (1944).
60
Técnica composicional que foi largamente utilizada por Richard Wagner em suas óperas e que consiste na
criação de temas e motivos musicais que se associam a uma personagem, a uma situação dramática, a um objeto, a
108
Nesse sentido, a música composta para Berlim é referencial (Figuras 4 e 5). Nela, são
apresentados sete principais temas, dos quais seis são usados mais explicitamente como leitmotiv:
tema de Berlim, marcha dos trabalhadores, ritmo das máquinas, ritmo do tráfego, ritmo do esporte
e ritmo da noite. A função exercida pelos leitmotivs variam, tal como em outros tipos de presença
da música. No caso de Berlim, o tema de Berlim exerce uma função mais determinante na
organização da narrativa e nas articulações entre planos e sequências, demarcando ou ressaltando
pontos de mudança de situações e conteúdos do plano dramático. Os outros leitmotivs agem mais
diretamente no plano dramático, sendo determinantes nas percepçãos ligadas à velocidade. A
marcha dos trabalhadores vai ainda exercer uma função semelhante àquela desempenhada pelo
leitmotiv do tubarão no filme Tubarão (1975) de Steven Spielberg61: mesmo na ausência visual do
trabalhador (tubarão), ele se faz muitas vezes presente no eixo dramático pelo motivo musical,
como se fosse um personagem. E, para além disso, a marcha dos trabalhadores se entrelaça diversas
vezes na composição musical com os outros leitmotivs, estabelecendo alguma instância de relação
entre os temas aos quais os motivos se referem.
De forma mais modesta, os leitmotivs aparecem também em O homem com a câmera62,
Entusiasmo63, Philips radio e The oil symphony, tanto exercendo uma função mais articulatória
quanto embrenhando-se no plano dramático.
um sentimento ou a qualquer outro elemento que o compositor ache relevante. O tema ou o motivo, nessa técnica,
é reiterado, por repetição e associação, juntando elementos explícitos ou implícitos das imagens com o plano sonoro.
61
Sobre o assunto, Carrasco (1993, p. 110) diz: “Há casos nos quais a música realmente substitui um personagem. No
filme Tubarão de Steven Spielberg, a figura central da fábula, ou seja, o próprio Tubarão, não aparece mais do que
algumas poucas vezes e nunca de corpo inteiro. Contudo, o público é sempre informado de sua presença pelo motivo
musical que corresponde ao perigoso animal. A relação entre o Tubarão e o seu leitmotiv é estabelecida logo na abertura
do filme. Os planos iniciais mostram o título e ouve-se um curto motivo na região extrema grave das cordas. Corta-se
para um plano do fundo do mar passando em alta velocidade, o que corresponde ao ponto de vista do Tubarão. O
motivo musical se desenvolve sobre um ostinato de cordas em andamento rápido, eventualmente pontuado por metais.
A partir daí está feita a associação e todas as vezes que ouvimos o referido motivo sabemos que o Tubarão está por
perto, embora quase nunca o vejamos. É um caso onde a música ocupa o espaço vazio deixado pela ausência física do
personagem na ação”.
62
Os leitmotivs em O homem com a câmera podem ser encontrados numa dimensão menos concreta. Nas indicações
sonoras/musicais para o filme, que não é propriamente a composição sonora/musical do filme, pode-se notar expressões
que se repetem, como “música alegre”. Verificar “Anexo I”, script musical escrito por Vertov para o filme.
63
Os leitmotivs em Entusiasmo aparecem de maneira diferente, não necessariamente ligada a um motivo estritamente
musical que se desenvolve e reaparece em variáveis arranjos, como nos outros exemplos citados. Iremos encontrar os
leitmotivs no filme, notando, sobretudo, a utilização repetida de certos “documentos sonoros”, como a marcha que irá
se associar às multidões, os sinos em associação à igreja, as sirenes etc. Verificar “The ear against the eye: Vertov’s
symphony” de Oksana Bulgakowa (2006) e “Música, futurismo e a trilha sonora de Dziga Vertov” de Michelle
Magalhães (2005).
109
Iremos também notar recorrentemente nas sinfonias metropolitanas a presença da música numa
relação direta com a materialidade explícita que aflora do plano visual, que podemos chamar de
paralelismo sensorial. Ela pode ser notada em três principais formas: densidade, ritmo/andamento,
imitação. Podemos entender “densidade” como a compatibilidade de informação sensorial entre o
som e a imagem. Como se aos elementos que compõem o plano visual fossem atribuídos elementos
na composição musical: quanto mais informação visual mais ideias existem no plano sonoro, e o
contrário também, quanto menos informação visual menos informação sonora. Por
“ritmo/andamento” entendemos a relação do ritmo e andamento musical com os movimentos e
fluxos dos elementos do plano visual, tal como com os cortes entre os planos visuais. A “imitação”
seria uma busca no plano musical pela simulação dos ruídos e efeitos sonoros numa
correspondência com aquilo que é mostrado na tela.
Em Berlim, um bom exemplo dos três paralelismos ocorre nos primeiros minutos do
filme, ainda no primeiro ato, da abertura até a chegada do trem à Berlim. Em O homem com a
câmera, um potencial exemplo no qual poderia ocorrer algo desses paralelismos encontra-se no
trecho que começa a partir do reaparecimento do câmera (depois do número “1”) até os planos da
mulher se vestindo64. Nas sinfonias metropolitanas sonoras, esses paralelismos são de fácil aferição
e permeiam grande parte da composição musical dos filmes.
Enfim, nas sifonias metropolitanas, que têm sua tomada musical fundada, sobretudo,
na heterogeneidade com a tomada visual, já se pode notar algumas das funções que seriam parte
das futuras convenções que se estabeleceriam na trilha musical dos anos 1930, quando o som de
cinema começa a superar as limitações técnicas da primeira fase do sonoro e consolida-se técnica
e poeticamente. Em linhas gerais, duas importantes dimensões em que a música se relaciona com
as imagens em movimento já se fazem notar: uma em que a música se relaciona com elementos da
composição fílmica que não são propriamente visuais, tais como o enredo, a situação dramática, as
intenções, as emoções e tudo aquilo que o filme nos indica no plano das ideias; outra em que a
materialidade sonora se relaciona com a materialidade visual, em relações de movimento,
velocidade, em pontuação de objetos etc.
64
Verificar o “Anexo 1”, o script musical escrito por Vertov para o filme, parte I, itens 6 e 7.
110
Figura 4 – Capa da partitura reduzida de Edmund Meisel para Berlim
Fonte: Deutsche Kinemathek (<http://www.deutsche-kinemathek.de/>).
111
Figura 5 – Apresentação da partitura reduzida de Edmund Meisel para Berlim
Fonte: Deutsche Kinemathek (<http://www.deutsche-kinemathek.de/>).
112
4.3 Breve consideração sobre a textura homofônica da música no documentário
Tal como no domínio ficcional, a música no documentário teve como grande

referencial a música romântica, especialmente naquilo que se refere às orquestrações de texturas
mais homofônicas (em detrimento de texturas mais polifônicas, características do barroco) – além
da estrutura sinfônica e narrativa –, valorizando estruturas e cadências harmônicas e privilegiando,
muitas das vezes, quando presente, linhas melódicas principais.
Leonid Sabaneev, em seu manual para música fílmica de 1935 (p. 70), “Music for the
films: a handbook for composers and conductors”, afirma que
o filme sonoro não suportará mais que duas linhas melódicas independentes. A
melodia principal e seu contraponto representam o máximo luxo polifônico
permitido para que não se corra o risco de obter um indiferenciável caos sonoro.
Kurt London, numa postura mais moderada, em seu famoso estudo de 1936, “Film
music: a summary of the characteristic features of its history, aesthetics, technique; and possibles
developments”, também toca no assunto e afirma que deve haver um uso balanceado de estruturas
polifônicas e homofônicas. Neil Lerner (2004, p. 1-2), que se dedicou aos estudos da música e do
documentário, especialmente ao norte-americano dos anos 1930 e 1940, afirma que essa balança
tendeu muito mais para o lado das texturas homofônicas. E, de fato, o uso de estruturas que se
distanciam da textura homofônica, ao menos nos documentários aqui trabalhados, é mais raro.
Lerner (2004, p. 1-25), em seu artigo “Musical texture as cinematic signifier: the
politics of polyphony in selected documentary film scores by Virgil Thomson and Aaron Copland”,
faz a análise de trechos que fogem da estrutura homofônica nos filmes The plow that broke the
plains e The river, com música composta por Virgil Thomson, e The cummington story (1945) de
Helen Grayson e Larry Madison, com música de Aaron Copland. Sua análise foca-se nas estruturas
musicais associáveis à fuga, características do período barroco, mais assentada na polifonia. Uma
estrutura que não encontra tradicionalmente relação com dramas e narrativas, diferentemente da
música romântica, e que potencialmente viola o conceito de “inaudibilidade”, caro ao cinema
clássico hollywoodiano e a sua estrutura de “cortes invisíveis”, como pontua Claudia Gorbman
(1987), por chamar demasiada atenção, devido a sua estrutura polimelódica. Para Lerner (2004, p.
18) as fugas nesses documentários, ao quebrarem com a “inaudibilidade”,
Realizam a importante função retórica de estabelecer o filme não como uma
narrativa ficcional escapista, mas como algo mais próximo a um discurso de
113
sobriedade, lembrando o público das maiores reinvidicações de verdade do
documentário, de seu enraizamento em lugares, eventos e pessoas reais. Assim,
uma possível razão para fugas em documentários: elas ajudam a significar
sistemas que procuram refletir bem como afetar “o real”.
Enfim, sem entrar no mérito de suas afirmativas, o que queremos dizer é que a textura
musical com tendências mais homofônicas parece ser a base dominante das composições do
domínio documental – e das músicas não originais que escutamos nos filmes –, e que outras
estruturas e texturas, apesar de existirem, são menos convencionais, como se pode aferir, de forma
geral, sobre outras tradições dramático-narrativas desde, pelo menos, a ópera ou, ainda, desde as
músicas instrumentais feitas para dança, no período barroco.
4.4 A tomada da música: sua relação com a tomada visual e com a circunstância de mundo
O campo teórico que tenta dar conta do debate sobre a presença da música em estruturas
narrativas (e no próprio cinema) é vasto, tal como a tradição das artes narrativas, e as funções
desempenhadas pela música nas diversas estruturas são muitas vezes compartilhadas e
semelhantes. Aqui, não pretendemos entrar com fôlego no campo do debate teórico e em análises
musicais. O que buscaremos, sobretudo, é identificar formas que acreditamos ser relevantes para
pensar a tradição documentária de forma diacrônica, tentando aproximar os estudos do som fílmico
da teoria documentária.
Em linhas gerais, podemos afirmar que no documentário clássico existe uma
predominância da música que tem sua tomada fundada numa heterogeneidade espacial e/ou
temporal com a tomada visual e com a circunstância de mundo, tal como nas sinfonias
metropolitanas. Embora as tomadas homogêneas entre música e imagens e a homogeneidade entre
a tomada da música e sua circunstância de mundo em heterogeneidade com a tomada visual
também apareçam com recorrência notável. No documentário moderno, a tomada da música
aparecerá recorrentemente em homogeneidade com a circunstância de mundo, seja em
heterogeneidade ou homogeneidade com a tomada visual. Embora seja notável a presença da
tomada heterogênea da música tanto em relação à imagem quanto em relação ao mundo fílmico.
Esse apontamento gira em tormo de três tipos gerais de tomada da música, que, mais
que classificatórios, servem de baliza para pensar a presença da música no documentário.
114
O primeiro tipo de tomada da música (mais predominante no documentário clássico) é
aquele que tem a fundação numa espacialidade e/ou temporalidade heterogênea em relação à
fundação da imagem (cujo espectador frui no mesmo presente da música) e à circunstância do
mundo fílmico. Em outras palavras, o lugar e/ou o momento no qual a materialidade sonora que
chega ao espectador foi captada difere do lugar e/ou do momento no qual a imagem (que chega ao
espectador ao mesmo momento) foi captada, tal como difere do lugar e/ou do momento ao qual o
mundo fílmico se insere.
A música compilada (ou música de arquivo, numa analogia à imagem de arquivo) é
uma daquelas que pode se estabelecer a partir de uma heterogeneidade drástica em relação à tomada
visual e à circunstância de mundo fílmico. Industrial Britain e Terra sem pão são dois exemplos
emblemáticos. O primeiro faz uso extensivo de música compilada composta no período romântico,
como Coriolan Overture de Beethoven; o segundo faz uso extensivo da também romântica Quarta
sinfonia de Brahms.
Hanns Eisler, em outro tipo de exemplo, reutiliza em New Earth composições de
própria autoria feitas anteriormente para os filmes Song of heroes e Kuhle Wampe (Suite para
orquestra nº 3 e 4, Die Ballade von den Säckeschmeißern).
Contudo, apresentar esse tipo de heterogeneidade não significa necessariamente que a
música compilada não estabeleça relações com as imagens, com o mundo fílmico e com os outros
sons, seja no âmbito dramático, épico ou no âmbito do objeto/temática/espaço/tempo fílmico –
mesmo porque a marca da música compilada é sua heterogeneidade temporal (já que sua tomada
se localiza num passado em relação à realização do filme como um todo) e não necessariamente a
heterogeneidade espacial com o mundo fílmico.
Em relação às funções épicas e dramáticas, Hanns Eisler, com sua música compilada
em New Earth, por exemplo, une e particiona planos, sequências, temáticas e cadencia paralelismos
sensoriais e ritmos intraplano. Em The forgotten village, por exemplo, é usada a canção tradicional
mexicana El muchacho alegre, compilada. O filme trata de uma vila mexicana e a música, que é
cantada em espanhol, relaciona-se diretamente e minimamente, ao menos para o público norte-
americano, ao povo ou ao território mexicano.
No período do documentário clássico, Spanish Earth talvez seja um dos filmes que
mais emprega música compilada. Numa contagem despreocupada é possível anotar mais de dez
115
músicas, que são, sobretudo, sardanas, tipicamente catalãs, coletadas, em sua maioria, em
Barcelona, como especula Jordi Olivar (2014, p. 69) em sua análise do filme65. Nos filmes da época
da Segunda Guerra, a música compilada também foi extensivamente utilizada, sobretudo os hinos
e as marchas militares, que, embora muitas das vezes com tomadas espacialmente heterogêneas ao
mundo fílmico e à tomada visual, relacionavam-se diretamente com a temática fílmica. A série
Why we fight, Tunisian victory e The Battle of midway são exemplos emblemáticos.
A música compilada, nesse sentido, traz ao ferramental narrativo um potencial de
associação – seja arbitrário, vago, inventado, volúvel, irônico, de má-fé, de boa-fé, absurdo, ético,
não ético etc. – entre a música utilizada (e seu entorno sociocultural) e os elementos do mundo
fílmico. Ela também, como no caso citado de New Earth, e mesmo nos casos de Industrial Britain
e Terra sem pão, intencionalmente ou não, é capaz de cumprir os papéis clássicos da música fílmica
orginal66.
Embora o uso da música compilada tenha sido comum no documentário clássico, a
música de tomada heterogênea em relação à tomada visual e à circunstância do mundo fílmico mais
recorrente foi aquela originalmente composta para o filme. E os papéis desempenhados por ela na
narrativa são variados.
Um caso interessante é o do “repórter musical”, como o próprio Hanns Eisler (apud
BRUNEL, 1999, p. 200) nomeou seu trabalho para Song of heroes, cujo assunto introduzimos no
item 4.1:
Logo notei que eu não poderia escrever a música atrás de uma mesa, então eu
comecei a trabalhar como “repórter musical”. Eu primeiro precisava de
informação detalhada sobre a realização, depois eu gravei a música nativa das
minorias nacionais e os sons nas fábricas. O trabalho não foi fácil para mim [...],
então eu fiquei muito orgulhoso de ter gravado mais que setecentos e cinquenta
metros de ruídos e música das minorias nacionais numa atmosfera incomum para
mim. O segundo passo do meu trabalho foi feito em Moscou, onde eu compus a
música fílmica, a qual gravei nos estúdios Mezjrabom. Primeiro, com o camarada
Tretjakov, eu gravei a “Ballad of Magnitogorsk” do Komsomol [juventude do
65
Interessante notar que embora a música utilizada seja espanhola (instrumental e cantada em catalão), ela é muito
específica da Catalunha. Os conflitos de se trabalhar com música catalã e se falar da Espanha como um todo e de
regiões que não são parte da Catalunha são debatidos de forma interessante por Jordi Olivar (2014) no artigo “This is
their fight: Joris Ivens’s The Spanish Earth and the romantic gaze”.
66
Vale aqui lembrar, em referência à intencionalidade ou não dos realizadores, aquilo que Michel Chion (1994, p. 189-
190) menciona no item “Forced marriage” (casamento forçado) do Audio-vision. Ele propõe que se tire a música
original do filme e coloque outras no lugar, aleatoriamente. Ele afirma que o “sucesso é garantindo”, em dez ou mais
versões sempre existirão alguns incríveis pontos de sincronização e justaposição.
116
Partido Comunista da União Soviética]. O texto era bem simples: Ural, Ural/
Cidade da montanha magnética/ Tem muito aço lá [...].
Apesar da tomada heterogênea da música, a ligação entre a visualidade e o próprio
mundo fílmico foi buscada pelo compositor, que foi a campo, para estudar e colher materiais que
o ajudassem na composição da música do filme. E, de fato, é notável traços melódicos e rítmicos
que distoam do resto da obra de Eisler e que se aproximam das composições do período do
“realismo socialista”, incluindo a canção composta com o intelectual, escritor e correspondente do
jornal Pravda, Sergei Tretyakov.
O “repórter musical” apareceu em diversos outros documentários clássicos, em menor
ou maior grau de proximidade com a circunstância de mundo fílmico. Alguns exemplos variados
são Os pescadores de Aran, com música de John Greenwood, Triunfo da vontade, com música de
Herbert Windt, The plow that broke the plains, The river e Louisiana story, com música de Virgil
Thomson.
Em Os pescadores de Aran, como é apontado nos créditos iniciais, a música foi baseada
em canções populares irlandesas, das Ilhas de Aran, região tematizada no filme. Mesmo em meio
a uma orquestração tradicional, padrões melódicos e rítmicos da música celta da região são
notáveis67.
Para compor a música de Louisiana Story, Virgil Thomson foi também um “repórter
musical”. Ele foi buscar fontes materiais que o ajudassem a compor a música do filme no Archive
of American Folk Song. Nele, Thomson debruçou-se sobre as gravações feitas pelos
etnomusicólogos Alan e John Lomax nos anos 1930 (BRASSEAUX, 2009, p. 111). As gravações
eram de canções populares dos Cajuns, descendentes de povoado francófono (Acadiano) do
nordeste da América do Norte que se fixou no sul de Luisiana. O filme gira em torno de um jovem
cajun, personagem principal do filme, e da invasão da indústria de petróleo em seu povoado em
Luisiana. As canções populares formaram a base melódica do material musical do filme, e em 1949
Virgil Thomson ganhou o Pulitzer Prize na categoria de música pela sua composição para o filme,
o primeiro e único compositor a ganhar o prêmio com música fílmica68.
67
Vale conferir a série de programas televisivos “Ceol na nOileán” da TG4, emissora irlandesa – que explora a tradição
musical de diversas ilhas irlandesas – em especial o capítulo “The stunning beauty and music of Aran island”,
produzido em 2009. Disponível em: <http://youtu.be/0CMtBIMIS0Q>. Acesso em: jun. 2014.
68
Verificar o site oficial do Pulitzer Prize, <http://www.pulitzer.org/bycat/Music>, acesso em: jun. 2014.
117
Virgil Thomson, em outros dois marcos do cinema documentário, The plow that broke
the plains e The river, parte de uma abordagem semelhante à de Louisiana story para compor a
música. Em The plow that broke the plains, Thomson incorporou a melodia de canções de trabalho
(“I ride a old paint”, por exemplo) e de cowboy (“Get along, little dogies”, por exemplo), assim
como hinos religiosos (“Old hundred”), difundidas nas Grandes Planícies (região a oeste do Rio
Mississipi, nos Estados Unidos, que se estende do norte ao sul do país), região tematizada no filme.
Em The river, como aponta Neil Lerner (1999, p. 106), Thomson usou melodias
presentes em The Southern harmony and musical companion, um livro de hinos e temas populares
compilados por William Walker, lançado em 1835, e em The sacred harp, um livro também com
hinos e temas populares, lançado em 1844 por Benjamin Franklin White and Elisha King. Ambos
figuram entre os mais importantes e influentes livros de hinos e temas do sul norte-americano
(LERNER, 1999, p. 106). Segundo Lerner (1999, p. 107), as melodias escolhidas por Thomson
ligam-se geograficamente e historicamente à região cujo filme se dedica. Lerner pontua também
que as fontes das músicas religiosas utilizadas são identificáveis “em termos de raça (branca),
classe (geralmente mais baixa) e religião (protestante)” e que são potencialmente familiares na
região do Rio Mississippi, que é tematizado no filme.
Ainda na perspectiva do “repórter musical”, temos o emblemático exemplo de Herbert
Windt, que, em sua composição para Triunfo da vontade, combina melodias folclóricas
germânicas, música marcial, temas do partido nazista e temas wagnerianos e “neo-wagnerianos”.
Como nota Richard Barsam (1975, p. 26-28) em seu estudo esmiuçado do filme, Windt não usa,
tirando pequenas exceções, os temas de Richard Wagner diretamente, “ele conta com a
familiaridade do espectador com a obra de Wagner e cria uma nova música heroica que evoca o
mundo wagneriano sem imitá-lo”. Com a combinação dos elementos wagnerianos com outros
elementos musicais presentes e/ou exaltados no contexto nazista, Windt, como aponta Barsam,
sugere a continuação da antiga tradição musical, numa perspectiva germânica, ao mesmo tempo
em que cria uma música fílmica de contínua variedade e interesse.
A música que é fruto do “repórter musical” pode exercer papéis semelhantes ao da
música compilada, sobretudo daquela que se aproxima mais da homogeneidade espacial com o
mundo fílmico. A diferença principal estaria no potencial que a primeira ganha em relação às
possibilidades narrativas. Ela, como fruto do compositor do filme, pode ser moldada, construída e
118
arranjada para servir à narrativa em toda potencialidade e variedade funcional pertencente à música
originalmente composta para o filme ao mesmo tempo em que pode manter/forjar o elo musical
com o mundo fílmico, numa virtual homogeneidade.
Ainda em relação a esse primeiro tipo de tomada da música (heterogênea espacial e/ou
temporalmente em relação à tomada visual e à circunstância de mundo fílmico), há outra situação
interessante. É o caso em que a música é especialmente gravada para o filme, mas não
necessariamente composta para ele, e quem a executa é um personagem ou uma figura que se liga
diretamente ao mundo fílmico. Tomemos dois exemplos: Song of Ceylon e Target for tonight.
Para a realização de Song of Ceylon, foram levadas para a Inglaterra duas pessoas do
Sri Lanka (Ceylon), Ukkuwa and Suramba (dançarino e percussionista do filme), para gravar voz,
canto e percussão69. A tomada sonora em locação não foi possível e a solução encontrada pelos
realizadores para incorporar elementos musicais do mundo fílmico autênticos foi levá-los ao
estúdio em Londres. Situação semelhante já havia ocorrido em Os pescadores de Aran, quando
nativos das Ilhas de Aran foram levados para os estúdios para gravarem suas vozes. Situação que,
por sua vez, assemelha-se, mesmo que tangencialmente, à do já citado caso de Eu, um negro.
Em Target for tonight, a situação é um pouco distinta. O filme tematiza, no contexto
da Segunda Guerra, uma missão britânica contra a Alemanha, atuada por membros da Royal Air
Force. A música do filme foi executada pela Royal Air Force Central Band. Por mais que não sejam
os mesmos membros da Royal Air Force que atuam nas imagens e que tocam, a instituição revela-
se, para além das imagens, na materialidade musical – na instrumentação e na orquestração que
nos remetem às bandas marciais, típicas de organizações militares, por exemplo.
Nos parágrafos anteriores, apresentamos diversos exemplos nos quais a música, mesmo
tendo uma tomada espacial e/ou temporal heterogênea com a tomada da imagem e com a
circunstância do mundo fílmico, pode estabelecer diversos tipos de relação com a narrativa, com o
tema, com o espaço e o tempo fílmico. Podemos notar, em alguns casos mais e em outros menos,
que o interesse em dar à música um lugar no mesmo mundo que o das imagens ou de trazer
elementos musicais do mundo e dos elementos tematizados – ou que se relacionam de alguma
69
Informação obtida no site do arquivo e catálogo da “Colonial film: moving images of the British Empire”,
<http://www.colonialfilm.org.uk/node/486>, acesso em: nov. 2014.
119
forma ou que se relacionam forjadamente com esse mundo e seus elementos – para a dimensão
fílmica já é notável no documentário dos anos 1930 e 1940.
Para além dessas situações (música compilada, “repórter musical”, música executada
por pessoas relacionadas ao mundo fílmico), temos aquela situação em que a música é composta
originalmente para o filme, executada e tomada numa material e virtual heterogeneidade (ao menos
em grande medida) com o mundo fílmico. Músicos emblemáticos que trabalharam (também) nessa
linha no documentário são, por exemplo, Aaron Copland, Benjamin Britten, Douglas Moore,
Hanns Eisler, Marc Blitzstein e Walter Leigh. Apesar de lidarem com as especificidades éticas do
documentário, a presença e o papel desse tipo de música são próximos daquilo que se observa no
cinema ficcional e nas sinfonias metropolitanas, em todas suas funções épicas, dramáticas e líricas.
O segundo tipo de tomada da música que gostaria de discutir, ocupa, por assim dizer,
o meio do caminho entre o tipo de tomada debatido nos parágrafos anteriores e o tipo de tomada
que se estabeleceria de forma definitiva no documentário moderno (a tomada da música em
homogeneidade com a tomada visual e com a circunstância de mundo fílmico). Ela se funda em
homogeneidade com o mundo fílmico, mas se estabelece em heterogeneidade com a imagem da
tomada visual que chega ao espectador concomitantemente.
A diferença desse tipo de tomada para a música compilada que estabelece relações com
o mundo fílmico reside no fato de ela ser feita para o filme ou, se não, ao menos, captada por seus
realizadores ou captada num espaço e tempo homogêneo ao mundo fílmico e a seus elementos. Em
alguns casos, como veremos adiante, ela pode até se fundar em homogeneidade com a tomada
visual, mas o aspecto a se ressaltar é que ela rompe sua relação genealógica e se firma com imagens
de outras tomadas visuais. Apesar de ser um tipo de tomada mais comum no documentário
moderno, são diversos os casos em que aparece no documentário clássico.
Em Song of heroes, temos um exemplo bem claro. Hanns Eisler, enquanto fazia seu
trabalho de “repórter musical”, captou sons e músicas em locação, em homogeneidade com a
circunstância espacial e temporal do mundo fílmico. Contudo, esses elementos sonoros são levados
ao espectador junto com imagens que não foram tomadas no mesmo espaço e/ou tempo das
imagens. As melodias tocadas na flauta são um exemplo. O foco principal não está em buscar uma
sincronia da música com a imagem. Ela atua como um elemento bastante funcional, unindo planos
120
(música contínua junto a diversos planos visuais) e se associando a um lugar (estepes), ao mesmo
tempo em que nos joga sonoramente ao mundo fílmico.
Em The voice of Britain, um filme que contou em boa parte com sons e imagens
captadas simultaneamente, situação semelhante acontece. É comum ao longo do filme trechos em
que a tomada da música é heterogênea, ao menos temporalmente, à tomada da imagem; embora a
música e a imagem nasçam algumas vezes num mesmo presente, na edição e na montagem fílmica,
elas são levadas ao espectador isoladamente, na companhia de música/imagem de outra
circunstância de tomada, heterogênea. Notaremos casos semelhantes no documentário clássico,
como em Children at school, Native Land e Listen to Britain.
O que está em jogo em primeiro lugar nessas situações não é a performance musical e
nem a busca de levar ao espectador imagens e sons sincronizados. Antes disso, parece-me que
existe a preocupação de dar um endereço, um lugar, um contexto à música que escutamos. De certa
forma, é apresentar a música como materialidade viva do mundo fílmico, deixando as imagens
livres no exercício de suas potencialidades narrativas que estão circunscritas para além da sincronia
da tomada sonoro-visual.
Em Listen to Britain, em um caso extremo, isso fica bastante claro. Nele, a música (tal
como os outros elementos sonoros) parece determinar o espaço e tempo do mundo fílmico de forma
mais deliberada que as imagens. Ken Cameron (1947, p. 42), engenheiro de som do filme, ao falar
de quatro exemplos de documentários de guerra que fazem interessante uso do som – Listen to
Britain, Burma victory (1945) de Roy Boulting, Journey Together (1945) de John Boulting e A
diary for Timothy –, infere que Listen to Britain é um filme ilustrado pelo uso dos efeitos-sonoros,
segundo ele, “as imagens da tela podem ser consideradas como suplementares ao som”.
Embora seja comum no documentário clássico, esse tipo de tomada (heterogênea à
tomada visual, mas homogênea à circunstância de mundo fílmico) encontra um espaço importante
no documentário moderno. É por meio da música que é fruto desse tipo de tomada que a sincronia
entre música e imagem pode se quebrar sem perder seu lastro de “realidade”, “factualidade”,
“existência” e de “vocação” mundana presentes no estilo e ética do documentário moderno. É por
esse caminho que podemos entender grande parte da articulação da música não sincrônica no
documentário moderno, que é mais recorrente do que costumamos inferir.
121
Um caso interessante é o de Primárias. Nele, é usada em diversos trechos a música de
campanha de John Kennedy (uma versão da famosa canção de sucesso High hopes de Frank
Sinatra) e em alguns outros trechos é usada a música de campanha de Hubert Humphrey – ambas
em mais de uma versão e às vezes sincrônicas com as imagens. No filme, elas cumprem papéis
clássicos da trilha musical – como leitmotiv e como ferramenta de união espacial/temporal/temática
entre planos visuais – sem necessariamente serem “acusadas” de “manipuladoras”, como as
músicas originalmente compostas para filmes. Nos créditos finais do filme ainda se informa:
“Music/ by courtesy of the Candidates”.
Em Titicut folies também há uma situação interessante. Ela gira em torno da melodia
de “My blue heaven”, tocada por um interno no trombone. Enquanto escutamos a música, é notável
que a sincronia entre som e imagem não é o foco e tampouco é apenas a performance do interno
que está em jogo. Há uma delicada construção e edição dos cortes entre os planos. Uma
continuidade espacial e temporal narrativa é articulada a partir da música. Começamos a escutar a
música quando temos no plano visual um interno de frente para uma janela, dentro do prédio. A
música é apresentada com outros sons, num volume baixo, dando a entender que aquilo que
escutamos é o ambiente sonoro que envolve o interno do plano visual. O próximo plano é do pátio,
fora do prédio, para onde supostamente o interno do plano anterior olha; ainda não vemos a fonte
sonora da música que escutamos, mas seu volume já é maior. Nos planos seguintes, já vemos o
interno trombonista tocando. A partir desse ponto, localizamos factualmente a música como
homogênea às imagens das tomadas visuais e à circunstância do mundo fílmico. Contudo, os
trechos de sincronia entre música e imagem que não são fruto de pós-produção são bem curtos (são
principalmente aqueles planos que enquadram com proximidade o trombonista). Enquanto ainda
escutamos a música, planos abertos do pátio e de outros internos são costurados em meio à
continuidade sonora da música. O que temos nessa sequência está para além da sincronia da tomada
sonoro-visual70. É um recurso de articulação musical sofisticado que utiliza a materialidade sonora
da música homogênea à circunstância do mundo fílmico e heterogênea (na maior parte) à tomada
visual, construindo, numa mistura de cutways e reaction shots, uma sequência que faz transparecer,
70
Há também outra construção semelhante, mais curta, que ocorre a partir da música “The Ballad of the Green Beret”
cantada por outro interno.
122
segundo alguns críticos, a ironia da montagem de Fredreick Wiseman, diretor e editor do filme
(GRANT, 2005, p. 7; ANDERSON; BENSON, 1991, p. 51).
Em Salesman, temos, ao menos, três outras situações semelhantes. A primeira é entre
o décimo oitavo e vigésimo minuto do filme, quando uma música que, a princípio, vem do rádio
do carro constrói a união de planos visuais (seis) que na sequência contrõem o caminho de volta
de Paul Brennan, do seu dia frustrado de venda em Boston, ainda de dia, até o hotel onde dormirá
(Yankee Drummer Inn), já à noite. Situação semelhante ocorre quando Brennan viaja pela região
de Opa-Locka na Flórida. A terceira situação é a das duas aparições de Yesterday dos Beatles na
versão instrumental de Percy Faith. Num primeiro momento a música é fruto de uma tomada
sonoro-visual sincrônica; mas na sequência seguinte a mesma música é reapresentada com outras
imagens, como fruto de trabalho de pós-produção, dando, senão uma dimensão lírica, uma
dimensão contemplativa à sequência, passível de uma análise que vai para além do sincronismo ou
que a reconheça não apenas como música tomada em locação.
Casos similares ocorrem em outros tantos documentários (entre eles os documentários
musicais, os “pré-modernos” e modernos da National Film Board e do Free cinema, o direto norte-
americano e o verdade francês): Mamma don’t allow (1956) de Karel Reisz e Tony Richardson,
The days before Christmas (1958) de Stanley Jackson, Wolf Koenig e Terence Macartney-Filgate,
We are the Lambeth boys (1959) de Karel Reisz, March to Aldermaston (1959) creditado
posteriormente a Karel Reisz e Lindsay Anderson, The Back-breaking Leaf (1959) de Terence
Macartney-Filgate, Happy mother’s day, Lonely boy, A pirâmide humana, Jazz on a summer’s day
(1959) de Bert Stern, Pour la suite du monde, The Beatles USA, Don’t look back, Monterey pop
(1968) de D. A. Pennebaker, Woodstock (1969) de Michael Wadleigh, Gimme shelter (1970) dos
irmãos Maysles.
No documentário moderno, além desse tipo de tomada da música (espacial e/ou
temporalmente heterogênea à tomada visual e homogênea à circunstância de mundo fílmico), há
um terceiro tipo de tomada também recorrente. É a sempre citada tomada sincrônica, que capta
sons e imagens em homogeneidade e que, para além disso, é preservada em sua homogeneidade na
materialidade sonora e visual que é levada ao espectador.
Nos documentários musicais esse tipo de tomada e o anterior vão se mesclar em grande
medida. Ao mesmo tempo em que a performance musical é privilegiada, tem-se o uso recorrente
123
dos cutaways. Em Jazz on a summer’s day, um dos precursores do “documentário musical de
festival”, esse tipo de construção é trabalhado ao longo de todo o filme: em meio às performances
que têm a música e a imagem de tomada homogênea há, intercalado, planos visuais de lugares e
tempos heterogêneos, enquanto a música permanece contínua, sem cortes71. Em Montery pop,
Woodstock e Gimme shelter, por exemplo, o recurso também é recorrente.
Kracauer (1960, p. 145-146), em seu livro Theory of film: the redemption of physical
reality, revela sua desconfiança em relação às performances musicais, deixando implícito que os
filmes que levam ao espectador apresentações musicais não são propriamente cinematográficos.
Seu referencial acentava-se, provavelmente, nas apresentações filmadas que inundaram as telas de
cinema desde o nascimento do filme sonoro. Nos exemplos mais ligados à estilística moderna, essa
perspectiva pode ser questionada, uma vez que a construção, edição e montagem cinematográfica
ficam evidentes, dando às imagens e às músicas os tratamentos que lhes transformam numa
narrativa cinematográfica. A mescla dos dois tipos de tomada referidas em parágrafo anterior são
uma das bases de grande parte desse tipo de produção de caráter cinematográfico que envolve
performance musical. É a partir dessa mescla que o filme, sem abrir mão da performance (levada
ao espectador para fruição sincrônica da materialidade sonora da música e da ação visível dos
performers na execução dessa mesma música), pode alçar vôo para as mais variadas contruções
cinematográficas ao longo das sequências em que escutamos a música performada.
Há também, os casos em que essa mescla não ocorre, ou ocorre com baixa incidência,
estabelecendo-se, definitivamente, a tomada sonoro-visual homogênea da performance, como nos
shows em The Beatles USA – embora se consiga uma variação de planos visuais devido às diversas
câmeras em ação ao mesmo tempo.
Para além das sequências de filmes que lidam com a performance musical em
concertos, festivais etc. para um grande público, temos um outro tipo de performance bastante
relevante na estilística do direto.
Em filmes como Jazz on a summer’s day, Montery pop, Woodstock, Gimme shelter,
nas sequências com foco nas performances musicais no palco, a tomada da música não tem a
mesma dimensão moderna da tomada visual. Nesses filmes, a tomada musical é feita pelos
71
Para uma análise de Jazz on a summer’s day conferir o livro Playing to the câmera: musicians and musical
performance in documentar cinema de Tomas Cohen (2012, p. 23-36)
124
microfones presentes no palco. Eles não são carregados junto com a câmera pela equipe realizadora
e tão pouco transitam com liberdade pelos espaços. A liberdade de mobilidade é, antes de tudo,
visual. As imagens são fruto, em grande parte, de diversas câmeras distribuídas no e para o palco.
A música está fadada a ser aquela que tem sua captação nos microfones da performance ao vivo,
propriamente dita, do mundo fílmico.
A tomada musical mais moderna, que mergulha na estilística do direto, é aquela que se
sujeita aos eventos não programados (ou menos programados), a uma (im)previsibilidade que pede
a conta ao sujeito-da-câmera e do gravador no transcorrer do presente, a seu estar ou não presente
em determinado espaço e tempo, no carregar na pele das marcas do presente e de sua variável
intensidade e de fazê-las chegar ao espectador do filme. É aquela música que é captada junto com
os outros elementos sonoros do espaço fílmico numa mise-en-scène que a princípio se distancia
daquelas que envolvem grandes apresentações – cuja música é captada no palco, numa
direcionalidade inequívoca à voz do cantor e ao soar dos instrumentos em palco (sujeitas, no limite,
às próprias vontades direcionais de captação dos performers, como quando o cantor vira seu
microfone ao público).
As grandes apresentações são, em si, antes de serem levadas ao espectador fílmico,
uma espécie de mise-en-scène, fruída por seus espectadores ao vivo. De certa forma, é dizer que as
grandes apresentações são, em verdade, encenações construídas, embora elas sejam ao mesmo
tempo encen-ação (encenação direta) para o sujeito-da-câmera, que pouco inflexiona a
performance musical; ou que, no máximo, é uma encenação dividida para dois distintos tipos de
fruição espectatorial (a ao vivo e a do filme). Daí surge um tipo de tomada bastante interessante:
os planos visuais e sonoros são construídos (não necessariamente para o filme) e envolvem uma
alta previsibilidade, controlada por dimensões extrafílmicas, ao mesmo tempo em que as próprias
performances, dentro da construção, estão abertas para o acaso (ou para as múltiplas situações mais
ou menos imprevisíveis que envolvem grandes aglomerações), cuja dimensão sonora/musical será
fruída a partir da apatia dos realizadores no não controle do microfone. As diferentes cargas de
intensidade do presente não são sentidas na pele do sujeito-da-câmera no âmbito sonoro, já que o
mesmo não manuseia os microfones do palco.
Em outras palavras, pode-se notar dois tipos recorrentes e gerais de tomada homogênea
(tanto em relação à tomada visual quanto à circunstância de mundo fílmico) que envolvem a
125
performance musical (a partir das quais variações são notáveis de acordo com parâmetros
estilísticos e éticos relativos à obra). Um tipo é o da performance musical tal como ocorre em
trechos de filmes como Don’t look back e Lonely boy – quando Bob Dylan e Paul Anka são
captados tocando e cantando em pequenas salas, fora da mise-en-scène intrínseca ao espetáculo
musical. O segundo é o da performance musical de grandes apresentações.
Podemos inclusive nos questionar se a primeira é uma performance musical ou se é
uma performance da vida, mais ligada ao ordinário; ou, em outra forma de fazer o questionamento
(ou de nos confundir), se a tomada é a de um performer, de um artista ou de uma personagem
famosa ou qualquer em seu agir cotidiano. Obviamente são questões que estão para além do
cinema, contudo, as diferenças de tomadas nos lançam, potencialmente, para vertentes distintas de
entendimento e fruição no ver e ouvir da música e de seu executante. E ambos os tipos de tomada
tornaram-se comuns na tradição documentária, em especial nos “documentários musicais”.
Há uma outra situação em que a tomada da música é homogênea à tomada visual e à
circunstância de mundo fílmico, mas que, contudo, não envolve uma performance ou não há um
foco direto na performance. Ela pode se aproximar do tipo de performance referido no parágrafo
anterior, a respeito de Don’t look back e Lonely boy, por não ter uma mise-en-scène típica de
apresentação em palco, podendo se estabelecer em espaços/tempos quaisquer, estando passível de
grande carga de interpretação. Mas, enfim, são as situações em que a tomada sonoro-visual se
estabelece, por exemplo, em festas, rituais, rodas de amigos, viagens de carro etc. cujo foco está –
para além da música e de sua execução – nas relações, nos elementos e no transcorrer que se
estabelece nesse espaço-tempo; nas situações em que a música “invade” o (ou surge do) espaço-
tempo da tomada sonoro-visual a partir, por exemplo, de rádio, televisão ou quaisquer outros
elementos que emitam música; ou ainda a partir de uma música cuja fonte não sabemos qual é,
embora, de alguma forma, se saiba que se faz presente em homogeneidade com a tomada visual e
com a circunstância de mundo fílmico.
Ao descrever os três tipos de tomadas gerais da música (heterogênea à tomada visual e
ao mundo fílmico; heterogênea à tomada visual e homogênea ao mundo fílmico; homogênea à
tomada visual e ao mundo fílmico) e algumas de suas principais variações notadas em nossa
análise, estabelecemos, de certa forma, dominâncias em relação ao documentário clássico e ao
126
documentário moderno. Contudo, é importante ressaltar que os três tipos de tomada ocorrem em
todo período aqui abarcado.
A música de tomada espacial e/ou temporal heterogênea à tomada visual e ao mundo
fílmico, por exemplo, é mais recorrente do que se parece no documentário moderno e “pré-
moderno”. Alguns dos filmes em que encontraremos trechos com algum tipo de variação dessa
tomada são, por exemplo, Dreamland, We are the Lambeth boys, The Back-breaking Leaf, Crises,
Eu, um negro, A pirâmide humana, Pour la suite du monde.
Em contrapartida, a tomada homogênea da música em relação à tomada visual e ao
mundo fílmico é também notada no documentário clássico. Alguns exemplos em que podemos
encontrar algumas das variações desse tipo de tomada são: The voice of Britain, Children at school,
Listen to Britain, A diary for Timothy, Mining review 2nd year nº 11.
A tomada da música que é heterogênea à tomada visual e homogênea à circunstância
de mundo fílmico é, de certa medida, comum no documentário clássico e no documentário
moderno, embora haja uma variação mais recorrente em cada um, como exemplificado
anteriormente.
127
128
5 Os outros elementos sonoros do documentário
5.1 A indiscernibilidade entre as pistas de música, voz e ruídos no documentário do período

clássico
O campo do documentário encontrou no General Post Office (GPO) Film Unit (1933-
1940), na Grã-Bretanha, um espaço privilegiado para experimentação, especialmente naquilo que
concerne ao som fílmico. As intenções e o clima da preocupação e do interesse com o som ecoaram
entre os realizadores e podemos notá-los, para além dos próprios filmes, nos volumes dos anos
1930 dos periódicos Cinema Quarterly, Sight and Sound e World Film News and Television
Progress e nos relatos posteriores dos envolvidos na produção de documentários desse período.
As experimentações começaram efetivamente a partir da compra de aparatos de
gravação (sistema Visatone-marconi em substituição ao British acoustic film) e da aquisição de um
pequeno estúdio próprio em janeiro de 1934 (REED, 1987, p. 35). Antes disso, a parte sonora dos
filmes era reduzida à prestação de serviços de uma orquestra e um narrador e, nessas condições,
como relata John Grierson (1934a, p. 215), líder da produção da GPO entre 1933 e 1937, o controle
final da trilha sonora fugia das mãos dos realizadores e experimentos eram plenamente impossíveis.
Três filmes sonorizados antes de 1934, no antigo sistema de produção e sob o nome da Empire
Marketing Board Film Unit, precursora da GPO Film Unit, evidenciam os limites da produção:
Industrial Britain, O’er Hill and Dale (1932) de Basil Wright e Upstream (1932) de Arthur Elton.
A respeito desses filmes, Grierson (1934a, p. 215) afirma que sob nenhum ponto de vista eles
representaram algo em relação à arte e à prática sonora.
Peça central nos avanços e experimentos em relação ao som na GPO foi Alberto
Cavalcanti, que relatou: “estava obcecado pela banda sonora e comecei, então, uma série de
experiências neste sentido” (CAVALCANTI, 1957, p. 66). Grierson, ainda em 1933, disse-lhe:
“Fique conosco, divirta-se explicando aos rapazes as suas ideias sobre som. Ainda não fizemos
nada a esse respeito” (CAVALCANTI, 1957, p. 73). Edgar Anstey (1966, p. 7), realizador do
primeiro marco de experimentação sonora da GPO – 6.30 Collection (1934) –, ressalta a validade
da presença de Cavalcanti: “Nós tínhamos no meio dos anos 1930 o conselho e, de fato, a inspiração
de Alberto Cavalcanti, o qual Grierson trouxe especialmente para exercitar nossas imaginações no
uso criativo do som”.
129
Walter Leigh, músico da GPO, que fez parte do grupo realizador do 6.30 Collection,
foi também peça-chave na experimentação sonora nesses primeiros anos e junto com Cavalcanti
lançou outro importante marco de experimentação sonora, Pett and Pott, e, em seguida, com Basil
Wright, lançou Song of Ceylon. Esses três filmes formam com outras duas produções seguintes, os
filmes Coal face e Night Mail, que contaram com a participação do músico Benjamin Britten e do
poeta W. H. Auden, um conjunto relevante de filmes no que diz respeito à experimentação sonora
no documentarismo clássico britânico.
O ponto que quero ressaltar desses experimentos encontra-se, sobretudo, no tocante a
momentos de indiscernibilidade, tanto do ponto de vista do esquema de realização quanto do
espectatorial, entre as pistas de música, voz e ruído – a clássica divisão tripartite da trilha sonora
consolidada no cinema nos anos 1930, tanto na perspectiva da organização produtiva quanto na
perspectiva teórica, especialmente no domínio ficcional. Essa discussão apresenta-se como uma
espécie de “os primórdios” daquilo que vemos se consolidar no cinema na década de 1970.
O que podemos notar a partir dos anos 1970 é a consolidação do “artista do som” no
mercado cinematográfico, o sound designer – termo usualmente creditado a Walter Murch e Ben
Burtt –, que acaba por contribuir com o esgotamento teórico da noção tripartite da trilha sonora
como caminho explicativo para o som de muitas das produções cinematográficas. De certa forma,
o que se percebe é a invasão, transposição e interpolação da música, voz e ruído nos arcabouços
fronteiriços que dividiam as típicas funções de cada uma destas três pistas no cinema clássico. Em
outras palavras, torna-se mais complicado explicar e reconhecer separadamente, com clareza, na
totalidade do filme, a música como música, a voz como voz e o ruído como ruído em suas funções
clássicas72.
Eduardo Mendes (2006, p. 91-92) sintetiza bem essa ideia:
Mesmo depois da evolução tecnológica do som, o preconceito cultural contra o
ruído continuava. Os elementos formadores da trilha sonora cinematográfica
tradicionalmente seguiam funções específicas e obedeciam a uma ordem
hierárquica. A voz tinha a função maior de informar o tema, o desenvolvimento
da história e a caracterização dos personagens. A música refletia situações de
caráter emocional dos personagens ou da história. Já os ruídos de sala e efeito
eram responsáveis pela manutenção do caráter verossimilhante da imagem
72
Esse assunto é central na atual pesquisa de Claudiney Carrasco “Música experimental e sound design no cinema: a
emergência de um novo conceito de trilha sonora” e também nas discussões do “Grupo de Pesquisa em Música
Aplicada à Dramaturgia e ao Audiovisual” liderado, também, por Claudiney Carrasco.
130
enquanto os sons ambientes serviam para indicar quando e onde os fatos ocorriam
(Zettl, 1973)73.
Quanto à audibilidade, continuava a hierarquia onde a trilha de vozes era a mais
intensa e a trilha de música, a segunda mais audível. Nos trechos sem falas, a trilha
de música crescia para o mesmo nível de intensidade usado na pista de vozes. Em
seguida, eram ouvidas as trilhas de ruídos onde internamente também havia uma
hierarquia de intensidade: os ruídos de efeitos, ruídos de sala e ruídos ambientais,
do mais ao menos intenso.
Walter Murch rompeu, em seus trabalhos dos anos 70, com essa tradição, fazendo
com que qualquer estímulo sonoro pudesse servir para acentuar tanto o caráter
verossimilhante como o caráter emocional da obra, seja ele música, ruído ou voz.
Enfim, algumas dessas características podem ser encontradas nos filmes mais
experimentais da GPO e em outros produzidos pela Crown Film Unit (CFU), a sucessora da GPO.
É interessante notar que Ken Cameron, que assumiu o departamento de som em 1938
na GPO e depois na CFU, em seu livro Sound and the documentary film, usa a palavra “design” ao
se referenciar ao trabalho do sound-engineer e do técnico de som na trilha sonora, décadas antes
de Murch e Burtt: “[...] o espectador que paga para ser entretido não tem, na maioria dos casos,
noção da quantidade de processos que estão envolvidos no design e execução da trilha sonora”
(CAMERON, 1947, p. 1). E talvez ainda mais interessante é o uso do termo sound-composer por
Walter Leigh e sua explicação e prognóstico a respeito do uso dos sound effects, ainda em 1935:
O uso de sound effects, não alusivamente, mas, por assim dizer, musicalmente,
para propósitos diretamente emocionais, é o próximo passo após o uso do som
natural em contraponto com a imagem. As possibilidades neste campo foram
ainda pouco exploradas, mas é claro que desde que o vocabulário do sound-
composer compreenda todos os sons conhecidos que são possíveis de gravar, não
há nada que o impeça de orquestrar sons que não são puramente musicais para
produzir certos efeitos. Desde que [Erik] Satie [compositor e pianista francês]
empregou uma máquina de escrever na música do Parede [balé composto e
executado na segunda década do século XX], houve vários casos de ruídos não
musicais combinados ritmicamente com a música, e, em filmes, o barulho do trem
como uma base de percussão, e o método de Hans Sachs de martelar74, como em
Man of Aran, são bastante familiares. Mas o uso mais delicado e tênue dos ruídos,
ou seja, criar certas atmosferas [e ambientes] da mesma forma como a música faz,
tem ainda que ser desenvolvido, e é, sem dúvida, neste sentido que os avanços
mais criativos e as descobertas mais ricas serão feitas (LEIGH, 1935, p. 73-74).
73
ZETTL, H. Sight, Sound, Motion: Applied Media Aesthetics. Belmont: Wandswirth, 1973.
74
A referência aqui é provavelmente ao segundo ato da ópera Die Meistersinger von Nürnberg de Richard Wagner, de
1868, no qual há um personagem baseado na figura histórica de Hans Sachs (1494-1576). Nessa ópera, a orquestra,
com seus instrumentos e arranjo, faz alusões aos sons de marteladas.
131
Grierson (1933, p. 8), que escreveu que o “documentário, ou tratamento criativo da
realidade, é a nova arte [...]”, compreendia que o som, assim como a imagem, deveria ser tratado
criativamente:
No início, escutar nossas sombras falarem e cantarem e escutar o chiado do
presunto e dos ovos fritando na panela foi uma novidade suficiente, mas se você
reparar no tema, você verá que o microfone, assim como a câmera, pode fazer
coisas melhores que simplesmente reproduzir [...]. O microfone também pode
captar o mundo. Assim sendo, ele tem o mesmo poder sobre a realidade, tal como
a câmera o teve antes do microfone. Ele tem o poder de trazer às mãos do artista
criativo mil e um elementos vernaculares, mil e um sons que cotidianamente
compõe o andar do mundo. Considerado simplesmente como um coletor de
matéria-prima, o microfone, tal como a câmera era antes, ainda tem que se libertar
das amarras do estúdio. A matéria-prima, é claro, não significa nada em si. É
somente conforme ela é usada que ela se torna matéria da arte. A questão final é
como nós usamos o som criativamente em vez de reprodutivamente (GRIERSON,
1934b, p. 101).
E um importante aspecto das ideias de Grierson era sua abertura, como líder de uma
produção, para as possibilidades e para as potencialidades do som ainda não exploradas, sem,
necessariamente, propor regras para o uso do som. Ou seja, uma abertura imprescindível para a
experimentação:
Você pode, com uma tesoura e um pote de cola, juntar qualquer som com qualquer
outro. Você pode orquestrar pedaços de som como você desejar. Chame isso de
orquestração horizontal. Você pode também, com a junção de trilhas, colocar
qualquer som em cima de outro som [...]. Você pode obviamente colocar qualquer
som ou sons que você seleciona ao longo de qualquer imagem. Aí você tem o
segredo de todo o negócio. [...] Nós temos o poder da fala, o poder da música, o
poder do som natural, poder do comentário, poder do coro, e mesmo o poder de
fabricar sons que nunca foram escutados antes. E esses diferentes elementos
podem todos ser usados para gerar atmosfera, drama e referência poética ao
assunto em mãos. E quando você lembrar que você pode cortar sons tal como você
pode cortar imagens e que você pode orquestrar qualquer desses elementos, ou
todos juntos, no tempo exato com o mudo [silêncio], as possibilidades tornam-se
enormes (GRIERSON, 1934b, p. 101-102).
Essas ideias ressoaram entre os realizadores da GPO, e a proposta de fazer algo não
convencional era uma constante, tal como podemos notar nos relatos de Alberto Cavalcanti (1957,
p. 177) ao longo do livro Filme e realidade, como em sua perspectiva de que os ruídos deveriam
ser usados dramaticamente; nos escritos de Edgar Anstey (1966, p. 7), quando, por exemplo, afirma
que estavam mais interessados nos sons do que na fala e que miravam seus ouvidos para todas as
máquinas, todos os processos auditivos, na esperança de isolar sons que pudessem comunicar a
essência dos temas tratados nos filmes; na teorização de Walter Leigh (1935, p. 71-74), quando
afirma que o músico, que deve ser um especialista em som e em seus efeitos emocionais, deve
132
organizar os sons numa partitura – o que ele, assim como Basil Wright (1935, p. 178), chama de
sound-score –, na qual cada som é calculado em relação às imagens e aos outros sons, e que o
músico faria bem em abandonar muitas convenções musicais em favor de experimentar e
desenvolver convenções próprias da nova arte, que é o filme sonoro, composto pelo som fílmico.
Todo esse clima e vontade de fazer o som de maneira diferente se potencializa na forma
que os filmes começavam a ser produzidos na GPO. Grierson (1934a, p. 215-216) fala da
importância do trabalho e da criação coletiva entre os realizadores para todos os aspectos do filme,
da quebra da barreira entre o produtor e o resultado que ele quer. O produtor do filme deveria
trabalhar na concepção do som, assim como o músico e o engenheiro do som deveriam trabalhar
na construção das falas e vice-versa.
Na prática fílmica, começamos a notar essas pretensões se concretizarem no filme 6.30
Collection. Logo no ínicio do filme, encontramos uma composição sonora, arranjada por Walter
Leigh, que foi escrita para um rebobinador de filme, um trompete, duas máquinas de escrever, uma
garrafa vazia, um projetor, algumas conversas gravadas, uma lixa, um sino, chimbais e triângulo,
todos tocados por membros da GPO (GRIERSON, 1934a, p. 217). Grierson (1934a, p. 217) diz
que 6.30 Collection é um relato altamente sinfônico da Western District Sorting Office (parte da
organização dos serviços postais em Londres), que teve grande parte dos sons do escritório como
tema do filme orquestrado, com controle de dinâmica, escolha de material sonoro, cortes sonoros,
junções de timbres de corpos diferentes, todos pensados ante as imagens e as intenções e climas da
narrativa. É interessante notar que mesmo o trompete, os chimbais e o triângulo sendo os únicos
instrumentos tipicamente musicais presentes no filme, Grierson adjetiva a trilha sonora de
“altamente sinfônica”. Nesse exemplo, já podemos notar que a separação das pistas de música e
ruído da trilha sonora, tanto do ponto de vista teórico quanto do espectatorial, perdem sentido. A
confusão com a pista de voz ocorre também, por mais que modestamente, quando temos vozes (e
assobios) sendo arranjadas e pensadas com os outros elementos sonoros.
Caso que nos lembra a dedicação dada ao tratamento sonoro em 6.30 Collection é o do
documentário Song of heroes, no qual muitos dos sons não musicais foram postos em filme segundo
noções musicais de acento, ritmo, pausa, timbre e dinâmica (forte, pianíssimo, crescendo,
decrescendo) e são frutos do trabalho do compositor Hanns Eisler, como bem nota Claude Brunel
(1999, p. 202) em seu estudo sobre trilha sonora nos filmes de Joris Ivens.
133
Filmes que também nos fazem lembrar de Shipyard de Paul Rotha, que contou com
uma construção sonora detalhada, timbricamente e ritmicamente “orquestrada”. Vale a pena
conferir o entusiasmo com o qual John Grierson (1935) fala sobre o filme no artigo “Two paths to
poetry”. Segue um curto trecho a respeito de Rotha e seu filme:
Paul Rotha é com certeza criativo. Ele vem equipado com um grande esplendor
de trabalho de câmera. Ele tem a força e o fervor da descrição ritmada75 melhor
que qualquer um antes dele, ele soube como usar o som para intensificar suas
impressões (GRIERSON, 1935, p. 196).
Considerações que também podem ser extendidas às construções de ambientes sonoros
em Face of Britain de Rotha, especialmente na segunda parte, “The smoke age”, na sequência em
que se vê homens trabalhando na indústria, na qual é evidente a construção melódica e rítmica dos
sons (tradicionalmente não musicais) numa estrutura musical quaternária.
Nessa linha, um dos trabalhos mais notáveis talvez seja o de Helen van Dongen em
Lousiana Story. Virgil Thomson (apud HOWE, 2012, p. 2) diz que o filme possui três tipos de
música, e um deles é a noise-music, composta e modelada por Helen van Dongen, editora do filme.
Há em especial uma sequência do filme que chama atenção, a “oil derrick sequence” (sequência da
torre de petróleo). Nas notas de trabalho do filme, Dongen (apud HOWE, 2012, p. 4) a chama de
“Ballet of the roughnecks”. O pensamento musical de Dongen transparece, para além do próprio
material que escutamos no filme, em suas notas para o filme, seja por se referenciar à sequência
como “balé”, por chamar os ruídos de “instrumentos”, a edição de “orquestração” ou por falar de
“pitch” (frequência) dos ruídos e que eles devem estar “in tune” (afinados) entre si.
Voltando à produção britânica, temos Pett and Pott, dirigido por Alberto Cavalcanti,
que contou, tal como 6.30 Collection, com a presença de Walter Leigh e que foi deliberadamente
realizado como uma experiência com a finalidade do grupo da GPO adquirir experiência no uso do
som (REED, 1987, p. 40). Um dado relevante ao se falar deste filme é que a trilha sonora foi
gravada antes das tomadas visuais serem iniciadas, técnica geralmente reservada aos desenhos
animados (REED, 1987, p. 40) – algo análogo ao caso de Entusiasmo, que teve o script sonoro
feito antes do visual. Hebert Read (1934, p. 18-21), escritor e crítico de arte, ainda em 1934 na
Cinema Quarterly, classifica Pett and Pott como um dos experimentos mais interessantes de
75
Traduzi “tempo”, uma expressão italiana que se refere ao andamento musical de uma obra, como “ritmada”.
134
“contraponto” entre som e imagem do cinema. Ele descreve, de forma sucinta, momentos
relevantes da construção sonoro-visual do filme:
Para além do que pode ser considerado como dispositivo normal – um
acompanhamento musical que induz um estado de espírito – há sugestões de uma
construção sinfônica mais complicada; o entrelaçamento de sons naturalistas
diretos com o ritmo musical formal: em um ponto, por exemplo, o ruído sem
sentido de um quebra-quebra de uma luta se encaminha para o ritmo musical. Mais
original é o coro utilizado, por exemplo, em uma cena que retrata um trem
suburbano, cheio de suburbanos lendo o mesmo jornal da noite. Eles começam a
ler os cabeçalhos das últimas notícias suburbanas, um roubo com violência. Suas
vozes começam a subir gradualmente em coro e o coro encaixa um ritmo, que
pode ser associado ao ritmo do trem. A cena é cortada suavemente para uma cena
real de violência, com a aparição de uma mulher, o apito do trem se encaixa com
o o grito dela [frente ao susto que toma com o ladrão, a cena é, então, cortada para
dentro do trem novamente, e o apito que continua serve aí como despertador para
os passageiros, a estação chegou]. Pett and Pott é um excelente exemplo de
comédia popular, intensificada por uma utilização inteligente das potencialidades
da técnica de cinema (READ, 1934, p. 18-21).
Há outra sequência relevante na qual o ambiente sonoro é composto por sons de
pássaros. Porém, a melodia do canto dos pássaros se encaixa como melodia de uma base musical
que soa concomitantemente. Há também em dois momentos o uso de uma voz sombria (grave e
lenta) sem referente visual, que funciona como um breve comentário dramático sobre os planos
próximos, mas que não se caracteriza como narração. Enfim, em Pett and Pott podemos notar que
as três pistas se diluem ou se misturam em certos pontos: as vozes, no momento do coro dos
“suburbanos”, além de não perderem suas características linguísticas e semânticas, funcionam
como construção do ruído do trem, que, por sua vez, não é mero ruído, é também uma construção
bastante musical dos sons do trem; o grito da mulher é também o apito do trem; o som dos pássaros,
que na tradição cinematográfica é muito utilizado, segundo Michel Chion (1994, p. 75), como
territory-sound, ou seja, como um som ambiente que ajuda a identificar um local por sua contínua
presença, é usado no filme tanto para compor o espaço fílmico como elemento musical; as vozes
invisíveis, sem referentes visuais, que geralmente coincidem com aquilo que chamamos de voz
over ou narração, são aí utilizadas de forma semântica, mas também como inflexão dramática
devido a suas características tímbrica e misteriosa76.
76
Podemos dizer que esse mistério se aproxima um pouco do “poder mágico” da voz acousmêtre de Chion (1999),
não vemos o corpo de quem fala, e as incertezas que cercam a voz exercem um mistério sobre a figura de quem que a
emite, seu lugar no plano dramático.
135
O trabalho com as vozes no referido trecho de Pett and Pott nos faz lembrar de uma
sequência do documentário norte-americano The city, de 1939. Na terceira parte, quando o filme
começa a tratar da cidade, dos aspectos urbanos propriamente ditos (depois de tratar da indústria),
há uma construção “orquestrada” das vozes, semelhante, por analogia à polifonia melódica, a um
contraponto. A respeito dessa sequência, em notas não publicadas para a construção sonora do
filme, Henwar Rodakiewicz (1973, p. 282), roteirista e produtor associado do filme, diz:
A música forma a base do som nessa sequência. Efeitos naturais, como sirenes,
apitos, sinos, trens, também aparecem. Mas, além da música e dos sons naturais,
vozes são ouvidas. Entretanto, as vozes e as distintas palavras faladas não são, em
nenhum sentido, narração, como nós geralmente entendemos o termo. De fato, as
vozes – talvez uma boa meia dúzia facilmente distinguível – são tratadas como se
elas fossem parte de uma partitura musical. Isso é, nós pensamos nelas como
instrumentos adicionados à orquestra. Elas emergem do fundo, sobrepõem seus
temas e voltam ao fundo novamente, da mesma forma que os oboés, os
violoncelos ou as trompas fazem na partitura. Eles não são, em nenhum sentido,
word effects sobrepostos, mas uma parte genuína e integral da orquestra. Nós
devemos sentir que as pessoas que falam estão sentadas entre os instrumentistas e
que as palavras são escritas para a música e entrelaçadas com a música.
Após essas produções britânicas, é lançado Song of Ceylon, filme no qual Walter Leigh,
além de se responsabilizar pela parte sonora, codirige com Basil Wright. Nesse filme, a
experimentação não ocorre apenas em alguns pontos da trilha sonora, como nos filmes
supracitados. Podemos afirmar que é um projeto sonoro mais ousado, e a concepção inteira da trilha
é experimental. Nas palavras de Walter Leigh (1935, p. 74),
no filme Song of Ceylon, foi feita uma tentativa [...] de construir uma sound-score,
que tivesse uma forma definida, e que não fosse só um acompanhamento para os
eventos visuais, mas que acrescentasse elementos que não estivessem contidos
nas imagens. O filme, de fato, foi todo cortado com olhos para a sound-score. Sua
forma é musicalmente concebida; uma análise de seus quatro movimentos poderia
ser lida como uma sinfonia. Cada som foi selecionado para a sua aparente
inevitabilidade, como harmonias são na música. Mesmo o comentário é calculado
como um efeito e não como um incômodo necessário.
Poucos parágrafos não cabem para citar todos momentos relevantes. Nesse sentido,
vale a pena conferir o ensaio “The Audio-visual rhythms of modernity: Song Of Ceylon, sound and
documentary filmmaking”, de Jamie Sexton (2004), que se dedica à análise dos elementos sonoros
de Song of Ceylon, e, também, a última página do artigo “The musician and the film”, de Walter
Leigh (1935), no qual o compositor faz comentários sobre o próprio filme.
De qualquer forma, alguns pontos gerais importantes e que valem a pena ser citados
concernem ao uso não semântico das vozes (a língua cingalesa explorada em sua sonoridade e
136
prosódia), ao uso de canções como ambientação sonora e índice cultural, do uso de materiais a
priori não musicais para compor padrões rítmicos e musicais, uso simbólico da orquestração
musical (associada à cultura europeia) e da percussão e canto (associado à cultura cingalesa),
manipulação de sons de código Morse (sonoridade muito próxima às obtidas pelos sintetizadores
nos filmes de ficção dos anos 1950 norte-americanos, como em Planeta proibido, de 1955) e outros
sons em estúdio, captação sonora experimental (captação do som de gongo usando o microfone em
movimento, por exemplo) (LEIGH, 1935, p. 74), combinação não hierárquica dos diversos
elementos sonoros na construção das atmosferas sonoro-visuais, que, como afirmado por Jamie
Sexton (2004, p. 6), rompe com a típica divisão entre música e outros sons da trilha sonora, além
do uso do som de maneira informativa (som sincronizado) e expressiva (som em contraponto com
as imagens) (SEXTON, 2004, p. 5; LEIGH, 1935, p. 71-74).
Em 1935, outro filme experimental foi lançado, Coal face. E, como ressalta Philip Reed
(1987, p. 70), houve um evento significante no que diz respeito a Benjamin Britten – músico
contratado pela GPO em 1935 e que trabalhou no Coal face – e aos filmes comentados nos
parágrafos anteriores, especialmente Pett and Pott e Song of Ceylon. No diário de Britten (apud
REED, 1987, p. 70), em relação ao dia 24 de maio de 1935, lia-se:
Fui a Soho Square GPO Film offices às 10h30 para ver alguns filmes da GPO com
Cavalcanti. Um muito apaixonante sobre “Ceylon” com bons efeitos musicais –
embora não seja perfeito – uma parte da música não era particularmente
interessante. Uma pequena comédia apaixonante de Cavalcanti. “Mr Pett & Mr
Pott” é um trabalho de gênio – o qual os charmosos distribuidores ingleses não
quiseram comprar! Por ser muito bobo! Também o famoso “Weather Forecast”.
Reed (1987, p. 71) aponta que era claro que Alberto Cavalcanti estava mostrando as
possibilidades da música fílmica para Benjamin Britten, que seria convidado por Cavalcanti para
participar de seu projeto experimental, Coal face. Reed continua e afirma que “os valores
experimentais [então] em circulação na GPO Film Unit são cruciais para formar nosso completo
entendimento do empreendimento de Coal face”. Essas informações nos dão indícios de que a
intenção experimental, passado um ano de euforia desde a compra dos novos aparatos de gravação
e do pequeno estúdio, continuava viva.
Coal face marca ainda o início de uma parceria profícua entre Britten e W. H. Auden,
escritor e poeta, que incluiria entre diversos filmes e músicas o trabalho em Night mail. O trabalho
deles em conjunto na totalidade dos elementos em Coal face com Cavalcanti foi decisivo para os
resultados alcançados. O script, a música e a montagem foram orquestrados conjuntamente pelos
137
envolvidos no filme, além da participação de outros membros da GPO, como Stuart Legg,
Humphrey Jennings, Basil Wright e William Coldstream num trabalho em que a decupagem das
imagens, o script e o som emergiam concomitantemente (REED, 1987, p. 70-101).
Uma das análises do som mais completas do filme pode ser encontrada na tese de
doutorado de Philip Reed (1987), no item 2 do capítulo 2, que foi revisado e resumido no livro The
Cambridge companion to Benjamin Britten, organizado por Mervyn Cooke (1999).
O aspecto que mais salta aos olhos no que se refere ao assunto aqui tratado é, sem
dúvida, o tratamento das vozes. Elas foram pensadas e escritas musicalmente na partitura de Britten
para o filme e, conforme Reed (1987, p. 89-92), podem ser divididas em quatro tipos: 1)
Comentário: texto falado não metrificado; 2) Comentário: texto falado metrificado; 3) Coro (dos
mineiros): texto falado metrificado; 4) Texto cantado.
O primeiro caso, o texto falado não metrificado, é o mais raro no filme e mesmo quando
usado tem o apoio de um background musical. Na Figura 6, temos um exemplo no qual o texto não
está metrificado, mas aparece com o background de piano e percussão, além do texto receber a
indicação musical ad lib[tum], conferindo-lhe liberdade recitativa.
O segundo e o terceiro caso, o texto falado metrificado e o coro metrificado, são os
mais abundantes no filme e estão envolvidos completamente na composição musical. Na Figura 7,
podemos ver o comentário metrificado, acompanhado de piano e percussão e na Figura 8, o coro
metrificado, divido em tenor 1 e 2 e baixo 1 e 2 e acompanhado de percussão.
O quarto caso, o texto cantado, que se opõe ao texto falado não metrificado, é escrito
com pitch e ritmo. Na Figura 9 o notamos divido em sopranos, altos, tenores e baixos,
acompanhados de percussão e piano.
Vemos diluir-se em Coal face, em grande parte, a divisão das pistas de voz e música,
seja pela maneira que foi produzida, em conjunto, não havendo departamentos ou pessoas
específicas trabalhando separadamente para cada uma delas, seja do ponto de vista espectatorial,
que, apesar de notarmos no comentário não metrificado – que cabe ressaltar, é o mais raro no filme
– o caráter informativo clássico, temos os textos metrificados e musicalizados que se colocam na
fronteira da função semântica, própria das vozes, e das funções da música fílmica clássica, como a
emotiva, a de gerar climas pela dinâmica, conduzindo ao clímax e ao relaxamento na narrativa.
138
Figura 6 – Partitura de Benjamin Britten para Coal face
Fonte: Reed (1987, ex. 26).
139
140
141
Há também o caso específico do coro metrificado, que, mesmo se pensarmos no limite
da pista de voz, confunde-se enquanto comentário e voz dos mineiros, de dentro do campo do
filmado.
Na Figura 8, podemos reparar também a atenção com a dinâmica das vozes: no rodapé
da imagem, vê-se siglas referentes às distâncias da voz em relação ao microfone, que na partitura,
propriamente dita, são utilizadas para dar diferentes intensidades e espacializações às linhas das
vozes.
Há ainda outros pontos interessantes. Cada ruído escutado no filme foi escrito na
partitura e não há, na verdade, como podemos dizer, sons naturais em origem. De maneira
semelhante ao que ocorre em 6.30 Collection, no qual há a orquestração de sons tipicamente não
musicais, parte da partitura de Coal face foi escrita para vinte e dois instrumentos tipicamente não
musicais, como chapa de metal, marreta de madeira, carrinho sobre amianto arenoso e copo em
balde d’água (REED, 1987, p. 440). Há também o caso de um longo trecho de assobio escrito na
partitura, elemento sonoro este que na tradição cinematográfica não ocupa comumente a pista de
música. Do ponto de vista mais macroestrutural da trilha sonora, há ainda que pontuar a associação
que ocorre entre “mineiro como máquina” e “mineiro como ser humano” – dois aspectos centrais
do filme – e comentário não metrificado e texto cantado, respectivamente. Esse tipo de associação
é costumeiramente feito pela música, quando, por exemplo, existe no filme um núcleo do bem e
outro do mal e para cada um deles se associa uma música diferente – uma música alegre para o
primeiro e uma música triste para o segundo, por exemplo. Em Coal face essa função é delegada à
voz, mas uma voz que já não se define unicamente pelas típicas funções da pista de voz e sim uma
voz imiscuída de elementos musicais.
Com uma equipe de trabalho semelhante a Coal face, foi lançado no ano seguinte Night
mail. Notadamente a experiência adquirida em Coal face foi determinante para o aspecto mais
experimental da trilha de Night mail (a famosa sequência no final do filme em que temos o
comentário/poema musicado, com instrumentos musicais e instrumentos tipicamente não musicais,
compondo o ambiente sonoro e os sons que aludem aos ruídos do trem). A exploração desses
elementos – voz, música e ruído – em Night mail caminhou, definitivamente, por vias semelhantes
à de Coal face.
142
Figura 10 – Partitura de Benjamin Britten para Night mail
Fonte: The British Library (<http://www.bl.uk>).
143
144
145
Nas Figuras 10, 11 e 12 (um trecho desta sequência), vemos a voz com suas definições
de altura e ritmo orquestrada com instrumentos musicais e com instrumentos tipicamente não
musicais, sand-paper (lixa) e wind-machine (máquina de vento). O diferencial de Night mail é que
a voz, além de cumprir seu papel informativo e musical, coaduna-se aos outros elementos sonoros
para compor, sobretudo ritmicamente, a sonoridade que se associa aos sons do trem, configurando-
se como um elemento que, se mantida a perspectiva tripartite da trilha sonora, transitaria pelas três
pistas.
Outros dois casos de experimentação sonora no documentarismo britânico ocorrem nos
filmes London can take it e Listen to Britain já na década de 1940 e um pouco distante do clima
experimental de meados dos anos 1930. Esses exemplos são interessantes porque remontam a
algumas experimentações relativas às sinfonias metropolitanas, mais diretamente a Entusiasmo e
Weekend. Em London can take it, temos quase dois minutos de uma construção sonora, sem
instrumentos musicais, que extrapola os limites da construção de ambiente sonoro ou de
sincronização de ruídos, e que é precedida do seguinte comentário do narrador do filme: “Isso não
são efeitos sonoros hollywoodianos, isso é a música que toca toda noite em Londres: a Sinfonia da
Guerra”. Em Listen to Britain, construções semelhantes ocorrem, mas os momentos estão mais
diluídos ao longo da trilha sonora. Contudo, da mesma forma, o narrador faz menção à “sinfonia
da guerra”:
Eu sou um canadense. Eu tenho ouvido a Grã-Bretanha. Eu ouvi o som de sua
vida, de dia e de noite. Muitos anos atrás, um grande americano, falando da Grã-
Bretanha, disse que na tempestade da batalha e do conflito havia um rigoroso
segredo e um pulso como o de um canhão. No excelente filme sonoro que é
apresentado aqui, você também vai ouvir o pulso do coração. Misturados em uma
grande sinfonia, está a música da Grã-Bretanha em guerra. O hino da noite do
[pássaro] cotovia, o rugido do [avião] Spitfires, os bailarinos no grande salão de
baile em Blackpool, o barulho de máquinas e trens de manobra [...]. O trompete
chama por liberdade, a canção de guerra de um grande povo. As primeiras notas,
sem dúvida, da marcha da vitória, como você e eu, escutamos a Grã-Bretanha.
A semelhança desses casos com o de algumas sinfonias metropolitanas reside na ideia
de compor com os ruídos cotidianos uma sonoridade representativa de um local, de um momento
ou de uma ideia, desprendida da ideia rígida de ambientação sonora ou de amarras com a
sincronização de ruídos com as imagens, aproximando-se de conceitos musicais de construção e
diluindo as fronteiras entre as pistas de ruído e música.
146
Em Entusiasmo, um experimento sonoro mais sofisticado, os ruídos, de forma geral,
não se associam necessariamente a fontes visíveis e nem a um imaginário fora de campo óbvio
(embora se note em diversos trechos essas intenções). Antes disso, os sons, na maneira que se
organizam verticalmente e se sobrepõem horizontalmente, ganham força metafórica, e não apenas
geram atmosferas sonoras representativas. A grande chave da triha sonora de Entusiasmo é
entender que nele o som é fruto de um processo de montagem, de uma organização do material
sonoro do mundo, colhido em locação, trabalhado como planos sonoros, num desvendamento do
mundo através da articulação fílmica. E podemos dizer “planos sonoros” porque a noção de uma
unidade sonora, que é passível de corte, de edição e de colagem se evidencia nas mudanças
abruptas, nos contrastes tímbricos e tonais e na manipulação dos sons da trilha sonora.
Para além disso, o pensamento musical insere-se profundamente na concepção dos
outros sons do filme, e podemos notar a aproximação conceitual de sons “musicais” e “não
musicais” na partitura escrita por Timofeev e Vertov em 1929.
Na Figura 13, como nota John MacKay (2015, p. 8), na última linha da partitura, ainda
na seção “J”, antes da “K”, temos o tique-taque de um relógio (de grande importância ao longo de
toda narrativa) em métrica indeterminada, embora indicado por repetições intervalares iguais
(semínimas se repetindo), que, nesse final de seção “J”, ganha o acompanhamento abrupto de um
som de motor, indicado pelas ondas acima das semínimas.
Na figura 14, em outro exemplo, na seção final da partitura de Entusiasmo, a notação
musical, em sua construção rítmica, está “no ritmo de um rádio-telégrafo” (como se lê em russo no
topo da partitura).
Vertov e Timofeev não eram os únicos realizadores de documentário na União
Soviética que lidavam com a aproximação ruído-música. Arseny Avraamov, citado no capítulo 2
a respeito do “som animado”, responsável pela parte sonora de The plan of the great Works, deixa
explícito que para ele não havia contradição entre música e ruído (SMIRNOV, 2013, p. 159). Sobre
a realização desse filme, Avraamov (apud SMIRNOV, 2013, p.159) escreve que
a maioria dos chamados ruídos que foram usados no filme não foram reproduzidos
por meio de instrumentos ruidosos, mas em vez disso foram produzidos por meios
musicais por instrumentos musicais reais.
147
Figura 13 – Partitura de Entusiasmo
Fonte: MacKay (2015, p. 8).
Figura 14 – Partitura de Entusiasmo
Fonte: MacKay (2015, p. 8).
148
A imbricação dos ruídos e da música é de notória importância nas obras de Vertov, tal
como foi para a carreira musical de Avraamov.
Da-Rin (2006, p. 109) localiza a importância do sonoro em Vertov:
Toda obra de Vertov começou pelo som. Eis como ele rememora seu interesse
particular pela possibilidade de gravar sons documentais, ao ouvir suspiros, sinos,
risos, motores e chiados, caminhando em 1918 pelas ruas de Moscou:
“caminhando eu penso: é preciso conceber um aparelho não que escreva, mas que
inscreva, fotografe, estes sons. De outro modo, seria impossível organizá-los,
montá-los. Eles fogem, como o tempo. Uma câmera talvez? Inscrever aquilo que
se vê... Organizar um universo não propriamente audível, mas visível. Seria a
solução?... Neste momento, eu encontro Mikhail Kolstov que me propõe fazer
cinema” (“Naissance Du Ciné-Oeil”. Em Vertov, 1972: 60)77.
Foi a partir daí que Vertov começou a trabalhar com cinema, “com os ouvidos atentos,
imaginando o equipamento cinematográfico como um dispositivo apto a registrar e editar imagens”
(DA-RIN, 2006, p. 110). Quando, portanto, Vertov fala de um cinema livre da música (da literatura
e do teatro) – no manifesto “Nós”, publicado originalmente na revista Kinophot, n. 1 de 1922, e na
Resolução do grupo Kinoks, de 1923, por exemplo – não se pode entender que ele era contra o uso
dela, e sim que ele era a favor do tratamento dos sons pela montagem – a música como documento
sonoro. “O rádio-orelha é a montagem do ‘eu escuto’! O Cine-olho é a montagem do ‘eu vejo’!
Cidadãos, eis o que lhes ofereço em um primeiro momento, em lugar da música, da pintura, do
teatro, do cinematógrafo e de outros escoamentos estéreis” (VERTOV, 1974, p. 29).
É comum vermos em algumas análises, como na do próprio Da-Rin aqui citada, que
caminha em consonância com a de Sadoul (1973), ou na dissertação de Magalhães (2005), a
associação da experiência sonora de Vertov com ideias futuristas, mais especificamente com o
manifesto “A arte do ruído” de Luigi Russolo (1986), de 1913, que, em linhas gerais, aponta que a
arte de trabalhar com os sons não deve se limitar a uma função imitativa, concordando com a vida
real, e sim combinando e justapondo os ruídos. De maneira geral, percebemos que o pensamento
de montagem sonora de Vertov incorpora essa ideia: os sons do mundo deveriam ser interpretados,
captados e montados de uma maneira significante, que cooperasse com o desvendamento dos
fenômenos sociais.
Todavia, não podemos negligenciar que para Vertov essa prática não pressupunha um
deslocamento via de regra entre o sonoro e o visível, ou melhor, não implicava a negação do uso
77
Tal trecho citado por Da-Rin pertence à tradução para o francês dos escritos de Vertov. No nosso referencial
bibliográfico, que é a tradução dos mesmos escritos para o espanhol, tal citação encontra-se em Vertov (1974, p. 53).
149
sincronizado do som no cinema, tal como temiam Eisenstein, Pudovkin e Alexandrov na
“Declaração sobre o futuro do cinema”.
A concordância ou não do visível com o audível de modo algum é obrigatória,
nem para os documentários nem para os filmes atuados. As imagens sonoras,
assim também como as mudas, se montam com o arranjo de princípios idênticos;
sua montagem pode fazê-las concordar ou não, ou inclusive misturá-las em
distintas associações necessárias (“Respostas a perguntas”, de 1930 – VERTOV,
1974, p. 122-126).
Pudovkin, apesar de ter assinado a declaração com Eisenstein e Alexandrov, mostra
um outro ponto de vista no texto “Asynchronism as a principle of sound in film”, de 1928
(PUDOVKIN, 1985), no qual compartilha ideias parecidas com Vertov: em resumo, a união entre
imagem e som não existe necessariamente por imitação, de maneira naturalista, ela pode ser
resultado de uma construção e de uma interação de ações, que caminham em sentido de uma
significação que pode representar uma realidade que não é necessariamente uma representação
imediata e superficial dela. Em suma: a escolha e o momento do uso sincronizado do som ganha
significado no cinema, ou seja, esse som sincronizado deixa de ser naturalista, apenas se assemelha
a tal.
Enfim, em Entusiasmo, o que notamos na trilha sonora é uma certa indiferença entre o
que é voz, música e ruído, especialmente no sentido de que todos os sons são documentos sonoros
do mundo e de que todos eles devem ser montados e organizados. Inclusive, a única música que
foi composta especialmente para o filme é encarada como documento sonoro, uma vez que a
escutamos e vemos sendo regida no estúdio, num processo reflexivo, que explicita ao espectador
etapas de construção do material sonoro do filme.
Em carta enviada por Charles Chaplin a Vertov em 1931 (Figura 15), ano em que
Entusiasmo estava sendo exibido em Londres, o comentário mais interessante também concerne à
organização dos sons:
Nunca havia imaginado que sons mecânicos poderiam ser arranjados com tanta
beleza. Considero “Entusiasmo” uma das sinfonias mais emocionantes que eu já
escutei. Dziga Vertov é um músico. Os professores deveriam aprender com ele e
não arrumar confusão com ele. Parabéns.
150
Figura 15 – Carta de Charles Chaplin a Dziga Vertov
Fonte: Film Museum (<http://www.filmmuseum.at>).
Essa concepção de som fílmico que podemos notar assistindo ao filme, pode também
ser notada nos escritos em que Vertov articulou uma espécie de script sonoro de Entusiasmo
(VERTOV, 1974, p. 306-309, grifo do autor):
1 - O tique-taque de um relógio. Fraco a princípio. Cada vez mais forte. Mais forte
ainda. Insuportavelmente forte (quase marteladas). Retorna gradualmente a um
nível médio, claramente audível. Como a batida de um coração, mas muito mais
forte. Ressoam passos que sobem uma escada, aproximam-se. Passam ao lado. O
151
ruído se apaga. O tique-taque do relógio. Passos voltam a se aproximar. Chegam
bem próximo. Se detêm. O tique-taque do relógio, como a batida de um coração.
A primeira badalada de sino de uma igreja. O som se apaga, cede seu lugar ao
tique-taque do relógio. Segunda badalada. O som se apaga, cedendo novamente o
lugar ao tique-taque do relógio. Terceira badalada, que se transforma num
carrilhão em festa. Fragmentos do Ofício Divino [espécie de oração realizada em
igrejas, na qual hinos, salmos e trechos da bíblia são recitados/cantados] se
misturam ao som do sino. O som do sino misturado com o Ofício não consegue
se manter por muito tempo no registro solene. Se sente a ironia, que busca um
lugar. O tom solene é incessantemente interrompido. Os ares religiosos parecem
executar uma dança. Durante alguns breves instantes, os sons desaparecem,
cedendo seu lugar ao tique-taque do relógio, logo as ondas dos sons voltam a se
elevar novamente. O tocar de uma sirene de fábrica, potente e prolongado, estoura
enfrentando o tique-taque, interrompendo-o. Depois da primeira sirene, uma
segunda, uma terceira interrompem a música e o som do sino. Como se estivessem
espantados, os sons se detêm em câmera lenta. Interrompem-se. O sino da igreja
emite seus últimos sons. Silêncio.
2 - O tique-taque do relógio como a batida de um coração. O sinal de uma
ofensiva: uma sirene aguda e prolongada. Logo uma segunda sirene, uma terceira.
Ao fundo, eleva-se uma marcha: tambores dos pioneiros, temas da Komsomol [ala
jovem do Partido Comunista da União Soviética], orquestra operária. A sirene
toca, forte, grandiosa, logo o som se reduz progressivamente. Permanece uma nota
que ressoa por um longo tempo como o zumbido de um motor.
3 - Zumbido único. Ao longe, escutam-se os ruídos da fábrica. Os sons de uma
marcha militar alegre (fanfarra) aproxima-se. A orquestra está bem próxima. Por
um momento os sons se interrompem e o trompete lança um sinal agudo (Ao
ataque! Adiante!). A mesma marcha, mais rápida, mas não tão forte, de maneira
que se escute o ruído de fundo da fábrica que se situa nas proximidades. Mais
rápido, animado e fraco, e de repente o ganido cômico da cruz que cai. A orquestra
emite um grito de entusiasmo. A sirene. A cruz cai com ganido cômico. A
orquestra aplaude entusiasmadamente. A sirene. O sino cai com ridículos
melindres sonoros e, ao tocar o chão, emite um gemido fúnebre (mais exatamente,
adota a pose do “gemido fúnebre”, de tal modo que provoca o escárnio e não a
piedade). Neste rápido tratado irônico irrompem gritos de entusiasmo, “hurra”
(expressados pelas orquestras). Este “hurra” vitorioso expressado pela orquestra
se transforma em marcha dos komsomols, em regozijo e em dança juvenil. Em
alguma parte, um relógio faz tique-taque. Um relógio?
4 - O tique-taque como a batida de um coração. O rádio-telégrafo começa a
trabalhar. Começamos a ouvir o coração da fábrica, a central da força motriz. A
pulsação da central é executada por diversos grupos instrumentais. Ouvimos
durante muito tempo esta pulsação elétrica abaixo da terra nas minas, perto dos
fornos e em todas as outras oficinas da fábrica. A batida do pulso elétrico se
intensifica graças ao funcionamento geral de todos os grupos de instrumentos de
percussão e logo a intensidade começa a diminuir; agora se escuta o que acontece
longe. O rádio-telégrafo funciona. O grito agudo da fanfarra irrompe, repetido três
vezes sobre o fundo da confusão sonora crescente. Um instante de silêncio para
permitir ouvir o rádio-telégrafo, a partir do qual começa o repasse geral dos sons
da fábrica divididos em grupos: 1) o grupo das pás mecânicas subterrâneas e das
tupias; 2) o grupo das brocas; 3) o grupo dos pilões; 4) o grupo dos tratores; 5) o
estrépito das laminadoras; 6) o grupo dos ruídos metálicos; 7) o grupo dos
152
assobios e grunhidos; 8) o grupo das explosões; 9) o grupo do fogo embravecido.
Associando-se progressivamente a estes grupos: 1) o grupo dos sinais (sirenes de
fábrica, gritos de “hurra”, golpes sobre bandejas de fundição e de cobre etc.); 2) o
grupo dos instrumentos da fanfarra saludando e chamando; 3) o grupo de um leve
tocar de tambores; 4) o grupo dos atabaques e chimbais agudos; 5) o grupo das
hélices; 6) o grupo dos gritos radiofônicos ensurdecedores; 7) o grupo dos trens
socialistas marchando a toda velocidade no porvir. Nas ondas do entusiasmo
sonoro, o ouvido capta A Internacional, excessivamente acelerado e intensificado.
Montagem sonora sobre o piano que toca claramente A Internacional, montado
com o carrilhão de Kremlin [cidade russa] acompanhado da Internacional,
montado novamente com o pianista. Simultaneamente se escuta o soar da meia-
noite. O pianista se levanta, fechando o piano (estalo), não em um silêncio total,
senão sobre o fundo do rádio-telégrafo que novamente emerge...
Em Weekend (1930), que pode ser considerado uma sinfonia metropolitana sem
imagens, Walther Ruttmann mostra sua vertente mais futurista, ao dedicar-se à arte dos ruídos,
apresentando-nos poeticamente a sonoridade da cidade de Berlim: gravações de palavras e
fragmentos de ruídos e músicas coletadas em Berlim são reconstruídos. Os planos sonoros
aproximam-se aos de Entusiasmo principalmente por ser dada vazão à montagem sonora e a um
tratamento não hierárquico dos diferentes elementos sonoros (vozes, música e ruído), pensados,
sobretudo, como documentos sonoros e coletados em locação. Industrial symphony, apesar de não
contar com uma trilha sonora experimental, lida, sob o trabalho da famosa editora de imagem e
som em documentários Helen van Dongen, com a noção de composição sonora, evidenciada nas
sobreposições de diferentes sons e nos cortes dos planos sonoros.
Enfim, a trilha sonora encontrou no domínio documental, nos anos 1930, um lugar
profícuo de desenvolvimento e experimentação, no âmbito teórico e na prática fílmica. Os termos
sound-composer e sound-score, por exemplo, são valiosos se pensarmos numa certa consonância
e similitude em relação aos termos sound-designer e sound-design, que se difundiu a partir dos
anos 1970 e que hoje se refere a um nicho de trabalho, tanto no domínio documental quanto no
ficcional78. A recorrente falta de precisão ao se definir se os sons de um filme pós-1970 são música,
78
Cabe mencionar que Marian Winter (1941, p. 151), em seu artigo “The function of music in sound film”, ao referir-
se ao trabalho sonoro de Edmund Meisel, usa a expressão effect music: “In his use of percussion instruments Meisel
anticipated many effects of sound film; the use of noise – Geräuschmusik – was his special interest, and after sound
film was an actuality he made a series of six records for Polydor which incorporated various noises into ‘effect music’
– street noises, the start and arrival of a train, a train running till the emergency brake is pulled, noises of a railway
station, machine noises, a bombardment and music of the heavenly hosts”. No mesmo artigo de Winter (1941, p. 153),
vemos mencionada também a expressão noise-music: “The various theories and studies of ‘noise-music’ (the beloved
Geräuschmusik of the Germans e Bruitismus dos Italian futurists) were linked particularly with film, during both silent
and sound periods. Although many of these experiments had only academic interest, increased awareness of the uses
of sound was effected.”
153
ruído, ambiente sonoro, voz, canto, coro etc. já podia ser notada nas indiscernibilidades a respeito
da divisão entre as pistas de música, voz e ruído no documentarismo britânico mais experimental
e nos trabalhos, por exemplo, de Ruttmann e Vertov.
Esse debate é atual e tem ligação com a produção contemporânea de documentário,
principalmente naquilo que se refere à quebra das funções clássicas desempenhadas pelas três
pistas. Um dos nichos de produção de documentário mais relevante da atualidade caminha nesse
sentido, é a produção do Sensory ethnography lab da Universidade de Havard, com filmes como
Leviathan (2012) de Verena Paravel, com som de Ernst Karel. São filmes que trabalham com outros
parâmetros de função, uso e presença do som na narrativa, num caminho que poderíamos chamar
de etnografia sonora79.
5.2 Os ruídos no documentário
Para além das pistas de música e voz (e da discussão sobre as indiscernibilidades),

temos aquilo que chamamos convencionalmente de ruído. Na tradição documentária, há filmes que
não usam materiais sonoros diferentes de voz e música, assim como há filmes em que música e/ou
a voz não é usada, há filmes que se dedicam aos ruídos com referentes visuais, há filmes que se
dedicam mais aos ambientes sonoros (ou aos ruídos de um extracampo) do que aos ruídos de
imediata relação com o que vemos no campo do visível, há filmes que criam os ruídos nos estúdios,
outros que negam esse modo de geração de som em favor do uso de sons advindos de locação, há
filmes em que a sincronia sonoro-visual é pós-produzida e filmes que prezam pela captação sonoro-
visual sincrônica, há filmes em que os ruídos são meticulosamente editados e mixados e outros em
que a pós-produção é evitada etc. e, finalmente, filmes que misturam duas ou mais dessas
caraterísticas.
No campo teórico e histórico dos estudos do som, a temática do ruído no documentário
figura, talvez, como a mais incipiente. É ainda um terreno de difícil incursão, embora já haja, de
certa forma, um lastro teórico e histórico no campo do ficcional (embora na ficção, o ruído,
também, talvez, figure como a temática mais incipiente).
79
Vale conferir o site do grupo: <https://sel.fas.harvard.edu/index.html>, acesso em: jan. 2015.
154
Os parâmetros que aplicamos para falar da música no documentário servem
hipoteticamente para falar também dos ruídos. Contudo, a aplicabilidade deles, do ponto de vista
analítico, lida com certas barreiras. Uma delas é a perceptiva: do ponto de vista espectatorial-
analítico, é complicado inferir a circunstância material, espacial e temporal do ruído que se faz
presente no filme. Em outras palavras, é difícil saber se o ruído é tomado em locação ou em estúdio,
se ele é fruto de uma tomada sonoro-visual sincrônica ou se é pós-sincronizado com a imagem, é,
também, difícil identificar que objeto originou a materialidade sonora levada ao espectador.
Uma possível solução para passar por essa barreira seria a pesquisa em arquivos e em
quaisquer outras fontes primárias que fizessem referência à produção dos ruídos em cada filme
especificamente. O problema, que se configura em outra barreira, é que esses materiais são
escassos, ainda mais quando se trata da produção documental dos anos 1930 aos 1960.
Pela perspectiva tecnológica, é possível fazer algumas afirmações gerais, de
conhecimento comum. No documentário clássico, os sons produzidos em heterogeneidade com a
tomada visual e com a circunstância de mundo fílmico foram mais dominantes, devido aos
equipamentos de captação sonora que dependiam de custoso esforço para irem à locação (no
mínimo um vultoso volume de bateria) na qual a tomada visual era feita e na qual a temática
específica de cada filme se debruçava. Em contrapartida, no documentário moderno, a potencial
mobilidade dos equipamentos possibilitou uma incursão mais recorrente e menos custosa no mundo
dos ruídos em locação, que, contudo, não implica uma homogeneidade espacial e/ou temporal entre
a tomada sonora e a tomada visual.
Sabemos que a discussão não é simples. No documentário clássico, apesar das
dificuldades, a tomada sonora em locação já ocorre, conforme discutido anteriormente e conforme
discutiremos a seguir. No documentário moderno, é notável a presença dos ruídos exercendo
funções que perduram desde o período clássico, como o papel de conferir continuidade à sequência
por meio da continuidade sonora frente a cortes no plano visual, o que implica sons e imagens que,
minimamente, não nasceram exatamente no mesmo presente.
Os escritos de Ken Cameron (1947) talvez sejam os mais reveladores sobre o
documentário clássico no que diz respeito aos ruídos, em especial naquilo que se refere ao
documentário britânico no período em que esteve como engenheiro de som no comando do
departamento de som da GPO e da CFU (1938 a 1951). No capítulo dedicado aos ruídos no livro
155
Sound and the documentary film, ele afirma que “o realizador do documentário usa o som genuíno
se ele é humanamente possível de ser captado”, e continua, afirmando que “Ele [o realizador] o
usará preferencialmente em detrimento de um som falsificado, mesmo se esse último for um pouco
mais admirável” (CAMERON, 1947, p. 36). Contudo, afirma que, de fato, a “reconstrução artificial
[...], na prática, tem que ser frequentemente feita” (CAMERON, 1947, p. 36).
Paul Rotha (1939, p. 210), na perspectiva de realizador e produtor, afirma que alguns
sons só se conseguem em locação: “as manobras de um trem à distância, a conversação e o ruído
de um escritório postal de triagem ou os sons característicos de uma estação ferroviária”. Nesses
casos, afirma Rotha (1939, p. 210), a presença do caminhão de som é indispensável. Em
contrapartida, afirma, também, que existem outros tipos de som que são melhor produzidos nos
estúdios de gravação, “especialmente sons que, por motivos dramáticos, requerem ser isolados de
seu ambiente” (ROTHA, 1939, p. 211). Ele dá o exemplo do “canto fúnebre do dragador”80:
ele pode ser fabricado (1) esfregando um lápis numa lousa, (2) arrastando a parte
afiada de uma espada contra um piso de concreto, (3) empurrando um tanque de
ferro vazio sobre um piso com pequenos pedregulhos espalhados. Todos os três
sons são gravados separadamente e misturados na trilha (ROTHA, 1939, p. 211).
Rotha (1939, p. 211) também dá o exemplo do som do “arco voltaico”81, que pode ser fabricado
pela captação de quatro tipos de som, gravados separadamente e, depois, unidos na trilha.
Rotha (1939, p. 211), ao final de suas ponderações, afirma que a diferença entre o uso
de sons “artificialmente criados” e sons “reais gravados em locação” é uma questão de
conveniência e praticidade.
Cameron, por sua vez, dá exemplos concretos de alguns filmes. Um dos exemplos é do
Close quarters (1943) de Jack Lee. Nele, Cameron (1947, p. 38) diz que os ruídos utilizados foram
todos genuínos, gravados em locação, numa correspondência direta entre materialidade sonora e
objeto. Interessante notar nesse filme o fato de que, para a parte visual, um gigantesco interior de
submarino foi construído nos estúdios Pinewood, enquanto para a parte sonora, já próximo ao fim
das filmagens, um “gravador portátil foi levado a um submarino [de verdade] e gravações de todos
os sons peculiares a ele foram feitas” (CAMERON, 1947, p.38) para serem utilizadas.
80
Dragador é uma estrutura mecânica que serve como um tipo de ferramenta de escavação na remoção de depósitos e
entulhos acumulados no fundo de solos, mares, rios etc.
81
Um tipo de descarga elétrica (o relâmpago é um tipo de arco voltaico).
156
Um outro exemplo é sobre o filme V. 1 (1944) de Humphrey Jennings. Era necessário
para o filme, segundo Cameron, um som que simulasse uma bomba viajando em aproximação,
“passando por cima” e explodindo. Não muito antes do fim das gravações dos sons do filme, um
caminhão de som conseguiu captar o som de uma bomba caindo, evitando que fosse necessária a
construção de um som bastante difícil de modelar nos estúdios (CAMERON, 1947, p. 38). Em
contraposição a esse caso, ele cita o filme A diary for Timothy. Foi pedido para o filme o som da
explosão de um foguete V - 2. A intenção original era gravar o som em locação, mas como não foi
possível, o som teve que ser fabricado nos estúdios numa elaborada combinação de um tiro de
rovólver, de uma explosão de um tanque, de uma explosão de um rojão num ambiente reverberante,
o ressoar de vários trovões misturados (CAMERON, 1947, p. 38). Embora esse som tenha sido
fabricado, a outra grande parte dos ruídos do filme foi gravada em locação por duas unidades
completas de som instaladas em dois caminhões (BADDELEY, 1963, p. 136-137).
Cameron (1947, p. 38-39) cita ainda outro exemplo interessante de som colhido em
locação. Uma equipe de som da Army Film Unit se juntou à Second Army (grupo militar britânico
de campo ativo na Segunda Guerra) antes de sofrerem uma invasão aérea em Arnhem. Foram
gravados, segundo Cameron, praticamente todos os tipos de armas de fogo usadas durante a invasão
e, também, um grande leque de sons de batalha. Não havia, então, nenhum filme particular em
vista. Posteriormente, alguns dos sons foram usados no filme True glory (1945) de Garson Kanin
e Carol Reed e em Theirs is the Glory (1946) de Brian Desmond Hurst e Terence Young, filme
sobre a invasão de Arnhem. Cameron ainda fala, num gancho com este exemplo, que com o passar
do tempo uma biblioteca de sons pode ser montada, o que facilita o trabalho da aquisição ou da
fabricação dos sons pretendidos para os filmes.
Alberto Cavalcanti, em Filme e realidade, cita também outros exemplos sobre ruídos
no documentário clássico. Um em Night mail e outro em North sea. A respeito do primeiro,
Cavalcanti (1957, p. 153) cita brevemente uma sequência em Night mail cujos sons do trem foram,
se não lhe falha a memória, feitos por uma bateria. Em relação a North sea, de acordo com
Cavalcanti (1957, p. 155), havia que ser reproduzido para o filme um “barulho de uma vaga82
quebrando no convés do navio”. Tentaram vários recursos em vão, “apelando inclusive para a
seção de efeitos da B.B.C”. Em algum momento encontraram “uma espécice de rangido metálico,
82
A palavra “vaga” pode ser entendida como “onda”.
157
que não poderia jamais ser identificado”. “O guincho83 dava a impressão de que o navio tinha sido
espremido diagonalmente e todas as suas juntas arrebentadas”. Cavalcanti comenta que era um
ruído maravilhoso porque era, justamente, irreconhecível. Para ele, a imagem tem um poder de
transformar a percepção da materialidade sonora, sendo o ruído, quando bem utilizado, uma
ferramenta dramática fundamental para se arrebatar o espectador. Ele conta um caso para explicar
essa perspectiva:
Um avião voava em direção da câmara. O diretor musical interrompia a orquestra
e um estranho som avolumava-se. Nada tinha que ver com o som de um motor,
embora o efeito fosse excelente. Curioso, precisei esperar a sessão seguinte, para
compreender como tinha este sido obtido. Prevenido, ao escutá-lo pela segunda
vez, reconheci um som muito comum, ouvido já milhares de vezes: o de um dos
pratos tocados por duas baquetas estofadas. Um som muito familiar que, mesmo
retendo sua qualidade dramática, tinha perdido, no entanto, a sua identidade
quando combinado com a imagem. A imagem transforma as notas do prato no
ronco do avião.
Eis porque os ruídos são tão úteis na banda sonora. Eles falam diretamente à
emoção. Uma criancinha se assusta com um barulho repentino, muito antes de
saber se há alguma relação entre barulho e perigo, antes mesmo de saber o que é
o perigo. Os cães fogem quando se bate num gongo ou numa bandeja de metal.
As imagens falam à inteligência e o ruído, contornando a inteligência, fala a
alguma coisa de mais profundo e instintivo, como provam a reação da criança e a
do cão. E isto nos leva a concluir que a mais importante característica da imagem
na tela é a sua qualidade objetiva (CAVALCANTI, 1957, p. 155).
A perspectiva de Cavalcanti tendia para o entendimento de que o uso e a percepção do
ruído deveriam caminhar no sentido dramático, não importando muito sua fidedignidade de origem
em relação ao objeto que se associa, cabendo à imagem a objetividade da identificação material.
Essa perspectiva tinha uma certa consonância com a perspectiva de Cameron (1947, p.
8), que dizia que o efeito do som (e também do silêncio) sobre as emoções e a dramaticidade
dependia mais da associação de ideias do que da realidade do som (e do silêncio) propriamente
dita. Karel Reisz (1953, p. 165-166), um dos membros fundadores do free cinema, em seu livro
The technique of film editing84 de 1953, em sua discussão sobre som no doumentário clássico, pensa
de forma semelhante, afirmando inclusive que “o efeito emocional dos sons no espectador é menos
83
“Guincho” aqui é utilizado na acepção de “som agudo”.
84
Reisz, nesse livro, trabalha com dois conceitos que, embora pouco detalhado, funciona de forma semelhante aos
conceitos de diegese e não diegese aplicados ao som fílmico, décadas antes de Thompson e Bordwell (1979) e Gorbman
(1980). Um deles é o actual sound, que seria o som diegético: “som cuja fonte é visível na tela ou cuja fonte subtende-
se estar presente pela ação do filme” (REISZ, 1953, p. 278). O outro conceito é commentative sound que seria o som
não diegético: “som cuja fonte não é nem visível na tela nem subtende-se como presente na ação” (REISZ, 1953, p.
279).
158
direto que o das imagens e é, portanto, menos prontamente descritível”, aferindo a objetividade da
imagem e o emotivo do som.
Enfim, no documentário clássico a presença do ruído se fez por tomadas em locação e
em estúdio. Embora, segundo W. Hugh Baddeley (1963, p. 136-137), que começou a escrever,
produzir e dirigir documentários na Inglaterra no final dos anos 1930, apenas as produções que
contavam com um montante significativo de dinheiro conseguiam gravar os sons em locação.
As tomadas dos ruídos no documentário clássico eram, basicamente, espacialmente
e/ou temporalmente heterogêneas à tomada visual e ao mundo fílmico, fossem elas de locação ou
estúdio – embora a tomada em locação pudesse se estabelecer de forma homogênea com o espaço-
tempo do mundo fílmico, como em alguns dos filmes de Humphrey Jennings produzidos pelo
Ministério da Informação britânico e como o recém-citado Theirs is the Glory, ou, em
homogeneidade com a tomada visual e com o mundo fílmico, como em Merchant Seamen (1942)
de Jack Holmes (Figura 16) 85.
Os ruídos eram trabalhados, sobretudo, excluindo os casos que citamos no item
anterior, numa perspectiva da verossimilhança e num trabalho narrativo que lidava tanto com os
elementos visíveis, que estabelecem relações diretas ou de suposição com aquilo que escutamos, e
com aquilo que se costuma chamar de ambiente sonoro.
Os sons relativos aos elementos visíveis e ao ambiente sonoro podiam ser, sem entraves
éticos, tanto construídos em estúdio, numa base material muito distante da do objeto ao qual se
refere, como a partir de um outro objeto igual ou semelhante localizado ou não numa espacialidade
e/ou temporalidade heterogênea à tomada visual e/ou circunstância de mundo fílmico. Ou ainda, o
ruído podia ser captado a partir do soar do mesmo objeto ao qual se refere no campo do visível,
fosse numa heterogeneidade temporal ou não com a tomada visual (embora os casos de completa
homogeneidade pareçam ser raros).
85
Foto de uma tomada em locação do filme. Na foto nota-se um microfone de fita (ribbon microphone) (CAMERON,
1947, p. 78).
159
Figura 16 – Tomada em locação de Merchant seamen
Fonte: Cameron (1947, p. 78).
Se lidarmos com ideias de realidade e objetividade, palavras sempre resgatadas quando

o assunto é documentário, há que se considerar que passava longe das questões éticas do
documentarismo clássico captar sincronicamente, para além das barreiras tecnológicas, o som e a
imagem como se isso fosse o totem ético da verdade; embora os ruídos possam ocupar um lugar
semelhante ao da música, como discutido no item 4.1, “A (falsa) polêmica da presença da música
160
no documentário”. Ou seja, o ruído também pode ser acusado de manipular a realidade, de tirar a
objetividade, de manipular emoções, de estetizar a realidade, de adicionar percepções que não se
aferem pelas imagens. Mas essa crítica só é possível de se fazer anacronicamente, a partir das novas
ideias que nascem com o documentário moderno.
Dentro desse horizonte de tomada dos ruídos, é notável a recorrência de certas
modalidades sonoras na narrativa. Um primeiro ponto sobre o assunto diz respeito aos tipos de
ruído captados em locação. Eles eram, sobretudo, advindos de locais amplos e de objetos
inanimados. Em outras palavras, foi rara a tomada de ruídos em ambientes delimitados
espacialmente, íntimos, em lares, bares etc. e de ruídos advindos de corpos animados, como o dos
humanos. Paul Rotha (1939, p. 208), um dos defensores da espontaneidade dos personagens em
seu ambiente, ainda em 1936, faz um comentário interessante, pertinente a esse assunto:
Existe um ponto prático que nós devemos lembrar nessa conexão – as maiores
dificuldades em relação à portabilidade do equipamento de som quando
comparado com o tamanho das modernas câmeras. Caminhões de som são
essencialmente objetos maiores e desajeitados. Eles atraem atenção, causam
distúrbio às características naturais do material que estão sendo gravados e causam
transtorno à intimidade, a qual o documentarista tenta criar entre ele mesmo e seu
tema. A mobilidade do equipamento de som, como devemos entender, é mais útil
para a coleção de wildtracks naturais, que, nesse caso, é usada de forma
independente da câmera.
Para Rotha, a presença volumosa dos equipamentos de som causava distúrbio no
espaço fílmico e, de certa forma, impedia uma captação interessante dos sons. O caminhão de som
e suas captações tornavam-se interessantes se usadas como wildtracks, que, em sua definição, é “a
coleção de todos os tipos de fala e som em películas, as quais podem, mais tarde, ser cortadas e
editadas em loops e em sub-tracks para regravação com a trilha sonora em branco” (ROTHA, 1939,
p. 210). Em contrapartida, para ele, a câmera, mais compacta, conseguia entrar nos espaços sem
causar o mesmo distúrbio.
Nos filmes do período, essa perspectiva ressoa inclusive a partir da espectatorialidade.
As tomadas visuais que tendiam mais ao íntimo ou à proximidade com o ator social raramente
lidavam com ruídos homogêneos a ela. E podemos notar isso porque, com os objetos visuais em
proximidade, evidencia-se a ausência ou presença de certos elementos sonoros cabíveis de estarem
presentes ou não conforme a materialidade, e de seus supostos sons correspondentes, advindos do
plano visual.
161
O sincronismo sonoro-visual na tomada era, de certa forma, descartado. Mas era
descartado não por um desapego à materialidade mundana dos ruídos como elemento narrativo.
Era descartado pela intrusão e distúrbio que os equipamentos de som, junto à câmera, poderiam
causar, o que poderia comprometer a tomada visual.
Nesse sentido, é interessante notar a dualidade do real que está em jogo no que diz
respeito ao ruído. O ruído de locação era interessante (sobretudo como wildtracks), mas sua
ausência poderia ser tranquilamente suplantada com a presença de ruídos tomados em estúdio,
mantendo-se, na narrativa, os graus de verossimilhança que lhe interessavam. E, quando os ruídos
não cumpriam diretamente a função de verossimilhança, contava-se com a suposta objetivadade da
imagem, à qual o ruído se juntava, seja em termos dramáticos ou de invenção/representação, para
compor a realidade fílmica, sem comprometimento com a ética documentária de então e seus
pressupostos de realidade.
Os ruídos tomados em estúdio, em termos de heterogeneidade, caminhavam na mesma
direção do som tomado em locação, cumprindo os mesmos papéis, apesar de lidarem com uma
possibilidade criativa maior. Os ruídos mais íntimos, como um suspirar, um estralar de dedos, o
som de um sentar na cadeira e o de um coçar de cabelo, não se apresentavam de forma corriqueira.
Os ruídos de estúdio vinham, sobretudo, em serviço da construção de ambientes amplos e de ações
determinantes da articulação fílmica. Por mais que próximos das ações do ator social, os ruídos
lidavam com a ação social, ou seja, com o som do martelo que o ator batia, com a pedra que ele
quebrava, com a fundição dos metais por ele operada, com o trem no qual estava presente, com os
sons do escritório no qual estava, com o seu caminhar durante o trabalho. Mesmo nos filmes com
encenação construída bem evidente, articulados em grande medida pelo diálogo, os ruídos eleitos
eram muito específicos da função social operada pelos personagens na narrativa.
Essas configurações de tomada de ruído impeliam, assim, uma estética sonora dos
ruídos bastante (ou completamente) mediada pela equipe realizadora. Os ruídos, independente de
seu nascimento para o microfone – em locação ou estúdio –, passavam na pós-produção,
minimamente, por um trabalho de pós-sincronização, forjando-se, em grande parte das situações,
numa construção sonora heterogênea à tomada visual e ao mundo fílmico em jogo. A fruição no
mundo, a indicialidade, o inesperado e o imprevisível, no âmbito dos ruídos, ficavam, assim,
bastante distantes da estilística do documentário clássico. Por mais que o som não muito bem
162
previsto podia acontecer para o microfone, como no caso da invasão de Arnhem, essa
“imprevisibilidade” não era levada pelos realizadores através da articulação fílmica para a fruição
espectatorial. Em contrapartida, os ruídos, potencialmente, ganhavam atributos articulatórios
valiosos. Podemos inclusive arriscar dizer que os ruídos em seus usos mais inovadores tiveram
grande espaço no documentário clássico justamente devido a essas perspectivas e leque de tomada
– debitária tanto à sua dimensão limitadora, no que diz respeito à mobilidade, como em relação à
abertura, eticamente aceita, para a construção sonora em estúdio.
No documentário moderno, os ruídos captados em locação ganham destaque, assim
como as tomadas homogêneas à tomada visual e ao mundo fílmico. De forma geral, as
configurações das tomadas dos ruídos são muito semelhantes às tomadas da voz no documentário
moderno. Os ruídos do mundo, de certa forma, deixam sua marca de forma mais direta. E isso não
significa dizer que existe uma estética não mediada – ela apenas não acontece no mesmo grau e da
mesma forma da do documentário clássico.
Os ruídos vão aparecer de três formas dominantes no documentário moderno. Uma é
aquela cujo ruído não é protagonista. Ou seja, quando o ruído ocorre para o sujeito-da-câmera
como um fruto, desejável ou não, do ambiente no qual a captação foca-se na voz ou na música.
Outra forma ocorre quando o ruído, tomado em locação ou não, tem função determinante na
articulação dos planos visuais, operando conexão espacial e temporal nos cortes entre planos nas
sequências, como no cutaway, reaction shot e jump cut, sendo bem trabalhado na edição e
mixagem. A terceira forma dominante ocorre quando os ruídos operam uma função determinante
dentro do plano visual, seja na construção do ambiente sonoro ou de elementos dramáticos sonoros
específicos, lidando, em certos casos, com a fruição mundana, o inesperado e o intenso, aspectos
dos quais a tomada da voz, como mencionado anteriormente, também podia se deleitar.
O primeiro caso (o foco da captação não está no ruído) talvez seja o mais recorrente,
dado o priviléigo recebido pela voz tanto na tomada quanto na articulação fílmica. Na tomada, a
relação voz e ruído é, em grande grau, determinada pela direcionalidade e localização do microfone
ante os eventos sonoros86. Embora seja comum dizer que no documentário moderno exista uma
diluição entre background e foreground no âmbito sonoro, é notável que a voz aparece usualmente
86
Outros fatores entram em jogo também no que diz respeito à tomada de som, como as características específicas de
captação de cada microfone, como a tessitura de captação e as angulações de captação (direcional, cardioides,
supercardioides, hipercardioides, bidirecionais, omnidireconais). Mas essas informações são difíceis de serem obtidas.
163
no “primeiro plano sonoro”. Se esse controle entre background e foreground era bastante evidente
no documentário clássico, devido, sobretudo, aos trabalhos de pós-produção, no documentário
moderno, esse controle entre background e foreground é fruto mais direto (mas não exclusivo) das
escolhas do sujeito-da-câmera no transcorrer do presente do mundo na tomada.
Comparativamente, contudo, podemos dizer que existe uma diferenciação entre background e
foreground mais evidente no documentário clássico.
O segundo caso (ruído como ferramenta de articulação entre os planos) não costuma
ser levado muito em conta nos debates. É nesse segundo caso que teremos o trabalho de edição e
mixagem mais vigoroso, que se fará presente no direto norte-americano, no verdade francês e no
cinema do vivido canadense. Alguns diretores/editores vão usar esse recurso em menor medida,
como é o caso de Frederick Wiseman em Titicut folies87, que preza pela tomada sincrônica sonoro-
visual, homogênea, e pela fruição espectatorial desse sincronismo sonoro-visual, homogêneo.
O terceiro caso é aquele em que a espacialidade e temporalidade mundana faz-se
transparecer em maior medida pelos ruídos do que por qualquer outro elemento sonoro. São
momentos em que as vozes, tão abundantes no documentário moderno, se silenciam; ou são os
momentos de contemplação do espaço-tempo que aflora das imagens; ou são os momentos em que
há suspensão das ações; ou os momentos mundanos que nem a oratória e nem a música ocupam
uma dimensão fundamental; ou momentos ordinários etc.
Existem ainda dois casos que irão, de certa forma, caracterizar algumas das diferenças
centrais entre a presença dos ruídos no documentário clássico e no moderno. Uma delas diz respeito
àquilo que chamamos anteriormente de verossimilhança. Dissemos que existia um horizonte
estilítisco no documentário clássico que prezava pela verossimilhança dos ruídos nas narrativas.
No documentário moderno, pelo apego à fruição mundana da tomada, as marcas de uma
verossimilhança são substituídas pelas marcas que evidenciam que o captador de som esteve no
mundo que se frui na espectatorialidade. As marcas são tanto do ponto de vista técnico, operacional,
quanto do surgimento do inesperado. Todas elas debitárias do “microfone na mão” e do transcorrer
mundano, a partir das quais o sujeito-da-câmera leva para a espectatoraliedade as marcas de sua
presença no mundo, das intensidades, riscos, conforto etc. O outro caso diz respeito aos lugares
conquistados. Se antes os ruídos tomados em locação, no documentário clássico, restringiam-se,
87
O que se nota com mais frequência em Titicut folies é o uso de fade in e fade out.
164
majoritariamente, aos ruídos tomados em lugares abertos, amplos e de momentos de menos
intimidade, prezando os aspectos sociais dos indivíduos; no documentário moderno, os ruídos
começam a surgir para a tomada a partir desses lugares menores, mais íntimos, mais próximos dos
reflexos de ações ordinárias.
A incursão na temática dos ruídos no documentário clássico e moderno, embora ainda
incipiente, mostra-se de grande valia tanto para os estudos do som quanto para a teoria
cinematográfica. Há ainda um longo caminho a se percorrer até, por exemplo, chegarmos com
firmeza para um debate sobre a atual e já citada produção do Sensory ethnography lab.
165
166
Considerações finais
Quando iniciamos a pesquisa, carregávamos alguns questionamentos, que mesmo

estando ocultos, por vezes, no texto, foram determinantes para direcionar nossas abordagens.
Retomá-los aqui, mesmo que suscintamente, parece ser interessante.
O primeiro questionamento que nos acometeu foi em relação à voz. Quando comecei a
analisar o som no documentário clássico – sobretudo o norte-americano, o britânico e o soviético
–, notei que existia, de certa forma, uma incongruência entre aquilo que havia aprendido a partir
de minhas leituras e aquilo que eu percebia a partir dos filmes propriamente ditos.
E no que consistia essa incongruência? Aprendi que uma das características marcantes
do documentário clássico é aquilo que convencionamos chamar de “voz de Deus”. Entretanto,
quando fui diretamente para a análise dos filmes (sobretudo aqueles de porte mais autoral), percebi
que a variedade de estratégias empregadas no uso da voz era tamanha, e que eu tinha tantos
exemplos de exceção (mesmo nas obras canônicas para a literatura da área) que a regra poderia
começar a ser repensada, espcialmente naquilo que se refere à produção de porte mais autoral,
referencial na teoria do cinema documentário. A primeira parte do capítulo 3, “As vozes no
documentário”, desenvolveu-se, em grande medida, no acerto de contas com essa incongruência.
A existência da “voz de Deus” não pode ser negada, nem no âmbito teórico e nem no
próprio filme. Contudo, notamos que, apesar de o conceito já ter cumprido papel fundamental no
desenvolvimento teórico e histórico da literatura cinematográfica, usá-lo genericamente é, de certa
forma, obscurecer o variado leque de estratégias fílmicas presentes no período clássico que lidaram
com aquela voz cujo corpo não se vê e que tão pouco se encontra num extracampo visual
homogêneo. E, de certa forma, já contamos com boa quantidade de filmes restaurados/recuperados
e um acesso mais fácil a fontes textuais primárias da época que nos permitem ir “para além da ‘voz
de Deus’”.
Além disso, na superestimação da uniformidade do uso da voz no documentário
clássico, sob o manto da “voz de Deus”, notamos que é muito comum se deixar de fora do debate
aquela voz cujo corpo que a emite é visível (ou que supomos encontrar no extracampo visual
homogêneo), que marcará, também, relevante presença no documentário clássico. A presença desse
tipo de voz, especialmente na forma de diálogo e conversas, engendradas pelas personagens
167
filmadas, começa a ocupar um lugar de destaque no documentário do período da guerra e do pós-
guerra e determina outras formas de se estabelecer a condução da narrativa fílmica, mais centrada
no desenvolvimento do plano dramático. Assim, buscamos trazer à tona esse debate, que é, em
muito, negligenciado.
Sobre a voz no documentário moderno, à qual nos dedicamos na segunda parte do
capítulo 3, mais que um questionamento, o que nos motivou na análise foi a vontade de entender
as diferentes configurações de tomada da voz e de sua articulação na narrativa, a fim de ir mais
além do debate que se centra apenas na chegada dos aparatos de captação sonoro-visual
sincronizada portáteis. Os novos aparatos, de fato, exercem mudança determinante na realização
da tomada. Contudo, nosso esforço não fluiu no sentido de reforçar essa perspectiva, e sim na
tentativa de discutir as diferentes formas de tomada da voz que surgem no virar dos anos 1950 para
os anos 1960; entre elas, aquelas que são mais diretamente debitárias dos novos aparatos e as que,
em contrapartida, são mais diretamente debitárias de uma mudança epistemológica, não
diretamente debitárias das novas tecnologias.
No que diz respeito à música, com a qual lidamos no capítulo 4, o ponto de partida foi
a discussão sobre o julgamento e a validade ética da presença da música no documentário. Na nossa
análise, tentamos escapar das ciladas teóricas que se figuram em afirmações como “essa música
manipula a realidade”, “a música tira a objetividade”, “a música manipula as emoções”, “a música
estetitiza a realidade”, “a música adiciona percepções que não se aferem pelas imagens”. Nesse
sentido, tentamos escapar também de conceitos como “diegético” e “não diegético”, ao passo que
nos centramos mais nas configurações das tomadas, a partir das quais as músicas chegam ao
espectador. Escolhemos esse caminho, não por desvalidar esses dois conceitos tão consolidados no
campo dos estudos do som, mas por acreditar que a música do documentário implica uma demanda
teórica de abordagem diferente, centrada na materialidade sonora da música em seu espaço-tempo
de emersão no mundo para e pelo sujeito que a capta e sua relação espaço-temporal com a tomada
visual e com a circunstância de mundo fílmico.
No quinto e último capítulo, “Os outros elementos sonoros do documentário”,
trabalhamos com dois grupos de elementos sonoros. No primeiro grupo, lidamos com elementos
de difícil definição, que nos confudem teoricamente e espectatorialmente quando temos no
horizonte a divisão tripartite da trilha sonora (voz, música e ruído), consolidada na teoria e no
168
âmbito prático do cinema ficcional ainda nos anos 1930. São elementos que não cumprem as
funções narrativas tipicamente estabelecidas para cada uma das três pistas, como bem se nota no
cinema clássico ficcional hollywoodiano, e que nos confudem no compreender da voz como voz,
da música como música e do ruído como ruído, ou, ainda, torna difícil o papel de identificar certos
elementos como voz, música ou ruído.
Na prática fílmica, o sound designer, a partir da sua consolidação na produção fílmica
no desenrolar dos anos 1970, torna-se, de certa forma, a figura simbólica que irá imprimir essas
marcas na trilha sonora sistematicamente, tanto no domínio documental como no ficcional.
Questionando-nos sobre uma história dessas indiscernibilidades, desses elementos de difícil
definição, que se mostram tão evidentes no cinema contemporâneo, é que empreendemos nosso
esforço na primeira parte do último capítulo. O documentário dos anos 1930, em especial o
britânico, figurou em um campo frutífero no que diz respeito à prática sonora envolvendo esses
elementos sonoros, de difícil definição, elementos que se tornam indiscerníveis quando temos no
horizonte a divisão tripartite da trilha sonora. E a um certo conjunto de práticas nesses anos 1930
podemos, inclusive, referir-nos como uma espécie de “os primórdios” das novas práticas que iriam
se consolidar a partir dos anos 1970.
No segundo grupo, lidamos com aquilo que se convenciona chamar de ruído. Nossas
questões sobre esse elemento da trilha sonora aproximaram-se, em grande parte, das questões
referentes à “voz de Deus” no documentário clássico. Para além daqueles filmes conhecidamente
tratados como experimentos sonoros, é usual encerrar o assunto dizendo, de forma superficial, que
o documentário clássico cria seus ruídos em estúdio com o intuito de conferir realidade ao mundo
visual filmado (sejam eles um ambiente sonoro ou elementos sonoros ligados mais diretamente a
objetos específicos, localizados no plano visual ou no extracampo homogêneo). Não que isso não
seja notável. O problema é que, tal como ocorre no caso da voz, insistir cegamente nesse ponto,
torna obscuro todo um leque de distintas estratégias. Algo parecido ocorre também no debate sobre
os ruídos do documentário moderno. Usualmente se resume que aquilo que escutamos são, agora,
os sons reais do mundo, de locação. Novamente, não que isso não seja notável, mas se pode notar,
também, um interessante leque de distintas estratégias. Enfim, no esforço de vasculhar essas
variadas estratégias é que abordamos a temática do ruído no documentário.
169
Antes de desenvolver os capítulos 3, 4 e 5, buscamos traçar uma breve história do
nascimento do documentário sonoro, na transição do silencioso para o sonoro. Assunto sobre o
qual ainda se pousa uma névoa. Os esforços sobre os estudos do som no documentário raramente
entraram nesses tempos mais remotos, nos quais a materialidade sonora apenas se forja, hoje, a
partir de partituras, cartas, documentos, artigos de jornal etc. Há ainda um grande esforço de
pesquisa de campo a ser realizado nessa empreitada, com a qual buscamos colaborar.
Enfim, foi lançando mão dessas perspectivas e desses questionamentos e com uma
abordagem que preza bastante pelo entendimento das configurações da tomada e da materialidade
que para ela aflora que imaginamos haver contribuído com os estudos do som no cinema
documentário.
170
Referências
AND NOW Rawtenstall. Sight and Sound, v. 5, n. 20, p. 155, winter 1936-7.
ANDERSON, C.; BENSON, T. Documentary dilemmas: Frederick Wiseman’s Titicut follies.

Carbondale: Southern Illinois University Press, 1991.
ALTAMAN, R. The evolution of sound technology. In: WEIS, E.; BELTON, J. (Ed.). Film sound:
theory and practice. New York: Columbia University Press, 1985. p. 44-53.
______. The silence of the silents. The musical quarterly, v. 80, n. 4, p. 648-718, 1996.
______. Silent film sound. New York: Columbia University Press, 2004.
ANSTEY, E. Some origins of Cinéma vérité and The sound-track in British documentary. Paris:
United Nations Educational, Scientific and Cultural Organization, 1966.
APPLEBAUM, L. Documentary music. In: LIMBACHER, J. Film music: from violins to video.
New Jersey: The Scarecrow Press, 1974. p. 66-72.
ARNHEIM, R. A new Laocoön: artistic composites and the talking film. In: WEIS, E.; BELTON, J.
(Eds.) Film sound: theory and practice. New York: Columbia University Press, 1985 [1938].
p. 112-115.
B.B.C. The voice of Britain. Sight and Sound, v. 4, n. 13, p. 125-126, spring 1935.
BADDELEY, W. The technique of documentary film production. London: Focal Press, 1963.
BARSAM, R. Film guide to Triumph of the will. Bloomington: Indiana University Press, 1975.
BELTON, J. Technology and aesthetics of film sound. In: WEIS, E.; BELTON, J. (Ed.). Film sound:
theory and practice. New York: Columbia University Press, 1985. p. 63-72.
BENYON, G. Musical presentation of motion pictures. New York: Schirmer, 1921.
BIRD, Thomas; FARR, William. The world we live in. Sight and Sound, v. 6, n. 23, p. 145-146,
autumn 1937.
BIRDSALL, C. Resounding city films: Vertov, Ruttmann and early experiments with documentary
sound aesthetic. In: ROGERS, H. (Ed.). Music and sound in documentary film. New
York: Routledge, 2015. p. 20-40.
BORDWELL, D.; THOMPSON, K. Film art: an introduction. 9. ed. New York: McGraw-Hill,
2009.
171
BRASSEAUX, R. Cajun breakdown: The emergence of an American-made music. New York:
Oxford University Press, 2009.
BRUCE, W. Producing an educational film. Sight and Sound, v. 1, n. 4, p. 106-109, winter 1933.
BRUNEL, C. Music and soundtrack in Joris Iven’s films. In: BAKKER, K. (Ed.). Joris Ivens and the
documentary film. Amsterdam: Amsterdan University Press, 1999. p. 195-209.
BRUZZI, S. New documentary: a critical introduction. London: Routledge, 2000.
BULGAKOWA, O. The ear against the eye: Vertov’s symphony. Monatshefte, v. 98, n. 2, p. 219-
234, summer 2006.
CAMERA on nature. World Film News and Television Progress, v. 3, n. 3, p. 124-125, July
1938.
CAMERON, K. Sound and the documentary film. London: Sir Isaac Pitman & Sons, 1947.
CAMPBELL, R. Cinema strikes back: radical filmmaking in the United States (1930-1942).
Michigan: UMI Research Press, 1978.
CARRASCO, C. Trilha musical: música e articulação fílmica. 1993. 190 p. Dissertação

(Mestrado em Cinema)–Escola de Comunicações e Artes, Departamento de Cinema, Rádio
e Televisão, Universidade de São Paulo, São Paulo, 1993.
CAVALCANTI, A. Filme e realidade. 2. ed. rev. Rio de Janeiro: CEB, 1957.
______. Sound in films. In: WEIS, E.; BELTON, J. (Ed.). Film sound: theory and practice. New York:
Columbia University Press, 1985 [1939]. p. 98-111.
CHION, M. Audio-vision: sound on screen. New York: Columbia University Press, 1994.
______. The voice in cinema. New York: Columbia University Press, 1999.
CLAIR, R. The art of sound. In: WEIS, E.; BELTON, J. (Ed.). Film sound: theory and practice. New
York: Columbia University Press, 1985 [1929]. p. 92-95.
COHEN, T. Playing to the camera: musicians and musical performance in documentary cinema.
New York: Wallflower, 2012.
COOKE, M. (Ed.). The Cambridge companion to Benjamin Britten. Cambridge: Cambridge

University Press, 1999.
______. A history of film music. New York: Cambridge University Press, 2008.
172
CORNER, J. Sounds real: music and documentary. Popular music, v. 21, n. 3, p. 357-366, Oct.
2002.
COSTA, F. M. O som no cinema brasileiro. Rio de Janeiro: 7Letras/Faperj, 2008.
DA-RIN, S. Espelho partido: tradição e transformação do documentário. Rio de Janeiro:

Azougue, 2006.
DAVY, C. The Song of Ceylon. Cinema Quarterly, v. 3, n. 2, p. 109-110, winter 1935.
DEAVILLE, J. Sounding the World: the role of music and sound in early ‘talking’ newsreels. In:
ROGERS, H. (Ed.). Music and sound in documentary film. New York: Routledge, 2015.
p. 41-55.
DELEUZE, G. A imagem-tempo. São Paulo: Brasiliense, 1990.
______. A imagem-movimento. Lisboa: Assirio & Alvim, 2004.
DIBBETS, K. High-tech avant-garde: Philips radio. In: BAKKER, K. (Ed.). Joris Ivens and the
documentary film. Amsterdam: Amsterdan University Press, 1999. p. 195-209 [notas]. p. 72-
86.
DOANE, M. The voice in the Cinema: the articulation of body and space. In: WEIS, E.; BELTON,
J. (Ed.). Film sound: theory and practice. New York: Columbia University Press, 1985. p. 54-
62.
DONNELLY, K. Irish sea power: a new version of Man of Aran (2009/1934). In: ROGERS, H.
(Ed.). Music and sound in documentary film. New York: Routledge, 2015. p. 137-150.
EISENSTEIN, S.; PUDOVKIN, V.; ALEXANDROV, G. Apêndice: Declaração sobre o futuro do

cinema sonoro. In: EISENSTEIN, S. A forma do filme. Tradução de Teresa Ottoni. Rio
de Janeiro: Jorge Zahar, 2002 [1928]. p. 217-219.
ELLIS, J. The documentary idea: a critical history of English-language documentary film and
video. Englewood Cliffs: Prentice Hall, 1989.
FIELDING, R. The American newsreel: a complete history, 1911-1967. 2. ed. Jefferson: McFarland,
2006.
FILMS for school. Sight and Sound, v. 5, n. 19, p. 98-99, autumn 1936.
FORD, C.; FAIRGRIEVE, J. Sound or silent/Film is teaching. Sight and Sound, v. 4, n. 13, p. 26-
30, spring 1935.
173
FRANCE, C. Cinema e antropologia. Campinas: Unicamp, 1998.
FREIRE, M. Jean Rouch e a invenção do Outro no documentário. Doc On-line: Revista digital de
Cinema Documentário, n. 3, p. 55-65, dez. 2007.
GAY, P. A cultura de Weimar. Rio de Janeiro: Paz e Terra, 1978.
GORBMAN, C. Narrative film music. Yale French Studies, n. 60, 183-203, 1980.
______. Unheard melodies: narrative film music. Bloomington: Indiana University Press, 1987.
GRAHAM, C. Leni Riefenstahl and Olympia. London: Scarecrow, 2001.
GRANT, B. Five films by Frederick Wiseman. Berkeley: University of California, 2006.
GRIERSON, J. The documentary producer. Cinema Quarterly, v. 3, n. 1, p. 8-10, autumn 1933.
______. The G.P.O gets sund. Cinema Quarterly, v. 2, n. 4, p. 215-221, summer 1934a.
______. Introduction to a new art. Sight and Sound, v. 3, n. 10, p. 101-104, autumn 1934b.
______. Two paths to poetry. Cinema Quarterly, v. 3, n. 4, p. 194-196, summer 1935.
GUYNN, W. The art of national projection: Basil Wright’s Song of Ceylon. In: GRANT, B.;
SLONIOWSKI, J. (Ed.). Documenting the documentary: close readings of documentary film
and video. Detroit: Wayne State University Press, 1998. p. 64-80.
HOLMES, J. B. G.P.O. films. Sight and Sound, v. 6, n. 23, p. 159-160, autumn 1937.
HOLMES, W. The new renaissance. Sight and Sound, v. 5, n. 18, p. 7-9, summer 1936.
HOWE, B. Helen van Dongen and the noise-music of oil in Louisiana Story. In: Society for American
Music Annual Meeting, 16., 2012, Charlotte. Anais… Charlotte: Davidson College, 2012. p.
1-5.
INDUSTRIAL Britain. Sight and Sound, v. 2, n. 8, p. 145, winter 1934.
JACOBS, L. (Org.). The documentary tradition. 2. ed. New York: Norton, 1992.
KRACAUER, S. Dialogue and sound. In: WEIS, E.; BELTON, J. (Ed.). Film sound: theory and
practice. New York: Columbia University Press, 1985 [1960]. p. 126-142.
______. Theory of film: the redemption of physical reality. London: Oxford University Press, 1960.
174
______. De Caligari a Hitler: uma história psicológica do cinema alemão. Rio de Janeiro: Jorge
Zahar, 1988.
LACK, R. Twenty four frames under: a buried history of film music. London: Quartet Books,
1997.
LEACOCK, R. For an uncontrolled cinema. Film Culture, n. 22-23, p. 23-25, 1961.
LEIGH, W. The musician and the film. Cinema Quarterly, v. 3, n. 2, p. 70-74, winter 1935.
LERNER, N. The classical documentary score in American films of persuasion: contexts and
case studies, 1936-1945. 1997. 307 p. Tese (Doutorado em Musicologia)–Duke University,
Durhan, 1997.
______. Damming Virgil Thomson’s music for The river. In: GAINES, J.; RENOV, M. Collecting
visible evidence. Minneapolis: University of Minnesota, 1999. p. 103-115.
______. Musical texture as cinematic signifier: the politics of polyphony in selected documentary
film scores by Virgil Thomson and Aaron Copland. In: GORBMAN, C.; SHERK, W. (Ed.)
Film music: history, theory, practice. Volume 2. California: The Film Music Society, 2004.
p. 1-25.
LIMA, C. Música em cena: à escuta do documentário brasileiro. 2015. 280 p. Tese (Doutorado em
Comunicação Social)–Faculdade de Filosofia e Ciências Humanas, Universidade Federal
de Minas, Belo Horizonte, 2015.
LINS, C. A voz, o ensaio, o outro. In: BORGES, C. (Org.). Angès Varda. São Paulo: Centro
Cultural Banco do Brasil, 2006. p. 34-39.
LONDON, K. Film music: a summary of the characteristic features of its history, aesthetics,
technique; and possibles developments. London: Faber & Faber, 1936.
MACKAY, J. Disorganized noise: Enthusiasm and the ear of the collective. Kinokultura, n. 7,
Jan. 2015.
MAGALHÃES, M. A. Música, futurismo e a trilha sonora de Dziga Vertov. 2005. 143 p.

Dissertação (Mestrado em Música)–Instituto de Artes, Universidade Estadual de Campinas,
Campinas, 2005.
MAIA. G. Aspectos da música no documentário brasileiro contemporâneo: algumas reflexões sobre o

fazer e o pensar. Doc On-line, n. 12, p. 100-126, ago. 2012.
MAMBER, S. Cinema-Verite in America, Part I. Screen, v. 13, n. 2, p. 79-108, 1972.
MENDES, E. Walter Murch: a revolução da trilha sonora cinematográfica. Significação (UTP), v. 26,
p. 187-224, 2006.
175
NICHOLS, B. The voice of documentary. Film Quarterly, v. 36, n. 3, p. 17-30, spring 1983.
______. Documentary and the coming of sound. In: MAQUA, J.; PALACIO, M. Historia del
cine, v. 6. Madrid: Ediciones Catedra, 1996. p. 273-295.
______. Introdução ao documentário. 3. ed. Campinas: Papirus, 2008.
OLIVAR. J. This is their fight: Joris Ivens’s The Spanish Earth and the romantic gaze. Revista
Forma, v. 10, p. 59-72, 2014.
PARENTE, A. Narrativa e modernidade: os cinemas não-narrativos do pós-guerra. Campinas:

Papirus, 2000.
PINTO, J. Polifonias do documentário: linguagens sonoras e plasticidades documentais (1930-

1940). 2007. 246 p. Dissertação (Mestrado em Cultura e Comunicação)–Universidade do
Porto, Porto, 2007.
POPPER, P. Synthetic sound: how sound is produced on the drawing board? Sight and Sound, v.
2, n. 7, p. 82-84, autumn 1933.
PUDOVKIN, V. Asynchronism as a principle of sound film. In: WEIS, E.; BELTON, J. (Ed.). Film
sound: theory and practice. New York: Columbia University Press, 1985 [1928]. p. 86-91.
RAMOS, F. A cicatriz da tomada: documentário, ética e imagem-intensa. In: ______ (Org.).

Teoria contemporânea do cinema: documentário e narrativa ficcional. Volume 2. São
Paulo: Senac, 2005. p. 159-226.
______. Mas afinal... O que é mesmo documentário?. São Paulo: Senac, 2008.
______. A imagem-câmera. Campinas: Papirus, 2012.
RAPÉE, E. Encyclopedia of Music for Pictures. New York: Belwin, 1925. Reimpressão: New
York: Arno Pres, 1970.
READ. H. Experiments in counterpoint. Cinema Quarterly, v. 3, n. 1, p. 18-21, autumn 1934.
REED, P. The incidental music of Benjamin Britten: a study and catalogue of his music for film,
theatre and radio. 1987. 703 p. Tese (Doutorado)–University of East Anglia, 1987.
______. Britten in the cinema: Coal face. In: COOKE, M. (Ed.). The Cambridge companion to
Benjamin Britten. Cambridge: Cambridge University, 1999. p. 54-77.
REISZ, K. The technique of film editing. London: Focal Press, 1953.
176
RICOEUR, P. Tempo e narrativa. Vol. 1: A intriga e a narrativa histórica. São Paulo: WMF
Martins Fontes, 2010.
RODAKIEWICZ, H. Treatment of sound in “The city”. In: JACOBS, L. The movies as medium.
New York: Farrar, Straus & Giroux, 1973. p. 278-288.
ROGERS, H. (Ed.). Music and sound in documentary film. New York: Routledge, 2015.
ROTHA, P. Documentary film. 2. ed. rev. London: Faber & Faber, 1939.
ROSEN, D. The sounds of music and war: Humphrey Jennings’s and Stewart McAllister’s Listen
to Britain (1942). In: EISEN, C. (Ed.). Coll’astuzia, col giudizio: essays in honor of Neal
Zaslaw. Ann Arbor: Steglein, 2009. p. 389-427.
RUOFF, J. Conventions of Sound in Documentary. In: ALTMAN, R. Sound theory, Sound

practice. New York: Routledge, 1992. p. 217-234.
______. An ethnographic surrealist film: Luis Buñuel’s Land without bread. Visual Anthropology
Review, v. 14, n. 1, p. 45-57, spring/summer 1998.
RUSPOLI, M. Pour un nouveau cinéma dans les pays en voie de développement: le groupe
synchrone cinematographique leger. Paris: United Nations Educational, Scientific and
Cultural Organization, 1963.
RUSSOLO, L. The art of noises. New York: Pendragon, 1986 [1913].
RUTTMANN, W. Malerei mit Zeit. 1919-1920. Manuscrito.
______. Wie ich meinen Berlin-Film drehte?. Licht-Bild-Bühne, n. 241, 1927.
______. Die absolute Mode. Film-Kurier, n. 30, 1928.
______. Sound films? - !. Illustrierter Film-Kurier, n. 1115, 1929.
______. Die Symphonie der Welt. La revue du cinéma, n. 8, 1930.
SABANEEV, L. Music for the films: a handbook for composers and conductors. London: Sir
Pitman & sons, 1935.
SADOUL, G. El cine de Dziga Vertov. Tradução de Jaime Goded. México: Ediciones Era,
1973.
SEXTON, J. The audio-visual rhythms of modernity: Song of Ceylon, sound and documentary
filmmaking. Scope, p. 1-10, May 2004.
177
______. Excavating authenticity: surveying the Indie-rock doc. In: ROGERS, H. (Ed.). Music and
sound in documentary film. New York: Routledge, 2015. p. 151-165.
SCHLINGENSIEPEN, M. Berlin – Die Sinfonie der Groβstadt für Orchester Auf der Basis des
Klavierauszuges der Original-Musik Edmund Meisels. Berlim: Ries & Erler, 1987.
SMIRNOV, A. Sound in Z: experiments in sound and electronic music in early 20th-century

Russia. London: Koenig Books & Sound and Music, 2013.
STOLLERY, M. The newsreel commentator, the actor, the intellectual, and the broadcaster:
celebrity and personality voices in classic British documentary. Celebrity Studies, v. 4, n.
2, p. 202-218, 2013.
TARKOVSKI, A. Esculpir o tempo. 2. ed. São Paulo: Martins Fontes, 1998.
TEXEIRA, F. Documentário moderno. In: MASCARELLO, F. (Org.). História do cinema

mundial. 3. ed. Campinas: Papirus, 2008. p. 253-287.
THE FACE of Britain. Sight and Sound, v. 4, n. 13, p. 126-127, spring 1935.
THOMPSON, J. R. Documentary ﬁlms. Sight and Sound, v. 4, n. 14, p. 74-75, summer 1935.
VESSELO, A. Night mail. Sight and Sound, v. 5, n. 17, p. 28-29, spring 1936.
VERTOV, D. Artículos, Proyectos y Diarios de Trabajo. Tradução: Victor Goldstein. Buenos Aires:
Ediciones de la Flor, 1974.
WEIS, E.; BELTON, J. (Ed.). Film sound: theory and practice. New York: Columbia University Press,
1985.
WELLER, F. O som no documentário clássico: as tecnologias da intimidade na escola britânica.

Doc On-line, n. 15, p. 319-358, dez. 2013.
WIDGERY, C. The kinetic and temporal interaction of music and film: three documentaries of
1930’s America. 1990. 471 p. Tese (Doutorado)–University of Maryland, College Park, 1990.
WINSTON, B. The documentary film as scientific inscription. In: RENOV, M. Theorizing

documentary. New York: Routledge, 1993. p. 37-57.
WINTER, M. The function of music in sound film. The musical quarterly, v. 27, n. 2, p. 146-164,
Apr. 1941.
WOLFE, C. Historicising the “voice of God”: the place of vocal narration in classical documentary.
Film History, v. 9, p. 149-167, 1997.
178
WRIGHT, B. Shipyard. Cinema Quarterly, v. 3, n. 3, p. 177-178, spring 1935.
WRIGHT, B.; BRAUN, V. Manifesto: dialogue on sound. In: WEIS, E.; BELTON, J. (Ed.). Film
sound: theory and practice. New York: Columbia University Press, 1985 [1934]. p. 96-97.
ZAMECNIK, J. S. Sam Fox moving picture music. Volume 2. New York: Sam Fox Publishing
Corporation, 1913.
179
180
Filmes citados
Nanook of the North (1922) de Robert Flaherty
Lichtspeil Opus I – IV (1921-1925) de Walther Ruttmann
Moana (1925) de Robert Flaherty
Grass: a nation’s battle of life (1925) de Ernest B. Schoedscak e Merian C. Cooper
A sexta parte do mundo (1926) de Dziga Vertov
Rien que les heures (1926) de Alberto Cavalcanti
Un tour au large (1926) de Jean Grémillon
The jazz singer (1927) de Alan Crosland
Chang: a drama of the wilderness (1927) de Ernest B. Schoedscak e Merian C. Cooper
Berlim: sinfonia de uma metrópole (1927) de Walther Ruttmann
The Bridge (1927) de Joris Ivens
A chuva (1929) de Joris Ivens
Melodia do mundo (1929) de Walther Ruttmann
O homem com a câmera (1929) de Dziga Vertov
À propos de Nice (1930) de Jean Vigo
The plan of the great Works (1930) de Abram Room
Entusiasmo (1930) de Dziga Vertov
Weekend (1930) de Walther Ruttmann
Plants of the underworld (1930) de autor desconhecido
Philips radio (Industrial Symphony) (1931) de Joris Ivens
In der Nacht (1931) de Walther Ruttmann
181
Kuhle Wampe (1932) de Slatan Dudow
O’er Hill and Dale (1932) de Basil Wright
Upstream (1932) de Arthur Elton
Song of heroes (1932) de Joris Ivens
Secrets of Nature (1922-1933) de vários autores
Industrial Britain (1933) de John Grierson e Robert Flaherty
The oil symphony (1933) de Boris Pumpiansky
King Kong (1933) de Ernest B. Schoedscak e Merian C. Cooper
Cable Ship (1933) de Stuart Legg
Under the city (1934) de Alexander Shaw
Pett and Pott (1934) de Alberto Cavalcanti
Os pescadores de Aran (1934) de Robert Flaherty
Song of Ceylon (1934) de Basil Wright
New Earth (1934) de Joris Ivens
6.30 Collection (1934) de Edgar Anstey
Shipyard (1935) de Paul Rotha
The voice of Britain (1935) de Stuart Legg
The King’s stamp (1935) de William Coldstream
Coal face (1935) de Alberto Cavalcanti
Housing problems (1935) de Arthur Elton e E. H. Anstey
Triunfo da vontade (1935) de Leni Riefenstahl
Face of Britain (1935) de Paul Rotha
The way to the sea (1936) de Paul Rotha
182
Night mail (1936) de Harry Watt e Basil Wright
People of Britain (1936) de Paul Rotha
The plow that broke the plains (1936) de Pare Lorentz
Terra sem pão (1933-1937) de Luis Buñuel
Spanish Earth (1937) de Joris Ivens
The river (1937) de Pare Lorentz
Children at school (1937) de Basil Wright
Pedra fundamental do edifício do Ministério de Educação e Saúde (1937) de Humberto Mauro
North sea (1938) de Harry Watt
Olympia (1938) de Leni Riefenstahl
People of the Cumberland (1938) de Sidney Meyers e Jay Leyda
The City (1939) de Ralph Steiner e Willard Van Dyke
White flood (1940) de Lionel Berman, David Wolff e Robert Stebbins
Valley Town (1940) de Willard Van Dyke
Power and the Land (1940) de Joris Ivens
London can take it (1940) de Humphrey Jennings
Target for tonight (1941) de Harry Watt e Basil Wright
The Forgotten Village (1941) de Hebert Kline
The land (1941) de Robert Flaherty
A place to live (1941) de Irving Lerner
Merchant Seamen (1942) de Jack Holmes
Kazakhstan for the Front (1942) de Dziga Vertov
183
Listen to Britain (1942) de Humphrey Jennings e Stewart McAllister
Native land (1942) de Leo Hurwitz e Paul Strand
The Battle of Midway (1942) de John Ford
Child went forth (1942) de Joseph Losey e John Ferno
Close quarters (1943) de Jack Lee
Desert victory (1943) de Roy Boulting
The Battle of San Pietro (1944) de John Huston
Tunisian victory (1944) de Frank Capra e Hugh Stewart
In the Mountains of Ala-Tau (1944) de Dziga vertov
V. 1 (1944) de Humphrey Jennings
Burma victory (1945) de Roy Boulting
Journey Together (1945) de John Boulting
The Cummington story (1945) de Helen Grayson e Larry Madison
True glory (1945) de Garson Kanin e Carol Reed
Why we fight (1942-1945) de Frank Capra
A diary for Timothy (1946) de Humphrey Jennings
Farrebique (1946) de Georges Rouquier
Britain Can Make It (1946) de Francis Gysin
Theirs is the Glory (1946) de Brian Desmond Hurst e Terence Young
A plan to work on (1948) de Kay Mander
Louisiana story (1948) de Robert Flaherty
Mining review 2nd year Nº 11 (1949) de Peter Pickering
Transport (1950) de Peter Bradford
184
From the ground up (1950) da Crown Film Unit (sem crédito para diretor)
The undefeated (1950) de Paul Dickson
Hôtel des invalides (1952) de Georges Franju
Noite e neblina (1955) de Alain Resnais
Planeta proibido (1955) de Fred M. Wilcox
Mamma don’t allow (1956) de Karel Reisz e Tony Richardson
La seine a rencontré Paris (1957) de Joris Ivens
The days before Christmas (1958) de Stanley Jackson, Wolf Koenig, Terrence McCartney Filgate
Eu, um negro (1958) de Jean Rouch
A pirâmide humana (1959) de Jean Rouch
Jazz on a summer’s day (1959) de Bert Stern
The Back-breaking Leaf (1959) de Terrence McCartney Filgate
We are the Lambeth boys (1959) de Karel Reisz
March to Aldermaston (1959), creditado posteriormente a Karel Reisz e Lindsay

Anderson
Primárias (1960) de Robert Drew
Crônica de um verão (1960) de Jean Rouch
Lonely boy (1961) de Roman Kroiter e Wolf Koenig
Pour la suite du monde (1962) de Pierre Perrault
Valparaíso (1962) de Joris Ivens
Happy mother’s day (1963) de Richard Leacock e Joyce Chopra
Crises: behind a presidential commitment (1963) de Robert Drew
The Beatles USA (1964) de Albert Maysles, David Maysles e Charlotte M. Zwerin
185
Meet Marlon Brando (1966) de Albert Maysles, David Maysles e Charlotte M. Zwerin
Don’t look back (1967) de D. A. Pennebaker
Titicut Follies (1967) de Frederick Wiseman
Warrendale (1967) de Allan King
Le règne du jour (1967) de Pierre Perrault
Salesman (1968) de Albert Maysles, David Maysles e Charlotte M. Zwerin
Monterey pop (1968) de D.A. Pennebaker
Les voitures d’eau (1968) de Pierre Perrault
Woodstock (1969) de Michael Wadleigh
Gimme shelter (1970) de Albert Maysles, David Maysles e Charlotte M. Zwerin
Tubarão (1975) de Steven Spielberg
Koyaanisqatsi (1983) de Godfrey Reggio
Leviathan (2012) de Verena Paravel
186
Anexo I: Script musical de Dziga Vertov para o filme O homem com a câmera
O arquivo foi enviado por Ken Winokur, percussionista e membro fundador da Alloy
Orchestra. A versão que segue é uma tradução para o inglês.
187
188
189
190
191
192

O Som No Documentário - Renan P. Chaves

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

O Som No Documentário - Renan P. Chaves

Enviado por

Direitos autorais:

Formatos disponíveis

Renan Paiva Chaves

O som no documentário: a trilha sonora e suas transformações nos principais movimentos e

Renan Paiva Chaves

O som no documentário: a trilha sonora e suas transformações nos principais movimentos e

Dissertação de Mestrado apresentada ao Instituto

Orientador: Prof. Dr. Claudiney Rodrigues

Este exemplar corresponde à versão final da

Nossa pesquisa dedica-se à trilha sonora do cinema documentário. Nossa abordagem

O campo de debate sobre o cinema documentário encontrou um novo fôlego a partir

Os indícios do processo de consolidação do formato sonoro no cinema não ficcional

Figura 1 – Sumário do volume 2 da antologia Sam Fox moving picture music

Fonte: Zamecnik (1913).

Tomando por base as definições de imagem-câmera, imagem animada e circunstância

Figura 2 – Representação gráfica de sons

Fonte: Popper (1933, p. 84).

Figura 3 – Representação gráfica de sons de Arseny Avraamov

Fonte: Smirnov (2013, p. 179).

3.1 As vozes no documentário clássico: para além da “voz de Deus”

‘Voice of God’: the place of vocal narration in classical documentary” (1997).

3.1.2 A voz visível

As vozes que estão ancoradas na imagem, na presença de um referente visual que se

3.2 As vozes no documentário moderno: para além do sincronismo portátil

Neste momento, fujo rapidamente da abordagem fenomenológica debitária aqui

John Cassavetes (DELEUZE, 1990, p. 179-188).

A motivação principal da análise que segue encontra-se na vontade de compreender

Eu, um negro: a indiscernibilidade entre o real e o fictício das vozes

Eu, um negro é um filme que trabalha essencialmente com som pós-produzido em

A pirâmide humana: entre o som pós-produzido e o direto sincronizado portátil – novos

As regras do jogo em A pirâmide humana são semelhantes às de Eu, um negro. No

Crônica de um verão: articulação e liberdade das imagens e das vozes

Breves considerações sobre a análise dos três filmes

3.2.2.1 Diferentes maneiras da voz se fazer presente no cinema direto

A fronteira conceitual entre a música e os outros elementos sonoros no documentário

4.1 A (falsa) polêmica da presença da música no documentário

Ao falar de música no documentário é difícil escapar de debates que trazem à tona a

4.2 As sinfonias metropolitanas, sua música e a metáfora sinfônico-musical

A dimensão autoral do som no documentário dá seus primeiros passos com as sinfonias

Fonte: Deutsche Kinemathek (<http://www.deutsche-kinemathek.de/>).

Fonte: Deutsche Kinemathek (<http://www.deutsche-kinemathek.de/>).

Tal como no domínio ficcional, a música no documentário teve como grande

5.1 A indiscernibilidade entre as pistas de música, voz e ruídos no documentário do período

Fonte: Reed (1987, ex. 26).

Figura 7 – Partitura de Benjamin Britten para Coal face

Fonte: Reed (1987, ex. 24).

Fonte: Reed (1987, ex. 23).

Fonte: Reed (1987, ex. 26).

Fonte: The British Library (<http://www.bl.uk>).

Fonte: The British Library (<http://www.bl.uk>).

Fonte: The British Library (<http://www.bl.uk>).

Fonte: MacKay (2015, p. 8).

Figura 14 – Partitura de Entusiasmo

Fonte: MacKay (2015, p. 8).

Fonte: Film Museum (<http://www.filmmuseum.at>).

5.2 Os ruídos no documentário

Para além das pistas de música e voz (e da discussão sobre as indiscernibilidades),

Fonte: Cameron (1947, p. 78).

Se lidarmos com ideias de realidade e objetividade, palavras sempre resgatadas quando

Quando iniciamos a pesquisa, carregávamos alguns questionamentos, que mesmo

ANDERSON, C.; BENSON, T. Documentary dilemmas: Frederick Wiseman’s Titicut follies.

BENYON, G. Musical presentation of motion pictures. New York: Schirmer, 1921.

BRUZZI, S. New documentary: a critical introduction. London: Routledge, 2000.

CARRASCO, C. Trilha musical: música e articulação fílmica. 1993. 190 p. Dissertação

CAVALCANTI, A. Filme e realidade. 2. ed. rev. Rio de Janeiro: CEB, 1957.