Você está na página 1de 270

ÍNDICE:

O que Vamos Estudar? __________________________________________________1


Descrição Estatística de um Sistema Discreto________________________________21
Descrição Estatística de um Sistema Contínuo _______________________________45
Modelos Quânticos ____________________________________________________73
Formando um Sólido___________________________________________________91
Sólidos Cristalinos____________________________________________________117
Ideias Básicas da Física Estatística _______________________________________141
Sólidos Magnéticos ___________________________________________________167
Calor Específico de Sólidos_____________________________________________197
Gás Ideal Monoatômico no Regime Clássico _______________________________221
Potencial Químico e Equilíbrio Difuso____________________________________235
O Gás Ideal Quântico _________________________________________________249
O Gás Ideal de Elétrons________________________________________________263
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Aula 1 - O que vamos estudar


19 de Janeiro de 2015

Meta
Apresentar aspectos gerais do conteúdo da disciplina e mostrar sua
relevância às aplicações tecnológicas atuais.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Reconhecer e descrever as aplicações da Fı́sica Estatı́stica e da Fı́sica


da Matéria Condensada.

2. Reconhecer e aplicar os conceitos de média, densidade e concentração


relacionando-os a valores de grandezas macroscópicas.

3. Identificar escalas de tempo, comprimento e energia associadas a alguns


sistemas fı́sicos.

Pré-requisitos
Esta aula requer que você esteja familiarizado com os conceitos de Teo-
ria Cinética dos Gases apresentados na Aula 7 de Fı́sica 2A e com as equações
de Boyle e Gay-Lussac (ou Charles) apresentadas na Aula 8 dessa disciplina.

Introdução
Entender os mecanismos responsáveis pelas propriedades dos materiais
é um dos objetivos básicos da Fı́sica da Matéria Condensada. Saber, por
exemplo, por que o vidro da janela é transparente à luz visı́vel, enquanto
que uma folha de alumı́nio (dessas que se usa na cozinha) não é. Ao mesmo

1 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

tempo, por que o alumı́nio é maleável e o vidro quebradiço? Ou ainda, por


que o cobre conduz bem a eletricidade, graças a isso o usamos na fabricação
de fios elétricos, enquanto que o plástico que reveste esses fios é um isolante
elétrico? Por que alguns materiais são magnéticos (os ı́mãs, que usamos em
tantos dispositivos) e outros não?
Interessa-nos também entender como e por que as propriedades dos
materiais se alteram quando, por exemplo, os aquecemos ou os esfriamos. O
estudo do comportamento térmico de sistemas macroscópicos é realizado pela
Termodinâmica. Você já aprendeu um pouco desse assunto em Fı́sica II-A.
Aqui queremos, a partir do conhecimento dos átomos individuais, encontrar
o comportamento térmico de um sistema macroscópico, ou seja, composto
por um número gigantesco desses átomos. Para tal usaremos uma descrição
estatistica do conjunto de partı́culas. As grandezas macroscópicas serão as-
sociadas a médias sobre diversas configurações possı́veis do sistema. A Fı́sica
Estatı́stica é a parte da Fı́sica dedicada a esse tipo de cálculo. Partimos do
conhecimento da energia de cada partı́cula, usando a Mecânica Quântica, e
obtemos o comportamento macroscópico a partir do cálculo da probabilidade
de cada possı́vel configuração do sistema. Embora atualmente a Fı́sica Es-
tatı́stica tenha aplicações muito amplas, por exemplo em biologia e economia,
sua principal aplicação é o entendimento do comportamento de materiais,
tendo uma relação muito forte com a Fı́sica da Matéria Condensada. Por
esta razão estamos apresentando os dois assuntos numa única disciplina.

Os materiais que encontramos na natureza


É interessante notar que a grande variedade de materiais que encon-
tramos em nosso meio ambiente é basicamente constituı́da por algumas deze-
nas de substâncias, que denominamos elementos quı́micos. Hoje conhecemos
117 desses elementos, dos quais somente os primeiros 94 (e possivelmente
o Califórnio, número atômico 98) ocorrem naturalmente. Os demais foram
produzidos artificialmente em laboratório. Mas, dentre esses 94, muitos são
extremamente raros na crosta terrestre, de modo que grande parte dos ma-
teriais com os quais lidamos são de fato constituı́dos por um número bem
menor de elementos quı́micos. Estes podem ser combinados formando uma
diversidade de compostos ou ligas. Um bom exemplo é o ferro. Quando
adicionamos a ele um pouco de carbono, algo entre 0,02 e 2,0 % em peso,
obtemos diferentes tipos de aço. E se a este adicionamos dois outros metais,

CEDERJ 2
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

o nı́quel e o cromo, obtemos o aço inoxidável. Um dos aspectos em que o


aço difere do ferro é sua maior dureza, o que em muitas situações representa
uma clara vantagem. Já o aço inoxidável difere do aço comum por não enfer-
rujar (não se oxida), bem como em relação a outras propriedades mecânicas,
elétricas e magnéticas.
Ao longo do tempo, a Humanidade foi aprendendo a trabalhar os mate-
riais, combinando-os e submetendo-os a tratamentos diversos (por exemplo,
térmicos e mecânicos) de modo a obter matéria prima para fabricação de
utensı́lios domésticos, armas, instrumentos de trabalho diversos, como fer-
ramentas e máquinas, etc. O conhecimento que se adquiriu através desse
processo era fundamentalmente empı́rico, isto é, vinha da experiência. Mas
não era suficiente para dar resposta a muitas perguntas, como por exemplo,
por que um material é magnético e outro não, por que um é condutor e outro
isolante, por que um é transparente e outro opaco à luz visı́vel, etc.

Box de curiosidade
Mencionamos as ligas de ferro, mas há muitas outras de igual importância.
Um exemplo são as ligas de cobre. Este, quando combinado com o zinco
em percentagens que vão de 2 a 45 %, produz o latão, de uso amplo em
utensı́lios domésticos, parafusos e fios elétricos. Já a adição de cerca de 12%
de estanho ao cobre produz o bronze, um material que não só é largamente
utilizado até os dias de hoje (por exemplo, na fabricação de ferramentas), mas
também marcou o inı́cio de uma importante fase na história da Humanidade
- a Idade do Bronze. A história de como a Humanidade aprendeu a fazer uso
dos materiais que encontramos na natureza, muitas vezes combinando-os de
modo a atender necessidades especı́ficas, é fascinante. Ela começa há cerca
de 1,8 milhões de anos, quando o Homo Habilis, um hominı́deo que viveu no
perı́odo entre 2,6 a 1,4 milhões de anos atrás, começou a utilizar pedras na
produção de instrumentos para diversos usos, particularmente para a caça.
Todavia, um avanço realmente marcante ocorreu há cerca de 5,5 mil anos,
quando os primeiros utensı́lios de bronze foram fabricados na região hoje
correspondente ao Irã e Iraque. A importância desse fato é que, para pro-
duzir o bronze, o ser humano teve que aprender a extrair o cobre e o estanho
das rochas (por aquecimento) e combiná-los, o que representa as primeiras
atividades em metalurgia desenvolvidas pela Humanidade. Esse fato também
representa o inı́cio de um processo através do qual o ser humano torna-se pro-
gressivamente capaz de intervir na natureza, manipulando seus elementos de

3 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

modo a obter novos materiais, com os quais novos utensı́lios e instrumentos


puderam ser produzidos. Processo esse que nos dias de hoje, graças ao ad-
mirável desenvolvimento cientı́fico ocorrido desde o inı́cio do século passado,
atinge nı́veis que há algumas décadas não eram sequer imaginados.
Fim do box de curiosidade

O desenvolvimento da Fı́sica da Matéria Con-


densada e sua importância
Uma etapa muito importante no esforço que a Humanidade vem desen-
volvendo no sentido de entender a natureza foi compreender que os materiais
presentes em nosso meio ambiente são constituı́dos por átomos. Richard
Feynman, um dos mais importantes fı́sicos do século XX, disse certa vez
[1]:“Se, por algum cataclismo, todo o conhecimento cientı́fico viesse a ser
destruı́do e somente uma frase pudesse ser transmitida à próxima geração
de criaturas, que afirmação conteria mais informações em menos palavras?
Acredito que seria a hipótese atômica (ou o fato atômico, se você quiser
chamá-lo assim) de que todas as coisas são feitas de átomos - pequenas
partı́culas em movimento perpétuo, atraindo umas às outras quando estão
separadas por uma pequena distância, mas repelindo-se quando comprimidas
umas contra as outras”.
As palavras de Feynman traduzem bem o significado da chamada Teoria
Atômica. Com base nela, torna-se possı́vel entender os mecanismos responsá-
veis pelas propriedades dos materiais, a partir do comportamento dos átomos
que os compõem. Todavia, avanços nesse sentido só se tornaram possı́veis
com o advento da Mecânica Quântica, nas primeiras décadas do século XX.
Como você bem sabe, a aplicação das leis da Fı́sica Clássica a partı́culas
como os átomos e seus constituintes conduz a uma série de resultados em
conflito com a experiência. Assim, foi somente a partir dos últimos anos da
década de 1920, quando a Mecânica Quântica se consolidou, que a Fı́sica da
Matéria Condensada se desenvolveu, permitindo estabelecer relações entre
as propriedades fı́sicas de um material e sua estrutura no nı́vel atômico. Os
resultados das pesquisas que ao longo dos anos vêm sendo conduzidas por
diversos grupos de investigação em todo o mundo, tanto no campo teórico
quanto no experimental, têm tornado possı́vel explicar e prever o comporta-
mento dos materiais sob diversas condições. E o progresso alcançado nessa
área tem repercutido em várias outras, como Ciência dos Materiais, Quı́mica,

CEDERJ 4
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Biologia, Telecomunicações, Transporte e Energia. É importante mencionar


que o entendimento dos mecanismos responsáveis pelas propriedades dos ma-
teriais abre para nós uma perspectiva absolutamente fantástica: a de intervir
nesses mecanismos, alterando assim tais propriedades. Atualmente podemos
ir ainda mais longe, criando materiais artificialmente estruturados, com di-
mensões e composição controladas na escala atômica! Os avanços na Fı́sica
da Matéria Condensada vêm ocorrendo em ritmo crescente e têm propici-
ado o acelerado desenvolvimento tecnológico que assistimos desde meados do
século XX.
Até aqui demos especial ênfase às contribuições da Fı́sica ao desen-
volvimento tecnológico, mas a Fı́sica da Matéria Condensada é também uma
área de pesquisa extremamente interessante sob o ponto de vista de Ciência
Básica. E é, sem dúvida, uma das mais ativas. Ela reúne o maior contingente
de fı́sicos em todos os paı́ses e já foi contemplada com muitos Prêmios Nobel.
E por que o interesse cientı́fico é tão grande? Bem, em geral os sistemas que
ela estuda são constituı́dos por um número muito grande de partı́culas que
interagem entre si e isto dá origem a fenômenos extremamente curiosos e,
algumas vezes, verdadeiramente surpreendentes. Assim foi a descoberta da
supercondutividade, ocorrida no inı́cio do século XX, para dar um exemplo.
Mas também de diversos outros, dos quais trataremos mais adiante.

Um pouco da história da Fı́sica Estatı́stica


A partir do momento em que entendemos a matéria como constituı́da
por átomos, passamos a lidar com um número gigantesco de variáveis para
descrever o sistema. Por exemplo, num volume macroscópico o número de
moléculas de um gás, N, é da ordem do número de Avogadro (NA ), ou
seja, N ∼ 1023 . Qualquer tentativa de entender o comportamento desse
sistema através do conhecimento da posição e da velocidade de cada molécula
será infrutı́fera. Mesmo se conseguı́ssemos ter acesso a todos esses dados, a
qualquer instante de tempo, eles seriam inúteis para responder às perguntas
que geralmente são feitas sobre um sistema como esse, basicamente: quais
são seus valores de pressão, densidade e temperatura. Para conhecer essas
grandezas a partir dos dados atômicos precisamos de alguma forma relacionar
grandezas definidas no nı́vel atômico (como posição e momento linear de cada
átomo) com grandezas macroscópicas (tais como pressão e temperatura do
sistema como um todo).

5 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

A primeira tentativa de descrição microscópica de um sistema macros-


cópico foi feita através Teoria Cinética. Na Aula 7 de Fı́sica 2A você viu a
determinação cinética da pressão de um gás ideal e a sua relação com a lei de
Boyle. Praticamente todas as idéias que serão trabalhadas nas próximas aulas
estão presentes no modelo cinético do gás ideal. Em primeiro lugar temos
um sistema que contém um número elevadı́ssimo de partı́culas. Neste caso o
sistema é um gás de baixa densidade, contido num recipiente macroscópico
de volume V . Através de hipóteses simplificadoras sobre o comportamento
microscópico das moléculas, a teoria cinética possibilita relacionar a pressão
P , que é uma grandeza macroscópica, com as velocidades moleculares ~ui ,
i = 1, 2, . . . N, através do valor médio, hu2 i, do quadrado da velocidade
como:
1
P ≡ ρhu2 i , (1.1)
3
sendo
N
1 X 2
hu2 i ≡ u (1.2)
N i=1 i
e ρ, a densidade volumétrica. Finalmente, a conexão com a temperatu-
ra (outra grandeza macroscópica) pode ser feita a partir de observações
empı́ricas, tais como a lei de Boyle (P V = constante), ou a lei de Gay-
Lussac ou Charles (V/T = constante). Com esse procedimento começamos
com uma visão microscópica, dada pelos valores de 6N variáveis (valores de
ux , uy , uz , x, y e z de cada molécula), e chegamos à macroscópica, com 3
variáveis: P , V e T . O processo de redução dimensional envolveu o cálculo
de valores médios para descrever o conjunto de moléculas.
Podemos considerar que a publicação do livro Hidrodinâmica por Ber-
noulli em 1738 como o inı́cio da Teoria Cinética. Nesse trabalho o fluido
é descrito por grandezas macroscópicas tais como pressão e densidade obti-
das através de médias calculadas a partir das propriedades moleculares. Nos
anos seguintes vários cientistas usaram esse método para obter a descrição
macroscópica de diversos sistemas. A Termodinâmica, que lida apenas com
grandezas macroscópicas, surgiu naturalmente para fundamentar uma série
de observações experimentais, estendendo o princı́pio de conservação de en-
ergia da Mecânica para englobar o calor como forma de energia.

box de atenção: Para o melhor entendimento destes conceitos é importante


que você refaça os Exercı́cios 2, 3 e 4 da Aula 7 de Fı́sica 2A.
fim do box de atenção
No final do século XIX a Termodinâmica já podia ser considerada

CEDERJ 6
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

como uma teoria bem estabelecida. Através dela o comportamento térmico


de vários sistemas pôde ser compreendido no nı́vel macroscópico levando a
um grande desenvolvimento tecnológico. A possibilidade de construção de
máquinas térmicas e motores foi fundamental para o que hoje conhecemos
como Revolução Industrial.
Box de curiosidade
A Revolução Industrial consistiu em um conjunto de mudanças tecnológicas
com profundo impacto no processo produtivo em nı́vel econômico e social.
Iniciada na Inglaterra em meados do século XVIII, expandiu-se pelo mundo
a partir do século XIX. A Fı́sica desenvolvida nessa época teve um papel
fundamental no desenvolvimento de novas tecnologias. Especificamente, a
Termodinâmica permitiu que fossem construı́das máquinas térmicas mais
eficientes para uso direto no processo industrial, como os teares, ou para a
expansão dos meios de transporte, como o motor a vapor e o motor à com-
bustão interna.
fim do box de curiosidade

Um dos principais ingredientes da formulação matemática da Termodinâ-


mica são as variáveis de estado que, como o nome indica, descreve o estado
macroscópico do sistema. Alguns exemplos são: energia (E), entropia (S),
volume (V ), pressão (P ) e temperatura (T ). O arcabolço da Termodinâmica
é um conjunto de leis a serem obedecidas pelas variáveis de estado. Nor-
malmente parte-se de alguma relação empı́rica entre algumas variáveis de
estado e relações entre outras variáveis podem ser obtidas com o uso das leis
da Temodinâmica. O que falta na Termodinâmica é uma forma sistemática
de encontrar relações entre variáveis de estado a partir de princı́pios fun-
damentais da escala atômico. O objetivo principal da Fı́sica Estatı́stica é
justamente fazer essa conexão, obendo a descrição macroscópica de um sis-
tema fı́sico formado por um número muito grande de partı́culas, a partir do
conhecimento estatı́stico no nı́vel atômico.
Historicamente pode-se considerar a formulação do Teorema H por
Boltzmann em 1872 como o marco inicial da Fı́sica Estatı́stica. Nesse teo-
rema Boltzmann mostra que, enquanto um sistema relaxa para o equilı́brio,
é possı́vel definir-se uma função a função H, que nunca aumenta com o pas-
sar do tempo. A partir dessa função Boltzmann propôs uma definição de
entropia ligada ao grau de desordem do sistema e compatibilizou o princı́pio
do aumento da entropia, existente na Termodinâmica, com a visão estatı́stica
de um sistema fı́sico. Em poucas palavras, Boltzmann mostrou que um sis-

7 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

tema que evolui no tempo, com energia constante, encontra seu equilı́brio
na configuração mais desordenada, que é, como veremos, também a mais
provável. Nessa época a Mecânica Quântica ainda não havia sido formu-
lada, e todo o desenvolvimento inicial da FE foi feito através da descrição
clássica do movimento das partı́culas. Assim, havia uma série de resultados
que conflitavam com observações experimentais, especialmente com relação
ao comportamento a baixas temperaturas.
Foi exatamente na tentativa de descrever a radiação térmica por Planck,
em 1901, que surgiu a idéia de que a energia da radiação eletromagnética
emitida pelos átomos nas paredes de uma cavidade deveria ser quantizada,
e não contı́nua. O modelo proposto por Planck é considerado como o inı́cio
da Mecânica Quântica. À medida que a descrição quântica passou a ser u-
sada, a excelente concordância entre as previsões da Fı́sica Estatı́stica e as
observações experimentais consagraram a teoria.

box de curiosidade:
Ludwig Eduard Boltzmann (Viena, 20 de
Fevereiro de 1844 - Duino-Aurisina, 5 de
Setembro de 1906) foi um fı́sico austrı́aco,
conhecido pelo seu trabalho no campo da ter-
modinâmica estatı́stica. É considerado junto
com Josiah Willard Gibbs e James Clerk
Maxwell como o fundador da Mecânica Es-
tatı́stica. Foi defensor da teoria atômica,
numa época em que esta era bem contro-
versa.
Em 1863 iniciou os seus estudos em fı́sica na universidade de Viena e em 1866
terminou o seu doutoramento na mesma universidade com uma tese sobre
teoria cinética de gases sob a supervisão de Joseph Stefan. No ano seguinte
foi nomeado docente nesta universidade e em 1869 professor na universidade
de Graz. Em 1871 ele visitou Gustav Kirchhoff e Hermann von Helmholtz em
Berlim. Em 1872 ele conheceu Henriette von Aigentler em Graz, enquanto
ela tentava ser admitida extra-oficialmente a assistir a aulas de matemática
e fı́sica na Universidade de Graz numa época em que a entrada de mulhe-
res não era permitida. Seguindo os conselhos de Boltzmann, ela finalmente
conseguiu-o. Em 1873 ele voltou à Universidade de Viena, depois de aı́ ser
nomeado professor de matemática, onde permaneceu até 1876. Boltzmann e
Henriette casaram-se a 17 de Julho de 1876 e do seu casamento nasceram 3
filhas e 2 filhos. Em 1876 ele foi nomeado professor de fı́sica experimental na

CEDERJ 8
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Universidade de Graz. Entre os seus alunos nesta universidade encontravam-


se Svante Arrhenius e Walther Nernst. Em Graz Boltzmann viveu 12 anos
felizes em que desenvolveu os seus conceitos estatı́sticos da natureza. Em
1885 ele é nomeado membro da Academia de Ciências imperial austrı́aca e
em 1887 é eleito presidente da universidade de Graz.
Em 1890 ele foi nomeado como professor de fı́sica teórica na Universi-
dade de Munique, mas em 1893 ele volta a Viena ao ser nomeado sucessor
do seu orientador Joseph Stefan na cátedra de fı́sica teórica dessa universi-
dade. Em Viena ele tem conflitos com alguns dos seus colegas, em particular
com Ernst Mach que foi nomeado professor de filosofia e história das ciências
desta universidade em 1895. Por isso em 1900 Boltzmann mudou-se para
a universidade de Leipzig. No entanto em 1902 Mach reformou-se devido a
problemas de saúde e Boltzmann volta a Viena. Nesta universidade ele teve
como estudantes a Paul Ehrenfest e Lise Meitner. Em Viena, além de fı́sica,
Boltzmann também ensinou filosofia e as suas aulas eram tão populares que
apesar de as dar no maior auditório da universidade e havia pessoas que não
conseguiam lugar a dentro.
Boltzmann sofria de enorme instabilidade emocional, alternando fases
de depressão com outras de enorme excitação ou irritação e pensa-se que
sofria muito provavelmente de distúrbio bipolar. Lise Meitner afirmou que as
pessoas mais próximas dele conheciam os seus ataques de depressão profunda
e as suas tentativas de suicı́dio. Em 5 de Setembro de 1906, enquanto passava
as férias de Verão em Duino, próximo de Trieste, Boltzmann cometeu suicı́dio
num ataque de depressão. Ele foi enterrado em Viena e na sua tumba está
escrita a famosa equação da fı́sica estatı́stica: S = κ ln Ω. Veremos mais
sobre essa definição de entropia na Aula 7.
Referência: Wikipedia
fim do box de curiosidade

Inicialmente criada para o estudo de sistemas fı́sicos, a abrangência


de sua formulação estendeu a aplicabilidade da Fı́sica Estatistica a outras
áreas, como biologia e economia, no final do século XX. Em poucas palavras,
a Fı́sica Estatı́stica fornece um mecanismo sistemático para o cálculo das
probabilidades de ocorrência de configurações microscópicas, como veremos
na Aula 7. Nesse cálculo os ingredientes principais são a energia e a temper-
atura. A Fı́sica Estatı́stica combina o princı́pio de minimização da energia
da Mecânica com a maximização da entropia, princı́pio proveniente da Ter-
modinâmica através da Segunda Lei. O estado de equilı́brio de um sistema é

9 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

determinado por esses dois processos de extremização, sendo a minimização


de energia dominante a baixas temperaturas e a maximização da entropia, a
altas temperaturas.

Medidas, densidade e flutuações

A relação entre as descrições atômica e macroscópica sempre é feita


através do cálculo de algum tipo de média tomada sobre um número muito
grande de partı́culas. É importante que, em qualquer manipulação matemáti-
ca referente a grandezas macroscópicas, um elemento infinitesimal de volume
seja grande suficiente para conter um número muito grande de partı́culas.
Ainda assim ele deve ser infinitesimal, quando comparado a qualquer volume
macroscópico. A enorme diferença entre as escalas de tamanho permite que
esse cálculo tenha sentido: o valor da média é estável, não difere muito se
calculado sobre diferentes elementos de volume. Os conceitos de média e
densidade podem ser usados em qualquer sistema, não apenas os formados
por átomos e moléculas, basta que exista uma grande diferença de escalas.

Atividade 1
(Objetivo 2)
Veja a foto abaixo, que mostra vários grãos de arroz espalhados sobre uma
folha de papel. Como você faria para estimar o número de grãos nessa foto
usando o conceito de densidade?

CEDERJ 10
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

diagramador: deixar 5cm

Resposta comentada
Uma inspeção visual mostra que a densidade de grãos é razoavelmente ho-
mogênea, portanto, podemos contar quantos grãos estão num pequeno qua-
drado, e depois calcular a área total. Como definir o tamanho do quadrado?
Ele deve ser grande o suficiente para ter um número razoável de grãos, mas
não muito grande, porque queremos exatamente evitar ter que contar muitas
grãos. Se o quadrado for muito pequeno o número de grãos nele dependerá
muito de onde está colocado, o que levaria a uma dispersão enorme no valor
médio do número de grãos na dada área. Para vermos o efeito dessa escolha
vamos considerar quadrados com 1 cm de lado (linha clara) e área aA = 1
cm2 e com 2 cm de lado (linha escura) e área aB = 4 cm2 . Vamos posicionar
cada quadrado em 5 pontos distintos e contar quantos grãos estão dentro de
cada um. Imediatamente notamos a primeira dificuldade: como lidar com

11 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

grãos que estão parcialmente dentro do quadrado. Vamos estimar as frações


de grão nas bordas dos quadrados.
Comecemos com os quadrados menores, em linha clara. Chamando de
ni o número de grãos no i-ésimo quadrado temos:

n1 = 9 n2 = 11 n3 = 9 n4 = 12 n5 = 12

Calculamos o valor médio:


5
1X
hniA = ni = 10,6
5 i=1
e o desvio quadrático médio:
v
u 5
u1 X
σA = t (ni − hni)2 = 1,4
5 i=1

A grandeza σA é uma medida de quanto os valores inviduais são diferentes


entre si. Dizemos que σA é uma medida das flutuações do valor médio de
grãos. Como a1 é a área dos quadrados claros, calculamos a densidade su-
perficial, grandeza macroscópica de grãos, grandeza macroscópica, definida
como ρA ≡ hniA /aA . Neste caso ficamos com ρA = 10,6 grãos/ cm2. Pode-
mos calcular a flutuação nos valores de densidade: σρA = σA /aA = 1,4 grãos/
cm2. Isso significa que podem-se encontrar valores de densidade entre 9 e 12
grãos/ cm2, dependendo de onde a medida é tomada. A área total da foto é
103,8 cm2, portanto, a estimativa do número total de grãos é 914. Se outra
regra for usada na contagem dos grãos nas bordas, o resultado individual
para cada quadrado pode ser um pouco diferente.
Repetimos o procedimento usando os quadrados maiores, com aB = 4
2
cm . Neste caso encontramos:

n1 = 33 n2 = 32 n3 = 34 n4 = 36 n5 = 37 .

Outras quantidades calculadas são: hniB = 34, 4, σB = 1,85 e ρB = 8,6


grãos/cm2 . A flutuação da densidade média é σρB = 8,6/4 = 0,46 grãos/
cm2. Neste caso o número total de gãos na foto é estimado em 893.
Uma grandeza muito importante é a flutuação relativa. Veja os valores
correspondentes às duas determinações:
σρA 1,4
= = 0,13 = 13%
ρA 10,6
σρB 0,46
= = 0,05 = 5%
ρB 8,6
Fim da atividade

CEDERJ 12
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Escalas de tempo, comprimento e energia


A conexão entre os mundos micro e macroscópico só é possı́vel porque
as escalas de tempo e distância caracterı́sticas das duas descrições são muito
diferentes. Qualquer medição ou observação macroscópica demora um tempo
extremamente longo em comparação aos tempos tı́picos de variações mi-
croscópicas. Podemos fazer algumas estimativas tomando como exemplo um
recipiente macroscópico contendo um mol de hélio à temperatura ambiente
e pressão atmosférica. Começamos por calcular o volume ocupado por 1 mol
de gás. Usamos a equação de estado do gás ideal, P V = nRT , com os dados
n = 1, nas CNPT, ou seja, T = 300 K, P = 105 Pa (≈ 1 atm). Assim,
obtemos:
nRT 1 × 8,314 J/(mol.K) × 300 K
V = = 5
= 24, 9 × 10−3 m3 = 24,9 l (1.3)
P 10 Pa
Com este resultado calculamos o volume médio ocupado por cada molécula
ou átomo, no caso dos gases monoatômicos:
V 24,9 × 10−3 m3 m3 nm3
v≡ = = 4,13 × 10−26
= 41,3 (1.4)
NA 6, 03 × 1023 átomos átomo átomo
Usamos o nanômetro (1 nm = 10−9 m) para escrever a resposta por se tratar
de uma unidade de comprimento mais adequada à escala atômica. Nessa
escala o angstron (1Å = 10−10 m) também é muito usado. Supondo uma
forma cúbica, esse valor de v corresponde a um cubo de 3,45 nm de lado.
Um átomo tem dimensões lineares da ordem de angstron, ou 10−1 nm, assim
vemos que há muito espaço vazio no gás.
Essa estimativa é a mesma para qualquer gás de átomos ou moléculas
nas mesmas pressão e temperatura, valendo também para o ar, por exemplo.
Não percebemos esses vazios nos gases porque eles se dão numa escala de
comprimento muito menor que a nossa. Nossa percepção macroscópica é a
de um gás de densidade homogênea igual à densidade média com relação
às variações microscópicas. Embora tenhamos usado o termo microscópico
em oposição a macroscópico, um sistema com dimensões da ordem de um
micrômetro (1 µm = 10−6 m) é bastante grande. Uma partı́cula sólida com
volume igual a 1µm3 tem cerca de 1011 átomos. Assim, continuamos a usar
o termo microscópico apenas por tradição pois o mais correto é a referir-se à
escala atômica ou nanoscópica.
Atividade 2
(Objetivos 2 e 3)
Estime o número de moléculas de água em um copo.

13 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

diagramador: deixar 5cm

Resposta comentada
Sabemos que um mol de uma substância contém 6,02 × 1023 moléculas ou
átomos da substância. A massa de um mol de água (H2O) é aproximada-
mente 18 gramas (já que a massa molar do oxigênio é aproximadamente 16 g
e a do hidrogênio, 1 g). Assim, 250 ml de água (um copo), à temperatura e
pressão ambientes, pesam cerca de 250 gramas (a densidade da água é aprox-
imadamente 1 g/cm3) e, portanto, contém cerca de (250/18) × 6,02 × 1023 =
8, 36 × 1024 moléculas.
fim da atividade

Atividade 3
(Objetivos 2 e 3)
A condutividade dos metais pode ser explicada por um modelo que conside-
ra um sólido metálico como um recipiente contendo um gás formado pelos
elétrons dos orbitais incompletos mais externos de cada átomo, os elétrons
de condução. Estime a concentração desse gás de elétrons no lı́tio, um metal
com um elétron de condução por átomo, massa molar m = 6,94 g e densi-
dade ρ = 535 kg/m3 . Compare com a concentração de átomos de hélio nas
condições ambientes.

diagramador: deixar 5cm

CEDERJ 14
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Resposta comentada
Para o gás de elétrons só importam os elétrons de condução, que são prati-
camente livres. Um mol de lı́tio tem NA = 6, 02 × 1023 átomos, portanto, o
mesmo número de elétrons. Precisamos agora calcular o volume de um mol.
Temos
m m 6,94 × 10−3 kg/mol
ρ= → V = = 3 = 1,30 × 10−5 m3 /mol .
V ρ 535 kg/m
A concentração é então:
NA 6,03 × 1023 elétrons/mol
φelétrons = = = 4,64 × 1028 elétrons/m3 . (1.5)
V 1,30 × 10−5 m3 /mol

A concentração do hélio nas CNPT pode ser calculada a partir de (1.4):


1 1 3
φHe = = = 2,42 × 1025 átomos/m . (1.6)
v 4,13 × 10−26 m3 átomos
Esta diferença de concentração nas CNPT implica que esses dois gases não
podem ser tratados com o mesmo modelo. Como veremos na Aula 14, o gás
de elétrons livres num metal é um gás essencialmente quântico à temperatura
ambiente.
fim da atividade
Atividade 4
(Objetivos 2 e 3)
Estime a velocidade das moléculas num gás.
diagramador: deixar 5cm

Resposta comentada
Vamos usar a expressão (1.1), para isso precisamos estimar a densidade de
um gás. Da equação de estado do gás ideal temos que a concentração molar
nas CNPT é
n P 105 N/m2
= = = 0,402 × 102 mol/m3 .
V RT (8,31 J/K.mol )(300 K)

15 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

Para o hélio, temos uma massa molar de 4 g, portanto ρHe ≈ 1,7 × 10−1
kg/m3 . No caso do argônio, com massa molar de 40 g, ρAr ≈ 1,7 kg/m3 .
Como estamos fazendo uma estimativa, podemos usar ρ ≈ 1 kg/m3. Esse é
um número interessante de se guardar. Veja que a água tem densidade 103
kg/m3 . Podemos considerar então esse um valor tı́pico para lı́quidos. Assim,
a densidade de um gás é tipicamente mil vezes menor que a de um lı́quido.
Considerando condições ambientes, temos
3P 3 × 105 Pa 2
hu2i = = 4
3 = 30 × 10 (m/s) . (1.7)
ρ 1 kg/m
p
Embora não seja igual à velocidade média, hu2 i em geral difere desse valor
por um fator da ordem da unidade, sendo, portanto, uma ótima estimativa
para a velocidade média.
Com essa aproximação o valor médio das velocidades moleculares é
p
hui ≈ hu2 i = 5,4 × 102 m/s = 1944 km/h . (1.8)

Assim, vemos que na escala atômica tudo é muito pequeno e rápido, em


comparação com nossos padrões macroscópicos.
fim da atividade

Agora vamos verificar as escalas de energia envolvidas. A unidade de energia


mais adequada para esse fim é o elétron-volt (eV), a energia de um elétron
num potencial de um volt. A relação com a unidade de energia no sistema
SI, o Joule, é:

1 eV = 1,60 × 10−19 J ou 1 J = 6,24 × 1018 eV . (1.9)

Começaremos calculando a energia cinética de um objeto macroscópico, uma


bola de tênis. A velocidade da bola num saque é aproximadamente 60 m/s,
e sua massa é cerca de 56 g. Portanto, sua energia cinética é
1 1
Ebola = mu2 = 56 × 10−3 kg (60 m/s)2 = 100, 8 J = 6,30 × 1020 eV .

2 2
(1.10)
O átomo de hélio no gás tem uma velocidade altı́ssima, muito maior que a
da bola de tênis, mas sua massa é muito pequena. A massa de um átomo
é essencialmente a do núcleo, que no caso do hélio equivale, com uma boa
aproximação à massa de dois prótons e dois nêutrons. Assim, a energia
cinética de um átomo de hélio no gás é:
1 1
EHe = mu2 = 4 × (1,67 × 10−27 kg)(5,4 × 102 m/s)2
2 2
= 97,4 × 10−23 J = 6,07 × 10−3 eV = 6,07 meV

CEDERJ 16
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Veremos mais adiante (Aula 7) que a energia de agitação térmica de uma


partı́cula, pode ser estimada pelo produto κT , sendo κ a constante de Boltz-
mann. Para temperatura ambiente, ET ≡ κT ≈ 0,025 eV.

Box de atenção: Revise a relação entre a energia cinética média e


temperatura, Eq. (7.17), Aula 7 de Fı́sica 2A.
fim do box de atenção

Comparando com os valores de energia calculados acima, vemos que


a energia da bola é muito maior do que sua energia térmica (ET  Ebola
ao passo o contrário ocorre com a energia cinética de um átomo de hélio
gasoso (ET  EHe ). Isto significa que o efeito da temperatura é irrelevante
para o movimento da bola de tênis, mas não para o comportamento dos
átomos de hélio no gás. Ou seja, o movimento do centro de massa da bola
é determinı́stico, podendo ser perfeitamente descrito pelas leis da Mecânica
Clássica, o mesmo não ocorrendo com o movimento de um átomo de hélio.

Conclusão
Podemos classificar fenômenos fı́sicos em termos de suas escalas de com-
primento, tempo e energia como macro ou microscópicos. Aos macroscópicos,
que são os observados por nós até mesmo sem o uso de equipamentos de me-
dida, estão associados comprimentos grandes, variações lentas e energias al-
tas, muito maiores que a energia térmica κT . A observação desses fenômenos
leva naturalmente à definição de variáveis macroscópicas, tais como pressão,
temperatura e densidade, que representam médias de grandezas atômicas
envolvendo um número gigantesco de partı́culas, tipicamente da ordem do
número de Avogrado. A escala microscópica, ou escala atômica, envolve
grandezas apropriadas para descrever movimentos muito rápidos de átomos
e moléculas que ocorrem com energias comparáveis à energia térmica κT . A
influência da energia térmica na escala atômica acaba afetando as grandezas
macroscópicas através do realização de médias.
Você viu que a importância do estudo da Fı́sica da Matéria Condensada
decorre, em grande medida, do fato de os conhecimentos nesta área terem
impacto direto em nossa experiência cotidiana, uma vez que aborda as pro-
priedades dos materiais com os quais usualmente lidamos. Outro ponto im-
portante é que Fı́sica da Matéria Condensada busca entender as propriedades

17 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

macroscópicas dos materiais a partir dos processos que ocorrem no nı́vel


atômico. Assim sendo, sua ferramenta básica é a Mecânica Quântica.

Atividade final
(Objetivos 2 e 3)
Se todas as moléculas de água em 1 g de água fossem distribuı́das uni-
formemente sobre a superfı́cie da Terra, qual seria a densidade superficial
de moléculas? Considere a Terra esférica com raio de 6,4 × 103 km.
diagramador: deixar 5 cm

Resposta comentada
Precisamos calcular o número N de moléculas em um grama e a área A da
superfı́cie da Terra. A molécula de água tem dois hidrogênios e um oxigênio,
portanto tem uma massa molar de 18 g. Um mol tem, portanto, 1/18 de
grama, ou seja,
6,03 × 1023 molécula/mol
N = = 3,35 × 1022 moléculas/g
18 g/mol
A área da superfı́cie da Terra é

A = 4π(6,4 km)2 = 515 km2

Espalhando as moléculas uniformemente terı́amos a concentração


N 3,35 × 1022 moléculas
φs = = 2 = 6,50 × 1019 moléculas/km2
A 515 km
2
= 6,50 × 109 moléculas/cm

O termo densidade usado isoladamente normalmente refere-se a densidade


de massa. Neste caso temos:
6,50 × 109 moléculas/cm2
ρs = φs m = = 1,94 × 10−13 g/cm2
3,35 × 10 moléculas/g
22

CEDERJ 18
Aula 1 - O que vamos estudar
MÓDULO 1 - AULA 1

Resumo
A principal idéia desta aula é a que podemos estudar um sistema us-
ando diferentes nı́veis de descrição, dependendo da informação que desejamos
obter. A passagem do nı́vel mais detalhado para o menos detalhado se dá
através da definição de grandezas médias. Esse é um procedimento comum a
diversas áreas. Por exemplo, as pesquisas de opinião tentam entender como
a população se comporta de uma forma média. O nı́vel microscópico neste
caso é aquele em que as opiniões individuais são coletadas. Na Fı́sica Es-
tatı́stica vamos examinar o comportamento de átomos e moléculas e através
de médias entender como um volume macroscópico se comporta.
Os sistemas estudados no decorrer do semestres serão aqueles formados
por sólidos cristalinos, a partir da descrição dos átomos individuiais. A Fı́sica
da Matéria Condensada é o ramo da Fı́sica que estuda sólidos, lı́quidos e géis,
a partir da descrição quântica de átomos e moléculas. Ela utiliza a Fı́sica
Estatı́stica para realizar médias térmicas e definir grandezas macroscópicas
tais como condutividade elétrica e magnetização.

Informações sobre a próxima aula


Na próxima aula você vai aprender conceitos fundamentais para o trata-
mento estatı́stico de sistemas fı́sicos discretos.

Leitura complementar
• H. Moysés Nussenzveig,
Curso de Fı́sica Básica 2 - Fluı́dos, Oscilações e Ondas, Calor
Editora Edgard Blücher, 2002

• S. R. A. Salinas,
Introdução à Fı́sica Estatı́stica
EdUSP, 2005.

• A Wikipedia é uma excelente fonte de informação em português. Você


pode acessar a página de entrada em:
http://pt.wikipedia.org/wiki/Wikipédia:Página principal

19 CEDERJ
Aula 1 - O que vamos estudar
Física Estatística e
Matéria Condensada

Referências
1. R.P. Feynman. Fı́sica em 12 lições. Ediouro Publicações, 2006.

CEDERJ 20
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

19 de Janeiro de 2015

Aula 2 - Descrição estatı́stica de um sistema


discreto

Meta
Apresentar os elementos básicos para a descrição estatı́stica de sistemas
fı́sicos discretos.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Reconhecer a diferença entre variáveis determinı́sticas e aleatórias.

2. Identificar eventos e espaço de amostragem.

3. Reconhecer e aplicar os conceitos de eventos exclusivos e independentes.

4. Reconhecer e aplicar os conceitos de média e desvio padrão.

5. Reconhecer e aplicar o conceito de distribuição discreta.

6. Identificar macro e microestados de sistemas fı́sicos discretos.

Pré-requisitos
Esta aula requer que você esteja familiarizado com os conceitos básicos
de probabilidade e distribuição binomial apresentados em Introdução à Prob-
abilidade.

Introdução
Como vimos na Aula 1, o estudo das propriedades dos materiais envolve
um número gigantesco de átomos. Para definirmos grandezas macroscópicas

21 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

a partir das grandezas atômicas precisamos realizar médias, que serão asso-
ciadas às variáveis macroscópicas. O cálculo dessas médias envolve o conhe-
cimento da probabilidade de ocorrência de cada possı́vel valor da variável
observada, por isso vamos rever alguns conceitos básicos sobre probabili-
dades.
Vamos imaginar dois experimentos. No primeiro um carro está em
movimento retilı́neo uniforme com velocidade de 60 km/h durante 30 minu-
tos. Qual a distância percorrida? Neste caso a resposta é totalmente pre-
visı́vel, a distância será de 30 km. Dizemos que este é um experimento deter-
minı́stico. Na segunda experiência jogamos uma moeda para cima e queremos
saber que face cairá para cima: cara ou coroa. Em princı́pio poderı́amos pre-
ver o resultado de uma jogada de moeda. Para tanto terı́amos que verificar
a posição exata do centro de massa da moeda e calcular as forças que atuam
sobre a moeda durante a jogada, assim como durante seu movimento no ar
etc. Se realmente pudéssemos fazer todos esses cálculos, para cada jogada
de cada moeda, poderı́amos conhecer com uma precisão inalcansável, o seu
movimento e portanto prever se o resultado seria cara ou coroa. É claro que
isso não é viável por muitas razões. Em vez disso, preferimos classificar o
experimento como aleatório e buscar uma descrição probabilı́stica que nos
diga quais as chances de obter cada resultado. Para tanto, imaginamos o
experimento sendo repetindo N vezes, sendo N  1. Se chamarmos de hni
o número de caras que esperamos obter em N jogadas, temos

hni = pN , (2.1)

onde 0 < p < 1 é a probabilidade de se tirar cara. No caso de uma moeda


simétrica, esperamos que o resultado seja cara em metade das jogadas, assim
p = 1/2, o mesmo valendo para coroa.
Podemos encarar (2.1) como uma definição experimental de probabili-
dade, que pode ser escrita formalmente como

Nx
PX (x) = lim , (2.2)
N →∞ N

onde PX (x) é a probabilidade de obter o resultado x para a variável X e


Nx é o número de vezes que observamos X = x no total de N realização
da experiência. O limite N → ∞ tem um papel fundamental aqui. Se
jogarmos a moeda N = 2 vezes e obtivermos 2 caras, não achamos nada de
mais. Mas, se a jogarmos N = 100 vezes e obtivermos 100 caras, certamente
suspeitarı́amos que há algo de errado com a moeda. A única diferença entre

CEDERJ 22
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

as duas situações é o valor de N. Mas, quanto grande N deve ser para termos
os valores esperado e medido sejam próximos? O maior possı́vel. Veremos
mais tarde que a pergunta correta é : Que erro estamos cometendo ao usar
a definição (2.2) com N finito?
Uma outra possibilidade para a determinação de PX (x) é a construção
de um modelo que nos permita calcular a probabilidade de ocorrência de cada
resultado possı́vel. Nesse modelo certamente entrariam considerações sobre
a distribuição de massa da moeda (é homogênea ou não?), sobre a forma com
que é jogada e sobre o número de resultados possı́veis (devemos considerar a
possibilidade da moeda cair em pé?). Para a moeda, em geral, supomos dois
resultados possı́veis, já que cair em pé é muito raro. Também supomos que
cara e coroa são igualmente prováveis já que, em geral, não há razão para
se supor que uma face tenha prioridade sobre a outra. Assim, um modelo
razoável leva a p = q = 1/2 sendo q a probabilidade de dar coroa.

Eventos independentes e mutuamente exclu-


sivos
Vamos formalizar e estender as noções que desenvolvemos intuitiva-
mente na seção anterior. Usaremos alguns conceitos básicos de teoria de
conjuntos. Começamos com duas definições importantes:

espaço de amostral de um determinado experimento = o conjunto Ω


com elementos tais que qualquer resultado do experimento corresponde
a um ou mais elementos de Ω.

evento = subconjunto do conjunto Ω relativo a um experimento. A pro-


babilidade de um evento E pode ser encontrada seguindo o seguinte
procedimento:

1. Construa o espaço amostral Ω.


2. Designe probabilidades para cada elemento de Ω. O caso mais
simples é aquele em que Ω é composto por NΩ elementos todos
igualmente prováveis, neste caso designe a probabilidade 1/NΩ a
cada um.
3. Para obter a probabilidade P(E) de um evento E, some as prob-
abilidades designadas a todos os elementos do subconjunto de Ω
correspondente a E.

23 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

W W W

(a) (b) (c)

Figura 2.1: Representação gráfica de um espaço de amostragem Ω, e dos


subconjuntos relativos a eventos do tipo A e B. Em (a) A e B são eventos
mutuamente exclusivos, as regiões coloridas de cinza são proporcionais a
P(A) e a P(B); em (b) a parte cinza corresponde ao subconjunto A∩B, sendo
proporcional a P(A, B) = P(A ∩ B), e em (c) a área cinza é proporcional a
P(A ∪ B).

Quando E = Ω dizemos que o evento é certo. Se E = ∅ dizemos que o


evento é impossı́vel. Fica claro que P(Ω) = 1 e P(∅) = 0.

Exemplo 2.1
Seja o experimento em que um dado é jogado e o número da face voltada para
cima é anotado. Primeiro definimos o espaço amostral: o resultado será um
inteiro de 1 a 6, ou seja Ω = {1, 2, 3, 4, 5, 6} e NΩ = 6. Supondo que seja um
dado equilibrado, cada elemento de Ω pode ocorrer com igual probabilidade
que é 1/6. Considere os eventos A, B e C definidos como:
A = o resultado é um número par
B = o resultado é um número maior que 2
C = o resultado é um número múltiplo de 3
O subconjunto correspondente ao evento A é A = {2, 4, 6} e NA = 3, portanto
P(A) = NA /NΩ = 1/2. Já B = {3, 4, 5, 6}, NB = 4, e P(B) = NB /NΩ =
2/3. Finalmente, C = {3, 6}, NC = 2 e P(C) = NC /NΩ = 1/3.

Podemos agora relacionar probabilidades para diferentes eventos.

• P(A ∩ B), ou P(A, B) é a probabilidade de que ambos eventos A e B


ocorram como resultado de um experimento. É chamada de probabili-
dade conjunta.

• P(A ∪ B) é a probabilidade de que eventos A ou B ocorram como


resultado de um experimento.

CEDERJ 24
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

• A notação P(Ā) significa a probabilidade do evento A não acontecer.


é fácil de ver que P(Ā) = 1 − P(A).

Temos assim que

P(A ∪ B) = P(A) + P (B) − P(A ∩ B) (2.3)

Se dois eventos são mutuamente exclusivos então

P(A ∩ B) = 0 (2.4)
P(A ∪ B) = P(A) + P(B) regra da soma

Se Ω = A1 ∪ A2 ∪ . . . ∪ Am , sendo os eventos Ai mutuamente exclusivos,


então os m eventos formam uma partição do espaço de amostragem Ω em m
subconjuntos. Neste caso temos
m
X
P(Ai ) = 1 , (2.5)
i=1

uma relação que usaremos bastante como condição de normalização.


Uma das principais questões de todas as análises probabilı́sticas é a
determinação da independência de eventos. Dois eventos A e B são eventos
independentes se e somente se

P(A ∩ B) = P(A)P(B) regra da multiplicação (2.6)

Em fı́sica costumamos usar essa propriedade de trás para frente. Na análise


de uma determinado processo aleatório podemos supor que determinados
eventos são independentes, por razões fı́sicas, e formular a sua descrição em
função disso. Um exemplo comum é o das velocidades moleculares num gás.
Uma descrição simples, como a do gás ideal, supõe que as moléculas não inte-
ragem entr si, isso implica em dizer que cada molécula pode ter qualquer valor
de velocidade, independente dos valores de velocidade das outras. Também
supomos que as componentes das velocidades são independentes.

Exemplo 2.2
Vamos voltar ao exemplo anterior. Se designamos a obtenção de cada número
na jogada de dado como um evento, temos que esses serão eventos inde-
pendentes (cada jogada não depende de jogadas anteriores) e mutuamente
exclusivos (não é possı́vel obter dois números ao mesmo tempo). Temos,
também:

25 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

• A ∩ B = {4, 6}, portanto P(A∩B) = 1/3. P(A∪B) = 1/2+2/3−1/3 =


5/6. Esse resultado poderia ser achado diretamente, já que apenas o 1
fica de fora.

• Se agora definimos o evento D como sendo tirar um número ı́mpar,


temos que D = {1, 3, 5}, P(D) = 1/2, P(A ∩ D) = 0 e A e D são
mutuamente exclusivos, em outras palavras, um número não pode ser
par e ı́mpar ao mesmo tempo.

Exemplo 2.3
Voltando ao exempo da moeda. Nossa experiência agora consiste em jogar
duas moedas que serão rotuladas inicialmente como a e b. Suponha que p
seja a probabilidade de dar cara.
(a) Qual a probabilidade de se obter duas caras como resultado da ex-
periência?
Neste caso, sendo A o evento“obter duas caras”,
Ω = {(caraa , carab ) , (caraa , coroab )) , (coroaa, carab )) , (coroaa, coroab ))} e NΩ =
4.
A = {(caraa, carab )}e NA = 1.
Como Ω é equiprovável, P(A) = NA /NΩ = 1/4.
Também, podemos pensar direto do ponto de vista das jogadas indi-
viduais. Como as jogadas são independentes

1
P(A) = P(duas caras) = P(cara ∪ cara) = P(cara)P(cara) = p2 = .
4
(b) Agora, qual a probabilidade das duas moedas terem o mesmo resultado?
Neste caso podemos ter duas coroas também. Portanto,
B = {(caraa, carab ) , (coroaa , coroab )} e NB = 2

NB 2 1
P(iguais) = = = = P(cara ∪ cara) + P(coroa ∪ coroa) .
NΩ 4 2

Atividade 1
(Objetivos 1, 2 e 3)
Um certo tipo de motor elétrico falha se ocorrer uma das seguintes situações:
emperramento dos mancais, queima dos rolamentos, desgaste das escovas.
Suponha que o emperramento seja duas vezes mais provável do que a queima,
esta sendo quatro vezes mais provável do que o desgaste das escovas. Qual
será a probabilidade de que a falha seja devida a cada uma dessas cir-
cunstâncias?

CEDERJ 26
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

deixar 5cm

Resposta comentada
Sejam os eventos:

• E = emperramento

• Q = queima

• D = desgaste

Do enunciado temos que P (E) = 2P (Q) e P (Q) = 4P (D). Além dessas


relações temos que P (E) + P (Q) + P (D) = 1 já que essas são todas as formas
de falha que podem ocorrer. Dessas três relações tiramos que P (E) = 8/13,
P (Q) = 4/13 e P (D) = 1/13.

Distribuições discretas
Chamamos de variável aleatória a variável cujo valor só pode ser deter-
minado através de uma experiência. Usaremos aqui a seguinte notação: em
letras maiúsculas teremos o nome da variável (ex: X é resultado da jogada
da moeda), e em minúsculas, o seu valor (ex: podemos fazer a associação
x = 0 para cara ou x = 1 para coroa).
Seja X uma variável aleatória definida no espaço de amostragem Ω
que pode tomar um número contável (finito ou infinito) de valores, ou seja,
X(Ω) = {x1, x2, . . .}. Sabendo a probabilidade para cada valor xi pode-
mos definir a distribuição de probabilidade, fX (xi ) ≡ P(xi ) satisfazendo as
seguintes condições
fX (xi) ≥ 0 , (2.7)
e
X
fX (xi ) = 1 , (2.8)
i

27 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

onde a soma é sobre todos os valores possı́veis da variável X.


A determinação de fX (xi ), permite o conhecimento completo de um sis-
tema aleatório mas, em geral, não é uma tarefa trivial obter essa informação.
Pode-se obter a forma fX (xi ) através de observações experimentais, de ex-
pansões em potências, ou pela resolução de equações diferenciais. Na prática,
muitas vezes usamos argumentos fı́sicos para supor uma determinada forma
para a distribuição, por isso é muito importante conhecer as propriedades de
algumas delas.
Os momentos de uma distribuição são grandezas muito importantes
porque definem a forma da distribuição e também porque são diretamente
relacionadas com observáveis fı́sicos. O n-ésimo momento de X é definido
como
X
Mn = hxn i = xni fX (xi) . (2.9)
i

Alguns momentos tem nomes especiais devido a sua frequente utilização.

primeiro momento → M1 = hxi = média ou valor esperado

segundo momento → M2 = hx2i


O segundo momento em geral aparece combinado com o primeiro na
forma
σ 2 = M2 − M12 = hx2 i − hxi2 . (2.10)

A grandeza σ 2 é denominada variância e mede o quanto os resultados de são


diferentes entre si.
De uma forma geral, a média de uma função de X é dada por
X X
hg(x)i = g(xi )fX (xi ) ≡ g(xi )PX (xi) (2.11)
i i

Distribuição uniforme
A distribuição mais simples é a uniforme, ou seja, aquela em que todos
os elementos do espaço amostral tem igual probabilidade de ocorrer. Um
exemplo de sistema com distribuição uniforme é dado equilibrado. Se X é o
número tirado, então x1 = 1, . . . , x6 = 6. Todos os valores tem probabilidade
1/6 de ocorrer, portanto f(xi ) = 1/6. Neste caso dizemos que o espaço
amostral é equiprovável. Uma ilustração desta distribuição pode ser vista na
figura 2.2.

CEDERJ 28
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

(a) (b)
Figura 2.2: (a) Dado equilibrado com seis possı́veis resultados (b) Se o dado
for correto, todos os números serão igualmente prováveis dando origem a
uma distribuição uniforme

Distribuição binomial
A distribuição binomial é muito importante na Fı́sica Estatı́stica po-
dendo ser utilizada para resolver diversos problemas. Você deve ter apren-
dido sobre ela no colégio, em alguma aula de Matemática. Seu nome vem
exatamente do binômio porque ela dá os termos do desenvolvimento binomial
(p + q)N . Observe as expressões da expansão binomial para alguns valores
de N.

N = 2 → (p + q)2 = p2 + 2pq + q 2
N = 3 → (p + q)3 = p3 + 3p2 q + 3pq 2 + q 3
N = 4 → (p + q)4 = p4 + 4p3 q + 6p2 q 2 + 4pq 3 + q 4

Para um valor qualquer de N podemos escrever


N
X
N
(p + q) = CN,n pN −n q n .
n=0

Os coeficientes CN,n podem ser facilmente determinados se adicionarmos um


ı́ndice a cada fator do produto. Por exemplo, para N = 2 terı́amos

(p + q)2 → (pa + qa)(pb + qb ) = pa pb + pa qb + qapb + qa qb


|{z} |{z} |{z} |{z}
1 2 3 4
→ pp + pq + qp + qq
= p2 q 0 + 2p1 q 1 + p0 q 2

29 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

Os quatro termos aparecem porque colocamos os ı́ndices a e b identificando


os fatores. Se abolimos esses ı́ndices os termos 2 e 3 tornam-se equivalentes
levando ao coeficiente 2 para o termo em pq. Para calcular a forma genérica
para qualquer N imaginamos que temos N caixas rotuladas por letras levando
a N! sequências possı́veis. Cada caixa pode receber uma letra extra, p ou q.
Chamando de n o número de caixas do tipo p temos que N −n caixas serão q.
Se agrupamos sequências com relação ao valor de n teremos várias sequências
que se tornarão equivalentes. Vamos ver um exemplo. Seja N = 4. As caixas
são numeradas de a a d. Duas das sequências possı́veis são abcd e badc entre
as 4! = 24 sequências. Podemos escolher p para as duas primeiras caixas e
q para as duas seguintes, nas duas sequências de caixa. Seriam os termos
pa pb qc qd e pb pa qd qc , que são termos idênticos e não deveriam ser contados
separadamente. Assim, das N! sequências devemos excluir as que diferem
entre si apenas por permutações das letras, em cada grupo p ou q. Sendo
assim,

N
X N!
(p + q)N = CN,npN −n q n onde CN,n = . (2.12)
n=0
n!(N − n)!

Os coeficientes CN,n são a combinação de N objetos n a n, ou o número de


escolhas distintas de n objetos num total de N.
Para entender melhor a contagem vamos verificar todas as possibili-
dades para o caso de N = 4 caixas, como indicado na tabela 2.1. O ı́ndice J
corresponde aos termos já agrupados pela eliminação dos rótulos temporários
a, b, c e d. Já o ı́ndice j numera os estados com as caixas ainda rotuladas.
Podemos usar o desenvolvimento acima para estudar o problema da
moeda. Para isso associamos p à probabilidadede se obter cara em uma
jogada e q a de se obter coroa. Sendo cara e coroa as únicas possibilidades de
resultado, temos que p + q = 1, que é a condição de normalização definida na
equação (2.5). Podemos interpretar N como número de moedas ou número
de jogadas de uma única moeda. Voltando ao caso N = 4, temos que a
probabilidade de obter uma dada sequência de jogadas com n caras é pn q 4−n
já que cada jogada é independente da outra (regra da multiplicação). O
número de sequências equivalentes é dado por C4,n (regra da soma). Assim
a probabilidade de se obter n caras numa jogada de 4 moedas, ou jogando 4
vezes a mesma moeda é P(4, n) = C4,npn q 4−n . Para um número N qualquer
temos que a probabilidade de se obter n caras numa jogada de N moedas,

CEDERJ 30
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

J j a b c d n C4,n
1 1 p p p p 4 1
2 p p p q
3 p p q p
2 4 p q p p 3 4
5 q p p p
6 p p q q
7 p q p q
8 p q q p
3 9 q p p q 2 6
10 q p q p
11 q q p p
12 q q q p
4 13 q q p q 1 4
14 q p q q
15 p q q q
5 16 q q q q 0 1

Tabela 2.1: Coeficientes de (p + q)4.

ou jogando N vezes a mesma moeda, é

N!
P(N, n) = CN,n pn q N −n = pn q N −n (2.13)
n!(N − n)!

A expressão (2.13) define o que chamamos distribuição binomial.


A condição de normalização para as N jogadas pode ser escrita como

N
X
P(N, n) = (p + q)N = 1 , (2.14)
n=0

já que p + q = 1 neste problema.


Temos também que
N
X
CN,n = 2N . (2.15)
n=0

já que 2N é o numero total de sequências.

31 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

Cálculo do valor esperado hni

O valor esperado para n na distribuição binomial pode ser facilmente


calculado usando-se as expressões (2.14) e (2.13). Pela definição de valor
esperado, equação (2.9) com n = 1, temos que:

N
X
hni = nP(N, n) . (2.16)
n=0

Agora note as seguintes igualdades:


N N
d X d X
P(N, n) = CN,n pn q N −n
dp n=0 dp n=0
N
X
= CN,n n pn−1 q N −n
n=0
N N
1 X 1X
= CN,n n pn q N −n = n P(N, n)
p n=0
p n=0
1
= hni
p

Fazemos então
N N
X d X d
hni = nP(N, n) = p P(N, n) = p (p+q)N = pN(p+q)N −1 = pN
n=0
dp n=0 dp
(2.17)
N −1
onde usamos que a equação 2.14 e também que (p + q) = 1, já que
p + q = 1.

Cálculo da variância σ 2

Além do valor esperado, uma grandeza importante para caracterizar


o resultado de um experimento é a variância, σ 2 . Esta grandeza pode ser
calculada de forma muito simples no caso da distribuição binomial. Se hni
é o valor esperado então dn = n − hni dá a distância com relação ao valor
esperado. Por exemplo, se temos N = 20, p = 0,5 e q = 0,5 o valor esperado
é hni =0,5 20 = 10. O valor n = 5 está a uma distância −5 com relação a hni.
O sinal negativo apareceu porque examinamos um valores de n menor que
o esperado, mas o que importa realmente é o valor absoluto dessa distância,
por isso vamos usar o seu valor quadrático. Podemos, assim, calcular o valor
médio dessas diferenças ao quadrado e extrair a raiz para obter uma medida

CEDERJ 32
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

do afastamento médio. Temos


N
X
hd2 i ≡ h(n − hni)2 i = P(N, n)(n − hni)2 (2.18)
n=0

Para prosseguir com o cálculo de σ 2 primeiro notamos o seguinte:

hd2 i ≡ h(n − hni)2 i = hn2 − 2nhni + hni2 i


= hn2 i − 2hnihni + hni2
= hn2 i − 2hni2 + hni2
= hn2 i − hni2
= M2 − M12 ≡ σ 2 (2.19)

Já sabemos que M1 = hni = pN, vamos agora calcular M2 = hn2 i usando
a definição de probabilidade binomial (equação (2.13)) e a definição de dis-
tribuição binomial (equação (2.12))
N
X
2
hn i = n2 P(N, n)
n=0
N
X N!
= n2 pn q N −n
n=0
n!(N − n)!
 2 XN
d
= p P(N, n)
dp n=0
 2
d
= p (p + q)N = pN + (pN)2 − p2 N .
dp
Finalmente,

σ 2 = hn2 i − hni2 = pN − p2 N = pN − p(1 − q)N = Npq . (2.20)

Assim, para dados valores de p e q, quanto maior o valor de N, maior a


variância, ou seja, maior é a diferença quadrática média dos valores de n com
relação ao valor esperado. Esse resultado parece paradoxal: quanto maior o
número de jogadas ou repetições, maior a dispersão do valores encontrados. A
questão é que a grandeza realmente importante é o valor relativo da dispersão.
Podemos calculá-lo com relação ao número total de jogadas:

σ Npq
= = (qp)1/2N −1/2 , (2.21)
N N
ou com relação ao valor médio
√ r
σ Npq q −1/2
= = N , (2.22)
hni pN p

33 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

Figura 2.3: PN (n) para N = 20, gráfico (a), e N = 40, gráfico (b). Para
os dois valores de N estão representados os valores correspondendo ao caso
simétrico (sı́mbolos sólidos) e assimétrico (sı́mbolos vazados). Todas os val-
ores estão representados em função de n − hni.


ou seja, σ/N, ou σ/hni, diminui com N quando N aumenta. Logo, quanto
maior o valor de N, menor será a flutuação relativa, menor será a chance
de se obter um valor muito diferente do esperado como resultado de uma
medida. Dizemos que o valor médio ou esperado fica melhor definido quanto
maior for o valor de N. Veremos mais tarde que este será o papel do limite
termodinâmico na Fı́sica Estatı́stica: fazer com que grandezas macroscópicas
provenientes de médias sobre grandezas microscópicas sejam bem definidas.

Forma da distribuição binomial

Usando a expressão (2.23) podemos calcular P(N, M) para diferentes


valores de N e p. A figura 2.3 mostra o comportamento de P(N, M) para
N = 20 e 40, para dois casos: simétrico (p = q = 0,5) e assimétrico (p = 0,8
e q = 0,2). Os parâmetros de cada distribuição podem ser vistos na tabela
2.2.

N p hni σ σ/N
20 0,5 10 2,2 0,1
20 0,2 4 1,8 0,09
20 0,5 20 3,2 0,08
20 0,2 8 2,5 0,06

Tabela 2.2: Parâmetros referentes aos gráficos da figura 2.3.

CEDERJ 34
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

Em primeiro lugar notamos a forma geral da distribuição: existe um


máximo em n = hni = Np e os valores de P(N, n) diminuem muito à medida
que nos distanciamos do máximo.
Atividade 2
(Objetivos 1, 2, 3, 4 e 5)
Considere um gás com N moléculas contido num volume V0 . Considere um
certo subvolume v, como esquematizado na figura.
(a) Calcule a probabilidade de que exatamente n moléculas estejam em v,
não interessando quais sejam.
(b) Calcule a dispersão relativa, definida como R = σ 2/hni2 , e explique o
comportamento de R quando v  V0 e v ≈ V0 .
diagramador: deixar 5cm

Resposta comentada

(a) Considerando que as moléculas do gás estejam uniformemente distribuı́das


em V0 , a fração de moléculas em v é dada por v/V0 . Supondo que V0 seja
macroscópico (se não este problema não tem sentido...), a probabilidade p de
que cada molécula, individualmente, esteja no subvolume v é dada por essa
fração, ou seja, p = v/V0 . A probabilidade de que n moléculas especı́ficas
estejam em v é pn . Como podemos escolher quaisquer n moléculas, a proba-
bilidade pedida é dada pela distribuição binomial:
 n  N −n
N! v V0 − v
P(N, n) = .
n!(N − n)! V0 V0
(b) O número médio hni em v é
Nv
hni = Np =
V0

35 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

A dispersão relativa R = σ 2/hni2 pode ser calculada como

Npq Np(1 − p) 1−p V0 − v


R= = = = .
(pN) 2 (pN) 2 pN Nv
Se v  V0 , R será um número muito grande. Isso significa que, se tomamos
um subvolume desse tamanho e realizamos várias medidas do número de
moléculas dentro dele, os valores encontrados serão bastante diferentes entre
si. Numa situação extrema, se v . V0 /N, que é o volume médio por molécula,
podemos ter até mesmo hni = 0 em alguma medição. Por outro lado, se
v → V0 , R ≈ 0, os valores dessa medida serão muito semelhantes entre si, ou
seja, hni será bem definido.
Fim da atividade

Aplicações fı́sicas da distribuição binomial


A distribuição binomial tem inúmeras aplicações em Fı́sica Estatı́stica.
Vamos ver duas muito importantes: o paramagneto uniaxial e o caminho
aleatório. Os dois problemas são muito diferentes embora tenham a mesma
descrição básica. Tudo é uma questão de como interpretar as variáveis em
cada sistema.
Nos dois problemas é mais significativo e conveniente trabalhar com a
diferença entre as quantidades de cada tipo, que definimos como M. Podemos
reescrever a distribuição binomial (2.13) em termos de M como
N +M N −M
P(N, M) = CN,M p 2 q 2 , (2.23)

onde
N!
CN,M = N +M
 N −M  , (2.24)
2
! 2
!
sendo
N +M N −M
n= e N −n= . (2.25)
2 2
Aproveitamos os exemplos para apresentar duas definições importantes:
micro e macroestados. O microestado é o estado do sistema levando em conta
o detalhamento microscópico. O macroestado é o estado levando em conta
a visão macroscópica apenas. Na maior parte dos casos o macroestado é
determinado pela energia do sistema e a situação mais comum é a de se
ter muitos microestados levando a um mesmo macroestado. Como se de
longe não pudéssemos perceber certos detalhes pequenos. Chamamos de
multiplicidade, g, ao número de microestados num dado macroestado.

CEDERJ 36
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

Paramagneto uniaxial

Um dos sistemas mais simples para um estudo estatı́stico é o formado


por átomos paramagnéticos, cujos momentos magnéticos estejam sempre ao
longo de um eixo, com orientação positiva ou negativa. Esta é uma “ca-
ricatura” que descreve com boa aproximação o comportamento magnético
de uma série de materiais. Veremos mais sobre este assunto na Aula 8. A
observação macroscópica neste caso será uma medida do momento magnético
total do sistema, ou de sua energia, por isso vamos entender como essas
grandezas estão relacionadas com variáveis microscópicas do sistema.
Nosso sistema é sólido, os átomos não têm movimento de translação e,
embora sejam idênticos, são distinguı́veis pelas suas posições. O momento
magnético de cada partı́cula está sempre paralelo a um eixo, sendo a ori-
entação ao longo dele definida pela variável σ, que pode ter os valores +1 ou
−1, como ilustrado na figura 2.4.

s=+1 s=-1

Figura 2.4: Possı́veis orientações do momento magnético num sistema para-


magnético uniaxial, com relação à orientação do campo magnético aplicado,
~
B.

Podemos usar diretamente a distribuição binomial na forma (2.23). Em


vez de moedas, átomos e em vez cara e coroa temos as possibilidades σ =
±1. Suponha que o sistema contenha N átomos. Temos aqui um total
de 2N configurações distintas, dependendo das escolhas do valor de σ para
cada átomo. Essas configurações definem os microestados do sistema. Se os
átomos têm momentos magnéticos unitários, o momento magnético total de
um dado microestado é dado por
N
X
M= σi = (N+ − N− ) , (2.26)
i=1

sendo N+ (N− ) o número de átomos com σ = +1(σ = −1) no microestado.


~ define a direção do eixo de
A presença de um campo magnético externo, B,
alinhamento dos momentos magnéticos. De acordo com nossa definição de σ,

37 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

temos σ = +1 quando o momento for paralelo ao campo, e σ = −1 quando


for antiparalelo. A energia de um dado macroestado pode ser escrita como

E = −BM = −B(N+ − N− ) = −B(2N+ − N) . (2.27)

Na última igualdade usamos que N = N+ + N− . A última expressão para


a energia mostra que ela fica definida pelo valor de N+ apenas, se valores
de N e B são especificados. A figura (2.5) mostra alguns dos possı́veis mi-
croestados para um sistema com N = 7 e N+ = 3. Todos eles levam ao
mesmo valor de energia e são idênticos do ponto de vista de uma observação
macroscópica. Em alguns poucos casos é possı́vel calcular exatamente o valor

Figura 2.5: Exemplos de possı́veis microestados do paramagneto uniaxial.


Neste caso N = 7, N+ = 3, N− = 4 e M = −1.

da muliplicidade g, este é um deles. A multiplicidade é dada pelos coefientes


CN,M (equação (2.24)), ou seja,
N!
g(M, N) = CN,M = N +M
 N −M  . (2.28)
2
! 2
!

Já que podemos usar apenas N+ e N para identificar um macroestado,


vamos simplificar a notação, usando n no lugar de N+ daqui para frente.
Sejam p e q as probabilidades de cada momento magnético ter orientação
positiva ou negativa, respectivamente, na presença do campo externo, sendo
p+q = 1. De acordo com a expressão (2.27), o menor valor de energia (o mais
negativo) corresponde ao macroestado com todos os momentos magnéticos
paralelos ao campo externo, ou seja, todos com σ = +1. Queremos considerar
também a possibilidade de ter momentos antiparalelos (σ = −1) e saber qual

CEDERJ 38
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

a chance de se obter um macroestado com momentos antiparalelos também.


Como cada momento magnético é independente do outro, a probabilidade de
ocorrência de um dado microestado com n momentos positivos é pn q N −n . Na
Aula 8 veremos que p está relacionada com o valor de B e com a temperatura
B

na forma p = exp κT onde κ é a constante de Boltzmann.

Atividade 3
(Objetivos 1, 2, 3, 4, 5 e 6)
Preencha a tabela abaixo e classifique os microestados de acordo com o
macroestado a que pertence. De o valor de energia de cada microestado,
supondo que o campo aplicado seja B.

microestado M E
(a) {+ + + + + + + + ++}
(b) {+ − + − + − + − +−}
(c) {+ + + + + − − − −−}
(d) {− − + + − − + + −−}
(e) {+ − − − + + − − −+}
(f) {− − − − − − − − −−}

Resposta comentada

microestado M E
(a) {+ + + + + + + + ++} 10 -10B
(b) {+ − + − + − + − +−} 0 0
(c) {+ + + + + − − − −−} 0 0
(d) {− − + + − − + + −−} -2 2B
(e) {+ − − − + + − − −+} -2 2B
(f) {− − − − − − − − −−} -10 10B

Os microestados (b) e (c) pertencem ao macroestado com energia E = 0 e


os microestados (d) e (e), ao macroestado de energia E = 2B.
Fim da atividade

Atividade 4
(Objetivos 1, 2, 3, 4, 5 e 6)
Encontre os macroestados e suas multiplicidades para um paramagneto uni-
axial com N = 4.
diagramador: deixar 10cm

39 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

Resposta comentada
Temos um total de 2N = 24 = 16 microestados. n varia entre 0 e 4, ou M
entre −4 e 4, levando a 5 macroestados. Podemos usar a equação (2.28) para
calcular as multiplicidades. A tabela abaixo mostra os 24 = 16 microestados
do sistema, classificando-os de acordo com os rótulos de macroestado n ou
M. J e j são ı́ndices arbitrários que identificam os macro e microestados,
respectivamente.

J j a b c d n M g(M, 4)
1 1 + + + + 4 4 1
2 + + + −
3 + + − +
2 4 + − + + 3 2 4
5 − + + +
6 + + − −
7 + − + −
8 + − − +
3 9 − + + − 2 0 6
10 − + − +
11 − − + +
12 − − − +
4 13 − − + − 3 −2 4
14 − + − −
15 + − − −
5 16 − − − − 0 −4 1

Fim da atividade

Caminho aleatório unidimensional

Um problema relacionado com o do sistema paramagnético uniaxial é


o do caminho aleatório em uma dimensão. Nesse problema, uma partı́cula
caminha ao longo de uma reta, dando passos para a direita ou esquerda
aleatoriamente. Cada passo é independente do anterior e todos os passos
tem o mesmo tamanho, `. Seja p a probabilidade da partı́cula dar um passo
para a direita. A relação com a distribuição binária é clara, podemos dizer
que cada passo é dado após a jogada da moeda, se for cara o caminhante
vai para a direita, se for coroa, para a esquerda. Este modelo, que pode

CEDERJ 40
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

ser estendido para o espaço tridimensional é extremamente importante na


descrição dos processos de difusão, a mudança de direção aparecendo pela
colisão aleatória da partı́cula sendo examinada com outras do meio.
A grandeza importante neste problema é a distância que o caminhante
está após uma sequência de N passos aleatórios. Essa distância é dada pela
diferença entre o deslocamento total para a direita e o deslocamento para a
esquerda. Assim, basta interpretar N+ e N− como o número de passos para
a direita e esquerda, respectivamente. M passa a ser o número lı́quido de
passos para a direita. Se M > 0 a partı́cula terminou à direita depois dos
N passos, se M < 0, terminou à esquerda. O macroestado é identificado por
M, assim, há vários caminhos que levam ao mesmo macroestado. O número
de trajetórias com um dado M, para um certo número N de passos é dado
pela multiplidade da distribuição binária, equação (2.28).
Atividade 5
(Objetivos 1, 2, 3, 4, 5 e 6)
Suponha que uma partı́cula realiza um caminho aleatório ao longo de uma
linha.
(a) Se uma partı́cula dá 10 passos, qual a probabilidade de que esteja a uma
distância d = 8` do ponto de partida? Suponha p = 0,5
(b) Qual o valor esperado para d, se a partı́cula dá 10 passos e p = 0,5? E
se p = 0,3?
diagramador: deixar 5cm

Resposta comentada
Como a distância está dada em unidades de `, d = 8` significa que temos
M = 8. Como o número total de passos é N = 10, usando a definição de n
em termos de M e N, equação (2.25), temos n = 9.
(a) Usamos a equação (2.23) com N = 10, n = 9 e p = q = 0, !5:
 9  1  10
10! 1 1 1 10
P10(9) = = 10 = = 9, 8 × 10−3
9!1! 2 2 2 1024
(b) O valor esperado para d é hdi = hMi`. Da relação entre n e M temos
que M = 2n − N, portanto
hMi = (2hni − N) = (2Np − N)` = N(2p − 1) ⇒ hdi = N(2p − 1)` .
Se p = 0,5, hdi = 0. Claro, a partı́cula dá passos para a direita e esquerda
com igual probabilidade, em média termina no ponto inicial.

41 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

Se p = 0,3, hdi = 10(2 × 0, 3 − 1)` = −4`. Aqui a probalidade de ir para a


direita é menor, em média a partı́cula termina à esquerda da origem.
Fim da atividade

Conclusão
Podemos usar distribuições de probabilidades para descrever sistemas
fı́sicos discretos do ponto de vista estatı́stico. As principais grandezas nesse
contexto são o valor esperado, ou valor médio, e a variância. O valor espe-
rado, como indica o nome, é o que se espera obter como resultado de uma
experiência, quando a mesma for repetida um número infinito de vezes. Sendo
assim, realizando a experiência uma vez, ou um número finito de vezes, cer-
tamente obteremos valores diferentes do esperado. A variância é a grandeza
que nos permite quantificar essa dispersão de valores obtidos, com relação
ao valor esperado. Quanto maior o número de repetições da experiência,
menor será a dispersão relativa, fazendo com que o valor esperado seja uma
grandeza bem definida para a quantidade que está sendo medida.

Atividade Final
(Objetivos 1, 2, 3, 4, 5 e 6)
Um sólido contém N núcleos que não interagem entre si. Cada núcleo pode
estar em qualquer um de três estados quânticos, rotulados pelo número
quântico m, que pode ter os valores 0 e ±1. Devido a interações elétricas
com campos internos ao sólido, núcleos nos estados m = 1 ou m = −1 tem
a mesma energia  > 0, enquanto que a energia do estado m = 0 é zero.
Calcule a multiplicidade g(E, N) do macroestado de energia E.
Dica: Escreva a energia como E = (N −N0 )ε, onde N0 é o número de núcleos
com m = 0. Agora você pode usar que (N − N0 ) = E/ε.
Resposta comentada
Como a energia pode ser escrita em termos de N e N0 , são essas as variáveis
que rotulam o macroestado, não importando o estado dos núcleos com m 6= 0.
A primeira contribuição para a multiplicidade vem de como escolher os
núcleos com m = 0. Dados N e N0 , há CN,N0 maneiras de fazer essa es-
colha. Para cada uma delas temos a liberdade de escolher quais núcleos com
m 6= 0 terão m = +1 ou −1, sem que a energia seja alterada. Por exemplo,

CEDERJ 42
Aula 2 - Descrição estatı́stica de um sistema discreto
MÓDULO 1 - AULA 2

considere N = 5, N0 = 3. Uma possibilidade de escolha de núcleos com


m = 0 é:
a b c d e
0 0 0

Agora podemos considerar todas as possibilidades para os núcleos b e e.


Temos assim:
a b c d e
0 + 0 0 +
0 + 0 0 -
0 - 0 0 +
0 - 0 0 -

Uma determinada escolha de núcleos com m = 0 gerou 22 = 4 possibilidades.


No caso geral, terı́amos 2N −N0 possibilidades. Assim, a multiplicidade total

N!
g(N0, N) = 2N −N0
(N − N0 )!N0!
Escrevendo em termos da energia, fica
N! E
g(E, N) = E  E
 2ε
ε
! N− ε !

Resumo
Nesta aula aprendemos como usar uam distribuição discreta para descr-
ever um sistema fı́sico. Em particular estudamos a distribuição binária, que
é usada com muita frequência na modelagem de sistemas fı́sicos. Aproveita-
mos para rever os conceitos de probabilidade, distribuição, valor esperado e
variância em sistemas discretos. Calculamos essas grandezas para o sistema
binário, analisando o comportamento da variância relativa com o número N
de componentes do sistema. Com isso, verificamos que o limite N → ∞
leva a distribuições muito centradas em torno do valor esperado. Aprende-
mos, também, as definições de macroestado, microestado e multiplicidade,
analisando as configurações possı́veis de um sistema binário.

Informações sobre a próxima aula


Na próxima aula continuaremos com a descrição estatı́stica de sistemas
fı́sicos, mas considerando sistemas descritos por variáveis reais obedecendo a

43 CEDERJ
Aula 2 - Descrição estatı́stica de um sistema discreto
Física Estatística e
Matéria Condensada

uma distribuição contı́nua. Em particular veremos como obter a distribuição


gaussiana a partir do limite N → ∞ da distribuição binomial.

Leitura complementar
• P. L. Meyer, Probabilidade-Aplicações à Estatı́stica, primeira edição,
LTC editora.

• S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São


Paulo, EDUSP, capı́tulo 1.

CEDERJ 44
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Aula 3 - Descrição estatı́stica de um sistema


contı́nuo
19 de Janeiro de 2015

Meta
Apresentar os elementos básicos para a descrição estatı́stica de sistemas
fı́sicos contı́nuos.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Construir um histograma a partir de um conjunto de dados.

2. Reconhecer a diferença entre variáveis aleatórias discretas e contı́nuas.

3. Calcular probabilidades, valores esperados e a variâncias a partir de


distribuições contı́nuas.

4. Obter a distribuição gaussiana a partir da distribuição binomial.

5. Identificar as propriedades da distribuição gaussiana.

Pré-requisitos
Esta aula requer que você esteja familiarizado com os conceitos básicos
probabilidade e distribuição binomial apresentados em Introdução à Proba-
bilidade e Estatı́stica.

Introdução
Podemos ter uma variável aleatória contı́nua por duas razões:

45 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

• A grandeza descrita é originalmente contı́nua. Um exemplo tı́pico está


no gás ideal estudado pela Teoria Cinética. Todo o formalismo está
baseado no fato de que as moléculas do gás tem velocidades variando de
acordo com uma determinada distribuição de velocidades. O valor da
velocidade u de uma molécula é representado por um número real. Ao
compararmos dois valores de velocidade temos que, necessariamente,
decidir primeiro quantas casas decimais serão consideradas, o que em
geral vai envolver a precisão do equipamento disponı́vel para medidas.
Assim, o intervalo ∆u fica naturalmente definido e, em vez de pergun-
tarmos qual a probabilidade de encontrar uma molécula com velocidade
u, perguntamos qual a probabilidade de encontrar uma partı́cula com
velocidade entre u e u + ∆u.

• A grandeza descrita é discreta mas pode assumir um número muito


grande de valores. Por exemplo, se usamos de novo o exemplo da
moeda, suponha que tenhamos 106 moedas. Em vez de perguntar qual
a probabilidade de obter, por exemplo, n = 523451 caras, perguntamos
qual a probabilidade de o número de caras estar entre 523000 e 523500,
definindo um ∆n = 500.

Veremos a seguir como lidar com essas variáveis contı́nuas, estendendo


o formalismo que já usamos para as variáveis discretas.

Histogramas
Antes de passarmos ao formalismo matemático das distribuições contı́nuas,
vale a pena aprender um pouco sobre histogramas. Um histograma é um tipo
especial de gráfico, em que a frequência relativa ou o número de ocorrências
de valores medidos é expressa em função do valor das medidas. Sua constru-
ção envolve os seguintes passos:

1. Obter de uma tabela com N valores da grandeza X que se quer estudar.


Quanto maior o valor de N, mais significativo será o resultado.

2. Determinar os valores mı́nimo e máximo de X.

3. Determinar o tamanho do intervalo ∆x que será usado para classificar


os dados.

CEDERJ 46
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

4. Dividir a variação total de X nos dados obtidos em n intervalos de


tamanho ∆x. Em geral tomamos como extremos valores xmin e xmax ,
tais que todos os dados sejam incluı́dos ao mesmo tempo que a escala
de leitura para o gráfico é fácil leitura.

5. Classificar os dados caem pelos intervalos. Definir Ni como o número


de dados entre xi e xi + ∆x.

6. Opcional: dividir a contagem em cada intervalo, Ni pelo número total


de dados, definindo a frequência relativa Fi = Ni /N.

7. Traçar o gráfico de Fi, ou de Ni , em função de x̄i , que é o valor central


de cada intervalo.

Note que usando a divisão por N explicada no item 6 temos a normalização


n n n
X X Ni 1 X
Fi = = Ni = 1 , (3.1)
i=1 i=1
N N i=1

onde n é o número de intervalos.


Vamos ver um exemplo dessa construção aplicando-a a um conjunto
de medidas do perı́odo τ de um pêndulo simples. Suponha que um aluno
realizou o conjunto de N = 100 medidas relacionadas na tabela 3.3.

τ (s) τ (s) τ (s) τ (s) τ (s) τ (s) τ (s) τ (s) τ (s) τ (s)
2,7572 2,7779 2,8753 2,2747 2,7934 2,7524 2,5963 2,7656 3,0376 3,3122
2,2496 2,4900 3,2255 2,7082 3,1866 1,9964 2,4286 2,8684 3,3925 2,7289
1,9154 2,3902 3,1911 2,7354 2,6591 2,7175 3,0865 2,5922 2,9031 2,6265
3,0182 3,1634 2,6027 3,1995 1,7365 3,2880 3,2444 2,5051 2,9800 2,5974
2,4493 2,7289 2,4364 2,8538 2,8431 2,9940 2,5028 2,5058 3,7085 3,3272
3,0343 2,6654 2,7709 2,4196 2,6359 2,9121 2,6573 2,8597 2,7957 2,7995
2,6050 2,5288 2,6348 2,7352 2,3866 2,6251 2,3283 3,3204 3,4361 2,7763
3,4252 3,1978 2,2228 2,1029 3,4341 3,5109 2,7653 2,7191 2,3851 2,4484
2,7237 2,7091 2,6622 3,4943 2,7243 2,4018 2,3138 3,1882 2,6864 2,8487
3,2349 2,9837 2,4838 3,0688 2,6266 3,6141 2,5203 2,9692 2,4440 3,1977

Tabela 3.3: Conjunto de dados resultantes de uma experiência de medição


do perı́odo de um pêndulo simples.

Examinando a tabela diretamente é difı́cil obter alguma informação


relevante sobre a experiência. Começamos nossa análise calculando o valor
médio e a variância, obtendo hτ i =2,79 s e σ =0,4 s. Vamos agora con-
struir o histograma seguindo os passos indicados anteriormente. O menor

47 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

valor de perı́odo na tabela é τmin = 1,7365 s, e o maior τmax = 3, 7085 s.


Para simplificar vamos fazer o gráfico entre 1,72 s e 3,72 s, com 10 intervalos
de ∆τ = 0,2 s. Contamos quantas medidas caem em cada intervalo e di-
vidimos por N =100 cada contagem. Finalmente obtemos o histograma de
frequências mostrado na figura 3.1.

Figura 3.1: Histograma relativo aos dados da tabela 3.3.

Observando o histograma da figura 3.1 notamos a concentração de valo-


res em torno de τ = hτ i=2,79 s. Quando os valores do perı́odo se afastam do
valor médio, o número de ocorrências cai bastante. Vamos ver como a forma
do histograma se altera se um número maior de medidas é considerado.
Numa experiência equivalente, foram tomadas N = 1000 medidas do
perı́odo. Em vez de mostrar a tabela, vamos apresentar logo os valores resul-
tantes da contagem por intervalos. Neste caso os valores mı́nimo e máximo
foram 1,585 s e 3,993 s, respectivamente. Assim construimos o histograma
com intervalos de 0,25 s, indo de 1,55 a 4,05 s. A tabela 3.4 mostra o resul-
tado da classificação dos dados nesses intervalos. F é a frequêcia relativa, ou
seja, o número de dados no intervalo centrado no valor indicado na primeira
coluna, dividido por N. Por exemplo, havia quatro valores entre 1,550 s
e 1,800 s, dando F = 4/1000. Como vimos no inı́cio da Aula 2, na ex-
pressão (2.2), os valores de F na tabela 3.4 podem ser considerados como
uma estimativa para a probabilidade de se obter uma medida de perı́odo nos
intervalos considerados, já que seu valor dá a fração de medidas no intervalo.

CEDERJ 48
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

i τ̄i (s) Fi
1 1,6750 0,004
2 1,9250 0,025
3 2,1750 0,075
4 2,4250 0,175
5 2,6750 0,225
6 2,9250 0,240
7 3,1750 0,148
8 3,4250 0,077
9 3,6750 0,024
10 3,9250 0,007

Tabela 3.4: Valores de frequência relativa para a construção de um his-


tograma referente a um conjunto de N = 1000 medidas de perı́odo de um
pêndulo simples

Exemplo 3.1
A partir da tabela 3.4 podemos calcular a probabilidade de se ter uma medida
na região central do histograma, entre 2,300 s e 3,300 s. Usando a regra
da soma, equação (2.5), somamos as probabilidades referentes a todos os
intervalos dentro dos limite definidos:

P(2,300 < τ < 3,300) = P(2,300 < τ < 2,550)


+ P(2,550 < τ < 2,800)
+ P(2,800 < τ < 3,050)
+ P(3,050 < τ < 3,300)

Se usamos a frequência relativa de cada intervalo como sendo a probabilidade


de encontrar a medida no intervalo, temos que
7
X
P(2,300 < τ < 3,300) = Pi
i=4
X7
= Fi
i=4
= 0,175 + 0,225 + 0,240 + 0,148 = 0,79 ou 79%.

A forma geral do histograma também depende do valor de ∆τ considerado


para a classificação dos dados. Por exemplo, a figura 3.3 mostra um his-
tograma construı́do com ∆τ = 0,20 s sobre o mesmo conjunto de dados da

49 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

2s

Figura 3.2: Histograma relativo a um conjunto de dados similar aos da


tabela 3.3, mas com N = 1000 valores, classificados em intervalos ∆τ =
0,25 s. Em escuro estão indicados o valor médio, hτ i = 2,79 s e o desvio
quadrático médio σ =0,4 s. Comparando este gráfico com o da figura 3.1,
podemos observar que é muito mais simétrico, e apresenta menos flutuações,
consequências do aumento do número de medidas. A região compreendida
entre hτ i − σ e hτ i + σ concentra a maior parte do dados.

figura 3.2. Como o intervalo considerado na contagem é menor, o número de


dados em cada intervalo também será menor, por isso os valores de frequência
são todos menores. Com um número finito de dados, se diminuı́mos muito
o tamanho do intervalo haverá vários sem nenhum dado, vários com um só
dado, etc.
Tivemos essa mesma situação ao fazermos a contagem de grãos na Ativi-
dade 1 da Aula 1 e ao definirmos o tamanho do subvolume do gás na Ativi-
dade 3 da Aula 2. Quando o número de dados for muito grande, N → ∞,
poderemos definir intervalos infinitesimais que conterão um número significa-
tivo de dados. Com isso será possı́vel construir um histograma cuja forma
será independente do tamanho do intervalo. Nesse limite estaremos partindo
para uma descrição contı́nua.

Distribuições contı́nuas
Agora queremos tratar de variáveis aleatórias reais contı́nuas tais que
podemos tomar um intervalo infinitesimal dx e definir dPX (x) ≡ fX (x)dx
como a probabilidade de encontrar o resultado de uma determinada ex-

CEDERJ 50
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Figura 3.3: Histograma relativo ao mesmo conjunto de dados da figura 3.2,


mas com ∆τ =0,20 s. Note como a forma geral foi alterada, e em especial os
valores de frequência.

periência entre x e x + dx. Em geral essa probabilidade depende de x e


é proporcional ao tamanho de dx. Quanto maior for o intervalo considerado,
maior será o valor numérico de PX (x)dx para um mesmo x. Neste caso é mais
significativa a definição da densidade de probabilidade, da seguinte forma

dPX (x)
fX (x) ≡ , (3.2)
dx
ou seja, a função fX (x) define a distribuição da variável aleatória X sendo
fX a densidade de probabilidade de X.

Box explicativo: O termo densidade de probabilidade refere-se ao fato


de que na formulação contı́nua dPX é uma probabilidade sendo, portanto,
uma grandeza adimensional, um número. Assim, fX (x)dx também é adimen-
sional, e fX (x) tem unidade de X −1 . Note que X pode ser qualquer grandeza,
massa, velocidade, carga, etc. fX (x) é a probabilidade por unidade de X, daı́
o termo densidade.
Fim do box explicativo

A densidade de probabilidade, fX (x), é uma função contı́nua por partes,


satisfazendo
fX (x) ≥ 0 (3.3)

51 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

e Z Z
dPX = fX (x) dx = 1 . (3.4)
Ω Ω
A expressão (3.4) é a condição de normalização para distribuições de variáveis
contı́nuas. A integração é sobre o espaço amostral que será um volume d-
dimensional, dependendo da dimensionalidade de X.
Exemplo 3.2
Considere os átomos de um gás ideal (não interagente). A posição ~r e a
velocidade ~u são variáveis aleatórias contı́nuas. O espaço amostral para a
posição é o espaço definido pelo recipiente que contém o gás, sendo tridimen-
sional. Para as velocidades, é o espaço definido por |u| ≥ 0, 0 ≤ φ ≤ 2π,
0 ≤ θ ≤ π, também tridimensional.

No caso do histograma, ao calcularmos a probabilidade de obter o


perı́odo do pêndulo entre determinados valores, somamos as contribuições
dos intervalos ∆τ correspondentes. No caso de uma distribuição contı́nua, se
queremos tratar de um intervalo não infinitesimal, por exemplo se queremos
saber qual a probabilidade de ter X entre os valores a e b, temos que
Z b Z b
PX (a ≤ x ≤ b) = fX (x)dx = dPX (x) . (3.5)
a a

O valor esperado de uma variável aleatória contı́nua, X, é definido de forma


equivalente a (2.16), substituindo a soma por uma integral:
Z Z
hxi = x dPX (x) = xfX (x)dx . (3.6)
Ω Ω

De uma forma geral o valor esperado de uma função h(x) é dado por
Z
hh(x)i = h(x)fX (x)dx . (3.7)

Daqui em diante usaremos o subı́ndice indeicativo da variável da distribuição


apenas quando a discriminação for necessária.

Distribuição uniforme
Um caso particular importante é o da distribuição uniforme. Neste caso
dP(x) = Cdx, onde C é uma constante que pode ser obtida por normalização,
ou seja Z Z
1
dP = C dx = CΩ = 1 ⇒ C = . (3.8)
Ω Ω Ω

CEDERJ 52
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

(a) (b)

Figura 3.4: (a) A posição angular da seta em uma roleta pode ser considerada
uma variável aleatória contı́nua. (b) Se a roleta for correta, todos os ângulos
serão igualmente prováveis dando origem a uma distribuição uniforme

Atividade 1
(Objetivos 2 e 3)
Seja X a duração da vida de um elemento eletrônico sendo representada
por uma variável aleatória contı́nua com densidade de probabilidade f(x) =
be−bx . Seja pj = P(j ≤ X < j + 1). Verifique que pj é da forma (1 − a)aj e
determine a.
deixar 4cm

Resposta comentada
Usamos a definição 3.5:

Z j+1 Z j+1
P(j ≤ X < j + 1) = f(x)dx = be−bx dx = e−bj (1 − e−b )
j j

Logo, a = e−b ,
Fim da atividade

Atividade 2
Suponha que o gráfico abaixo represente a densidade de probabilidade de
uma variável aleatória contı́nua X. Qual a relação entre a e b?

53 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

f(x)
(a,b)

-a b x

deixar 4cm

Resposta comentada
Primeiro encontramos as equações das retas:
 
b b
y1 = x+
2a 2
 
b b2
y2 = − x+
b−a b−a
Agora usamos a condição de normalização:
Z b Z a Z b
f(x)dx = 1 = y1(x)dx + y2 (x)dx = 1
−a −a a
2
Calculando as integrais obtemos a = b
− b.
Fim da atividade
Atividade 3
(Objetivos 2 e 3)
Um sistema é constituı́do por vários osciladores harmônicos unidimensionais,
cujas posições são dadas por x = A cos(ωt + α), onde a constante de fase α
é uma variável aleatória uniformemente distribuı́da entre 0 e 2π.
(a) Qual a densidade de probabilidade fX (x) de encontrar um desses os-
ciladores entre x e x + dx?
(b) Faça o gráfico de fX (x) e interprete fisicamente sua forma.
deixar 5cm

Resposta comentada
(a) Se a constante de fase é uniformemente distribuı́da, então fα (α) é uma
constante que pode ser obtida por normalização Como α está definida entre
0 e 2π, temos
Z 2π Z 2π
1
fα(α)dα = C dα = C2π = 1 ⇒ C = .
0 0 2π

CEDERJ 54
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Logo, fα(α) = 1/2π. No intervalo entre 0 e 2π há dois valores de α que geram
o mesmo valor de x, já que cos(α) = cos(2π −α). Portanto, dP(x) = 2dP(α).
Como dx = A sin(ωt + α)dα, temos que dα = dx/(A2 − x2)1/2, e finalmente,
a densidade de probabilidade desejada é:

dP(x) = fX (x)dx = 2dP[α(x)] = 2fα (α)dα(x)


1 dx 1
= 2 2 2 1/2
⇒ fX (x) = .
2π (A − x ) π(A − x2 )1/2
2

(b) O gráfico ao lado mostra a forma


de fX (x) para A = 2,0. Os valores
máximos estão em x ± A, ou seja,
é mais provável que encontremos os
osciladores nas regiões próximas aos
extremos, ou pontos de retorno. Esse
resultado é fácil de entender, nesses
pontos a velocidade é menor, portanto
o tempo de permanência é maior.

Fim da atividade
Atividade 4
(Objetivos 2 e 3)
Suponha que X seja uniformemente distribuı́da entre −α e +α. Detemine
α > 0 de modo a satisfazer as seguintes condições:
(a) P(X > 1) = 1/3
(b) P(X < 0, 4) = 0,6
(c) P(X > 1) = 0,5
(d) P(X < 0, 5) = 0,7

Resposta comentada
Como explicado no texto que antecede a equação (3.8), temos que P(x) é da
forma P(x) = C. O valor de C deve satisfazer a condição de normalização:
Z +α
1
Cdx = 1 =⇒ C =
−α 2α
(a) P(X > 1) = 1/3
Z +α
1 1 α−1 1
dx = → = →α=3
1 2α 3 2α 3

55 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

(b) P(X < 0,4) = 0,6


Z 0,4
1 0,4 + α
dx = 0,6 → = 0,6 → α = 2,0
−α 2α 2α
(c) P(X > 1) = 0,5
Z +α
1 α−1
dx = 0,5 → = 0,5 → não tem solução
1 2α 2α
(d) P(X < 0,5) = 0,7
Z 0,5
1 0, 5 + α 5
dx = 0,7 → = 0,7 → α =
−α 2α 2α 4

Fim da atividade

Distribuição gaussiana
Vampos voltar ao caso da distribuição binomial estudada na Aula 2.
Tomando como exemplo a jogada da moeda, obtivemos que a probabilidade
de se obter n caras numa sequência de N jogadas de moeda é dada por
P(N, n) = CN,n pn q N −n = n!(NN−n)!
!
pn q N −n onde p é a probabilidade de se
obter cara em uma jogada e q = 1 − p, a de se obter coroa. Na Fı́sica sempre
estaremos interessados em sistemas com valores de N muito grandes, por isso
é conveniente verificar o comportamento da distribuição binomial quando
N  1. À medida que aumentamos N, P(N, n) tem valores apreciáveis
apenas nas vizinhanças de seu máximo, como pode ser visto na figura 2.3,
por isso vamos examinar essa região. Note que mesmo quando p 6= q, a região
do máximo é aproximadamente simétrica se os valores de p e q não forem
muito diferentes.
Vamos trabalhar com o log da distribuição, porque estaremos con-
siderando uma região de valores de n em que P(N, n) varia muito. Temos
assim, a partir da distribuição binomial, equação (2.13), que

ln P(N, n) = ln N! − ln n! − ln(N − n)! + n ln p + (N − n) ln q . (3.9)

Quando N  1 teremos problemas no cálculo de N! e de ln P(N, n). Por


isso usamos a aproximação de Stirling para o fatorial de um número muito
grande:
ln N! = N ln N − N + O(ln N) , N  1. (3.10)
A obtenção dessa expressão pode ser vista com detalhes no livro Introdução
à Fı́sica Estatı́stica indicado como referência no fim da aula. O sı́mbolo

CEDERJ 56
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

O(ln N) significa “termo da ordem de ln N”, o que quer dizer que a expansão
indicada difere de ln N! por um valor cuja ordem de grandeza é ln N. Seja
ñ o valor mais provável de n, ou seja, aquele para o qual P(N, n) é máxima:
Pmax = P(N, ñ). Podemos escrever esse valor como ñ = rN, 0 < r < 1. Se
p e q não forem muito diferentes, perto do máximo, tanto n quanto N − n
serão números da ordem de N. Usamos a aproximação de Stirling para os
fatoriais desses números desprezando os termos O(ln N), ficando com

ln P = N ln N − N − n ln n + n − (N − n) ln(N − n) + N − n
+ n ln p + (N − n) ln q . (3.11)

Podemos calcular a posição do máximo para N  1 extremizando ln PN .


Obtemos
dln P(N, n)
= − ln ñ + ln(N − ñ) + ln p − ln q = 0 , (3.12)
dn
levando a
ñ = pN ≡ hni , (3.13)
onde usamos a expressão (2.17) para hni.
Verificamos a concavidade:
d2 ln P(N, n) 1 1
2
=− − , (3.14)
dn n N −n
quando n = ñ temos

d2 ln P(N, n) 1 1
= − = − <0, (3.15)
dn2
n=ñ Npq σ2

ou seja, o extremo é um máximo.


Agora, expandimos a distribuição perto do máximo, porque essa é a
região que nos interessa descrever. Para isso tomamos n = ñ + ,   ñ.
Mantendo apenas até o termo quadrático temos

dln P 1 2 d2ln P
ln P(N, n) ≈ ln P(N, ñ) +  +  +··· (3.16)
dn n=ñ 2 dn2 n=ñ
| {z } | {z }
0 − N1pq

Exponenciando, teremos
   
(n − ñ)2 (n − hni)2
P(N, n) = C exp − = C exp − , (3.17)
2Npq 2σ 2

onde a expressão (2.20) foi usada na identificação de σ.

57 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

A constante de normalização, C, pode ser encontrada se impomos que


a soma das probabilidades para todos os valores possı́veis de n é 1, ou seja,
Z +∞  
(n − hni)2
dn C exp − =1. (3.18)
−∞ 2σ 2

Esta integral, e outras similares, vai aparecer muitas vezes nas próximas
aulas, por isso vale a pena ver como ela pode ser calculada.
Nosso objetivo é calcular a integral
Z +∞
2
I≡ du e−u , (3.19)
−∞

que pode ser calculada com com a definição de variáveis complexas, ou usando
o truque descrito a seguir. O ponto de partida é a integral I 0 no plano xy,
escrita em coordenadas polares como
Z 2π Z ∞ " #∞
−r 2
2 e
I0 ≡ dφ e−r rdr = 2π − =π. (3.20)
0 0 2
0

Mas I 0 também pode ser escrita em coordenadas cartesiana, dando


Z +∞ Z +∞
 
0
I = dx exp −(x2 + y 2 ) dy
−∞ −∞
Z +∞  Z +∞ 
−x2 −y2
= e dx e dy = I 2 .
−∞ −∞

Logo, Z +∞ √
2
e−u du = π. (3.21)
−∞

Obtemos, assim, a expressão final normalizada


 
1 (n − hni)2
P(n) = √ exp − , (3.22)
σ 2π 2σ 2
ou  
1 (n − Np)2
P(n) = √ exp − . (3.23)
2πNpq 2Npq
As expressões (3.22) e (3.23) definem o que chamamos de distribuição Gaus-
siana, também chamada distribuição normal.
Atividade 5
(Objetivos 3 e 5)
(a) Mostre que r
Z +∞
−ax2 π
e dx = . (3.24)
−∞ a

CEDERJ 58
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

(b) Use esse resultado para calcular a constante de normalização C da equação


(3.18).
(c) Mostre que r
Z ∞
2 −ax2 1 π
x e dx = a>0 (3.25)
0 4a a
Dica: observe a igualdade
Z ∞ Z ∞
d −ax2 2
e dx = − x2 e−ax dx .
da 0 0

deixar 5 cm

Resposta comentada
(a) Partimos da equação (3.21), e fazemos uma troca de variáveis:

√ √
u= ax → du = a dx

Com isso temos


Z +∞ Z +∞
r
−ax2 1 −u2 π
e dx = √ e du =
−∞ a −∞ a

(b) Basta fazer as identificações: y = x − hxi e a = 2σ 2 em (3.18).


(c) O integrando da equação (3.21) é uma função par, portanto podemos
escrever Z ∞ r
−ax2 1 π
e dx =
0 2 a
Usamos a dica:
Z ∞  r  r
d −ax2 d 1 π 111 π
e dx = =−
da 0 da 2 a 22a a

Fim da atividade
Atividade 6
(Objetivo 4)
Verifique a validade da aproximação gaussiana.
deixar 5cm

Resposta comentada
A forma gaussiana foi obtida ao trucarmos a expansão de log P até o termo
quadrático, assim, devemos ver os efeitos da truncagem na expressão (3.16).

59 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

Calculemos o primeiro termo que foi desprezado, e que envolve a terceira


derivada:

1 3 d3ln P(N, n) 1 q −p 1 q −p
 3
= 3 2 2 2 = (n − ñ)3 2 2 2 . (3.26)
3! dn
n=ñ 6 N pq 6 N pq

Para que a aproximação Gaussiana seja boa este termo, de ordem cúbica
em , deve ser menor que o anterior, de ordem quadrática em . Ou seja,
devemos ter
1 |q − p|
|n − ñ|2  2 2 2
|n − ñ|3 , (3.27)
2Npq 6N p q
ou seja,
3Npq
|n − ñ|  . (3.28)
|q − p|
A expressão (3.28) define a região em torno do máximo onde a aproximação
é válida. Para um dado valor de N, quanto mais próximos forem p e q
maior é |p − q| −1 e mais fácil será satisfazer a condição (3.27). Por outro
lado, dados p e q, quanto maior for N, mais fácil será satisfazer a condição
Fora do intervalo definido em (3.28), ou seja, para |n − ñ| ≥ 3Npq/|q − p|,
temos P ∼ exp[−9N 2 p2 q 2/(2Npq|q − p|2 )] → 0 para N → ∞, portanto a
aproximação é boa para Npq  1.

Propriedades da distribuição gaussiana

Para esta análise usaremos a forma (3.22) da distribuição gaussiana, ou


seja  
1 (n − hni)2
P(n) = √ exp − .
σ 2π 2σ 2
Como partimos da distribuição binomial, a variável, n, que representava
o número caras, é adimensional. Dessa forma, σ 2 = hn2 i − hni2 também
é uma grandeza adimensional. Para que possamos generalizar o resultado
para qualquer variável real, temos que definir a variável real x relacionada
com n como: x = `n, sendo ` um número real com a mesma dimensão de x.
Mantendo a notação usada para a densidade de probabilidade, temos:
 
1 (x − hxi)2
fG (x) = √ exp − . (3.29)
σ 2π 2σ 2

Aqui o subı́ndice G identifica que estamos tratando de uma distribuição


especı́fica, a gaussiana. Agora σ tem a mesma unidade de ` e fG (x) tem
unidade de `−1 , sendo dP(x) = fG (x)dx adimensional.

CEDERJ 60
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Agora vamos examinar sua forma geral. Notamos que trata-se de uma
função simétrica com relação a x = hxi, ou seja P(hxi + ∆) = P(hxi − ∆),
para qualquer valor de ∆. Isso significa que flutuações para mais ou para
menos no valor de X são igualmente prováveis. Também temos que fG tem
seu valor máximo em X = hxi. Isso pode ser facilmente verificado através
do cálculo da derivada de fG . O valor de fG (x) no ponto de máximo é dado
por fG (hxi), e vale
1
fGmax = √ ⇒ fG (x) (3.30)
σ 2π
Com isso podemos escrever a distribuição gaussiana como
 
(x − hxi)2
fGmax exp − . (3.31)
2σ 2
Agora vamos verificar a influência dos parâmetros hxi e σ. A figura 3.5
mostra gráficos de fG (x) para diversos valores de hxi e σ. O valor de hxi dá
a posição do máximo e posiciona a curva como um todo. σ está relacionado
com sua largura e com a rapidez com que fG varia quando nos afastamos
de seu valor máximo. Vamos ver como σ está relacionado com a largura da

Figura 3.5: Gráficos de distribuições gaussianas a partir da expressão (3.29)

curva calculando em que pontos ela cai a fGmax /e ou a 36,8% de fGmax :


 
−1 (x± − hxi)2 √
fG (x± ) = fGmax e ⇒ − = −1 ⇒ x ± = hxi ± σ 2 (3.32)
2σ 2
A figura 3.6 mostra as regiões compreendidas por x ± σ e x ± 2σ. Vemos,
assim, que a região em torno do máximo, onde estão os maiores valores de
fG (x) é essencialmente definida pelo parâmetro σ.

61 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

Figura 3.6: Gráficos de distribuições gaussianas com σ = 2 e hxi = 0


mostrando as regiões compreendidas por (a) x ± σ e (b) x ± 2σ.

Atividade 7
(Objetivo 5)
Também podemos estimar a largura da distribuição gaussiana pelo cálculo
dos pontos nos quais ela cai à metade de seu valor máximo, ou seja,
fGmax
fG (x± ) =
2
Calcule x± .
diagramador: deixar 5cm

Resposta comentada
Devemos impor a condição fG (x± ) = fGmax /2 que implica em
(x± − hxi)2 √
= ln 2 ⇒ x ± = hxi ± σ 2 ln 2 (3.33)
2σ 2
Fim da atividade

Vamos agora calcular os valores da probabilidade de se encontrar X em


diversas regiões finitas da curva, a partir de seu ponto central. Primeiro
vamos calcular a probabilidade de encontrar x entre hxi−nσ e hxi+nσ, sendo
n um número inteiro. Para este cálculo a posição da curva não importa,
já que a curva é simétrica em relação a hxi. Então podemos tomar, por
simplicidade, hxi = 0. Usamos a expressão (3.5) para este cálculo:
Z +nσ  
1 x2
P(−nσ ≤ x ≤ +nσ) = √ exp − 2 dx . (3.34)
σ 2π −nσ 2σ

CEDERJ 62
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

√ √
Agora fazemos a troca de variável x/σ 2 ≡ u, dx = σ 2 du. Com isso a
integral toma a forma:
Z +n/√2
1 2
P(−nσ ≤ x ≤ +nσ) = √ √
e−u du . (3.35)
π −n/ 2
Esta integral não pode ser calculada analiticamente, portanto, devemos con-
sultar alguma tabela. Esta integral em geral aparece nas tabelas relacionada
com a função erro que tem a seguinte definição:
Z a Z +a
2 −u2 1 2
erf(a) ≡ √ e du = √ e−u du . (3.36)
π 0 π −a
Assim, temos que,
 
n
P(−nσ ≤ x ≤ +nσ) = erf √ . (3.37)
2
Box multimidia
Um lugar ótimo para consultas matemáticas pela internet é a página:
http://mathworld.wolfram.com.
Nela você pode encontrar tudo que precisa num curso de fı́sica, inclusive uma
ferramenta on-line para o cálculo de integrais indefinidas.
Fim do Box multimidia

Consultando uma tabela de integrais encontramos:

n P(−nσ ≤ x ≤ +nσ)
1 0,6827
2 0,9545
3 0,9973

Este resultado significa que, ao realizar uma experiência ideal, com


um número muito grande de repetições, descrita pela distribuição gaussiana,
cerca de 68% dos valores medidos estarão no intervalo hxi± σ. Se considerar-
mos uma faixa de valores de 4σ em torno do valor mais provável, teremos aı́
cerca de 95% dos dados. Em resumo, a chance de se obter um valor diferente
do esperado em mais de 2σ é muitı́ssimo pequena. Quanto menor for o valor
de σ, mais iguais a hxi serão os valores medidos. A figura 3.6 ilustra essas
faixas numa gaussiana com σ = 2.

Para finalizar devemos dizer que, embora tenhamos examinado uma dis-
tribuição especı́fica, os resultados encontrados aplicam-se qualitativamente a

63 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

várias outras distribuições. Como a forma gaussiana é fácil de tratar matem-


aticamente, ela é em geral usada para descrever vários sistemas com variáveis
aleatórias.
Atividade 8
(Objetivos 3, 4 e 5)
Um conjunto de partı́culas está espalhado sobre o plano x−y com a densidade
de probabilidade
f(x, y) = C exp(−r2) ,
onde r2 = x2 + y 2. Ou seja, a probabilidade de se encontrar uma partı́cula
com abcissa entre x e x + dx e ordenada entre y e y + dy é f(x, y)dxdy.
(a) Calcule C.
(b) Calcule a probabilidade de se encontrar uma partı́cula com x > 1.
(c) Qual a probabilidade de se encontrar três partı́culas do mesmo lado da
linha x = 1.
deixar 6cm

Resposta comentada
(a) O valor de C vem da normalização. Em coordenadas cilı́ndricas:
Z 2π Z ∞
1 1
dφ C exp(−r2 )r dr = 2πC = 1 =⇒ C = .
0 0 2 π
Em coordenadas cartesianas:
Z +∞ Z +∞ Z 2
 2 2
 +∞ √ 2
C exp −(x + y ) dx dy = C exp(−x )dx =1
−∞ −∞ −∞

Logo,
1
C= .
π
(b) As variáveis x e y são independentes, por isso vale a regra da multi-
plicação:
h√ i h√ i
P(x, y) = P(x)P(y) = C exp(−x2) C exp(−y 2)
| {z }| {z }
P (x) P (y)

Agora podemos calcular a probabilidade pedida. Integramos sobre todos os


valores de y e sobre os valores de x que satisfazem à condição x > 1:
Z +∞ Z +∞ Z +∞
1
P(x > 1) = P(y)dy P(x)dx = √ exp(−x2 )dx
−∞ 1 π 1

CEDERJ 64
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Agora vamos usar a definição de função erro cujo valor pode ser encontrado
em diversas tabelas:
Z a
2 2
erf(a) = √ e−u du =⇒ erf(1) = 0,8427
π 0

Temos:
Z +∞ Z +∞ Z 1 √ √
2 2 2 π π
exp(−x )dx = exp(−x )dx − exp(−x )dx = − erf(1)
1 0 0 2 2

Logo,
1 1
P(x > 1) = − erf(1) = 0,07865
2 2
(c) No item anterior calculamos a probabilidade de um ponto estar à direita
da reta x = 1. A probabilidade do ponto estar à esquerda, é P(x < 1), é

P(x < 1) = 1 − P(x > 1) = 0,92135

Logo, a probabilidade de três pontos estarem do mesmo lado (não importa


qual) é:
P(mesmo lado) = P(x > 1)3 + P(x < 1)3 = 0, 7826

Fim da atividade

Distribuição delta de Dirac


A função delta de Dirac define uma distribuição infinitamente concen-
trada em um único valor. Para entender sua forma imagine o comportamento
da distribuição gaussiana quando σ → 0. A figura 3.7 mostra o gráfico da
distribuição gaussiana na forma da equação (3.29) com hxi = 0 e σ = 1,0,
σ = 0,5 e σ = 0,1 . À medida que σ diminui a distribuição torna-se mais es-
treita e alta, ficando mais concentrada na região onde x = hxi. Agora vamos
considerar a integral que define o valor médio de uma determinada função
de X, sendo X uma variável aleatória regida pela distribuição gaussiana,
usando a equação (3.7) Temos
Z
hh(x)i = h(x)fX (x)dx

Z +∞  
1 (x − hxi)2
= √ h(x) exp − dx . (3.38)
σ 2π −∞ 2σ 2

Vamos analisar o integrando. Considere que hxi = 0 e σ = 1. Pelo gráfico


da distribuição (figura 3.7, linha contı́nua) vemos que se x ≤ −3 ou x ≥ 3

65 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

Figura 3.7: Gaussianas traçadas com ajuda da equação (3.29) com diferentes
de σ. Note que à medida que σ diminui a distribuição torna-se cada vez mais
alta e estreita.

fG (x) ≈ 0. Assim, se a função h(x) tiver valor finito no intervalo −3 ≤ x ≤ 3,


podemos dizer que
Z +∞  2
1 x
hh(x)i = √ h(x) exp − dx
2π −∞ 2
Z +3  2
1 x
≈ √ h(x) exp − dx (3.39)
2π −3 2

Vamos repetir esse raciocı́nio agora para σ = 0,5, que é a curva com linha
tracejada na figura 3.7. Esta distribuição está bem mais concentrada em
torno x = hxi = 0. Por isso podemos considerar contribuições à integral
apenas na região −1,5 ≤ x ≤ 1,5 :
Z +∞  
1 x2
hh(x)i = √ h(x) exp − dx
0,5 2π −∞ 0,5
Z +1,5  
1 x2
≈ √ h(x) exp − dx (3.40)
0,5 2π −1,5 0,5

Seguindo o mesmo raciocı́nio para σ = 0,1 temos


Z +∞  
1 x2
hh(x)i = √ h(x) exp − dx
0,1 2π −∞ 0,02
Z +0,4  
1 x2
≈ √ h(x) exp − dx (3.41)
0,1 2π −0,4 0,02

CEDERJ 66
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Se continuamos a diminuir σ o intervalo que mais contribui para hh(x)i vai


ficando cada vez mais reduzido. O caso extremo seria σ → 0, que é o limite
que dá a distribuição delta. Nesse caso o único valor que contribui é o valor no
ponto x = hxi = 0, onde está concentrada a distribuição, ou seja, poderı́amos
escrever Z
lim hh(x)i = h(x)δ(x)dx = h(0)
σ→0 Ω
Assim, considerando o caso mais geral em que hxi = x0 , terı́amos
Z
h(x)δ(x − x0)dx = h(x0 ) (3.42)

Atividade 9
Objetivos(3, 4 e 5)
A densidade de probabilidade de se encontrar um elétron com energia E
numa certa situação é dada por
f(E) = 0,2 δ(E − E0 ) E < 0
= 0,8
b
exp (−E/b) E > 0

onde δ(E − E0 ) é a função delta de


Dirac. Considere E0 = −1,5 eV e b = 1
f(E)
eV. Esta distribuição nos diz que para
E < 0 a energia é quantizada, sendo
E = −1,5 eV o único valor possı́vel.
0,8
Se E > 0 a energia tem um espectro
contı́nuo.
(a) Qual a probabilidade de que E seja 1 2
-1,5 E(eV)
0
maior que 1,0 eV?
(b) Qual é a energia média do elétron?
deixar 5cm

Resposta comentada
(a) Aqui usamos a equação (3.5)
Z ∞ Z ∞
0,8 −E/b
P(E > 1,0) = P(E)dE = e dE = 0,8e−1/b
1,0 1,0 b
(b) Agora usamos a definição de média, equação (3.6):
Z ∞
hEi = EP(E)dE
−∞
Z 0 Z ∞
0,8 −E/b
= E 0,2 δ(E − E0 )dE + E e dE
−∞ 0 b
= 0,2E0 + 0,8b = 1,1 eV

67 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

fim da atividade

Aplicação: distribuição de Maxwell-Boltzmann


Ao final do século XIX a teoria atomı́stica da matéria estimulou di-
versos estudos sobre sistemas de partı́culas microscópicas, trazendo um novo
entendimento dos materiais. A ideia básica nas teorias dessa época era des-
crever o movimento das partı́culas através da Mecânica Clássica e usar algum
tratamento estatı́stico para gerar as grandezas macroscópicas observáveis.
Um dos pricipais resultados é a distribuição de velocidades de Maxwell-
Boltzmann. O modelo proposto é o de um gás clássico, de partı́culas pontuais,
com velocidades ~u aleatóriamente distribuı́das de acordo com
 
3
 m 3/2 mu2
dP(~u) = f(~u)d u = exp − u2 sen θdθdφdu, (3.43)
2πκT 2κT
sendo m a massa das partı́culas, T a temperatura, θ o ângulo com relação
ao eixo z e φ o ângulo com relação ao eixo x. f(~u)d3 u dá a probabilidade
de se encontrar uma molécula com módulo de velocidade entre u e u + du e
movimento na direção definida pelos ângulos entre θ e θ+dθ e entre φ e φ+dφ.
Como não há direção privilegiada neste modelo, podemos integrar a parte
angular de dP(~u) para obter a distribuição dos módulos das velocidades:
 
 m 3/2 mu2
dP(u) = 4π exp − u2du ≡ P(u)du (3.44)
2πκT 2κT

A partir do conhecimento de P(u) podemos calcular grandezas termodinâmicas


tais como a energia interna, que nada mais é do que a energia cinética média.
Vamos ver como esse cálculo pe feito. Temos que
  Z ∞
1 2 1 2 3
Eint = N mu = N mhu i = u2 P(u)du = NκT . (3.45)
2 2 0 2

Conclusão
Dependendo da natureza do problema a ser resolvido, podemos utilizar
variáveis aleatórias contı́nuas para estudá-lo. Isso pode ocorrer porque o
sistema é intrinsecamente contı́nuo ou porque os valores discretos estão muito
próximos além de serem muito numerosos.
Podemos estender as definições introduzidas no estudo das variáveis
aleatórias discretas pela definição da densidade de probabilidade. Em vez

CEDERJ 68
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Figura 3.8: Gráfico da distribuição de Maxwell-Boltzmann dada pela equação


(3.44). Estão indicadas: velocidade mais provável (ump = (2κT /m)1/2), ve-
p
locidade quadrática média (uqm ≡ hu2 i = (3κT /m)1/2) e velocidade média
(hui = (8κT /m)1/2 )

de considerarmos a probabilidade de ocorrência de um determinado valor da


variável, passamos a usar a probabilidade de a encontrarmos em um determi-
nado intervalo infinitesimal. A passagem natural da descrição discreta para a
contı́nua é através da construção de um histograma. Formalmente podemos
obter uma distribuição contı́nua a partir de uma discreta tomando o limite
N → ∞. Por exemplo, desta forma pudemos obter a distribuição gaussiana
a partir da binomial.
A distribuição gaussiana, além de ser matematicamente fácil de lidar,
tem uma propriedade importante: quando nos afastamos de seu valor máximo
ela cai com uma rapidez que depende do valor de σ. Isso significa que ela des-
creve sistemas para os quais a probabilidade de se encontrar valores muito
maiores ou menores que a média é muito pequena. Em outras palavras,
são sistemas que podem ser caracaterizados pelo valor médio ou esperado
de alguma grandeza, como o número de palitos de fósforo numa caixa ou a
magnetização de um sólido.

Atividade Final
(Objetivos 1, 2, 3, 4, 5)

69 CEDERJ
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
Física Estatística e
Matéria Condensada

O histograma da figura 3.3 tem uma forma que sugere uma distribuição
gaussiana. Encontre a expressão da gaussiana que poderia ser usada para
descrever esse conjunto de dados. A tabela usada para a construção do
histograma é:

τ (s) f τ (s) f
1,6 0,002 2,8 0,201
1,8 0,007 3,0 0,175
2,0 0,028 3,2 0,112
2,2 0,067 3,4 0,073
2,4 0,132 3,6 0,025
2,6 0,168 3,8 0,008

deixar 5cm

Resposta comentada
Amos usar a expressão (3.29) com τ no lugar de x. Os valores de hτ i e σ para o
conjunto de dados que gerou o histograma são 2,79 s e 0,4 s, respectivamente.
Antes de traçar a curva temos que pensar como foi feita a normalização no
caso do histograma. Cada barra vertical tem uma altura que depende do valor
de ∆τ escolhido, porque é proporcional ao número de medidas no intervalo.
Portanto, a grandeza f do eixo vertical não é a densidade de probabilidade,
mas a probabilidade de encontrar o perı́odo entre τ e τ + ∆τ . Assim, a
expressão correta para ajustar é fG (τ )∆τ . A figura a seguir mostra essa
curva sobreposta ao histograma.

CEDERJ 70
Aula 3 - Descrição estatı́stica de um sistema contı́nuo
MÓDULO 1 - AULA 3

Resumo
Nesta aula vimos como estender as noções de probablilidade e dis-
tribuição a sistemas descritos por variáveis contı́nuas. Essa passagem se
dá naturalmente através da construção de histogramas, uma ferramenta es-
tatı́stica muito úitl para a análise de sistemas com um número grande de
elementos.
A descrição estatı́stica dos sistemas contı́nuos se dá através da densi-
dade de probalidade que é uma função que permite o cálculo de médias em
geral. Dentre as densidades mais usadas destacamos a função uniforme, que
dá a mesma densidade de probabilidade para qualquer intervalo da variável
aleatória em questão, e a gaussiana que tem a densidade concentrada em
torno do valor médio. Vimos também que é possı́vel obter distribuição gaus-
siana a partir da distribuição binomial no limite N → ∞.

Informações sobre a próxima aula


Na próxima aula vamos revisar alguns conceitos e modelos já estudados
em Introdução à Mecânica Quântica.

Leitura complementar
Distribuições contı́nuas e distribuição gaussiana

• P. L. Meyer, Probabilidade-Aplicações à Estatı́stica, primeira edição,


LTC editora. Teoria Cinética e distribuição de Maxwell

• S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São


Paulo, EDUSP: capı́tulo 1.

• H. Moysés Nussenzveig, Curso de Fı́sica Básica 2 - Fluı́dos, Oscilações


e Ondas, Calor, 2002, editora Edgard Blücher: capı́tulo 11

• Halliday, Resnick e Walker. Fundamentos de Fı́sica volume 2, quarta


edição, LTC editora, capı́tulo 21

71 CEDERJ
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

Aula 4 - Modelos quânticos


19 de Janeiro de 2015

Meta
Apresentar e rever diversos conceitos e modelos básicos de Mecânica
Quântica, que serão necessários para o estudo de processos atômicos.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Reconhecer e aplicar conceitos básicos de Mecânica Quântica;

2. Identificar as propriedades de espectros de energia em algum sistemas;

Pré-requisitos
É fundamental que você reveja todo o conteúdo de Introdução à Mecânica
Quântica.

Introdução
Como vimos na Aula 1, nosso objetivo nesta disciplina é entender as
propriedades macroscópicas, tais como condutividade e calor especı́fico, a
partir do conhecimento de propriedades das partı́culas que os constituintem.
Essas partı́culas podem ser átomos, fótons ou elétrons, por exemplo, trazendo
a necessidade de uma descrição através da Mecânica Quântica. Nesta Aula
vamos desenvolver, de forma resumida, a descrição quântica dos sistemas que
estudaremos nas próximas aulas. O ponto de partida é uma breve revisão do
conteúdo de Introdução à Mecânica Quântica.

Mecânica Quântica: uma breve revisão


Como você deve se lembrar, na Mecânica Clássica há dois conceitos
básicos: o de onda e o de partı́cula. O primeiro se refere a perturbações que

73 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

se propagam em um dado meio. Exemplos são as ondas sonoras no ar, as


ondas em uma corda ou na superfı́cie de um lago, ou ainda as ondas eletro-
magnéticas (o meio neste caso é o campo eletromagnético). Já o conceito de
partı́cula se aplica a objetos materiais cujas dimensões sejam muito pequenas
em relação às da região do espaço onde o objeto se move. Um exemplo seria
o movimento de um grão de poeira flutuando no ar, dentro de uma sala. Se
você quiser uma definição mais precisa de partı́cula, você poderá dizer que é
um ponto matemático ao qual associamos algumas propriedades, como massa
ou carga elétrica.

Exemplo 4.1
A Terra é aproximadamente uma esfera de cerca de 6.400 km de raio. É
claro que em relação a nós ou em relação aos objetos que nos circundam,
você jamais descreveria a Terra como uma partı́cula. Pois pense então no
movimento da Terra em torno do Sol, numa órbita de cerca de 150 milhões
de quilômetros. A relação “raio da Terra/raio da órbita” resulta em um
número muito pequeno. Façamos as contas juntos: se você representar a
órbita por um cı́rculo de 15 cm de raio, a Terra teria que ser representada
por um cı́rculo de raio igual a aproximadamente 6,4×10−4 cm, ou seja, mais
ou menos o tamanho de uma bactéria! É por isto que quando descrevemos o
movimento dos planetas no sistema solar podemos tratá-los como partı́culas.

A função de onda
Feitas estas considerações fica claro que, para os fı́sicos no inı́cio do
século XX, associar a um átomo, cujas dimensões são da ordem de um bi-
lionésimo de metro, o modelo de partı́cula seria absolutamente justificável.
E o mesmo deveria valer para as partı́culas subatômicas. Mas como você já
aprendeu, o modelo de partı́cula não descreve adequadamente o comporta-
mento do átomo, nem dos seus constituintes. A questão é que esses objetos
apresentam, em algumas circunstâncias, comportamentos que identificamos
como caracterı́sticos de uma partı́cula, enquanto que em outras, compor-
tamentos caracterı́sticos de fenômenos ondulatórios, como difração e inter-
ferência. É claro que no mundo macroscópico não encontramos nada que se
comporte dessa forma dual (ora como partı́cula, ora como onda), de modo
que não podemos fazer uma imagem do que seja um átomo ou uma partı́cula
sub-atômica (por comodidade e tradição, vamos continuar nos referindo a
esses objetos como partı́culas). Você pode pensar que isto talvez represen-

CEDERJ 74
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

tasse um obstáculo intransponı́vel para a formulação de uma teoria capaz de


descrever o mundo microscópico. Portanto, é de fato admirável que os fı́sicos
no inı́cio do século XX tenham conseguido construir tal teoria, baseada em
alguns conceitos bastante abstratos, mas que se mostra extremamente bem
sucedida na descrição da Natureza na escala atômica.
Enquanto na Mecânica Clássica o estado dinâmico de uma partı́cula
em um instante t fica especificado pela sua posição ~r(t) e seu momento
~p(t), na Mecânica Quântica tal estado é especificado através de uma função
de onda Ψ(~r , t), que em geral assume valores complexos. O significado
fı́sico da função de onda é dado pelo postulado de Born, segundo o qual
|Ψ(~r, t)|2 ≡ Ψ∗ (~r, t)Ψ(~r, t) fornece a densidade de probabilidade de se en-
contrar a partı́cula em um ponto ~r , no instante t. Ψ∗(~r , t) é o conjugado
complexo de Ψ(~r, t), ou seja,
)
Ψ(~r, t) = Re(Ψ) + iIm(Ψ)
|Ψ(~r, t)|2 = [Re(Ψ)]2 + [Im(Ψ)]2
Ψ∗ (~r, t) = Re(Ψ) − iIm(Ψ)

Usando a notação da Aula 3, podemos escrever

dP(~r , t) = P(~r, t)d~r = |Ψ(~r, t)|2d~r (4.1)

sendo a condição de normalização dada por


Z +∞ Z +∞ Z +∞
dP(~r, t) = P(~r, t)d~r = |Ψ(~r, t)|2d~r = 1 (4.2)
−∞ −∞ −∞

O postulado de Born explicita o caráter probabilı́stico da descrição da Na-


tureza que a Mecânica Quântica nos oferece. Veja que na Mecânica Quântica
perde sentido perguntar “qual a posição da partı́cula em um instante t”, a
pergunta deve ser “qual a probabilidade de que a partı́cula seja encontrada
numa dada posição ~r no instante t”.
Para compreendermos um pouco melhor o que isto significa, compare-
mos as previsões da Mecânica Clássica com as da Mecânica Quântica para um
sistema constituı́do por uma única partı́cula movendo-se em uma dimensão.
Segundo a Mecânica Clássica, se você tomar cópias idênticas desse sistema,
igualmente preparadas de modo a estarem no mesmo estado inicial, (isto é,
partı́culas partindo da mesma posição e com a mesma velocidade), ao medir
nas diversas cópias a posição da partı́cula em um dado instante t1 você en-
contrará (a menos de erros experimentais) o mesmo resultado, digamos x1.
Já na Mecânica Quântica, cada cópia poderá lhe fornecer um resultado difer-
ente, não importa quão precisos sejam os equipamentos de medida! Haverá,

75 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

portanto, uma distribuição de resultados, cada um com uma densidade de


probabilidade de ocorrência dada por P(~r, t1) = |~r, t1 )|2. Vamos considerar
o caso unidimensional. Neste caso podemos falar na posição mais provável
da partı́cula no instante t, que corresponderá ao valor de posição para o qual
a distribuição P(x, t) passa por um máximo. Podemos, também, calcular o
valor esperado da posição, ou posição média, dado por
Z +∞ Z +∞
hxi ≡ xP(x, t)dx = x|Ψ(x, t)|2dx (4.3)
−∞ −∞

Neste ponto você poderá estar pensando: seria o caráter probabilı́stico uma
limitação da Mecânica Quântica ou um aspecto intrı́nseco da Natureza? Esta
questão foi e ainda é tema de intenso debate, mas, embora não se tenha uma
conclusão definitiva, há fortes indicações de que o caráter probabilı́stico seja
algo intrı́nseco à Natureza.

A equação de Schrödinger
Na Mecânica Clássica, a evolução no tempo do estado dinâmico de uma
partı́cula (como a posição e o momento linear variam no tempo) é dada pelas
leis de Newton. Já na Mecânica Quântica, a evolução no tempo do estado
dinâmico de uma partı́cula sujeita ao potencial U(~r ) (função de onda) é dada
pela equação de Schrödinger

~2 2 ∂Ψ(~r, t)
− ∇ Ψ(~r , t) + U(~r )Ψ(~r, t) = i~ (4.4)
2m ∂t
Podemos escrever a equação (4.4) em função do operador hamiltoniano H
definido como
~2 2
H≡− ∇ + U(~r ) . (4.5)
2m
O primeiro termo na definição de H corresponde à energia cinética e o
seguinte, à nergia potencial. Com a definição desse operador a equação (4.4)
pode ser reescrita como

∂Ψ(~r, t)
HΨ(~r , t) = i~ . (4.6)
∂t

Com base nas equações (4.4) ou (4.6) temos que, se conhecermos o


estado inicial da partı́cula, dado por Ψ(~r, 0), podemos determinar Ψ(~r.t) para
qualquer t > 0. Na disciplina Introdução à Mecânica Quântica, você teve
oportunidade de estudar as soluções dessa equação para diversos potenciais

CEDERJ 76
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

U(~r ). Aprendeu também que, no caso de potenciais que não dependam do


tempo, como os considerados aqui, você pode usar a técnica de separação
de variáveis, escrevendo a função de onda como o produto de uma função
dependente somente da posição por outra dependente somente de t: Ψ(~r, t) =
ψ(~r)ξ(t). Substituindo esta expressão na equação (4.4) (ou (4.6)) temos que
ξ(t) = exp − iεt

~
e que ψ deve satisfazer

~2 2
Hψ = − ∇ ψ + U(~r )ψ = εψ (4.7)
2m
A equação (4.7) é denominada equação de autovalores para o hamiltoniano
do sistema. Ela admite um conjunto infinito de soluções {ψα(~r), εα } que são
os autoestados ψα(~r) e autovalores εα , que dão os possı́veis valores de energia
para o sistema. Aqui α representa um conjunto de números quânticos , como
veremos mais à frente. Chamaremos de orbital a solução da equação de
Schödinger para uma partı́culas, seja qual for o potencial.

Solução para alguns potenciais


Nesta seção vamos rever alguns potenciais que foram vistos em In-
trodução à Mecânica Quântica e que serão utilizados na modelagem dos
sólidos. A maneira de obter a solução ψ(~r) não é importante neste momento.
Nosso objetivo é entender que sistema real pode ser descrito por esses poten-
ciais e quais as propriedades de seu espectro de energias.

Partı́cula livre numa caixa tridimensional


Começamos pelo caso mais simples, o da partı́cula livre numa caixa
tridimensional, visto com detalhes na Aula 18 de Introdução à Mecânica
Quântica. Usaremos esse modelo para descrever um gás de partı́culas não
interagentes confinado a um certo volume cúbico V = Lx Ly Lz , o que corre-
sponde ao seguinte potencial

U(x, y, z) = 0 , 0 < x < Lx , 0 < y < Ly , 0 < z < Lz


= ∞ para os outros valores de x, y e z (4.8)

que define uma caixa de paredes instransponı́veis. Sem perder a generalidade,


podemos escolher Lx = Ly = Lz = L, levando a V = L3 . Como o potencial
é nulo dentro do volume, a partı́cula confinada tem apenas energia cinética.

77 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

Este problema pode ser resolvido por separação de variáveis porque o


movimento em cada direção é completamente independente. A função de
onda pode então ser escrita como

ψ(x, y, z) = ψx (x)ψy (y)ψz (z) (4.9)

sendo ψx (x), ψy (y) e ψz (z) as funções de onda relativas a cada direção. Este
procedimento vai simplificar muito a solução do problema. Substituindo a
forma (4.9) para a função de onda na equação (4.7) com U = 0 temos
 2   2   2 
∂ ψx ∂ ψy ∂ ψz
Hψ(~r) = ψy ψz + ψx ψz + ψx ψy
∂x 2 ∂y 2 ∂z 2
= εψx ψy ψz . (4.10)

Assim, basta resolver o problema unidimensional. Vamos escolher a direção


x. A equação que queremos resolver é
~2 ∂ 2 ψ x
− = εx ψ x (4.11)
2m ∂x2
A solução da equação (4.11) será uma onda plana que pode ser escrita como
uma combinação linear de senos e cossenos: ψx (x) = A cos kx x + B sen kx x
ou como a soma de ondas planas em sentidos opostos, ψ = Ce−ikx + De+ikx .
Seja qual for a escolha, a energia cinética referente ao movimento na direção
x da partı́cula é
(~kx )2
εx = . (4.12)
2m
Repetindo o procedimento para as outras direções, temos
~2 ~2 2
kx2 + ky2 + kz2 =

ε = εx + εy + εz = k . (4.13)
2m 2m
Se a partı́cula estivesse numa região sem limitações, kx , ky e kz seriam
irrestritos e os valores de energia teriam um espectro contı́nuo. O fato de
a partı́cula estar confinada a uma caixa, faz com que apenas certos valores
de energia sejam possı́veis. O confinamento define um tipo de condição de
contorno, que será usada para calcular os valores de k possı́veis. Este mo-
delo será sempre aplicado em situações em que L é macroscópico, portanto,
exceto pelas partı́culas imediatamente ao lado das paredes do recipiente,
as partı́culas do gás não serão afetadas pelo recipiente. Isso justifica, por
exemplo, que escolhamos um volume cúbico. Sendo assim, vamos usar o
que chamamos de condições fixas ou de reflexão total. Neste caso temos que
ψ(0) = ψ(L) = 0. Neste caso é mais conveniente escrever a solução na forma

ψx(x) = A cos kx x + B sen kx x . (4.14)

CEDERJ 78
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

Agora impomos que a condição de contorno:

ψx(0) = 0 ⇒ A = 0 (4.15)

e
nx π
ψx (L) = 0 ⇒ sen kx L = 0 ⇒ kx L = nx π ou kx = , (4.16)
L

onde nx = 1, 2, 3 . . .. O mesmo procedimento pode ser feito para as outras


direções, levando a ky = nLy π e kz = nLz π .
Finalmente,

~2 2
ε = k
2m
~2
kx2 + ky2 + kz2

=
2m
~2  nπ 2
= , (4.17)
2m L

sendo n2 = n2x + n2y + n2z e nx , ny , nz = 1, 2, 3 . . .


De acordo com a expressão para a energia, equação (10.1), o valor de
n pode ser usado para rotular o macroestado, definido pela energia, de uma
única partı́cula. Cada orbital é definido pela escolha dos valores de nx , ny e
nz . A multiplicidade do macroestado vem da possibilidade de se obter um

mesmo n para diferentes escolhas de nx , ny e nz . Por exemplo, n = 27 pode
ser obtido de 4 maneiras diferentes, com (nx , ny , nz ) = (5,1,1), (1,5,1), (1,1,5)
e (3,3,3). Diferentemente da distribuição binomial, não podemos encontrar
uma expressão algébrica que nos dê a multiplicidade relativa a cada n. En-
tretanto, estaremos sempre trabalhando com sistemas macroscópicos, o que
significa que L tem dimensões macroscópicas e que o espaçamento entre os
nı́veis de energia é muito pequeno; tão pequeno, que podemos assumir uma
variação contı́nua.

Atividade 1
(Objetivos 1 e 2)
Estime a separação entre os dois primeiros nı́veis de energia do gás hélio.
Suponha o gás contido num volume de 1 cm3.
deixar 5cm

79 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

Resposta comentada
Partimos da expressão para os nı́veis de energia:

~2  πn 2
ε= .
2m L
Vamos calcular o espaçamento entre os dois primeiros nı́veis. O estado fun-
damental tem nx = ny = nz = 1, ou seja, n2 = 3. O próximo nı́vel ter
n2 = 1 + 1 + 22 = 6. Assim o espaçamento entre esses dois nı́veis é

3 ~2  π 2
∆ε = .
2m L
A massa de um átomo de hélio é m ≈ 6,6−27 kg. Tomando L = 1 cm btemos

∆ε = 2,48 × 10−37 J = 1,5 × 10−18 eV .

fim da atividade

dn

(a) (b)

Figura 4.1: Ilustração da contagem de estados num gás em (a) três e (b)
duas dimensões. : figura (a) para ser feita pelo desenhista

O tamanho macroscópico do sistema permite que nx , ny e nz possam ser


consideradas variáveis contı́nuas e que a multiplicidade possa ser calculada
com relação a um intervalo de energia, entre ε e ε + dε. Começamos o cálculo
pela contagem dos orbitais entre n e n + dn. A relação entre n e nx , ny e nz
é a mesma do raio de uma esfera centrada na origem dos eixos (nx , ny , nz ).
Assim, temos que o número de estados com n menor ou igual a n é 1/8 do
volume da esfera de raio n (veja a figura 4.1), ou

1 4πn3
N (n) = . (4.18)
8 3

CEDERJ 80
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

A fração 1/8 aparece porque queremos apenas nx , ny e nz > 0. Agora,


o número de estados com n entre n e n + dn é dado pelo volume de 1/8 da
casca esférica de raio n e espessura dn, ou seja,
1
dN (n) = 4πn2dn . (4.19)
8
As expressões acima podem ser escritas em termos de ε se usamos (10.1).
Identificando V = L3, obtemos
 3/2
V 2m
N (ε) = 2 ε3/2 , (4.20)
6π ~2
e  3/2
N (ε) V 2m
dN (ε) = = 2 ε1/2dε . (4.21)
ε 4π ~2
Definimos agora a densidade de estados ou densidade de orbitais, D(ε), como
 3/2
dN 3N (ε) V 2m
D(ε) ≡ = = 2 ε1/2 . (4.22)
dε 2ε 4π ~2
g(ε) ≡ D(ε)dε é a multiplicidade do estado com energia entre ε e ε + dε.
Assim, num gás tridimensional, a multiplicidade aumenta com o aumento da
energia.
Atividade 2
(Objetivos 1 e 2)
Estime o número de orbitais com n ≤ 20 em d = 2 e d = 3 dimensões.
deixar 3cm

Resposta comentada
Temos que usar a aproximação contı́nua já que o número de orbitais envolvi-
dos é enorme. Para d = 2 temos que
1
N (n) = πn2 = 100π .
4
Analogamente para d = 3,
1 4πn3 4π
N (n) = = × 103 .
8 3 3
fim da atividade

81 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

Oscilador harmônico

Agora vamos rever um potencial harmônico do tipo

1 1 1
U(x, y, z) = Kx x2 + Ky y 2 + Kz z 2 (4.23)
2 2 2

onde Kx , Ky e Kz são as constantes elásticas em cada direção. Este problema


examinado com detalhes na Aula 18 de Introdução à Mecânica Quântica. U-
saremos este modelo para descrever as oscilações dos átomos na rede cristalina
de um sólido, na Aula 9.
A equação de Schrödinger estacionária para este potencial é

~2 2
 
1 2 1 2 1 2
− ∇ ψ(~r) + Kx x + Ky y + Kz z ψ(~r) = εψ(~r) , (4.24)
2m 2 2 2

Vamos considerar o caso em que as constantes elsticas são todas iguais a K.


Os nı́veis de energia relativos a esse potencial tem a forma

 
3
εn = n + ~ω n = nx + ny + nz , nx , ny , nz = 0, 1, 2 . . . (4.25)
2

p
onde ω = K/m é a frequência natural do oscilador.

Atividade 3
(Objetivos 1 e 2)
A função de onda Ψ(x, t) para o estado fundamental do oscilador harmônico
unidimensional, consistindo de uma partı́cula de massa m sob ação de uma
força restauradora linear do tipo F = − Kx, pode ser escrita como:


! r !
Km 2 i K
Ψ(x, t) = A exp − x exp − t
2~ 2 m

(a) Verifique que Ψ(x, t) é solução da equação de Schrödinger dependente do


tempo:
~2 ∂ 2 Ψ K 2 ∂Ψ
− 2
+ x Ψ = i~
2m ∂x 2 ∂t

(b) Calcule os valores médios de x e x2, ou seja, hxi e hx2i.

CEDERJ 82
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

deixar 5cm

Resposta comentada
(a) Vamos reescrever a função de onda como:

2
Ψ(x, t) = Ae−αx e−iωt/2
√ q
Km mω
onde α = = 2~
ω = K m
2~
,
. Com essas definições o cálculo fica mais
organizado. Vamos substituir Ψ(x, t) na equação:

∂Ψ 2
= −A2αxe−αx e−iωt/2 = −2αxΨ(x, t)
∂x

∂ 2Ψ
= −2α[1 − 2αx2 ]Ψ(x, t)
∂x 2

∂Ψ
= −iωΨ(x, t)
∂t
Substituindo tudo na equação dada e usando a definição de α encontramos
a resposta desejada. A condição de normalização é
Z +∞
|Ψ(x, t)|2 dx = 1
−∞

o que leva a
+∞
r
π  mω 1/4
Z
2 −2αx2 2
A e =1 ⇒ A =1 ⇒ A=
−∞ 2α π~

A probabilidade do oscilador estar entre x e x + dx é

mω 2 x2
 mω 1/2  
dP(x) = exp − dx
π~ ~
Z +∞
hxi = x|Ψ(x, t)|2dx = 0
−∞

83 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

A integral é nula por paridade: integrando mpar e intervalo de integração


simétrico.
Z +∞
2
hx i = x2|Ψ(x, t)|2dx
−∞
 mω 1/2 Z +∞ 2
= x2 e−αx dx
π~ −∞
 mω 1/2 1 r π ~ √
= 3
= 2
π~ 2 α mω
Fim da atividade

A forma da energia de um oscilador quântico nos permite considerar


um sistema tridimensional como três osciladores unidimensionais. Assim,
num sistema com N 0 osciladores tridimensionais pode ser encarado como um
sistema com N = 3N 0 osciladores unidimensionais, permitindo-nos basear a
análise do espectro de energia e da multiplicidade em osciladores unidimen-
sionais. Os nı́veis de um oscilador unidimensionais são dados por
 
1
 = ~ω nx + nx = 0, 1, 2 . . . , (4.26)
2

sendo a energia de um sistema com N osciladores unidimensionais dada por


N    
X 1 N
E = ~ω nxi + = ~ω M + , (4.27)
i=1
2 2

onde M = N
P
i=1 ni . A expressão (4.27) para a energia mostra que o macroes-
tado do conjunto de N osciladores fica completamente definido pela variável
M. O cálculo da multiplicidade g(N, M) pode ser feito através da dis-
tribuição binomial se associamos os valores de nxi de cada oscilador a uma
quantidade nxi de bolinhas. Um dado microestado {nx1 , nx2 , . . . nxN } pode
ser representado pela sequência de bolinhas e usamos bastões para separar
as bolinhas referentes a cada oscilador. Por exemplo, considere o caso de
N = 5 e M = 9. Temos 9 bolinhas que devem ser separadas em 5 seções.
Uma arrumação possı́vel é

• • | • | • • • | • •|•

correspondendo a nx1 = 2, nx2 = 1, nx3 = 3, nx4 = 2, nx5 = 1. Outra


possibilidade para os mesmos valores de M e N é

|•••|•••|•••|

CEDERJ 84
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

ou nx1 = 0, nx2 = 3, nx3 = 3, nx4 = 3, nx5 = 0. A multiplicidade será dada


pelo número das possı́veis arrumações de M bolinhas e N − 1 bastões. As-
sim, o cálculo da multiplicidade do macroestado fica reduzido à distribuição
binária outra vez: temos um total de M + N − 1 objetos e devemos escolher
as posições dos objetos de cada tipo. Ou seja,

(M + N − 1)!
g(M, N) = . (4.28)
M!(N − 1)!

Átomo de um elétron
O sistema que vamos revisar agora é um átomo contendo um núcleo de
carga positiva Ze e um só elétron com carga negativa −e, explicado na Aula
20 de Introdução à Mecânica Quântica. O estudo desse sistema, além da
sua importância histórica, é fundamental para o entendimento de sistemas
mais complexos, como átomos de muitos elétrons e moléculas, servindo como
ponto de partida para toda a quı́mica. Os átomos de um único elétron são os
sistemas ligados mais simples que ocorrem na natureza. Eles consistem em
um núcleo carregado positivamente e um elétron com carga negativa, ligados
pela atração coulombiana. Esse potencial, em coordenadas esféricas, tem a
forma:
−Ze2
U(r) = , (4.29)
4πε0r
onde r é a distância entre o elétron e o núcleo e ε0 a constante dielétrica do
vácuo. Vemos que o potencial é central, já que depende apenas do módulo
da distância da partı́cula à origem de coordenadas. Deste modo, a equação
de Schrödinger para o sistema se escreve

~2 2 Ze2
− ∇ ψ− ψ = εψ (4.30)
2µ 4πε0r

onde µ é a massa reduzida do sistema núcleo-átomo, µ = Mn m/(Mn + m),


sendo Mn a massa do núcleo do átomo (a massa do próton no caso do tomo
de hidrogênio) e m, a massa do elétron. Como a massa do elétron é muito
menor que a massa do núcleo (no caso do núcleo mais leve, o hidrogênio, ela
é 1,836 vezes menor), temos que, com boa aproximação, µ ≈ m. Usaremos
esta aproximação daqui em diante.
A equação (4.30) pode ser resolvida pelo procedimento de separação de
variáveis em coordenadas esféricas. A função de onda fica na forma

ψ(r, θ, φ) = Rnl (r)Ylml (θ, φ) , (4.31)

85 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada

onde Ylml (θ, φ) são os harmônicos esféricos e


( 3 )1/2
2Z (n − l − 1)!
Rnl (r) = − e−ρ/2 ρl Lnl (ρ) , (4.32)
na0 2n [(n + l)!]3
2
0~
onde ρ = 2Z na
r é a coordenada radial renormalizada e a0 = 4πε
µe2
, é o raio
de Bohr. Seu valor numérico a0 = 0,529 × 10−10 m ou a0 = 0,529 Å e
corresponde, no modelo atômico de Bohr que você estudou em Fı́sica 4B, ao
raio do átomo de hidrogênio no estado fundamental. Lnl (ρ) são polinômios
em ρ com grau (n − l − 1) conhecidos como polinômios de Laguerre.
Os valores de energia do elétron ligado ao núcleo devem obedecer a
2
Ze2

µ 1
εn = − 2 n = 1, 2, 3, . . . (4.33)
2~ 4πε0~ n2
Substituindo os valores das constantes temos outra expressão útil:
Z2
εn = −13,6 2 eV n = 1, 2, 3, . . . (4.34)
n
Frequentemente vemos os valores de energia εn escritos em função da con-
stante de Rydberg Ry definida como
me4
 
1
Ry = (4.35)
4π0 4π~2c
onde c é a velocidade da luz. Com essa definição, temos que os valores de
energia do elétron podem ser escritos como
1
εn = −hc Ry (4.36)
n2
Box de curiosidade
A constante de Rydberg tem dimensão [L]−1 e foi definida a partir da análise
do espectro atômico do hidrogênio. Vamos entender como. Se o elétron do
átomo de hidrogênio está excitado, num nı́vel com energia εni , e decai para
um nı́vel de energia εnf , ele emite radiação eletromagnética de frequência
εnf − εni
ν= . (4.37)
h
Usando a expressão (4.36), lembrando que o comprimento de onda λ é dado
por
λ = c/ν temos
!
1 ν εnf − εni 1 1
= = = Ry − 2 . (4.38)
λ c hc n2i nf

CEDERJ 86
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

Fim do box de curiosidade


Como a energia só depende de n, dizemos que os nı́veis são degenerados,
havendo uma multiplicidade g(n) por conta dos valores possveis de l e ml:

• Para cada valor n há n possı́veis valores de l, eles são:

l = 0, 1, 2, 3 . . . n − 1 .

• Para cada valor de l há (2l + 1) valores possı́veis de ml , eles são:

ml = −l, −(l − 1) . . . , −1, 0, 1, . . . , (l − 1), l .

• Para cada valor de n, há um total de n2 autofunções ou orbitais degen-


eradas.
Atividade 4
(Objetivos 1 e 2)
Calcule a multiplicidade dos 3 primeiros nı́veis de energia do átomo de
hidrogênio, especificando os valores de l e ml possı́veis para cada valor de
n.

Resposta comentada
A resposta está organizada na tabela abaixo.

n 1 2 3
l 0 0 1 0 1 2
ml 0 0 −1, 0,+1 0 −1, 0, +1 −2, −1, 0, +1, +2
g(n) 1 4 9

O ı́ndice l está associado ao momento angular orbital do elétron no átomo,


p
cujo módulo é |L| = ~ l(l + 1), enquanto que ml especifica a projeção L
ao longo de um eixo de quantização (usualmente o eixo z de um sistema de
coordenadas). Por tradição, utiliza-se a notação espectroscópica segundo a
qual os orbitais com l = 0, 1, 2, . . . são designados pelas letras s, p, d, ...
respectivamente.

87 CEDERJ
Aula 4 - Modelos quânticos
Física Estatística e
Matéria Condensada
Atividade 5
(Objetivos 1 e 2)
Sabendo que a função de onda para o elétron no estado fundamental do
 3/2  
átomo de hidrogênio é ψ100 = √1π aZ0 exp − Zra0
.
Mostre que
(a) o raio médio hri da órbita do elétron nesse estado é (3/2)a0 ;
(b) o raio mais provável é rmp = a0 .
(c) Faça o gráfico da densidade de probabilidade radial indicando os valores
de hri e rmp = a0.
(deixar 5cm)

Resposta comentada
(a) O valor médio de r para um elétron num dado orbital ψnlm é dado por
Z 2π Z π Z ∞
hri = dϕ cos θdθ r|ψnlml |2 r2 dr ,
0 0 0

O orbital fundamental neste caso é o 1s, ou seja n = 1 e l = 0, e tem simetria


esférica, portanto
 3 Z ∞  
1 Z 3 2r
hri = 4π r exp − dr ,
π a0 0 a0
Para simplificar podemos definir x ≡ r/a0 e obter que
Z ∞
hri = 4a0 dx x3 e−2x
0

Esta integral pode ser calculada por partes (três vezes), fornecendo o resul-
tado hri = (3/2)a0 .
(b) O valor mais provável é aquele para 
o qual a densidade de probabilidde
é máxima. Assim, como P(r) = Cr exp − a2r0 , devemos calcular
2

dP 2 2
=0 → 2r − r =0 → r = a0
dr a0
 
(c) Neste caso P(r) = Cr2 exp − a2r0 .

CEDERJ 88
Aula 4 - Modelos quânticos
MÓDULO 1 - AULA 4

Fim da atividade

Resumo
Nesta Aula revimos alguns modelos quânticos que serão essenciais para
o estudo dos sólidos: partı́cula na caixa tridimensional, oscilador harmônico
e átomo com um elétron. Nos três casos usamos a técnica de separação de
variáveis para calcular a expressão dos nı́veis de energia cujas multiplico-
dades também foram calculadas. No caso da partı́cula livre na caixa 3d,
uma expressão para a multiplicidade só foi possı́vel no limite termodinâmico
V → ∞, levando à definição de densidade de estados ou orbitais. No caso
do oscilador harmômico, usamos a distribuição binomial para o cálculo da
multiplicidade e no caso do átomo com um elétron a calculamos diretamente
pela própria estrutura de nı́veis.

Informações sobre a próxima aula


Na próxima Aula estudaremos átomos com muitos elétrons e as ligações
atômicas.

89 CEDERJ
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Aula 5 - Formando um sólido


19 de Janeiro de 2015

Meta
Apresentar como os átomos se ligam para formar estruturas mais com-
plexas, como moléculas e até mesmo sólidos.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Identificar as principais diferenças entre férmions e bósons;

2. Aplicar as regras para preenchimento de orbitais em átomos com muitos


elétrons;

3. Reconhecer o papel do princı́pio da exclusão na estrutura eletrônica de


átomos;

4. Identificar as principais caracterı́sticas das ligações entre átomos num


sólido cristalino;

Pré-requisitos
É fundamental que você reveja todo o conteúdo de Introdução à Mecânica
Quântica.

Introdução
Na Aula 1, mencionamos a famosa frase de Feynmann sobre serem todas
as coisas formadas por átomos. A descoberta desse fato, como bem registrou
Feynmann, representou um grande avanço na nossa busca por conhecer e
entender a Natureza. Diante dele, somos naturalmente levados a considerar a
seguinte questão: como os átomos se ligam para formar um sólido? Podemos
imaginar que a resposta a essa pergunta dependa dos elementos quı́micos
que se esteja considerando, uma vez que quando olhamos a tabela periódica,

91 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

vemos que os mesmos podem ser reunidos em diferentes grupos, segundo as


diferentes maneiras com que eles se combinam entre si e com os elementos
de outros grupos. Mas o que queremos entender é por que pode ser mais
vantajoso para os átomos se ligarem para formar estruturas mais complexas,
como moléculas e sólidos.
Para iniciarmos a análise desta questão é necessário que consideremos
a existência do spin e do princı́pio da exclusão. Em seguida vamos apren-
der como o princı́pio da exclusão influencia o preenchimento das camadas
eletrônicas e finalmente vamos analisar a formação dos sólidos cristalinos em
termos da estrutura eletrônica dos átomos constituintes.

Spin, bósons e férmions - O princı́pio da ex-


clusão de Pauli
Na Aula 19 de Introdução à Mecânica Quântica você estudou a con-
servação do momento angular para partı́culas sujeitas a um potencial central,
como o potencial coulombiano na equação do átomo de hidrogênio. Aprendeu
p
também que o momento angular orbital dessas partı́cula é L = l(l + 1) ~,
sendo l um número que pode ser inteiro ou semi-inteiro. Para cada valor
de l existem (2l + 1) valores de projeção de momento angular, correspon-
dendo a ml = −l, −l + 1 . . . l − 1, l. Além do momento angular orbital,
os elétrons tem um momento angular intrı́nseco ou spin S, que escrevemos
p
como S = s(s + 1) ~. Este momento angular intrı̀nseco está associado
a um momento magnético, como será visto na Aula 8. Devido a esse mo-
mento magnético intrı́nseco S existe interação dessas partı́culas com campos
magnéticos externos. Foi exatamente a deflexão de um feixe de elétrons
por um campo magnético (experimento de Stern-Gerlach) em 1922, uma
das principais evidências da existência desse momento magnético intrnseco.
Normalmente usa-se o termo spin, simplesmente, associado ao valor de s, no
lugar de momento angular de spin.
Você deve estar se perguntando qual o significado desse grau de liber-
dade adicional. A dificuldade em responder essa pergunta decorre do fato de
não termos no mundo macroscópico um objeto que se comporte, em todos os
sentidos, como um elétron ou qualquer outra partı́cula subatômica. Assim,
não temos como formar uma imagem desses objetos e interpretar suas pro-
priedades em termos clássicos. Já comentamos sobre isso na primeira aula.
O máximo que conseguimos fazer é lançar mão de modelos clássicos para

CEDERJ 92
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

explicar este ou aquele comportamento de tais partı́culas, como quando as


descrevemos ora como uma partı́cula, ora como uma onda. Mas um ponto
que tem que ficar bem claro para você é que, apesar da impossibilidade de se
explicar o mundo quântico em termos clássicos, a Mecânica Quântica é uma
teoria consistente internamente e que tem sido capaz de descrever com ad-
mirável precisão os fenômenos no nı́vel microscópico. Tendo estas observações
em mente, vamos então tentar interpretar o spin em termos clássicos. Uma
possibilidade é pensar o elétron como sendo um minúsculo objeto esférico ca-
paz de girar em torno de si mesmo. Seria análogo ao planeta Terra, que gira
sobre si mesma enquanto que se desloca no espaço. Essa representação do
elétron (uma bolinha girando em torno de si) parece razoável, uma vez que
o spin eletrônico está associado a um momento angular intrı́nseco, que cor-
responde exatamente a s = 1/2. Ou seja, sob o ponto de vista clássico, esse
momento angular adicional seria necessariamente associado a um movimento
de rotação. Todavia, essa imagem clássica leva a uma série de inconsistências
teóricas e a conflitos com dados experimentais. Não vamos detalhar este
ponto, não só por ser um tanto técnico, como também por que nos desviaria
da questão que estamos buscando responder.
Observa-se experimentalmente que as partı́culas podem ser classificadas
de acordo com seu spin como bósons, caso tenham spin inteiro, ou férmions
se o spin for semi-inteiro. Essa classificação aplica-se a partı́culas compostas
também. São férmions: elétrons (e), prótons (p) e neutrons (n)(s = 1/2),
átomos de He3 (2p+1n+2e, s = 1/2) e todos os átomos com número ı́mpar
de constituintes. Alguns exemplos de bósons são: fótons e fônons (s = 1),
átomos de He4 (2p+2n+2e, s = 0) e átomos com número par de constituintes.
É uma lei da Natureza que a função de onda, descrevendo um sistema
de partı́culas idênticas, deve ser simétrica ou antissimétrica pela troca de
partı́culas. A descoberta dessa lei em 1925 se deve a Pauli e o levou a
estabelecer o Princı́pio da Exclusão, formulado como:

• Sistemas constituı́dos por partı́culas idênticas de spin semi-inteiro são


descritos por funções de onda antissimétricas. Essas partı́culas (férmions)
obedecem estatı́stica de Fermi-Dirac.

• Sistemas constituı́dos por partı́culas idênticas de spin inteiro são de-


scritos por funções de onda simétricas. Essas partı́culas (bósons) obe-
decem estatı́stica de Bose-Einstein.

Box de curiosidade: Enrico Fermi (1901 - 1954) foi um fı́sico italiano, que

93 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

se destacou pelo seu trabalho sobre o desenvolvimento do primeiro reator


nuclear e por sua contribuição ao desenvolvimento da Mecânica Quântica,
Fı́sica Nuclear e de Partı́culas, e Mecânica Estatı́stica. Fermi nasceu na
Itália e desde cedo mostrou grande interesse por fı́sica e matemática. Rece-
beu seu diploma de graduação e de doutorado na Scuola Normale Superiore
em Pisa. Após alguns anos na Alemanha, regressou à Universidade de Roma
onde, em 1926, dedicou-se à mecânica es-
tatı́stica de partı́culas que obedecem ao
princı́pio de exclusão de Pauli, como os
elétrons, levando ao que conhecemos hoje
como estatı́stica de Fermi-Dirac, uma vez que
Dirac chegou independentemente às mesmas
conclusões. Em 1933, Fermi introduziu o
conceito de interação fraca, que em conjunto
com o recém postulado neutrino, entrariam
na teoria do decaimento beta. Juntamente
com um grupo de colaboradores, Fermi co-
meçou uma série de experiências em que foram produzidos artificialmente
núcleos radioativos, pelo bombardeamento com neutrons de vários elemen-
tos. Alguns dos seus resultados sugeriram a formação de elementos transura-
nianos. De fato, o que eles observaram, e que mais tarde foi comprovado
por Hahn, foi a cisão nuclear. Em 1938 Fermi recebeu o Prémio Nobel de
Fı́sica por este trabalho. Foi então para os Estados Unidos da América, onde
viria a participar do projeto Manhattan e dirigir o projeto de construção
do primeiro reator nuclear na Universidade de Chicago. Depois da Guerra,
Fermi dedicou-se à Fı́sica das partı́culas, com diversas contribuições impor-
tantes. O elemento quı́mico de número atômico 100, criado sinteticamente em
1952, recebeu o nome de Férmio em sua homenagem. Fermi morreu prematu-
ramente, aos 53 anos de idade, vı́tima de câncer no estômago, provavelmente
causado pela exposição a materiais radioativos.
Fonte: Wikipedia
Fim do box de curiosidade

Box de curiosidade: Wolfgang Ernst Pauli (1900 - 1958) foi um fı́sico


austrı́aco conhecido principalmente por seu trabalho na teoria do spin do
elétron.

CEDERJ 94
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Pauli fez muitas contribuições importantes


em sua carreira como fı́sico, principalmente
na mecânica quântica. Ele publicou artigos,
mas preferia longas cartas a seus colegas,
como Niels Bohr e Heisenberg, com quem
mantinha grande amizade. Muitas de suas
idéias e resultados nunca foram publicadas
e aparecem apenas nestas cartas, que foram
copiadas e distribuı́das por quem as possuia.
Em 1924, Pauli propôs um novo grau de liberdade quântico, para explicar
inconsistências entre o espectro atômico observado e o previsto pela mecânica
quântica. Ele formulou o Princı́pio da Exclusão, talvez seu mais importante
trabalho, que estabelece que dois férmions (por exemplo elétrons) não podem
existir no mesmo estado quântico. Uhlenbeck e Goudsmit posteriormente
identificaram este grau de liberdade como o spin. Em 1926, logo depois
que Werner Heisenberg publicou a teoria matricial da moderna mecânica
quântica, Pauli a usou para derivar o espetro do átomo de hidrogênio. Este
resultado foi importante para dar crédito à teoria de Heisenberg. Em 1927,
ele apresentou as matrizes de Pauli, como base dos operadores de spin. Seu
trabalho influenciou Dirac na descoberta da equação de Dirac para o eletron
relativı́stico. Em 1931, ele propôs a existência de uma partı́cula neutra, ainda
não observada na época, e sem massa, para explicar o espectro contı́nuo no
decaimento beta. Em 1934, Fermi introduziu a partı́cula em sua teoria de
decaimento radioativo, chamando-a neutrino. O neutrino foi observado di-
rectamente em 1959. Em 1940, ele provou o teorema estatı́stico de spin, um
resultado crı́tico da mecânica quântica que estabelece quais estados partı́culas
com spin 1/2 são férmions, e partı́culas com spin 1 são bósons.
Fonte: Wikipédia
Fim do box de curiosidade

Box de curiosidade: Paul Adrien Maurice Dirac (1902 - 1984) foi um


fı́sico teórico britânico responsável por contribuições fundamentais para o
desenvolvimento da Mecânica Quântica e a formulação quântica do Eletro-
magnetismo. Dirac estudou engenharia elétrica na Universidade de Bris-
tol, Inglaterra, completando o curso em 1921. Em 1923, se formou em
matemática e recebeu uma bolsa de pesquisa no St. John’s College, na
Universidade de Cambridge.

95 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada
Em sua tese, defendida em 1926, desen-
volveu uma versão da Mecânica Quântica,
mesclando a Mecânica Matricial de Heisen-
berg com a Mecânica Ondulatória de Er-
win Schrödinger num único formalismo
matemático. Foi Professor de Matemática
da Universidade de Cambridge e passou os
últimos catorze anos da sua vida na Florida
State University. Em 1928, desenvolveu a
chamada Equação de Dirac, que descreve o comportamento relativı́stico do
elétron. Essa teoria o levou a prever a existência do pósitron, a antipartı́cula
do elétron, que foi observado experimentalmente em 1932 por Carl Ander-
son. Partilhou o Prêmio Nobel de Fı́sica de 1933 com Erwin Schrödinger
pelo Desenvolvimento de novas teorias atômicas.
Fonte: Wikipédia
Fim do box de curiosidade

Box de curiosidade: Satyendra Nath Bose (1894 - 1974) foi um fı́sico in-
diano especializado em fı́sica matemática. Ele é mais conhecido pelo seu
trabalho em Mecânica Quântica por volta de 1920, gerando as bases para
a estatı́stica de Bose-Einstein e a teoria do condensado de Bose-Einstein.
O nome bóson para as partı́culas de spin inteiro é em sua homenagem.
Embora mais de um prêmio Nobel tenha sido
agraciado a pesquisas envolvendo bósons, a
estatı́stica de Bose-Einstein e o condensado
de Bose-Einstein, Bose nunca recebeu esse
prêmio. Bose nasceu em Calcutá onde real-
izou seus estudos até o curso superior. De
1916 a 1921 foi professor no departamento
de fı́sica da Universidade de Calcutá. Em
1921 passou para o departamento de fı́sica
da então recentemente fundada universidade
Dhaka, agora em Bangladesh. Em 1924 ele
escreve um trabalho derivando a lei da ra-
diação de Planck de uma forma alternativa, sem qualquer referência à fı́sica
clássica. A aceitação desse trabalho não foi imediata, o que o fez enviá-lo
a Einstein na Alemanha. Einstein reconheceu a importânca do trabalho, o
traduziu para o alemão e o submeteu em nome de Bose à então prestigiosa

CEDERJ 96
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

revista alemã Zeitschrift für Physik. Com isso, a importância do trabalho foi
reconhecida e Bose deixou a Índia pela primeira vez, passando dois anos na
Europa onde trabalhou com Louis de Broglie, Marie Curie e Einstein.
Fonte: Wikipédia
Fim do box de curiosidade

Agora vamos ver as implicações do princı́pio da exclusão na estatı́stica


de partı́culas idênticas.
Suponha o caso de duas partı́culas idênticas e independentes, obede-
cendo ao hamiltoniano
p2i
H = H1 + H2 onde Hi = + U(~ri ) .
2m
Seja ψni (~ri ) uma autofunção de Hi , ou seja, Hi ψni (~ri ) = εni ψni , i = 1, 2.
Neste caso, n1 e n2 representam um conjunto de números quânticos definindo
o orbital da partı́cula, ou seja, se a partı́cula 1 está no orbital n1 , sua função
de onda é ψn1 (~r1 ). O produto ψn1 ψn2 tem auto valor E = εn1 + εn2 , como
pode ser visto abaixo:

(H1 + H2 ) ψn1 ψn2 = H1 ψn1 ψn2 + ψn1 H2 ψn2


= εn1 ψn1 ψn2 + εn2 ψn1 ψn2
= (εn1 + εn2 )ψn1 ψn2

De acordo com a lei descoberta por Pauli, a função de onda correta para o
sistema deve ter sua simetria definida. Neste caso, a função de onda normal-
izada para as duas partı́culas deve ser construı́da a partir das combinações
lineares simétrica (ψS ) e antissimétrica(ψA), levando às expressões:
1
ψS (~r1, ~r2 ) = √ [ψn1 (~r1)ψn2 (~r2) + ψn1 (~r2 )ψn2 (~r1 )]
2
e
1
ψA (~r1 , ~r2) = √ [ψn1 (~r1 )ψn2 (~r2 ) − ψn1 (~r2 )ψn2 (~r1 )] ,
2
respectivamente. Note que se n1 = n2, ψA = 0, ou seja, no caso antissimétrico
não podemos ter as duas partı́culas no mesmo orbital, ou seja, com todos
os números quânticos iguais. Isso vai ser crucial para definir as regras de
ocupação de sistemas formados por férmions idênticos. Note que se fizermos
r1 → r2 a função de onda antissimétrica também se anula. Isso significa que
é improvável que partı́culas no estado ψA sejam encontradas próximas uma
da outra.

97 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

Suponha três orbitais, representados pelas letras A, B e C. Nas tabelas


abaixo, você pode ver como esses orbitais podem ser ocupados por bósons ou
férmions. Os ı́ndices numéricos identificam as partı́culas

Bósons
A B C função de onda
1,2 - - ψA (~r1 )ψA (~r2 )
- 1,2 - ψB (~r1 )ψB (~r2 )
- - 1,2 ψC (~r1 )ψC (~r2 )
1 2 - √1 [ψA (~r1 )ψB (~r2 ) + ψB (~r1)ψA (~r2)]
2

- 1 2 √1 [ψB (~r1 )ψC (~r2 ) + ψC (~r1 )ψB (~r2)]


2

1 - 2 √1 [ψA (~r1 )ψC (~r2 ) + ψC (~r1 )ψA (~r2 )]


2

Férmions
A B C função de onda
1 2 - √1 [ψA (~r1 )ψB (~r2) − ψB (~r1 )ψA (~r2 )]
2
- 1 2 √1 [ψB (~r1)ψC (~r2) − ψC (~r1 )ψB (~r2 )]
2
1 - 2 √1 [ψA (~r1)ψC (~r2) − ψC (~r1 )ψA (~r2 )]
2

Atividade 1
(Objetivo 1)
Considere um sistema hipotético com N = 18 partı́culas, distribuindo-se por
3 nı́veis de energia com a seguinte estrutura:

nı́vel energia multiplicidade


1 ε1 1
2 ε2 3
3 ε3 6

Podemos escrever a energia total do sistema em termos das ocupações ni


como E = n1 ε1 + n2 ε2 + n3 ε3. Determine as ocupações ni em T = 0 para as
seguintes situações
(a) As partı́culas são férmions com spin s = 1/2.
(b) As partı́culas são férmions com spin s = 5/2

CEDERJ 98
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

(c) As partı́culas são bósons com spin s = 1.


deixar 3cm

Resposta comentada
Em todos os estados devemos procurar a configuração de menor energia já
que T = 0.
(a) s = 1/2 - Como são férmions, devemos usar o princı́pio da exclusão, ou
seja, em cada orbital entram, no máximo, (2s + 1) = 2 fémions. Assim,
n1 = 2, n2 = 6 e n3 = 10.
(b) s = 5/2 - Repetimos o raciocı́nio do ı́tem (a) agora com (2s + 1) = 6.
Temos n1 = 6, n2 = 12 e n3 = 0,
(c) s = 1 - Neste caso as partı́culas são bósons, portanto podem estar todas
condensadas no primeiro nı́vel. Logo, n1 = 18 e n2 = n3 = 0,
Fim da atividade

Átomos com mais de um elétron


Vamos agora considerar a situação de átomos com mais de um elétron.
Dentre esses sistemas, o caso mais simples é o do átomo de hélio, que possui
dois prótons e dois elétrons. A parte espacial da função de onda eletrônica
para esse sistema depende agora das coordenadas ~r1 e ~r2 de cada um dos
elétrons, isto é, ψ(~r1, ~r2 ) satisfaz a equação
~2 2 ~2 2 2e2 2e2 e2
 
− ∇ − ∇ − − + ψ(~r1, ~r2 ) = εψ(~r1, ~r2)
2m 1 2m 2 4πε0r1 4πε0r2 4πε0r12
(5.1)
onde r12 = |~r1 − ~r2 | Os termos entre parênteses são facilmente identificáveis:
os dois primeiros correspondem às energias cinéticas de cada elétron; os dois
seguintes, aos termos de interação com o núcleo, que estamos considerando
em repouso e tendo carga 2e, e o quinto é a interação (repulsiva) entre os
elétrons. Este é o termo que torna o problema complexo, pois acopla a
dinâmica dos dois elétrons. Dizemos que estes estão correlacionados. Se os
elétrons não interagissem entre si a solução seria imediata, pois terı́amos dois
problemas independentes. Em termos matemáticos, dirı́amos que as variáveis
~r1 e ~r2 seriam separáveis, isto é, poderı́amos escrever a função de onda como

99 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

o produto de duas funções hidrogenóides, uma nas variáveis do elétron (1)


e outra nas do elétron (2). No entanto, a presença do termo de interação
nos impede de obter uma solução analı́tica para ψ(~r1, ~r2), obrigando-nos a
empregar métodos aproximativos para obter os autoestados e autoenergias
do sistema.
Em 1927, o matemático e fı́sico teórico inglês, Douglas Rayner Hartree
(1897-1958), formulou um método para o cálculo aproximado das funções
de ondas eletrônicas em átomos e ı́ons complexos, isto é, que possuem mais
de um elétron, baseado em uma idéia bastante simples, que descrevemos a
seguir.
Tomando como exemplo o átomo de hélio, vamos supor que a função
de onda ψ(~r1 , ~r2) possa ser escrita como

ψ(~r1 , ~r2) = ψ1(~r1 )ψ2(~r2 ) (5.2)

onde ψ1(~r1 ) e ψ2 (~r2 ) são dois orbitais monoeletrônicos diferentes. É claro que
a expressão na equação (5.2) representa uma aproximação para a função de
onda correta, que, como já dissemos, não se escreve nessa forma. A questão
passa a ser então a de encontrar os estados monoeletrônicos que forneçam a
melhor aproximação para ψ(~r1, ~r2 ). Partindo do fato de que o elétron que
ocupa um dos orbitais, digamos ψ1, é atraı́do pelo núcleo que possui carga
(2e) e é repelido pelo elétron que ocupa o outro orbital, Hartree substitui
essa interação por uma interação média. Assim: o elétron no estado ψ2 gera
uma distribuição espacial de carga

ρ2 (~r ) = −eψ2∗(~r)ψ2(~r ) (5.3)

que por sua vez gera um potencial elétrico dado por


ρ2 (~r1)
Z
U2 (~r1 ) = d3 r2 (5.4)
4πε0|~r1 − ~r2|
Isto nos permite escrever a equação para ψ1(~r) na forma
~2 2 2e2
 
− ∇ − + (−e)U2 (~r1) ψ1(~r1 ) = ε1 ψ1(~r1 ) (5.5)
2m 1 4πε0 r1
Analogamente, encontramos que a equação para ψ2(~r2 ) toma a forma
~2 2 2e2
 
− ∇ − + (−e)U1 (~r2) ψ2(~r2 ) = ε2 ψ2(~r2 ) (5.6)
2m 2 4πε0 r2
onde U1 (~r) é obtido trocando-se o ı́ndice (2) por (1) nas equações (5.3) e
(5.4). Um ponto importante a ser destacado é que a energia eletrônica total

CEDERJ 100
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

do sistema no estado ψ(~r1, ~r2) = ψ1(~r1 )ψ2(~r2 ) é dada por


Z Z
ε= d3 r1 d3r2 ψ ∗(~r1 , ~r2)H(~r1 , ~r2 )ψ(~r1, ~r2 ) (5.7)

onde
~2 2 ~2 2 2e2 2e2 e2
H=− ∇1 − ∇2 − − + (5.8)
2m 2m 4πε0r1 4πε0r2 4πε0r12
e não pela soma doa autovalores ε1 e ε2 que se obtém das equações (5.5) e
(5.6), isto para evitar contar duas vezes a interação repulsiva entre os elétrons
nos orbitais ψ1 (~r) e ψ2 (~r) (pense sobre isto, pois é um ponto importante).
Note que os potenciais repulsivos (decorrentes da interação elétron-
elétron) que aparecem nas equações (5.5) e (5.6) cancelam, em certa medida,
as interações atrativas com os núcleos atômicos. Dizemos que a repulsão
coulombiana entre os elétrons resulta numa blindagem (mesmo que parcial)
da interação com esses núcleos.
A aproximação de Hartree pode ser imediatamente estendida a átomos
com mais de dois elétrons e desde sua formulação importantes avanços foram
alcançados no sentido de melhorá-la, incluindo efeitos decorrentes do fato
de na realidade haver correlação entre os movimentos dos elétrons no átomo.
Não vamos tratar desses avanços, que representam ainda hoje um importante
campo de investigação na Fı́sica da Matéria Condensada, pois isto nos levaria
a discussões bastante técnicas, fugindo aos objetivos de uma disciplina básica
nessa área. Mas queremos registrar que as idéias de Hartree estabeleceram
as bases para o desenvolvimento da chamada teoria de um elétron, que per-
mite descrever as propriedades de um sistema de muitos elétrons (átomos,
moléculas e sólidos) a partir da solução de um problema de um elétron, e que
tem tido grande impacto sobre as pesquisas em Fı́sica, Quı́mica e Biologia.
Um dos que mais contribuı́ram para a consolidação dessa teoria foi o fı́sico
nascido na Áustria e radicado nos Estados Unidos, Walter Khon (1932-), que
foi agraciado com o Prêmio Nobel em Quı́mica, em 1998.
As equações de Hartree (ou suas versões atuais) são em geral resolvidas
numericamente quase que de modo rotineiro, graças ao explosivo crescimento
na capacidade computacional ocorrido nas últimas décadas e também ao de-
senvolvimento de algoritmos computacionais altamente eficientes. Os estudos
então realizados estabelecem de forma segura que a estrutura eletrônica dos
átomos complexos pode ser descrita com base em orbitais monoeletrônicos,
que são também caracterizados por três números quânticos (n, l, m). Esses
orbitais podem ser agrupados em camadas associadas cada uma ao número

101 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

quântico principal n. Como no átomo de hidrogênio, as energias dos or-


bitais dependem de n, mas apresentam uma pequena dependência também
no número quântico orbital l.

Estado fundamental de átomos com muitos elétrons


Veremos agora como fazer o preenchimento dos orbitais em átomos com
vários elétrons. Como vimos, os nı́veis eletrônicos se agrupam em camadas,
especificadas por um número quântico principal n e dentro de cada camada,
há orbitais especificados por ı́ndices quânticos l e ml . Por tradição, utiliza-se
a notação espectroscópica segundo a qual os orbitais com l = 0, 1, 2, . . . são
designados pelas letras s, p, d, . . . respectivamente.
Ao incluı́rmos a projeção de spin, ms , na coleção de números quânticos
eletrônicos, passamos a ter um orbital definido pelos valores de (n, l, ml, ms ).
O valor do spin s não foi incluı́do porque é o mesmo, igual a 1/2, para todos
os elétrons. Como pelo Princı́pio de Exclusão de Pauli cada orbital só pode
ser ocupado por um elétron, para dados (n, l, ml) temos a possibilidade de
dois elétrons um com projeção de spin ms = +1/2 e outro com ms = −1/2.
Assim, a camada com n = 1, para a qual l = ml = 0, pode acomodar
somente dois elétrons e é representada como 1s2 . Já a camada com n = 2
compreende duas subcamadas, correspondentes a l = 0 e l = 1, que no
átomo de hidrogênio tem a mesma energia, mas que nos átomos complexos
têm energias ligeiramente diferentes. Resulta que a subcamada com l = 0
acomoda 2 elétrons (2s2 ) a com l = 1, 6 (2p6 ). E assim se segue. Portanto,
se o átomo possui N elétrons, seu estado fundamental (o de mais baixa
energia) é obtido preenchendo-se os N primeiros nı́veis, seguindo o Princı́pio
de Exclusão.
Atividade 2
(Objetivos 1 e 2)
Quantos elétrons a camada com n = 5 pode acomodar?
deixar 3cm

Resposta comentada
Para n = 5 podemos ter l = 0, 1, 2, 3 e 4. Para cada valor de l temos (2l + 1)

CEDERJ 102
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Ordem de preenchimendo
das subcamadas

Figura 5.1: Diagrama para o preenchimento de orbitais num átomo multi-


eletrônico

orbitais, cada um com no máximo dois elétrons. Finalmente o número total


na camada n = 5 é

N5 = 2 + 6 + 10 + 14 + 18 = 50 elétrons

fim da atividade

Com base nos cálculos da aproximação de Hartree é possı́vel determinar


a ordem de preenchimento dos orbitais. Em geral usamos essa informação na
forma do diagrama apresentado na figura 5.1, proposto pelo quı́mico norte-
americano Linus Pauling (1901-1994). Certamente você já deve ter utilizado
este diagrama diversas vezes na aula de quı́mica. Tomemos como exemplo o
átomo de sódio (Na), que possui 11 elétrons. No estado fundamental, esses
elétrons se distribuem pelos orbitais atômicos da seguinte forma: [1s2 2s2
2p6 ] 3s1 . Ou seja, as camadas correspondentes a n = 1 e 2, que comportam
respectivamente dois e oito elétrons, estão completamente cheias, formando
o que chamamos de caroço atômico. Um fato muito importante é que as
camadas atômicas completas apresentam grande estabilidade, resultante da
forte energia de ligação dos elétrons que as constituem. No caso do sódio, o
11o o elétron ocupa sozinho o orbital 3s, que denominamos orbital externo
ou orbital de valência. Veja alguns dados interessantes. Para você arrancar
esse elétron do átomo de Na, são necessários 5,14 eV, enquanto que para

103 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

Camada cheia, gás inerte

Ativo!

Ativo!

Octeto 2s2p estável


gás inerte

Ativo!

Figura 5.2: Preenchimento progressivo das camadas eletrônicas.

arrancar um elétron do nvel 2p do átomo de Neônio (Ne), que possui as


camadas completas, com 10 elétrons distribuı́dos na forma 1s2 2s2 2p6 , são
necessários 21,56 eV. Isto deixa claro como os elétrons desemparelhados em
orbitais externos são mais facilmente ionizáveis. A existência destes estados
é uma caracterı́stica comum dos átomos e ı́ons complexos, à qual faremos
referências em diversos momentos. A figura 5.2 mostra o preenchimento
progressivo das camadas eletrônicas levando aos átomos que conhecemos.
Cada vez que completamos uma camada, temos um gás nobre. Os elementos
com subcamadas incompletas são quimicamente ativos.

Atividade 3
(Objetivo 2)
20 26
Determine a configuração do estado fundamental dos átomos Ca e Fe.
Resposta comentada
Vamos usar a figura 5.1:
20
Ca: 1s2 2s2 2p6 3s2 3p6 4s2
26
Fe: 1s2 2s2 2p6 3s2 3p6 4s2 3d6

CEDERJ 104
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Figura 5.3: Tabela periódica.

A tabela periódica

A tabela periódica contém a classificação dos elementos de acordo com


sua configuração eletrônica (figura 5.3). Nela, os elementos estão situados
com número atômico crescente, em sete linhas chamadas perı́odos. O arranjo
é tal que todos os elementos numa dada coluna ou grupo, tem elétrons de
valência similares assim como propriedades quı́micas e fı́sicas. Essas pro-
priedades mudam gradualmente e sitematicamente, na direção horizontal ao
longo de cada perı́odo.
Elementos na coluna 18 são chamados gases nobres ou gases inertes por
terem todas as camadas eletrônicas completas e estáveis. Elementos das col-
unas 17 e 16 tem deficiência de 1 e 2 elétrons, respectivamente, com relação
à configuração estável (com todas as camadas completas). Os elementos da
coluna 17 são chamados halogênios. Os metais alcalinos estão na coluna 1 e
os metais alcalinos terrosos na coluna 2. Esses elementos têm 1 e 2 elétrons
adicionais, respectivamente, com relação à configuração estável. Os metais
de transição estão localizados no bloco central, entre as colunas 3 e 12, tem
uma camada d incompleta e, em alguns casos, 1 ou 2 elétrons em camadas
mais externas. Os elementos nas colunas 13, 14 e 15 tem propriedades in-
termediárias entre metais e não metais. Pode-se notar que a maioria dos
elementos está classificada como metal.

105 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

Uma propriedade importante de se observar na análise das ligações


atômicas é a eletronegatividade, que mede a tendência de um átomo receber
elétrons e tornar-se negativo. Para entender como essa propriedade varia ao
longo da tabela periódica, vamos verificar as colunas 1 e 17. Os elementos da
coluna 1 tem o último orbital na forma ns1 , portanto a perda desse elétron
os deixa com uma configuração tipo gás inerte. Já os elementos da coluna
17 tem como última camada um orbital np5 , logo ao receber um elétron eles
adquirem uma configuração estável. Assim os elementos na coluna 17 são
mais eletronegativos que os da coluna 1. A mesma análise pode ser feita com
relação a outros pares de colunas em posições oposta, levando à conclusão
que a eletronegatividade cresce da esquerda para a direita. Olhando dentro
de uma mesma coluna, por exemplo a coluna 1, observamos que o último
orbital tem o valor de n crescendo à medida que descemos a coluna, o mesmo
ocorrendo em outras colunas. Isso significa que esse elétron mais externo fica
cada vez mais distante do núcleo à medida que descemos em uma coluna. As-
sim, esse elétron é cada vez mais facilmente retirado à medida que descemos
a coluna, ou seja, a propensão a perder elétrons (que se chama eletroposi-
tividade) aumenta à medida que descemos a coluna. Consequentemente, a
propensão a receber elétrons varia no sentido contrário e a eletronegatividade
cresce de baixo para cima.

Tipos de ligação cristalina


É comum na literatura cientı́fica encontrar termos designando cristais
a partir da natureza da interação entre seus átomos. Os tipos básicos são:
cristal molecular, covalente, iônico e metálico. Os três primeiros tipos levam
a materiais não condutores de eletricidade. Vamos ver quais as principais
caracterı́sticas desses cristais considerando situações em que o caráter da
ligação entre os átomos é bem definido. Infelizmente há muitos caso inter-
mediários, onde não há uma contribuição muito predominante de um dado
efeito. Apesar disso vale a pena entender esses casos exemplares.
Como vimos, átomos com muitos elétrons podem ter camadas eletrônicas
externas incompletas. Os elétrons nessas camadas sofrem uma atração pelo
núcleo blindada pelas camadas internas. O resultado disso é a existência de
elétrons que podem facilmente ser dissociados dos átomos originais passando
a ocupar o que chamamos um orbital molecular. Vamos analisar a ligação
entre vários tipos de átomos considerando suas posições na tabela periódica.

CEDERJ 106
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

6+ 6+ 6+
17+ 11+ 17+

18- 10- 18-

11+ 17+ 11+


6+ 6+ 6+
10- 18- 10-

(a) cristal covalente: C (b) cristal iônico: NaCl

10+ 10+ 10+


11+ 11+ 11+
10- 10- 10-

10+ 10+ 10+


11+ 11+ 11+
10- 10- 10-

(c) cristal metálico: Na (d) cristal molecular: Ne

Figura 5.4: Visão esquemática dos principais tipos de ligação cristalina. A


regiões em cinza claro representam a distribuição eletrônica. Os cı́rculos em
cinza escuro representam os núcleos. (a) cristal covalente (ex:C) (b) cristal
iônico (ex:NaCl)(c) cristal molecular (ex:Ne) (d) cristal metálico (ex:Na)

Cristal covalente
A ligação covalente caracteriza-se pelo compartilhamento de elétrons
por dois átomos. Essa ligação ocorre entre átomos que têm elétrons com spins
desemparelhados na última camada e que tenham eletronegatividades iguais
ou semelhantes. Eles poderão formar pares com um elétrons de valência
de outros átomo. Os spins antiparalelos do elétrons do par permitem eles
ocupem a mesma região do orbital molecular.

Exemplo 5.1
Vamos analisar a formação das ligações covalentes nas moléculas N2 e O2 . De
acordo com a teoria de Hartree, resumida no diagrama da Figura 5.1 temos
as estruturas eletrônicas:

N (Z = 7) → 1s2 2s2 2p3

O (Z = 8) → 1s2 2s2 2p4

O orbital p tem l = 1, logo tem multiplicidade (2l + 1) = 3, assim, pode-


mos ter os três elétrons com spin pararelo, ou seja, com o mesmo valor de
ms = 1/2. Com isso a molécula N2 tem três ligações covalentes. Já no caso

107 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

do oxigênio, o quarto elétron tem que emparelhar com alguém, sobrando


apenas dois eletrósn com spin paralelo, levando à formação de duas ligações
covalentes.

Outros exemplos de ligação covalente são: H2 , Cl2, F2 etc, H2O, HNO3


e CH4. Este tipo de ligação pode ser muito forte, como no diamante, que
tem temperatura de fusão 3550 ◦ C, ou muito fraca, como no bismuto que
tem temperatura de fusão é 270 ◦ C. Neste tipode cristal há um aumento na
densidade eletrônica entre os ı́ons formados pelo núcleo e camadas eletrônicas
completas, em determinadas direções, como esquematizado na figura 5.7(a).

A Molécula de H2

O exemplo mais simples de ligação covalente é o da ligação presente na


molécula H2 . Podemos usar nosso conhecimento sobre as funções de onda
dos átomos isolados para entender porque a formação da molécula é mais fa-
vorável energeticamente. Comecemos com dois átomos de hidrogênio neutros
e isolados, isto é, colocados tão distantes um do outro que não interagem en-
tre si. Se os dois átomos se encontrarem no estado fundamental, então cada
elétron estará ligado ao seu respectivo núcleo (no caso, um próton), ocupando
um estado 1s. A função de onda para esse elétron, ψ1s (~r), é dada por
 3/2  
1 Z Zr
ψ1s(~r) = ψ100(~r ) = √ exp − (5.9)
π a0 a0
onde a0 é o raio de Bohr. Verificamos então um fato interessante, que ocorre
quando os dois átomos se tornam suficientemente próximos. Nessa situação,
os dois elétrons, que inicialmente se localizavam cada um em torno do seu
respectivo núcleo, passam a ocupar um mesmo orbital (que denominamos
molecular), o qual se distribui espacialmente em torno dos dois núcleos. A
situação é esquematicamente representada na figura 5.5. A pergunta que
podemos então fazer é: por que os elétrons passam dos orbitais atômicos
para o molecular? Bem, você deve estar pensando, corretamente, que isto
se dá porque a energia eletrônica do orbital molecular deve ser menor que
a dos orbitais atômicos. Mas por que é assim? Para entender este ponto
teremos que analisar com mais detalhe as energias de um e de outro estado.
Nos átomos de hidrogênio isolados, cada elétron ocupa um orbital cuja parte
radial é dada pela equação (5.9). Nessa equação, a0 determina a extensão da
função de onda em torno do núcleo atômico, dada por hri = (3/2)a0 , como
visto na Atividade 5 da Aula 4. Pois imaginemos por um momento que pos-
samos tomar a0 na expressão para ψ1s(~r) como um parâmetro livre a, tal que

CEDERJ 108
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

(a)

(b)

Figura 5.5: representação esquemática dos orbitais atômicos (a) e molecular


(b) no caso do H

seja que possı́vel diminuir (ou aumentar) a em relação ao a0 . Isto significar


tornar a função de onda eletrônica mais (ou menos) concentrada em torno do
núcleo atômico. Se diminuı́mos o raio atômico, esperamos que a energia po-
tencial de interação com o núcleo diminua, isto é, que se torne mais negativa
uma vez que se trata de uma interação atrativa. De fato, se substituirmos a0
por a na expressão para a função de onda ψ1s(~r) e calcularmos o valor médio
do potencial U(r) = −e2/(4π0 r) nesse estados encontramos que

e2
Z  
3
hUi1s = d rψ1s (~r, a) ∗
− ψ1s(~r, a)
4πε0r
e2
= − (5.10)
4πε0a

Podemos reescrever hUi1s dividindo e multiplicando pelo raio de Bohr a0 =


 2
4πε0 ~2 1 me4
me 2 e usando a definição da constante de Rydberg Ry ≡ 4π0 4π~3 c
.
Temos
e2 1 2hc
hUi1s = − = −Ry (5.11)
4πε0(a/a0 ) a0 a/a0
Observamos então que, de fato, ao reduzirmos o raio atômico a, a energia
potencial torna-se mais negativa, ou seja, diminui. No entanto, o oposto
ocorre com a energia cinética T , que aumenta a medida que diminuı́mos o
raio atômico. De fato,o valor esperado da energia cinética é

~2
Z  
3
hT i1s = d rψ1s (~r, a) − ∗
∇2ψ1s (~r, a)
2m
~2 1
= (5.12)
2m a2

109 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

E(a)

a/a0

Figura 5.6: Energia eletrônica total(cinética+potencial)para um elétron no


potencial de um próton em função do raio a da órbita, em unidades de Ry~c.

Novamente usando as definições de a0 e Ry temos

~2 1 1 1
hT i1s = 2
= Ryhc (5.13)
2m (a/a0)2 a0 (a/a0)2

A energia total fica então


 
1 2
E(a) = hUi1s + hT i1s = − hcRy (5.14)
(a/a0) (a/a0)2

A Figura 5.6 mostra um gráfico de E(a) em função de a/a0, onde vemos


claramente que esta função passa por um mı́nimo justamente quando a = a0 .
Examinando a figura 5.5 percebemos imediatamente que no estado atômico o
elétron encontra-se mais confinado espacialmente que no molecular, de modo
que ao passar do primeiro para o segundo sua energia cinética diminui. Isto
é a chave para a formação da ligação entre os dois átomos. Ao aproximarmos
os dois átomos, surge a possibilidade de que os elétrons passem a ocupar es-
tados mais estendidos, diminuindo a energia do sistema. Como consequência,
para separar os átomos você teria que realizar um trabalho sobre o sistema,
correspondente ao que denominamos energia de ligação da molécula. É o que
analisaremos a seguir.

CEDERJ 110
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

A energia de ligação da molécula de H2

Suponha que um dos átomos, que denominamos (1), esteja na origem


das coordenadas e o outro, que denominamos (2), na posição R ~ , tal que
~  a0 . Considere que inicialmente um elétron ocupe o orbital ψ1s (~r)
|R|
(estado fundamental) do átomo (1), que por simplicidade de notação vamos
representar como ψ1(~r). A equação para este orbital pode ser reescrita na
forma
~2 2
 
− ∇ + U1 (~r ) ψ1 (~r) = ψ1(~r) (5.15)
2m
onde U1 (~r ) é o potencial de interação com o núcleo do átomo (1) e  =
1s. Queremos estimar a energia do elétron quando ele passa para o orbital
molecular ψmol (~r), que satisfaz a equação
~2 2
 
− ∇ + U1 (~r) + U2 (~r) ψmol(~r ) = mol ψmol(~r ) (5.16)
2m
onde U2 (~r) é o potencial de interação com o núcleo do átomo (2). O termo
entre colchetes é o hamiltoniano molecular, que representamos por Hmol .
Como vimos na Aula 4,
Z
mol = d3 r ψmol ∗
(~r)Hmol ψmol (~r) (5.17)

Para calcular este valor médio temos que dispor de uma expressão para
ψmol (~r). A figura 5.5 nos sugere que podemos aproximar ψmol (~r) pela ex-
pressão
1
ψmol (~r) = √ [ψ1(~r) + ψ2 (~r)] (5.18)
2
Aqui, ψ2(~r ) é a função de onda do estado fundamental do átomo (2). Ela
satisfaz uma equação que tem exatamente a mesma forma que a equação
(5.15), com o ı́ndice (1) substituı́do por (2).
Note que a superposição das funções ψ1 (~r) e ψ2(~r ) for muito pequena,
R
então d3 r ψ1∗ (~r)ψ2(~r ) ≡ 0, caso em que dizemos que ψ1 e ψ2 são (aproxi-
madamente) ortogonais. Segue-se então que
Z 
1
Z Z
3 3 3
d r ψmol (~r)ψmol(~r ) =

d r ψ1 (~r )ψ1(~r) + d r ψ2 (~r)ψ2 (~r)
∗ ∗
2
= 1 (5.19)

ou seja, ψmol é normalizada a 1. Com base na expressão (5.18) para o orbital


molecular, temos então que
1
Hmol ψmol (~r) = √ [Hmol ψ1 + Hmol ψ2] (5.20)
2

111 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

O primeiro termo entre colchetes pode ser reescrito como

~2 2 ~2 2
   
− ∇ + U1 (~r) + U2 (~r) ψ1 (~r) = − ∇ + U1 (~r) ψ1 + U2 (~r)ψ1
2m 2m
= ψ1(~r) + U2 (~r )ψ1 (5.21)

Analogamente temos que, no segundo termo,

~2 2 ~2 2
   
− ∇ + U1 (~r) + U2 (~r) ψ2 (~r) = − ∇ + U2 (~r) ψ2 + U1 (~r)ψ2
2m 2m
= ψ2(~r) + U1 (~r )ψ2 (5.22)

Combinando os dois resultados temos


1
Hmol ψmol (~r) = ψmol + √ [U2(~r )ψ1 + U1 (~r)ψ2 ]
2

Multiplicando ambos os lados por ψmol∗


(~r) temos
Z
mol ≡ dr ψmol

(~r )Hmol ψmol(~r )
Z 
1
Z
3 3
= + d r ψ2 U2 ψ1 + d r ψ1 U1 ψ2
∗ ∗
(5.23)
2

Analisemos esse resultado. Note primeiramente que as funções ψ1(~r) e ψ2 (~r)


e são reais e positivas, enquanto que os potenciais são atrativos, portanto,
negativos. Isto significa que o termo entre chaves no lado direito da equação
(5.23) é negativo. Assim, vemos que mol é de fato menor que . E isto
decorre da possibilidade de cada elétron poder passar de um átomo ao outro.
Os termos entre colchetes são, por esta razão, chamados de integrais de trans-
ferência. Considerando que os dois elétrons ocupem o estado molecular com
spins opostos, teremos então que a energia de ligação da molécula (energia
necessária para dissociá-la) será dada por
Z Z 
3 3
2 − 2mol = − d r ψ2 U2ψ1 + d r ψ1 U1 ψ2 > 0
∗ ∗

Cristal iônico
A ligação iônica ocorre entre elementos com eletronegatividade muito
diferente, ou seja, um elemento com propensão a receber elétrons e outro a
doar. Normalmente um dos elementos será metálico e o outro não metálico.
O exemplo clássico é o NaCl. Considerando os átomos afastados, temos que
o sódio é metálico com valência +1 e o cloro é não metálico, com valência -1.

CEDERJ 112
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Ao aproximarmos os átomos vemos que o átomo de sódio assume a estrutura


eletrônica do neônio ao transferir um elétron de valência 3s ao átomo de
cloro, que passa a ter a estrutura do argônio. Comparado aos átomos Na e
Cl separados, o sistema combinado NaCl (cloreto de sódio) tem uma energia
mais baixa de 3,6 eV, ou seja, a energia de ligação entre Na e Cl é de 3,6 eV.
A ligação iônica não tem direção privilegiada, ou seja, a densidade
eletrônica intersticial não depende da direção, como esquematizado na figura
5.7(b). De uma forma geral a energia de ligação dos cristais iônicos está na
faixa 3-8 eV. Em geral os materiais iônicos são duros e quebradiços, e são
isolantes térmicos e elétricos já que os elétrons que participam na ligação
ficam fortemente ligados aos ı́ons.

Cristal metálico
A ligação metálica ocorre entre elementos metálicos, que constituem
66% dos elementos da tabela periódica. Este tipo de ligação tem algumas
semelhanças com a covalente, já que também decorre da superposição de
orbitais. Entretanto, na ligação metálica a superposição é muito maior e
não há direção privilegiada. Podemos imaginar um metal como um material
em que os núcleos atômicos junto com as camadas eletrônicas mais internas
estão fixos em determinadas posições espaciais, enquanto que os elétrons
de valência estão praticamente livres dentro do sólido e recebem o nome
de elétrons de condução, como esquematizado na figura 5.7(c). Na Aula
13 vamos descrever esses elétrons de condução como partı́culas de um gás
quântico contido pelo volume do sólido. Em alguns metais a interação entre
os caroços iônicos e os elétrons de condução tem um papel importante na
energia de coesão do cristal, mas a principal caracterı́stica da ligação metálica
é o rebaixamento da energia dos elétrons de valência quando comparamos com
a energia dos elétrons no átomo isolado. Esses materiais são bons condutores
de eletricidade e de calor, devido aos elétrons de condução.

Cristal molecular
Os gases inertes formam os cristais mais simples. Esses átomos tem
as camadas eletrônicas completas, assim, para entender a origem da atração
entre esses átomos temos que lembrar que a distribuição de carga num átomo
não é rı́gida. Se fosse, como a simetria é esférica no caso das gases nobres,
terı́amos uma interação nula entre os átomos já que o potencial eletrostático

113 CEDERJ
Aula 5 - Formando um sólido
Física Estatística e
Matéria Condensada

6+ 6+ 6+
17+ 11+ 17+

18- 10- 18-

11+ 17+ 11+


6+ 6+ 6+
10- 18- 10-

(a) cristal covalente: C (b) cristal iônico: NaCl

10+ 10+ 10+


11+ 11+ 11+
10- 10- 10-

10+ 10+ 10+


11+ 11+ 11+
10- 10- 10-

(c) cristal metálico: Na (d) cristal molecular: Ne

Figura 5.7: Principais tipos de ligação cristalina. A regiões em cinza claro


representam a distribuição eletrônica. Os cı́rculos em cinza escuro represen-
tam os núcleos. (a) cristal covalente (ex:C) (b) cristal iônico (ex:NaCl)(c)
cristal molecular (ex:Ne) (d) cristal metálico (ex:Na)

de uma distribuição esférica de carga negativa seria cancelada pela carga


positiva do núcleo, na região externa ao átomo. Na realidade existem peque-
nas distorções instantâneas na distribuição de carga eletrônica, que induzem
um momento de dipolo no átomo vizinho, gerando uma atração fraca entre
os átomos. Esse tipo de interação chama-se interação de van der Waals.
Nesses cristais a energia de coesão é baixa. Em geral são materiais transpar-
entes, isolantes e com temperaturas de fusão baixas, na faixa de 24-160 K.
Este tipo de interação sempre existe entre dois átomos neutros, mas pode ser
desprezı́vel perante outros tipos de interação.

Resumo

Nesta Aula introduzimos o conceito de spin, o princı́pio de exclusão de


Pauli e de que maneira ele afeta o estado fundamental dos átomos de muitos
elétrons. Também, apresentamos os principais tipos de ligação entre átomos
em um cristal.

CEDERJ 114
Aula 5 - Formando um sólido
MÓDULO 1 - AULA 5

Informações sobre a próxima aula


Na próxima Aula examinaremos os sólidos cristalinos em termos das
propriedades das redes cristalinas.

115 CEDERJ
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Aula 6 - Sólidos cristalinos


19 de Janeiro de 2015

Meta
Apresentar os chamados sólidos cristalinos e caracterizar as maneiras
segundo as quais os átomos que os compõem se distribuem espacialmente.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Identificar as redes de Bravais.

2. Identificar as células primitivas e convencionais.

3. Determinar as frações de empacotamento de redes de Bravais.

4. Identificar os parâmetros de rede.

Pré-requisitos
Para compreender esta aula, você precisará lembrar-se de conceitos
básicos de cálculo vetorial e de geometria.

Introdução
O que é um cristal? Você já deve ter ouvido alguém se referir a uma
taça ou a uma jarra como sendo de cristal. Ou então dizer que uma pedra,
como o diamante, o topázio ou o rubi, é um cristal. Para muitas pessoas, o
termo cristal aplica-se a materiais em geral transparentes, com alto grau de
dureza e que podem ser lapidados, exibindo então faces planas e arestas bem
definidas. Para essas pessoas, a afirmação de que os metais, por exemplo,
também formam cristais talvez soe surpreendente. A razão para isto é, em
parte, o fato de os metais, por serem maleáveis, nem sempre exibirem de
forma clara essas caracterı́sticas de cristalinidade. Mas é também a diferença
no significado que se atribui ao termo cristal na linguagem comum e na Fı́sica.

117 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

Figura 6.1: Representações de sistemas cristalinos em três (a) e em duas (b)


dimensões.

Na Fı́sica, esse termo é usado para designar os sólidos cujos átomos estão
distribuı́dos de forma periódica no seu interior. Veja, por exemplo, a figura
6.1. Ela representa dois possı́veis arranjos de átomos idênticos, o primeiro (a)
em três dimensões e o segundo (b) em duas, nos quais percebemos claramente
a regularidade no posicionamento dos mesmos. O arranjo em duas dimensões
corresponde a estruturas que podemos hoje em dia construir, constituı́da,
por exemplo, por uma camada monoatômica depositada sobre um substrato.
Por agora, examinemos com mais atenção esses arranjos para percebermos
algumas caracterı́sticas dessa regularidade.
Mas antes de avançarmos, vale fazer um comentário. Lembre-se de que
os sólidos reais são constituı́dos por um número muito grande de átomos.
Algo como 1023 átomos por cm3. Isto nos permite considerar que tais sistemas
estejam no limite termodinâmico, no qual o número N de partı́culas e o
volume V vão a infinito, mantendo-se fixa a concentração N/V . Assim, os
arranjos na figura 6.1 devem ser pensados como representando uma pequena
amostra de uma distribuição de átomos que preenche todo o espaço.
Feita a observação, voltemos então à análise das estruturas na figura
6.1. Esqueça-se por um momento dos átomos e considere apenas as posições
ocupadas por eles (também nos referimos a elas como sı́tios). Você terá assim
um conjunto de pontos, como mostrado na figura 6.2, que denominamos rede.

Você notará que nessa figura traçamos alguns vetores, que ligam pontos
de rede. Damos a eles o nome de vetores de rede, que denotamos como R. ~ O
~ Você também pode traçar
conjunto desses vetores é representado como {R}.
alguns vetores de rede no caso de um arranjo em duas dimensões, como na

CEDERJ 118
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Figura 6.2: Rede cristalina associada ao cristal tridimensional na figura 6.1.

Figura 6.3: Alguns vetores de rede em um cristal bidimensional.

figura 6.3.

Redes de Bravais
Você pode imaginar vários tipos de redes, em três ou em duas di-
mensões. Mas as redes associadas aos materiais cristalinos têm uma pro-
priedade especial: dado um cristal tridimensional, é sempre possı́vel escolher
um conjunto de vetores de rede não coplanares {~a1, ~a2, ~a3}, que denominamos
~ fazendo combinações
vetores primitivos, e gerar a partir deles toda a rede {R}
lineares do tipo
~ = m1~a1 + m2~a2 + m3~a3 ,
R (6.1)

onde m1, m2 e m3 são números inteiros. Queremos que este ponto fique
bem claro para você. O que estamos dizendo é que, escolhidos os vetores
{~a1, ~a2, ~a3 }, a cada ponto de rede podemos associar três números inteiros
(m1, m2 , m3) e, reciprocamente, a cada conjunto de três números inteiros
(m1, m2 , m3) temos associado um ponto de rede. A situação pode ser repre-

119 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

a2

a1

Figura 6.4: Exemplo de uma rede bidimensional que é uma rede de Bravais.

sentada esquematicamente na forma:

~ {~a⇐⇒
R
a2 ,~a3 }
1 ,~
(m1 , m2, m3) (6.2)

É o que denominamos uma correspondência biunı́voca. As redes que satis-


fazem esta condição são denominadas redes de Bravais, em homenagem ao
fı́sico francês Auguste Bravais.

Box de curiosidade:
Auguste Bravais (1811-1863) notabilizou-se
por seus estudos em cristalografia. Nascido
na pequena cidade de Annonay, na França,
estudou na prestigiosa École Polytechnique,
em Paris. Teve seu interesse atraı́do por
várias áreas do conhecimento, que incluı́a
magnetismo, meteorologia e astronomia.
Em 1854 tornou-se membro da Academia
Francesa de Ciência.
Fonte: Wikipedia
Fim do box de curiosidade
Você pode também definir redes de Bravais em duas dimensões. Nesse caso,
terá apenas dois vetores primitivos, {~a1, ~a2}, que são não colineares. Para
você compreender bem o significado da correspondência definida no esquema
(6.2), vamos ver dois exemplos de redes bidimensionais, que você deve pensar
como se estendendo por todo o plano. O primeiro, mostrado na figura 6.4,
corresponde claramente a uma rede de Bravais. Se tomamos como vetores
primitivos os indicados na figura 6.4, vemos claramente que a cada ponto

CEDERJ 120
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

a2

a1

Figura 6.5: Segundo exemplo de uma rede bidimensional que não é uma rede
de Bravais.

temos associado um par de números inteiros e a cada par de números in-


teiros temos associado um ponto da rede. Você está de acordo? Pois então
considere o exemplo na figura 6.5. É claro que se trata de um arranjo regular
de pontos, mas que não se enquadra na definição de uma rede de Bravais.
Os dois vetores mostrados na figura seriam candidatos a vetores primitivos,
pois afinal qualquer ponto da rede pode ser escrito como combinação linear
dos dois com coeficientes inteiros. Mas repare que existem pares de inteiros
aos quais não está associado um ponto de rede. Considere, por exemplo, o
par de números inteiros (1,1). O ponto R ~ = 1~a1 + 1~a2 simplesmente não faz
parte da rede. Como também não fazem parte os que seriam associados aos
pares (−1, 1), (−1, −1) e (1, −1) (há mais exemplos fora da região mostrada
na figura). E isto não depende da escolha dos vetores primitivos, como você
poderá verificar analisando o arranjo dos pontos. Uma caracterı́stica impor-
tante das redes de Bravais é o fato de todos os seus sı́tios serem equivalentes.
Isto significa que você pode tomar qualquer um como origem para um sis-
tema de coordenadas. Em consequência, a rede se mostra invariante por
uma translação segundo qualquer vetor de rede. Portanto, se você deslocar
todos os pontos de rede segundo o mesmo vetor de rede, a rede transladada
será exatamente igual à inicial (lembre-se que estamos considerando-a como
preenchendo todo o espaço). Note que a rede mostrada na figura 6.5 clara-
mente não possui esta caracterı́stica (os pontos (1,0) e (2,0), por exemplo,
são claramente não-equivalentes). Embora tenhamos usado como exemplo
uma rede bidimensional, você pode imaginar que existam situações análogas
em três dimensões. Mais adiante nesta aula, veremos como tratar arranjos
como o mostrado na figura 6.5.

121 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada
Atividade 1
Considere o conjunto de pontos mostrados na figura 6.1(a) e acrescente um
ponto no centro de cada aresta vertical. O conjunto de pontos assim formado
representa uma rede de Bravais?
deixar 3cm

Resposta comentada
O conjunto de pontos que então se obtém não constitui uma rede de Bravais,
uma vez que os sitio que estão nos vértices de cada cubo não são equivalentes
aos localizados nos centros das arestas verticais. Faça um esboço da rede para
se convencer deste fato.
Fim da atividade

Você deve ter notado que os vetores primitivos não são únicos. Voltando
à figura 6.3, você poderá verificar que qualquer um dos pares de vetores lá
mostrados pode ser tomado como de vetores primitivos. Há, portanto, uma
certa liberdade na escolha desses vetores, o que, como veremos, não afeta a
Fı́sica do sistema. Por questão de conveniência, é usual escolhermos trabalhar
com os vetores primitivos de menor módulo. Qual seria então a escolha usual
dentre os exemplos mostrados na figura 6.3? Acertou se você escolheu o par
na parte superior direita.

Células primitivas
Dada uma rede de Bravais, podemos dividir o espaço em regiões corres-
pondendo cada uma a um ponto de rede e com as quais podemos preencher
todo o espaço sem haver superposição. Tais regiões são denominadas células
primitivas. A figura 6.6 nos mostra dois exemplos de células primitivas em
uma rede bidimensional.
A primeira célula, localizada na parte superior da figura, tem como
vértices quatro pontos de rede e claramente atende a definição. Considerando
que ela esteja associada a um de seus quatro vértices (pode ser qualquer um
dos quatro), você poderá construir cópias para cada um dos demais pontos
da rede, as quais irão preencher todo o espaço sem superposições. No caso

CEDERJ 122
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Figura 6.6: Células primitivas em uma rede bidimensional

tridimensional, a célula equivalente a esta corresponde ao volume gerado


pelos três vetores primitivos {~a1, ~a2, ~a3}, VC = |~a1 · (~a2 × ~a3)|.
Todavia, a maneira de dividir o espaço em células primitivas não é
única. Na parte inferior da figura 6.6 encontramos outra célula primitiva, a
qual é construı́da de uma forma muito interessante: você toma um sı́tio da
rede e traça todos os segmentos que o unem a todos os outros pontos; em
seguida, traça o plano bissetor de cada um desses segmentos (no nosso de-
senho, temos linhas bissetoras), definindo então uma região em torno do sı́tio
considerado, cujos pontos estão mais próximos desse sı́tio do que de qualquer
outro. É claro que você poderá repetir esse procedimento considerando um
outro sı́tio da rede e as diversas regiões que vão se formando preencherão
todo o espaço, sem superposições. Ou seja, são também células primitivas,
que denominamos células de Wigner-Seitz, em homenagem aos fı́sicos Eugene
Paul Wigner (1902-1995) e Frederick Seitz (1911-2008), que a introduziram.
A definição de célula primitiva implica que, independente da maneira
como elas são construı́das, o volume (ou a área, no caso de redes bidimension-
ais) é sempre o mesmo. Você pode verificar que isto de fato ocorre quando
tomamos as duas células mostradas na figura 6.6.

Tipos de redes de Bravais


Podemos mostrar que em duas dimensões existem cinco redes de Bra-
vais, as quais são mostradas na tabela 6.5. Já em três dimensões, encon-
tramos quatorze redes, que são apresentadas na figura 6.7. Focalizaremos
nossa atenção nas três primeiras, denominadas cúbica simples, cúbica de

123 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

a2
f
a1 6 |~a2| φ < 90◦
|~a1| =

a2
f

a1 6 |~a2| φ = 90◦
|~a1| =

a2
f

a1 6 |~a2| φ = 90◦
|~a1| =

f
a2

a1 |~a1| = |~a2| φ = 120◦

a2 f

a1 |~a1| = |~a2| φ = 90◦

Tabela 6.5: Redes de Bravais em duas dimensões

CEDERJ 124
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

metal estrutura parâmetro de rede raio atômico


cristalina a(nm) R(nm)
alumı́nio FCC 0,405 0,1431
cobre FCC 0,361 0,1278
ouro FCC 0,408 0,1442
ferro* BCC 0,287 0,1241
chumbo FCC 0,495 0,1750
nı́quel FCC 0,352 0,1246
platina FCC 0,392 0,1387
prata FCC 0,409 0,1445
tungstênio BCC 0,316 0,1371

Tabela 6.6: Alguns metais com rede cúbica. (*)O ferro à temperatura ambi-
ente apresenta-se numa rede BCC, mas pode ser FCC em outras temperat-
uras mais elevadas.

face centrada e cúbica de corpo centrado, pois ocorrem com muita frequência.
Por tradição, referimo-nos a elas pelas siglas formadas a partir de suas des-
ignações na lı́ngua inglesa: SC (simple cubic), FCC (face centred cubic) e
BCC (body centred cubic). A maioria dos metais tem estrutura cúbica, daı́
a importância de seu estudo. As células mostradas na figura 6.7 são deno-
minadas células convencionais, que são muito usadas porque permitem uma
fácil visualização da estrutura da rede. É importante ter claro que, exceto
no caso da rede cúbica simples (SC), as células primitiva e convencional são
diferentes, sendo que o volume da convencional é maior que o da primitiva.

Exemplo 6.1
Veja, por exemplo, o caso da rede FCC, mostrada na figura 6.8. Cada um dos
oito sı́tios nos vértices do cubo é compartilhado por oito células (atribuı́mos
então a cada um o peso 1/8), enquanto que cada um dos seis sı́tios situados
nas faces é compartilhado por duas células (peso 1/2). Então temos: 8 ×
(1/8) + 6 × (1/2) = 4 átomos na célula convencional, que tem volume igual
a a3. Os vetores primitivos são:
1 1 1
~a1 = a(x̂ + ŷ) , ~a2 = a(ŷ + ẑ) e ~a3 = a(ẑ + x̂) (6.3)
2 2 2
e a célula primitiva definida por eles está indicada na figura. o volume da
célula primitiva deve ser 1/4 do volume da célula convencional, já que ela
contém um só átomo. Vamos verificar. Ele é dado por V = |~a1 · (~a2 × ~a3 |.

125 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

Figura 6.7: Células convencionias das 14 redes de Bravais em três dimensões


(ilustração: manter as expressões SC, BCC e FCC; entre as demais,
deverão ser traduzidas: Ortorrômbica, Monoclı́nica, Triclı́nica,
Trigonal e Hexagonal)

Figura 6.8: Célula primitiva da rede FCC. Refazer ilustração

CEDERJ 126
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Temos que
1
~a2 × ~a3 = a2 (x̂ + ŷ − ẑ) ,
4

levando a um volume V = 14 a3. Note que este resultado é coerente com


o obtido usando-se a célula convencional que tem 4 átomos ou sı́tios num
volume igual a a3.

Atividade 2
(Objetivos 1 e 2)
Mostre que a célula convencional da rede cúbica de corpo centrado (BCC)
compreende dois pontos de rede.
deixar 3cm

Resposta comentada
Neste caso, a célula convencional é um cubo com um sitio em seu centro.
Cada um dos oito sı́tios nos oito vértices do cubo é compartilhado por oito
células convencionais (damos a cada um deles o peso 1/8). Assim temos
8 × (1/8) + 1 = 2 sı́tios compreendidos na célula, que, portanto, tem o dobro
do volume da célula primitiva.
Fim da atividade

Podemos representar as células cristalinas de várias maneiras, conforme


nossa conveniência. A figura 6.9 mostra três possibilidades para a repre-
sentação da célula convencional da rede FCC. Em 6.9(a) temos cada ı́on
representado pela fração de uma esfera dura com raio igual ao raio atômico.
Nesta forma de visualizar temos uma boa noção de quanto espaço é ocupado
pelos átomos. 6.9(b) mostra cada átomo como uma esfera de raio arbitrário,
menor que o raio atômico. A ideia desta representação é visualizar me-
lhor todos átomos. Finalmente na 6.9(c) temos esferas com o raio atômico,
mostradas integralmente, aglomeradas de acordo com a simetria da rede.
A simetria das redes são muito importantes pela relação que tem com
grandezas fı́sicas que desejamos medir. Duas grandezas importantes nesse
sentido são o número de coordenação e a fração de empacotamento, que
analisamos a seguir.

127 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

Figura 6.9: Representações gráficas da rede FCC. (a) esferas duras (b) esferas
duras reduzidas e (c) agregados de átomos (ilustração: refazer)

Figura 6.10: Representações gráficas da rede BCC. (a) esferas duras (b)
esferas duras reduzidas e (c) agregados de átomos (ilustração: refazer)

CEDERJ 128
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Número de primeiros vizinhos ou número de coordenação z - Esses


são os vizinhos mais próximos na rede. Várias vezes considermos que
uma dada interação ocorre apenas entre um átomo e seus primeiros vi-
zinhos. A interação de troca, que será analisada na Aula 8, responsável
pelo ferromagnetismo de alguns materiais é um exemplo. Para realizar
esta contagem usamos a representação mostrada na figura 6.9(b). Para
a rede FCC exemplificada na figura, tomamos como referência o átomo
do centro da face superior. Esse átomo tem 4 primeiros vizinhos nos

vértices, a uma distância d = a/ a, onde a é o lado do cubo. Os átomos
nos centros das faces laterais também estão a essa distância. Temos 4
desses átomos abaixo (mostrados na figura) e 4 acima (imaginando que
a rede se repete em todas as direções). Finalmente são 12 primeiros
vizinhos na rede FCC.

Fração de empacotamento F - É a fração do volume da rede ocupado


por átomos, sendo uma grandeza diretamente relacionada à densidade
do material. Para calcular esse número a representação mostrada na
figura 6.9(a) é a ideal. O volume da célula mostrada é a3 . Pelo desenho
vemos que cada átomo da face tem metade dentro da célula e os dos
cantos tem 1/8 dentro da célula. Assim, número total de átomos na
célula é 6× 21 +8× 81 = 4. Se R é o raio atômico, cada átomo tem volume
4πR3 /3. Precisamos agora relacionar o raio atômico e o parâmetro de
rede. Novamente olhando a figura 6.9(a) vemos que a diagonal da face

do cubo, d, contém 4 raios atômicos, logo, d = 4R. Assim, R = a 2/4
e

4 × 4πR3 /3 π 2
F = = = 0,74 , (6.4)
a3 6

que é o maior valor possı́vel para o empacotamento de esferas iguais.

Atividade 3
(Objetivos 1, 2, 3 e 4 )
O cálcio tem estrutura FCC, raio atômico de 0,197 nm e massa atômica de
40,08 g/mol. Calcule sua densidade. Para sua referência o valor tabelado é
ρtab =1,55 g/cm3 ).

129 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

deixar 3cm

Resposta comentada
Densidade é massa por volume, assim podemos usar como volume a célula
cúbica convencional, bastando calcular quanta massa há nela. Na rede FCC
o a diagonal da face compreende 4 raios atômicos, portanto o raio atômico e
o parâmetro de rede estão relacionados como

a = 2 2R

logo

a = 2 × 1,4 × 0, 197 = 0,55 nm e V = a3 = 0,173 nm3 = 0,173 × 10−21 cm3

Na rede FCC temos 4 átomos por célula, assim,


4 × 40,08 g/mol
ρ= = 1,54 g/cm3
6,02 × 1023 mol−1 × 0,173 × 10−21 cm3
Fim da atividade

Colocação dos átomos na rede


Temos então que cada cristal possui uma rede de Bravais associada.
Mas note que para caracterizar completamente um cristal você precisa es-
pecificar também os átomos que ocupam os sı́tios dessa rede. No caso de
alguns metais, como o cobre, o nı́quel e a prata (há outros exemplos) o cristal
é construı́do colocando-se em cada ponto de rede um só átomo do elemento
em questão. No entanto, podemos pensar que, em cada ponto da rede seja
possı́vel colocar mais de um átomo. O conjunto de átomos que colocamos em
cada ponto de rede (não importa quantos sejam) é denominado base. Assim,
podemos dizer que:

cristal = rede de Bravais + base

É uma maneira interessante de olharmos um cristal, não é mesmo? E carac-


teriza completamente a estrutura cristalina.

CEDERJ 130
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Figura 6.11: Estrutura cristalina do NaCl em duas representações. As esferas


menores representam o sódio. A base consiste em um Na em 000 e um Cl
em 12 21 12 Refazer figura

Um exemplo clássico é o cloreto de sódio, NaCl. O cristal de cloreto de


sódio é formado a partir de uma rede FCC. A base consiste em um átomo
Na e um Cl separados pela metade da diagonal do cubo, como pode ser visto
na figura 6.11. Outro exemplo pode ser visto na figura 6.12. A estrutura do
diamante é obtida colocando-se dois átomos de carbono em cada sı́tio de uma
rede FCC. A base consiste de um átomo em 000 e outro 41 14 41 , em unidades
de parâmetro de rede.
Voltemos a uma questão que havı́amos deixado em aberto. Como de-
screver um cristal cujos átomos estejam localizados nos pontos mostrados na
figura 6.5? Já vimos que esses pontos não formam uma rede de Bravais. A
solução é então descrever esse arranjo como sendo uma rede quadrada (que
é uma rede de Bravais), em cujos pontos colocamos um conjunto de três
átomos (uma base). Veja na figura 6.13 como tudo ficou consistente.

Atividade 4
(Objetivos 1, 2, e 4)
O silı́cio (Si), o germânio (Ge) e o estanho (Sn)-elementos da coluna 14
(grupo IV) na tabela periódica-cristalizam-se na estrutura do diamante (veja
a figura 6.12(a). Quantos átomos existem em uma célula primitiva desses
materiais? E na célula convencional?
deixar 3cm

131 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

(a) (b)

Figura 6.12: Estrutura cristalina do diamante. (a) posições atômicas na


célula cúbica do diamante, projetadas numa das faces. As frações indicam
a altura com relação à face inferior. Os pontos 0 e 12 estão na rede FCC, os
pontos em 41 e 34 estão numa rede similar deslocada ao longo da diagonal do
cubo de 41 de seu comprimento. A base consiste de um átomo em 000 e outro
111
444
; (b) a rede do diamante em três dimensões.

Figura 6.13: Rede quadrada com três átomos por ponto de rede

CEDERJ 132
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Figura 6.14: Processo de solificação de uma amostra policristalina a partir


de solução. (a) pequenos cristalitos se formam na solução, com orientações
aleatórias; (b) os cristalitos crescem à medida que mais átomos se agregam
aos cristalitos já existentes; (c) a solidificação terminou resultando em uma
amostra com grãos de tamanhos variados e orientações da rede cristalina
diferentes; (c) as linhas indicam as fronteiras entre as regiões ordenadas.
Refazer figura

Resposta comentada
A rede de Bravais da estrutura do diamante é a cúbica de face centrada, tendo
dois átomos por ponto de rede. Como cada célula primitiva contém um ponto
de rede, então essa célula contém dois átomos. Já a célula convencional,
mostrada na figura (17.10a), contém quatro pontos de rede, portanto, oito
átomos.
.
Fim da atividade

Monocristais, sólidos policristalinos e amorfos

Em um sólido cristalino, quando o arranjo periódico dos átomos se


estende por toda a amostra, dizemos que temos um monocristal. Na prática
a obtenção de um monocristal grande é algo bem difı́cil, requerendo muito
controle durante a a solidicação. A maioria dos sólidos cristalinos é composta
por uma coleção de pequenos cristais ou grãos formando o que chamamos
de um sólido policristalino. A figura 6.14 mostra, esquematicamente, como
a formação de um policristal ocorre.
Existem muitos sólidos que não apresentam um arranjo regular de seus

133 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

Figura 6.15: Duas possı́veis estruturas bidimensionais para o dióxido de


silı́cio. (a) estrutura cristalina (b) estrutura amorfa.

átomos a longas distâncias, apenas localmente. Chamamos esse sólidos de


não cristalinos ou amorfos. A figura 6.15 traz um exemplo bidimensional
esquemático dessa situação. Na figura 6.15(a) temos o material cerâmico
SiO2 (dióxido de silı́cio) na forma cristalina e na figura 6.15(b) o mesmo
material na forma amorfa. Mesmo tendo o átomo de silı́cio sempre ligado a
três átomos nas duas estruturas, vemos que na estrutura amorfa, à medida
que nos distanciamos de uma determinado átomo de referância, a estrutura
torna-se irregular.
O que determina se o sólido será cristalino ou amorfo é a forma com que
o lı́quido (que não tem uma estrutura regular) se solidifica. O resfriamento
muito rápido é uma das principais causas da formação de materiais amorfos.
Metais em geral formam sólidos cristalinos. Alguns materiais cerâmicos são
cristalinos, outros não. Polı́meros podem ser cristalinos, amorfos ou uma
mistura dos dois.

Difração de raios X

A difração de raios X é a principal técnica experimental para a deter-


minhação da rede cristalina de um dado material. Historicamente muito da
nossa compreensão a cerca de arranjos de átomos e moléculas em sólidos re-
sultam da análise do padrão de difração de raios X.

Box de curiosidade:

CEDERJ 134
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Atualmente dispomos de algumas


técnicas que nos permitem investigar
a estrutura atômica de um material, catodo

dentre as quais a mais comumente


utilizada baseia-se no fenômeno de
difração de raio X. Sobre ela há uma
história interessante, que vale a pena anodo

ser contada. Em 1895, o fı́sico alemão


Wilhelm Conrad Röntgen (1845-1923) fez alguns experimentos com tubos de
vácuo (ou tubos de raios catódicos, como também são conhecidos). Obser-
vou que, quando atravessados por uma corrente elétrica, esses tubos emitiam
uma radiação até então desconhecida. Deu a essa radiação o nome provisório
de raios X, designação pela qual passaram a ser definitivamente conhecidos.
figura obtida em:
(http://upload.wikimedia.org/wikipedia/commons/f/f0/Cosser Crookes xray tube.jpg)
Fim do box de curiosidade
O fenômeno de difração nos é bem conhecido. Ele ocorre, por exemplo,
quando uma onda incide sobre uma grade, cujo espaçamento é comparável
ao comprimento de onda da radiação. Cada ponto da grade espalha a ra-
diação segundo diferentes direções e as ondas espalhadas interferem entre si,
construtiva ou destrutivamente. resultando no fenômeno que denominamos
difração da onda. A figura 6.16 mostra a interferência entre ondas na su-
perfı́cie de um liquido, emitidas por duas fontes pontuais. Vemos claramente
a existência de direções segundo as quais ocorrem interferências construtivas
e destrutivas. A experiência realizada por von Laue, Knipping e Friedrich,
pela qual von Laue recebeu o Premio Nobel em Fı́sica de 1914, foi de fato
muito importante, pois se por um lado revelou o caráter ondulatório dos raios
X, por outro demonstrou serem os cristais formados por arranjos regulares
de átomos, que podem funcionar como uma grade de difração para os raios
X.
A relevância desse trabalho foi imediatamente reconhecida e já no ano
seguinte à sua divulgação o fı́sico William Laurence Bragg (1890-1971) pub-
licou um artigo apresentando as estruturas cristalinas de quatro sais (KCl,
NaCl, KBr e KI), obtidas utilizando a técnica de difração de raio X.
O experimento para a determinação da estrutura cristalina a partir da
difração de raios X é bastante simples e sua montagem está ilustrada na
figura 6.17. Um feixe de raio X incide sobre um cristal, sendo espalhado por
este, indo sensibilizar um filme fotográfico. Se a energia do raio X estiver tipi-

135 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

interferência construtiva

interferência destrutiva

Figura 6.16: figura de interferência entre ondas na su-


perfı́cie de um lı́quido, emitidas por duas fontes pontuais.
(http://upload.wikimedia.org/wikipedia/en/d/dc/Interf.png)

cristal
filme

colimador

entrada dos raios X saída


dos raios X dos raios X

Figura 6.17: Montagem do experimento de difração de raios X por um cristal

CEDERJ 136
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

Figura 6.18: Padrão de difração do composto KAl(SO4)2 .12H2 O.


(https://wiki.brown.edu/confluence/download/attachments/5896/diffraction.jpg)

camente de 10 a 50 keV, o que significa comprimentos de onda da ordem de


1×10−10 a 2×10−10 m, então forma-se no filme fotográfico uma imagem como
a mostrada na figura 6.18. Esta é uma tı́pica figura de difração, constituı́da
por pontos claros, que denominamos picos de difração, sobre um fundo es-
curecido. Em termos gerais, podemos explicar o fenômeno de difração com
base nas seguintes considerações.
Como sabemos, uma onda eletromagnética tem como componentes
campos elétrico e magnético oscilantes. Quando a onda incide sobre um
átomo (ou ı́on), o campo elétrico causa uma perturbação oscilatória nos
elétrons atômicos, que então emitem radiação em todas as direções do espaço
(lembre-se que uma carga elétrica acelerada irradia ondas eletromagnéticas).
Dizemos que o átomo espalha a radiação.
As ondas espalhadas pelos átomos que compõem o cristal se superpõem
e interferem entre si. Em algumas direções do espaço essa interferência é
construtiva, resultando nos picos de difração, enquanto que outras, a inter-
ferência é destrutiva, resultando em uma região escura no filme.
Esta argumentação parece razoável, mas precisamos mostrar que é isto
que de fato ocorre e, mais importante, precisamos mostrar como que a partir
da figura de difração podemos determinar o arranjo atômico dentro do cristal.
Para tanto, precisaremos analisar mais detalhadamente as condições para a
ocorrência de interferência construtiva.
Considere então um feixe de raio X com um vetor de onda ~k incidindo

137 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

fonte filme
k
k’
q
q fonte
amostra de raios-X
f
2f
d

x detetor
x’

(a) (b)

Figura 6.19: (a) Feixes incidentes sobre dois ı́ons separados por uma distância
d e por eles espalhados. (b) Diagrama esquemático de um difratômetro de
Raios-X

sobre um cristal, como esquematicamente mostrado na figura 6.19, sendo


então espalhado pelos átomos do cristal. Queremos determinar as direções
segundo as quais as ondas espalhadas interferirão construtivamente.
Consideremos então os raios espalhados por dois átomos em planos
cristalinos diferentes, separados de d e seja k~0 o vetor de onda espalhada.
Vamos supor que a radiação seja espalhada elasticamente pelo cristal, de
modo que |~k| = |~k 0 | = k. Isto significa que a frequência ω = k/c (e portanto
a sua energia ~ω) não se altera no processo de espalhamento.
Você pode ver claramente na figura 6.19 que há uma diferença de
caminho óptico entre os raios que incidem sobre os dois átomos e que essa
diferença vale x + x0 . Você deve se lembrar que para ocorrer interferência
construtiva entre as ondas espalhadas pelos dois átomos é necessário que elas
atinjam o filme em fase. E isto significa que a diferença de caminho óptico
deva ser um múltiplo do comprimento de onda λ = 2π/k, ou seja,

x + x0 = nλ (6.5)

onde n é um inteiro. Como x = x0 = d sen θ, temos que a condição para a


observação de um máximo é

2d sen θ = nλ (6.6)

A equação (6.6) recebe o nome de Lei de Bragg.


Vale a pena ressaltar um ponto relativo à energia do feixe de raio X
a ser usado no experimento. Mencionamos o fato de a figura de difração se
formar quando a energia do feixe situa-se na faixa de 10 a 50 keV, o que

CEDERJ 138
Aula 6 - Sólidos cristalinos
MÓDULO 1 - AULA 6

corresponde a comprimentos de onda na faixa de 1 a 2 Angstrons. Sabemos


que a condição para que ocorra a difração é que o comprimento de onda da
radiação seja comparável ao perı́odo da grade de difração, que no caso é o
parâmetro de rede do cristal. Isto então nos deixa claro a faixa de compri-
mento tı́pica dos parâmetros de rede dos materiais.

Box de curiosidade:

William Lawrence Bragg (1890-1971) e seu pai,


Sir William Henri Bragg (1862-1949), receberam
o prêmio Nobel de 1914 por seus trabalhos
em cristalografia. Uma história curiosa envol-
vendo estes dois personagens, que deram impor-
tantes contribuições ao desenvolvimento da técnica
de difração de raio X para a determinação de
estruturas cristalinas, ocorreu quando William William L. Bragg
Lawrence tinha apenas cinco anos de idade. Nessa
ocasião, ele sofreu uma queda de seu triciclo, o
que lhe causou uma fratura no braço. Seu pai, que
havia há pouco tomado conhecimento dos trabal-
hos de Röntegen com raios X, usou esta radiação
para examinar o braço do filho. Foi a primeira
aplicação dessa radiação para fins de diagnóstico
medico de que se tem notı́cia na Austrália, local
onde então viviam.

Sir William Henry Bragg


Fim do boxe de curiosidade

Resumo
Nesta aula, você aprendeu que os materiais que denominamos cristali-
nos são aqueles em que a distribuição espacial dos átomos que os compõem
apresenta periodicidade. Viu que essa distribuição define uma rede cristalina
(que denominamos rede de Bravais) cujos pontos são ocupados por uma base,
que pode conter um ou mais átomos. Ao longo da discussão destes pontos,

139 CEDERJ
Aula 6 - Sólidos cristalinos
Física Estatística e
Matéria Condensada

vários conceitos importantes foram introduzidos, como o de vetores primi-


tivos e de células primitiva e convencional. Focalizamos nosso estudo nas
redes cúbica de face centrada (FCC) e cúbica de corpo centrado (BCC) pela
sua simplicidade e também porque grande parte dos metais de uso comum
tem estrutura cristalina desses tipos.

Leitura complementar
Para anvançar neste tópico um ótimo texto em português é: Introdução
à Fı́sica do estado sólido
Ivan S. Oliveira e Victor L. B. de Jesus
Editora Livraria da Fı́sica
Capı́tulo 4

CEDERJ 140
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

Aula 7
Ideias básicas da Fı́sica Estatı́stica
19 de Janeiro de 2015

Meta
Estabelecer a ligação entre as descrições atômica e macroscópica, através
da definição estatı́stica de entropia e da hipótese fundamental de Boltzmann,
e apresentar a distribuição de Boltzmann.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Entender o equilı́brio térmico de um ponto de vista probabilı́stico;

2. Associar a entropia macroscópica com a multiplicidade de um macroes-


tados;

3. Calcular a probabilidade de ocorrência de um determinado micro ou


macroestado, quando a temperatura é mantida constante;

4. Calcular a função de partição;

5. Utilizar a função de partição para obter informações sobre a termodinâmica


do sistema e

6. Demonstrar o princı́pio da equipartição da energia.

Pré-requisitos
Para o melhor entendimento desta aula você deve rever algumas aulas
de Fı́sica 2A revisando os conceitos de equilı́brio térmico e troca de calor
(Aula 5), entropia (Aula 12), energia interna (Aula 8), calor especı́fico (Aula
9) e Primeira Lei da Termodinâmica (Aula 10).

141 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

Introdução
Nas Aulas 2 e 3 vimos como lidar com distribuições e como identificar
micro e macroestados de sistemas descritos por variáveis aleatórias. Nesta
aula usaremos esses conceitos para estabelecer a conexão ente as descrições
atômica e macroscópica através da definição estatı́stica da entropia. Faremos
isso usando a Mecânica Quântica para o cálculo do espectro de energia das
partı́culas de um sistema contendo um número muito grande delas. A partir
do valor da energia e da temperatura vamos calcular a probabilidade de cada
configuração possı́vel e com essa informação calcular os valores de grandezas
macroscópicas.
Começamos analisando o processo de troca de energia entre dois sis-
temas que estão isolados do resto do universo, do ponto de vista proba-
bilı́stico. Ao estabelecermos a condição de equilı́brio iremos definir, também,
uma entropia estatı́stica que servirá de ligação entre a Fı́sica Estatı́stica e a
Termodinâmica. Em seguida vamos considerar a troca de energia entre um
sistema e uma reservatório, ambos na mesma temperatura T .

O equilı́brio térmico
Vamos considerar um sistema (S) com uma estrutura interna con-
sistindo de duas partes identificáveis, que serão denominadas sistema 1 (S1 )
e sistema 2 (S2 ), contendo N1 e N2 partı́culas, e energias E1 e E2, respec-
tivamente. Inicialmente S1 e S2 estão em equilı́brio individualmente, sepa-
rados por uma parede impermeável (não permite passagem de partı́culas)
e adiabática ou isolante (não permite passagem de calor). Quando o iso-
lamento térmico entre eles é removido as partes S1 e S2 passam a poder
trocar energia. Esperamos o tempo necessário para que se reequilibrem, e
verificamos que no estado final eles passam a ter energias E10 e E20 como
esquematizado na figura 7.1. Do ponto de vista da Termodinâmica esta
situação é bem familiar. Certamente você já resolveu o problema de calcular
a temperatura final de equilı́brio, T 0, de dois objetos, a temperaturas T1 e T2 ,
que estão dentro de um calorı́metro, podendo trocar calor apenas entre si.
A energia total do sistema é constante por causa do isolamento térmico do
calorı́metro e a temperatura de equilı́brio é determinada supondo-se que os
corpos trocam uma certa quantidade de calor dependente de suas temperat-
uras iniciais, suas massas e de que material são feitos. Também impomos que

CEDERJ 142
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

no equilı́brio os corpos estarão na mesma temperatura. A observação exper-


imental concorda com essa uniformidade de temperatura, mas se impomos
apenas a conservação de energia, muitas outras configurações finais seriam
possı́veis, até mesmo aquela em que o corpo mais frio cede uma quantidade
de calor Q, tornando-se mais frio, sendo esse calor absorvido pelo corpo mais
quente, que fica ainda mais quente. Por que isso não ocorre? Essa é a per-
gunta que queremos responder, examinando a probabilidade de ocorrência
de cada estado final que satisfaz a conservação de energia. Vamos formular o
problema em termos da energia. Queremos saber como determinar os valores
finais de energia de cada corpo, para todos os estados finais que satisfazem a
conservação de energia, dentro de uma descrição microscópica probabilı́sca.

S1 S2 S1 dE 2 S2
d E1

E1 E2 E´1 E´2

(a) (b)
parede condutora
parede isolante

Figura 7.1: (a) Dois sistemas em equilı́brio individualmente, isolados um do


outro e do meio externo. Cada um encontra-se num determinado macroes-
tado, com sua respectiva multiplicidade. (b) O isolamento térmico entre
os sistemas é removido, eles trocam calor até atingirem um novo estado de
equilı́brio. Nesse estado final cada sistema estará num outro macroestado,
eventualmente, com outra multiplicidade.

Como o sistema S está isolado, necessariamente devemos ter conservação


de energia, ou seja, E = E1 + E2 = E10 + E20 . Note que são aceitáveis quais-
quer valores de E10 e E20 que satisfaçam a conservação de energia. Estamos,
então, incluindo a possibilidade da parte com menor energia ter sua energia
reduzida e a de maior energia aumentada da mesma quantidade. Do ponto
de vista termodinâmico, isso é equivalente a por dois objetos a temperaturas
diferentes em contato térmico, e o mais quente esquentar, enquanto que o
mais frio esfria mais ainda! Sabemos que na prática essa situação não ocorre.
Veremos a seguir que ela não é observada simplesmente porque é extrema-
mente improvável. Vamos ver como descrever a troca de energia do ponto
de vista estatı́stico. A conservação de energia nos permite escrever o estado

143 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

final em termos da energia total e da energia final de um dos sistemas. Es-


colhemos escrever em termos de S1 . A energia final de S2 é dada por E − E10 .
Sendo g(E, N) a multiplicidade do sistema composto representado na figura
7.1(b), podemos escrever
X
g(E, N) = g1 (E10 , N1 )g2 (E − E10 , N2) , (7.1)
E10

onde g1 (E10 , N1) e g2 (E − E10 , N2 ) são as multiplicidades dos sistemas S1 e


S2 , respectivamente. Na expressão 7.1 usamos as regras da multiplicação e
da soma, revisadas na Aula 2. É importante entender o que significa o lado
direito de (7.1). Como ainda podemos identificar os dois sistemas, estamos
considerando todas as possibilidades de energia para os sistemas individuais,
compatı́veis com a conservação da energia total. Para cada valor de E10 , há
apenas um de E20 possı́vel, assim, podemos usar apenas E10 como variável.
Para um dado valor de E10 , S1 pode ser encontrado em qualquer um de seus
g1 (E10 , N1 ) microestados e, para cada um desses microestados, S2 pode es-
tar em qualquer um de seus g2 (E − E10 , N2 ) microestados. Para determinar
a configuração de equilı́brio, ou seja, qual o valor observado para E10 , pre-
cisamos verificar qual o maior termo na soma (7.1). Esse termo corresponde
à configuração final de maior multiplicidade sendo, portanto, a com maior
probabilidade de ser observada. Assim, num sistema qualquer, o equilı́brio
pode ser encontrado pela determinação do maior termo do somatório (7.1),
o que pode ser feito se maximizamos g1 (E10 , N1 )g2 (E − E10 , N2 ) por variações
em E10 e E20 = E − E10 , ou seja, se impomos a condição
∂g1 ∂g2
d (g1 g2 ) = g2 dE1 + g1 dE2 = 0 .
∂E1 ∂E2
A energia total se conserva, então dE = dE1 + dE2 = 0 ou dE1 = −dE2 .
Com isso, temos que
 
∂g1 ∂g2
d (g1 g2 ) = g2 − g1 dE1 = 0 . (7.2)
∂E1 ∂E2
Seja E o valor de E1 que satisfaz a condição (7.2), temos:

1 ∂g1 1 ∂g2 ∂ln g1 ∂ln g2
= ou = . (7.3)
g1 ∂E1 E1 =E g2 ∂E2 E2 =E−E ∂E1 E1 =E ∂E2 E2 =E−E
A conexão entre a descrição estatı́stica, microscópica, e a termodinâmica,
abordagem macroscópica, foi proposta por Boltzmann, através da definição
estatı́stica de entropia como

S ≡ κ ln g , (7.4)

CEDERJ 144
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

onde κ é a constante de Boltzmann. Com essa definição, a condição de


equilı́brio (7.3) pode ser escrita como

∂S1 ∂S2
= (7.5)
∂E1 E1 =E ∂E2 E2 =E−E
Sabemos que, no equilı́brio térmico, as temperaturas de todas as partes de um
sistema devem ser iguais. Aqui devemos ter T1 = T2 no equilı́brio. Definimos
assim
1 ∂S1 1 ∂S2
≡ e ≡ . (7.6)
T1 ∂E1 E T2 ∂E2 E−E
Neste momento, temos que parar e pensar sobre o que acabamos de fazer.
Uma definição estatı́stica de entropia foi proposta e identificamos como
κ ln g1 (E, N1 ) a entropia do sistema 1 e o equivalente para o sistema 2. Note
que a identificação da temperatura foi feita apenas com relação ao termo
máximo, aquele calculado com E1 = E e E2 = E − E. Isso levou a valores
iguais para a temperatura dos sistemas apenas nessa configuração. Em out-
ras palavras, a definição de temperatura (7.6) vale apenas em sistemas no
equilı́brio.
Para levar nossa análise ao mundo macroscópico, temos que supor sis-
temas muito grandes. Supondo que estamos tratando de sistemas regidos por
uma distribuição como a binomial ou a gaussiana, ou seja, que tem a forma
de um sino. Neste caso, apenas valores entorno do mais provável tem prob-
abilidade razoável de ocorrer. À medida que N1 e N2 forem muito grandes,
levando a um N muito grande, a largura relativa da distribuição diminui,
tornando-se extremamente centrada no valor mais provável.

A hipótese fundamental de Boltzmann


Antes de prosseguir devemos discutir o conceito de equilı́brio. Em-
bora seja bastante simples definir o equilı́brio matematicamente, no mundo
real este é um conceito bastante subjetivo, que só tem sentido quando vem
associado a alguma escala de tempo definida pelas observações experimentais.
Intuitivamente um estado de equilı́brio é algo imutável, permanente, se o
sistema for deixado fora de influências externas. Na prática, tudo está sempre
mudando, o eterno simplesmente é algo que dura muito mais do que o tempo
disponı́vel para as medidas que se desejam fazer. Além disso, o equilı́brio deve
ser estável, ou seja, se tirado do equilı́brio um sistema deve ter mecanismos
internos que o façam retornar ao estado inicial. Por exemplo, se o estado
de equilı́brio requer que a temperatura de um sistema seja uniforme, ao se

145 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

criar um gradiente de temperatura logo haverá um fluxo de calor de forma


a uniformizá-la. Daqui para frente vamos usar o termo estado de equilı́brio
para um estado com essas caracterı́sticas.
Agora vamos imaginar um sistema macroscópico com N partı́culas
em equilı́brio térmico, isolado do meio externo, no macroestado de ener-
gia E. Esse macroestado tem multiplicidade g(E, N). Chamamos de estados
acessı́veis a qualquer um destes g(E, N) microestados compatı́veis com os
dois vı́nculos impostos, que são o número de partı́culas e a energia que
devem permanecer constantes. Boltzmann imaginou que sempre haveria
uma interação residual entre as partı́culas do sistema, responsável por fazer
com que este fique constantemente passando de um microestado a outro.
Essa dinâmica seria imperceptı́vel no nı́vel macroscópico onde apenas valores
médios seriam observados. A hipótese fundamental de Boltzmann diz que, no
equilı́brio, o tempo dedicado a cada microestado acessı́vel é idêntico, e assim
pode-se dizer que todos os microestados acessı́veis são igualmente prováveis,
ou que as probabilidades para os microestados obedecem a uma distribuição
uniforme definida como
1
PE (j) = , (7.7)
g(E, N)
onde j denota um microestado do macroestado de energia E e multiplicidades
g(E, N).
Esta hipótese tem uma consequência importante no que diz respeito
a medidas experimentais. Normalmente um processo de medição envolve a
tomada de valores em momentos distintos, de uma única amostra, seguida
de um processo de promediação, onde o valor médio e a variância são de-
terminados. Esse procedimento está ilustrado na figura 7.2(a). Nesse caso,
estamos tomando uma média temporal, já que os valores usados referem-
se a instantes diferentes. Os valores médios necessários à formulação ter-
modinâmica são provenientes de uma média estatı́stica, obtida por medidas
feitas em sistemas equivalentes. Na figura 7.2(b) podemos ver como ela pode
ser formalmente obtida. A hipótese de Boltzmann garante que as duas médias
são iguais no equilı́brio, se o tempo de observação referente à média temporal
for grande o suficiente. Queremos estudar o comportamento termodinâmico
de um sistema fechado com energia E constante, composto por N partı́culas.
O termo fechado significa que não é pemitida a troca de energia ou partı́culas
com o resto do universo. O ponto de partida é a definição estatı́stica de en-
tropia, Eq. (7.4), S(E, N) ≡ κ ln g(E, N). Até este ponto, o valor de N pode
ser qualquer um. Para que a entropia definida estatisticamente seja equiva-

CEDERJ 146
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

X1

X2

intervalo de medida

Xg

Figura 7.2: (a) Um sistema fechado é observado por um determinado inter-


valo de tempo ∆t. Várias medidas de X são feitas durante esse intervalo, e a
média aritmética delas é o que chamamos de média temporal. Em geral, este
é o procedimento adotado nos processos de medição. (b) O procedimento
descrito aqui é apenas formal e ilustra o tipo de média que é definida pela es-
tatı́stica. O sistema está num macroestado de multiplicidade g. São feitas g
cópias do sistema, cada uma em um dos microestados acessı́veis. A grandeza
X é medida em cada cópia. A média aritmética é tomada, e o valor final é o
que chamamos de média estatı́stica. A hipótese de Boltzmann garante que
as duas médias são equivalentes se ∆t for grande o suficiente e se o sistema
estiver em equilı́brio.

lente à entropia termodinâmica, devemos tomar o limite termodinâmico de


S. Como explicado no inı́cio desta Aula, com esse limite, a configuração de
maior multiplicidade será a contribuição dominante, e a chance de encontrar
o sistema numa configuração diferente dessa é desprezı́vel. Tomado o limite
termodinâmico, usamos a definição de temperatura, Eq. (7.6), para derivar
a equação de estado E(T, N) para o sistema. Vamos entender como realizar
esse cálculo mais uma vez estudando o exemplo a seguir.

147 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada
Exemplo 7.1
Como aplicação, vamos encontrar a relação E(T, N) para o sistema param-
agnético uniaxial descrito na Aula 2. Assim, M = −E/B, e a multiplicidade
dada pela Eq. (2.23) pode ser escrita como

N!
g(E, N) =  1   1
E
 (7.8)
2
N− ! 2 N+E
B B
!

Como faremos N → ∞ em seguida, devemos explicitar todas as dependências


em N. Podemos escrever a energia em termos da energia por partı́cula como
E = N, sendo  independente de N. Obtemos

N!
g(, N) =  N   N

 (7.9)
2
1− ! 2 1 + B !
B

Usando a definição de entropia obtemos


     
S N  N 
= ln N! − ln 1− ! − ln 1+ ! (7.10)
κ 2 B 2 B

Agora tomamos o limite termodinâmico e usamos a aproximação de Stirling


definida na equação (3.10),

S
= N ln N − N (7.11)
κ       
N  N  N 
− 1− ln 1− + 1−
2 B 2 B 2 B
          
N  N  N 
− 1+ ln 1+ + 1+
2 B 2 B 2 B
N       N    
= N ln 2 − 1− ln 1 − − 1+ ln 1 + .
2 B B 2 B B
Assim, temos que

κ ln g
s() = lim (7.12)
N →∞ N
1    1   
= κ ln 2 − 1− ln 1 − − 1+ ln 1 + .
2 B B 2 B B
Só agora, depois de tomado o limite termodinâmico, temos a entropia ter-
modinâmica dada por S = Ns.
Usamos a definição de temperatura para encontrar a equação de estado
T (, N) como

1 ∂S ∂s κ   κ  
= = = ln 1 − − ln 1 + . (7.13)
T ∂E ∂ 2B B 2B B

CEDERJ 148
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

Podemos inverter a expressão acima para obter (T, B) como


 
2B 1 − /B  exp(−B/κT ) − exp(B/κT )
exp = ⇒ = ,
κT 1 + /B B exp(−B/κT ) + exp(B/κT )

dando
B B
(B, T ) = −Btgh ou E = −NBtgh . (7.14)
κT κT
Como a energia do sistema é da forma E = −MB, identificamos imediata-
mente
B
M(B, T ) = N tgh . (7.15)
κT
Fim do exemplo

A distribuição de Boltzmann
O equilı́brio térmico tratado até agora considerava que a energia total
ficava constante. Do ponto de vista experimental o controle da temperatura
é mais conveniente em inúmeras situações. Mesmo em nossa vida do dia a
dia temos fácil acesso à temperatura de uma forma geral e a usamos como
parâmetro de referência. O comportamento de sistemas em função da tem-
peratura é algo que sempre se deseja conhecer, por isso existem equipamentos
projetados para o controle da temperatura de um sistema, permitindo um
estudo de suas propriedades térmicas. Assim, vamos buscar uma descrição
estatı́stica sob esse ponto de vista.
Novamente consideramos um sistema combinado, com duas partes iden-
tificáveis, isolado do meio externo. A diferença agora é que uma das partes
é muito maior que a outra e será chamada reservatório. A figura 7.3 mostra
uma representação dessa configuração. A parte menor receberá o nome de
sistema simplesmente. É nela que estamos interessados. A energia total, E0,
é mantida constante, e depois que o equilı́brio térmico foi atingido, temos
que a energia do sistema é ε e a do reservatório, E0 − ε. As perguntas
agora são: Como determinar a energia do sistema depois que o equilı́brio
térmico for atingido? Já que estamos controlando a temperatura, em que
condições a energia será uma grandeza bem definida, ou seja, em que cir-
cunstâncias as flutuações de energia serão desprezı́veis? Assim como no caso
do equilı́brio térmico entre sistemas isolados do resto do universo, devemos
admitir todos os possı́veis valores para a energia do sistema. Um deles será
mais provável e, no limite termodinâmico, esperamos que corresponda ao
estado de equilı́brio. Começamos calculando a probabilidade Pj de que o

149 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

R S
e
E0- e

Figura 7.3: Um sistema S em contato com um reservatório térmico R. A


fronteira de S permite que haja troca de energia com o reservatório, e o
sistema combinado S + R está isolado do meio externo, sendo a energia
total, E0 , constante.

sistema esteja num determinado microestado dentro de todos os possı́veis,


considerando todos os macroestados. Se o sistema está num microestado j
de energia ε, o reservatório estará no macroestado de energia E0 − ε e multi-
plicidade gR (E0 − ε). Note que o microestado j pode ocorrer estando R em
qualquer um de seus microestados de energia E0 − ε. Seguindo a hipótese
fundamental de Boltzmann, de que no equilı́brio o sistema passeia por todos
os seu estados acessı́veis, passando o mesmo tempo em cada um deles, temos
que o tempo em que ele estará no microestado j será proporcional a gR , ou
seja, a probabilidade Pj será proporcional a gR . Se j é um microestado do
macroestado de energia ε, temos então
Pj (ε) = c gR (E0 − ε) , (7.16)
onde c é uma constante de proporcionalidade, a ser determinada por normal-
ização. Como estamos interessados no limite termodinâmico, estaremos li-
dando com valores de Pj que variam muito rapidamente dependendo do valor
de ε escolhido. Por isso é mais conveniente trabalhar com ln Pj = ln c+ln gR .
Continuamos, usando o fato do reservatório ser muito maior que o sistema,
significando que E0  ε, e que podemos expandir ln Pj em série, na forma
ln Pj (ε) = ln c + ln gR (E0 − ε)

∂ln gR
= ln c + ln gR (E0 ) − ε + O(ε2) . (7.17)
∂E E=E0

Vamos considerar apenas até o termo linear da expansão em série. Podemos


identificar SR = κ ln gR como a entropia do reservatório. Neste caso, usando
a definição (7.6) de temperatura, temos que
 
ε ε
ln Pj (ε) = ln C − ou Pj (ε) = C exp − , (7.18)
κTR κTR

CEDERJ 150
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

sendo TR a temperatura do reservatório, e C uma constante. Em princı́pio


c 6= C porque ao truncarmos a série, a normalização de Pj pode mudar.
Como no equilı́brio as temperaturas do sistema e do reservatório serão iguais,
podemos abolir o ı́ndice R adotado para a temperatura. A constante de
proporcionalidade deve ser determinada por normalização, somando-se as
probabilidades referentes a todos os microestados possı́veis para S,
X X  ε  1
Pj (εj ) = C exp − =1 ⇒ C = P ε
 . (7.19)
j j
κT j exp − κT

Definimos então 
X εj 
Z≡ exp − (7.20)
j
κT
o que leva à definição de probabilidade para um dado microestado como
ε 
exp − κTj
Pj (ε) ≡ . (7.21)
Z
A função Z é chamada função de partição. As probabilidades definidas em
(7.21) compõem o que chamamos de distribuição de Boltzmann. Chamamos
ε 
de fator de Boltzmann a exp − κTj . A soma em (7.20) é sobre todos os mi-
croestados dos sistema, portanto teremos vários termos iguais (os g(ε) termos
que pertencem ao mesmo macroestado). Podemos agrupá-los e escrever Z
em termos de uma soma sobre os macroestados como
X  ε 
Z≡ g(ε) exp − . (7.22)
ε
κT

Com isso, a probabilidade de um determinado macroestado é


ε

g(ε) exp − κT
P(ε) ≡ (7.23)
Z
1
Uma notação muito usada neste contexto é adefinição β ≡ κT
.
A Figura 7.4 mostra o comportamento do fator de Boltzmann em função
da energia e da temperatura, separadamente. No primeiro caso vemos que,
quanto mais baixa a temperatura, menor é a probabilidade de ocupação de
microestados de energia elevada. Se agora fixamos a energia do microes-
tado, vemos que microestados de energia elevada tem uma chance razoável
de ocupação apenas se aumentamos a temperatura.
Atividade 1
(Objetivo 3)
A diferença de energia entre estados eletrônicos é medida em eV, entre esta-
dos nucleares, em MeV= 106 eV, e entre estados subnucleares, em GeV= 109

151 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

Figura 7.4: Comportamento do fator de Boltzmann em função da (a) energia,


em meV e (b) temperatura em K.

eV. A que temperaturas as excitações eletrônicas, nucleares e subnucleares


serão relevantes?
deixar 5cm

Resposta comentada
Se temos dois microestados com energias ε e ε + ∆, a distribuição de Boltz-
mann nos diz que a probabilidade relativa de ocupação deles é dada por
P(ε + ∆ε) exp[−β(ε + ∆ε)]
= = exp(−β∆ε) . (7.24)
P(ε) exp(−βε)

Assim, para um dado valor de ∆ε, quanto maior for a temperatura (menor
β), maior a probabilidade da partı́cula ocupar o microestado com energia
ε + ∆ε. De uma forma geral, dizemos que quando κT > ∆ε a ocupação do
microestado de energia ε + ∆ε torna-se relevante. Vamos, então, calcular
a temperatura T = ∆ε/κ acima da qual as excitações com energia ∆ε tem
chance razoável de ocorrer, para os processos dados.

1,6×10−19 J
estados eletrônicos: ∆ε = 1 eV → Te ≈ ≈ 104 K
1,4×10−23 J/K

estados nucleares: ∆ε = 106 eV → TN ≈ 1010 K

CEDERJ 152
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

estados subnucleares (quarks): ∆ε = 106 eV → TQ ≈ 1013 K

Fim da atividade

A expressão (7.23) é especialmente útil quando a energia é uma variável


contı́nua. Esse é o caso de sistemas clássicos, e de alguns sistemas quânticos,
no limite termodinâmico. Se ε é uma variável contı́nua, a soma é substituı́da
por uma integral na forma
Z  ε 
Z = exp − D(ε)dε , (7.25)
κT

onde D(ε) é o que chamamos densidade de estados, e g(ε) = D(ε)dε é a


multiplicidade referente ao intervalo de energia ε → ε + dε, exatamente
como definido na Aula 4, na equação (4.22).
Podemos usar (7.21) ou (7.23) para calcular os valores médios de grandezas.
Por exemplo, seja uma grandeza definida pela função f(ε), seu valor médio
é dado por P εj 
j f(ε j ) exp − κT
hfi ≡ , (7.26)
Z
ou P 
ε
ε f(ε)g(ε) exp − κT
hfi ≡ . (7.27)
Z

Z1 e ZN
Até agora usamos simplesmente a letra Z para a função de partição,
entretanto, é importante distinguir entre as funções de partição para todo o
sistema, que chamaremos de ZN e a função de partição para uma partı́cula,
que camaremos de Z1 . Uma situação comum é a de termos um sistema em
que as partı́culas são distinguı́veis e independentes. O sólido parmagnético é
um exemplo. Embora os átomos do sólidos sejam idênticos entre si, são dis-
tinguı́veis porque ocupam posições fixas na rede. Além disso, as orientações
individuais dos momentos magnéticos foram escolhidas independentemente.
Neste caso podemos escrever a função de partição do sistema todo em termos
da função de partição para uma partı́cula, como veremos a seguir.
Se as partı́culas são distinguı́veis e independentes a energia total do
sistema num dado microestado pode ser escrita como
N
X
Eα = εiα , (7.28)
i=1

153 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

onde εiα é a energia da i-ésima partı́cula no microestado α. Vamos chamar


de ZN a função de partição para o sistema todo. Temos que
 
X Eα
ZN = exp −
α
κT
PN !
X ε iα
= exp − i=1
α
κT
N
XY  ε 

= exp −
α i=1
κT
N
YX  ε 

= exp −
i=1 α
κT
N
Y
= Z1
i=1
= Z1N , (7.29)
P εiα

onde fizemos a identificação Z1 = α exp − κT
. Esse tipo de fatoração
simplifica incrivelmente o cálculo e sempre tentaremos usá-la. Vamos ver um
exemplo dessa fatoração.
Exemplo 7.2
Como vimos na Aula 2, a energia de um sólido paramagnético com N partı́culas
é dada por
XN
E = −B σi , (7.30)
i=1

onde B é o campo magnético externo e σi é uma variável que pode ter


valores +1 e −1 se o momento magnético da i-ésima partı́cula está paralelo
ou antiparalelo ao campo externo, respectivamente (ver figura 2.4).
Para calcular diretamente ZN para este sistema, usamos a soma sobre
os macroestados, ou seja, sobre os valores de energia e não sobre os valores
individuais de σ. Para isso vamos usar a expressão (7.22):
X  ε 
Z≡ g(ε) exp − ,
ε
κT

que implica no cálculo da multiplicidade. Podemos escrever a energia como

E = −B(N+ − N− ) = −B [N+ − (N − N+ )] , (7.31)

onde N+ (N− ) é o número de momentos magnéticos com alinhamento para-


lelo(antiparalelo) ao campo externo. A multiplicidade do macroestado de

CEDERJ 154
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

energia E é dada por


N!
g(N, N+ ) = .
N+ !(N − N+ )!
Temos então
N
X N!
ZN = exp [βBN+ ] exp [−βB(N − N+ )] (7.32)
N+ =0
N+ !(N − N+ )!

N
X N!
= [exp (βB)]N+ [exp (−βB)](N −N+ )
N+ =0
N+ !(N − N+ )!
Para realizar a soma usamos a expressão do binômio
N
X N!
(x + y)N = xn y N −n .
n=0
n!(N − n)!
Identificando x = exp (+βB) e y = exp (−βB), temos
ZN = [exp (+βB) + exp (−βB)]N = [2 cosh(βB)]N (7.33)

Vamos ver como fica este mesmo problema se realizamos a soma so-
bre os microestados usando a expressão (7.20). Um microestado qualquer
das N partı́culas é definido pelos valores de σ de cada uma. As partı́culas
não interagem entre si, isso significa que cada uma pode ter σ = ±1 inde-
pendentemente levando a um total de 2N microestados. A soma sobre esses
microestados é uma soma sobre os N valores de σ, na forma
N
!
X X X X
ZN = ... exp βB σi
σ1 =±1 σ2 =±1 σN =±1 i=1

X X X N
Y
= ... exp (βBσi)
σ1 =±1 σ2 =±1 σN =±1 i=1
" #" # " #
X X X
= exp (βBσ1) exp (βBσ2) . . . exp (βBσN )
σ1 σ2 σN
" #N
X
= exp (βBσ) = Z1N . (7.34)
σ

Reduzindo o problema ao cálculo de Z1 tudo fica muito mais fácil. Temos


X
Z1 = exp (βBσ) = exp(+βB) + exp(−βB) = 2 cosh(βB) . (7.35)
σ=±1

Assim,
ZN = [2 cosh(βB)]N (7.36)

Fim do exemplo

155 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

O efeito das flutuações


O efeito das flutuações de energia pode ser estudado pelo cálculo da
variância da distribuição de Boltzmann. Usando a definição (7.26) de valor
médio temos
P 2   P   2
Ej Ej
E
j j exp − κT j Ej exp − κT
σE2 ≡ hE 2 i − hEi2 = −  . (7.37)
Z Z

A combinação 1/κT aparece tantas vezes nos cálculos de fı́sica estatı́stica,


que torna-se conveniente defini-la como uma variável. Usualmente usamos a
letra β para isso. Com essa definição, a função de partição fica escrita como
P
Z = j exp(−βE). Agora, note a seguinte igualdade:

∂Z X
=− E exp(−βE) . (7.38)
∂β j

Com ela podemos reescrever hEi e hE 2 i como

1 ∂Z 1 ∂ 2Z
hEi = − = Eint e hE 2 i = . (7.39)
Z ∂β Z ∂β 2
Assim,
 2  
1 ∂ 2Z 1 ∂Z ∂ 1 ∂Z ∂hEi ∂hEi
σE2 = − = =− = κT 2 . (7.40)
Z ∂β 2 Z ∂β ∂β Z ∂β ∂β ∂T

hEi é o valor de médio da energia, é o valor que observamos macroscopi-


camente e que estamos acostumados a chamar de energia interna na Ter-
modinâmica, ou Eint, se usamos a notação da disciplina Fı́sica 2A. Se medi-
mos várias vezes a energia interna de um sistema macroscópico em equilı́brio,
mantido a uma temperatura constante, obtemos sempre o mesmo valor. No
entanto, ao associarmos a energia interna ao valor médio da energia de um
sistema, estamos admitindo que ele possa ter vários valores de energia, tendo
cada um a probabilidade P(E) de ocorrer, de acordo com a expressão (7.23).
Para que o valor observado de energia seja bem definido, é necessário que
σE /N seja um valor muito pequeno. Normalmente a energia é escrita em
função das variáveis extensivas, como por exemplo o volume. Chamando de
X a variável extensiva que foi mantida constante, temos que a derivada da
energia interna com relação à temperatura é CX (capacidade térmica a X
constante). Definindo o calor especı́fico cX como CX /N, temos que

σE2 = κT 2 NcX , (7.41)

CEDERJ 156
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

ou seja, a flutuação relativa dos valores de energia é



σE κT 2cX
= √ , (7.42)
N N
o que significa que, sendo cX finito, σE /N → 0 quando N → ∞, quer dizer,
a energia se torna bem definida no limite termodinâmico, embora tenha sido
permitido que assumisse qualquer valor.
Atividade 2
(Objetivos 3, 4 e 5)
Considere um sistema hipotético em que cada partı́cula pode ter três valores
de energia ε1 = 0,001 eV, ε2 = 0,01 eV e ε3 = 0,1 eV. Sabendo que as
multiplicidadfes são g1 = 1, g2 = 2 e g3 = 50, responda:

1. Qual o valor de energia mais provável quando T = 350 K?

2. Estime o intervalo de temperatura para o qual ε2 é a energia mais


provável.

3. Qual dos valores de energia corresponderia a ter o sistema com maior


entropia? Explique.

Dica: Faça os gráficos de P(ε) para ε = ε1 , ε2, ε3 e temperaturas entre 100 e


400 K e use o gráfico para responder os ı́tens (a) e (b).
deixar 5cm

Resposta comentada
Vamos usar a expressão (7.23) para a probabilidade do macroestado:
ε

g(ε) exp − κT
P(ε) ≡ .
Z
Seguindo a sugestão contruimos o gráfico abaixo, de ZP(ε) em função de T .
Notem que não precisamos calcular a função de partição.

157 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

(a) Analisando as curvas do gráfico, vemos que , em T ≈ 350 K, ZP(ε3) >


ZP(ε2) > ZP(ε1), logo, P(ε3) > P(ε2 ) > P(ε1 ). Sendo assim, ε3 é o valor
de energia mais provável.
(b) No intervalo aproximadamente definido como 150 < T < 320 K, a curva
relativa a ZP(ε2) tem os maiores valores, ou seja, ε2 é o valor de energia
mais rovável.
(c) Usamos aqui a definição (4.4): S = κ ln g. A maior entropia (maior valor
de g) corresponde à energia ε = ε3.
Fim da atividade

Atividade 3
(Objetivos 1 e 2)
Um ziper tem N elos, cada um pode estar no estado fechado com energia
0, e aberto com energia . O ziper só pode ser aberto a partir do extremo
esquerdo, e o i-ésimo elo só pode estar aberto se os elos a sua esquerda estão
abertos.
(a) Mostre que a função de partição deste sistema pode ser somada para dar:
1 − exp[−β(N + 1)]
Z= (7.43)
1 − exp(−β)
P
Dica: Mostre que N n
n=0 x =
1−xN +1
1−x
para x < 1.
(b) No limite   κT , calcule o número médio de elos abertos à temperatura
T.
deixar 5cm

Resposta comentada
(a) Os possı́veis valores de energia são: E = 0, ε, 2ε . . . Nε, ou seja, E =
nε, n = 0, 1 . . . N. Como o zı́per só pode ser aberto a partir do extremo
esquerdo e o i-ésimo elo só pode estar aberto se os elos à sua esquerda também
estiverem, a multiplicidade do macroestado de energia E é g(E, N) = 1.
Escrevemos a função de partição:
N
X  nε  X N h  ε in
Z= exp − = exp − .
n=0
κT n=0
κT

Para realizar a soma, vamos seguir a dica. Começamos por mostrar que
P∞ n
n=0 x = 1/(1 − x) para x < 1. Note que

X
xn = 1 + x + x2 + x3 + . . . (7.44)
n=0

CEDERJ 158
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

e

X
x xn = x + x2 + x3 + . . . (7.45)
n=0

Subtraindo (7.45) de (7.44) temos


∞ ∞
X
n 2 3 2 1 3
X
(1 − x) x = 1+x+x +x +...−x−x −x ... = 1 ⇒ xn =
n=0 n=0
1−x
(7.46)
Queremos uma expressão para a soma até N. Podemos obte-la se observamos
que
N
X ∞
X ∞
X ∞
X ∞
X
n n n n N +1
x = x − x = x −x xn
n=0 n=0 n=N +1 n=0 n=0
∞ N +1
N +1
X 1−x
= 1−x xn = (7.47)
n=0
1−x

ε

Assim, identificando x ≡ exp − κT temos
h i
1 − exp − (NκT
+1)ε

Z= ε
 (7.48)
1 − exp − κT

(b) Usamos a definição de média para um sistema à temperatura constante:



 P∞
n exp − κT n=0
hni = (7.49)
Z
ε

Quando ε  κT temos que x ≡ exp − κT é um número muito pequeno, tal
2 3
que x  x  x e assim por diante. Nesta aproximação temos

X
nxn = 0 + x + 2x2 + 3x3 + . . . ≈ x (7.50)
n=0

e
1 − xN +1 1
Z= ≈ ≈ (1 + x) , (7.51)
1−x 1−x
onde usamos a aproximação (1 + x)m ≈ 1 + mx válida para x  1. Logo
ε

x exp − κT
hni ≈ = ε

1+x 1 + exp − κT

fim da atividade

159 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

Conexão com a Termodinâmica


Assim como na discussão do equilı́brio térmico, o fato de termos a
variável livre assumindo valores termodinâmicos bem definidos quando N →
∞, está relacionado com a existência de um termo predominante em (7.22).
A multiplicidade é sempre uma função crescente da energia, e o fator de
Boltzmann decresce com o aumento da energia, assim, o produto de funções
com esses comportamentos acaba gerando uma função que apresenta um
pico. Assim, quando escrevemos Z na forma (7.22) temos a certeza de que
existe um termo máximo, ou dominante. Este comportamento será acentuado
quando fizermos N → ∞. Vamos considerar que, nesse limite, a soma em
Z possa ser substituı́da pelo maior termo apenas. Se usamos a definição de
entropia em função da multiplicidade, podemos escrever g(E) = exp(S/κ) e
X
Z= exp [−β(E − T S)] . (7.52)
E

Para um dado valor de temperatura, o maior termo do somatório (termo


dominante) corresponde ao que tem o menor valor de E − T S. Considerando
que quando N → ∞ este é o único termo importante, temos

lim Z = exp [−β min(E − T S)] . (7.53)


N →∞

Definimos a função F tal que

F ≡ lim −κT ln Z = min(E − T S) . (7.54)


N →∞

Com essa definição a função de partição, no limite termodinâmico, pode ser


escrita como
Z = exp(−βF ) . (7.55)

Aqui podemos fazer as seguintes identificações, válidas apenas no limite


termodinâmico: E → hEi = Eint. Esse procedimento é possı́vel pelo fato de
σE /N → 0 no limite termodinâmico, como acabamos de ver. Com essa
substituição concluı́mos que, no limite termodinâmico, a configuração de
troca de energia mais provável, que corresponde ao termo dominante da
função de partição, é aquela que minimiza a quantidade F = Eint −T S. Note
que à medida que T é fixa, F é diminuı́do se Eint diminui, ou se S aumenta.
A grosso modo, quando T for baixa, o termo T S é pouco importante, e o
critério de diminuição de energia será predominante. Um caso extremo é
o em que T = 0, onde apenas a minimização da energia define o equilı́brio.
Esta é exatamente a situação dos sistemas regidos pela Mecânica (clássica ou

CEDERJ 160
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

quântica). Por outro lado, se a temperatura é alta o suficiente, a maximização


da entropia será o principal critério. De uma forma geral, o comportamento
térmico dos sistemas é regido pela competição entre minização de energia e
maximização de entropia.
A função F (X, T, N) define o que chamamos energia livre de Helm-
holtz. A estrutura da Termodinâmica está baseada na definição de energias
livres, ou potenciais termodinâmicos, adequados a situações que refletem a
realidade experimental. Existem outras energias livres definidas para os casos
em que outras variáveis de estado são mantidas sob controle. O estudo dessa
interessantı́ssima estrutura matemática está fora do escopo desta disciplina.
Se você tem interesse, sugiro que consulte a leitura complementar indicada
no final desta aula.

Interpretação estatı́stica da Primeira Lei da Termodinâmica


Vamos considerar um sistema hipotético, bem simples. Temos N = 10
partı́culas que podem ocupar 4 nı́veis de energia não degenerados, com ener-
gias ε1 . . . ε4, como indicado na figura 7.5. Se T = 0, não havendo restrição
para a ocupação dos nı́veis, o critério de minimização de energia leva ao es-
tado fundamental onde E = Nε1 . Para T 6= 0 a probabilidade de ocupação
dos nı́veis superiores aumenta. Observando a expressões (7.21) e (7.23) e a
figura 7.4 vemos que o aumento da temperatura faz com que a probabilidade
de ocupação dos nı́veis de energia mais elevada aumente. Numa dada tem-
P
peratura, podemos escrever a energia total do sistema como E = 4i=1 ηi εi.
As variáveis ηi definem o que chamamos de ocupações, elas dão o número de
partı́culas em cada nı́vel de energia. No caso da figura 7.5(b) temos η1 = 5,
η2 = 3, η3 = 0, η4 = 2. Podemos obter valores diferentes de E se variamos as
ocupações ηi , ou se variamos os valores dos εi . O primeiro caso está ilustrado
nas figuras 7.5(b) e (c). Em geral teremos os nı́veis de energia dependendo de
uma variável extensiva X, como o volume. Se X é variado, mantendo fixas
as ocupações, os valores dos εi mudam e a energia total do sistema varia
(veja a figura 7.5(d)). Essas duas contribuições podem ser identificadas se
calculamos a variação total de energia. Temos
4
X 4
X
E= ηi εi ⇒ dE = (εi dηi + ηi dεi ) (7.56)
i=1 i=1

No primeiro termo de dE a variação das ocupações leva a um aumento na


multiplicidade do macroestado ou, do ponto de vista termodinâmico, um

161 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

(a) T=0 (b) T1 > 0


e4 e4
e3 e3
e2 e2
e1 e1

(d) T3
(c) T2 > T1 e4
e4 e3
e3
e2
e2
e1 e1

Figura 7.5: Representação gráfica da ocupação de nı́veis de energia. (a)T =


0, prevalece o critério energético, todas as partı́culas tem a menor energia
possı́vel. (b) Numa temperatura T1 > 0 nı́veis de energia mais elevada pas-
sam a ser ocupados. (c) O sistema recebeu calor, com relação à configuração
(b). A energia aumenta porque algumas partı́culas foram promovidas a nı́veis
mais elevados. (d) Com relação a (b), esta configuração teve a energia au-
mentada pelo aumento de ocupação de nı́veis mais elevados e pelo aumento
no valor das energias dos nı́veis. Com relação a (c), o aumento de energia se
deveu apenas ao aumento dos valores de εi , já que as ocupações permanece-
ram constantes.

aumento de entropia, causado por troca de calor. O segundo termo resultou


da variação de X, ou seja, corresponde à realização de trabalho. Assim,
no limite termodinâmico, temos dE = d0 Q + d0W , que nada mais é que a
Primeira Lei da Termodinâmica.

O princı́pio da equipartição de energia


Um dos resultados mais interessantes da distribuição de Boltzmann é
sem dúvida o princı́pio da equipartição de energia. Embora seja válido ape-
nas nos regimes de temperatura alta, sua simplicidade reflete exatamente o
espı́rito que permeia a fı́sica de um modo geral, de isolar apenas o que é
fundamental em um sistema. Como visto na Aula 8 de Fı́sica 2A, no lim-
ite termodinâmico, em sistemas regidos pela Mecânica Clássica, cada termo
quadrático de energia contribui com κT /2 para a energia interna do sistema.
Agora podemos calcular esse resultado.

CEDERJ 162
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

Suponha um sistema com N partı́culas, cuja energia seja dada por


N X̀
X
E= ai,j α2i,j . (7.57)
i=1 j=1

Definimos ` como o número de termos independentes, ou número de graus


de liberdade. Os ai,j são coeficientes, e αi,j são variáveis que definem o mi-
croestado do sistema. Por exemplo, num gás com N moléculas de massa m,
a energia cinética total é
N  
X 1 2 1 2 1 2
E= mvi,x + mvi,y + mvi,z (7.58)
i=1
2 2 2

sendo a velocidade da i-ésima molécula dada por ~vi = vi,x x̂ + vi,y ŷ + vi,z ẑ.
Neste caso identificamos ` = 3 (temos 3 termos de energia cinética, referentes
ao movimento ao longo dos 3 eixos), α1 = vx, α2 = vy , α3 = vz e a = m/2
para todas as partı́culas e graus de liberdade.
Sendo um sistema clássico, as variáveis αi,j são contı́nuas, portanto, a
função de partição é dada por
Z Z Z " N
!#
X X̀
ZN = dα1,1 dα1,2 . . . dαN,` exp −β ai,j α2i,j (7.59)
i=1 j=1

ZN pode ser escrita como


 
N Z
!
Y  X̀  N
ZN =  dαi,1 . . . dαi,` exp −β
 ai,j α2i,j  = (Z1 ) . (7.60)
i=1  j=1 
| {z }
≡Z1

Na equação acima escrevemos a função de partição de N partı́culas (ZN )


em termos da função de partição para uma partı́cula (Z1 ). Isso foi possı́vel
porque a energia total pode ser escrita como a soma das energias de cada
partı́cula individual. Assim, ficamos reduzidos ao cálculo de Z1 . Podemos
simplificar ainda mais o problema se notamos que

Ỳ Z +∞ Ỳ r π  `/2
 π
Z1 = dαj exp −βaj α2j = = . (7.61)
j=1 −∞ j=1
βaj βaj

Assim, obtemos
 N `/2
π
ZN = , (7.62)
βaj

163 CEDERJ
Aula 7 Ideias básicas da Fı́sica Estatı́stica
Física Estatística e
Matéria Condensada

onde usamos que r


Z +∞
−ax2 π
e dx = . (7.63)
−∞ a
Usando a equação (7.39) podemos calcular a energia interna

1 ∂Z N` κT
Eint = − = = N` . (7.64)
Z ∂β 2β 2

Conclusão
A formulação da hipótese fundamental de Boltzmann nos permite es-
tabelecer a conexão entre as descrições atômica e macroscópica. O ponto de
partida é o conhecimento do espectro de energia incluindo a multiplicidade
de cada nı́vel. No caso de um sistema isolado, onde a energia permanece
consntante, todos os microestados são igualmente prováveis no equilı́brio.
Podemos imaginar que o sistema ´´passeia” pelos microestados, passando a
mesma quantidade de tempo em cada um. Nossa percepção macroscópica
não é capaz de detectar isso, mas a concordância dos resultados previstos
pela Fı́sica Estatı́stica nos permite concluir que a hipótese de Boltzmann é
correta.
Definindo a entropia estatı́stica em função da multiplicidade do macroes-
tado pudemos formular o equilı́brio térmico do sistema combinado em termos
da temperatura, ou seja, a configuração de troca de energia mais provável
para o sistema combinado é aquela que leva à uniformidade da temperatura
em todas as partes que o compõem. Tendo a temperatura regulada por um
reservatório térmico, um sistema macroscópico encontra seu equilı́brio na
configuração que minimiza F = Eint − T S. Essa configuração representa a
competição entre duas tendências: maximizar a entropia e minimizar a en-
ergia, a primeira sendo mais importante no regime de temperatura alta e a
segundo no de temperatura baixa.
O conhecimento do comportamento térmico de um sistema com a tem-
peratura controlada pode ser feito a partir da função de partição, que é uma
soma sobre todos os possı́veis microestados do sistema. Nesse procedimento
admitimos que os sistema esteja em qualquer microestado, atribuindo a ele
uma probabilidade que depende da temperatura e da energia do microes-
tado. É fundamental que fique claro que, só depois de aplicado o limite
termodinâmico, poderemos realizar a conexão com a termodinâmica, já que,
apenas nesse caso, o estado final de energia fica bem definido.
Um ponto muito importante, e que nem sempre fica claro, é que pode-

CEDERJ 164
Aula 7 Ideias básicas da Fı́sica Estatı́stica
MÓDULO 1 - AULA 7

mos escolher fixar a energia ou a temperatura. O comportamento obser-


vado macroscopicamente não depende de que abordagem estatı́stica usamos.
Podemos escolher a que for mais conveniente em cada problema que fomos
resolver. O que garante a equivalência entre as diferentes abordagens é o
limite termodinâmico.

Informações sobre a próxima aula


Na próxima Aula vamos estudar os materiais magnéticos.

165 CEDERJ
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

Aula 8 - Sólidos magnéticos


19 de Janeiro de 2015

Meta
Obter uma descrição qualitativa do magnetismo em sólidos.

Objetivos
Ao final desta aula, você deve ser capaz de:

1. Calcular o momento magnético em átomos e ı́ons simples;

2. Entender as diferenças entre diamagnetismo, paramagnetismo e ferro-


magnetismo;

3. Calcular a equação de estado para um paramagneto uniaxial;

4. Entender o comportamento ferromagnético na aproximação de campo


médio;

Pré-requisitos
Reveja a estatı́stica dos sistemas binário estudada na Aula 2, a definição
de spin na Aula 4, o preenchimendo dos orbitais eletrônicos na Aula 5 e as
informações básicas sobre magnetismo e campo magnético nas Aulas 16 a 18
de Fı́sica 3B.

Introdução
A entidade fundamental para a descrição do magnetismo nesta abor-
dagem é o momento de dipolo magnético (ou simplesmente momento magné-
tico) que, classicamente, pode ser representado por uma espira plana de área
a percorrida por uma corrente I, comom mostrado na figura 8.1). Definindo
o vetor área A~ (onde |A|
~ = a) como sendo perpendicular à superfı́cie da es-
pira e circulando a corrente no sentido da regra da mão direita, chegamos à
formula ~µ = I A~ para o seu momento magnético.
Um elétron ao redor de um átomo tem duas contribuições para seu
momento magnético total: o momento magnético orbital µL e o momento

167 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

magnético intrı́nseco µS . O momento magnético orbital está relacionado com

I
Figura 8.1: Ilustração da relação clássica entre momento magnético e corrente
em um espira.

o momento angular orbital L ~ do elétron ao redor do núcleo, uma propriedade


clássica (muito similar ao exemplo anterior da espira de corrente), através da
expressão
e ~ ~
L
~µL = − L = −gL µB , (8.1)
2me ~
onde e/me é a razão carga-massa do elétron, gL = 1 e
e~
µB = = 0,927 × 10−23 A.m2 = 0,927 × 10−23 J/T , (8.2)
2me
é o magneton de Bohr, grandeza que muitas vezes é usada como unidade
para momentos magnéticos. Já o momento magnético intrı́nseco deriva do
~ o spin, pode ser escrito da seguinte forma:
momento angular intrı́nseco S,
S
~µS = −gS µB , (8.3)
~
onde gS ≈ 2. A diferença entre gL e gS é uma das manifestações do caráter
intrinsecamente quântico do spin. Num átomo ou ı́on com vários elétrons na
última camada S~ eL~ serão resultantes da distribuição desses elétrons pelos
orbitais com diferentes valores de mS e mL , de forma a minimizar a energia
atômica, como veremos mais à frente.
A interação do momento magnético orbital com o momento magnético
de spin se dá através do que chamamos acoplamento spin órbita. Por causa
dessa interação a função de onda eletrônica deixa de ser uma autofunção de
Lz e Sz separadamente e passa a ser autofunção de Jz . Os auto valores de J~
e Jz são como os de um momento angular :

J 2Yjmj = ~2j(j + 1)Yjmj (8.4)

Jz Yjmj = mj Yjmj mj = −j, −j + 1, . . . , 0, . . . j − 1, j (8.5)

CEDERJ 168
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

onde Yjmj é uma função dos ângulos θ e φ chamada harmônico esférico e


J = L + S e mj = ml + ms . Com esse acoplamento, o momento magnético
total do elétron fica sendo
J~
~µJ = −gJ µB (8.6)
~
onde gJ pode ser escrito em termos de gL , gS e dos autovalores de L2 e S2 :

J (J + 1) + S(S + 1) − L(L + 1)
gJ = 1 + (8.7)
2J (J + 1)

Em situações onde o acoplamento spin-órbita é forte, essa é a grandeza de


interesse para a descrição do magnetismo, já que L e S estão acoplados pelo
termo proporcional a L · S no Hamiltoniano.
Uma questão importante é o efeito dos outros átomos da rede. Até o
momento consideramos o átomo isolado. Num sólido a presença do resto da
rede pode ser descrita como um campo cristalino que afeta o acoplamento
spin-órbita. Na grande maioria dos sólidos, sobretudo nos metais, ocorre um
cancelamento global do momento angular orbital devido ao campo cristalino,
efeito conhecido como quenching do momento angular e a única contribuição
não nula passa a ser a do spin eletrônico.
Para um átomo em um sólido, também podemos ignorar a contribuição
do momento magnético nuclear µN = 5,05 × 10−27 J/T, já que µN  µB ,
refletindo a grande disparidade nas massas do nucleons e dos elétrons. As-
sim, podemos calcular o momento magnético atômico como a soma das con-
tribuições dos elétrons individuais. O resultado final desse somatório depende
da configuração eletrônica do átomo em questão e por isso certos átomos são
naturalmente magnéticos e outros não.

Momento magnético de átomos e ı́ons


Suponha que num determinado átomo ou ı́on exista uma camada par-
cialmente preenchida por elétrons. Se l for o momento angular desses elétrons,
existem 2(2l +1) orbitais na camada, já levando em conta as duas orientações
de spin. Suponha que haja n elétrons nessa camada, sendo n < 2(2l + 1).
Se os elétrons não interagissem entre si, os orbitais teriam todos a mesma
energia e não faria diferença a forma de distribuı́-los. Entretanto, se levarmos
em conta a repulsão coulombiana entre os elétrons, as energias das diversas
possı́veis configurações ficam diferentes. Para conhecermos o estado funda-
mental do átomo ou ı́on usamos um conjunto de 3 regras, denominado regras

169 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

de Hund. Para evitar confusão entre os valores relativos a um elétron e ao


átomo como um todo, usaremos letras minúsculas para designar os autoval-
ores eletrônicos individuais. As regras a seguir são:

1. Os elétrons devem ocupar os orbitais de modo a maximizar o spin total


S, respeitando o princı́pio da exclusão. Para saber que valor é esse,
note que o maior valor possı́vel para S corresponde também ao maior
valor de Sz . Se n ≤ 2l +1 todos os elérons ficam desemparelhados, cada
um com um valor de ml . Neste caso S = ns = n/2. Se n > 2l + 1, há
P
emparelhmento diminuindo, inevitavelmente, o valor de S = i msi ,

2. O momento angular total L da camada no estado fundamental deve


se o maior possı́vel, sendo consistente com a regra 1 e com o princı́pio
da exclusão. Para determinar esse valor note que o maior valor de L
também terá o maior valor de Lz . Assim o primeiro elétron na camada
deve ir para o orbital em que |ml | = l, que é o maior valor possı́vel. Em
seguida escolha o próximo valor de ml e assim por diante. Finalmente,
P
L = i ml i .

3. Finalmente, se a camada tem menos da metade dos elétrons que pode


comportar, temos J = |L − S|, nos outros casos J = L + S

O momento magnético resultante é:


p
µJ = gJ J (J + 1) (8.8)

Este seria o valor para o átomo isolado. Caso haja quenching do momento
angular orbital, terı́amos L = 0. Neste caso, gj = 2 sempre e o momento
atômico no sólido seria
p
µJ = 2 S(S + 1) . (8.9)

Vamos ver a seguir um exemplo importante, o cálculo do momento


magnético do ı́on Fe2+ .
Exemplo 8.1
O átomo isolado de ferro tem a configuração
Fe: 1s2 2s2 2p6 3s2 3p6 4s2 3d6 = [átomo de argônio]4s2 3d6 .
Frequentemente o ferro é encontrado em sólidos no estado de oxidação 2+ ,
obtido pela perda dos elétrons 4s. Temos assim
Fe2+ : 1s2 2s2 2p6 3s2 3p6 3d6 = [átomo de argônio]3d6 .
Na camada 3d temos que l = 2 portanto podemos ter orbitais com ml =
±2, ±1, 0 que serão ocupados pelos 6 elétrons, de forma a maximizar S, com
apenas um emparelhamento,da seguinte forma

CEDERJ 170
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

ml 2 1 0 −1 −2
ms + 12 − 12 + 12 + 12 + 12 + 12

Assim, temos L = 2×2+1+0+(−1)+(−2) = 2 e S = 1/2−1/2+4×(1/2) = 2.


Neste caso temos a camada pode comportar 10 elétrons, estando ocupada por
6 elétrons (mais da metade da ocupação possı́vel) temos S = 2 e L = 2, logo
J = S + L = 4. Assim,
20 + 6 − 6 3
gJ = 1 + =
40 2
e
p 3√
µJ = gJ J (J + 1) =
20µB = 6,7µB
2
Experimentalmente temos que o momento magnético do Fe2+ está entre
5,25µB e 5,53µB . Vamos ver se essa discrepância pode vir de algum can-
celamento devido ao campo cristalino. Para tal fazemos L = 0 levando a
J = S = 2 e gJ = 2 para obter
p √
µJ = gJ J (J + 1) = 2 6µB = 4,9µB .

Podemos então concluir que há um cancelamento parcial no Fe2+.


Fim do exemplo
Atividade 1
(Objetivo 1)
Encontre o valor de J e de µJ para o ı́on Fe3+, obtido a partir do Fe pela
perda dos elétrons 4s e de 1 elétron 3d.
deixar 3cm

Resposta comentada
A distribuição eletrônica do ı́on em questão é:
Fe3+ : 1s2 2s2 2p6 3s2 3p6 3d5
Na camada 3d temos que l = 2 portanto podemos ter orbitais com ml =
±2, ±1, 0. Para maximizar S eles serão ocupados pelos 5 elétrons da seguinte
forma

ml 2 1 0 −1 −2
ms + 12 + 21 + 12 + 12 + 12

171 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

Assim, temos L = 2 + 1 + 0 − 1 − 2 = 0 e S = 5 × (1/2) = 5/2. Neste caso


temos a camada pode comportar 10 elétrons, estando ocupada por 5 elétrons,
exatamente a metade, então S = 5/2 e L = 0, logo J = S + L = 5/2. Assim,
r
p 35
µJ = gJ J (J + 1) = 2 = µB = 5,9µB .
4
Fim da atividade

Tipos de magnetismo
Na nossa linguagem comum quando dizemos que algum material é
magnético, em geral estamos nos referindo a uma forma especı́fica de mag-
netismo, o ferromagnetismo. Mas existem outras formas de magnetismo que
passam despercebidas por nós e que são também importantes. Para entender
os princı́pios básicos do magnetismo em sólidos, primeiro precisamos definir
algumas grandezas macroscópicas.
Quando temos um sólido composto por muitos átomos, seu momento
magnético total será a soma vetorial dos momentos magnéticos atômicos.
Assim, se os momento individuais estiverem com direções aleatórias, sem
que haja uma direção preferencial, teremos um momento magnético total
nulo. Chamando de ~µi o momento magnético do i-ésimo átomo, definimos o
vetor magnetização M~ como

~ = 1
X
M ~µi (8.10)
V i

~
onde V é o volume do sólido macroscópico, grande o suficiente para que M
fique bem definido.

box de atenção: Note que podemos caracterizar o material pelo valor de M


(momento magnético por unidade de volume) ou de µ (momento magnético
atômico). As duas grandezas são relacionadas bastando para isso saber como
os átomos estão distribuı́dos na rede cristalina. O valor de µ normalmente é
dado em termos de µB . Já a magnetização tem como unidades A/m no SI.
fim do box de atenção

Atividade 2
(Objetivo 1)
A magnetização de saturação Ms pode ser obtida pela equação (8.5) supondo

CEDERJ 172
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

que todos os momentos magnéticos estejam paralelos. Calcule Ms para o


nı́quel que tem momento magnético atômico µ = 0,6 µB e densidade ρ =
8,90 × 103 kg/m3 .
deixar 3cm

Resposta comentada
Consultando uma tabela periódica temos que a massa atômica do Ni é 58,7
g, ou seja, um átomo tem massa 58,7×10−3 kg/6,02×1023 =9,75×10−26 kg.
A partir da densidade podemos calcular o número de átomos em 1 m3 e
multiplicar pelo momento magnético atômico. Obtemos

8,9 × 103 kg/m3


Ms = × 0,6 × 0, 927 × 10−23 A.m2 = 0,501 A/m
9,75 × 10−26 kg

fim da atividade

Se B~ é o campo magnético, podemos definir um campo magnético au-


~ de forma a explicitar efeitos da magnetização do material. Macros-
xiliar H,
copicamente os dois campos são relacionados como
 
B~ = µ0 H ~ +M~ , (8.11)

onde µ0 = 4π × 10−7 N/A é a permeabilidade magnética do vácuo.


Para seguir em frente vamos considerar o caso mais simples, em que
a magnetização é induzida na direção do campo aplicado, tal que podemos
definir a grandeza escalar χ, denominada susceptibilidade magnética, como

M µ0 M
M = χH ⇒ χ= = (8.12)
H Bap

box de atenção:
A notação Bap representa o campo aplicado, em geral gerado por uma corrente
I percorrendo um solenóide como esquematizado na 8.2. Num solenóide longo
e de raio pequeno, na região central o campo é aproximadamente uniforme.
Como visto na Aula 18 de Fı́sica 3B (equação (18.5)), neste caso Bap = µ0 nI
e H = nI, onde n é o número de espiras por unidade de comprimento.

173 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

Figura 8.2: A maneira mais simples de se obter um campo magnético uni-


forme e controlável é colocar a amostra (em vermelho) na região central de
um solenóide. O campo pode então ser alterado através da variação da cor-
rente.

fim do box de atenção


A susceptibilidade magnética é um tipo de função de resposta. Ela mede
a resposta do meio magnético à aplicação do campo externo. Examinando
as equações (8.11) e (8.12) vemos que χ é uma grandeza adimensional. A
forma de χ (linear ou não) e seu valor podem ser usados para a classificação
dos materiais em termos de seu magnetismo dentro das seguintes categorias:

• Diamagnético

• Paramagnético

• Ferromagnético

Diamagnetismo é o tipo mais fraco de resposta magnética sendo carac-


terizado por χ ≈ −10−5 . A origem do diamagnetismo é a polarização das
camadas completas dos átomos, assim está presente em todos os materiais. O
sinal negativo indica que a polarização é tal que se opõe ao campo aplicado.
Em materiais em que outra forma de magnetismo está presente o diamag-
netismo é imperceptı́vel. Os materiais diamagnéticos não são considerados
magnéticos e o diamagnetismo não é um efeito muito importante, em geral.
Na maior parte dos casos os sólidos são formados por átomos que per-
dem ou ganham elétrons, adquirindo uma configuração de gás inerte, com
todas as camadas cheias, o que leva a um momento magnético nulo. Este é
o caso do sódio e do cloro no NaCl. A configuração eletrônica desses átomos
é:
Na - 11 elétrons - 1s2 2s2 2p6 3s1
Cl - 17 elétrons - 1s2 2s2 2p6 3s2 3p5 .

CEDERJ 174
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

Assim, o sódio perde um elétron para formar o ı́on Na+ , com todas as ca-
madas completas. O cloro, por outro lado, tem sua camada 3p completa
ao receber esse elétron, tornando-se Cl− , também com as camadas comple-
tas. Isso não acontece com os ı́ons dos elementos de transição, como Ti, V,
Mn, Fe, Co e Ni. Os átomos desses elementos têm a camada 3d incompleta,
mesmo tendo elétrons na camada 4s. Estes elétrons são perdidos na ligação
quı́mica, deixando a camada 3d incompleta, com momento magnético não
nulo. Fenômeno semelhante ocorre com as terras raras do grupo dos lan-
tanı́deos, Nd, Pm, Eu, Gd, Tb, Dy, etc, que perdem elétrons 6s ficando com
a camada 4f incompleta, e com os elementos do grupo dos actı́neos. Esses
elementos têm ı́ons ou átomos com momento magnético não nulo.

material χ
Óxido de alumı́nio -1,81 ×10−5
Cobre -0,96 ×10−5
Ouro -3,44 ×10−5
Mercúrio -2,85 ×10−5
Silı́cio -0,41 ×10−5
Prata -2,38 ×10−5
Cloreto de sódio -1,41 ×10−5
Zinco -1,56 ×10−5

Tabela 8.7: Valores de susceptibilidade de alguns materiais diamagnéticos

Quando os átomos de um material têm camadas incompletas, há um


momento magnético atômico, que responderá à aplicação do campo externo
de forma distinta e mais intensa. Este é o caso das outras formas de mag-
netismo citadas. Aqui trataremos apenas das mais importantes que são o
paramagnetismo e o ferromagnetismo.

Paramagnetismo
Um material paramagnético tem átomos com momento magnético total
~µ, mas a fraca interação entre eles faz com que sejam essencialmente indepen-
dentes. Assim, se nenhum campo é aplicado, a orientação de cada momento
será aleatória, distribuı́da uniformente para todos os ângulos. Sendo assim,
a soma vetorial desse momentos é nula e M = 0 se Bap = µ0 H = 0. Com

175 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

a aplicação de um campo externo os momentos magnéticos tendem ao ali-


nhamento com o campo. O estado fundamental, a T = 0, corresponde a
todos os momentos perfeitamente alinhados com o campo externo, levando
à magnetização de saturação
(8.13)
Quando T > 0 alguns momentos perdem o alinhamento e a magnetização to-
tal diminui, embora haja uma predominância para o alinhamento na direção
do campo. Esta situação está ilustrada esquematicamente na figura 8.3. Os
materiais paramagnéticos tem suceptibilidade positiva com valores
χ ≈ 10−5 − 10−3 .
B B
M=0 B=0 T>0 M>0 T=0 M=Ms

(a) (b) (c)

Figura 8.3: Ilustração esquemática do comportamento de um material para-


magnético. (a) Na ausência de um campo externo os momentos magnéticos
apontam em direções aleatórias levando a uma magnetização nula. (b) Se
um campo é aplicado, para T > 0, teremos um alinhamento predominante
na direção do campo. (c) Se T = 0 basta um campo finito para alinhar
perfeitamente todos os momentos magnéticos, levando o sistema à satuação.

Modelo estatı́stico para o paramagnetismo


Para entender como a magnetização de um sólido paramagnético se
comporta em função da temperatura vamos usar um modelo muito simples
que considera que o momento magnético atômico só pode estar ao longo de
um eixo, podendo ser paralelo ou antiparalelo ao mesmo, uma situação que
corresponde a termos J = 1/2 e mJ = ±1/2. O eixo em questão será definido
pela direção do campo externo aplicado. Esse modelo de sistema chama-se
paramagneto uniaxial. De forma semelhante ao que já fizemos nas Aulas 2 e
7, vamos escrever o momento magnético de cada átomo como
µi = µσi σi = ±1 . (8.14)

CEDERJ 176
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

A única diferença aqui é que explicitamos o valor do momento magnético


atômico, µ, para que tenhamos as unidades corretas. A energia do sistema
paramagnético na presença de um campo externo aplicado Bap é dada por
N
X
E = −Bap µσi , (8.15)
i=1

onde Bap = µ0 H. Como vimos no Exemplo 7.2, ZN é a função de partição


para os N átomos e pode ser escrita em função de Z1 , que é a função de
partição para um único átomo, como ZN = Z1N . Embora os átomos sejam
idênticos, num sólido eles são indistinguı́veis pela posição que ocupam na
rede. Seguindo em frente, temos
X
Z1 = exp (βBapµσ)
σ=±1
= exp(+βµBap) + exp(−βµBap)
= 2 cosh(βµBap) , (8.16)

onde β ≡ 1/κT . Assim,


N
ZN = [2 cosh(βµBap)] (8.17)

O momento magnético atômico médio na direção do campo pode ser


calculado de várias maneiras. Começamos pelo cálculo direto usando Z1 .
Partindo da definição de média térmica, equação (7.49), temos:
1 X
hµσi = µhσi = µσ exp (βµσBap)
Z1 σ
1
= [(+µ) exp (βµBap) + (−µ) exp (−βµBap)]
Z1
2 senh (βµBap)
= µ
2 cosh(βµBap)
= µ tgh(βµBap) . (8.18)

A magnetização total é então


 
Nµ Nµ Nµ µBap
M≡ hσi = tgh (βµBap) = tgh . (8.19)
V V V κT
Também podemos encontrar a função M(T, Bap) a partir de uma derivada
de Z1 . Observando a expressão (8.20) vemos que hµσi pode ser calculado
através da derivada de Z1 com relação a Bap, ou seja
∂Z1 X
= βµσ exp (βBapµσ)
∂Bap σ
1 1 ∂Z1 1 ∂ln Z1
⇒ hµσi = = . (8.20)
β Z1 ∂Bap β ∂Bap

177 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

As expressões (8.20) e (8.19) são duas formas de escrever equação de


estado para o sólido paramagnético. Elas dão o comportamento da magne-
tização em função da temperatura e do campo aplicado. Se considerarmos
T fixo e variarmos o campo aplicado obtemos uma isoterma. A figura 8.4
mostra o gráfico de algumas delas. Nessa figura o campo externo está escrito
em unidades arbitrárias.

Figura 8.4: Magnetização de paramagneto uniaxial, em função do campo


aplicado (em unidades arbitrárias) para três valores de temperatura.

Vamos examinar a figura 8.4. Primeiro analisamos a forma geral das


isotermas. Notamos que hσi tem sempre o mesmo sinal que Bap , refletindo a
tendência ao alinhamento com o campo. Também, se Bap = 0 temos hσi = 0
e Ms = 0. Quando Bap ≈ 0 temos um comportamento praticamente linear,
havendo uma grande variação em hσi se variamos Bap. A partir de um certo
valor de campo essa variação diminui e torna-se quase nula quando Bap → ∞.
Nessa região o sistema está praticamente saturado, ou seja hσi → ±1. Esse
comportamento é mais evidente na curva para T = T1. Para um dado valor
de campo, notamos que hσi1 > hσi2 > hσi3 . Isso se deve ao aumento da
probabilidade de ter o momento magnético atômico antiparalelo ao campo
externo à medida que aumentamos a temperatura.
Para estudar os comportamentos de alta e baixa temperaturas de forma

CEDERJ 178
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

mais simples definimos a variável Θ ≡ µBap/κ, com dimensões de tempera-


tura. Note que Θ depende do material através do valor de µ. Com essa
variável podemos reescrever a expressão para hσi como
 
Θ
hσi = tgh . (8.21)
T

Teremos temperaturas altas se T  Θ e baixas se T  Θ. A figura 8.5


mostra o comportamento da magnetização em termos da variável adimen-
sional Θ/T .

Figura 8.5: Magnetização para um paramagneto uniaxial, em função de Θ/T .


Perto da origem (T  Θ), quando a magnetização é baixa, temos um regime
aproximadamente linear onde pequenas variações de Θ/T levam a variações
de magnetização proporcionais. Quando T  Θ temos um regime saturado,
onde grandes variações de Θ/T levam a ı́nfimas variações na magnetização.

Atividade 3
(Objetivos 2 e 3)
Considerando o paramagneto uniaxial, encontre expressões para hσi nos li-
mites T  Θ e T  Θ.

179 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

deixar 6cm

Resposta comentada

Θ
• Temperatura baixa: T  Θ ⇒ x ≡ T
 1 Neste caso fica mais fácil
usar a forma exponencial:
Θ
− exp − Θ
 
exp
 
Θ T T
hσi = tgh = Θ
T exp T
+ exp − Θ
T

Agora usamos que, se x  1, exp(x)  1 e exp(−x) ≈ 0, obtendo


hσi ≈ 1.

Θ
• Temperatura alta: T  Θ ⇒ x ≡ T
 1 Neste caso usamos a ex-
pansão em série de tgh x:

x3
tgh x ≈ x −
3

para obter
 3
Θ 1 Θ
hσi ≈ −
T 3 T

Fim da atividade

Atividade 4
(Objetivos 2 e 3)
O oxigênio é um dos poucos gases paramagnéticos. Sabendo que o momento
magnético de uma molécula O2 é µ = 2,85 µB , calcule o valor de Θ para o
gás considerando campo aplicado Bap = 1 T, tı́pico de medidas de suscepti-
bilidade.

CEDERJ 180
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

deixar 3cm

Resposta comentada
Usando a definição do magneton de Bohr, equação (8.2), temos que

µ = 2,85 µB = 2,85 × 0,927 × 10−23 J/T = 2,64 × 10−23 J/T

Assim,
µBap 2,64 × 10−23 J/T × 1 T
Θ≡ = = 1,91 K
κ 1,38 × 10−23 J/K
Sendo assim, Tamb ≈ 300 K é uma temperatura altı́ssima. De fato, à temper-
atura ambiente, a susceptibilidade do O2 é muito bem descrita pelo modelo
de Curie que será visto a seguir.
Fim da atividade

Cálculo da susceptibilidade
Normalmente calculamos a susceptibilidade paramagnética fora da região
de saturação porque nesta região a magnetização varia muito pouco. Na
região linear, onde T  Θ, temos que hσi ≈ ΘT
, assim,
Nµhσi Nµ Θ Nµ µµ0 H Nµ2 µ0 H
M= = = = . (8.22)
V V T V κT κT
Logo,
M C
χ= = , (8.23)
H T
2
onde C ≡ N µκ µ0 . A expressão (8.23) recebe o nome de lei de Curie.
O modelo que acabamos de ver, do paramagneto uniaxial, se aplica a
sólidos com J = 1/2 porque neste caso apenas duas orientações são possı́veis,
correspondendo a mJ = +1/2 e mJ = −1/2. Podemos realizar cálculos
semelhantes, porém razoavelmente mais complicados, para obter a expressão
geral para qualquer valor de J :
Nµ µBap
M= BJ (x) x≡ , (8.24)
V κT
onde BJ (x) é a função de Brillouin definida como
 
2J + 1 (2J + 1)x 1 x
BJ (x) = cotgh − cotgh (8.25)
2J 2J 2J 2J

181 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

A figura 8.7 mostra curvas de magnetização experimentais para diversos ma-


teriais paramagnéticos e a previsão teórica dada pela equação (8.24) A tabela

-1
c

T(K)
Figura 8.6: Gráfico de 1/χ para um sal de gadolı́neo. A linha reta é a lei de
Curie (8.23).

8.8 traz alguns valores de susceptibilidade paramagnética.

material χ
Alumı́nio 2,07 ×10−5
Cromo 3,13 ×10−4
Molibdênio 1,19 ×10−4
Sódio 8,48 ×10−6
Titânio 1,81 ×10−4
Zircônio 1,09 ×10−4

Tabela 8.8: Valores de susceptibilidade de alguns materiais paramagnéticos.

CEDERJ 182
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

m em unidades de mB

Figura 8.7: Isotermas de magnetização para diversos materiais param-


agnéticos em função do campo aplicado. A concordância entre a curva teórica
dada pela equação (8.24) e os dados experimentais é excelente.

Atividade 5
(Objetivos 2 e 3)
Mostre que B1/2(x) = tgh x.
deixar 3cm

Resposta comentada
Temos que
B1/2(x) = 2 cotgh 2x − cotgh x

Agora usamos a relação

cotgh 2x + 1
cotgh 2x =
2 cotgh x

183 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

Temos assim
cotgh 2x + 1 2 cotgh 2 x + 2 − 2 cotgh 2x
B1/2(x) = 2 − cotgh x = = tgh x
2 cotgh x 2 cotgh x

Fim da atividade
Atividade 6
Um modelo clássico para o paramagnetismo considera que o momento mag-
nético varia de direção continuamente. Considerando que o campo aplicado
~ ap = Bẑ, a energia de cada momento magnético do sólido
está na direção z, B
neste modelo é escrita como

~ ap · ~µ = Bµ cos θ .
ε = −B

Mostre que  
µB κT
h~µi = µ cotgh −
κT µB
deixar 4cm

Resposta comentada
Começamos calculando a função de partição, que será na forma de uma
integral, já que qualquer orientação é possı́vel. Temos:
Z π
Z1 = exp (βBµ cos θ) sen θdθ .
0

A integral em θ pode ser escrita de forma mais conveniente se usamos d cos θ =


− sen θdθ. Definindo u ≡ cos θ ficamos com
Z +1
Z1 = exp (βBµu) du
−1
    
κT µB µB 2κT µB
= exp − exp − = senh
Bµ κT κT µB κT

O cálculo de h~µi pode ser feito como na equação 8.20, ou seja,

1 1 ∂Z1
hµi = ,
β Z1 ∂Bap

CEDERJ 184
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

levando a  
µB κT
h~µi = µ cotgh − .
κT µB
fim da atividade

Ferromagnetismo
Normalmente quando nos referimos a um material magnético na lin-
guagem coloquial, estamos pensando em um material ferromagnético. Esses
materiais apresentam alta magnetização à temperatura ambiente, mesmo
sem a aplicação de um campo externo. Dizemos que eles tem magnetização
espontânea. Embora o ferromagnetismo seja conhecido pelo ser humano há
milênios ele só pode ser realmente entendido com o advento da Mecânica
Quântica. Uma caracterı́stica importante é que os materiais ferromagnéticos
passam a ser paramagnéticos acima de uma certa temperatura, chamada
temperatura de Curie ou temperatura crı́tica. Aqui vamos ver um modelo
bem simplificado, que tem concordância qualitativa com sistemas reais.
A origem do ferromagnetismo é puramente quântica. Em determinados
materiais os átomos tem elétrons desemparelhados, que interagem entre si
de forma a que o alinhamento paralelo entre os spins diminui a energia de
repulsão coulombiana sendo, portanto, favorável energéticamente. Para ter
uma ideia de como isso ocorre vamos calcular a energia coulombiana entre
os dois elétrons. A energia potencial de interação neste caso é

e2
U(~r1 , ~r2 ) = r12 , (8.26)
4π0
onde r12 = |~r1 − ~r2 | é a distância entre os elétrons. A função de onda para
os dois elétrons é
1
ψ(~r1, ~r2 ) = √ [φα (~r1)φβ (~r2 ) ± φα (~r2 )φβ (~r1 )] , (8.27)
2
onde α e β são dois orbitais distintos. Usando essa forma de função de onda
temos um valor esperado de energia na forma

hUi ≡ E ± J , (8.28)

onde
e2 1
Z
E= φ∗α(~r1 )φ∗β (~r2 ) φα (~r1 )φβ (~r2 ) (8.29)
4π0 r12

185 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

e
e2 1
Z
J = φ∗α(~r1 )φ∗β (~r2 ) φα (~r2 )φβ (~r1 ) (8.30)
4π0 r12
Note que E é a energia coulombiana média, sem levar em conta o princı́pio
da exclusão. A imposição desse princı́pio leva ao segundo termo, J , que
contém a troca de posição dos elétrons. Por isso chamamos J de integral de
troca ou integral de intercâmbio.
O sinal ± vai depender da orientação do spin dos dois elétrons. Vamos
considerar as duas possibilidades. Se forem paralelos, ~s1 = ~s2 = (+1/2)ẑ ou
~s1 = ~s2 = (−1/2)ẑ. Nos dois casos ~s1 · ~s2 = +1/4. Analogamente, se os spins
forem antiparalelos, ~s1 · ~s2 = −1/4. O hamiltoniano

Htroca = −2J ~s1 · ~s2 (8.31)

recebe o nome de hamiltoniano de Heisenberg e a energia relacionada a ele,


energia de troca. Quando J > 0 dizemos que o sistema é ferromagnético,
porque a energia de repulsão coulombiana é diminuı́da quando ~s1 e ~s2 são par-
alelos. Esta é uma situação bastante rara por isso materias ferromagnéticos
são bem especiais. Está fora dos nossos objetivos discutir detalhes dessa
interação, mais informações podem ser encontradas em livros de fı́sica da
matéria condensada.
A interação de troca é de curto alcance e uma boa aproximação é con-
siderar que ela exista apenas entre átomos que são primeiros vizinhos na rede
cristalina. Neste caso, a energia de interação de um momento magnético com
os momentos magnéticos vizinhos pode ser escrita como

~i
X
εi = −J ~µi · ~µj = −~µi · B (8.32)
j∈{vi}
P
onde j∈{vi } significa a soma sobre os primeiros vizinhos de i e

~i ≡ J
X
B ~µj (8.33)
j∈{vi }

faz o papel de um campo que depende de como estão os vizinhos do átomo


em questão, ou seja, depende da posição. Na presença de um campo externo
terı́amos  
εi = −~µi · B~ ap + B
~ i = −~µi · B
~ ef (i) , (8.34)

onde B~ ef(i) ≡ B
~ ap + B
~ i é um campo efetivo que depende da posição. O fato
de termos um campo que depende da posição torna o problema bastante
complicado e sua solução está fora do escopo desta disciplina. Há uma série

CEDERJ 186
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

modelos para o estudo deste problema. Os mais populares são os modelos


de Ising, Heisenberg e de Potts. Ao aluno interessado sugerimos o livro
Introdução à Fı́sica Estatı́stica citado ao final da Aula.
Atividade 7
(Objetivo 4)
Considere um sistema ferromagnético hipotético onde os átomos com mo-
mento ~µ estão numa rede quadrada no plano xy ocupando as posições (0, 0),
(0, a), (a, 0), (a, a). Sabendo que J > 0, e ~µ = µŷ, calcule os possı́veis val-
ores de energia do sistema.
deixar 5cm

Resposta comentada
Precisamos apenas considerar as configurações abaixo (pense sobre isso!):

+ + + - + -

+ + - + + -
(a) (b) (c)

Evitando as contagens duplicadas temos:

Ea = −4J µ2 Eb = +4J µ2 Ec = 0

Note que nas configurações (b) e (c) existem dois momentos magnéticos pos-
itivos e dois negativos. Se não houvesse interação entre eles, como no caso
paramagnético, as duas configurações seriam equivalentes e teriam a mesma
energia.
fim da atividade

Um modelo simples para o ferromagnetismo foi proposto por Weiss,


que descreveu o ordenamento ferromagnético como proveniente de um campo

187 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

molecular que seria resultante da interação média com todos os outros átomos.
O modelo pode ser formulado a partir do modelo de Curie para o paramag-
netismo, com a substituição do campo magnético externo, por um campo
efetivo, independente da posição, definido como
~ ef ≡ B
B ~ ap + B
~ mol , (8.35)

onde B ~ mol ≡ λh~µi é o campo molecular proveniente da interação média entre


um momento magnético e todos os outros. Note como este modelo é bem
diferente, aqui um momento magnético distante contribui da mesma forma
que um vizinho, do ponto de vista da interação entre momentos magnéticos.
Este tipo de aproximação, que substitui a interação detalhada entre as par-
tı́culas pela interação média, é utilizada frequentemente em Fı́sica e recebe o
nome de teoria de campo médio. Embora as teorias de campo médio envolvam
aproximações grandes e não apresentem boa concordância quantitativa com
a experiência, elas são muito utilizadas até hoje porque trazem importantes
informações qualitativas sobre o sistema.

O parâmetro λ dá a intensidade da interação. Levando a definição


(8.35) em (8.21) temos
 
µBef h µ i
hσi = tgh = tgh (B + λhσi) . (8.36)
κT κT
Para encontrar hµ(Bap , T )i devemos resolver a equação transcedental acima.
Como estamos interessados no caso Bap = 0, já que buscamos a magnetização
espontânea, nosso problema é resolver a equação

ψ = tgh (aψ) , (8.37)

onde ψ ≡ hµi/µ e a = λµ2 /κT . Não é possı́vel resolver a equação (8.37) ana-
liticamente), entretanto, uma breve análise gráfica nos traz muita informação
sobre o problema. Encontrar a solução de (8.37) significa encontrar as in-
terseções entre as curvas y = ψ e y = tgh(aψ). A figura 8.8 mostra esta
situação. As possı́veis soluções dependem dos valores de a. Para a ≤ 1 há
apenas a solução ψ = 0, mas para a > 1 temos também duas outras soluções
simétricas. A condição para que existam as soluções ψ 6= 0 pode ser expressa
como
λµ2

dtgh(aψ)
> 1 −→ a > 1 −→ T < (8.38)
dψ ψ=0 κ
Assim vemos que a = 1 é um valor crı́tico para definir o comportamento
2
magnético do sistema. Definimos assim a temperatura crı́tica Tc = λµκ que

CEDERJ 188
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

Figura 8.8: Solução gráfica da equação transcendental ψ = tgh (aψ). Depen-


dendo do valor de a podemos ter uma ou três soluções.

separa os regimes ferro (T < Tc) e paramagnético (T > Tc). Repetindo o


procedimento gráfico podemos obter diversos valores de interseção com hµi =
6
0 para diversos valores de temperatura. O comportamento desses valores de
momento magnético médio em função da temperatura está esboçado na figura
8.9.
Na fase paramagnética temos ψ = 0 como solução e na fase ferro-
magnética temos ψ 6= 0 como solução.
Para continuar nossa análise, vamos considerar o comportamento perto
da temperatura crı́tica. Para isso reescrevemos a equação (8.36) como

µB Tc
tgh−1 ψ = + ψ. (8.39)
κT T

Quando T ≈ Tc temos que a solução de (8.37) leva a |ψ|  1. Nesse caso,


usamos a expansão
ψ3
tgh−1 ψ ≈ ψ +
3
para obter
κT 3 κ
Bap (ψ, T ) = ψ + (T − Tc) ψ . (8.40)
3µ µ

189 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

Figura 8.9: Comportamento da solução não nula de (8.37) em função da


temperatura, para T < Tc .

Histerese

Um ponto importantı́ssimo no estudo do ferromagnetismo é o compor-


tamento da magnetização em função do campo aplicado. Se pensarmos em
obter essa informação a partir das soluções obtidas com a análise gráfica,
terı́amos um comportamento com o esboçado na figura 8.11. O valor de hµi
para Bap = 0 na temperatura da isoterma com T < Tc corresponde à mag-
netização espontânea caracterı́stica de um material ferromagnético, sendo
essa a principal diferença com relação ao sistema paramagnético. No en-
tando, na prática observamos um comportamento hµi(Bap ) bem diferente. A
figura 8.12 mostra uma curva de histerese tı́pica de sistemas ferromagnéticos
reais. Para entendê-la vamos imaginar uma experiência em que variamos
o campo magnético que atua sobre um determinado sólido ferromagnético,
mantendo a temperatura constante. Vamos considerar inicialmente o esta-
mos no ponto 1, que corresponde ao sistema saturado devido ao campo muito
forte. No sistema da figura 8.12 seria um campo H > 200 × 103 A/m. Agora
começamos a diminuir o campo. A magnetização do sistema vai começar
a diminuir. Quando o campo aplicado for zero, será observada uma de-
terminada magnetização espontanêa (ponto 2). Se continuarmos a variar
o campo, invertendo-o, teoricamente terı́amos uma magnetização negativa
como reposta. Na prática isso não ocorre, o sistema se mantém magneti-

CEDERJ 190
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

Figura 8.10: Comportamento da magnetização função da temperatura para


o nı́quel. A curva foi obtida a partir do modelo de Curie-Weiss.

Figura 8.11: Comportamento da magnetização função do campo aplicado


segundo a análise gráfica da solução da equação transcendental (??).

zado inversamente ao campo até um certo campo H = −Hc . Isso se ocorre


porque a inversão dos momentos magnéticos envolve primeiro um aumento

191 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

de energia, dizemos que cada momento magnético tem que superar uma certa
barreira de energia para chegar ao valor de equilı́brio. Essa barreira depende
do valor do campo aplicado, assim o valor de Hc está relacionado com a mag-
nitude dela. O campo Hc recebe o nome de campo coercitivo. Continuamos
a diminuir o campo até chegar à saturação da direção oposta à inicial, ponto
4. Agora começamo a aumentar o campo. O estado final 4 passa a ser o
inicial 1’ do novo processo. Agora, quando o campo chega a zero, o sistema
se mantém magnetizado na direção de alinhamento anterior, negativa. A
magnetização permanec negativa até que H = Hc (ponto 3’) a magnetização
se torna positiva e atinge novamente a saturação, em 4’. Temos assim um
ciclo, que pode ser percorrido quantas vezes quisermos, denominado ciclo
de histerese. Na fı́sica experimental as curvas de histerese são muito estu-
dadas, já que certas peculiaridades em suas formas podem ser relacionadas
com propriedades magnéticas especı́ficas dos sólidos. .

Figura 8.12: Comportamento da magnetização função do campo aplicado


como observado em sistemas reais.

CEDERJ 192
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

material µ(µB ) Tc (K)


Fe 2,22 1043
Co 1,72 1394
Ni 0,60 631

Tabela 8.9: Momento magnético e temperatura de Curie para os elementos


ferromagnéticos à temperatura ambiente

Cálculo da susceptibilidade

Na região próxima à temperatura de Curie, temos que ψ  1 logo


ψ  ψ 3. Nesta aproximação, temos que

κ κV
Bap (ψ, T ) ≈ (T − Tc) ψ = (T − Tc) M. (8.41)
µ N

Assim, temos que a susceptibilidade é dada por

M N
χ= = . (8.42)
Bap κV (T − Tc)

A equação (8.42) recebe o nome de lei de Curie-Weiss. A principal diferença


entre esta susceptibilidade e a de Curie, χ = M H
= CT (equação 8.23), é a
divergência em T = Tc. A observação experimental desta divergência é um
método muito utilizado na determinação de Tc .

Atividade Final

(Objetivos 2 e 3)
(a) Calcule a energia interna de um sólido paramagnético uniaxial com N
átomos, na presença de um campo B ~ ap = Bẑ aplicado na direção dos mo-
mentos magnéticos.
(b) Mostre que o calor especı́fico por partı́cula para o sistema paramagnético
uniaxial é dado por
 2   −2
µBap µBap
c=κ cosh
κT κT

(c) Esboce o gráfico do calor especı́fico em função da temperatura para Θ =


10, 50 e 100 K, sendo Θ ≡ µBap /κ.
deixar 7cm

193 CEDERJ
Aula 8 - Sólidos magnéticos
Física Estatística e
Matéria Condensada

Resposta comentada
(a) Podemos calcular diretamente a partir da definição da energia: Eint =
−NBap hµi. Vamos usar a expressão para hµi, equação (8.20).

Eint = −µBap tgh(βµBap)

(b) Usamos a expressão para Eint encontrada no ı́tem anterior. Temos assim
 2   −2
1 ∂Eint µBap µBap
c= =κ cosh
N ∂T κT κT

A figura 8.13 mostra o comportamento do calor especı́fico para os valores de


Θ especificados.

Figura 8.13: Calor especı́fico para um paramagneto uniaxial, em função da


temperatura. Θ = µBap/κ é uma escala de temperatura natural para o
sistema.

Resumo
Nesta aula estudamos algums propriedades magnéticas básicas de sólidos
para e ferromagnméticos. Pudemos aplicar diretamente a distribuição de
Boltzmann para encontrar o comportamento térmico macroscópico de um

CEDERJ 194
Aula 8 - Sólidos magnéticos
MÓDULO 1 - AULA 8

sistema paramagnético uniaxial. A partir dela calculamos as grandezas ma-


croscópicas, tais como magnetização e calor especı́fico. O ferromagnetismo
foi descrito por um modelo que substituiu a interação entre cada par de
átomos pela intereação com um campo molecular médio.

Informações sobre a próxima aula


Na próxima aula veremos mais uma aplicação da Fı́sica Estatı́stica,
dessa vez na determinação do calor especı́fico de sólidos.

Leitura complementar
• S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição São
Paulo, EDUSP.

• Sérgio M Rezende, A Fı́sica de materiais e dispositivos eletrônicos, Ed.


Universidade Federal de Pernambuco, 1996

195 CEDERJ
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

Aula 9 - Calor especı́fico de sólidos


19 de Janeiro de 2015

Meta
Obter um modelo que descreva as propriedades termodinâmicas de sis-
temas formados por osciladores quânticos e aplicá-lo no cálculo do calor es-
pecı́fico de sólidos.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. entender a aproximação harmônica para o movimento de átomos num


sólido;

2. calcular o calor especı́fico de sólidos pelos modelos de Einstein e Debye;

3. obter o resultado clássico para o calor especı́fico de sólidos como um


limite de alta temperatura dos modelos de Einstein e Debye.

Pré-requisitos
Esta aula requer que você esteja familiarizado com os conceitos de os-
ciladores acoplados e modos normais, vistos na Aula 4 de Mecânica, com
as energias do oscilador quântico e com a definição termodinâmica de calor
especı́fico vista na Aula 9 de Fı́sica 2A.

Introdução
A capacidade térmica C de um material, como sabemos, é a razão
entre uma dada quantidade de calor Q a ele fornecida (ou dele retirada) e a
correspondente variação ∆T na sua temperatura, isto é,

C = Q/∆T . (9.1)

Quanto maior for C, maior é a capacidade do material trocar calor com


a sua vizinhança (absorvendo ou emitindo), com pequena alteração na sua

197 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

temperatura. Portanto, um corpo que tenha uma alta capacidade térmica


pode ser usado como um reservatório de temperatura (ou reservatório de
calor). Um bom exemplo é o da água em uma piscina. Quando um pessoa
entra numa piscina ela em geral cede uma certa quantidade de calor para a
água, o suficiente para resfriar o seu corpo. Mas a variação na temperatura da
água é, para todos os efeitos, imperceptı́vel. É claro que a capacidade térmica
depende da quantidade de matéria considerada (aquecer em 10 ◦C dois litros
de água requer uma quantidade de calor maior que para aquecer um só litro),
por isto costumamos definir uma grandeza denominada calor especı́fico, dada
pela razão entre C e o volume V , ou o número de moles nmol, ou número
de partı́culas N, ou massa m, do corpo. Assim, definimos o calor especı́fico
por unidade de volume, ou por mol etc. O calor especı́fico não depende da
quantidade do material e tampouco (experiência nos mostra) da forma da
amostra. Ou seja, o calor especı́fico é uma propriedade da substância que
compõe o corpo.
Um ponto interessante é que o calor especı́fico depende do processo
envolvido na troca de calor. Por exemplo, a transferência de calor para um
corpo pode ser feita mantendo-se constante a pressão sobre o corpo (por
exemplo, a pressão atmosférica) ou então o seu volume. Para essas trocas de
calor definimos o calor especı́fico a pressão constante, cP e o calor especı́fico
a volume constante, cV . O que define o uso de um ou outro depende da
conveniência experimental. Por exemplo, se nosso sistema é gasoso, manter
o volume constante é simplesmente não trocar o recipiente. Se entregarmos
calor a esse corpo a pressão interna varia. Já no caso de sólidos ou lı́quidos,
que têm superfı́cie exposta ao meio exterior, é mais fácil manter a pressão
constante, por exemplo a pressão atmosférica. Se entregamos calor a esse
sistema,o volume varia e há realização de trabalho. No caso dos sólidos as
variações de volume são tão pequenas que podemos considerar cP ≈ cV .
Assim, nos sólidos em geral nos referimos simplesmente a calor especı́fico.
Sob o ponto de vista teórico, cV é mais fácil de ser calculado.
No inı́cio do século IXX, os fı́sicos e quı́micos franceses Pierre Louis
Dulong (1785-1838) e Alexis Thérèse Petit (1791-1820) concluı́ram, com base
no estudo de alguns casos, que o calor especı́fico molar (medido em Joule,
por Kelvin, por mol) dos cristais monoatômicos deveria ser igual a 3R, onde
R é a constante dos gases (aproximadamente igual a 8,314472 J.K−1.mol−1 ).
Esta lei empı́rica, enunciada em 1819, ficou conhecida como a Lei de Dulong-
Petit. Em 1841, o fı́sico e quı́mico francês Henri Victor Regnault (1810-1878)
verificou que tal lei era de fato seguida por um número grande sólidos. É

CEDERJ 198
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

elemento cV (J.K−1 .mol−1)


Bismuto 25,7
Zinco 25,2
Ferro 25,1
Prata 24,9
Ouro 25,4
Alumı́nio 24,2

Tabela 9.10: Valores experimentais de calor especı́fico molar para alguns


sólidos, a 25 ◦ C

importante ressaltar que até então as medidas eram feitas à temperatura


ambiente. Posteriormente foi mostrado que a Lei de Dulong-Petit está em
acordo com a Mecânica Estatı́stica Clássica, como revemos agora. Na análise
que se segue, teremos em mente um sólido monoatômico, isto é, aquele em
que há um só ı́on por ponto de rede. Considerando então o conjunto dos
ı́ons como um sistema tridimensional de massas conectadas por molas, a
contribuição de cada ı́on à energia total do sólido é composta por um termo
de energia cinética (associada aos momentos px , py e pz ) e outro de energia
potencial (associado aos deslocamentos x, y e z) devido à compressão (ou
expansão) das molas que conectam o referido ı́on aos seus vizinhos. Ou seja,
temos para cada ponto de rede 6 graus de liberdade. Assim, segundo o
teorema da equipartição da energia, sendo N o número de sı́tios da rede, a
energia clássica total do sólido em equilı́brio térmico é

1
Eint = 6N × κT = 3NκT . (9.2)
2

Como N = nNa , onde n é o número de moles e Na é o número de Avogadro,


então o calor especı́fico molar

1 ∂Eint
c= (9.3)
n ∂T

c = 3Na κ ≈ 25 J.K−1.mol−1 . Para que você tenha uma idéia de como esse
resultado é próximo do experimental à temperatura ambiente, veja a tabela
9.10

199 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

O calor especı́fico a baixas temperaturas e


os modelos quânticos

Em 1872 e 1875, o fı́sico Heinrich Friedrich Weber (1843-1912) publi-


cou dois trabalhos relatando os resultados de medidas do calor especı́fico do
diamante, do boro e do silı́cio, feitas a temperaturas baixas de até −5◦ C,
que forneceram resultados significativamente menores que os previstos por
Dulong-Petit. Isto foi considerado como uma “anomalia”. Os experimen-
tos que causaram maior impacto foram realizados depois que o engenheiro
alemão, Carl Paul Gottfried von Linde (1842-1934) conseguiu liquefazer o
ar, em 1895. Isto possibilitou que medidas de calor especı́fico de sólidos
fossem feitas à temperatura de liquefação do nitrogênio (77,36 K), ou seja,
quase −200◦ C, resultando em valores muito abaixo do previsto pela lei de
Dulong-Petit.
A figura 9.1 mostra o resultado experimental do calor especı́fico molar
para três materiais, chumbo, alumı́nio e carbono, assim como o resultado
previsto pelo princı́pio da equipartição, ou valor clássico, em função da tem-
peratura. Para a temperatura ambiente, o valor medido para o chumbo é bem
próximo do valor clássico. Para o alumı́nio já vemos uma discrepância maior
e o valor medido para o carbono difere muito do previsto classicamente. À
medida que consideramos temperaturas mais baixas, a discrepância aumenta.
Dois aspectos nessas curvas são comuns a todos os sólidos. Primeira-
mente, vemos que o calor especı́fico se anula quando T = 0, valor requerido
pela Terceira Lei da Termodinâmica. Em segundo lugar, observamos que os
resultados experimentais se aproximam da previsão clássica à medida que a
temperatura aumenta. A discrepância entre a teoria clássica e os resultados
experimentais a baixas temperaturas só pode ser entendida com o advento da
Mecânica Quântica e representa um dos triunfos dessa teoria, como veremos
a seguir nos modelos de Eistein e Debye.

box de informação A Terceira Lei da Termodinâmica diz respeito à en-


tropia dos sistemas no zero absoluto. Assim como a Segunda Lei, ela pode
ser enunciada de várias maneiras. No contexto que nos interessa, ela diz que
a entropia tende a um valor constante quando T → 0. Para a grande maioria
dos sistemas S = 0 quando T = 0. Do ponto de vista do calor especı́fico ela
traz um resultado importante porque diz que ∂S/∂T → 0 quando T → 0.
Como a capacidade térmica é proporcional a ∂S/∂T , temos que seu valor

CEDERJ 200
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

Figura 9.1: Esta figura mostra o resultado experimental do calor especı́fico


molar para três materiais, chumbo, alumı́nio e carbono, assim como o re-
sultado previsto pelo princı́pio da equipartição, em função da temperatura.
Para a temperatura ambiente, o valor medido para o chumbo é bem próximo
do valor clássico. Para o alumı́nio já vemos uma discrepância maior, e o valor
medido para o carbono difere muito do previsto classicamente. À medida que
consideramos temperaturas mais baixas, a discrepância aumenta.(Figura ex-
traı́da da Aula 9 de Fı́sica 2A)

deve ser nulo quando T = 0.


fim do box de informação

box de curiosidade Albert Einstein (1879 - 1955) foi o fı́sico alemão princi-
pal responsável pela revolução ocorrida na fı́sica no inı́cio do século XX. Sua
atuação em áreas diversas da Fı́sica trouxe entendimento e contextualização
a diversos fenômenos e a previsão de efeitos fantásticos que só puderam ser
observados experimentalmente vários anos após sua morte. Ele recebeu o
prêmio Nobel de Fı́sica em 1921 pelo descobrimento do efeito fotoelétrico.
Einstein é mais conhecido pela formulação das teorias da Relatividade Espe-
cial e Geral, mas suas contribuições à Fı́sica Estatı́stica, à Termodinâmica,
ao Eletromagnetismo e à Mecânica Quântica são absolutamente geniais.
Embora tenha tido dificuldades na fala quando criança, Einstein foi um
aluno dedicado e muito talentoso em Matemática desde a escola elementar.

201 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

Na escola secundária teve problemas em aceitar a educação rı́gida das escolas


alemães que, na sua opinião, não incentivavam uma postura criativa de seus
alunos. Nessa época, com 16 ano, publicou seu primeiro trabalho cientı́fico,
sobre a teoria do éter no Eletromagnetismo. Cerca de um ano depois entrou
para a Escola Politécnica de Zurich para estudar Fı́sica e Matemática. De-
pois de se graduar em 1900, Einstein foi trabalhar no registro de patentes
suiço. Nessa época desenvolveu intensa correspondência com inúmero cien-
tistas, promovendo um grupo de discussões cientı́ficas e filosóficas. A partir
de então sua carreira foi uma sucessão de inúmeros trabalhos geniais e funda-
mentais que revolucionaram a Fı́sica da época como uma intensidade difı́cil
de imaginar agora. Além da atuação cientı́fica, Einstein foi um pacifista at-
uante com diversas publicações sobre o questões polı́ticas.
fim do box de curiosidade

box de curiosidade Peter Joseph William Debye (1884 - 1966) foi um


fı́sico holandês com diversas contribuições ao entendimento da matéria de
uma forma geral. Ele estudou matemática e fı́sica clássica, tendo se formado
em engenharia elétrica. Durante seu doutorado ele estudou a pressão de ra-
diação e em 1910 derivou a lei de Planck com um método que o próprio Plack
concordou ser mais simples. Debye recebeu o prêmio Nobel de quı́mica em
1936 pelas contribuições ao conhecimento da estrutura molecular através de
sua pesquisa sobre momentos de dipolo e difração de raios-X e de elétrons
em gases.
fim do box de curiosidade

A aproximação harmônica
Tanto os modelos quânticos como os clássicos para o calor especı́fico
de sólidos descrevem o sistema como um conjunto de osciladores. No caso
mais simples, que será considerado aqui, os osciladores são harmônicos, ou
seja, tem uma dependência quadrática com o deslocamento atômico. Entre-
tanto, a interação entre átomos num sólido se dá através de um potencial
assimétrico como o mostrado na figura 9.2(a). Nesse gráfico ρ é uma variável
adimensional proporcional à distância entre dois átomos. Para entender a
forma desta interação imagine-a como a soma de duas contribuições, uma
atrativa e outra repulsiva. Considere que, inicialmente, dois átomos estão in-
finitamente separados, com interação desprezı́vel (U → ∞ quando ρ → 0). À
medida que os aproximamos começa a haver interação atrativa entre eles. A

CEDERJ 202
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

origem dessa interação atrativa depende do material que estamos observando.


Quando aproximamos muito os átomos começa a haver superposição das nu-
vens eletrônicas, gerando uma forte repulsão para valores pequenos de ρ. A
soma dessas duas contribuições leva a um potencial U(ρ) bastante assimétrico
tornando difı́cil o tratamento analı́tico do problema. Entretanto, se estiver-
mos com energias próximas ao mı́nimo do potencial, podemos considerá-
lo como uma parábola, permitindo o uso do hamiltoniano para o oscilador
harmônico, revisto na Aula 4. Vamos ver como realizar essa aproximação
considerando o potencial de Lennard-Jones, muito usado para descrever a
interação entre átomos neutros. Sua forma é
  
σ 12  σ 6
U(r) = 4ε − , (9.4)
r r
sendo ε e σ parâmetros ajustáveis que caracterizam um material especı́fico e
r é a distância entre os átomos. Definindo as variáveis adimensionais ρ ≡ r/σ
e u ≡ U/4ε, ele pode ser reescrito como
 
1 1
U= − . (9.5)
ρ12 ρ6
Exatamente esta função foi usada na figura 9.2. A aproximação harmônica
consiste em expandir o potencial até o termo quadrático, em torno do ponto
de mı́nimo. Se (ρ0 , u0) são as coordenadas do mı́nimo, temos
2

du 1 2 d u
u(ρ) ≈ u0 + (ρ − ρ0 ) + (ρ − ρ0 )
dρ 2
ρ0 dρ2 ρ0

Para o potencial em questão, temos que u0 = −0,25 e ρ0 = 21/6 ≈ 1,12. O


termo linear por definição é nulo, logo ficamos com
u(ρ) ≈ −0,25 + 7,15(ρ − 1,12)2 .
Esta curva está mostrada na figura 9.2(b).
Usaremos a aproximação harmônica para descrever a interação entre
átomos numa rede cristalina monoatômica. Primeiro vamos considerar que
os osciladores sejam independentes, no modelo de Einstein, depois consider-
aremos que são acoplados, no modelo de Debye. Antes de seguir com esses
modelos, vamos ver como é o cálculo da função de partição para um oscilador
quântico,

Função de partição para o oscilador quântico


Suponha que tenhamos um conjunto de N partı́culas quânticas sujeitas
a um potencial do tipo harmônico, em equilı́brio térmico com um reservatório

203 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

Figura 9.2: A figura (a) mostra a curva para o potencial de Lennard-Jones


na forma adimensional dada pela equação (9.5), em função da distância entre
partı́culas. Em (b) aparece também a curva para a aproximação harmônica.

na temperatura T . Se as partı́culas são independentes, podemos obter o


comportamento do sistema completo a partir da função de partição de um
único oscilador, assim, começamos por aı́.
A equação de Schrödinger estacionária para um oscilador tridimensional

 
~2 2 1 2 1 2 1 2
− ∇ ψ(~r) + Kx x + Ky y + Kz z ψ(~r) = εψ(~r) , (9.6)
2m 2 2 2

Vamos considerar o caso em que as constantes elásticas são todas iguais a


k. Como visto na Aula 18 de Introdução à Mecânica Quântica e na Aula 4
desta disciplina, os nı́veis de energia devidos a esse potencial tem a forma

 
3
ε= n+ ~ω n = nx + ny + nz , nx , ny , nz = 0, 1, 2 . . . (9.7)
2

onde ω é a frequência natural do oscilador.


Quando T = 0 o estado fundamental, com n = 0, é o estado de
equilı́brio. Quando T > 0, a probabilidade de ocupação de nı́veis acima do
fundamental é não nula, sendo dada pelo fator de Boltzmann. O macroestado
de um único oscilador pode ser identificado pelo valor de n, e os microesta-
dos pelos valores de (nx , ny , nz ). A função de partição para um oscilador

CEDERJ 204
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

tridimensional é
 X
∞ X
∞ X

3~ω
Z1 = exp −β exp [−β~ω (nx + ny + nz )]
2 nx =0 ny =0 nz =0
 3
  X ∞ 
 ~ω 
= 
exp −β 2 exp (−β~ωnx )
 (9.8)
 nx =0 
| {z }
≡Zω

A soma dentro dos colchetes, Zω , é a função de partição de um oscilador


unidimensional, a menos de um fator multiplicativo constante. A soma em
Zω pode ser realizada facilmente pela série geométrica. Identificamos a =
exp (−β~ω) < 1, e usamos que

X 1
an = , a<1 (9.9)
n=0
1−a

para obter

X 1
Zω = exp (−β~ωnx) = . (9.10)
nx =0
1 − exp (−β~ω)

Modelo de Einstein
Einstein foi o primeiro a propor uma solução para a discrepância entre
a lei de Dulog-Petit e os resultados experimentais obtidos a baixas temper-
aturas. Ele aplicou o conceito de quantização da energia à teoria dos sólidos
e mostrou que assim seria possı́vel explicar porque o calor especı́fico molar
de um sólido depende da temperatura, no trabalho “Teoria de Planck da
radiação e a teoria do calor especı́fico”, publicado em 1907. Em 1901 Planck
havia explicado a radiação térmica dos corpos supondo que a energia eletro-
magnética emitida era quantizada. Para obter concordância quantitativa, foi
definida a constante de Planck. Esse fato é considerado como o nascimento
da Mecânica Quântica. Eistein reformulou o modelo em termos de um gás
de fótons, que são quanta de energia eletromagnética.
No modelo de Einstein em três dimensões o conjunto de N átomos do
sólido corresponde a N osciladores de frequência ω, com energias dadas pela
forma quantizada:
 
3
ε= n+ ~ω n = nx + ny + nz , nx , ny , nz = 0, 1, 2 . . .
2

205 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

A função de partição de cada oscilador é dada por Z1 (equação (9.8)) :


"   ∞ #3
~ω X
Z1 = exp −β exp (−β~ωnx)
2 n =0
x

A energia média por oscilador, ou energia interna por oscilador pode


ser calculada usando a expressão (7.39), hEi = Eint = − Z1 ∂Z
∂β
. Obtemos

1 3~ω 3~ω
hεi = Eint = + . (9.11)
N 2 exp (β~ω) − 1
O calor especı́fico por partı́cula pode ser calculado pela derivada da energia
média com relação à temperatura. Obtemos
 2 
θE exp θTE
c = 3κ   2 , (9.12)
T exp θTE − 1

onde θE ≡ ~ω/κ é uma grandeza com dimensão de temperatura que carac-


teriza o sólido através do valor de ω (não é a temperatura do sólido), de-
nominada temperatura de Einstein. Os regimes de temperatura alta e baixa
são definidos com relação a θE . O calor especı́fico molar pode ser facilmente
obtido se lembramos que o número de partı́culas N pode ser escrito como
N = nNA e também que Nκ = nR. Com isso temos que o calor especı́fico
molar pelo modelo de Eistein é
 2 
θE exp θTE
c = 3R   2 . (9.13)
T exp θTE − 1

A figura 9.3 mostra o comportamento do calor especı́fico do modelo de


Einstein em função de T /θE . Comparando a forma da curva com as cur-
vas experimentais, notamos que existe concordância qualitativamente. Em
princı́pio deveria ser possı́vel ajustar a expressão (9.12) a dados experimen-
tais com a escolha de um valor conveniente para θE . Na prática verifica-se
que o ajuste não é possı́vel com um único valor de θE para toda as tem-
peraturas. Numa tentativa de melhorar o modelo de Einstein outros foram
propostos, com mais de um valor de frequência, ou seja, contendo grupos
de osciladores independentes mas com frequências distintas, até que surge o
modelo de Debye, que leva em conta todas as frequências dos modos normais.

Atividade 1
(Objetivo 2)
Como o modelo de Einstein considera que os osciladores são independentes,

CEDERJ 206
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

Figura 9.3: Calor especı́fico por partı́cula pelo modelo de Einstein

podemos também descrever um sistema com N osciladores em 3 dimensões


como um sistema composto por 3N osciladores unidimensionais, ou seja, com
energias dadas por
 
1
ε = n+ ~ω n = 0, 1, 2 . . . . (9.14)
2
Mostre como obter (9.11) neste caso.
deixar 3cm

Resposta comentada
Como cada oscilador é unidimensional, Z1 fica dado como
 
~ω 1
Z1 = exp −β
2 1 − exp (−β~ω)
Usamos agora a expressão para a energia média:
1 ∂Z1 ~ω ~ω 1
hεi = − = + = Eint.
Z1 ∂β 2 exp (β~ω) − 1 3N
Comparando com a expressão 9.11 podemos ver que a Eint terá o mesmo
valor nos dois casos.
Fim da atividade
Atividade 2
(Objetivo 2)
Mostre que o modelo de Einstein concorda com o princı́pio da equipartição

207 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

no limite T  θE .
deixar 3cm

Resposta comentada
Se usamos a aproximação harmônica num sistema de osciladores clássicos
desacoplados, teremos que a energia de um dado oscilador unidimensional,
por exemplo na direção x, é

1 1
ε = mvx2 + k∆x2 ,
2 2
onde m e vx são a massa e a velocidade do oscilador, respectivamente, ∆x
o afastamento com relação ao ponto de equilı́brio e k a constante elástica,
dada pela concavidade do potencial, calculada no ponto de mı́nimo. No caso
de um oscilador tridimensional temos
1 1
ε = m(vx2 + vy2 + vz2) + k(∆x2 + ∆y 2 + ∆z 2 ) .
2 2

Aqui estamos supondo um sistema isotrópico, ou seja, com a mesma


constante elástica em todas as direções. Temos, assim, 6 termos quadráticos
na expressão da energia, 3 relativos a energia cinética e 3 relativos a energia
potencial elástica. Neste caso, o princı́pio da equipartição levaria a uma
energia interna
 
1 1
Eint = N 3 × κT + 3 × κT = 3NκT .
2 2

Portanto, o calor especı́fico desse sólido clássico é

1 ∂Eint
cV = = 3κ .
N ∂T
Se T  θE , temos que θE /T  1 de maneira a permitir as aproximações
 
θE
exp ≈1
T

no numerador e  
θE θE
exp ≈ 1+
T T
no denominador. Precisamos do termo extra no denominador para garan-
tir um resultado finito. Substituindo essas expressões obtemos o resultado
clássico.

CEDERJ 208
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

x01 x02
k k k

m m

x1 x2

Figura 9.4: Exemplo simples de acoplamento entre osciladores. Na figura


superior as massas m estão em equilı́brio nas posições x01 e x02. Na figura
inferior vemos as massas deslocadas de suas posições de equilı́brio.

Modelo de Debye

A grande diferença entre os modelos de Debye e Einstein é que o


primeiro considera que os osciladores estejam acoplados, o movimento de um
afetando o dos outros. Como você viu na Aula 4 de Mecânica, as equações
de movimento de N osciladores idênticos acoplados podem ser escritas como
N equações independentes, para osciladores com determinadas frequências,
as frequências dos modos normais. Isso significa que o movimento coletivo
de um conjunto de N osciladores acoplados pode ser escrito como uma com-
binação linear desses modos. Essa é a idéia deste modelo: quando T > 0
os átomos da rede cristalina têm um movimento complicado de oscilação em
torno das suas posições de equilı́brio, que pode ser escrito como a super-
posição de movimentos mais simples, os modos normais.

Exemplo 9.1
Vamos analisar um sistema simples formado por osciladores mecânicos como
indicado na figura 9.4. Temos duas massas idênticas acopladas por molas de
constante elástica k. As equações de movimento para as massas são

d2 x1
m = −kx1 − k(x1 − x2 )
dt2
d2 x2
m 2 = −kx2 − k(x2 − x1 )
dt

209 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

(a) modo simétrico


x1 x2

(b) modo assimétrico x 1 x2

Figura 9.5: Modos normais dos osciladores da figura 9.4. (a) Modo simétrico
x1 = x2 . (b) Modo assimétrico x1 = −x2.

Somando e subtraindo essas equações obtemos

d2xs
m = −kxs xs = (x1 + x2)/2
dt2
d2 xa
m 2 = −3kxa xa = (x1 − x2)/2
dt

p
onde xs e xa são as soluções simétrica, com frequência ω0 = k/m, e as-
p √
simétrica, com frequência ω1 = 3k/m = 3ω0 :

xs = As sen (ω0 t + φs ) xa = Aa sen (ω1 t + φa )

Essas soluções, que obedecem às equações desacopladas, recebem o


nome de modos normais. O movimento dessas massas pode ser descrito
como uma como uma combinação linear desses modos normais:

x1(t) = xs (t) + xa (t) x2 (t) = xs (t) − xa (t)

Duas soluções particulares são

Aa = 0 → x1 (t) = x2 (t) e As = 0 → x1(t) = −x2 (t) .

Na primeira, solução simétrica, os osciladores vão para a direita e para a


esquerda juntos (figura 9.5(a)) com frequência ω0 . Na segunda, solução
assimétrica, as massas tem movimentos opostos, oscilando com frequência
ω 2 = 3ω02 (figura 9.5(b)).

Assim, abstraı́mos dos átomos e passamos a pensar apenas na super-


posição de modos, queremos saber qual a quantidade média de cada modo

CEDERJ 210
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

(a)

(b)

Figura 9.6: Modos normais transversais para os osciladores da figura 9.4.

na vibração coletiva da rede, observada para um dado valor de temperatura.


Neste contexto os modos normais são tratados como partı́culas e ganham
o nome de fônons. O sistema passa a ser um gás de fônons confinado a
um volume V (o volume do sólido). Esses fônons são quanta de oscilações
elásticas que podem ser longitudinais, como as representadas na figura 9.5,
ou transversais como as da figura 9.6. Para determinar as frequências dos
modos normais observamos a figura 9.7, onde temos um grande número de
osciladores formando um meio de comprimento L. O maior comprimento de
onda possı́vel é λmax = 2L. De uma forma geral os comprimentos de onde
devem obedecer λn = 2L/n, sendo n = 1, 2, 3 . . .. Para cada frequência há
3 polarizações possı́veis: duas transversais e uma longitudinal. Por simplici-
dade consideramos um volume cúbico, V = L3 , e supomos que a velocidade
de propagação, u, para qualquer polarização seja a mesma. Neste caso
2πu nπu
ωn = → ωn = , (9.15)
λn L
onde n2 ≡ n2x + n2y + n2z , nx , ny , nz são números inteiros positivos, não nulos.
Para estudar o sistema teremos que realizar somas sobre todos os modos
possı́veis. Começamos calculando o número médio de fônons numa dada
frequência ω, hη(ω)i. A energia de η fônons é  = η~ω, assim, a função de
partição é a própria Zω . O valor médio de η numa dada temperatura é, por
definição,

1 X
hηi = η exp (−βη~ω) . (9.16)
Zω η=0

Definindo α ≡ β~ω, fica fácil notar que


dln Zω
hηi = − . (9.17)

211 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

Figura 9.7: Alguns modos normais transversais de um arranjo unidimensional


com N osciladores. O confinamento impõe rstrições ao comprimento de onda,
que só pode ter os valores indicados à direita.

Usando a expressão (9.10), obtemos a distribuição de Planck


1
hη(ω)i = . (9.18)
exp (β~ω) − 1
Agora podemos calcular a energia total dos fônons no sólido somando
as contribuições de todas as frequências. Temos
X X X ~ωn
E= gn hn i = gn hηi~ωn = gn , (9.19)
n n n
exp (β~ωn ) − 1
onde gn é a multiplicidade relativa aos valores de n. Valores macroscópicos
de L levam a valores consecutivos de frequência extremamente próximos,
permitindo que aproximemos a soma em (9.19) por uma integral. A multi-
plidade pode ser calculada pelo método de construção da casca de raio n e
espessura dn, como feito na Aula 4. Temos
1
gn → 3 × 4πn2 dn . (9.20)
8
O fator 3 leva em conta as três polarizações e o 1/8 considera apenas os valores
positivos de nx , ny e nz . Fazendo a aproximação para o contı́nuo, definimos
a variável adimensional q ≡ β~vnπ/L. Nessa aproximação podemos escrever
a soma sobre os modos de qualquer quantidade como
Z Z
X 3
f(n) = 3 × f(n)D(n)dn = f(n)4πn2 dn . (9.21)
n
8

CEDERJ 212
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

Num sólido tridimensional com N átomos há 3N modos normais (são 3N


equações de movimento). Isso define o maior valor de frequência, ou maior
valor de n, que chamaremos de nD :
Z  1/3
3 nD 2 6N
4πn dn = 3N ⇒ nD = (9.22)
8 0 π
Assim, a energia total dos fônons pode ser calculada somando-se sobre todas
as frequências, apenas limitando a integral ao valor nD . Temos
Z
3π nD ~ωn
Eint = dn n2 . (9.23)
2 0 exp(β~ωn ) − 1
Novamente definimos a variável adimensional q ≡ β~cπn/L, qD ≡ β~cπnD /L,
e escrevemos a energia como
Z qD
3L3 4 q3
Eint = 2 (κT ) dq . (9.24)
2π (~c)3 0 eq − 1
Os regimes de temperatura alta e baixa agora são relativos à temperatura
de Debye definida como
   2 1/3
~nD π ~c 6π N
θD = T q D = ⇒ θD = (9.25)
κL κ V
Por causa do limite superior, a integral em (9.24) não pode ser calculada
exatamente, mas podemos verificar seu comportamento para temperaturas
altas e baixas. Antes de seguir com essas aproximações, vamos ver quais são
os valores de θD para alguns materiais. A tabela 9.11 mostra diversos valores
de θD obtidos por ajuste da expressão dada pelo modelo de Debye a dados
experimentais, à temperatura ambiente.
Para que um material tenha um calor especı́fico próximo ao previsto
pela Lei de Dulong-Petit à temperatura ambiente, ele deve ter uma temper-
atura de Debye menor que 300 K, e quanto menor for esse valor, melhor será
a previsão do modelo clássico. Assim, claramente o modelo clássico se aplica
perfeitamente ao potássio, mas não ao carbono, nessa temperatura. A figura
9.8 mostra medidas experimentais para o calor especı́fico de alguns materiais,
em função de T /θD . Os valores de θD são obtidos previamente pelo ajuste
da curva prevista pelo modelo de Debye. Com a temperatura escrita nessa
escala, as curvas para todos os sólidos colapsam numa única curva universal.

Temperaturas baixas: T  θD , ou qD  1

A figura 9.9 mostra o comportamento do integrando em (9.24). Note


que quando q > 10 o valor do integrando é muito pequeno, assim, podemos

213 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

material θD (K)
potássio 91
chumbo 105
sódio 158
cálcio 230
zinco 327
alumı́nio 428
ferro 470
silı́cio 645
carbono 2230

Tabela 9.11: Valores da temperatura de Debye para diversos materiais.

Figura 9.8: Valores experimentais do calor especı́fico de diversos materiais, e


o calculado pelo modelo de Debye, em função de T /θD . (Figura extraı́da da
Aula 9 de Fı́sica 2A)

considerar qD → ∞ sem correr o risco de estar aumentando muito o valor da


integral. Neste limite, o valor da integral é π 4/15. Nesta aproximação,
 3
3 T
Eint = NκT π 4 (9.26)
5 θD
e  3
∂Eint 12π 4 Nκ T
CV = = (9.27)
∂T 5 θD
O resultado (9.27) recebe o nome de Lei T 3 de Debye.

CEDERJ 214
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

Figura 9.9: Comportamento do integrando f(q) = q 3 /(eq − 1).

Temperaturas altas: T  θD , ou qD  1

Neste caso, para todo q ≤ qD , eq − 1 ≈ q + q 2/2 + q 3 /6 + . . . = q(1 + r),


onde definimos r ≡ q/2 + q 2/6 + . . ., portanto r  1. Com isso

q3 q3 q2
= = ≈ q 2(1 − r + r2 − r3 + . . .)
eq − 1 q(1 + r) 1+r

Vamos manter termos até q 2 em r. Nesta aproximação temos:

r = q/2 + q 2/6 r2 = q 2/4 r3 = 0. (9.28)

Finalmente,
   
q3 2 q q2 q2 2 q q2
= q 1− − + = q 1− + (9.29)
eq − 1 2 6 4 2 12

Usando este resultado na expressão (9.24) temos


 2

3 θD
Eint = 3Nκ T − + . (9.30)
8θD 20T

O calor especı́fico fica então


 
θ2
cV = 3κ 1 − D 2 . (9.31)
20T

Podemos ver imediatamente que o resultado clássico pode ser obtido fazendo-
se T → ∞.
Atividade 3
(Objetivos 2 e 3)
Trabalhe todos os detalhes necessários para chegar à equação (9.30).

215 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

diagramador: deixar 5cm

Resposta comentada
Nosso ponto de partida é a expressão (9.24):
Z qD
3L3 4 q3
Eint = 2 (κT ) dq .
2π (~c)3 0 eq − 1

Usando a definição para θD , equação (9.25), podemos escrever


  3 Z qD Z qD
T q3 1 q3
Eint = 9NκT dq q = 9NκT 3 dq q .
θD 0 e −1 qD 0 e −1

Usamos a expressão para o integrando, eq. (9.29), para obter:


Z qD    3 
1 2 q q2 1 qD 4
qD 5
qD
Eint = 9NκT 3 dq q 1 − + = 9NκT 3 − +
qD 0 2 12 qD 3 8 60

Escrevendo em termos de θD temos a expressão (9.30).


Fim da atividade
Atividade 4
Considere dois sistemas, um composto por átomos de ferro (θD = 470 K e
outro por átomos de selênio (θD = 90 K), com n = 1 mol de átomos. Observe
a figura 9.8 e calcule a variação de temperatura (para os dois sistemas) nas
situações

1. O sistema recebe 1 J de calor a 300 K.

2. O sistema recebe 1 J de calor a 100 K.

diagramador: deixar 5cm

Resposta comentada
A quantidade de calor trocada num determinado processo é dada por
Z
Q = C(T )dT

Para pequenas variações de temperatura podemos considerar que C é con-


stante. Temos assim Q = nc∆T . Neste caso usaremos ∆T = Q/nc. Para
utilizar a informação do gráfico precisamos da temperatura de Debye. Para
isso consultamos a tabela 9.11.

CEDERJ 216
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

1. Ferro: T = 100K → T /θD = 100/470 = 0,21. De acordo com o


gráfico o valor de c nessa temperatura reduzida é aproximadamente 10
J/mol.K
1J
∆T = = 0,10 K
1 mol × 10 J/mol.K
Selênio: T = 100K → T /θD = 100/90 = 1,11. De acordo com o
gráfico o valor de c nessa temperatura reduzida é aproximadamente 24
J/mol.K
1J
∆T = = 0,042 K
1 mol × 24 J/mol.K

2. Ferro: T = 300K → T /θD = 300/470 = 0,7. De acordo com o gráfico o


valor de c nessa temperatura reduzida é aproximadamente 21 J/mol.K

1J
∆T = = 0,048 K
1 mol × 21 J/mol.K

Selênio: T = 300K → T /θD = 300/90 = 3,33. De acordo com o


gráfico o valor de c nessa temperatura reduzida é aproximadamente 25
J/mol.K
1J
∆T = = 0,040 K
1 mol × 25 J/mol.K
De acordo com o gráfico, a partir de T /θD ≈ 1 a variação de c com
a temperatura é bem pequena, então a aproximação é mais adequada.
Isso se aplica ao chumbo, nas duas temperaturas.

Conclusão
O comportamento térmico de sólidos pode ser entendido se idealizamos
os átomos da rede cristalina exercendo oscilaçoes incoerentes em torno de suas
posições de equilı́brio. A energia potencial de interação entre átomos pode
ser aproximada, no caso de oscilações de pequena amplitude, por um função
quadrática, o que implica que podemos usar o modelo do oscilador harmônico
para descrever o sistema. O modelo clássico para esses osciladores produz
um calor especı́fico independente da temperatura (Lei de Dulong-Petit), o
que viola a terceira lei da Termodinâmica e não é observado experimen-
talmente, e do material, o que não é observado experimentalmente. Para
que esses problemas sejam corrigidos torna-se necessário, em primeiro lugar,
tratar o sistema quanticamente. Em termos da descrição quântica, o modelo
que considera interação entre os osciladores, modelo de Debye, tem ótima
concordância com resultados experimentais. Esse modelo também traz a

217 CEDERJ
Aula 9 - Calor especı́fico de sólidos
Física Estatística e
Matéria Condensada

definição natural de um parâmetro com dimensão de temperatura, a temper-


atura de Debye θD , que permite a definição dos regimes de temperatura alta
e baixa para modelo.
O modelo quântico que considera os osciladores independentes, mod-
elo de Einstein, traz resultados surpreendentemente bons considerando-se
a simplicidade do mesmo. O outro modelo quântico, modelo de Debye,
leva em consideração a interação entre átomos, tratando a oscilação da rede
através dos modos normais de oscilação. Este modelo traz a definição de um
parâmetro com dimensão de temperatura, a temperatura de Debye, tı́pica
para cada material, com uma ótima concordância quantitiativa com resulta-
dos experimentais.

Resumo
Nesta aula aprendemos a calcular o calor especı́fico de sólidos pelos
modelos clássico, de Einstein e de Debye. Nos três modelos supomos que os
átomos num sólido cristalino realizam oscilações de pequena amplitude em
torno de sua posição de equilı́brio. Neste limite é possı́vel aproximar-se o
potencial de interação entre átomos por uma parábola levando ao modelo
do oscilador harmônico simples para descrever o movimento dos átomos. O
modelo clássico leva a um calor especı́fico que não depende da temperatura, o
que contraria a Terceira Lei da Termodinâmica e os resultados experimentais:
o calor especı́fico deve ser nulo quando T → 0. O resultado clássico, como
outros obtidos pelo princı́pio da equipartição, não depende do material, o que
também não é observado experimentalmente. A introdução de uma expressão
quântica para a energia dos osciladores, mesmo que ainda sejam considerados
independentes, leva ao que chamamos modelo de Einstein. Esse modelo tem
um parâmetro de ajuste, a temperatura de Einstein θE , e gera um calor
especı́fico que, corretamente, vai a zero quando T → 0 e tende ao valor
clássico quando T → ∞. Embora apresente uma excelente concordância
qualitativa, o ajuste de dados experimentais, em geral, não é possı́vel com um
único valor de θE para todas as regiões de temperatura. O modelo de Debye
introduz a interação entre os osciladores e passa a descrever o movimento
dos átomos da rede pelos seus modos normais que podem ser encarados com
quanta de elergia elástica, denominados fônons. Nesse contexto podemos
pensar no sólido como um recipiente repleto por esse gás de fônons. No
modelo de Debye temos também um parâmetro de ajuste, a temperatura de
Debye θD , que serve para definir os regimes de alta e baixa temperatura para

CEDERJ 218
Aula 9 - Calor especı́fico de sólidos
MÓDULO 1 - AULA 9

cada sólido. Assim como no modelo de Einstein, o calor especı́fico de Debye


vai a zero quando T → 0 e tende ao valor clássico quando T → ∞.

Informações sobre a próxima aula


Na próxima aula vamos estudar o gás ideal clássico.

Leitura complementar
• S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São
Paulo, EDUSP.

• Sérgio M Rezende, A Fı́sica de materiais e dispositivos eletrônicos, Ed.


Universidade Federal de Pernambuco, 1996

219 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

Aula 10 - Gás ideal monoatômico no regime


clássico
19 de Janeiro de 2015

Meta

Apresentar as principais propriedades térmicas de um gás de partı́culas


livres no regime clássico.

Objetivos

Ao final desta aula, você deverá ser capaz de:

1. perceber em que situações podemos aproximar a soma na função de


partição para uma integral;

2. verificar como a indistinguibilidade das partı́culas afeta a contagem de


microestados;

3. calcular a função de partição, a entropia e a energia livre de Helmholtz


para o gás ideal no regime clássico;

4. estabelecer a equação de estado para o gás a partir da função de


partição.

Pré-requisitos

Esta aula requer que você esteja familiarizado com a função de onda
e espectro de energia de uma partı́cula numa caixa tridimensional, assunto
coberto pelas Aulas 17 e 18 de Introdução à Mecânica Quântica e revisto na
Aula 4 desta disciplina. Além disso você deve rever a origem experimental
da equação de estado do gás ideal e a definição de calor especı́fico nas Aulas
6 e 10 de Fı́sica 2A, respectivamente. Usaremos, também, os resultados para
integrais gaussianas expostos na Aula 3.

221 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

Introdução

O modelo do gás ideal clássico é um dos mais importantes na Ter-


modinâmica e na Fı́sica Estatı́stica. Por gás entendemos um sistema no qual
as partı́culas não tem posição fixa, elas estão o tempo todo em movimento.
Com isso teremos uma alteração fundamental na maneira de abordar o pro-
blema. Num sólido os átomos idênticos são distinguı́veis pelas posições que
ocupam. Mesmo quando consideramos o movimento de vibração dos átomos
na rede, como vimos na Aula 9, as oscilações se dão ao redor de posições
fixas na rede cristalina. Num gás não temos posições fixas e as partı́culas são
indistinguı́veis. Veremos a seguir e na Aula 12 que esse novo ingrediente traz
inúmeros efeitos importantes. O termo ideal significa que as partı́culas não
estão sujeitas a qualquer potencial de interação. Com essa aproximação um
gás de átomos ou moléculas nunca será capaz de se tornar lı́quido ou sólido,
para tal terı́amos que levar em conta a interação atrativa entre as partı́culas.
Entretanto, se nas temperaturas de interesse não houver alteração de fase,
o modelo sem interação permite o entendimento de diversas propriedades
macroscópicas de forma simples. Finalmente o termo clássico se refere à
maneira como a indistinguibilidade é tratada. Trataremos dessa questão
numa aproximação que nos levará a um gás de baixı́ssima densidade, no qual
efeitos quânticos, tais como o princı́pio de exclusão, são irrelevantes.
Na Fı́sica 2A você estudou o gás ideal do ponto de vista da Ter-
modinâmica, descrevendo-o através das variáveis macroscópicas pressão, vo-
lume e temperatura. A função que relaciona essas variáveis (equação de
estado) é obtida, nessa abordagem macroscópica, a partir de observações ex-
perimentais. Nesta aula queremos chegar a essa equação de estado a partir
da descrição microscópica, usando a distribuição de Boltzmann.
Os primeiros cálculos estatı́sticos do gás ideal foram realizados antes
da Mecânica Quântica; usaram, portanto, a expressão clássica para a energia
cinética de cada partı́cula. Esse cálculo tem sérios problemas dimensionais a
começar pela função de partição que não é adimensional como deveria. Esses
problemas só puderam ser corrigidos quando a energia do sistema passou a ser
dada pela Mecânica Quântica. Nesta aula iremos direto ao modelo quântico.
Um cálculo bastante detalhado usando a energia clássica pode ser visto no
livro Introdução à Fı́sica Estatı́stica indicado como leitura complementar.

CEDERJ 222
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

Modelo quântico
O modelo para o gás ideal consiste de um conjunto de N partı́culas
pontuais e não interagentes, limitadas a um volume V = L3 . Do ponto
de vista da Mecânica Quântica, essas condições correspondem ao modelo da
partı́cula livre numa caixa 3d, como visto na Aula 4. Nesse modelo, os valores
de energia de uma partı́cula são dados por

~2  πn 2
ε= , (10.1)
2m L
onde n2 = n2x +n2y +n2z , e nx , ny , nz = 1, 2 . . .. De acordo com a expressão para
a energia, equação (10.1), o valor de n pode ser usado para rotular o macroes-
tado de uma única partı́cula. A multiplicidade desse macroestado vem da
possibilidade de se obter um mesmo n para diferentes escolhas de nx , ny e
nz . Em sistemas macroscópicos, que têm L com dimensões macroscópicas o
espaçamento entre os nı́veis de energia é muito pequeno de modo que pode-
mos assumir uma variação contı́nua de energia. Isso significa que nx , ny e nz
podem ser considerados números reais e não inteiros, e que a multiplicidade
deve ser calculada considerando que a energia da partı́cula está no intervalo
entre ε e ε + dε, ou que n está entre n e n + dn. A relação entre n e nx , ny e
nz é a mesma do raio de uma esfera centrada na origem dos eixos (nx , ny , nz ).
Como vimos na Aula 4, o número de estados com n entre n e n + dn, dN (n)
é dado pelo volume de 1/8 da casca esférica de raio n e espessura dn, ou seja,
1
dN (n) = 4πn2dn . (10.2)
8
A expressão acima pode se escrita em termos de ε se usamos a equação (10.1).
Identificando V = L3, obtemos
 3/2
V 2m
dN (ε) = 2 ε1/2dε . (10.3)
4π ~2

A densidade de estados D(ε) é definida como


 3/2
dN V 2m
D(ε) ≡ = 2 ε1/2 . (10.4)
dε 4π ~2

D(ε)dε é a multiplicidade do estado com energia entre ε e ε+dε. Assim, num


gás tridimensional, a multiplicidade aumenta com o aumento da energia.

Box de atenção
O termo densidade de estados é o adotado na fı́sica da matéria condensada,

223 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

mas traz alguma ambiguidade no contexto da fı́sica estatı́stica porque não


fica claro se estamos tratando de micro ou macroestados. Por isso costuma-se
usar o termo densidade de orbitais em textos de fı́sica estatı́stica. Por orbital
entende-se uma solução da equação de Schödinger para uma partı́cula, não
tendo relação com a idéia de órbita. Assim, cada função de onda resultante
de se resolver o problema de uma partı́cula livre numa caixa corresponde a
um orbital.
fim do box de atenção

Atividade 1
(Objetivo 3)
Uma realização bidimensional do gás ideal pode ser obtida se examinamos
os átomos de gás que são adsorvidos por uma superfı́cie. Adsorção (que não
deve ser confundida com absorção) é o processo que ocorre quando moléculas
de um gás ou lı́quido se acumulam na superfı́cie de um sólido, formando um
filme muito fino. No processo de absorção, as moléculas se difudem dentro
do sólido. O filme adsorvido pode ser considerado um gás bidimensional já
que as moléculas estão confinadas a uma superfı́cie. Qual a densidade de
estados nesse caso?
deixar 4cm

Resposta comentada
A expressão (10.1) para a energia continua válida, só que agora n2 = n2x + n2y ,
supondo que o gás esteja confinado a uma superfı́cie paralela ao plano xy.
A figura 4.1(b) mostra como a contagem da multiplicidade deve ser feita
num sistema bidimensional. Cada ponto corresponde a dados valores de nx
e ny . No limite contı́nuo, o número de pontos numa dada região pode ser
aproximado pela área da mesma. Temos assim:
1 1
N (n) = πn2 e dN (n) = πndn . (10.5)
4 2
O fator 1/4 aparece porque queremos apenas valores positivos para nx e ny .
Escrevendo em termos da energia, temos:
Am Am
dN (ε) = dε logo D(ε) = ,
2π~2 2π~2
onde A = L2 é a área ocupada pelo gás. Diferentemente do gás em três
dimensões, no gás bidimensional a multiplicidade não depende da energia.
fim da atividade

CEDERJ 224
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

A contagem de estados num sistema de par-


tı́culas indistinguı́veis
Na Aula 8 calculamos a função de partição para o paramagneto uni-
axial relacionando ZN , a função de partição para as N partı́culas, com Z1 , a
relativa a uma partı́cula, através da relação (7.29) transcrita abaixo:
N
ZN = (Z1 ) . (10.6)

A relação acima simplifica enormemente o cálculo da função de partição,


porque em Z1 temos apenas que levar em conta a multiplicidade relativa
à forma da energia, e não a relativa à divisão da energia total entre as
partı́culas. Vejamos porque essa expressão implica na distinguibilidade das
partı́culas. Considere o caso N = 3 para um sistema de dois estados (como
o do paramagneto uniaxial), com energias εx e εy . Definindo x ≡ exp(−βεx)
e y ≡ exp(−βεy ) e usando os rótulos a, b e c para designar as partı́culas,
temos

Z3 = (Za )(Zb )(Zc ) = (xa + ya )(xb + yb )(xc + yc )


= xa xb xc + xa xb yc + xa yb xc + xa yb yc
+ ya xb xc + ya xb yc + ya yb xc + ya yb yc . (10.7)

Os termos correspondem a ter cada partı́cula em um dos nı́veis de energia.


Por exemplo, yaxb xc corresponde à partı́cula a com energia εy , e as b e c
com energia εx. Assim, estamos assumindo que é possı́vel distinguir qual é a
partı́cula, a, b ou c, o que pode ocorrer se as partı́culas tiverem posições fixas,
como numa rede cristalina, que é em geral o caso dos materiais com esse tipo
de magnetismo. Vemos também que os estados xaxb yc xa xb yc e xayb xc têm a
mesma energia, igual a 2εx +εy , e por isso pertencem ao mesmo macroestado.
O mesmo acontece com os termos ya xb xc , ya xbyc e ya yb xc , que tem energia
2εy + εx. A expressão (7.33) mostra como calcular ZN agrupando os termos
por macroestados. Neste caso especı́fico, terı́amos

Z3 = x3+3x2 y+3xy 2+y 3 = (Z1 )3 para partı́culas distinguı́veis . (10.8)

Mas, e se as partı́culas forem indistinguı́veis? Esse é o caso dos átomos livres


num volume, como num gás. Nesse caso xaxb yc e xa yb xc não são microestados
do mesmo macroestato, eles são o mesmo microestado, e g(E) = 1. A função
de partição para as três partı́culas seria

Z3 = x3 +x2y +xy 2 +y 3 6= (Z1 )3 para partı́culas indistinguı́veis . (10.9)

225 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

Considere agora um sistema com N partı́culas e M nı́veis de energia.


Neste caso a energia total é escrita como

E = η1 ε1 + η2 ε2 . . . ηM εM , (10.10)

onde os ηi são as ocupações dos estados de energia εi , devendo obedecer ao


P
vı́nculo i ηi = N. Se as partı́culas forem distinguı́veis, a multiplicidade do
macroestado com energia E é dada por
N!
g(η1, η2 , . . . ηM ) = , (10.11)
η1!η2 ! . . . ηM !
mas se forem indistinguı́veis, g(η1 , η2, . . . ηM ) = 1. Assim, se usarmos a forma
(7.29) para calcular ZN num sistema de partı́culas indistinguı́veis, estaremos
com muitos termos sendo contados a mais. A proposta de Boltzmann para
corrigir essa contagem excessiva foi dividir o produto (Z1 )N pelo número de
permutações possı́veis com N partı́culas, ou seja, usar a expressão
1
ZN = (Z1 )N , (10.12)
N!
para partı́culas indistinguı́veis. Esta correção só é exata nos termos em que
cada partı́cula está num nı́vel de energia, ou seja, se os ηi forem todos iguais
a 1 em (10.11), já que g = N! nesse caso. Todos os outros termos serão divi-
didos por um valor maior que g. Em outras palavras, os termos referentes a
configurações em que mais de uma partı́cula tem a mesma energia serão pe-
nalizados e contribuirão muito pouco para o cálculo de ZN . As configurações
com uma partı́cula em cada nı́vel, por outro lado, serão favorecidas. Veremos
mais à frente que o uso dessa correção leva necessariamente ao gás no regime
clássico.

O gás monoatômico
Usaremos a expressão (10.12) para calcular a função de partição para
um gás ideal monoatômico, admitindo a indistinguibilidade das partı́culas.
Para calcular Z1 precisamos dos possı́veis valores de energia para uma
partı́cula de massa m confinada a um volume V = L3 . Eles são, de acordo
com a (10.1),
(~k)2 nπ
ε= , k= , n2 = n2x + n2y + n2z (10.13)
2m L
Um microestado do sistema completo é rotulado pelos valores de (nx , ny , nz )
para cada partı́cula. Se examinarmos apenas uma partı́cula, o microestado

CEDERJ 226
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

será rotulado pelos valores de (nx , ny , nz ) dessa partı́cula. Somando sobre os


microestados de uma partı́cula, temos
∞ X
X ∞ X

exp −βα n2x + n2y + n2z
 
Z1 = (10.14)
nx =1 ny =1 nz =1
∞ X
X ∞ X

exp −βαn2x exp −βαn2y exp −βαn2z
  
=
nx =1 ny =1 nz =1
" ∞
# ∞ "

#
X X X
2 2 2
  
= exp −βαnx  exp −βαny  exp −βαnz
nx =1 ny =1 nz =1
" ∞
#3
X
exp −βαn2x

= ,
nx =1

onde α = ~2π 2/2mV 2/3. Como V é um volume macroscópico, a separação


entre os valores de energia é muito pequena e a soma em nx pode ser aprox-
imada por uma integral. Assim,
Z ∞ 3
2

Z1 = exp −βαnx dnx . (10.15)
0

Usando a expressão (3.24) para a integral gaussiana, temos


 r 3  3/2
1 π κT m
Z1 = = V = φq V . (10.16)
2 αβ ~22π

O resultado (10.16) define uma grandeza importante, a concentração quântica:


 3/2
κT m
φq = . (10.17)
~22π
Veremos adiante o seu significado.
Podemos também calcular Z1 fazendo a soma sobre os macroestados,
que neste caso pode ser a soma sobre os valores de ε ou n. Já utilizando a
aproximação de espectro de energia contı́nuo, temos
X Z ∞
Z1 = g(ε) exp(−βε) → exp(−βε)D(ε)dε (10.18)
ε 0

1
Z
exp −βαn2 n2 dn

= 4π
8 0
3/2
π −3/2
= (αβ)
8
 3/2
κT m
= V = φq V .
~22π

227 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

Concentração quântica
Uma partı́cula quântica tem seu momento linear definido como p = h/λ,
sendo λ o comprimento de onda. Num sistema clássico, uma partı́cula de
massa m e velocidade v tem seu momento linear definido como p = mv. Num
gás tı́pico, com apenas um tipo de molécula, todas as partı́culas tem o mesmo
valor de massa mas cada uma tem um valor de velocidade, cujo valor está
distribuı́do de acordo com uma distribuição dependente da temperatura. O
momento linear médio, neste caso, é hpi = mhvi. O princı́pio da equipartição
nos dá o valor médio de v 2, já que
1 3 3κT
hεi = mhv 2i = κT ⇒ hv 2 i = .
2 2 m
Vamos considerar que σv2 = hv 2i − hvi2 ≈ 0, ou seja,
hvi2 ≈ hv 2 i ≈ κT /m .
Igualando as definições quântica e clássica temos
 1/2  2 1/2
h κT h
≈m ⇒ λT ≈ . (10.19)
λT m mκT
λT é o que chamamos comprimento de onda térmico. Podemos associar a
cada partı́cula quântica um volume definido por λ3T , com isso, a concentração
quântica fica definida como
 3/2
1 mκT
φq ≡ 3 = . (10.20)
λT h2
Dizemos que um gás está no regime clássico quando sua concentração
φ = N/V é muito menor que φq . Na Aula 1 calculamos as concentrações do
hélio nas CNPT e dos elétrons de condução no lı́tio na temperatura ambiente.
Podemos compará-las com as concentrações quânticas para essas partı́culas
na mesma temperatura. Obtemos para o hélio
φHe
= 3 × 10−6  1 . (10.21)
φqHe
Concluı́mos, então, que a aproximação clássica é boa para o hélio à temper-
atura ambiente. Para os elétrons encontramos uma concentração φelétrons ≈
104 φHe , mas como a massa de um átomo de hélio é 104 maior que a de um
elétron, e φq ∝ m3/2, temos que
φelétrons
= 0, 66 × 102  1 . (10.22)
φqelétrons
Assim, no caso dos elétrons, tratá-los como um gás clássico não é uma boa
aproximação. Na Aula 12 você vai aprender como lidar com esse sistema.

CEDERJ 228
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

Atividade 2
(Objetivo 4)
Calcule a energia interna e o calor especı́fico a V constante do gás ideal
clássico a partir de sua função de partição. Verifique se os resultados estão
de acordo com o princı́pio da equipartição da energia.
deixar 5cm

Resposta comentada
Começamos pela energia interna. Vamos usar a expressão para a energia
média dada pela equação (7.39):
1 ∂ZN
hEi = Eint = − . (10.23)
ZN ∂β
Fica mais simples calcular a energia interna por partı́cula:
Eint 1 ∂Z1
=− .
N Z1 ∂β
Assim, usando a expressão apra Z1 , equação 10.19, temos
3
Eint = NκT .
2
Para calcular o calor especı́fico usamos a definição (9.11) apresentada na Aula
9 de Fı́sica 2A. Temos
1 ∂Eint 3Nκ
cV = =⇒ cV = . (10.24)
N ∂T 2
Os resultados para Eint e cV são idênticos aos previstos pelo princı́pio da
equipartição.
fim da atividade

Energia livre de Helmholtz


O cálculo das grandezas termodinâmicas exige que o limite N → ∞
seja tomado. Assim, calculamos a energia livre por partı́cula como
1
f = lim (−κT ln ZN ) (10.25)
N →∞ N
 
1 1 N
= −κT lim ln (Z1 )
N →∞ N N!
= κT [ln N − 1 − ln φq V ]
   
φ
= κT ln −1
φq

229 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

Neste cálculo usamos a aproximação de Stirling para N! , N  1, ln N! ≈


N ln N − N. Para o sistema todo,
   
φ
F = NκT ln −1 . (10.26)
φq

Como vimos na Aula 7, a energia livre de Helmholtz combina os princı́pios


de minimização de energia e maximização de entropia e é definida como
F = Eint − T S. Vamos calcular a variação de energia livre, dF :

dF = dEint − d(T S) = T dS − p dV − SdT − T dS = −p dV − SdT , (10.27)

onde usamos que a troca infinitesimal de calor foi reversı́vel, podendo ser
escrita como d0 Q = T dS. Se escrevemos F como uma função de V e T ,
temos que    
∂F ∂F
dF = dV + dT . (10.28)
∂V T ∂T V
Comparando as expressões (10.27) e (10.28) podemos imediatamente identi-
ficar  
∂F
P =− , (10.29)
∂V T
levando à conhecida relação P = NκT /V .

Atividade 3
(Objetivo 4)
Encontre uma expressão para a entropia S(N, V, T ) do gás ideal clássico a
partir da forma diferencial da energia livre de Helmholtz, equação (10.28).
deixar 4cm

Resposta comentada
Comparando as expressões (10.28) e (10.27) podemos identificar:
     
∂F φq 5
S=− = Nκ ln + (10.30)
∂T φ 2

Esta expressão para a entropia recebe o nome de fórmula de Sackur-Tetrode


e concorda com resultados experimentais. Note que, mesmo para o regime
clássico, S guarda sua origem quântica através da presença de ~ na concen-
tração quântica, ressaltando a impossibilidade de se obter o mesmo resultado
a partir de um modelo puramente clássico.
fim da atividade

CEDERJ 230
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

Atividade 4
(Objetivos 2 e 4)
A energia livre de Helmholtz deve ser uma quantidade extensiva, ou seja, ao
ser dividida por N o resultado deve ser independente de N. Isso significa
que a energia livre por partı́cula não depende do número de partı́culas no
sistema. A energia interna e a entropia também são grandezas extensivas.
Mostre que, se a divisão por N! não for feita, isso não ocorre para o gás ideal
clássico.
deixar 4cm

Resposta comentada
Se calculamos ZN como Z1N e calculamos F a partir da expressão (10.26)
obtemos:
Ferrada = −NκT (ln φq + ln V ) (10.31)

Verificamos a extensividade:
1
ferrada = lim Ferrada
N →∞ N
κT
= − lim ln Z1N
N →∞ N
  
1 3 m 3
= − lim NκT ln + ln κT + ln V
N →∞ N 2 2π~2 2
 
3 m 3
= κT ln + ln κT + ln N + ln v , (10.32)
2 2π~2 2

onde usamos a substituição V = Nv. Assim, vemos que a expressão (10.32)


depende de N, consequentemente Ferrada não é uma grandeza extensiva.
fim da atividade

Atividade Final

(Objetivos 1 a 5)
Para o gás ideal bidimensional, calcule:
(a) Z1 e ZN
(b) a energia interna
(c) a energia livre de Helmholtz
(d) a entropia
Resposta comentada
(a) Supondo que o gás esteja confinado numa região quadrada de área A = L2

231 CEDERJ
Aula 10 - Gás ideal monoatômico no regime clássico
Física Estatística e
Matéria Condensada

no plano xy, temos:


∞ X
X ∞
exp −βα n2x + n2y
 
Z1 = (10.33)
nx =1 ny =1
∞ X
X ∞
exp −βαn2x exp −βαn2y
 
=
nx =1 ny =1
" ∞
# ∞

X X
exp −βαn2x exp −βαn2y 
 
= 
nx =1 ny =1
" ∞
#2
X
exp −βαn2x

= .
nx =1

Usando a definição α ≡ ~2π 2 /2mL2 temos que


 
κT m
Z1 = A. (10.34)
2π~2
Podemos definir a concentração quântica em duas dimensões como φ2d q =
κT m/2π~2. Assim, a função de partição fica com a mesma forma da calculada
para o gás tridimensional, ou seja,

Z1 = φ2d
q A . (10.35)

A função de partição para N partı́culas também é dada por ZN = Z1N /N!.


(b)A energia interna pode ser calculada diretamente da função de partição:
1 ∂ZN
hEi = − = Eint . (10.36)
ZN ∂β
Calculando a derivada obtemos Eint = NκT .
(c) A energia livre de Helmholtz pode ser calculada a partir da expressão
F = limN →∞ (−κT ln ZN ). Obtemos:
  N 
Z1
F = lim −κT ln
N →∞ N!
= κT (N ln N − N − N ln Z1 )
= NκT ln N − ln A − 1 − ln φ2d

q
  2d  
φ
= NκT ln −1 (10.37)
φ2d
q

A concentração do gás adsorvido foi definida como φ2d = N/A. (d) Usamos
a definição de energia livre de Helmholtz:
Eint − F
F = Eint − T S ⇒ S = (10.38)
T

CEDERJ 232
Aula 10 - Gás ideal monoatômico no regime clássico
MÓDULO 1 - AULA 10

Usando as expressões já calculadas para F e Eint obtemos


" ! #
φ2d
q
S = Nκ ln +2 (10.39)
φ2d

Resumo
Nesta aula estudamos a estatı́stica de um gás de átomos não inter-
agentes, num regime de baixa densidade. Utilizamos para tal o modelo
quântico para uma partı́cula livre em uma caixa tridimensional. A partir
dos nı́veis de energia dessas partı́culas calculamos a função de partição de
uma partı́cula e usamos a correção de Boltzmann para calcular a função de
partição para N partı́culas indistinguı́veis. Essa correção gerou um modelo
de gás no qual a probabilidade de múltipla ocupação de nı́veis de energia
é desprezı́vel e cuja validade está restrita a gases em regime de baixa con-
centração, ou regime clássico. Para melhor definir esse regime usamos a
comparação com uma grandeza denominada concentração quântica. A par-
tir da função de partição calculamos a energia interna, a energia livre de
Helmholtz, a entropia e obtivemos a equação de estado para o gás ideal
clássico. O cálculo da função de partição foi feito considerando-se um es-
pectro contı́nuo de energia, uma aproximação válida quando tratamos de
volumes macroscópicos. Nessa aproximação foi necessário definir a densi-
dade de estados, ou densidade de orbitais, que dá o número de microestados
por intervalo de temperatura.

Informações sobre a próxima aula


Na próxima aula vamos uma nova grandeza termodinâmica, o potencial
quı́mico. Com essa definição poderemos trabalhar o gás ideal no regime
quântico.

Leitura complementar
• S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São
Paulo, EDUSP, capı́tulos 4 e 6.

• H. Moysés Nussenzvei, Curso de Fı́sica Básica 2 - Fluı́dos, Oscilações


e Ondas, Calor, Edgard Blücher, 2002.

233 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

Aula 11 - Potencial quı́mico e equilı́brio difu-


sivo
19 de Janeiro de 2015

Meta
Apresentar as condições de equilı́brio térmico e difusivo do ponto de
vista termodinâmico e estatı́stico.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Definir o potencial quı́mico a partir da condição de equilı́brio difusivo.

2. Calcular o potencial quı́mico do gás ideal no regime clássico.

3. Definir o potencial quı́mico total com contribuições internas e externas.

4. Calcular a grande função de partição ou soma de Gibbs para sistemas


com ocupação variável.

Pré-requisitos
Esta aula requer que você tenha familiaridade com vários conceitos de
Termodinâmica expostos em Fı́sica 2A, especialmente: equilı́brio térmico e
troca de calor (Aula 5) e entropia (Aula 12). Além disso, reveja a descrição
estatı́stica do equilı́brio térmico e a derivação da distribuição de Boltzmann,
na Aula 7.

Introdução
Até agora consideramos sistemas em que o número total de partı́culas
era mantido constante, com isso, as contribuições para a variação de energia
interna incluı́am apenas troca de calor e variação de volume, ou de qual-
quer outra variável extensiva pertinente ao problema. Vamos agora adi-
cionar a possibilidade de variar a energia interna pela variação do número

235 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

de partı́culas N. Primeiro usaremos abordagem Termodinâmica, ou seja,


descrevendo um sistema diretamente do ponto de vista macroscópico. Em
seguida vamos estender a discussão da distribuição de Boltzmann da Aula 7,
para incluir microestados com diferentes valores de N. Veremos na próximas
aulas que considerar a possibilidade de variar N tornará possı́vel o estudo
do gás ideal no regime quântico, por agora vamos simplesmente entender sua
associação com a troca de partı́culas.

Termodinâmica do equilı́brio térmico e difu-


sivo
Até agora usamos os seguintes pares de variáveis termodinâmicas: tem-
peratura-entropia, pressão-volume e momento magnético total-campo mag-
nético. Se observarmos esses pares veremos que diversas formas de equilı́brio
são obtidas com o fluxo de UMA variável provocado por variações de uma
outra variável. Vejamos um exemplo bem comum: dois sistemas a temperat-
uras diferentes, separados por uma parede diatérmica, trocam entropia (ou
calor, afinal d0Q = T dS) até que as temperaturas se igualem. Outro exem-
plo bem corriqueiro: dois sistemas a pressões diferentes separados por uma
parede móvel variam seus volumes (trocam volume) até que as pressões se
igualem. Aqui vamos definir uma variável de nome potencial quı́mico, tal que
dois sistemas com potenciais quı́micos diferentes, separados por uma parede
que permita apenas a passagem de partı́culas (parede rı́gida, fixa e isolante
térmica) troquem partı́culas até que os potenciais quı́micos se igualem. Us-
aremos a letra µ para designar essa nova variável. Com isso, a primeira lei
da Termodinâmica fica escrita como

dEint = T dS − P dV + µdN . (11.1)

Box de atenção
Note que µ tem dimensões de energia já que N é uma variável adimensional.
Fim do box de atenção

Considere que dois sistemas que em contato com um reservatório térmico


são interligados de forma a poderem trocar partı́culas, como esquematizado
na Figura 11.1. Suponha que os potenciais quı́micos das duas partes sejam
inicialmente diferentes, por exemplo suponha que µ2 > µ1 . Haverá troca de

CEDERJ 236
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

partı́culas entre os sistemas, na forma de uma corrente de partı́culas pelo


tubo que liga os dois sistemas, até que o equilı́brio difusivo seja estabelecido.
A condição que define o equilı́brio difusivo é µ1 = µ2 . A troca de partı́culas
entre os sistemas é daquele com o maior valor de µ para o que tem o menor
valor de µ, ou seja, da parte com µ2 para a com µ1 .

s 1
s 2
m1 m2
T T

Figura 11.1: Os sistemas S1 e S2 estão em contato térmico com um reser-


vatório à temperatura T e podem trocar partı́culas entre si através de uma
passagem entre os dois. Na figura supomos que µ2 > µ1 , por isso indicamos
uma passagem de partı́culas de S2 para S1 , até que o equilı́brio se estabeleça
com µ1 = µ2 .

Na Aula 7, vimos como escrever a energia livre de Helmoltz em função


de V e T e pudemos definir a pressão e a entropia em função de derivadas de F
em função do volume e da temperatura, respectivamente. Naquele momento
estávamos considerando sistemas com N constante, então não tinha sentido
considerar contribuições que ocorressem pela variação de N. Agora queremos
exatamente incluir essa possibilidade. Assim, vamos seguir um procedimento
análogo, incluindo a dependência em N. Temos
     
∂F ∂F ∂F
dF = dV + dT + dN . (11.2)
∂V T ,N ∂T V,N ∂N V,T

Mas F = Eint − T S, e

dF = dEint − d(T S)
= T dS − P dV + µdN − SdT − T dS
= −P dV − SdT + µdN , (11.3)

237 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

Comparando as expressões (11.3) e (11.2) podemos imediatamente identificar


 
∂F
µ= . (11.4)
∂N T ,V

Se várias espécies quı́micas estão presentes, a cada uma é associado um


potencial quı́mico. A condição de equilı́brio difusivo nesse caso é estabelecida
para cada espécie.
Com a equação (11.4) podemos calcular o potencial quı́mico do gás
ideal clássico a partir da expressão já encontrada para F , equação (10.26),
lembrando que φ = N/V . Temos
   
N
F (T, V, N) = NκT ln −1 ,
V φq

logo


∂F
µ(T, V, N) =
∂N T ,V
   
N 1
= κT ln − 1 + NκT
V φq N
 
φ
= κT ln . (11.5)
φq

Como já se podia esperar, quanto maior a concentração, maior o valor de µ.


Se interligarmos dois recipientes com um determinado gás à temperatura T ,
o que tiver maior concentração irá ceder partı́culas para o menos concentrado.

Atividade 1
(Objetivo 2)
Escreva o potencial quı́mico do gás ideal em função da pressão e da temper-
atura.
diagramador: deixar 5cm

Resposta comentada
A equação de estado do gás ideal é P V = NκT , ou seja, φ = N/V = P/κT .
Substituindo esta expressão para φ na equação (11.5) temos a expressão de-
sejada:  
P
µ(T, P ) = κT ln .
κT φq
Fim da atividade

CEDERJ 238
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

Podemos também escrever o potencial quı́mico a partir da entropia. Para


isso, reescrevemos a equação (11.1) como
1 P µ
dS = dEint + dV − dN . (11.6)
T T T
Supondo que S seja função de E, V e N, temos
     
∂S ∂S ∂S
dS = dE + dV + dN (11.7)
∂E N,V ∂V N,E ∂N E,V

Comparando as expressões (11.6) e (11.7) vemos que


 
µ ∂S
=− . (11.8)
T ∂N E,V

Potencial quı́mico interno e total


A passagem de partı́culas entre dois sistemas com diferentes valores
de potencial quı́mico pode ser afetada por diferenças de energia potencial
externas. Por exemplo, suponha que o gás da Figura 11.1 tenha partı́culas
carregadas. A corrente estabelecida entre as duas partes, devida a uma
diferença de densidade que gere uma diferença de potencial quı́mico, pode
ser cancelada pela aplicação de um campo elétrico. Por isso é conveniente
definir um potencial quı́mico interno e um externo, ou seja

µt = µint + µext . (11.9)

fazendo com que a condição de equilı́brio difusivo seja generalizada como

µ1t = µ2t . (11.10)

É importante ressaltar que a relação entre o sentido do fluxo e a diferença de


potencial quı́mico externo é a mesma, ou seja, na ausência da contribuição
interna, as partı́culas vão do maior potencial externo para o menor.
Atividade 2
(Objetivos 3)
Um modelo muito simplificado para a condução de seiva das raı́zes às folhas
de uma árvore considera que as raı́zes estão em contato com ar saturado de
vapor de água à concentração φ0, e as folhas em contato com ar saturado a
uma concentração αφ0 , onde α < 1. Considere que o vapor possa ser descrito
pela expressão (11.5), e que a temperatura seja uniforme e igual a T . Calcule
a altura h da árvore, em função de α e T .

239 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

deixar 5cm

Resposta comentada
O potencial quı́mico do vapor de água em contato com as folhas é menor do
que aquele nas raı́zes, já que a concentração de vapor nas folhas é menor.
Assim, a tendência da água é subir das raı́zes até as folhas. O campo grav-
itacional atua no sentido contrário, fazendo com que a água prefira descer.
Já que a energia potencial gravitacional afeta o fluxo de vapor, vamos incluı́-
la como uma contribuição externa ao potencial quı́mico. Para o cálculo de
µint vamos usar o modelo do gás ideal, expressão (11.5.) Assim, numa dada
altura z,  
φ
µt (z) = κT ln + mgz .
φq |{z}
| {z } µext
µint

No equilı́brio difusivo, a condição (11.10) leva a µt (h) = µt (0). Esta condição


só poderá ser satisfeita se considerarmos que a concentração varia com z.
Temos que φ(h) = αφ0 e φ(0) = φ0 logo a condição de equilı́brio fica
   
αφ0 φ0
κT ln + mgh = κT ln + mg 0 .
φq φq
| {z } | {z }
folhas raı́zes
Resolvendo para h temos
κT
h=− ln α .
mg
Fim da Atividade

Estatı́stica do equilı́brio térmico e difusivo


Vamos passar para a descrição microscópica estendendo a discussão
feita na Aula 7, agora para um sistema com T e µ determinados por acopla-
mento térmico e difusivo com um reservatório. Agora queremos calcular a
probabilidade Pj de que o sistema esteja num determinado microestado den-
tro de todos os possı́veis, considerando todos os macroestados, com todos os
valores de N pertinentes ao sistema. Essa probabilidade será proporcional à
multiplicidade do reservatório no macroestado compatı́vel com o microestado
j. Se j é um microestado do macroestado de energia ε, com N partı́culas,
temos então
Pj (ε, N) = c gR (E0 − ε, N0 − N) , (11.11)

CEDERJ 240
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

R
N0-N N
s
E0-e e
mT
m T

Figura 11.2: Um sistema S em contato com um reservatório R. A fronteira


de S permite que haja troca de energia e de partı́culas com o reservatório,
e o sistema combinado S + R está isolado do meio externo, sendo a energia
total, E0 , e o número total de partı́culas, N0 , constantes.

onde c é uma constante e gR é a multiplicidade do macroestado de energia


E0 − ε, com N0 − N partı́culas, do reservatório. Seguimos o mesmo pro-
cedimento da Aula 7, considerando que o reservatório é muito maior que o
sistema, o que significa que E0  ε e N0  N, e que podemos expandir ln Pj
em série, na forma

∂ln gR ∂ln gR
ln Pj (ε, N) = ln c+ln gR (E0 , N0)−ε −N +O(ε2, N 2 ) .
∂E E0 , N0 ∂N E0 , N0
(11.12)
Fazendo a identificação SR = κ ln gR , usando as definições (7.6) para a tem-
peratura (T = ∂E ∂S
), e (11.8) para µ/T , temos

ε NµR
ln Pj (ε, N) = ln C − +
κTR κTR
ou    
ε NµR
Pj (ε, N) = C exp − exp ,
κTR κTR
sendo TR e µR a temperatura e o potencial quı́mico do reservatório, re-
spectivamente, e C uma constante. Como no equilı́brio as temperaturas do
sistema e do reservatório serão iguais, o mesmo ocorrendo com os potenciais
quı́micos, podemos abolir o ı́ndice R. A constante de proporcionalidade deve
ser determinada por normalização, somando-se as probabilidades referentes
a todos os microestados possı́veis para S, o que inclui agora uma soma todos
os possı́veis valores de N. Temos
 ε   
X X j Nj µ
Pj (εj , Nj ) = C exp − exp = 1. (11.13)
j j
κT κT

241 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

Logo,
1
C=P  . (11.14)
εj  Nj µ
j exp − κT
exp κT

Definimos então   
X εj  Nj µ
Z≡ exp − exp (11.15)
j
κT κT
o que leva à definição de probabilidade para um dado microestado como
 
εj  Nj µ
exp − κT exp κT
Pj (εj , Nj ) ≡ . (11.16)
Z
A função Z é chamada grande função de partição ou soma de Gibbs.

box de curiosidade: Josiah Willard Gibbs (1839-1903) foi um fı́sico teórico


e matemático americano. Gibbs foi o principal formulador da termodinâmica
quı́mica e da fı́sico-quı́mica.
Seu doutorado em engenharia foi realizado
em Yale, onde passou toda sua carreira.
Sua tese foi um estudo sobre forma dos
dentes nas engrenagens dentadas. Em 1901
Gibbs recebeu a maior distinção cientı́fica da
época, conferida a um único cientista por
ano: a medalha Copley da Royal Society
of London pela aplicação da segunda lei da
termodinâmica à relação entre as energias
quı́mica, térmica e elétrica e a capacidade de
realização de trabalho.
Fim do box de curiosidade
 
N µ
Uma notação útil é definir a atividade λ ≡ exp κTj . Com essa definição a
grande função de partição fica
X  ε 
j
Z≡ λNj exp − (11.17)
j
κT

Já que agora N pode assumir diversos valores, faz sentido calcular o
número médio de partı́culas no sistema, numa dada temperatura T . No limite
termodinâmico, este será o valor observado macroscopicamente. Usando a
definição usual de média temos
1 X  ε 
j
hNi = Nj λNj exp − . (11.18)
Z j κT

CEDERJ 242
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

hNi também pode ser calculado pela derivada de Z:


1 dZ
hNi = λ (11.19)
Z dλ
De uma forma geral a média térmica em sistemas com T fixa e N variável é
definida como P 
Nj ε
j f(ε j , Nj )λ exp − κT
hfi ≡ . (11.20)
Z
Atividade 3
(Objetivo 4)
Considere um sistema que pode estar desocupado com energia zero ou ocu-
pado por uma partı́cula com energia zero ou energia ε. Calcule a ocupação
e a energia médias na temperatura T .
deixar 5cm

Resposta comentada
Para organizar nossos cálculos vamos montar uma tabela com os possı́veis
microestados.
j Nj εj termo na grande função de partição
1 0 0 1
2 1 0 λ
3 1 ε λ exp(−βε)

Assim,
Z = 1 + λ + λ exp(−βε) .
A ocupação média pode ser calculada a partir da expressão (11.18) ou (11.19)
λ + λ exp(−βε)
hNi =
Z
Usamos a equação (11.20) para calcular a energia média:
ελ exp(−βε)
hEi =
Z
Fim da Atividade

Conclusão
A possibilidade de existir troca de partı́culas com um reservatório, além
da troca de calor, faz com seja necessária a definição de mais uma variável

243 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

intensiva, o potencial quı́mico, para o estudo do comportamento térmico de


um sistema. Do ponto de vista da Termodinâmica isso significa um novo
termo na expressão matemática para a Primeira Lei, relativo à possibilidade
de se variar a energia interna de um sistema pela adição ou subtração de
partı́culas. Do ponto de vista da Fı́sica Estatı́stica, a variação de N significa
que devemos visitar todos os microestados obtidos para todas as possı́veis
energias e todos os possı́veis valores de N. Com essa extensão aparece nat-
uralmente uma nova normalização no cálculo da probalidade de ocupação
de um microestado, a grande função de partição ou soma de Gibbs. Assim
como a função de partição, a grande função de partição pode ser usada para
o cálculo das grandezas médias pertinentes ao sistema.

Atividade final
(Objetivos 1,2 e 4)
Quando se expõe um lı́quido a um gás numa pressão moderada, geralmente a
pressão do gás decresce, indicando que parte das moléculas do gás foram ad-
sorvidas na superfı́cie do lı́quido. Esse decréscimo depende da temperatura,
da natureza das substâncias presentes no meio e da pressão do gás. Experi-
mentalmente, as medidas nesses sistemas são feitas em termos da fração f de
moléculas de gás adsorvidas em função da pressão p do gás. A curva f(P ),
para uma dada temperatura é chamada isoterma de Langmuir.
Um processo muito estudado nesse contexto é a adsorção de oxigênio
pelo sangue, feito por uma parte inorgânica do grupo heme. Este grupo
consiste de um átomo de ferro ligado a quatro átomos de nitrogênio e esses,
por sua vez, ligados a um anel orgânico (figura 11.3(a)). Essa estrutura
em forma de cúpula aparece em algumas proteı́nas e funciona como uma
armadilha para oxigênio. Um exemplo é a mioglobina, proteı́na responsável
pela cor vermelha da carne crua, que tem um grupo heme.
O Fe central do grupo heme pode estar ligado ou não a uma molécula
O2 . Se tomamos uma quantidade macroscópica de mioglobina, uma certa
fração f de moléculas estará como grupo heme ocupado por O2 , sendo o
valor de f dependente da temperatura e da pressão de O2 .
(a) Calcule a grande função de partição (soma de Gibbs) para uma molécula
de mioglobina em termos da ocupação, ou não, de seu grupo heme por uma
molécula O2 . Use o refencial de energia:

MbO2 → grupo heme ocupado com um O2 → N = 1, E = ε

CEDERJ 244
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

O2
Fe
Fe
N
N
C C
C C
N C
N C
(a) (b)

Figura 11.3: (a) Parte da molécula de mioglobina, mostrando o grupo heme


em forma de cúpula. (b) Aqui o grupo heme está indicado em vermelho
pleas linhas mais grossas saindo do átomo de ferro. Quando desocupado ele
se apresenta mais fechado, a adorção do oxigênio tem o efeito de abrir o
grupo heme.

O2 +Mb em repouso → grupo heme desocupado → N = 0, E = 0

Especificamos o repouso porque não estamos lendo em conta qualquer con-


tribuição de energia cinética, apenas as energias envolvidas em ter a molécula
O2 capturada ou não.
(b) Considere os grupos heme oxigenados em equilı́brio com outros não ox-
igenados, todos em contato com um reservatório de moléculas de oxigênio
livres, tudo à temperatura T . Qual a condição de equilı́brio para o O2 livre
e o ligado ao grupo heme.
(c) Calcule a fração de grupos heme oxigenados.
(d) Use o potencial quı́mico do gás ideal clássico para mostrar que
P
f = . (11.21)
P0 + P
deixar 5cm

245 CEDERJ
Aula 11 - Potencial quı́mico e equilı́brio difusivo
Física Estatística e
Matéria Condensada

Resposta comentada
(a) Com o refencial de energia exposto acima, calculamos Z a partir de
(11.17):
Z = λ0 e0 + λ1 e−βε = 1 + λe−βε
(b) A condição de equilı́brio para O2 livre e o ligado ao grupo heme é

µ(O2 ) = µ(MbO2 ) ou λ(O2 ) = λ(MbO2)

(c) De acordo com (11.16) A fração de grupos heme oxigenados corresponde


a
λe−βε λe−βε
f= =
Z 1 + λe−βε
(d) Usando a expressão (11.5) temos
 
φ φ
µ = κT ln ⇒ λ=
φq φq
Podemos escrever f em termos da pressão de O2 usando que, para um gás
ideal, φ = P/κT . Obtemos
P
f = ,
P0 + P
onde P0 ≡ φq κT exp βε. Uma isoterma f(P ) de Langmuir pode ser traçada
para cada dado valor de P0 , um parâmetro que leva em conta a temperatura,
o tipo do gás (pelo valor de φq dele) e pelo tipo de reação (através do valor
de ε).

Resumo
Nesta aula aprendemos o conceito de potencial quı́mico necessário para
o estudo de sistemas em que o número de partı́culas é variável. Do ponto de
vista termodinâmico partimos da inclusão de mais um termo na expressão
matemática da Primeira Lei, correspondendo à possibilidade de se variar a
energia interna de um sistema pela adição ou subtração de partı́culas. O
equilı́brio difusivo entre dois sistemas, ou entre duas partes de um sistema,
ocorre quando ambos tem o mesmo potencial quı́mico. Se há variação de
potencial quı́mico, o fluxo de partı́culas ocorre do sistema de maior poten-
cial quı́mico para o de menor valor. Como muitas vezes a interação com
algum campo externo pode afetar o fluxo de partı́culas entre dois sistemas,
torna-se conveniente a definição do potencial quı́mico total, resultante da
soma dos potenciais quı́micos interno e externo. Do ponto de vista da es-
tatı́stica, aprendemos sobre a soma de Gibbs, ou função de granpartição Z,

CEDERJ 246
Aula 11 - Potencial quı́mico e equilı́brio difusivo
MÓDULO 1 - AULA 11

uma quantidade análoga à função de partição, que leva em conta todos os


possı́veis valores de N para o sistema. Assim como ocorrido com a função de
partição, podemos usar Z para calcular qualquer grandeza termodinâmica
do sistema.

Informações sobre a próxima aula


Na próxima aula vamos aplicar o que aprendemos agora para descrever
o gás ideal em qualquer regime, não só o clássico.

Leitura complementar
S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São
Paulo, EDUSP, seções 3.2 e 7.2.

247 CEDERJ
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

Aula 12 - O gás ideal quântico


19 de Janeiro de 2015

Meta
Tratar a estatı́stica do gás ideal sem restrições para concentração e
temperatura.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Desenvolver diferentes formas para o cálculo da grande função de partição


ou soma de Gibbs.

2. Reconhecer as diferenças entre as estatı́sticas de férmions e bósons.

3. Calcular a grande função de partição e as ocupações médias para gases


de férmions e bósons.

4. Obter o modelo para o gas ideal clássico como o limite de alta temper-
atura dos gases quânticos.

Pré-requisitos
Esta aula requer que você revise as Aulas 5 e 10 desta disciplina e a
Aula 19 de Introdução à Mecânica Quântica

Introdução
Na Aula 10 aprendemos a calcular a função de partição para o gás
ideal no regime clássico, ou de baixa concentração. Esse regime apareceu
naturalmente, como um efeito da correção de contagem, obtida pela divisão
da função de partição total por N!, que levou em conta a indistinguibili-
dade dos átomos. Sem essa aproximação não seria possı́vel calcular a função
de partição, mas a sua introdução inviabiliza o estudo dos gases em baixas

249 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

temperaturas ou altas concentrações, justo quando efeitos quânticos são rel-


evantes e visı́veis. Nesta aula usaremos os conceitos de potencial quı́mico
e grande função de partição para descrever a estatı́stica do gás ideal em
qualquer regime.

A grande função de partição para o gás ideal


 
P ε  N µ
A expressão (11.15) da Aula passada, Z ≡ j exp − κTj exp κTj ,
mostra a grande função de partição sendo indexada por um ı́ndice cor-
rido para os microestados, considerando todas as possibilidades de energia e
número de partı́culas. A menos que haja poucos microestados, essa forma de
calcular Z não é muito prática. Se as partı́culas são independentes, podemos
organizar a soma em termos de dois ı́ndices, um para os valores de energia,
outro para N, ou para as ocupações. Vamos ver como.

Variando E primeiro, depois N


Neste caso podemos reescrever Z como
X  ε 
j
Z = exp − λNj
j
κT
X X X
= λN g(E) exp[−βE(N)] = λN ZN , (12.1)
N E N

onde ZN é a função de partição usual, calculada para um sistema com N


P ε

partı́culas: ZN ≡ ε g(ε) exp − κT . O que fizemos foi primeiro considerar
todas as possibilidades de energia para um certo valor de N e depois levamos
em conta todos os valores de N pertinentes. Neste caso, é necessário que o
cálculo da função de partição para um dado N seja possı́vel.

Escrevendo a energia total em termos das ocupações


Aqui escrevemos a energia total de um dado microestado k como Ek =
P
j ηjk εj , onde as ηjk são as ocupações dos orbitais com energia εj no mi-
croestado k, ou seja, os ηjk nos dizem quantas partı́culas há com cada valor
de energia εj . Os valores de ηjk são variados de forma independente, sem
qualquer vı́nculo, gerando configurações com diversos valores de Nk . Defi-
P
nimos o número de partı́culas num dado microestado k como Nk ≡ j ηjk ,
sendo a soma sobre os orbitais. Cada termo gerado pode ser classificado de

CEDERJ 250
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

acordo com seu valor de Nk . Temos assim:


!
XX P X
ηjk
Z = ...λ j exp −β ηjk εj
η1k η2k j
YX
ηjk
= λ exp (−βηjk εj ) (12.2)
j ηjk
| {z }
Zj

P P
As somas η1k η2k sigificam somar sobre η11 , η12 . . . η21, η22 . . . . Neste caso
tomamos um orbital j, com energia εj , e o consideramos ocupado com ηj = 0,
1, 2 etc partı́culas. é como se tivéssemos vários sistemas, cada um com energia
εj , podendo estar ocupado com ηj partı́culas, e energia ηj εj , ou desocupado
com energia zero, de forma independente.
No caso do gás ideal, nosso problema é com o cálculo de ZN , por isso
vamos preferir este método. Nosso problema será calcular:
X
Zj = [λ exp (−βεj )]ηj . (12.3)
ηj

Usamos aqui uma notação simplificada, abandonando o ı́ndice referente ao


microestado. Neste caso j refere-se ao orbital considerado, sendo ηj os
possı́veis valores de ocupação e εj a energia do mesmo. Agora nos deparamos
com uma nova questão: quais são os valores de ηj possı́veis? A resposta é:
depende do tipo de partı́cula que estamos considerando, ou seja, se são bósons
ou férmions.
Atividade 1
(Objetivos 1)
Considere um sistema com dois nı́veis de energia não degenerados, com ener-
gia ε1 e ε2 , que podem ser ocupados por nenhuma, uma ou duas partı́culas.
(a) Classifique todas as possı́veis configurações do sistema, pela energia total,
ocupação de cada nı́vel, e número total de partı́culas.
(b) Escreva a grande função de partição para o sistema como uma soma cor-
rida sobre os macroestados, na forma (12.1) e na forma (12.2)
deixar 10cm

Resposta comentada
(a) Vamos chamar de η1 e η2 as ocupações dos orbitais com energia ε1 e ε2,
respectivamente. Podemos organizar todas as possibilidades de ocupação de
cada nı́vel numa tabela. Os microestados serão numerados pelo ı́ndice k.

251 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

Por exemplo, n1k é a ocupação do orbital com energia ε1 no microestado k e


assim por diante. A tabela com os valores pedidos é:

k η1k η2k Nk Ek
1 0 0 0 0
2 1 0 1 ε1
3 0 1 1 ε2
4 1 1 2 ε1 + ε2
5 2 1 3 2ε1 + ε2
6 1 2 3 ε1 + 2ε2
7 2 2 4 2ε1 + 2ε2
8 2 0 2 2ε1
9 0 2 2 2ε2

(b) Vamos usar a expressão (11.15) com as informações da tabela. Seguindo a


ordem das linhas para escrever Z pelo ı́ndice corrido dos microestados temos:
X
Z = λNk exp (−βEk )
k
= 1 + λ exp [−βε1] + λ exp [−βε2] + λ2 exp [−β(ε1 + ε2)]
+λ3 exp [−β(2ε1 + ε2)] + λ3 exp [−β(ε1 + 2ε2 )]
+λ4 exp [−β(2ε1 + 2ε2 )] + λ2 exp [−β2ε1] + λ2 exp [−β2ε2]

Agora vamos organizar pelas energias. Não temos uma expressão genérica
para ZN , então vamos calcular a função de partição para cada N possı́vel,
ou seja, N = 0, 1, 2, 3 e 4.

Z0 = 1 Z1 = exp [−βε1] + exp [−βε2]

Z2 = exp [−β(ε1 + ε2 )] + exp [−β2ε1] + exp [−β2ε2]

Z3 = exp [−β(2ε1 + ε2)] + exp [−β(ε1 + 2ε2 )]

Z4 = exp [−β(2ε1 + 2ε2 )]

Obtemos Z multiplicando cada ZN pelo λN e somando:

Z = λ0 Z0 + λ1 Z1 + λ2 Z2 + λ3 Z3 + λ4 Z4 ,

que leva à expressão anterior para Z.


Finalmente vamos organizar pelos orbitais. O produto sobre os orbitais
terá os termos j = 1 e j = 2. Cada Zj terá três termos, correspondendo ao

CEDERJ 252
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

orbital desocupado, ocupado por uma partı́cula e por duas partı́culas.


 
Z = 1 + λ exp [−βε1] + λ2 exp [−β2ε1] 1 + λ exp [−βε2] + λ2 exp [−β2ε2]
| {z }| {z }
Z1 Z2

Efetuando o produto teremos a expressão desejada.


Fim da atividade

Cálculo da grande função de partição e da


ocupação média para bósons e férmions
Vamos voltar ao gás ideal estudado na Aula 10. Esse sistema consiste
em um gás de partı́culas não interagentes com energias cinéticas dadas pela
~2 πn 2

expressão (10.1): εn = 2m L
. O orbital a ser considerado no cálculo de
Zj corresponde a uma dada escolha de nx , ny , nz para a função de onda da
partı́cula numa caixa, e uma dada projeção de spin. Vamos ver as diferenças
entre termos um gás de bósons ou de férmions.

Bósons
Neste caso, podemos ter qualquer número de partı́culas em um orbital,
ou seja, as ocupações ηj podem assumir qualquer valor. Definindo x ≡
P∞
λ exp (−βεj ) e usando que n=0 xn = 1−x1
, para x < 1, podemos calcular Zj
facilmente:

X 1
Zj = [λ exp (−βεj )]ηj = . (12.4)
ηj =0
1 − λ exp (−βεj )

A ocupação média de um dado orbital é



1 X
hηj i = ηj [λ exp (−βεj )]ηj (12.5)
Z j η =0
j

Usando a definição de x podemos escrever hηj i como


∞ ∞
1 X ηj
X
hηj i = ηj x = (1 − x) ηj xηj . (12.6)
Z j η =0 η =0
j j

Note que
∞ ∞ ∞
d X ηj X ηj −1 1X
x = ηj x = ηj xηj . (12.7)
dx η =0 η =0
x η =0
j j j

253 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

Logo
 
∞ ∞  
X
ηj d X
ηj  d 1 x
ηj x = x  x =x = . (12.8)
ηj =0
dx η dx 1−x (1 − x)2
j =0

Substuindo esse resultado na expressão para hηj i temos:


1 1
fBE = hηj i = = . (12.9)
λ−1 exp(βεj ) − 1 exp[β(εj − µ)] − 1
A expressão (12.9) recebe o nome de distribuição de Bose-Einstein.
Examinando a equação (12.9) vemos que quando tivermos λ−1 exp(βεj ) =
1, ou εj = µ, fBE → ∞. Também, para que a grande função de partição seja
convergente, devemos ter x ≡ exp[β(µ − εj )] < 1 , ou seja, µ < εj . Como
isso tem que acontecer para qualquer valor de εj , concluı́mos que µ deve ser
menor que o mais baixo valor de εj , que chamaremos de ε0. Quando µ → ε0 ,
teremos fBE (ε0) → ∞, ou seja a ocupação desse orbital será muito maior
que a dos outros, mesmo numa temperatura não nula. Essa concentração de
bósons no estado fundamental, para uma tempertautra não nula, recebe o
nome de condensação de Bose-Einstein e está por trás de fenômenos como
supercondutividade e superfluidez. Veja mais sobre esse assunto em

http://pt.wikipedia.org/wiki/Supercondutividade
e
http://pt.wikipedia.org/wiki/Superfluidez

Férmions
De acordo com o princı́pio da exclusão, não podemos ter dois ou mais
férmions no mesmo orbital, logo, só há dois termos neste caso: ηj = 0 ou
ηj = 1. Temos assim
Zj = 1 + λ exp(−βεj )
Para a ocupação
1
1 X 0 + λ exp (−βεj )
hηj i = ηj [λ exp (−βεj )]ηj =
Z j η =0 1 + λ exp(−βεj )
j

ou
1 1
fFD = hηj i = = (12.10)
λ−1
exp(βεj ) + 1 exp[β(εj − µ)] + 1
A expressão (12.10) recebe o nome de distribuição de Fermi-Dirac.
Vamos analisar o comportamento de (12.10). Observamos:

CEDERJ 254
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

Figura 12.1: Distribuição de Fermi-Dirac para T > 0 (curva em preto). As


áreas em azul mostram a diferença entre as distribuições para T = 0 e T > 0.

• T = 0 (β = ∞), ε > µ : neste caso exp[β(ε − µ)] → ∞, logo fFD → 0.

• T = 0 (β = ∞), ε < µ : agora exp[β(ε − µ)] → 0, logo fFD → 1.

• T > 0, ε = µ : fFD = 0,5.

Assim, para T = 0 temos uma função degrau, com descontinuidade em ε = µ.


O valor do potencial quı́mico em T = 0 recebe o nome de energia de Fermi.
Usaremos a notação εF para designá-lo já que também é a energia do último
orbital ocupado em T = 0. Temos então que, para T = 0, fFD (ε) = 1 para
ε < εF , indicando que todos esses orbitais estão preenchidos. Se ε > εF
temos fFD (ε) = 0, indicando que esses orbitais estão vazios. Para tempera-
turas diferentes de zero, fFD toma uma forma arredondada, nas vizinhanças
de εF . A Figura 12.1 mostra a forma da distribuição de Fermi-Dirac para
temperaturas não nulas (linha), e para T = 0. As áreas em cinza claro
mostram a diferença entre as distribuições para T = 0 e T > 0. A área cinza
claro superior corresponde aos orbitais esvaziados pelo aumento da temper-
atura. A área cinza claro inferior corresponde aos orbitais que passaram a
ser ocupados pelo aumento da temperatura.

255 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

Limite clássico
Na Aula 10, quando calculamos a função de partição para o gás ideal
clássico, não fizemos distinção entre bósons e férmions. é importante enten-
der porque isso não foi preciso. A questão toda é a divisão por N! no cálculo
de ZN a partir de Z1 . Como vimos, essa divisão foi introduzida para corrigir
a contagem de estados já que as partı́culas eram indistinguı́veis. Entretanto,
essa correção acabou por penalizar os estados com mais de uma partı́cula
no mesmo orbital, já que a probabilidade de ocorrência desses estados fi-
cou muito reduzida pela correção de contagem. Como consequência, o gás
resultante tem muitos orbitais vazios, e outros com apenas uma partı́cula,
tornando-se irrelevante a distinção entre férmions e bósons.
É possı́vel obter o resultado clássico a partir do quântico, se tomarmos
o limite correto. Como vimos na Aula 10, no regime clássico, φ  φq , onde φq

m 3/2
é a concentração quântica, definida na equação (10.17) como φq = κT ~2 2π
,
e φ é a concentração do gás definida como φ = N/V . Como µ = κT ln (φ/φq )
para o gás clássico, temos que λ = φ/φq para esse gás, ou seja, o gás clássico
tem λ−1  1 (ou λ  1) sempre. Assim, podemos fazer λ−1 exp(βεj ) ± 1 ≈
λ−1 exp(βεj ) e escrever a ocupação de um orbital de energia εj no regime
clássico como
fclássico = λ exp(−βεj ) . (12.11)
Note que fclássico  1 para todos os orbitais. A Figura 12.2 mostra uma
comparação entre as distribuições quântica e a clássica, mostrando clara-
mente a última como o limite único das distribuições de Fermi-Dirac e de
Bose-Einstein quando a temperatura for muito alta.
Atividade 2
(Objetivos 1, 2 e 3)
Um sistema hipotético tem apenas dois orbitais, um com energia zero e outro
com energia . Os orbitais não são degenerados e podem ser ocupados de
forma independente.
(a) Calcule a grande função de partição para ocupação por bósons e por
férmions.
(b) Calcule o número médio de partı́culas no sistema para ocupação por
férmions e por bósons.
(c) No caso de férmions, qual a probabilidade de o sistema estar ocupado por
duas partı́culas? E por uma?
(d) Generalize o resultado do ı́tem (a), considerando agora quatro orbitais,
com energias zero, 1, 2 e 3.

CEDERJ 256
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

Figura 12.2: Comparação entre as distribuições de Bose-Einstein, Fermi-


Dirac e clássica. Como pode ser observado, o regime clássico é o limite das
duas distribuições quânticas quando ε − µ  κT .

(e) Refaça o ı́tem (a) considerando que o orbital com energia  é triplamente
degenerado.
deixar 5cm

Resposta comentada
(a) Como o enunciado diz que os orbitais são independentes, temos Z =
Z0 Z .
Para férmions, cada orbital pode receber no máximo uma partı́cula:

          
0 0 1 0 0 0 1
Z = λ exp − + λ exp − λ exp − + λ exp −
κT κT κT κT
h   i
= [1 + λ] 1 + λ exp −
κT

Se você tem dúvidas, com 2 orbitais é possı́vel montar a tabela das con-
figurações:

257 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

0  E N
0 0 0 0
1 0 0 1
0 1  1
1 1  2

Usamos a tabela para escrever a grande função de partição. Pela ordem das
linhas da tabela temos:
     
Z = 1 + λ + λ exp − + λ2 exp − ,
κT κT

que é equivalente à expressão anterior.


Para bósons, um orbital pode ser ocupado sem restrições. Para um orbital
qualquer temos

∞   ∞ h   iN
X
N N X 1
Z = λ exp − = λ exp − = 

N =0
κT N =0
κT 1 − λ exp − κT

Assim,
 " #
1 1
Z= 

1−λ 1 − λ exp − κT

(b) Basta usar


dln Z
hNi = λ

(c) Examinando a tabela das configurações, vemos que para que o sistema
tenha duas partı́culas, devemos ter uma em cada orbital, correspondendo à
última linha. Ou seja

λ2 exp − κT
P (2) =
Z
Podemos ter N = 1 de duas maneiras. Temos então

λ + λ exp − κT
P (1) =
Z

(c) Basta fazer o produto com os 4 orbitais. O mesmo que acima, fazendo
1 = 2 = 3 = . (d) Sendo triplamente degenerado, o orbital com energia 
comporta-se como três orbitais independentes. No caso de férmions podemos
construir a tabela:

CEDERJ 258
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

0  E N
0 0 0 0
1 0 0 1
0 1  1
0 2 2 2
0 3 3 3
1 1  2
1 2 2 3
1 3 3 4

A expressão para Z pode ser trivialmente calculada seguindo-se as linhas da


tabela. Para bóson é só considerar que temos 3 orbitais com energia :

 " #3
1 1
Z= 

1−λ 1 − λ exp − κT

Fim da atividade

Conclusão
A estatı́stica do gás ideal em qualquer temperatura ou concentração
pode ser estudada se usamos o formalismo da grande função departição ou
soma de Gibbs, trabalhando com as ocupações dos diversos orbitais indi-
vidualmente. Neste caso, já que orbitais multiplamente ocupados não são
mais suprimidos pela correção de contagem, torna-se necessária a distinção
entre bósons e férmions, inerente ao tipo de spin da partı́cula. Desta forma
encontramos dois tipos de gases quânticos, de bósons e de férmions, com pro-
priedades bem distintas. Os dois gases têm comportamento idêntico quando
T → ∞, tendendo ao comportamento clássico nessa região de temperaturas.

Leitura complementar
S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São
Paulo, EDUSP, capı́tulo 8.

R. Eisberg e R. Resnick, Fı́sica Quântica, Editora Campus, capı́tulo 8.

259 CEDERJ
Aula 12 - O gás ideal quântico
Física Estatística e
Matéria Condensada

Atividade Final
(Objetivo 4)
Como podemos introduzir os graus de liberdade internos na grande função de
partição para o gás clássico? Suponha como exemploo um gás de moléculas
poliatÔmicas. Neste caso cada molécula tem a possibilidade de movimen-
tos de rotação e vibração além da translação do centro de massa. Os dois
primeiros movimentos referem-se a graus de liberdade internos à molécula
porque são referentes a propriedades estruturais da mesma. Supondo que
cada movimento é independente do outro, podemos escrever a energia total
de uma molécula como
ε = εj + εint ,

onde εj corresponde à energia cinética de translação do centro de massa, e


εint às energias de rotação e vibração.
Diagramador: deixe 5cm

Resposta comentada

Como vimos acima, a ocupação média no regime clássico é muito menor


que um, assim, ao calcular a grande função de partição, Zj , só precisamos
nos preocupar com os termos ηj = 0 e ηj = 1. Vamos considerar que para um
dado microestado de translação, todas as possibilidades de estados internos
possam ocorrer. Assim,
X X
Zj = λη Zη = 1 + λ exp[−β(εj + εint)] , (12.12)
η int

sendo a segunda soma sobre os ı́ndices pertinentes aos movimentos internos


da molécula. Definindo a função de partição para esses graus de liberdade
como
X
Zint = exp(−βεint)
int

CEDERJ 260
Aula 12 - O gás ideal quântico
MÓDULO 1 - AULA 12

podemos reescrever a equação (12.12) como

Zj = 1 + λZint exp(−βεj ) .

A probabilidade de que um dado estado translacional j seja ocupado,


independentemente dos movimentos internos da molécula é dada por

λZint exp(−βεj )
f(εj ) = ≈ λZint exp(−βεj ) .
1 + λZint exp(−βεj )

Comparando este resultado com a equação (12.11) vemos que a introdução


dos graus de liberdade internos tem o papel de alterar o valor de λ, ou µ.
Definimos λ∗ ≡ λZint , ou λ = λ∗ /Zint = φ/φq Zint . Assim, podemos usar os
resultados previamente obtidos para o gás monoatômico com λ∗ no lugar de λ.

Resumo
Nesta aula, aprendemos como usar a grande função de partição ou soma
de Gibbs para calcular as ocupações médias de gases quânticos organizando
a soma em termos de um produto sobre os orbitais. Desta forma foi possı́vel
tratar cada orbital como um sistema independente, o que simplificou enor-
mente o tratamento do problema. Vimos que a estatı́stica de férmions e
bósons é bem diferente devido ao princı́pio de exclusão de Pauli e o usamos
para calcular as ocupações médias para gases de férmions e bósons. Veri-
ficamos, também, que o limite de temperatura alta para ambos os gases é
dado pelo regime clássico, onde torna-se irrelevante o caráter fermiônico ou
bosônico da partı́cula porque as ocupações médias são sempre muito menores
que um.

Informações sobre a próxima aula


Na próxima aula, vamos aplicar a distribuição de Fermi-Dirac a um gás
de elétrons.

261 CEDERJ
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

Aula 13 - O gás de elétrons livres


19 de Janeiro de 2015

Meta
Apresentar as principais propriedades termodinâmicas do gás ideal de
férmions e com elas explicar a condutividade elétrica em metais.

Objetivos
Ao final desta aula, você deverá ser capaz de:

1. Identificar as principais propriedades do gás de elétron livres.

2. Definir a escala de temperaturas para o gás de elétrons.

3. Calcular diversas propriedades dos gases de elétrons no regime de baixas


temperaturas.

Pré-requisitos
Esta aula requer que você revise as Aulas 7, 10 e 11 desta disciplina.

Introdução
Na aula anterior, vimos como obter a ocupação de um orbital para sis-
temas de férmions e bósons e também algumas propriedades gerais dos gases
quânticos. Nesta aula, vamos estudar com mais detalhes o comportamento
termodinâmico do gás de férmions usando-o como modelo para os elétrons
de condução em um sólido metálico.
Uma corrente elétrica resulta do movimento de partı́culas carregadas
como resposta às forças que atuam sobre elas devido à aplicação de um campo
elétrico. Cargas positivas são aceleradas na direção do campo e negativas, na
direção oposta ao campo. Na maioria dos sólidos a corrente se deve ao movi-
mento de elétrons, que são denominados elétrons de condução. Além disso,
em materiais iônicos é possı́vel haver uma corrente devida ao movimento de

263 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

ı́ons. Nesta Aula, trataremos apenas da corrente de elétrons de condução.


Estudaremos esses elétrons considerando que os mesmos formam um gás de
férmions confinado ao volume V do sólido. Veremos que para este gás, a
temperatura ambiente é baixı́ssima e o caráter quântico do gás se manifesta
de diversas maneiras nessa temperatura.

O gás de elétrons livres


Um metal sólido consiste basicamente de ı́ons positivos formados pe-
los núcleos e orbitais mais internos dos átomos, praticamente fixos numa
rede cristalina, e elétrons quase livres formando o que chamamos de gás de
elétrons. Num metal tı́pico, como o lı́tio, a concentração de elétrons livres é
da ordem de φ(el) ≈ 1027 − 1028 elétrons/m3. Devido à reduzida massa do
elétron, a concentração quântica do gás de elétrons na temperatura ambiente
é bem menor que a de um gás de átomos. Seu valor é φq (el) ≈ 1027 m−3 ,
assim, a condição φ  φq não se aplica para o gás de elétrons à temperatura
ambiente, sendo este um gás essencialmente fermiônico nessa temperatura.
Considerar esses elétrons como livres é uma aproximação, já que eles
sofrem atração dos ı́ons positivos da rede. Essa interação é muito importante
no entendimento das propriedades especı́ficas de um determinado material,
e certamente a simetria da rede cristalina tem papel fundamental nessa in-
teração. O estudo do gás com interação é bastante complicado e está fora
do escopo desta disciplina, entretanto, veremos que o gás de elétrons livres
já nos traz um entendimento bastante bom do coportamento dos metais.

Propriedades da distribuição de Fermi-Dirac


Começamos lembrando que um orbital é uma solução da equação de
Schrödinger para uma partı́cula, no nosso caso significa uma dada escolha
de (nx , ny , nz ) para a parte de energia cinética e um valor da projeção de
spin. Como estamos tratando de elétrons que tem spin s = 1/2, as projeções
possı́veis são ms = ±1/2.
Na aula passada vimos que num gás de férmions a ocupação média do
orbital de energia ε é dada pela distribuição de Fermi-Dirac, que tem a forma
1 1
fFD(ε) = = . (13.1)
λ−1 exp(βε) + 1 exp[β(ε − µ)] + 1
Como a ocupação deve ser um número entre 0 e 1, por causa do princı́pio da

CEDERJ 264
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

exclusão, fFD(ε) pode ser encarada como a probabilidade de que um orbital


com energia ε esteja ocupado. Para T = 0, todos os orbitais com ε ≤ µ ou
ε ≤ εF tem fFD = 1, portanto estão preenchidos. Os orbitais com ε > µ,
ou ε > εF têm fFD = 0, estando desocupados nessa temperatura. Este é o
estado de mais baixa energia para o sistema, é o seu estado fundamental.
À medida que a temperatura aumenta, a energia total deve aumentar
devido à passagem de elétrons para orbitais de maior energia. Os elétrons
que têm ε . εF são afetados primeiro, já que logo acima deles há orbitais
vazios, prontos para serem ocupados. Promover um elétron com ε  εF
requer muita energia, já que os orbitais vazios têm ε > εF . Assim, para uma
temperatura não nula, mas baixa, a distribuição de Fermi-Dirac só é apreci-
avelmente diferente da com T = 0 nas vizinhanças da energia de Fermi εF .
A largura da região afetada é da ordem de κT . Para qualquer temperatura,
quando ε = µ(T ), fFD = 0,5. Esse valor de energia é denominado nı́vel de
Fermi. É importante não confundir o nı́vel de Fermi com a energia de Fermi.
O primeiro é um valor que depende da temperatura, o segundo não, é uma
propriedade do gás de elétrons a T = 0. Como a distribuição de Fermi-
Dirac à temperatura ambiente é muito semelhante à distribuição em T = 0,
o valor da energia de Fermi é uma grandeza relevante para a caracterização
dos metais.

Atividade 1
(Objetivo 1)
Mostre que a distribuição de Fermi-Dirac é simétrica com relação ao nı́vel de
Fermi.
Deixar 5cm

Resposta comentada
Calculamos a distribuição num ponto de energia ε = µ + δ. Temos
1 1
fFD (µ + δ) = =1− = 1 − fFD(µ − δ)
exp(βδ) + 1 exp(−βδ) + 1

265 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

Note que:

• fFD (µ + δ) = probabilidade do orbital com energia ε = µ + δ estar


ocupado.

• fFD (µ − δ) = probabilidade do orbital com energia ε = µ − δ estar


ocupado.

• 1 − fFD(µ − δ) = probabilidade do orbital com energia ε = µ − δ estar


vazio.

Logo, a simetria é entre os buracos e os elétrons excitados.


Fim da atividade

Atividade 2
(Objetivo 1)
Estime a largura da região 2δ afetada pelo aumento de temperatura na dis-
tribuição de Fermi-Dirac. Considere uma aproximação linear para a dis-
tribuição na região de interesse, como indicado na figura abaixo. A reta é a
tangente no ponto ε = µ.
m-d

0,5

m m+d

deixar 5cm

Resposta comentada
Vamos calcular a equação dessa reta, que aproxima para 2δ a largura da
região arrendondada.
ε−µ
 
dfFD 1 1
=− exp 2
dε κT κT ε−µ
 
exp κT + 1
Assim, fFD
0
(µ) = −1/4κT . Seguindo a notação da figura, podemos calcular
o valor de δ. Obtemos δ = 2κT . Assim, a largura da região afetada pela

CEDERJ 266
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

eF

Figura 13.1: Preenchimento dos nı́veis de energia num sistema unidimen-


sional, a T = 0.

temperatura é 4κT .
Fim da atividade

O gás de elétrons a T = 0

O estado fundamental do gás de N elétrons pode ser obtido se preencher-


mos todos os orbitais, a partir de baixo, até que o último elétron seja colo-
cado. A figura 13.1 ilustra esse processo num gás unidimensional com 12
elétrons. Neste caso os nı́veis são não degenerados (tem multiplicidade igual
a um) e podem acomodar dois elétrons, um com ms = +1/2, outro com
ms = −1/2 em cada um.
Num sistema de maior dimensão teremos que levar em conta a multiplici-
dade dos nı́veis de energia. Por exemplo, no gás tridimensional, o nı́vel de
energia com n2 = 6 tem três orbitais degenerados, com (nx , ny , nz ) iguais a
(2, 1, 1), (1, 2, 1) e (1, 1, 2), podendo acomodar 6 elétrons no total. Determi-
nar a energia de Fermi num sistema bi ou tridimensional fica complicado,
porque não temos uma expressão que nos diga a degenerescência de cada
nı́vel. Para calcular a multiplicidade desses nı́veis vamos novamente usar a
aproximação de que o volume é macroscópico e portanto a separação entre os
nı́veis é muito pequena. Com isso, passamos a usar a densidade de estados
(ou densidade de orbitais) para fazer essa contagem.
Vamos lembrar as definições apresentadas nas Aula 4 e 10. Para um

267 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

gás tridimensional, a energia de um orbital é:


 2  
~ π 2 2
nx + n2y + n2z ,

ε=
2m L
O número de orbitais com energia entre ε e ε + dε é

dN (ε) = D(ε)dε

Essa expressão define a densidade de estados, ou orbitais, D(ε) dada por


 3/2
V 2m
D(ε) = 2 ε1/2 . (13.2)
4π ~2
Agora podemos calcular a energia de Fermi. Começamos impondo que a
soma da ocupação média sobre todos os orbitais seja N. Na abordagem
contı́nua temos:
Z ∞
N = 2 fFD (ε)D(ε)dε
0
Z εF Z ∞ 
= 2 1 D(ε)dε + 0 D(ε)dε
0 εF
 3/2 Z εF
V 2m
= 2 ε1/2dε
4π 2 ~2 0
 3/2
V 2m 2 3/2
= ε (13.3)
2π 2 ~ 2 3 F
O fator 2 vem das duas projeções de spin. Finalmente, para o gás tridimen-
sional de elétrons, temos assim
2/3
~2 3π 2N

εF = ≡ κθF , (13.4)
2m V
onde θF é um parâmetro com dimensão de temperatura, denominado tem-
peratura de Fermi. A definição θF permite estabelecer uma referência de
temperatura. Por exemplo, se um sistema tem θF muito maior que a tem-
peratura ambiente, significa que ele deve ser descrito pelo modelo quântico
nessa temperatura. A tabela 13.12 mostra alguns valores de εF e θF .
Pode-se imediatamente concluir que para esses metais a temperatura
ambiente é uma temperatura bastante baixa, estando a distribuição de Fermi
pouco modificada com relação a forma em T = 0. O mesmo ocorre com todos
os metais.
Atividade 3
(Objetivo 3)
Qual a energia interna do gás de elétrons a T = 0?

CEDERJ 268
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

metal εF (eV) θF (104 K)


Li 4,7 5,5
Na 3,1 3,7
K 2,1 2,4
Rb 1,8 2,1
Cs 1,5 1,8
Cu 7,0 8,2
Ag 5,5 6,4
Au 5,5 6,4

Tabela 13.12: Valores da temperatura de Fermi para alguns metais.

Deixar 5cm

Resposta comentada
Este cálculo é semelhante ao da energia de Fermi. Devemos somar a energia
de todos os orbitais ocupados. Temos:
Z ∞
Eint = 2 εfFD (ε)D(ε)dε
0

Para T = 0:

Z εF
Eint = E0 = 2 εD(ε)dε
0
 3/2 Z εF
V 2m
= 2 2 ε3/2dε
4π ~2 0

Efetuando a integral e ordenando as constantes, obtemos:


3
E0 = NεF .
5
Fim da atividade

Dependência do potencial quı́mico com a temperatura


A expressão (13.3) é especı́fica para T = 0. Numa temperatura qual-
quer devemos escrever
Z ∞  3/2 Z ∞
V 2m
N =2 fFD (ε)D(ε)dε = 2 2 fFD (ε)ε1/2dε . (13.5)
0 4π ~ 2
0

269 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

Em princı́pio podemos obter µ(T ) calculando a integral e invertendo a função.


Infelizmente essa integral não é nada simples de resolver, ela requer uma
solução em série, válida para temperaturas baixas. Foge do escopo desta
disciplina entrar nos detalhes desse cálculo, devido a Sommerfeld. Ele pode
ser visto na referência citada no fim da aula.
Os dois primeiros termos da expansão de Sommerfeld levam a:
"  2 #
π2 T
µ(T ) ≈ εF 1 − . (13.6)
12 θF

O fato de µ diminuir com a temperatura num sistema tridimensional


podia ser previsto com uma análise qualitativa. A Figura 13.2 mostra o
integrando de (13.5), fFD(ε)ε1/2 para T = 0 e T > 0, supondo que o potencial
quı́mico não dependa da temperatura. Para T = 0 fFD (ε) = 1 até ε = εF
e zero depois disso. Assim, o número total de partı́culas é dado pela área
compreendida pela curva ε1/2 e pela reta ε = εF . Para T > 0 o integrando
é uma curva que passa por um máximo e vai a zero quando ε → ∞. Neste
caso, a área total sob a curva corresponde ao número total de particulas.
Para passar de uma área para outra, devemos retirar a área cinza escuro
superior e adicionar a área cinza claro inferior. Como a segunda área é
maior, terı́amos um valor de N maior em T > 0, o que é claramente um
absurdo. O erro desse raciocı́nio está na suposição de que µ não varia com a
temperatura. A área cinza claro é maior que a cinza escuro porque nela fFD
está sendo multiplicada por valores maiores de ε. Se admitimos que µ possa
variar com a temperatura, diminuiundo neste caso, a curva para T > 0 seria
toda deslocada para valores menores de energia compensando as duas áreas
e levando ao mesmo valor de N.
Atividade 4
(Objetivo 2)
De que forma a dimensão afeta o comportamento de µ(T )?
deixar 5cm

Resposta comentada
A dimensionalidade do sistema afeta a forma de D(ε). Em d = 3 D(ε) ∼ ε1/2,
sendo uma função crescente de ε. Por isso a área cinza claro ficou maior,
fFD (ε) está sendo multiplicada por um número maior quanto maior for a
energia.
Num sistema bidimensional D(ε) não depende de ε (veja a Atividade

CEDERJ 270
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

Figura 13.2: Comportamento do integrando em (13.5) para T = 0 e T > 0,


supondo que o potencial quı́mico não dependa da temperatura.

2 da Aula 8), logo esse efeito não aparece, e µ deve ser independente da
temperatura.
Em d = 1, temos D(ε) ∼ ε−1/2 (Verifique!), logo, o comportamento é o
inverso do caso tridimensional, ou seja, µ deve aumentar com a temperatura.
Fim da atividade

Calor especı́fico do gás de elétrons


A energia interna do sistema, numa temperatura qualquer, pode ser
calculada a partir da expressão:

∞  3/2 Z ∞
V 2m
Z
Eint = 2 εfFD(ε)D(ε)dε = 2 2 fFD(ε)ε3/2dε . (13.7)
0 4π ~2 0

Assim como no cálculo de µ deve-se proceder com a expansão do integrando


e integração de cada termo. O cálculo realizado por Sommerfeld leva a
"  2 #
3 5π 2 T
Eint ≈ NεF 1 + (13.8)
5 12 θF

o que implica em
π2 T
cel = κ .
2 θF

271 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

O rótulo“el”ajuda a lembrar que essa é a contribuição dos elétrons de con-


dução. No sólido como um todo quando entregamos uma certa quantidade
de calor, parte também irá para os fônons, ou seja, para excitar vibrações
nos ı́ons que estão presos na rede cristalina. Como vimos na Aula 9, o
calor especı́fico vibracional é proporcional a T 3 para temperaturas baixas.
Juntando os dois termos, temos para o sólido metálico a baixas temperaturas

c = γT + AT 3 (13.9)

A expressão (13.9) tem razoável concordância com dados experimentais, con-


siderando sua simplicidade. A tabela mostra uma comparação entre valores
experimentais para γ, tirados por ajuste da equação (13.9) a dados experi-
mentais, e o valor previsto pelo modelo de elétrons livres que acabamos de
ver.

metal γexp(mJ/mol.K2) γFD (mJ/mol.K2)


Li 1,63 0,75
Na 1,38 1,14
K 2,08 1,69
Rb 2,41 1,97
Cs 3,20 2,36
Cu 0,695 0,50
Ag 0,646 0,65
Au 0,729 0,654

Tabela 13.13: Comparação entre valores teóricos e experimentais para γ

Atividade 5
(Objetivos 2 e 3)
O que a teoria clássica prevê para a contribuição eletrônica para o calor
especı́fico de metais? Compare com o resultado previsto pelo modelo de
Fermi-Dirac.
deixar 5cm

CEDERJ 272
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

Resposta comentada
Na teoria clássica (equipartição) também devemos considerar que há duas
contribuiçõespara o calor especı́fico, do gás eletrônico e das vibrações da
rede. Assim, escrevemos
c = cel + cvib .

Na Aula 9 vimos que previsão clássica para a parte de vibração é cvib = 3κ.
Quanto ao gás de elétrons, a teoria clássica não distingue o tipo de partı́cula,
então temos o mesmo valor de todos os gases de partı́culas pontuais, ou seja,
cel = 3κ/2. Assim,
9
c = κ ≈ 37 J/mol.K
2
Para comparação, usamos o resultado para a prata. Pela tabela γ =
0, 65 mJ/mol.K2, logo, à temperatura ambiente

cFD ≈ (0, 65 mJ/mol.K2 )320 K = 0, 208 J/mol.K

Vemos assim que o resultado previsto pelo modelo clássico é muito maior que
o observado experimentalmente e previsto pelo modelo de Fermi-Dirac.
Fim da atividade

Atividade 6
(Objetivos 1 e 3)
Use seu conhecimento sobre a forma da distribuição de Fermi-Dirac para
encontrar uma expressão qualitativa para o calor especı́fico eletrônico.
deixar 5cm

Resposta comentada
Vamos supor que estamos num regime de baixa temperatura, que é o aplicável
aos elétrons de condução à temperatura ambiente. A região de fFD (ε) afetada
por um aumento de temperatura é da ordem de κT . Se acomodarmos N
átomos até ε = εF , deveremos ter N 0 ≈ κT N/εF elétrons na região afetada.
A energia desses elétrons é aproximadamente ≈ N 0 κT , logo

N
E0 = (κT )2 ,
εF
levando a c ∼ T .
Fim da atividade

273 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

Estrutura de bandas em sólidos


Até este ponto não temos como distinguir entre materiais condutores
e isolantes elétricos. Para entender a origem dessa diferença e justificar a
aplicação do modelo de um gás aos elétrons de um metal, precisamos aprender
um pouco sobre a formação das bandas de energia, que aparecem pela mistura
de orbitais de átomos adjacentes na rede cristalina.
Cada átomo individual tem nı́veis de energia discretos que são organi-
zados na forma de camadas e subcamadas. As camadas são designadas por
números inteiros (1, 2, 3, etc) e as subcamadas por letras (s, p, d, f, etc).
Para cada subcamada s, p, d e f, existem, respectivamente, um, três, cinco e
sete estados, cada um podendo ser ocupado por até dois elétrons devido ao
princı́pio de exclusão de Pauli. Na maioria dos casos os elétrons ocupam os
orbitais de mais baixa energia.
Vamos extrapolar a descrição do átomo isolado ao conjunto de N átomos
de um sólido, considerando que N é, pelo menos, da ordem do número de
Avogrado. Se a distância entre átomos é suficientemente grande, cada átomo
mantém sua configuração individual. Quando os átomos são aproximados,
por exemplo para formar um sólido, os elétrons de cada átomo sofrem in-
teração com os elétrons de átomos vizinhos também. Essa interação é tal que
cada estado atômico se subdivide numa série de N estados com diferenças
de energia muito pequenas, formando o que chamamos bandas de energia.
A extensão dessa subdivisão depende da separação interatômica e começa a
partir das camadas mais externas já que elas são as primeiras a serem per-
turbadas no processo de aproximação dos átomos. A figura 13.3 mostra um
diagrama esquemático desse processo para N = 12 átomos. Dentro de cada
banda os estados são discretos, mas a diferença de energia entre eles é muito
pequena, especialmente para valores macroscópicos de N. Na configuração
de equilı́brio de um determinado sólido é possı́vel que a formação de ban-
das não ocorra para as subcamadas atômicas mais internas. Como ilustrado
na figura 13.4. É importante notar que entre as bandas pode ocorrer um
espaço ou gap de energia. O valores de energia nos gaps não são acessı́veis
aos elétrons.
O número de estados em cada banda é igual ao total de estado dos N
átomos que contribuiram para ela. Por exemplo, uma banda s terá N estados
e uma banda p terá 3N estados. Cada estado da banda pode ser ocupado
por dois elétrons. Além disso, cada banda vai conter os elétrons que vieram
da subcamada correspondente. Por exemplo, uma banda 4s do sólido conterá

CEDERJ 274
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

estado 2s
banda 2s
(12 estados)

estados individuais

estado 1s
banda 1s
(12 estados)

separação interatômica

Figura 13.3: Diagrama esquemático da energia eletrônica em função da sep-


aração interatômica para um agregado de 12 átomos (N = 12). Com a
aproximação dos átomos, cada um dos estados eletrônicos 1s e 2s se divide
em 12 estados, formando uma banda.

os elétrons 4s dos átomos isolados. Como resultado, teremos bandas vazias,


completamente cheias e parcialmente cheias.
As propriedades elétricas de um sólido são uma consequência dessa es-
trutura de bandas e do preenchimento delas. A banda que contém os elétrons
de maior energia é denominada banda de valência; a banda de condução é a
próxima banda de energia, que é, na maior parte dos caso, desocupada.
Existem quatro tipos principais de estrutura de bandas em T = 0 K
(veja a figura 13.5):

• A banda de valência é parcialmente ocupada com elétrons até ε = εF .


Este é o caso de metais como o cobre. Cada átomo isolado de cobre
tem 1 elétron 4s. Num sólido com N átomos de Cu a banda 4s pode
acomodar 2N elétrons, assim ela estará até a metade apenas.

• A banda de valência é completamene cheia mas existe uma superposição


entre ela e a banda de condução. Este é o caso do magnésio. Cada
átomo de Mg isolado tem 2 elétrons de valência 3s. Quando o sólido é
formado, as bandas 3s e 2p se superpõem

• Os dois últimos tipos correspondem à mesma estrutura de bandas:

275 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

banda de energia

gap

energia
banda de energia

energia
separação
interatômica
separação
de equilíbrio

Figura 13.4: (a) Representação convencional da estrutura de bandas para um


material sólido, na sua configuração de equilı́brio. (b) Energia eletrônica em
função da separação interatômica para um agregado de átomos, indicando
como a estrutura do ı́tem (a) aparece.

banda de valência completa e banda e condução separada e desocu-


pada. Se a separação, ou gap de energia, for grande, tipicamente maior
que 2 eV o material é um isolante elétrico. Se o gap de energia for
menor que 2 eV o material é semicondutor.

Relação entre a condução elétrica e a estrutura de


bandas
Como vimos na descrição do gás de elétrons livres, apenas elétrons com
energia acima de εF podem ter sua energia aumentada, por exemplo, pela
aplicação de um campo elétrico. Em metais com estrutura de banda como as
(a) e (b) mostradas na figura 13.5 existem estados desocupados logo acima de
εF , assim pouca energia é necessária para excitar os elétrons próximos ao nı́vel
de Fermi. Normalmente a energia proveniente de um campo elétrico é sufiente
para excitar muitos elétrons, o que acaba levando a uma condutividade alta.
No caso das estruturas (c) e (d) da figura 13.5 não há estados vazios
próximos ao topo da banda de valência. Para se tornar livre um elétrons
precisa receber energia suficiente para superar o gap entre as bandas de
valência e condução. Nos materiais classificados como semicondutores, o gap
é pequeno e até mesmo a energia térmica à temperatura ambiente é capaz

CEDERJ 276
Aula 13 - O gás de elétrons livres
MÓDULO 1 - AULA 13

banda de
condução banda de condução
banda de condução vazia
vazia vazia
banda de condução
vazia

energia
gap de energia
gap de energia
gap de energia
banda de
valência
estados desocupados cheia banda de banda de
banda de valência valência
valência cheia cheia
estados ocupados

(a) (b) (c) (d)

Figura 13.5: Várias possı́veis estruturas de banda em sólidos a T = 0 K.


(a) Estrutura de um metal com o cobre em que a banda de valência é par-
cialmente ocupada. Neste caso há estados de energia disponı́veis logo acima
dos estados ocupados, na mesma banda. (b) No caso de um metal como
o magnésio, existe uma superposição da banda de valência completa com
banda de condução, vazia. (c) Estrutura de bandas para um isolante elétrico
tı́pico. A banda de valência é completamente preenchida e existe um gap de
energia relativamente grande (> 2 eV) entre ela e a banda de condução. (d)
Nos materiais semicondutores tem a estrutura de bandas semelhante à dos
isolantes, mas o gap de energia é pequeno (< 2 eV).

de promover elétrons à banda de condução. Num material isolante isso n eo


é possı́vel.

Leitura complementar
S. R. A. Salinas, Introdução à Fı́sica Estatı́stica, primeira edição, São
Paulo, EDUSP, capı́tulos 8, 9 e 10.

Resumo
Nesta aula, aprendemos algumas propriedades de gases de bósons e
férmions. Os férmions apresentam um estado fundamental de alta energia
devido à necessidade de limitar a população dos orbitais. Para temperat-
uras muito baixas, sistemas de férmions tem praticamente todos os orbitais
ocupados até uma energia próxima à energia de Fermi, e praticamente todos
vazios acima dessa energia. O efeito de aumento de energia por aumento de
temperatura se dá basicamente devido a férmions nos últimos orbitais ocu-
pados, levando a um valor de calor especı́fico muito baixo quando comparado

277 CEDERJ
Aula 13 - O gás de elétrons livres
Física Estatística e
Matéria Condensada

ao do gás clássico. Já o gás de bósons tem um comportamento muito distinto


de um gás de férmions. A proximidade do potencial quı́mico do orbital fun-
damental faz com que a ocupação do mesmo seja macroscópica para certas
temperaturas. Os bósons que populam esse orbital formam o que chamamos
de condensado de Bose-Einstein. Os fenômenos da supercondutividade e
superfluidez tem como base a existência desse condensado.

CEDERJ 278