Você está na página 1de 169

This is page i

Printer: Opaque this

Contents

1 Teoria de Drude para os Metais 3


1.1 Hipóteses Básicas do Modelo de Drude . . . . . . . . . . . . 4
1.2 Condutividade Elétrica DC de um Metal . . . . . . . . . . . 7
1.3 Efeito Hall e Magnetorresistência . . . . . . . . . . . . . . . 12
1.4 Condutividade Elétrica AC de um Metal . . . . . . . . . . . 15
1.5 Condutividade Térmica de um Metal . . . . . . . . . . . . . 20
1.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2 Teoria de Sommerfeld de Metais 29


2.1 Propriedades do Estado Fundamental do Gás de Elétrons . 31
2.2 Propriedades Térmicas do Gás de Elétron Livre: A Dis-
tribuição de Fermi-Dirac . . . . . . . . . . . . . . . . . . . . 38
2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações
da Distribuição de Fermi-Dirac . . . . . . . . . . . . . . . . 41
2.4 Teoria de Sommerfeld da Condução em Metais . . . . . . . 48
2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3 Redes Cristalinas 57
3.1 Rede de Bravais . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 Redes Infinitas e Cristais Finitos . . . . . . . . . . . . . . . 59
3.3 Mais Ilustrações e Exemplos Importantes . . . . . . . . . . 60
3.4 Convenções . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.5 Número de Coordenação . . . . . . . . . . . . . . . . . . . . 62
3.6 Célula Unitária Primitiva . . . . . . . . . . . . . . . . . . . 62
ii Contents

3.6.1 Célula Unitária; Célula Unitária Convencional . . . 63


3.6.2 Células Primitivas de Wigner-Seitz . . . . . . . . . . 63
3.7 Estrutura Cristalina; Rede com uma Base . . . . . . . . . . 64
3.8 Alguns Exemplos Importantes de Estruturas Cristalinas e
Redes com Base . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.8.1 Estrutura do Diamante . . . . . . . . . . . . . . . . 65
3.8.2 Estrutura Hexagonal com Agrupamento Compacto . 65
3.8.3 Outras Possibilidades de Empacotamento Compacto 66
3.8.4 Estrutura do Cloreto de Sódio . . . . . . . . . . . . 67
3.8.5 Estrutura do Cloreto de Césio . . . . . . . . . . . . . 67
3.8.6 Estrutura do Sulfeto de Zinco (Zincblende) . . . . . 67
3.9 Outros Aspectos das Redes Cristalinas . . . . . . . . . . . . 67
3.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4 Rede Recíproca 71
4.1 Definição de Rede Recíproca . . . . . . . . . . . . . . . . . 71
4.2 Rede Recíproca é uma Rede de Bravais . . . . . . . . . . . 72
4.3 Recíproca da Rede Recíproca . . . . . . . . . . . . . . . . . 73
4.4 Exemplos Importantes . . . . . . . . . . . . . . . . . . . . . 74
4.5 Volume da Célula Primitiva da Rede Recíproca . . . . . . . 74
4.6 Primeira Zona de Brillouin . . . . . . . . . . . . . . . . . . 75
4.7 Planos de Rede . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.8 Índices de Miller dos Planos de Rede . . . . . . . . . . . . . 76
4.9 Algumas Convenções para Direções Específicas . . . . . . . 78
4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5 Determinação de Estruturas Cristalinas por Difração de


Raio-X 81
5.1 Formulação de Bragg da Difração de Raio-X por um Cristal 82
5.2 Formulação de von Laue da Difração de Raio-X por um Cristal 83
5.3 Equivalência das Formulações de Bragg e von Laue . . . . . 84
5.4 Geometrias Experimentais Sugeridas pela Condição de Laue 86
5.5 Construção de Ewald . . . . . . . . . . . . . . . . . . . . . . 86
5.6 Difração por uma Rede Monoatômica com Base; Fator de
Estrutura Geométrico . . . . . . . . . . . . . . . . . . . . . 88
5.6.1 Rede Cúbica de Corpo Centrado Considerada como
Cúbica Simples com Base . . . . . . . . . . . . . . . 89
5.6.2 Rede Monoatômica do Diamente . . . . . . . . . . . 90
5.7 Difração por um Cristal Poliatômico; Fator de Forma Atômico 91
5.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6 Classificação das Redes de Bravais e Estruturas Cristalinas 95


6.1 Classificação das Redes de Bravais . . . . . . . . . . . . . . 96
6.2 Os Sete Sistemas Cristalinos . . . . . . . . . . . . . . . . . . 97
6.3 As Quatorze Redes de Bravais . . . . . . . . . . . . . . . . . 98
Contents iii

6.4 Enumeração dos Sete Sistemas Cristalinos e Quatorze Redes


De Bravais . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.5 Grupos Puntuais e Grupos Espaciais Cristalográficos . . . . 101
6.6 Nomenclatura dos Grupos Puntuais . . . . . . . . . . . . . 103
6.6.1 Notação de Schöenflies para Grupos Puntuais Crista-
lográficos Não-Cúbicos . . . . . . . . . . . . . . . . . 103
6.6.2 Notação Internacional para Grupos Puntuais Crista-
lográficos Não-Cúbicos . . . . . . . . . . . . . . . . . 104
6.6.3 Nomenclatura para os Grupos Puntuais Cristalográ-
ficos Cúbicos . . . . . . . . . . . . . . . . . . . . . . 105
6.7 Os 230 Grupos Espaciais . . . . . . . . . . . . . . . . . . . . 105
6.8 Exemplos entre os Elementos . . . . . . . . . . . . . . . . . 107
6.9 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

7 Níveis Eletrônicos num Potencial Periódico: Propriedades


Gerais 111
7.1 O Potencial Periódico . . . . . . . . . . . . . . . . . . . . . 112
7.2 Teorema de Bloch . . . . . . . . . . . . . . . . . . . . . . . 113
7.2.1 Primeira Demonstração do Teorema de Bloch . . . . 114
7.2.2 Condições de Contorno de Born-von Karman . . . . 115
7.2.3 Segunda Demonstração do Teorema de Bloch . . . . 117
7.3 Observações Gerais sobre o Teorema de Bloch . . . . . . . . 120
7.4 Superfície de Fermi . . . . . . . . . . . . . . . . . . . . . . . 123
7.5 Densidade de Níveis . . . . . . . . . . . . . . . . . . . . . . 125
7.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

8 Elétrons num Potencial Periódico Fraco 133


8.1 Aproximação Geral da Equação de Schrödinger quando o
Potencial é Fraco . . . . . . . . . . . . . . . . . . . . . . . . 134
8.1.1 Níveis de Energia Próximos de um Único Plano de
Bragg . . . . . . . . . . . . . . . . . . . . . . . . . . 138
8.1.2 Bandas de Energia em uma Dimensão . . . . . . . . 141
8.2 Curvas Energia-Vetor de Onda em Três Dimensões . . . . . 142
8.3 O Gap de Energia . . . . . . . . . . . . . . . . . . . . . . . 142
8.4 Zonas de Brillouin . . . . . . . . . . . . . . . . . . . . . . . 143
8.5 Fator de Estrutura Geométrico em Redes Monoatômicas com
Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.6 Importância do Acoplamento Spin-Órbita em Pontos de Alta
Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
8.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

9 Método das Ligações Fortes 151


9.1 Formulação Geral . . . . . . . . . . . . . . . . . . . . . . . . 152
9.1.1 Aplicação a uma banda-s originária de um único nível
atômico-s . . . . . . . . . . . . . . . . . . . . . . . . 156
Contents 1

9.2 Observações Gerais sobre o Método de Ligações fortes . . . 158


9.3 Funções de Wannier . . . . . . . . . . . . . . . . . . . . . . 162
9.4 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
2 Contents
This is page 3
Printer: Opaque this

1
Teoria de Drude para os Metais

Os metais ocupam uma posição muito especial no estudo dos sólidos, ex-
ibindo uma variedade de propriedades que outros sólidos (tais como, o
quartzo, enxofre ou sal comum) não possuem.
São excelentes condutores de calor e eletricidade, são dúcteis e maleáveis,
apresentam brilho, etc. O desafio de encontrar explicações para essas car-
actísticas foi o ponto de partida para o desenvolvimento da teoria moderna
dos sólidos.
Embora a maioria dos sólidos comumente encontrados sejam não-metálicos,
os metais continuam exercendo um papel importante na teoria dos sólidos
desde o século XIX até os dias atuais. De fato, o estado metálico provou ser
um dos estados mais fundamentais da matéria. Os elementos, por exem-
plo, definitivamente favorecem o estado metálico: mais de dois terços são
metais. Mesmo para entender os não-metais, devemos também entender os
metais, pois ao explicar porque o cobre é um bom condutor, começa-se a
aprender porque o sal comum não o é.
Durante os últimos cem anos, os físicos tentam construir modelos sim-
ples do estado metálico que expliquem, qualitativa e quantitativamente
as propriedades metálicas características. Nesta busca, tem-se conseguido
repetidamente muitos sucessos acompanhados de fracassos aparentemente
irremediáveis. Mesmo os modelos mais antigos, embora errados em alguns
aspectos, são de grande valia para os físicos atuais de estado sólido, quando
usados adequadamente.
4 1. Teoria de Drude para os Metais

Neste capítulo, examinaremos a teoria da condução metálica introduzida


por P. Drude1 na virada do século. Os sucessos do modelo de Drude foram
consideráveis, e ainda hoje é usado como um modo prático e rápido de
formar idéias e estimativas aproximadas de propriedades, cuja compreen-
são mais precisa requer análise de considerável complexidade. As falhas
do modelo de Drude para explicar alguns resultados experimentais e o au-
mento do quebra-cabeça conceitual definiram os problemas que a teoria
dos metais teria de atacar naqueles próximos vinte e cinco anos. Esses
problemas foram resolvidos somente com a rica e sutil estrutura da teoria
quântica dos sólidos.

1.1 Hipóteses Básicas do Modelo de Drude


A descoberta do elétron por J. J. Thomson em 1897 teve um impacto
imediato nas teorias sôbre a estrutura da matéria, e sugeriu um mecanismo
óbvio para a condução em metais. Três anos após a descoberta de Thomson,
Drude construiu sua teoria de conduç ão elétrica e térmica, aplicando a
teoria cinética dos gases ao metal, considerado como um gás de elétrons.
Na sua forma mais simples, a teoria cinética trata as moléculas de um gás
como esferas sólidas idênticas, que se movem em linha reta até colidirem
com uma outra.2 Admite-se que o tempo de duração de uma única colisão
seja desprezível, e, se considera que nenhuma outra força atue entre as
partículas, com exceção das forças que agem momentaneamente durante
cada colisão.
Embora esteja presente somente um tipo partícula, num metal deve haver
pelo menos dois tipos, pois os elétrons são carregados negativamente, mas o
metal é eletricamente neutro. Drude considrerou que a carga positiva com-
pensadora estaja associada a partículas muito mais pesadas que ele con-
siderou serem imóveis. Naquele tempo, porém, não existia nenhuma noção
precisa da origem tanto das partículas leves, os elétrons móveis, como das
partículas mais pesadas, partículas carregadas positivamente. A solução
para este problema é um dos principais feitos da teoria quântica moderna
dos sólidos. Nesta discussão do modelo de Drude, porém, admitiremos sim-
plesmente (e em muitos metais esta suposição pode ser justificada ) que,
quando os átomos de um elemento metálico são reunidos para formar um
metal, os elétrons de valência são desprendidos dos átomos e vagam livre-
mente pelo metal, enquanto que os íons metálicos permanecem intatos e
fazem o papel das partículas positivas imóveis na teoria de Drude. Este
modelo está esquematizado na Figura 1.1. Um único átomo isolado de um

1 Annalender Physik, 1, 566 e 3, 369 (1900).


2 Oucom as paredes do recipiente que os contém, uma possibilidade geralmente ig-
norada na discussão de metais, a menos que se esteja interessado em fios muito finos,
lâminas delgadas, ou em efeitos de superfície.
1.1 Hipóteses Básicas do Modelo de Drude 5

elemento metálico tem um núcleo de carga eZa , onde Za é o número atômico


e é o valor da carga eletrônica3 : e = 4, 80 × 10−10 unidades eletrostáticas
(esu) = 1, 60 × 10−19 C. Em volta do núcleo, orbitam Za elétrons de carga
total −eZa . Alguns destes elétrons, Z, são os fracamente ligados elétrons
de valência. Os Za − Z elétrons restantes estão fortemente ligados ao nú-
cleo, têm pouca importância nas reações químicas, e são conhecido como
os elétrons de caroço. Quando estes átomos isolados condensam para for-
mar um metal, os elétrons de caroço permanecem ligados ao núcleo para
formar o íon metálico, mas os elétrons de valência podem vagar longe de
seus átomos de origem. No contexto metálico esses elétrons são conhecidos
como elétrons de condução.4
Drude aplicou a teoria cinética a este ”gás” de elétrons de condução
de massa m, que (ao contrário das moléculas de um gás normal) move-se
contra um fundo de íons imóveis pesados. A densidade do gás de elétrons
pode ser calculado como segue:
Um elemento metálico contém 0, 6022 × 1024 átomos por mol (número
de Avogadro) e ρm /A moles por cm3 , onde ρm é a densidade de massa (em
gramas por centímetro cúbico) e A é a massa atômica do elemento. Como
cada átomo contribui com Z elétrons, o número de elétrons por centímetro
cúbico, n = N/V, é
Z ρm
n = 0, 6022 × 1024 , (1.1)
A
A Tabela 1.1 mostra a densidade de elétrons de condução para alguns
metais selecionados. Elas são tipicamente da ordem de 1022 elétrons de
condução por centímetro cúbico, variando de 0, 91 × 1022 para o césio até
24, 7 × 1022 para o berílio.5
Também está relacionada na Tabela 1.1 uma medida da densidade eletrônica
largamente usada, rs , definida como o raio de uma esfera cujo volume é igual
ao volume ocupado por cada elétron de condução. Assim
µ ¶1/3
V 1 4πrs3 3
= = ; rs = . (1.2)
N n 3 4πn

A Tabela 1.1 lista rs tanto em Angstrons (10−8 cm) como em unidades


do raio de Bohr a0 = ~2 /me2 = 0, 529 × 10−8 cm; este último compri-
mento, sendo a medida do raio de um átomo de hidrogênio no seu estado
fundamental, é usado frequentemente como uma escala para medidas de

3 Sempre tomaremos e como sendo um número positivo.


4 Como no modelo de Drude, quando os elétrons de caroço têm um papel passivo e os
íons agem como uma entidade inerte indivisível, às vezes nos referimos aos elétrons de
condução simplesmente como ”os elétrons”, reservando-se o termo completo para quando
a distinção entre elétrons de condução e elétrons de caroço precisar ser enfatizada.
5 Estes são os limites para os elementos metálicos sob condições normais. Densidades

mais altas podem ser obtidas pela aplicação de pressão (que tende a favorecer o estado
metálico). Densidades mais baixas são encontradas em compostos.
6 1. Teoria de Drude para os Metais

distâncias atômicas. Note que rs /a0 está entre 2 e 3 na maioria dos casos,
embora varie entre 3 e 6 nos metais alcalinos (podendo chegar a 10 em
alguns compostos metálicos).
Essas densidades são tipicamente mil vezes maiores do que aquelas de
um gás clássico ideal à temperatura e pressão normais. Apesar disto e
apesar das fortes interações eletromagnéticas elétron-elétron e elétron-íon,
o modelo de Drude trata corajosamente o gás de elétron metálico denso
pelos métodos da teoria cinética de um gás neutro diluído, com pequenas
modificações. As hipóteses básicas são estas:
1. Entre colisões despreza-se a interação de um determinado elétron tanto
com o outro elétron, quanto com o íon. Assim, na ausência de campos eletro-
magéticos aplicados externamente, considera-se que cada elétron se mova
uniformemente em linha direta. Na presença de campos aplicados externa-
mente, considera-se que cada elétron se mova da forma determinada pelas
leis do movimento de Newton na presença desses campos externos, mas
desprezando-se os campos adicionais complicados produzidos pelos outros
elétrons e pelos íons.6 A não inclusão das interações elétron-elétron en-
tre as colisões é conhecida como aproximação de elétron independente. A
correspondente não inclusão das interações elétron-íon é conhecida como
aproximação de elétron livre. Encontraremos nos capítulos subseqüentes
que embora a aproximação de elétron independente seja, em muitos contex-
tos surpreendentemente boa, a aproximação de elétron livre deve ser aban-
donada se se quiser mesmo ter a uma compreensão qualitativa de muitos
dos comportamentos metálicos.
2. As colisões no modelo de Drude, como na teoria cinética, são eventos
instantâneos que alteram bruscamente a velocidade de um elétron. Drude
os atribuiu aos choques dos elétrons com os íons impenetráveis (ao invés
de atribuir às colisões elétron-elétron, o análogo do mecanismo de colisão
predominante num gás ordinário). Veremos mais tarde que o espalhamento
elétron-elétron realmente é um dos menos importantes dos vários mecanis-
mos de espalhamento num metal, exceto sob condições não usuais. Porém,
a descrição mecânica simples (Figura 1.2) de um elétron que se move de íon
para íon está muito longe de ser a descrição correta.7 Felizmente, isto não é
importante para muitos propósitos: um entendimento qualitativo (e à vezes
quantitativo) da condução metálica podem ser obtidos considerando-se sim-

6 Na verdade, a interação elétron-íon não é ignorada completamente, pois o modelo

de Drude considera implicitamente que os elétrons são limitados ao interior do metal.


Evidentemente este aprisionamento é provocado pela atração dos íons positivamente car-
regados. Efeitos grosseiros da interação elétron-íon e elétron-elétron tais como estes são
levados em conta, somando-se aos campos externos um campo interno adequadamente
definido, que representa o efeito médio das interações elétron-electon e elétron-íon.
7 Por algum tempo, as pessoas ficaram envolvidas com um problema difícil, embora

irrelevante, relacionado com um elétron atingindo um íon em cada colisão. Deste modo,
uma interpretação literal da Figura 1.2 deve ser evitada a qualquer custo.
1.2 Condutividade Elétrica DC de um Metal 7

plesmente que há algum mecanismo de espalhamento, sem se questionar o


que realmente poderia ser esse mecanismo. Recorrendo-se, em nossa análise,
só a alguns poucos efeitos gerais dos processos de colisão, podemos evitar
de nos comprometermos com uma idéia específica de como o espalhamento
dos elétron de fato acontece. Estas características gerais são descritas nas
duas seguinte hipóteses.
3. Admitiremos que um elétron experimenta uma colisão (i.e., sofre uma
mudança brusca na sua velocidade) com uma probabilidade τ por unidade
tempo. Com isto, queremos dizer que a probabilidade de um elétron sofrer
uma colisão em qualquer intervalo de tempo infinitesimal dt é dt/τ . O
tempo τ é conhecido de muitas maneira, tais como tempo de relaxação,
tempo de colisão ou tempo livre médio, e tem um papel fundamental na
teoria de condução metálica. Segue-se desta suposição, que um elétron es-
colhido ao acaso num determinado momento, em média, se move durante
um tempo τ antes de sua próxima colisão, e se moveu, em média, durante
um tempo τ desde sua última colisão.8 Nas aplicações mais simples do mod-
elo de Drude, o tempo de colisão é cinsiderado ser independente da posição
e da velocidade de um elétron. Veremos mais adiante que isto parece ser
uma suposição surpreendentemente boa para muitas (mas, não para todas)
aplicações.
4. Admitimos que os elétrons atingem o equilíbrio térmico com o meio
vizinho apenas através das colisões.9 Admite-se que estas colisões mantêm
o equilíbrio termodinâmico local de um modo particularmente simples: ime-
diatamente após cada colisão um elétron emerge com uma velocidade que
não está relacionada com sua velocidade imediatamente antes a colisão,
mas dirigida aleatoriamente e com um valor apropriado à temperatura que
prevalece no local onde aconteceu a colisão. Assim, quanto mais quente for
a região na qual acontece uma colisão, maior será a velocidade do elétron
que emergirá da colisão.
No restante deste capítulo ilustraremos estas noções através de suas apli-
cações mais importantes, observando até que ponto elas têm sucesso ou não
descrevem os fenômenos observados.

1.2 Condutividade Elétrica DC de um Metal


De acordo com a lei de Ohm, o fluxo de corrente num fio é proporcional à
diferença de potencial ao longo do fio: V = IR, onde R, a resistência do
fio, depende de suas dimensões, mas é independente do valor corrente ou

8 Veja Problema 1.
9 Dada a aproximação de elétron livre e independente, este é o único mecanismo
possível que resta.
8 1. Teoria de Drude para os Metais

da diferença de potencial. O modelo de Drude leva em conta este compor-


tamento, e fornece uma estimativa para o valor da resistência.
Geralmente, elimina-se a dependência de R com as dimensões do fio,
introduzindo-se uma quantidade que depende somente do metal do qual é
feito o fio. A resistividade ρ é definida como sendo a constante de propor-
cionalidade entre o campo elétrico E num ponto do metal e a densidade de
corrente j que ele induz:10

E =ρj (1.3)

A densidade de corrente j é um vetor, paralelo ao fluxo de carga, cuja


magnitude é a quantidade de carga por unidade de tempo que cruza uma
unidade de área perpendicular ao fluxo. Então, se uma corrente uniforme
fluir através de um fio de comprimento L e área da secção transversal A,a
densidade de corrente será dada por j = I/A. Como a diferença de potencial
ao longo do fio será dada por V = EL, a Eq.(1.3) dá V = IρL/A, e então
R = ρL/A.
Se n elétrons por unidade de volume movem-se todos com velocidade v,
então a densidade de corrente que eles dão origem será paralela a v. Além
disso, num intervalo tempo dt os elétrons percorrerão uma distância vdt na
direção de v, tal que n (vdt) A elétrons cruzarão uma área A perpendicular à
direção do fluxo. Como cada elétron transporta uma caraga −e, a carga que
atravessa A num intervalo de tempo dt será −nevAdt, e então, a densidade
de corrente é

j = −nev (1.4)

Em qualquer ponto num metal, os elétron estão sempre se movendo em


várias direções com uma variedade de energias térmicas. A densidade de
corrente resultante é então determinada por (1.4), onde v é a velocidade
eletrônica média. Na ausência de campo elétrico, existe a mesma probabil-
idade dos elétrons se moverem em qualquer direção, de modo que a média
v se anula, e como era de se esperar, não existe nenhuma densidade de
corrente resultante. Na presença de um campo E, porém, haverá uma ve-
locidade eletrônica média dirigida no sentido oposto ao campo (sendo a
carga eletrônica negativa), a qual podemos calcular da seguinte maneira:
Considere um elétron típico no instante zero. Seja t o tempo decorrido
desde sua última colisão. Sua velocidade no instante zero será sua veloci-
dade v0 imediatamente após aquela colisão mais a velocidade adicional
−eEt/m que ele adquiriu subseqüentemente. Como admitimos que um
elétron emerge de uma colisão em direção aleatória, não haverá nenhuma
contribuição de v0 para a velocidade eletrônica média, que deve ser dada
então completamente pela média de v1 . Porém, a média de t é o tempo de

1 0 Em geral, E e j não são paralelos. Define-se então o tensor de resistividade.


1.2 Condutividade Elétrica DC de um Metal 9

relaxação τ . Portanto
µ ¶
eEτ ne2 τ
vméd =− ; j= E (1.5)
m m

Este resultado normalmente é determinado em termos do inverso da re-


sistividade, a condutividade σ = 1/ρ:
µ 2 ¶
ne τ
j = σE; σ = (1.6)
m

Isto estabelece a dependência linear de j em E e dá uma estimativa da


condutividade σ em termos de quantidades que são todas conhecidas com
exceção do tempo de relaxação τ . Podemos usar então (1.6) e os valores
experimentas das resistividade estimar o valor do tempo de relaxação:
m
τ= (1.7)
ρne2
A Tabela 1.2 dá as resistividade de vários metais representativos a várias
temperaturas. Note a forte dependência com a temperatura. À temperatura
ambiente a resistividade é aproximadamente linear em T , mas decai brus-
camente quando temperaturas baixas são alcançadas. As resistividades à
temperatura ambiente são tipicamente da ordem de microohm centímetro
(µohm-cm) ou, em unidades atômicas, da ordem de 10−18 statohm.11 Se
ρµ é a resistividade em microhm centímetros, então um modo conveniente
de expressar o tempo de relaxação dado por (1.7) é:
µ ¶µ ¶3
0, 22 rs
τ= × 10−14 s (1.8)
ρµ a0

Os tempos de relaxação obtidos da Eq. (1.8) e as resistividades na Tabela


1.2, são mostrados na Tabela 1.3. Note que a temperaturas ambientes τ é
tipicamente da ordem de 10−14 a 10−15 s. Para considerar se este é um
número razoável é mais instrutivo observar o caminho livre médio, ` = v0 τ ,
onde v0 é a velocidade média eletrônica. O comprimento ` mede a distância

1 1 Para converter resistividades de microhm centímetros para statohm centímetros note

que uma resistividade de 1 µΩ-cm produz um campo elétrico de 10−6 V/cm na presença
1
de uma corrente de 1 A/cm 3 . Desde que 1 A é 3 × 109 esu/s, e 1 V é 300 statV, uma
resistividade de 1 µΩ produz um campo de 1 statV/cm quando a densidade de corrente
é 300 × 106 × 3 × 109 esu-cm −2 -s−1 . O statohm-centímetro é a unidade eletrostática
de resistividade, e então dá 1 statV/cm com uma densidade de corrente de apenas 1
esu-cm −2 -s−1 . Assim 1 µΩ-cm é equivalentes a 19 × 10−17 statΩ-cm. Para se evitar
usar o statohm-centímetro, pode-se calcular (1.7) tomando-se ρ em ohm metros, m em
quilogramas, n em elétrons por metro cúbico e e em Coulombs. (Nota : As fórmulas mais
importantes, constantes, e fatores de conversão dos Capítulos 1 e 2 são resumidas no
Apêndice A.)
10 1. Teoria de Drude para os Metais

média que um elétron percorre entre duas colisões. No tempo de Drude era
natural estimar v0 ,usando a lei de equipartição clássica da energia 21 mv02 =
3
2 kB T. Usando a massa eletrônica conhecida, encontra-se que v0 é da ordem
de 107 cm/s à temperatura ambiente, e, consequentemente, um caminho
livre médio de 1 e 10 Å. Uma vez que esta distância é comparável ao
espaçamento interatômico, o resultado é bastante consistente com a visão
original de Drude de que as colisões são devido aos elétrons chocando-se
com os íons grandes e pesados.
Porém, veremos no Capítulo 2 que esta estimativa clássica de v0 é uma
ordem de grandeza menor a temperaturas ambientes. Além disso, para tem-
peraturas mais baixas na Tabela 1.3, τ é uma ordem de grandeza maior que
à temperatura ambiente, enquanto (como veremos no Capítulo 2) v0 é real-
mente independente da temperatura. Isto pode elevar o caminho livre mé-
dio a baixas temperaturas para 103 ou mais angstroms, aproximadamente
mil vezes o espaçamento entre íons. Atualmente, trabalhando-se a temper-
aturas suficientemente baixas, com amostras cuidadosamente preparadas,
podem ser alcançados caminhos livres médios da ordem de centímetros (i.e.,
108 espaçamentos de interatômicos). Esta é uma forte evidência de que o
que os elétrons fazem não é simplesmente chocarem-se com os íons, como
Drude supôs.
Felizmente, porém, podemos continuar calculando com o modelo de Drude
sem qualquer entendimento preciso da causa das colisões. Na ausência de
uma teoria do tempo de colisão torna-se importante encontrar predições do
modelo de Drude que sejam independentes do valor do tempo de relaxação
τ . Como acontece, existem várias tais quantidades independentes de τ que,
mesmo hoje em dia são de interesse fundamental, pois em muitos aspectos
o tratamento quantitativo preciso do tempo de relaxação continua sendo o
elo mais fraco nos tratamentos modernos da condutividade metálica. Como
resultado, quantidades independentes de τ são altamente valiosas, pois elas
às vezes dão informações consideravelmente mais confiáveis.
Dois casos de interesse particular são o cálculo da condutividade elétrica,
quando um campo magnético estático espacialmente uniforme está pre-
sente, e quando o campo elétrico é espacialmente uniforme mas dependente
do tempo. Ambos os casos simplesmente são com pela observação seguinte:
é espacialmente uniforme mas tempo-dependente. Ambos os casos são mais
facilmente tratados lançando-se mão das seguintes observações:
A qualquer instante t a velocidade eletrônica média v é justamente
p(t)/m, onde p é momento total por elétron. Conseqüentemente, a den-
sidade de corrente é
nep(t)
j=− (1.9)
m
Dado que o momento por elétron é p(t) no instante t, vamos calcular o
momento por elétron p(t + dt), após um intervalo de tempo infinitesimal
dt. Um elétron escolhido ao acaso a tempo num instante t terá uma colisão
antes do tempo t + dt com probabilidade dt/τ , e então permanecerá até o
1.2 Condutividade Elétrica DC de um Metal 11

tempo t+dt sem sofrer uma colisão com probabilidade 1−dt/τ . Se não sofre
nenhuma colisão, porém, ele simplesmente evolui sob a influência da força
f (t) (devido aos campos elétrico e magnético espacialmente uniformes) e
então adquirirá um momento adicional. f (t)dt + O(dt)2 .12 A contribuição
de todos esses elétrons que não colidem entre t e t + dt para o momento por
elétron no instante t + dt é a fração (1 − dt/τ ) de todos os elétrons que eles
constituem, vezes o seu momento médio por elétron, p(t) + f (t) + O(dt)2 .
Assim, desprezando por enquanto a contribuição para p(t + dt) desses
elétrons que sofrem uma colisão no tempo entre t e t + dt, temos13
µ ¶
dt £ ¤
p(t + dt) = 1− p(t) + f (t) dt + O(dt)2
τ
µ ¶
dt
= p(t) − p(t) + f (t)dt + O(dt)2 (1.10)
τ

A correção para (1.10) devido a esses elétrons que tiveram uma colisão
no intervalo de t a t+dt é apenas da ordem de (dt)2 . Para ver isto, primeiro
observe que tais elétrons constituem uma fração dt/τ do número total de
elétrons. Além disso, como a velocidade eletrônica (e o momento) é dirigida
aleatoriamente imediatamente após uma colisão, cada um desses elétrons
contribuirá para momento médio p (t + dt) apenas com o valor do momento
adquirido da força f (t) após a última colisão. Esse momento é adquirido
durante um tempo não maior do que dt, e é então da ordem f (t) dt . Assim
a correção para (1.10 é da ordem de (dt/τ ) f (t) dt, e não afeta o termos
de ordem linear em dt. Podemos escrever então:
µ ¶
dt
p(t + dt) − p(t) = − p(t) + f (t)dt + O(dt)2 (1.11)
τ

onde consideramos a contribuição de todos os elétrons para p(t + dt).


Dividindo-se isto por dt e tomando-se o limite quando dt → 0, encontramos

dp(t) p (t)
=− + f (t) (1.12)
dt τ

Isto simplesmente especifica que o efeito das colisões de elétrons individuais


é introduzir um termo de amortecimento na equação de movimento para o
momento por elétron.
Agora aplicamos (1.12) para vários casos de interesse.

1 2 O(dt)2 significa um termo da ordem de (dt)2 .


1 3 Sea força não é a mesma para todos os elétrons, (1.10) continuará valendo, desde
que se interprete f como a força média por elétron.
12 1. Teoria de Drude para os Metais

1.3 Efeito Hall e Magnetorresistência


Em 1879 E. H. Hall tentou determinar se a força sofrida por um fio trans-
portando corrente num campo magnético era exercida sobre todo o fio ou
apenas sobre (o que chamaríamos agora) os elétrons móveis no fio. Ele sus-
peitou ser este último, e sua experiência foi baseada no argumento de que
”se a corrente de eletricidade num condutor fixo é atraída por um imã, a
corrente deveria ser desviada para um lado do fio, e portanto a resistência
medida deveria aumentar”.14 Seus esforços para descobrir esta resistência
extra fracassaram,15 mas Hall não considerou isto conclusivo: ”O imã pode
tender a desviar a corrente sem contudo fazê-lo. É evidente que neste caso
existiria um estado de força no condutor, a pressão da eletricidade, por
assim dizer, para um lado do fio”. Este estado de força deveria aparecer
como uma voltagem transversal (conhecida hoje como a voltagem Hall),
que Hall pôde observar.
A experiência de Hall é descrita na Figura 1.3. Um campo elétrico Ex é
aplicado a um fio que se estende na direção-x e uma densidade de corrente
jx flui no fio. Além desse campo, um campo magnético H aponta na direção
positiva do eixo-z. Como resultado, a força de Lorents16
e
− v×H (1.13)
c
atua para desviar os elétrons na direção negativa do eixo-y (a velocidade de
arraste de um elétron é oposta ao fluxo de corrente). Porém os electrons não
podem se mover para muito longe na direção-y sem antes baterem contra
as bordas do fio. Como eles se acumulam ali, aparece um campo elétrico na
direção-y que se opõe a seu movimento e a mais acumulação de elétrons. No
equilíbrio, este campo transversal (ou campo Hall) Ey equilibrará a força
de Lorentz forçam, e corrente só fluirá na direção-x.
Há duas quantidades de interesse. Uma é a relação entre campo ao longo
do fio Ex e a densidade de corrente jx ,
Ex
ρ (H) = (1.14)
jx

Esta é a magnetorresistência,17 que Hall encontrou ser independente do


campo. A outra é o valor do campo transversal Ey . Considerando que este
campo equilibra a força de Lorentz, podemos esperá-lo ser proporcional

1 4 Am. J. Math. 2, 287 (1879).


15 O aumento na resistência (conhecido como magnetorresistência) acontece, como ver-
emos nos Capítulos 12 e 13. Porém, o modelo de Drude prediz o resultado nulo de Hall.
1 6 Quando lidamos com materiais não-magnéticos (ou fracamente magnéticos), sempre

chamaremos o campo de H, pois a diferença entre B e H é extremamente pequena.


1 7 Mais precisamente, esta é a magnetorresistência transversal. Existe, também, uma

magnetorresistência longitudinal, medida com o campo magnético paralelo à corrente.


1.3 Efeito Hall e Magnetorresistência 13

tanto ao campo aplicado H quanto à corrente jx ao longo do fio. Define-se


portanto uma quantidade conhecida como coeficiente Hall por
Ey
RH = (1.15)
jx H
Note que, como o campo de Hall está na direção negativa do eixo-y
(Figura 1.3), RH deveria ser negativo. Se, por outro lado, os portadores de
carga fossem positivos, então o sinal da sua componente-x da velocidade
seria invertido, e a força de Lorentz ficaria então inalterada. Em conseqüên-
cia disso, o campo de Hall seria oposto à direção que tem para portadores
negativamente carregados. Isto é de grande importância, porque significa
que uma medida do campo Hall determina o sinal dos portadores de carga.
Os dados originais de Hall concordaram com o sinal da carga eletrônica
mais tarde determinado por Thomson. Um dos aspectos notáveis do efeito
Hall, porém. é que em alguns metais o coeficiente Hall é positivo e sugere
que os portadores têm uma carga oposta àquela do elétron. Este é outro
mistério cuja solução teve que esperar pela teoria quântica dos sólidos.
Neste capítulo, consideraremos só a análise simples do modelo de Drude
que, embora seja incapaz de descrever os coeficientes Hall positivos, está
freqüentemente em boa concordância com a experiência.
Para calcular o coeficiente de Hall e a magnetorresistência primeiro de-
terminamos as densidades de corrente jx e jy na presença de um campo
elétrico com componentes arbitrárias Ex e Ey , e na presença de um campo
de rnagnetic H ao longo do eixo-z. A força (independente da posição) que
atua sobre cada elétron é f = −e (E + v × H/c), e portanto a Eq. (1.12)
para o momento por elétron torna-se18
dp ³ p ´ p
= −e E + ×H − (1.16)
dt mc τ
No estado estacionário a corrente é independente do tempo, e então px
e py satisfarão
px
0 = −eEx − ω c py −
τ
(1.17)
py
0 = −eEy − ω c px −
τ
onde
eH
ωc = (1.18)
mc

1 8 Note que a força de Lorentz não é a mesma para cada elétron, uma vez que ela

depende da velocidade eletrônica v. Então a força f em (1.12) será tomada como a força
média por elertron (veja nota de rodapé 13). Porém, como a força depende do elétron
sobre o qual ela atua apenas por um termo linear na velocidade do elétron, a força média
é simplesmente obtida substituindo-se aquela velocidade pela velocidade média, p/m.
14 1. Teoria de Drude para os Metais

Multiplicamos estas equações por −neτ /m e introduzimos as componentes


da densidade de corrente por (1.4) para encontrar

σ 0 Ex = ω c τ jy + jx

σ0 Ey = −ω c τ jx + jy (1.19)

onde σ é a condutividade DC do modelo de Drude na ausência de um


campo magnético, dado por (1.6).
O campo de Hall Ey é determinado pela condição de que não há nenhuma
corrente jy transversal. Fazendo jy igual a zero na segunda equação de
(1.19), encontra-se que
µ ¶ µ ¶
ωcτ H
Ey = − jx = − jx (1.20)
σ0 nec

Portanto, o coeficiente Hall (1.15) é


1
RH = − (1.21)
nec
Este é um resultado muito marcante, porque afirma que o coeficiente Hall
não depende de nenhum parâmetro do metal menos a densidade de porta-
dores. Considerando que já calculamos n admitindo-se que os elétrons de
valências atômica se tornam os elétrons de condução metálica, uma medida
da constante de Hall fornece um teste direto da validade desta suposição.
Ao tentarmos obter a densidade de elétron n a partir da medida dos coefi-
cientes Hall, nos deparamos com o problema que, ao contrário da predição
de (1.21), esses coeficientes geralmente dependem do campo magnético.
Além disso, eles dependem da temperatura e do cuidado com que a amostra
foi preparada. Este resultado é um tanto inesperado, já que o tempo de re-
laxação τ , que pode depender fortemente da temperature e das condições
da amostra, não aparece em (1.21). Porém, a temperaturas muito baixas
em amostras muito puras, cuidadosamente preparadas a campos muito al-
tos, as medidas das constantes de Hall parecem se aproximar de um valor
limite. As teorias mais elaboradas dos Capítulos 12 e 13 predizem que para
muitos (mas não todos) metais este valor limite é justamente o resultado
simples de Drude (1.21).
Na Tabela 1.4, estão relacionados alguns coeficientes Hall a campos altos
e moderados. Note a ocorrência de casos nos quais RH é realmente positivo
e corresponde aparentemente aos portadores com uma carga positiva. Um
exemplo importante da observada dependência com o campo, e totalmente
inexplicada através da teoria de Drude, é mostrado na Figura 1.4.
O resultado de Drude confirma a observação de Hall que a resistência
não depende do campo, pois quando jy = 0 (como é o caso no estado esta-
cionário, quando o campo de Hall foi estabelecido), a primeira equação de
1.4 Condutividade Elétrica AC de um Metal 15

(1.19) reduz-se a jx = σ 0 Ex , que é o resulatado esperado para a condu-


tividade em campo magnético nulo. Porém, experiências mais cuidadosas
numa variedade de metais revelaram que há uma dependência da resistência
com o campo magnético, que pode ser bastante dramática em alguns casos.
Aqui, novamente a teoria quântica dos sólidos é necessária para explicar
porque o resultado de Drude se aplica em alguns metais e calcular os desvios
verdadeiramente extraordinários destes resultados em outros metais.
Antes de encerrarmos o assunto dos fenômenos DC num campo mag-
nético uniforme, observamos para aplicações futuras, que a quantidade ω c τ
é uma importante medida adimensional da força de um campo magnético.
Quando ω c τ é pequeno, a Eq. (1.19) dá j aproximadamente paralelo a E,
como acontece na ausência de um campo magnético. Porém, j em geral
forma um ângulo φ (conhecido como ângulo de Hall) com E, onde (1.19)
dá tgφ = ω c τ . A quantidade ω c , conhecida como freqüência de cíclotron, é
simplesmente a freqüência angular de rotação19 do elétron livre no campo
magnético H. Assim ω c τ será pequeno se os elétrons completarem só uma
pequena parte de uma rotção entre colisões, e grande, se eles completarem
muitas rotações. Alternativamente, quando ω c τ é pequeno o campo mag-
nético deforma muito pouco as órbitas eletrônicas, mas quando ω c τ é com-
parável à unidade ou maior, o efeito do campo magnético sobre as órbitas
eletrônicas é muito drástico. Uma avaliação numérica útil da freqüência de
ciclotron é
¡ ¢
ν c 109 Hz = 2, 80 × H (kG), ω c = 2πν c (1.22)

1.4 Condutividade Elétrica AC de um Metal


Para calcular a corrente induzida num metal por um campo elétrico depen-
dente do tempo, vamos escrever o campo na forma:
¡ ¢
E (t) = Re E(ω)e−iωt (1.23)

A equação de movimento (1.12) para o momento por elétron, torna-se

dp p
= − − eE (1.24)
dt τ
Procuramos uma solução do regime estacionário da forma
¡ ¢
p (t) = Re p (ω) e−iωt (1.25)

1 9 Num campo magnético uniforme a órbita de um elétron é uma espiral ao longo

do campo cuja projeção no plano perpendicular ao campo é um círculo. A freqüência


angular ωc é determinada pela condição que a aceleração centrípeta ω 2c r é fornecida pela
força de Lorentz (e/c) (ω c r) H.
16 1. Teoria de Drude para os Metais

Substituindo-se as quantidades complexas p e E em (1.24), que deve ser


satisfeita tanto pela parte real, quanto pela parte imaginária de qualquer
solução complexa, encontra-se que p (ω) deve satisfazer
p (ω)
−iωp (ω) = − − eE (ω) (1.26)
τ
Uma vez que j = −nep/m, a densidade de corrente é
¡ ¢
j (t) = Re j (ω) e−iωt ,
¡ 2 ¢
nep (ω) ne /m E (ω)
j (ω) = − = (1.27)
m (1/τ ) − iω
Usualmente, escreve-se este resultado como

j (ω) = σ (ω) E (ω) (1.28)

onde σ (ω) , conhecida como condutividade dependente da frequência (ou


AC), é dada por
σ0 ne2 τ
σ (ω) = , σ0 = (1.29)
1 − iωτ m
Note que isto se reduz exatamente ao resultado de Drude DC (1.6) para
frequência nula.
A aplicação mais importante deste resultado é para a propagação de
radiação eletromagnética num metal. Poderia parecer que as suposições
que fizemos para derivar (1.29) a tornaria inaplicável para este caso, pois
(a) o campo E numa onda eletromagnética é acompanhado por um campo
magnético perpendicular H da mesma magnitude,20 que nós não incluímos
em (1.24), e (b) os campos numa onda eletromagnética variam tanto no
espaço como tempo, enquanto que a Eq. (1.12) foi derivada supondo-se
uma força espacialmente uniforme.
A primeira complicação sempre pode ser ignorada. Ela conduz a um
termo adicional −ep/mc × H em (1.24), que é menor que o termo em E
por um fator v/c, onde v é o módulo da velocidade eletrônica média. Mas,
mesmo numa corrente tão grande quanto 1 A/mm2 , v = j/ne é somente
da ordem de 0, 1 cm/s. Conseqüentemente, o termo no campo magnético
é tipicamente 10−10 do termo no campo elétrico e pode ser corretamente
ignorado por completo
O segundo ponto levanta questões mais sérias. A Eq. (1.12) foi derivada
supondo-se que a qualquer instante a mesma força atua sobre cada elétron,
o que não é o caso se o campo elétrico varia no espaço. Note, porém, que a
densidade de corrente no ponto r é completamente determinada pelo resul-
tado da ação do campo elétrico sobre cada elétron em r desde sua última

2 0 Um das características mais atraentes das unidades do sistema CGS.


1.4 Condutividade Elétrica AC de um Metal 17

colisão. Esta última colisão, na maioria esmagadora das vezes, acontece


não mais do que alguns caminhos livres médios distante de r. Então, se o
campo não varia apreciavelmente sobre distâncias comparável ao caminho
livre médio eletrônico, podemos calcular corretamente j (r, t), a densidade
de corrente no ponto r, tomando-se o campo em todos lugares em espaço
como dado por seu valor E (r, t) no ponto r. O resultado,

j (r, ω) = σ (ω) E (r, ω) (1.30)

é então válido sempre que o comprimento de onda λ do campo é grande


comparado ao caminho livre médio eletrônico `. Isto é normalmente satis-
feito num metal pela da luz visível (da qual o comprimento de onda é da
ordem de 103 a 104 Å). Quando não é satisfeito, tem-se que recorrer às
denominadas teorias não-locais, de maior complexidade.
Supondo, então, que o comprimento de onda é grande comparado ao cam-
inho livre médio, podemos proceder como segue: na presença de uma den-
sidade de corrente especificada j, podemos escrever as equações de Maxwell
como21

1 ∂H
∇ · E = 0; ∇ · H = 0; ∇ × E = −
c ∂t
4π 1 ∂E
∇×H= j+ (1.31)
c c ∂t
Vamos olhar para uma solução com dependência temporal e−iωt , notando
que, num metal, podemos escrever j em termos de E via (1.28). Encon-
tramos, então,
µ ¶
2 iω iω 4πσ iω
∇ × (∇ × E) = −∇ E = ∇×H= E− E (1.32)
c c c c
ou µ ¶
ω2 4πiσ
−∇2 E = 1+ E (1.33)
c2 ω
Esta equação tem a forma uma equação de onda usual,
ω2
−∇2 E = ² (ω) E (1.34)
c2
com uma constante dielétrica complexa dada por
4πiσ
² (ω) = 1 + (1.35)
ω

2 1 Estamos considerando aqui uma onda eletromagnética, na qual a densidade de carga

induzida ρ se anula. Abaixo examinamos a possibilidade de oscilações na densidade de


carga.
18 1. Teoria de Drude para os Metais

Se estamos em freqüências altas bastante para satisfazer

ωτ À 1 (1.36)

seja satisfeita, então em primeira aproximação as Eqs. (1.35) e (1.29) nos


dão
ω 2p
² (ω) = 1 − 2 (1.37)
ω
onde ω p , conhecida como frequência de plasma, é dada por

4πne2
ω 2p = (1.38)
m
Quando ² é real e negativo (ω < ω p ) as soluções de (1.34) decaem expo-
nencialmente no espaço; i.e., nenhuma radiação pode se propagar. Porém,
quando ² é positivo (ω > ω p ) a solução da Eq. (1.34) torna-se oscilatória,
podendo a radiação se propagar, e o metal deveria se tornar transpar-
ente. Esta conclusão, evidentemente, só é válida se a nossa suposição de
altas frequências (1.36) for satisfeita para valores da frequência próximos
de ω = ω p . Se expressarmos τ em termos da resistividade através da Eq.
(1.8), então podemos usar a expressão (1.38) da frequência de plasma para
mostrar que
µ ¶3/2 µ ¶
2 rs 1
ω p τ = 1, 6 × 10 (1.39)
a0 ρµ
Como a resistividade em microhom-centímetro, ρµ , é da ordem ou menor
que a unidade ou menos, e como rs /a0 está no intervalo entre 2 e 6,
a condição para frequências altas (1.36) será satisfeita na frequência de
plasma.
De fato, para os metais alcalinos, observa-se que estes se tornam transpar-
entes na região do ultravioleta. Numericamente, a Eq. (1.38) dá a frequência
a partir da qual o material se tornaria transparente, isto é,
µ ¶−3/2
ωp rs
νp = = 11, 4 × × 1015 Hz (1.40)
2π a0
ou µ ¶3/2
c rs
λp = = 0, 26 × 103 Å (1.41)
νp a0
Na Tabela 1.5, mostramos os comprimentos de onda de corte calculados
a partir (1.41), juntamente com os valores de corte medidos. Existe uma
boa concordância entre os valores teóricos e experimentais. Como veremos,
a constante dielétrica real de um metal é muito mais complicada do que
aquela obtida em (1.37) e é pura sorte que os metais alcalinos notavelmente
exibam este comportamento de Drude. Em outros metais, diferentes con-
tribuições à constante dielétrica competem fortemente com o ”termo de
Drude” (1.37).
1.4 Condutividade Elétrica AC de um Metal 19

A segunda conseguência importante de (1.37) é que o gás de elétrons


pode suportar oscilações na densidade de carga. Com isto nos referimos
a uma perturbação na qual a densidade de carga22 tem uma dependência
temporal oscilatória e−iωt . Da equação da continuidade
∂ρ
∇·j=− , ∇ · j (ω) = iωρ (ω) (1.42)
∂t
e, da lei de Gauss,
∇ · E (ω) = 4πρ (ω) (1.43)
encontramos, em vista da Eq. (1.30), que

iωρ (ω) = 4πσ (ω) ρ (ω) (1.44)

Esta equação tem uma solução desde que

4πσ (ω)
1+ =0 (1.45)
ω
que é exatamente a condição que encontramos acima para o início da propa-
gação da radiação. No presente contexto, ela aparece como a condição que
a frequência deve satisfazer para haja propagação da onda de densidade de
carga.
A natureza desta onda de densidade de carga, conhecida como oscilação
de plasma ou plasmon pode ser entendida através de um modelo muito
simples.23 Imagine que o gás de elétrons como um todo seja deslocado por
uma distância d em relação ao fundo positivos de íons fixos (Figura 1.5).24
A carga superficial resultante dá origem a um campo elétrico de módulo
4πσ, onde σ é a carga por unidade de área25 em ambas as extremidades
do bloco. Consequentemente o gás de elétrons como um todo obedecerá à
equação de movimento

N md¨ = −N e |4πσ| = −N e (4πnde) = −4πne2 N d (1.46)

que leva a oscilação na frequência de plasma.

2 2 Não devemos confundir a densidade de carga ρ com a condutividade, também, geral-


mente representada por ρ. Esta distinção ficará clara no contexto, quando nos referirmos
a elas.
2 3 Como o campo de um plano uniforme de carga é independente da distância do plano,

este argumento grosseiro que coloca toda densidade de carga sobre duas superfícies
opostas, não é tão grosseiro quanto parece à primeira vista.
2 4 Obervamos anteriormente que o modelo de Drude leva em conta a interação elétron-

íon, admitindo que a atração dos íons carregados positivamente confina os elétrons no
interior do metal. Neste modelo simples de uma oscilação de plasma é precisamente esta
atração que fornece a força restauradora.
2 5 Não devemos confundir a densidade de carga σ com a condutividade, também, geral-

mente representada por σ.


20 1. Teoria de Drude para os Metais

Foram feitas algumas observações diretas de plasmons. Talvez a mais


importante seja a observação das perdas de energia em múltiplos de ~ω p ,
quando os elétrons são lançados contra filmes metálicos finos.26 Contudo,
deve-se sempre ter em mente a possibilidade de excitação desses plasmons
no fluxo de outros processos eletrônicos.

1.5 Condutividade Térmica de um Metal


O sucesso mais impressionante do modelo de Drude, na época em que foi
proposto, foi a explicação da lei empírica de Wiedemann e Franz (1853). A
lei de Wiedemann-Franz afirma que a razão entre as condutividades térmica
e elétrica, κ/σ,de um gande número de metais é diretamente proporcional
à temperatura, onde a constante de proporcionalidade, grosso modo, é a
mesma para todos os metais. Esta excepcional regularidade pode ser vista
na Tabela 1.6, onde mostramos a condutividade térmica medida experi-
mentalmente para vários metais a 273 K e 373 K, juntamente com a razão
κ/σ (conhecida como número de Lorentz) para as duas temperaturas.
Neste caso, o modelo de Drude considera que a corrente térmica no metal
seja transportada pelos elétrons de condução. Esta hipótese é baseada na
observação empírica de que os metais são melhores condutores de calor do
que os isolantes. Então, a condução térmica pelos íons27 (presentes tanto
nos metais como nos isolantes) é muito menos importante do que a con-
dução térmica pelos elétrons de condução (presentes somente nos metais).
Para definir e estimar a condutividade térmica, considere uma barra
metálica, cuja temperatura varia pouco a pouco ao longo de seu compri-
mento. Se não existir nenhuma fonte ou sorvedor de calor nas extrimidades
da barra para manter o gradiente de temperatura, então, a extremidade
mais aquecida se resfria, enquanto que a extremidade mais fria se aquece,
isto é, a energia térmica flui no sentido oposto ao do gradiente de temper-
atura. Fornecendo-se calor à extremidade mais aquecida a uma taxa maior
do que a que ele flui para a outra extremidade, podemos produzir um estado
estacionário no qual estejam presentes tanto um gradiente de temperatura,
como um fluxo uniforme de calor. Definimos a densidade de corrente tér-
mica jq como um vetor paralelo ao fluxo de calor, cujo módulo é a energia
térmica por unidade de tempo que atravessa um área unitária perpendicu-

2 6 C. J. Pourcel and J. B. Swan, Phys. Rev. 115, 869 (1959).


2 7 Embora os íons metálicos não possam vagar livremente pelo metal, existe uma
maneira pela qual eles podem transportar energia térmica (mas não corrente elétrica):
os íons podem ter pequenas vibrações em torno de suas posições médias, dando origem
à transmissão de energia térmica na forma de propagação de ondas elásticas através da
rede de íons. Veja Capítulo 25.
1.5 Condutividade Térmica de um Metal 21

lar ao fluxo.28 Para pequenos gradientes de temperatura, observa-se que a


corrente térmica é proporcional a ∇T (lei de Fourier):

jq = −κ∇T (1.47)

A constante de proporcionalidade κ é conhecida como condutividade tér-


mica, e é sempre positiva, uma vez que o fluxo de calor é sempre oposto à
direção do gradiente de temperatura.
Como um exemplo concreto, vamos examinar um caso onde a variação
da temperatura é uniforme na direção positiva do eixo-x. No estado esta-
cionário, a corrente térmica flui na direção-x e tem uma magnitude j q =
−κ dT /dx. Para calcularmos a corrente térmica, observamos que (hipótese
4, página 1.1) após cada colisão um elétron emerge com uma velocidade
apropriada à temperatura local; quanto maior for a temperatura do local da
colisão, maior será a energia com que o elétron emergirá dessa colisão. Con-
sequentemente, mesmo quando a velocidade eletrônica média num ponto
se anular (diferente do caso do fluxo elétrico) os elétrons que atingem o
ponto, vindos da região de temperatura mais alta terá energia maiores do
que aqueles oriundos da região de temperatura mais baixa, dando origem
a um fluxo térmico resultante dirigido para o lado de temperatura mais
baixa (Figura 1.6).
Para obtermos uma estimativa quantitativa, usando esta idéia, vamos
considerar inicialmente um modelo “unidimensional” bastante simplificado,
no qual os elétrons podem se mover apenas na direção-x,tal que num ponto
x, metade dos elétrons vêm do lado de maior temperatura e a outra metade,
do de baixa temperatura. Se ε (T ) for a energia térmica por elétron num
metal em equilíbrio térmico à temperatura T,então um elétron, cuja última
colisão ocorreu ponto x0 , terá, em média, uma energia térmica ε (T [x0 ]) .
Os elétrons que chegam a x pelo lado da alta temperatura, em média,
tiveram a sua última colisão em x − vτ , e então transportarão uma energia
térmica por elétron de valor igual ε (T [x − vτ ]). Suas contribuições para a
densidade de corrente térmica em x serão então o número desses elétrons
por volume de unidade, n/2, vezes sua velocidade, v, vezes esta energia, ou
(n/2) v ε (T [x + vτ ])
Ao atingirem o ponto x,os elétrons vindos do lado de alta temperatura
sofreram a última colisão, em média, na posição x − vτ , e, portanto, trans-
portam uma energia térmica por elétron de valor igual a ε (T [x − vτ ]) . A
contribuição desses elétrons à densidade de corrente térmica no ponto x
será o número de tais elétrons por unidade de volume, n/2, vezes a veloci-
dade, v, vezes esta energia, ou seja, (n/2) vε (T [x − vτ ]) . Por outro lado,
os elétrons que chegam ao ponto x pelo lado de menor temperatura, con-
tribuirão para a corrente com o valor de (n/2) v ε (T [x + vτ ]) , uma vez que

2 8 Note a analogia com a definição de densidade de corrente elétrica j, assim como a

analogia entre as leis de Ohm e Fourier.


22 1. Teoria de Drude para os Metais

eles vêm da direção-x positiva e se movem no sentido negativo do eixo-x.


Fazendo-se a soma, obtém-se
1
jq = nv {ε (T [x − vτ ]) − ε (T [x + vτ ])} (1.48)
2
Supondo-se que a variação na temperatura sobre um caminho livre médio
(` = vτ ) seja muito pequena,29 podemos expandir essas expressões em
torno do ponto x,encontrando
µ ¶
∂ε ∂T
j q = nv 2 τ − (1.49)
∂T ∂x

Para generalizar este resultado para o caso tridimensional, precisamos


apenas substituir v pela componente vx da velocidade eletrônica v, e fazer
a média sobre todas as direções. Como30 hvx2 i = hvy2 i = hvz2 i = 31 v 2 , e
ndε/dT = (N/V ) dε/dT = (dE/dT ) /V = cv , o calor específico eletrônico,
temos
1
jq = v 2 τ cv (−∇T ) (1.50)
3
ou
1 1
κ = v 2 τ cv = v`vcv , (1.51)
3 3
onde v 2 é a velocidade quadrática média dos elétrons.
Enfatizamos a aspereza deste argumento. Falamos muito fluentemente
sobre a energia térmica por elétron transportada por um grupo particu-
lar de elétrons, uma quantidade que se poderia ficar em dificuldades para
definir com precisão. Também fomos bastante descuidados ao substituirmos
quantidades, em várias fases do cálculo, por suas médias térmicas. Por ex-
emplo, se poderia alegar que se a energia térmica por elétron depende da
direção de onde vêm os elétrons, assim será sua velocidade média, pois esta
também depende da temperatura no lugar de sua última colisão. Notare-
mos abaixo que este último lapso é cancelado por, também, outra omissão,
e no Capítulo 13 encontraremos, por um argumento mais rigoroso, que o re-
sultado (1.51) é bem próximo (e, em circunstâncias especiais, exatamente)
do resulatdo correto.
Dado a estimativa (1.51), podemos derivar outro resultado independente
dos mistérios embutidos no tempo de relaxação τ , dividindo-se a condu-
tividade térmica pela condutividade elétrica (1.6):
1 2
κ 3 cv mv
= (1.52)
σ ne2

2 9 A variação da temperatura num comprimento ` é `/L vezes a variação da temper-

atura no comprimento L da amostra.


3 0 No equilíbrio, a distribuição de velocidades é isotrópica. Correções devidas ao gra-

diente de temperatura são extremamente pequenas.


1.5 Condutividade Térmica de um Metal 23

Era natural para Drude aplicar as leis clássicas dos gases ideais, calcu-
lando o calor específico electrônico e a velocidade quadrática média. Assim,
cosiderou cv como sendo 32 nkB e 21 mv2 como 32 kB T, onde kB é a constante
de Boltzmann, 1, 38 × 10−16 erg/K. Isto conduz ao resultado
µ ¶2
κ 3 kB
= T (1.53)
σ 2 e

O lado direito de (1.53) é proporcional a T e só depende das constantes


universais kB e e, em completa concordância com a lei de Wiedemann e
Franz. A Eq. (1.53) dá um número de Lorenz31
µ ¶2
κ 3 kB 2
= = 1, 24 × ×10−13 (erg/esu-K)
σT 2 e (1.54)
= 1, 11 × ×10−8 W-Ω/K2

que é aproximadamente metade do valor típico mostrado na Tabela 1.6.


Em seu cálculo original da condutividade elétrica, Drude encontrou er-
roneamente metade do resultado correto (1.6), como resultado do que ele
encontrou κ/σT = 2, 22 × 10−8 W-Ω/K2 em extraordinária concordância
com o resultado experimental.
Este sucesso, embora inteiramente casual, foi tão impressionante ao ponto
de estimular novas investigações com o modelo. Isto porém, era muito
enignático, uma vez que nenhuma contribuição eletrônica ao calor especí-
fico ao menos remotamente comparável ao valor 23 kB T nunca era observada.
Mesmo à temperatura ambiente não parecia haver nenhuma contribuição
eletrônica ao calor específico medido experimentalmente. No Capítulo 2,
mostraremos que as leis dos gases clássicos ideais não podem ser aplicadas
ao gás de elétrons num metal. O sucesso de Drude, à parte o fator 2 enganos
seus, é uma consequência de dois erros da ordem de 100 que se cancelam: à
temperatura ambiente, a contribuição eletrônica correta ao calor específico
é da ordem de 100 vezes menor do que a previsão clássica, enquanto que a
velocidade média eletrônica é 100 vezes maior
No Capítulo 2, examinaremos a teoria correta das propriedades de equi-
líbrio do gás de elétrons livres e retornaremos a uma melhor análise da
condutividade térmica de um metal no Capítulo 13. Porém, antes de con-
cluirmos o assunto sobre transporte térmico, devemos corrigir uma simpli-
ficação introduzida em nossa análise que torna obscuro um fenômeno físico
importante:
Calculamos a condutividade térmica, ignorando todas as manifestações
do gradiente de temperatura, com exceção do fato que a energia térmica
transportada por um grupo de elétrons depende da temperatura no lugar

3 1 Uma vez que (J/C)2 = (W/A)2 = W-Ω, as unidades práticas em que os números de

Lorentz são representados são chamados, às vezes, de W-Ω/K 2 ao invés de (J/C-K)2 .


24 1. Teoria de Drude para os Metais

da sua última colisão. Mas se elétrons emergem de uma colisão com energias
maiores quando a temperatura é mais alta eles também terão velocidades
maiores. Pareceria então que nós permitiríamos que a velocidade eletrônica
v assim como sua contribuição para a energia térmica dependesse do lugar
da última colisão. Como se mostra tal termo adicional só altera o resultado
por um fator da ordem da unidade, mas nós estávamos de fato muito cer-
tos ao ignorarmos tal correção. É verdade que imediatamente depois que o
gradiente de temperatura é aplicado haverá um velocidade eletrônica mé-
dia não nula dirigida para a região de baixa temperatura.Considerando que
os elétrons são carregados, porém, esta velocidade resultará numa corrente
elétrica. Mas as medidas de condutividades térmicas são executadas sob
condições de circuito aberto, no qual nenhuma corrente elétrica pode fluir.
Então a corrente elétrica só pode continuar até que se acumule bastante
carga na superfície da amostra para formar um campo elétrico retardador
que se opõe à acumulação adicional de carga, e conseqüentemente, can-
cela exatamente o efeito do gradiente de temperatura sobre a velocidade
média eletrônica.32 Quando o estado estacionário é atingido não haverá
nenhum fluxo corrente elétrica, e estávamos então corretos admitindo que
a velocidade eletrônica média se anulava num ponto.
Desta maneira, somos conduzidos a considerar outro efeito físico: um
gradiente de temperatura numa barra longa e delgada deveria ser acom-
panhado por um campo elétrico dirigido no sentido oposto ao do gradiente
de temperatura. A existência de tal um campo, conhecido como campo
termoelétrico, era conhecida por algum tempo (o efeito Seebeck). O campo
é escrito convencionalmente como

E = Q ∇T (1.55)

e a constante de proporcionalidade é conhecida como termopotência. Para


estimar a termopotência, devemos observar que em nosso modelo “unidi-
mensional” a velocidade eletrônica média num ponto x devido ao gradiente
de temperatura é:
1 dv
vQ = [v (x − vτ ) − v (x + vτ )] = −v
2 µ ¶ dx
d v2
= −v (1.56)
dx 2

Podemos novamente generalizar para três dimensões33 fazendo-se v2 → vx2


e notando-se que hvx2 i = hvy2 i = hvz2 i = 13 v 2 , tal que

τ dv2
vQ = − (∇T ) (1.57)
6 dT

3 2 Veja discussão análoga da origem do campo Hall na página .


3 3 Cf. a discussão que nos levou da Eq. (1.49) para a Eq. (1.50).
1.6 Problemas 25

A velocidade média devido ao campo elétrico é34


eEτ
vE = − (1.58)
m
Para se ter vQ + vE = 0,devemos fazer
µ ¶
1 d mv2 cv
Q=− =− . (1.59)
3e dT 2 3ne
Este resultado é também independente do tempo de relaxação. Drude
obteve-o por outra aplicação inadequada da mecânica clássica, fazendo cv
igual a 3nkB /2, para encontrar que
k
Q=− = −0, 43 × 10−4 V/K (1.60)
2e
Valores de termopotências metálicas medidos à temperatura ambiente são
da ordem de microvolts por Kelvin, um fator de 100 vezes menor. Este
é o mesmo erro de 100, que apareceu duas vezes na derivação da lei de
Wiedemann-Franz, só que agora não há compensação, o que mostra sem
ambiguidades a inadequação da mecânica estatística clássica em descrever
o gás de eléron metálico.
Com o uso da mecânica estatística quântica, remove-se esta discrepância.
Porém, em alguns metais, o sinal da termopotência - a direção do campo
termoelétrico - é oposto àquele predito pelo modelo de Drude. Isto é tão mis-
terioso quanto a discrepância no sinal do coeficiente Hall. A teoria quântica
dos sólidos também pode explicar a inversão de sinal na termopotência, mas
a sensação de triunfo, neste caso, deve ser um pouco moderado, pois ainda
está faltando uma teoria realmente quantitativa do campo termoelétrico.
Veremos em disscussões futuras algumas das peculiaridades deste fenômeno
que o fazem particularmente difícil de calcular com precisão.
Estes últimos exemplos deixaram claro que não podemos ir muito longe
com uma teoria de elétrons livres sem o uso apropriado da estatística quân-
tica. Este será o assunto do Capítulo 2.

1.6 Problemas

1. Distribuição de Poisson
No modelo de Drude, a probabilidade de que um elétron sofra uma
colisão num intervalo de tempo infinitesimal dt é dt/τ .

3 4 Veja discussão na página .


26 1. Teoria de Drude para os Metais

(a) Mostre que, para um elétron escolhido aleatoriamente num dado


instante, a probabilidade de não ter sofrido nenhuma colisão du-
rante os t segundos anteriores, é e−t/τ . Mostre que a probabil-
idade para que este elétron não sofra nenhuma colisão durante
os próximos t segundos, é a mesma.
(b) Mostre que a probabilidade para que o intervalo de tempo en-
tre duas colisões sucessivas do elétron esteja entre t e t + dt é
(dt/τ ) e−t/τ .
(c) Mostre, como conseqüência de (a), que em qualquer instante
o tempo médio, calculado sobre todos os elétrons, decorrido a
partir da última colisão (ou até a próxima colisão) é τ .
(d) Mostre, como conseqüência de (b), que o tempo médio entre
colisões sucessivas de um elétron é τ .
(e) O ítem (c) implica que, em qualquer instante, o tempo T entre
a última colisão e a próxima é 2τ , calculada a média sobre todos
os elétrons . Explique por que este resultado não é incompatível
com aquele obtido no ítem (d). (Uma explicação rigorosa deve-
ria incluir uma derivação da distribuição de probabilidade para
T .) O erro ao apreciar esta sutileza, levou Drude a estimar a
condutividade elétrica como sendo a metade do valor de (1.6).
Ele não cometeu o mesmo engano na condutividade térmica, daí
a origem do fator de dois que aparece em seu cálculo do número
de Lorenz (veja página 23).

2. Aquecimento Joule
Considere um metal à temperatura uniforme num campo elétrico uni-
forme e estático E. Um elétron sofre uma colisão, e então, depois de
um tempo t, uma segunda colisão. No modelo de Drude, a energia
não é conservada durante as colisões, pois a velocidade média de um
elétron que sai de uma colisão não depende da energia que ele havia
adquirido do campo durante o intervalo de tempo que precedeu a
colisão (hipótese 4, página 7).

(a) Mostre que a energia média que os elétrons perdem para os íons
na segunda de duas colisões seperadas por um intervalo de tempo
t, é (eEt)2 /2m. (A média é tomada sobre todas as direções nas
quais o elétron é lançado após a primeira colisão)
(b) Mostre, usando o resultado do Problema 1(b), que a perda média
de energia para os íons por elétron por colisão é (eEτ )2 /2m, e,
então,
¡ 2 que ¢ a perda média por centímetro cúbico por segundo é
ne τ /m E 2 = σE 2 . Mostre que a perda de potência num fio
de comprimento L e de área de seção transversal A é I 2 R,onde
I é a corrente que flui e R, a resistência do fio.
1.6 Problemas 27

3. Efeito Thomson
Suponha que, além do campo elétrico no Problema 2, aplica-se no
metal um gradiente uniforme de temperatura ∇T . Uma vez que
o elétron sai de uma colisão com uma energia que é determinada
pela temperatura local, a perda de energia nas colisões dependerá da
variação do valor desse gradiente e da quantidade de energia que os
elétrons adquirem do campo elétrico entre as colisões. Consequente-
mente, a perda de potência conterá um termo proporcional a E · ∇T
(que é facilmente isolado dos outros termos, pois é um termo de se-
gunda ordem na perda de energia, que troca de sinal, quando o sinal
de E é invertido). Mostre que esta contribuição é dada, no modelo
de Drude, pelo termo da ordem de (neτ /m) (dε/dT ) (E · ∇T ) , onde
ε é a energia média térmica por elétron. (Calcule a perda de energia
por um dado elétron colidindo no ponto r, após ter sofrido a última
colisão no ponto r − d. Considerando que o tempo de relaxação τ seja
fixo (isto é, independente da energia), d pode ser encontrado como
função do campo e do gradiente de temperatura, até primeira ordem,
por argumentos cinemáticos simples, que é suficiente para se obter a
perda de energia até segunda ordem.)
4. Ondas de Helicon
Suponha que uma metal seja colocado num campo magnético uni-
forme H dirigido ao longo do eixo-z. Seja e−iωt um campo AC apli-
cado perpendicularmente a H.

(a) Se o campo elétrico for polarizado circularmente (Ey = ±iEx ) ,


mostre que a Eq. (1.28) deve ser generalizada para
µ ¶
σ0
jx = Ex , jy = ±ijx , jz = 0 (1.61)
1 − i (ω ∓ ω c ) τ

(b) Mostre que, usando (1.61), as equações de Maxwell (1.31) têm


solução

Ex = E0 ei(kz−ωt) , Ey = ±iEx , Ez = 0 (1.62)

com k2 c2 =∈ ω 2 , onde
µ ¶
ω 2p 1
∈ (ω) = 1 − (1.63)
ω ω ∓ ω c + i/τ

(c) Faça um esboço de ∈ (ω) para ω > 0 (escolhendo a polarização


Ey = iEx ) e demonstre que existem soluções para k2 c2 =∈ ω 2
com k arbitrário para frequências ω > ω p e ω < ω c . (Considere
válida a condição ω c τ À 1 para campos elevados, e observe que,
mesmo para centenas de kilogauss, ω p /ω c À 1.)
28 1. Teoria de Drude para os Metais

(d) Mostre que, quando ω ¿ ω c , a relação entre k e ω para a solução


de baixa frequência é
µ 2 2¶
k c
ω = ωc (1.64)
ω 2p

Esta onda de baixa frequência, conhecida como helicon, já foi


observada em muitos metais.35 Estime a frequência do helicon
para um comprimento de onda de 1 cm e um campo magnético
aplicado de 10 kG, para densidades metálicas.

5. Plasmons Superficiais
Uma onda eletromagnética que pode ser propagar na superfície de um
metal complica a observação de plasmons ordinários (bulk ). Considere
o metal contido no semi-espaço z > 0 e o vácuo, no semi-espaço z < 0.
Admita que a densidade de carga elétrica ρ, que aparece nas equações
de Maxwell, se anule tanto dentro, quanto fora do metal. (Isto não
impede uma concentração de densidade superficial de carga no plano
z = 0.) O plasmon superficial é uma solução das equações de Maxwell
da forma:
Ex = A eiqx e−Kz , Ey = 0, Ez = B eiqx e−Kz , z > 0;
0 0
Ex = C eiqx eK z , Ey = 0, Ez = B eiqx eK z , z > 0; (1.65)

q, K, K 0 real, K, K 0 positivo

(a) Usando as condições de contorno usuais (Ek contínuo e (∈ E)⊥


contínuo) e os resultados de Drude (1.35) e (1.29), encontre três
equações relacionando q, K e K 0 em função de ω.
(b) Supondo ωτ À 1, plote q 2 c2 em função de ω 2 .
(c) No limite quando qc√À ω, mostre que existe uma solução com
frequência ω = ω p / 2. Mostre, por inspeção de K e K 0 , que
a onda está confinada na superfície. Descreva sua polarização.
Esta onda é conhecida como plasmon superficial.

3 5 R. Bowers et al., Phys. Rev. Letters 7, 339 (1961).


This is page 29
Printer: Opaque this

2
Teoria de Sommerfeld de Metais

Na época de Drude, e por muitos anos depois, parecia razoável supor que
a distribuição de velocidade eletrônica, como aquela de um gás clássico
ordinário de densidade n = N/V , fosse dada no equilíbrio à temperatura T
pela distribuição de Maxwell-Boltzmann. Tal distribuição nos dá o número
de elétrons por unidade de volume com velocidades no intervalo1 dv em
torno de v como fB (v) dv, onde
µ ¶3/2
m 2
fB (v) = n e−mv /2kB T
(2.1)
2πkB T

Dissemos no Capítulo 1 que, juntamente com o modelo de Drude, esta


função de distribuição leva a uma boa concordância na ordem de grandeza
com a lei de Wiedemann-Franz, mas também prediz uma contribuição para
o calor específico de um metal de 32 kB T por elétron que não era observada.2
Este paradoxo, que pôs em dúvida o modelo de Drude durante um quarto
de um século, só foi resolvido pelo advento da teoria quântica e o recon-
hecimento de que, para elétrons,3 o princípio de exclusão Pauli requer a

1 Usamos a notação vetorial padrão. Assim, v representa o módulo do vetor v;uma


velocidade está no intervalo dv em torno de v se sua i -ésima componente estiver entre
vi e vi + dvi , para i = x, y, z; usamos também dv para representar o volume da região
do espaço das velocidades, no intervalo dv em torno de v: dv = dvx dvy dvz .
2 Porque, como veremos, a contribuição eletrônica correta é da ordem de 100 vezes

menor à temperatura ambiente, do que aquela prevista no modelo clássico, tornando-se


ainda menor à medida que a temperatura diminui.
3 E para todas as partículas obedecendo a estatística de Fermi-Dirac.
30 2. Teoria de Sommerfeld de Metais

substituição da distribuição de Maxwell-Boltzmann (2.1) pela distribuição


de Fermi-Dirac:

(m/~)3 1
fB (v) = 3
£¡ 1
2
¢ ¤ (2.2)
4π exp 2 mv − kB T0 /kB T + 1

Aqui ~ é a constante de Planck dividida por 2π, e T0 é uma temperatura


determinada pela condição de normalização4
Z
n= dv f (v) (2.3)

e é tipicamente dezenas de milhares de graus. Para temperaturas de inter-


esse (isto é, menores do que 103 K) as distribuições de Maxwell-Boltzmann
e Fermi-Dirac são bastante diferentes para densidades eletrônicas típicas
de metal (Figura 2.1)
Neste capítulo, descreveremos a teoria baseada na distribuição de Fermi-
Dirac (2.2) e examinamos as consequências da estatística de Fermi-Dirac
para o gás de elétrons em metais.
Logo depois da descoberta de que o princípio de exclusão de Pauli era
necessário para tratar estados eletrônicos ligados de átomos, Sommerfeld
aplicou esse mesmo princípio ao gás de elétrons livres em metais e assim
resolveu a anomalia térmica mais visível do modelo anterior de Drude. Na
maioria das aplicações, o modelo de Sommerfeld nada mais é do que o gás
de elétron clássico de Drude com a única modificação de que a distribuição
de velocidade eletrônica é a distribuição quântica de Fermi-Dirac, ao in-
vés da distribuição clássica de Mawell-Boltzmann. Para justificar o uso da
distribuiç ão de Fermi-Dirac em conexão com a teoria clássica, devemos
analisar a teoria quântica do gás de elétrons.5
Por simplicidade, examinaremos o estado fundamental (i.e., T = 0) do
gás de elétron antes de estudá-lo a temperaturas diferentes de zero. Como
veremos, as propriedades do estado fundamental em si são de grande in-
teresse: mostraremos que a temperatura ambiente para o gás de elétron a
densidades metálicas é, na verdade, uma temperatura ainda muito baixa
e para muitos propósitos indistinguível de T = 0. Assim, mesmo à tem-
peratura ambiente, muitas das propriedades eletrônicas de um metal (mas
nem todas) quase não diferem de seus valores a T = 0.

4 Note que as constantes na distribuição de Maxwell-Boltzmann (2.1) já foi escolhida,

satisfazendo a condição (2.3). A Eq. (2.2) é obtida abaixo; veja Eq. (2.89). No Problema
3d o pré-fator que aparece na Eq. (2.2) é colocado numa forma que facilite a comparação
direta com a Eq. (2.1).
5 Neste capítulo, o termo ”gás de elétron” significa um gás de elétrons livre e inde-

pendente (veja página 6), a menos que se considere explicitamente as correções devido
às interações elétron-elétron ou elétron-íon.
2.1 Propriedades do Estado Fundamental do Gás de Elétrons 31

2.1 Propriedades do Estado Fundamental do Gás


de Elétrons
Vamos calcular as propriedades do estado fundamental de N elétrons con-
finados a um volume V. Uma vez que os elétrons não interagem entre si
(aproximação de elétron independente) podemos determinar o estado fun-
damental do sistema de N elétrons, determinando-se inicialmente os níveis
de energia de um único elétron no volume V, e, em seguida, preenchendo-se
estes níveis de uma maneira consistente com o princípio de exclusão de
Pauli, que permite, no máximo, que um elétron ocupe qualquer um desses
níveis.6
Um único elétron pode ser descrito por uma função de onda ψ (r) e a
especificação de qual das duas possíveis orientações possui seu spin. Se
o elétron não sofre nenhuma interação, a função de onda associada com
o nível de energia ε satisfaz a equação de Schrödinger independente do
tempo:
µ 2 ¶
~2 ∂ ∂2 ∂2 ~2 2
− + + ψ (r) = − ∇ ψ (r) = εψ (r) (2.4)
2m ∂x2 ∂y 2 ∂z 2 2m

Representaremos o confinamento do elétron (pela atração dos íons) ao


volume V, através da condição de contorno sobre a Eq. (2.4). A escolha da
condição de contorno, sempre que se está se tratando de problemas que não
estão relacionados explicitamente com os efeitos da superfície metálica, é
a uma condição importante que temos à nossa disposição e pode ser de-
terminada por conveniência matemática, pois, se o metal é suficientemente
volumoso, deveríamos esperar que suas propriedades de volume (bulk) não
sejam afetadas pela configuração detalhada de sua superfície. Com este es-
pírito, primeiro selecionamos a forma do metal que seja adequada à nossa
conveniência analítica. A escolha usual é um cubo de lado L = V 1/3 .
O próximo passo é a escolha de uma condição de contorno para a equação
de Scrödinger (2.4), refletindo o fato de que os elétrons estejam confinados
neste cubo. Faremos esta escolha, certos de que isso não afetará as pro-
priedades de bulk que serão calculadas. Uma das possibilidades é impor
que a função de onda ψ (r) se anule para r sobre a superfície do cubo. Isto,
porém, é às vezes insatisfatório, pois leva a soluções de ondas estacionárias
da Eq. (2.4), enquanto que o transporte de carga e energia pelos elétrons é,
de longe, mais convenientemente discutido em termos de ondas itinerantes.
Uma escolha mais satisfatória é enfatizar a insignificância da superfície,
dispondo dela completamente. Isto pode ser feito, imaginando-se cada face
do cubo unindo-se à face oposta, de forma que um elétron que chega à
superfície não seja por ela refletido, mas deixa o metal, reentrando simul-

6 Deste ponto em diante, reservaremos o termo ”estado” para nos referirmos ao estado

do sistema de N elétrons e o termo ”nível”, para o estado de um elétron.


32 2. Teoria de Sommerfeld de Metais

taneamente num ponto correspondente sobre a superfície oposta. Assim, se


o nosso metal fosse unidimensional, poderíamos simplesmente substituir a
linha de 0 a L, à qual o elétron estivesse confinado, por um círculo de cir-
cunferência L. Em três dimensões, a incorporação geométrica da condição
de contorno, na qual os três pares de faces opostas no cubo estejam unidas,
torna-se topologicamente impossível de se construir no espaço tridimen-
sional. Entretanto, a forma analítica da condição de contorno é facilmente
generalizada. Em uma dimensão, o modelo circular de um metal resulta na
condição de contorno ψ (x + L) = ψ (x) ,e a generalização ao cubo tridi-
mensional é, evidentemente,
ψ (x, y, z + L) = ψ (x, y, z)
ψ (x, y + L, z) = ψ (x, y, z) (2.5)
ψ (x + L, y, z) = ψ (x, y, z)
A Eq. (2.5) é conhecida como condição de contorno de Born-von Karman
(ou condição de contorno periódica). A encontraremos freqüentemente (às
vezes numa forma ligeiramente generalizada7 ).
Resolveremos a Eq. (2.4) sujeita à condição de contorno (2.5). Verifica-se
por diferenciação direta que a solução, ignorando-se a condição de contorno,
é
1
ψ k (r) = √ eik·r (2.6)
V
com energia
~2 k2
ε (k) = (2.7)
2m
onde k é qualquer vetor independente da posição. Escolhemos a constante
de normalização em (2.6) tal que a probabilidade de se encontrar o elétron
em qualquer posição dentro do volume V seja igual a um, isto é:
Z
2
1 = dr |ψ (r)| (2.8)

Para entendermos o significado do vetor k, notamos que o nível ψ k (r) é


um autoestado do operador momento,
µ ¶
~ ∂ ~ ~ ∂
p= = ∇, px = , etc. , (2.9)
i ∂r i i ∂x
com autovalor p = ~k, pois
~ ∂ ik·r
e = ~k eik·r (2.10)
i ∂r

7 Mais tarde, será mais conveniente não usarmos um cubo, mas um paralelepípedo

de arestas não necessariamente iguais ou perpendiculares. Para enquanto, usamos um


cubo para evitarmos complexidades geométricas desnecessárias, mas é um bom exercício
verificar que todos os resultados desta seção permanecem válidos para o paralelepípedo.
2.1 Propriedades do Estado Fundamental do Gás de Elétrons 33

Como para uma partícula num autoestado de um operador tem um valor


definido do correspondente observável dado pelo autovalor, um elétron no
nível ψ k (r) tem um momento definido proporcianal a k:

p = ~k (2.11)

e uma velocidade v = p/m de

~k
v= (2.12)
m
Em vista disso, a energia (2.7) pode ser escrita na forma clássica usual:

p2 1
ε= = mv2 (2.13)
2m 2
Podemos interpretar k como um vetor de onda. A onda plana eik·r é
constante em qualquer plano perpendicular a k (desde que tais planos se-
jam definidos pela equação k · r = constante) e é periódica numa direção
paralela a k,com comprimento de onda

λ= (2.14)
k
conhecido como comprimento de onda de de Broglie.
Agora aplicamos a condição de contorno (2.5). Isto impõe a k a condição
de que somente certos valores discretos sejam permitidos, pois a Eq. (2.5)
só será satisfeita pela função de onda geral (2.6) somente se

eikx L = eiky L = eikz L = 1 (2.15)

Como ez = 1 somente se z = 2πin, onde n é um inteiro8 , as componentes


do vetor de onda k devem ser da forma:
2πnx 2πny 2πnz
kx = , ky = , kz = , nx , ny , nz inteiros (2.16)
L L L
Então num espaço tridimensional com eixos cartesianos kx , ky e kz (con-
hecido como espaço-k) os vetores de onda permitidos são aqueles cujas
coordenadas ao longo dos três eixos são dados por múltiplos inteiros de
2π/L. Isto está ilustrado na Figura 2.2 (em duas dimensões).
Geralmente, a única utilização prática que se faz da condição de quanti-
zação (2.16) é a seguinte: às vezes precisa-se saber quantos valores permi-
tidos de k estão contidos numa região do espaço-k que é muito grande em
comparação com 2π/L,e que portanto contém um número muito grande

8 Sempre usamos a palavra ”inteiro” com o significado de inteiros positivos, zero ou

negativos.
34 2. Teoria de Sommerfeld de Metais

de pontos permitidos. Se a região for muito grande,9 então uma excelente


aproximação para se calcular o número de pontos permitidos é justamente
o volume do espaço-k contido nessa região, dividido pelo volume ocupado
por cada valor de k na rede dos valores permitidos de k. Este último vol-
ume (veja Figura 2.2) é igual a (2π/L)3 . Concluímos, portanto, que, uma
região do espaço-k de volume Ω, conterá

Ω ΩV
3 = (2.17)
(2π/L) 8π3

valores permitidos de k, ou, equivalentemente, que o número de valores de


k permitidos por unidade de volume do espaço-k (também conhecido como
densidade de níveis no espaço-k) é igual a

V
(2.18)
8π 3
Na prática, lidaremos com regiões do espaço-k tão grandes (∼ 1022 pontos)
e regulares (tipicamente esferas) que, para todos os efeitos, as Eqs. (2.17) e
(2.18) podem ser consideradas exatas. Brevemente, começaremos a aplicar
essas importantes fórmulas de contagem.
Como consideramos que os elétrons são não-interagentes, podemos con-
struir o estado fundamental de N -elétrons, colocando-se elétrons nos níveis
permitidos de um-elétron que acabamos de determinar. O princípio de ex-
clusão de Pauli tem um papel fundamental nesta construção (assim como
acontece com os estados atômicos de muitos elétrons): podemos colocar no
máximo um elétron em cada nível de um-elétron. Os níveis de um-elétron
são especificados pelos vetores de onda k e pela projeção do spin do elétron
sobre um eixo arbitrário, que pode ter apenas um dos dois valores: +~/2 ou
−~/2. Portanto, associados com cada vetor de onda k permitido existem
dois níveis eletrônicos, um para cada direção do spin do elétron.
Então, ao construirmos o estado fundamental de N -elétrons, começamos
colocando dois elétrons no nível de um-elétron com vetor de onda k = 0, que
tem a menor energia de um-elétron possível, ε = 0. Continuamos, então,
adicionando elétrons, preenchendo-se sucessivamente os níveis de energia
mais baixa de um-elétron que ainda não estejam ocupados. Como a energia
de um nível de um-elétron é diretamente proporcional ao quadrado de seu
vetor de onda (veja (2.7)), então, quando N for muito grande a região
ocupada será praticamente uma esfera.10 O raio dessa esfera é chamado de
kF (F de Fermi), e seu volume Ω é igual a 4πkF3 /3. De acordo com a Eq.

9 E de forma não muito irregular; somente uma fração desprezível dos pontos deveria

estar dentro dos limites de O(2π/L) da superfície.


1 0 Se a superfície não fosse esférica, não seria o estado fundamental, pois então constru-

iríamos um estado de energia mais baixa, movendo-se os elétrons de níveis mais distantes
de k = 0 para níveis não-ocupados mais próximos da origem.
2.1 Propriedades do Estado Fundamental do Gás de Elétrons 35

(2.17), o número de valores de k permitidos no interior da esfera é


µ ¶µ ¶
4πkF3 V kF3
= V (2.19)
3 8π 3 6π2
Como cada valor de k permitido corresponde a dois níveis de um-elétron
(um para cada valor do spin), para acomodarmos os N elétrons devemos
ter
k3 k3
N = 2 · F2 V = F2 V (2.20)
6π 3π
Então, se temos N elétrons num volume V (i.e., uma densidade eletrônica
n = N/V ), o estado fundamental do sitema de N -elétrons é formado,
preenchendo-se todos os níveis de uma-partícula com k menor do que kF ,
deixando-se vazios todos aqueles níveis com k maior do que kF , onde kF é
dado pela condição:
k3
n = F2 (2.21)

Este estado fundamental de elétron livre e independente é descrito por
algumas terminologias bastante triviais:
A esfera de raio kF (vetor de onda de Fermi ) contendo os níveis de um-
elétron ocupados é chamada de esfera de Fermi.
A superfície da esfera de Fermi, que separa os níveis ocupados daqueles
não-ocupados é chamada de superfície de Fermi. (Veremos, a partir do
Capítulo 8, que a superfície de Fermi é uma das construções fundamentais
na teoria moderna dos metais; em geral não é esférica.)
O momento ~kF = pF dos níveis de um-elétron ocupados de mais alta
energia é conhecido como momento de Fermi; sua energia, εF =.~2 kF2 /2m
é a energia de Fermi; e sua velocidade, vF = ~kF /m é a velocidade de
Fermi. O papel da velocidade de Fermi na teoria dos metais é comparável
ao da velocidade térmica, v = (3kB T /m)1/2 , no gás clássico.
Todas essas quantidades podem ser calculadas em termos da densidade
dos elétrons de condução, via Eq. (2.21). Para estimá-las numericamente às
vezes é mais conveniente expressá-las em termos do parâmetro adimensional
rs /a0 (veja 6), que varia entre 2 a 6 para elementos metálicos. Juntas, as
Eqs. (1.2) e (2.21), nos dão:

(9π/4)1/3 1, 92
kF = = (2.22)
rs rs
ou
3, 63 −1
kF = Å (2.23)
rs /a0
Como o vetor de onda de Fermi é da ordem do inverso de Angstrons, o
comprimento de onda de de Broglie dos elétrons mais energéticos é da
ordem de Angstrons.
36 2. Teoria de Sommerfeld de Metais

A velocidade de Fermi é
µ ¶
~ 4, 20
vF = kF = × 108 cm/s (2.24)
m rs /a0

Esta é uma velocidade relativamente grande (da ordem de 1 por cento da


velocidade da luz!). Do ponto de vista da mecânica estatística clássica este
resultado é surpreendente, pois, estamos descrevendo o estado fundamental
(T = 0) e todas as partículas num gás clássico têm velocidades nulas a T =
0. Mesmo à temperatura ambiente, a velocidade térmica (i.e., a velocidade
média) para uma partícula clássica com a mesma massa do elétron é apenas
da ordem de 107 cm/s.
A energia de Fermi é convenientemente escrita na forma (como a0 =
~2 /me2 ) µ 2 ¶
~2 kF2 e
εF = = (kF a0 )2 . (2.25)
2m 2a0
Aqui, e2 /2a0 ,conhecido como Rydberg (Ry), é a energia de ligação do es-
tado fundamental do átomo de hidrogênio, 13, 6 eV.11 O Rydberg é uma
unidade conveniente para medir energias atômicas, assim como o raio de
Bohr o é para as distâncias atômicas. Como kF a0 é da ordem da unidade,
a Eq. (2.25) demonstra que a energia de Fermi tem a magnitude de uma
energia típica de ligação atômica . Usando (2.23) e a0 = 0, 529 × 10−8 cm,
encontramos a forma numérica explícita:
50, 1 eV
εF = , (2.26)
(rs /a0 )2
indicando um intervalos de energias de Fermi para as densidades metálicas
entre 1, 5 e 15 eV.
A Tabela 2.1 mostra as energias de Fermi, velocidades e vetores de onda
para metais, cujas densidades de elétrons de condução são dadas na Tabela
1.1.
Para calcular a energia do estado fundamental de N -elétrons no volume
V devemos somar as energias de todos os níveis de um-elétron que estejam
dentro da esfera de Fermi12
X ~2
E=2 k2 (2.27)
2m
k<kF

Em geral, ao somarmos qualquer função F (k) bem comportada sobre todos


os valores permitidos de k, procede-se da seguinte maneira:

1 1 No sentido exato, o rydberg é a energia de ligação na aproximação da massa do


próton infinita. Um elétron-volt é a energia adquirida por um elétron ao cruzar um
potencial de 1 volt; 1 eV = 1, 602 × 10−12 erg = 1, 602 × 10−19 Joule.
1 2 O fator 2 é devido aos dois níveis de spin permitidos para cada k.
2.1 Propriedades do Estado Fundamental do Gás de Elétrons 37

Uma vez que o volume do espaço-k por valor permitido de k é ∆k =


8π 3 /V (veja Eq. (2.18)) é conveniente escrever
X V X
F (k) = F (k) ∆k (2.28)
8π 3
k k
P
para que, no limite quando
R ∆k → 0 (i.e., V → ∞), a soma F (k) ∆k
aproxime-se da integral dk F (k) , com a condição de que F (k) não varie
apreciavelmente13 sobre distâncias no espaço-k da ordem de 2π/L. Podemos
portanto rearranjar (2.28) e escrever

1 P R dk
V → ∞lim k F (k) = F (k) (2.29)
V 8π 3

Ao aplicarmos a Eq. (2.29) a sistemas P macroscopicamente grandes, mas


finitos, sempre se considera que (1/V ) k F (k) difere muito pouco do
seu limite para volume infinito (por exemplo, considera-se que a energia
eletrônica por unidade de volume num cubo de cobre de arestas de 1 cm é
a mesma que num cubo de 2 cm de arestas).
Usando-se a Eq. (2.29) para calcular (2.27), encontramos que a densidade
de energia do gás de elétrons é
Z
E 1 ~2 k2 1 ~2 kF5
= 3 dk = 2 . (2.30)
V 4π k<kF 2m π 10m

Para se obter a energia por elétron, E/N, no estado fundamental, devemos


dividir este resultado por N/V = n = kF3 /3π2 , o que nos dá

E 3 ~2 kF2 3
= = εF . (2.31)
N 10 m 5
Podemos também escrever este resultado como
E 3
= kB TF , (2.32)
N 5
onde TF , a temperatura de Fermi, é

εF 58, 2
2 × 10 K. (2.33)
4
TF = =
kB (rs /a0 )

Note que, ao contrário deste resultado, a energia por elétron num gás clás-
3
sico ideal, kB T, se anula quando T = 0, e atinge um valor tão grande
2
quanto ao da Eq. (2.32), somente para T = 52 TF ≈ 104 K.

1 3 O caso mais famoso em que esta condição não é satisfeita é a condensação de um

gás de Bose ideal. Nas aplicações em metais, este problema nunca aparece.
38 2. Teoria de Sommerfeld de Metais

Dado a energia do estado fundamental E, pode-se calcular a pressão


exercida pelo gás de elétrons, através da relação P = − (∂E/∂V )N . Como
E = 53 N εF e εF é proporcional a kF2 ,que depende de V somente através do
fator n2/3 = (N/V )2/3 ,segue-se que14
2E
P = (2.34)
3V
Pode-se também calcular a compressibilidade, K, ou seu inverso B =
1/K, o módulo volumétrico, definido por

1 ∂P
B= = −V (2.35)
K ∂V
Como E é proporcional a V −2/3 , a Eq. (2.34) mostra que P varia como
V −5/3 e, portanto,
5 10 E 2
B= P = = nεF (2.36)
3 9 V 3
ou µ ¶5
6, 13 2
B= × 1010 dyn/cm (2.37)
rs /a0
Na Tabela 2.2, comparamos os valores dos módulos volumétricos de
elétrons livres (2.37) calculados de rs /a0 , com os módulos volumétricos
medidos para vários metais. A concordância para os metais alcalinos mais
pesados é casualmente boa, mas mesmo quando a Eq. (2.37) dá valores
distantes daqueles medidos experimentalmente, como no caso dos metais
nobres, ainda assim o resultado está dentro da ordem de grandeza correta
(embora esse valores variem de três vezes para mais a três vezes para menos,
pela tabela). É absurdo esperar que, apenas a pressão do gás de elétrons
livres, deveria determinar completamente a resistência de um metal à com-
pressão, mas a Tabela 2.2 demonstra que esta pressão é pelo menos tão
importante quanto qualquer outro efeito..

2.2 Propriedades Térmicas do Gás de Elétron


Livre: A Distribuição de Fermi-Dirac
Quando a temperatura é diferente de zero, é necessário examinar os estados
excitados do sistema de N -elétrons, assim como seu estado fundamental,
pois de acordo com os princípios básicos da mecânica estatística, se um
sistema de N -elétrons está em equilíbrio térmico à temperatura T, então
suas propriedades podem ser calculadas, tomando-se médias sobre todos

1 4 A temperaturas diferentes de zero, a pressão e a densidade de energia continuam

obedecendo a esta relação. Veja Eq. (2.101).


2.2 Propriedades Térmicas do Gás de Elétron Livre: A Distribuição de Fermi-Dirac 39

os estados estacionários de N -partículas, atribuindo-se a cada estado de


energia E um peso PN (E) proporcional a e−E/kB T :

e−E/kB T
PN (E) = P −E N /k T (2.38)
e α B

(Aqui EαN é a energia do α-ésimo estado estacionário do sistema de N -


elétrons, a soma sendo sobre todos esses estados.)
O denominador de (2.38) é conhecido como função de partição, e é rela-
cionada com a energia livre de Helmholtz, F = U − T S (onde U é a energia
interna e S,a entropia) por
X N
e−Eα /kB T = e−FN /kB T (2.39)

Podemos portanto escrever (2.38) na forma mais compacta:

PN (E) = e−(E−FN )/kB T (2.40)

Devido ao princípio de exclusão, para constuirmos um estado de N -


elétrons devemos preencher N diferentes níveis de um-elétron. Então, cada
estado estacionário de N -elétrons pode ser especificado, relacionando-se
quais dos N níveis de um-elétron estão ocupados naquele estado. Uma
quantidade muito útil para se conhecer é fiN , a probabilidade de haver
um elétron num determinado nível i, quando o sistema de N -elétrons está
em equilíbrio térmico.15 Esta probabilidade é simplesmente a soma das
probabilidades independentes de se encontrar o sistema de N -elétrons em
qualquer um daqueles estados de N -elétrons nos quais o i-ésimo nível está
ocupado:

P ¡ ¢ (somatório sobre todos os estados α


fiN = PN EαN de N -elétrons nos quais existe um (2.41)
elétron no nível i de um-elétron).

Podemos calcular fiN , usando-se as três seguintes observações:


1. Como a probabilidade de um elétron estar no nível i é igual a um menos
a probabilidade de nenhum elétron estar nesse nível (sendo estas as duas
únicas possibilidades permitidas pelo princípio de exclusão), poderíamos
escrever igualmente bem a Eq. (2.41) como

P ¡ ¢ (somatório sobre todos os estados γ de


fiN = 1 − PN EγN N -elétrons nos quais não existe nenhum
elétron no nível i de um-elétron).
(2.42)

1 5 No caso de interesse, i é especificado pelo vetor de onda do elétron k e pela projeção

s do spin do elétron sobre algum eixo.


40 2. Teoria de Sommerfeld de Metais

2. Tomando-se qualquer estado de (N + 1)-elétrons no qual exista um


elétron no nível i de um-elétron, podemos construir um estado de N -
elétrons no qual o nível i esteja vazio, removendo-se simplesmente os elétrons
do i-ésimo nível, deixando-se inalterada a ocupação dos demais níveis. As-
sim, qualquer estado de N -elétrons onde não exista elétron no nível i pode
ser construído a partir de um estado de (N +1)-elétrons com um elétron no
nível i.16 Evidentemente, as energias de qualquer estado de N -elétrons e o
correspondente estado de (N + 1)-elétrons diferem exatamente pelo valor
de εi , a energia do único nível de um-elétron, cuja ocupação é diferente
nos dois estados. Então, o conjunto das energias de todos os estados de N -
elétrons com o nível i vazio é o mesmo que o conjunto das energias de todos
os estados de (N + 1)-elétrons com o nível i ocupado, desde que todas as
energias deste último conjunto sejam subtraídas do valor de εi . Podemos,
portanto, reescrever (2.42) na forma

P ¡ ¢ (somatório sobre todos os estados α


fiN = 1 − PN EαN+1 − εi de (N + 1)-elétrons nos quais existe
um elétron no nível i de um-elétron.)
(2.43)
Mas, a Eq. (2.40) permite-nos escrever o termo na soma como
¡ ¢ ¡ ¢
PN EαN+1 − εi = e(εi −µ)/kB T PN+1 EαN+1 , (2.44)
onde µ,conhecido como potencial químico, é dado, à temperatura T , por
µ = FN+1 − FN (2.45)
Substituindo-se esta expressão na Eq. (2.43), encontramos:

P ¡ (somatório sobre todos os estados α


¢
fiN = 1 − e(εi −µ)/kB T de (N + 1)-elétrons nos quais existe
PN +1 EαN +1
um elétron no nível i de um-elétron).
(2.46)
Comparando-se o somatório em (2.46) com aquele em (2.41), encontra-se
que (2.46) simplesmente assegura que
fiN = 1 − e(εi −µ)/kB T fiN +1 (2.47)
3. A Eq. (2.47) dá a relação exata entre as probabilidades do nível i de
um-elétron estar ocupado tanto num sistema de N -elétrons quanto num
de (N + 1)-elétrons, à temperatura T. Quando N é muito grande (esta-
mos interessados em N da ordem de 1022 ) é um absurdo imaginar que, ao
adicionarmos mais um elétron, alteraríamos apreciavelmente esta probabil-
idade para mais que uns pouquíssimos níveis de um-elétron.17 Portanto,

1 6 Isto é, aquele obtido, ocupando-se todos aqueles niveis ocupados no estado de N-

elétron mais o i-ésimo nível.


1 7 Para um nível típico, variando-se N por um, altera-se a probabilidade de ocupação

por um valor da ordem de 1/N. Veja Problema 4.


2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 41

podemos substituir fiN +1 por fiN em (2.47), o que a torna possível resolvê-
la para fiN :
1
fiN = (ε −µ)/k T (2.48)
e i B +1
Nas fórmulas a seguir eliminaremos a referência explícita à dependência
de fi com N,que é, em qualquer evento, levada em conta através do po-
tencial químico µ; veja (2.45). O valor de N pode sempre ser calculado a
partir de fi , observando-se que fi é o número médio de elétrons no nível i
de um-elétron.18 Como o número total de elétrons N é igual à soma sobre
todos os níveis do número médio em cada nível,
X X 1
N= fi = , (2.49)
i i
e(εi −µ)/kB T + 1

que determina N como função da temperatura T e do potencial químico µ.


Em muitas aplicações, todavia, são dados a temperatura e N (ou melhor
a densidade, n = N/V ). Em tais casos, a Eq. (2.49) pode ser usada para
determinar o potencial químico µ em função de N e T, permitindo-o ser
eliminado das fórmulas subsequentes em favor da temperatura e da den-
sidade. Porém, o potencial químico é de grande interesse termodinâmico
na sua própria concepção. Algumas de suas propriedades mais importantes
são sumarizadas no Apêndice B.19

2.3 Propriedades Térmicas do Gás de Elétron


Livre: Aplicações da Distribuição de
Fermi-Dirac
Num gás de elétron livre e independente, os níveis de um-eléton são especi-
ficados pelo vetor de onda k e pelo número quântico de spin s,com energias
que são independentes de s (na ausência de um campo magnético) e dadas
por (2.27); i.e.,
~2 k2
ε (k) = (2.50)
2m

1 8 Prova : Um nível pode conter 0 ou 1 elétron (mais do que um é proibido pelo princípio

de exclusão de Pauli). O número médio de elétrons é portanto 1 vezes a probabilidade de


1 elétron mais 0 vezes a probabilidade de 0 elétron. Então, o número médio de elétrons
no nível é numericamente igual à probabilidade desse nível estar ocupado. Note que isto
não seria verdadeiro se fossem permitidas ocupações múltiplas do nível.
1 9 O potencial químico tem um papel fundamental, quando a distribuição (2.48) é

obtida no ensemble gran-canônico. Veja por exemplo, F. Reif, Statistical and Thermal
Physics, McGraw-Hill, New York, 1965, pág. 350. Nossa derivação um tanto não orto-
doxa, que também pode ser encontrada no Reif, usa apenas o ensemble canônico.
42 2. Teoria de Sommerfeld de Metais

Primeiro verificamos que a função de distribuição (2.49) é consistente


com as propriedades do estado fundamental (T = 0) derivadas acima. No
estado fundamental, os níveis são ocupados com ε (k) ≤ εF , tal que a função
de distribuição para o estado fundamental deve ser:

fks = 1, ε (k) < εF


= 0, ε (k) > εF (2.51)

Por outro lado, quando T → 0,a forma limite da distribuição de Fermi-


Dirac (2.48) é

lim fks = 1, ε (k) < µ


T →0
= 0, ε (k) > µ (2.52)

Para que esses resultados sejam consistentes é necessário que

lim µ = εF (2.53)
T →0

Veremos brevemente que para metais o potencial químico permanece


igual à energia de Fermi a um alto grau de precisão, de todo o modo até
a temperatura ambiente. Como resultado, as pessoas freqüentemente não
fazem nenhuma distinção entre as duas quantidades quando estão lidando
com metais. Porém, isto pode ser perigosamente engananoso. Em cálcu-
los precisos é essencial manter-nos informados sobre até que ponto µ, o
potencial químico, difere de seu valor de temperatura zero, εF .
A aplicação mais importante da estatística de Fermi-Dirac é para o cál-
culo da contribuição eletrônica ao calor específico a volume constante de
um metal, µ ¶ µ ¶
T ∂S ∂u U
cv = = , u= (2.54)
V ∂T V ∂T V V
Na aproximação de elétron independente, a energia interna U é igual à
soma, sobre todos os níveis de um-elétron, de ε (k) vezes o número médio
de elétrons no nível:20
X
U =2 ε (k) f (ε (k)) (2.55)
k

Introduzimos a função de Fermi f (ε) para enfatizar que fk depende de k


somente através da energia eletrônica ε (k):

1
f (ε) = (2.56)
e(ε−µ)/kB T + 1

2 0 Como de costume, o fator 2 reflete o fato de que cada nível-k pode conter dois

elétrons com orientações de spin contrárias.


2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 43

Dividindo-se ambos os membros de (2.55) pelo volume V, então (2.29)


permite-nos escrever a densidade de energia u = U/V como
Z
dk
u= ε (k) f (ε (k)) (2.57)
4π3

Se dividirmos também ambos os membros de (2.55) por V, então podemos


complementar a Eq. (2.57) com uma equação para a densidade eletrônica
n = N/V,e usá-la para eliminar o potencial químico:
Z
dk
n= f (ε (k)) (2.58)
4π 3

No cálculo de integrais tais como as das Eqs. (2.57) e (2.58) da forma


Z
dk
F (ε (k)) (2.59)
4π3

deve-se às vezes explorar o fato de que o integrando depende de k, somente


através da energia eletrônica ε = ~2 k2 /2m, calculando-se a integral em
coordenadas esféricas e mudando-se da variável k para ε:
Z Z ∞ 2 Z ∞
dk k dk
F (ε (k)) = F (ε (k)) = dε g (ε) F (ε) (2.60)
4π 3 0 π2 −∞

Aqui r
m 2mε
g (ε) = , ε>0 (2.61)
~2 π 2~2
= 0, ε>0
P
Como a integral (2.59) é um cálculo de (1/V ) ks f (ε (k)) , a forma de
(2.60) mostra que
µ ¶
1
g (ε) dε = × [o número de níveis de um-elétron no
V (2.62)
intervalo de energia entre ε e ε + dε]

Por esta razão, g (ε) é conhecida como densidade de níveis por unidade
de volume (ou simplesmente, como densidade de níveis). Uma maneira
dimensionalmente mais transparente de escrever g é
µ ¶1/2
3 n ε
g (ε) = , ε>0 (2.63)
2 εF εF
= 0, ε>0

onde εF e kF são definidos pelas equações (2.21) e (2.25) para temperatura


zero. Uma quantidade particularmente importante sob o ponto de vista
44 2. Teoria de Sommerfeld de Metais

numérico é a densidade de níveis na energia de Fermi, que (2.61) e (2.63)


dão em duas formas equivalentes:

mkF
g (εF ) = (2.64)
~2 π2
ou
3 n
g (εF ) = (2.65)
2 εF

Usando esta notação, reescrevemos (2.57) e (2.58) como:


Z
u = dε g (ε) ε f (ε) (2.66)

e Z
n= dε g (ε) f (ε) (2.67)

Fazemos isto tanto por simplicidade de notação, como porque nesta forma
a aproximação de elétron livre aparece somente através do cálculo partic-
ular (2.61) ou (2.63) da densidade de níveis g. Podemos definir uma densi-
dade de níveis, via (2.62), em termos dos quais (2.66) e (2.67) permanecem
válidas para qualquer sistema de elétrons não-interagentes (ou seja, inde-
pendente).21 Com isso, estamos preparados para aplicar, mais tarde, os
resultados deduzidos de (2.67) e (2.67) para modelos consideravelmente
mais sofisticados de elétrons independentes em metais.
Em geral, as integrais (2.66) e (2.67) tem uma estrutura muito complexa.
Existe, porém, uma expansão sistemática simples que explora o fato de que,
para quase todas as temperaturas de interesse em metais, T é ainda muito
menor do que a temperatura de Fermi (??). Na Figura 2.3, mostramos o
gráfico da função de Fermi f (ε) a T = 0 e à temperatura ambiente, para
densidades metálicas típicas (kB T /µ ≈ 0, 01). Evidentemente, f difere de
sua forma à temperatura zero apenas numa pequena região em torno de
µ de largura
R +∞igual a poucos kB T. Então, a maneira na qual as integrais
da forma −∞ H (ε) f (ε) dε diferem de seus valores à temperatura zero,
R εF
−∞
H (ε) f (ε) dε, será inteiramente determinada pela forma de H ( ε)
próximo de ε = µ. Se H ( ε) não varia rapidamente numa faixa de energia da
ordem de kB T em torno de µ, a dependência da integral com a temperatura
seria dada, com bastante precisão pela substituição de H ( ε) pelos primeiros
termos de sua expansão de Taylor em torno de ε = µ:

X dn (ε = µ)n
H ( ε) = H (ε)|ε=µ (2.68)
n=0
dεn n!

2 1 Veja Capítulo 8.
2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 45

Este procedimento é desenvolvido no Apêndice C. O resultado é uma


série da forma:

Z +∞ Z µ ∞
X
d2n−1 2n
H (ε) f (ε) dε = H (ε) dε + H (ε)|ε=µ
(kB T ) an
−∞ −∞ n=1
dε2n−1
(2.69)
que é conhecida como expansão de Sommerfeld.22 Os an são constantes adi-
mensionais da ordem da unidade. As funções H que normalmente encon-
tramos, apresentam as maiores variações numa escala de energia da ordem
de µ, e geralmente (d/dε)n H (ε)|ε=µ é da ordem de H (µ) /µn .Quando isto
for o caso, os termos sucessivos na expansão de Sommerfeld
¡ ¢ são cada vez
2
menores por um fator da O (kB T /µ) que é da O 10−4 à temperatura
ambiente. Consequentemente, num cálculo real somente o primeiro e (oca-
sionalmente) o segundo termos são mantidos na soma em (2.69). A forma
explícita desses termos é (Apêndice C):

R∞
H (ε) f (ε) dε
−∞ µ ¶6
Rµ π2 2 7π4 4 kB T
= −∞ H (ε) dε + (kB T ) H 0 (µ) + (kB T ) H 000 (µ) + O
6 360 µ
(2.70)
Para calcular o calor específico de um metal a temperaturas baixas com-
paradas com TF usamos a expansão de Sommerfeld (2.70) para as densi-
dades de energia e de número eletrônicos (Eqs. (2.66) e (2.67)):

Rµ π2 ¡ ¢
u= 0
(kB T )2 [µg 0 (µ) + g (µ)] + O T 4 (2.71)
ε g (ε) dε +
6
Rµ π2 ¡ ¢
n = 0 g (ε) dε + (kB T )2 g 0 (µ) + O T 4 (2.72)
6

A Eq. (2.72), como veremos em detalhes, implica que µ difere de seu valor
em T = 0, εF , por termos da ordem de T 2 . Então, podemos escrever corre-
tamente, até a ordem de T 2 ,

Z µ Z εF
H (ε) dε = H (ε) dε + (µ − εF ) H (εF ) (2.73)
0 0

2 2 A expansão nem sempre é exata, mas é altamente confiável, a menos que H (ε)

tenha uma singularidade muito próxima de ε = µ. Se, por exemplo, H for singular
em ε = 0 (como é o caso para a densidade de níveis de elétrons livres (2.63), então a
expansão desprezará termos da ordem de exp (−µ/kB T ) , que são tipicamente da ordem
de e−100 ≈ 10−63 . Veja também Problema 1.
46 2. Teoria de Sommerfeld de Metais

Se aplicarmos esta expansão às integrais (2.71) e (2.72), e substituirmos µ


por ε nos termos já da ordem de T 2 nessas equações, encontramos
½ ¾
Rε π2 2
u = 0 F ε g (ε) dε + εF (µ − εF ) g (εF ) + (kB T ) g 0 (εF )
6 (2.74)
π2 2 ¡ 4¢
+ (kB T ) g (εF ) + O T
6 ½ ¾
R εF π2 2 0
n = 0 g (ε) dε + (µ − εF ) g (εF ) + (kB T ) g (µ) (2.75)
6

Os primeiros termos independentes da temperatura do lado direito de


(2.74) e (2.75) são exatamente os valores de u e n no estado fundamental.
Como estamos calculando o calor específico a densidade constante, n é
independente da temperatura, e (2.75) reduz-se a
π2
0 = (µ − εF ) g (εF ) + (kB T )2 g 0 (µ) (2.76)
6
que determina o desvio do potencial químico em relação a εF :
π2 0
2 g (µ)
µ = εF − (kB T ) (2.77)
6 g (εF )
Uma vez que g (ε) varia como ε1/2 para um gás de elétrons livres (veja Eq.
(2.63)) isto dá " µ ¶2 #
1 nkB T
µ = εF 1 − , (2.78)
3 2εF
que é, como havíamos afirmado acima, uma variação da ordem de T 2 e
tipicamente em torno de apenas 0, 01 por cento, mesmo à temperatura
ambiente.
A equação (2.76) torna nulo o termo entre chaves na Eq. (2.74), sim-
plificando assim a forma da densidade de energia térmica para densidade
eletrônica constante:
π2
u = u0 + (kB T )2 g (εF ) (2.79)
6
onde u0 é a densidade de energia no estado fundamental. O calor específico
do gás de elétrons é portanto
µ ¶
∂u π2 2
cv = = k T g (εF ) (2.80)
∂T n 3 B
ou, para elétrons livres (veja (2.65)),
µ ¶
π 2 kB T
cv = nkB (2.81)
2 εF
2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 47

Comparando-se isto com o resultado clássico para um gás ideal, cv =


3nkB /2, vemos que o efeito ¡da estatística
¢ de Fermi-Dirac é diminuir o
calor específico por um fator π2 /3 (kB T /εF ) , que é proporcional à tem-
peratura, e mesmo à temperatura ambiente é somente da ordem de 10−2 .
Isto explica a ausência de qualquer contribuição observável dos graus de
liberdade eletrônicos ao calor específico de um metal a temperatura ambi-
ente.
Sem levar em conta o valor numérico preciso do coeficiente, podemos en-
tender este comportamento do calor específico diretamente da dependência
da função de Fermi com a temperatura. O aumento da energia dos elétrons,
quando elevamos a temperatura a partir de T = 0 é devido inteiramente à
excitação de alguns elétrons com energias dentro de uma faixa de O (kB T )
abaixo de εF (região com sombreado escuro da Figura 2.4) para uma faixa
de energia de O (kB T ) acima de εF (região com sombreado mais claro da
Figura 2.4) O número de elétrons por unidade de volume que são excitados
é o produto da largura da faixa de energia, kB T, pela densidade de níveis
por unidade de volume g (εF ) . Além disso, a energia de excitação é da or-
dem de kB T, e então a densidade de energia térmica total é da ordem de
2
g (εF ) (kB T ) acima da energia do estado fundamental. Isto difere do re-
sultado exato (2.79) por um fator de π 2 /6, mas dá uma idéia física simples,
e é útil para uma estimativa grosseira.
A predição de um calor específico variando linearmente com a temper-
atura é uma das mais importantes consequências da estatística de Fermi-
Dirac, e além disso ainda fornece um teste simples da teoria do gás de
elétrons num metal, contanto que se possa estar seguros de que graus de
liberdade diferentes do eletrônico não fazem contribuições comparáveis ou
até maiores que estes. Como acontece, os graus de liberdade iônicos dom-
inam completamente o calor específico a temperaturas altas. Porém, bem
abaixo da temperatura ambiente sua contribuição decresce com o cubo
da temperatura (Capítulo 23) e a temperaturas muito baixas tornam-se
menores do que a contribuição eletrônica, que só decresce linearmente com
T . Com o objetivo de separar essas duas contribuições tornou-se de praxe
traçarmos o gráfico de cv /T contra T 2 , pois se as contribuições eletrônicas
e iônicas juntas comportam-se, a baixas temperaturas, como

cv = γT + AT 3 (2.82)

então
cv
= γ + AT 2 (2.83)
T

Assim, podemos encontrar γ extrapolando-se a curva cv /T linearmente até


T 2 = 0,e notando onde ela intercepta o eixo cv /T. Medidas de calores
48 2. Teoria de Sommerfeld de Metais

específicos metálicos apresentam um termo linear que se torna comparável


ao termo cúbico para poucos graus Kelvin.23
Dados do calor específico são usualmente apresentados em Joule (ou calo-
ria) por mol por grau Kelvin. Como um mol de elétrons livres num metal
contém ZNA elétrons de condução (onde Z é a valência e NA é o número de
Avogadro) e ocupa um volume ZNA /n, devemos multiplicar a capacidade
térmica por unidade de volume, cv , por ZNA /n para obter a capacidade
térmica por mol, C :
π2 kB T g (εF )
C= ZR (2.84)
3 n
onde R = kB NA = 8, 314 J/mol = 1, 99 cal/mol. Usando a densidade de
níveis de elétrons livres (2.65) e o cálculo (2.33) de εF /kB , encontramos
uma contribuição dos elétrons livres à capacidade térmica por mol de C =
γT,onde
µ ¶2
1 2 Z rs
γ= π R = 0, 169 Z × 10−4 cal-mol−1 -K−2 (2.85)
2 TF a0

Algumas medidas de γ são mostradas na Tabela 2.3, juntamente com os


valores para elétrons livres derivados de (2.85) e dos valores de rs /a0 na
Tabela 1.1. Note que os metais alcalinos continuam sendo razoavelmente
bem descritos pela teoria de elétrons livres, assim como os metais nobres
(Cu, Ag, Au). Porém, observe também a grande discrepância no Fe e Mn
(os valores experimentais são dez vezes os valores teóricos), assim como
aquelas no Bi e Sb (experimental da ordem de 0, 1 vezes a teoria). Esses
grandes desvios são agora qualitativamente entendidos sobre fundamentos
bastante gerais e retornaremos a eles no Capítulo 15.

2.4 Teoria de Sommerfeld da Condução em Metais


Para encontrar a distribuição de velocidades para elétrons em metais, con-
sidere uma pequena região24 do espaço-k em torno de um ponto k, de
volume dk. Permitindo-se a dupla degenerescência do spin, o número de

2 3 Uma vez que a densidade constante é difícil de se realizar experimental, geralmente

mede-se o calor específico a pressão constane, cp . Porém, podemos mostrar (Problema


2) que para um gás de elétron livre metálico à temperatura ambiente ou mais baixa,
cp /cv = 1+O (kB T /εF )2 . Assim, a temperaturas onde a contribuição ao calor específico
torna-se observável (a uns poucos graus Kelvin) os dois calores específicos diferem por
uma pequena quantidade.
2 4 Pequena, no sentido de que a função de Fermi e outras funções de interesse variem

muito pouco dentro do elemento de volume; mas, grande o bastante para que este volume
contenha muitos níveis de um-elétron.
2.4 Teoria de Sommerfeld da Condução em Metais 49

níveis de um-elétron neste elemento de volume é (veja (2.18))


µ ¶
V
dk (2.86)
4π 3
A probabilidade de que cada nível seja ocupado é f (ε (k)) , e, portanto, o
número total de elétrons no elemento de volume do espaço-k é
V ~2 k2
3
f (ε (k)) dk, ε (k) = (2.87)
4π 2m
Como a velocidade de um elétron livre com vetor de onda k é v = ~k/m
(Eq. (2.12)), o número de elétrons num elemento de volume dv, em torno
3
de v, é o mesmo que num elemento de volume dk = (m/~) dv em torno
de k = mv/~. Consequentemente, o número total de elétrons por unidade
de volume do espaço real num elemento de volume do espaço da velocidade
dv em torno de v é
f (v) dv (2.88)
onde
3
(m/~) 1
f (v) = £¡ ¢ ¤ (2.89)
4π 3 exp 12 mv2 − µ /kB T + 1
Sommerfeld reexaminou o modelo de Drude, substituindo a distribuição
de velocidades clássica de Maxwell-Boltzmann (2.1) pela distribuição de
Fermi-Dirac (2.89). A utilização de uma distribuição de velocidade, con-
struída a partir de argumentos quantum-mecânicos, na teoria clássica, que
é obtida a partir de argumentos muito diferentes, precisa ser justificada. 25
Pode-se descrever o movimento de um elétron classicamente somente se for
possível especificar sua posição e momento com a precisão necessária, sem
violar o princípio da incerteza.26
Um elétron típico num metal tem um momento da ordem de ~kF , tal
que a incerteza em seu momento, ∆p,deve ser pequena comparada com
~kF para que se tenha uma boa descrição clássica. Como, de (2.22), kF ∼
1/rs ,então a incerteza na posição deve satisfazer
~ 1
∆x ∼ >> ∼ rs (2.90)
∆p kF

2 5 Uma justificação analítica detalhada é razoavelmente complicada para construir,

da mesma maneira que é uma questão bastante sutil se especificar com generalidade e
precisão, quando a teoria quântica pode ser substituída por seu limite clássico. Porém,
as bases físicas são simples.
2 6 Também há uma limitação um pouco mais especializada sobre o uso da mecânica

clássica descrevendo elétrons de condução. A energia de movimento de um elétron no


plano perpendicular ao campo magnético uniforme aplicado é quantizado em múltiplos
de ~ω c (Capítulo 14). Até mesmo para campos tão grande quanto 104 Gauss, esta é
energia muito pequena, mas em amostras apropriadamente preparadas a temperaturas
de alguns graus Kelvin, estes efeitos quânticos tornam-se observáveis, e são, de fato, de
grande importância prática.
50 2. Teoria de Sommerfeld de Metais

onde, de (1.2), rs é da ordem da distância média entre elétrons - i.e., de


Angstrons. Assim, torna-se impossível usar a descrição clássica se tivermos
que considerar elétrons localizados dentro dos limites das distâncias atômi-
cas (também da ordem de Angstrons). Porém, os elétrons de condução num
metal não são ligados a íons particulares, mas podem vagar livremente pelo
volume do metal. Numa amostra macroscópica, para todos os propósitos,
não é necessário especificar a posição de um elétron com uma precisão de
10−8 cm. O modelo de Drude presume o conhecimento da posição de um
elétron fundamentalmente apenas nos dois seguintes contextos:

1. Quando são aplicados campos eletromagnéticos ou gradientes de tem-


peratura variando espacialmente, deve-se poder especificar a posição
de um elétron sobre uma escala pequena comparada com a distância
λ, sobre a qual os campos ou gradientes de temperatura variam. Para
a maioria das aplicações, os campos ou gradientes de temperatura
aplicados não variam apreciavelmente sobre a escala de Angstroms, e
a precisão necessária para definir a posição do elétron não conduz a
uma incerteza inaceitavelmente grande em seu momento. Por exem-
plo, o campo elétrico associado com a luz visível só varia apreciavel-
mente sobre uma distância da ordem 103 Å. Porém, se comprimento
de onda é muito menor que este (por exemplo, raios-X), tem-se que
usar a mecânica quântica para descrever o movimento eletrônico in-
duzido pelo campo.
2. Existe também uma suposição implícita no modelo de Drude de que
se pode localizar um elétron dentro dos limites de substancialmente
menos que um caminho livre médio `, e então se deveria suspeitar
dos argumentos clássicos, quando ocorrem caminhos livres médios
muito menores do que dezenas de Angstroms. Felizmente, como ver-
emos abaixo, os caminhos livres médios em metais são da ordem de
100 Å à temperatura ambiente e tornam-se ainda maiores, quando a
temperatura diminui.

Existe então um grande número de fenômenos em que o comportamento


de um elétron metálico é bem descrito pela mecânica clássica. Todavia,
não é assim tão óbvio que o comportamento de N tais elétrons possam
ser descritos dessa maneira. Como o princípio de exclusão de Pauli afeta
profundamente a estatística de N eletrons, por que não teria efeitos simi-
larmente drásticos sobre sua dinâmica? Que esta preocupação não procede,
segue-se de um teorema elementar que apresentamos sem prova, uma vez
que esta prova, embora simples, possui uma notação muito pesada:
Considere um sistema de N elétrons, cujas interações entre eles são ig-
noradas, e que estão sujeitos a campo eletromagnético arbitrário, variando
tanto no espaço quanto no tempo. Seja o estado de N -elétrons no instante 0
formado pela ocupação de um determinado grupo de níveis de um-elétron,
ψ 1 (0) , ..., ψ N (0) . Seja ψ j (t) o nível ψ j (0) , que evoluiria no tempo t sob a
2.4 Teoria de Sommerfeld da Condução em Metais 51

influência do campo eletromagnético se existisse apenas um único elétron


presente, que estivesse no estado ψ j (0) no tempo zero. Então, a forma
correta do estado de N -elétrons no instante t será aquele formado pela
ocupação do conjunto de N níveis de um-elétron ψ 1 (t) , ..., ψ N (t) .
Assim, o comportamento dinâmico de um sistema de N elétrons não-
interagentes é completamente determinado, considerando-se N problemas
independentes de um-elétron. Em particular, se a aproximação clássica for
válida para cada um desses problemas de um-elétron, ela também será
válida para o sistema de N -elétrons como um todo.27
A utilização da estatística de Fermi-Dirac afeta somente aquelas predições
do modelo de Drude que requerem o conhecimento da distribuição da ve-
locidade eletrônica para seus cálculos. Se a taxa 1/τ , na qual os elétrons
sofrem colisões, não depender de sua energia, então somente as estimativas
do caminho médio livre eletrônico e os cálculos da condutividade térmica
e termopotência serão afetados pela mudança da função de distribuição de
equilíbrio.
Caminho Livre Médio Usando vF (Eq. (2.24)) como uma medida da
velocidade eletrônica típica, podemos calcular o caminho livre médio ` =
vF τ da Eq. (1.8) como segue:

(rs /a0 )2
`= × 92 Å (2.91)
ρµ

Uma vez que a resistividade em microhom centímetros, ρµ ,tipicamente


está entre 1 a 100 à temperatura ambiente, e como rs /a0 está entre 2
a 6, podemos encontrar caminhos livres médios da ordem de centenas de
Angstrons mesmo à temperatura ambiente.28
Condutividade Térmica Podemos ainda estimar a condutividade tér-
mica pela Eq. (1.51):
1
κ = v2 τ cv (2.92)
3
O calor específico correto é menor do que aquele usado por Drude por
um fator da ordem de kB T /εF ; a estimativa correta de v 2 não é a veloci-
dade média térmica quadrática clássica, kB T /m, mas sim vF2 = 2εF /m,

2 7 Note que isto implica que se qualquer configuração clássica for consistente com o

princípio de exclusão de Pauli em t = 0 (i.e., existindo menos que um elétron de cada


spin por unidade de volume, em qualquer região do espaço dos momentos de volume
dp = (2π~)3 /V ) esta permanecerá consistente com o princípio de exclusão em todos os
tempos futuros. Este resultado pode também ser provado por um raciocínio puramente
clássico como um corolário direto do teorema de Liouville. Veja Capítulo 12.
2 8 Talvez seja da mesma maneira também que Drude calculou `, usando a velocidade

térmica clássica muito menor, ou ele poderia ter ficado muito confuso com tais caminhos
livres médios longos a ponto de abandonar outras investigações.
52 2. Teoria de Sommerfeld de Metais

que é maior do que o valor clássico por um fator da ordem de εF /kB T.


Substituindo-se esses valores em (2.92) e eliminando-se o tempo de relax-
ação através da Eq. (1.6), encontra-se
µ ¶2
κ π2 kB 2
= = 2, 44 × 10−8 W-Ω/K (2.93)
σT 3 e

Este resultado é bastante próximo do excelente valor obtido casualmente


por Drude, graças a duas correções compensadoras da ordem de kB T /εF ,
e está em excelente concordância com os dados experimentais da Tabela
1.6. Como veremos (Capítulo 13) este valor do número de Lorentz é muito
melhor do que poderia sugerir a derivação muito grosseira de (2.93).
Termopotência A sobreestimativa de Drude da termopotência, é tam-
bém, resolvida com a aplicação da estatística de Fermi-Dirac. Substituindo-
se o calor específico da Eq.(2.81) na Eq. (1.59), encontramos
µ ¶ µ ¶
π 2 kB kB T kB T
Q=− = −1, 42 × 10−4 V/K (2.94)
6 e εF εF
µ ¶
kB T
que é menor do que o estimado por Drude (Eq. (1.60)) por O ∼
εF
0, 01 à temperatura ambiente.
Outras Propriedades Como a forma da distribuição da velocidade
eletrônica não entra no cálculo da condutividades DC ou AC, do efeito
Hall ou da magnetorresistência, as estimativas dadas no Capítulo 1 contin-
uam a mesma tanto com a estatística de Maxwell-Boltzamann como a de
Fermi-Dirac.
Isto não é o caso, porém, se usamos um tempo de relaxação dependente
da energia. Se, por exemplo, se pensasse que os elétrons colidissem com
centros espalhadores fixos, então, seria natural considerar o caminho livre
médio independente da energia, e então um tempo de relaxação igual a
τ = `/v ∼ `/ε1/2 . Pouco tempo depois que Drude apresentou o modelo
de gás de elétrons para um metal, H. A. Lorentz mostrou, usando a dis-
tribuição de velocidade clássica de Maxwell-Boltzmann, que um tempo de
relaxação dependente da energia implicaria na dependência das condutivi-
dades DC e AC com a temperatura, assim como uma magnetoresistência
não nula e o coeficiente de Hall dependente da temperatura. Como agora já
podemos esperar da inadequabilidade da distribuição de velocidade clássica,
nenhuma dessas correções melhoraram a discrepância do modelo de Drude
em relação às observações feitas sobre os metais.29 Além disso, veremos
(Capítulo 13) que, quando usamos a correta distribuição de Fermi-Dirac

2 9 O modelo de Lorentz, porém, é muito importante na descrição de semicondutores

(Capítulo 29).
2.5 Problemas 53

a introdução da dependência da energia para o tempo de relaxação tem


efeito pouco significante sobre a maioria das quantidades de interesse num
metal.30 Se calcularmos as condutividades DC e AC, a magnetorresistência
ou o coeficiente Hall, admitindo-se uma dependência de τ (ε) com a energia,
os resultados encontrados são os mesmos que aqueles que teríamos calcu-
lado considerando-se um τ independente da energia, igual a τ (εF ). Nos
metais, essas quantidades são determinadas quase que exclusivamente pela
forma com que os elétrons, próximos do nível de Fermi, são espalhados.31
Esta é uma outra consequência muito importante do princípio de exclusão
de Pauli, cuja justificativa será dada no Capítulo 13.

2.5 Problemas

1. Gás de elétron livre e independente em duas dimensões

(a) Qual é a relação entre n e kF em duas dimensões?


(b) Qual é a relação entre kF e rs em duas dimensões?
(c) Prove que, em duas dimensões, a densidade de níveis de elétrons
livres g (ε) é uma constante independente de ε, para ε > 0, e 0
para ε < 0. Qual é o valor dessa constante?
(d) Mostre que, em consequência de g (ε) ser constante, qualquer
termo na expansão de Sommerfeld para n se anula, com exceção
do termo T = 0. Deduza que µ = εF para qualquer temperatura.
(e) Mostre, usando a Eq. (2.67), que, quando g (ε) é da forma como
no item (c), então
³ ´
µ + kB T ln 1 + e−µ/kB T = εF . (2.95)

(f) Usando (2.95, faça uma estimativa da quantidade pela qual µ


difere de εF . Comente sobre o significado numérico desta ”falha”
da expansão de Sommerfeld, e sobre as razões matemáticas para
essa ”falha”.

2. Termodinâmica de um gás de elétron livre e independente

30 Atermopotência é a exceção mais relevante.


3 1 Essa
afirmação é correta até a ordem de kB T /εF , mas em metais este é sempre um
bom parâmetro de expansão.
54 2. Teoria de Sommerfeld de Metais

(a) Deduza, usando as identidades termodinâmicas


µ ¶ µ ¶
∂u ∂s
cv = =T , (2.96)
∂T n ∂T n
das Eqs. (2.56) e (2.57), e da terceira lei da termodinâmica (s →
0 quando T → 0), que a densidade de entropia, s = S/V , é dada
por
Z
dk
s = −kB [f ln f + (1 − f ) ln (1 − f )] , (2.97)
4π3
onde f (ε (k)) é a função de Fermi (Eq. (2.56)).
(b) Sabendo-se que a pressão P satisfaz a Eq. (B.5) do Apêndice B,
P = − (u − T s − µ n) , deduza, a partir de (2.97), que
Z Ã " ¡ ¢ #!
dk ~2 k2 /2m − µ
P = kB T ln 1 + exp − (2.98)
4π3 kB T
Mostre que (2.98) implica que P é uma função homogênea de µ
e T de grau 5/2; isto é,
P (λ µ, λ T ) = λ 5/2 P (µ, T ) (2.99)
para qualquer constante λ .
(c) Deduza das relações termodinâmicas no Apêndice B que
µ ¶ µ ¶
∂P ∂P
= n, =s (2.100)
∂µ T ∂T µ
(d) Mostre, por diferenciação da Eq. (2.99) com relação a λ,que as
relação (2.34) para o estado fundamental mantém-se válida, em
qualquer temperatura, na forma
2
P = u (2.101)
3
(e) Mostre que, quando kB T << εF , a razão entre o calor especí-
fico a pressão constante e o calor específico a volume constante
satisfaz
µ ¶ µ ¶2 µ ¶4
cp π2 kB T kB T
−1= +O
cv 3 εF εF
(f) Mostre, levando mais termos na expansão de Sommerfeld de u
e n, que a capacidade térmica eletrônica correta até a ordem de
T 3 é dada por
π2 2
cv = k T g (εF )
3 B " µ Ã 00 !#
¶2
π4 4 3 g 0 (εF ) g (εF )
− kB T g (εF ) 15 − 21 (2.102)
90 g (εF ) g (εF )
2.5 Problemas 55

3. Limite clássico da estatística de Fermi-Dirac


A distribuição de Fermi-Dirac reduz-se à distribuição de Maxwell-
Boltzmann, quando a função de Fermi (2.56) for muito menor do que
a unidade para qualquer valor positivo de ε, pois neste caso teremos
f (ε) ≈ e−(ε−µ)/kB T (2.103)
A condição necessária e suficiente para que a Eq. (2.103) seja válida
para todo ε positivo é
e−µ/kB T À 1 (2.104)
(a) Considerando válida a relação (2.104), mostre que
rs = e−µ/3kB T 31/3 π 1/6 ~ (2mkB T )−1/2 (2.105)
Juntamente com (2.104), isto requer que
µ ¶1/2
~2
rs À , (2.106)
2mkB T
que também pode ser considerada como a condição para a vali-
dade da estatística clássica.
(b) Qual é o significado da medida que rs deve exceder?
(c) Mostre que (2.106) dá origem à condição numérica
µ 5 ¶1/2
rs 10 K
À (2.107)
a0 T
(d) Mostre que a constante de normalização m3 /4π3 ~3 , que aparece
na distribuição de velocidade de Fermi (2.2) pode também ser

escrita como (3 π/4) n (m/2πkB TF )3/2 tal que fB (0) /f (0) =

(4/3 π) (TF /T )3/2
4. Insensibilidade da função de distribuição a pequenas vari-
ações no número total de elétrons
Ao derivarmos a distribuição de Fermi (página 40), argumentamos
que a probabilidade de ocupação de um dado nível não mudaria apre-
ciavelmente, quando variamos por um o número total de elétrons. Ver-
ifique que a função de Fermi (2.56) é compatível com esta hipótese,
da seguinte maneira:
(a) Mostre, quando kB T ¿ εF , que quando variamos o número de
elétron por um, a uma temperatura fixa, o potencial químico
sofrerá uma varaiação igual a
1
∆µ = (2.108)
V g (εF )
onde g (ε) é a densidade de níveis.
56 2. Teoria de Sommerfeld de Metais

(b) Mostre, como consequência disto, que a variação máxima que a


probabilidade de ocupação de um nível f pode sofrer é igual a
1 εF 1
∆f = (2.109)
6 kB T N
[Use o cálculo de g (εF ) para elétrons livres (2.65).] Mesmo
que temperaturas de miligraus Kelvin possam ser atingidas, nas
quais εF /kB T ≈ 108 , ∆f ainda é desprezível, quando N for da
ordem de 1022 .
This is page 57
Printer: Opaque this

3
Redes Cristalinas

Quem nunca andou pelos departamentos de história natural de museus


surpreende-se, às vezes, ao aprender que os metais, tal como a maioria de
outros sólidos, são cristalinos, pois embora sejam usadas as características
cristalinas óbvias do quartzo, diamante, sal-gema, as faces planas carac-
terísticas, formando ângulos agudos entre si, estão ausentes nos metais
nas suas formas mais comumente encontradas. Porém, aqueles metais que
ocorrem naturalmente no estado metálico são muitas vezes encontrados na
forma cristalina, o que é completamente mascarada nos produtos metálicos
industrializados devido a grande maleabilidade dos metais, que os permite
adaptarem-se a qualquer forma macroscópica que desejarmos.
O verdadeiro teste da cristalinidade não está na aparência superficial
de uma amostra grande, mas sim se, numa escala microscópica, os íons
estão distribuídos num arranjo periódico.1 Esta regularidade microscópica
básica da matéria cristalina foi tomada como hipótese por ser uma maneira
óbvia de explicar as regularidades geométricas de cristais macroscópicos,
nos quais as faces planas formam somente determinados ângulos entre si.
Esta hipótese foi confirmada experimentalmente em 1913, através do tra-
balho de W. Bragg e L. Bragg, que inventaram a cristalografia de raio-X e
começaram a investigar como os átomos são distribuídos nos sólidos.

1 Às vezes, uma amostra é feita de muitos pequenos pedaços, cada um, grande com-

parados com a escala microscópica, e contendo um grande número de íons distribuídos


periodicamente. Este estado “policristalino” é mais comumente encontrado do que um
único cristal macroscópico, no qual a periodicidade é perfeita, estendendo-se através de
toda a amostra.
58 3. Redes Cristalinas

Antes de descrevermos como determinar a estrutura microscópica dos


sólidos por difração de raio-X, e como essas estruturas afetam as pro-
priedades físicas fundamentais, é útil estudarmos algumas das propriedades
geométricas mais importantes dos arranjos cristalinos no espaço tridimen-
sional. Essas considerações puramente geométricas estão implícitas em quase
todas as análises que encontramos na física do estado sólido, e serão seguidas
neste capítulo e nos Capítulos 5 e 7. A primeira das muitas aplicações desses
conceitos será feita para a difração de raio-X no Capítulo 6.

3.1 Rede de Bravais


Um conceito fundamental na descrição de qualquer sólido cristalino é o
da rede de Bravais, que especifica o arranjo periódico no qual as unidades
repetidas do cristal são distribuídas. Essas unidades podem ser um único
átomo, grupos de átomos, moléculas, íons, etc, mas a rede de Bravais de-
screve apenas a geometria da estrutura periódica, independente da natureza
dessas unidades. A seguir, damos duas definições equivalente para rede de
Bravais:
(a) Uma rede de Bravais é um arranjo infinito de pontos dispostos e orien-
tados de tal maneira que parece exatamente o mesmo, independente
do ponto do qual a estrutura é observada.
(b) Uma rede de Bravais (tridimensional) é o conjunto de todos os pontos,
cujas posições são definidas pelos vetores R, da forma
R = n1 a1 + n2 a2 + n3 a3 (3.1)
onde a1 , a2 e a3 são quaisquer três vetores não-coplanares,
P e n1 , n2
e n3 são quaisquer números inteiros.2 Então, o ponto ni ai é al-
cançado, movendo-se ni passos3 de comprimento |ai | na direção de
ai , para i = 1, 2 e 3.
Os vetores ai que aparecem na definição (b) de uma rede de Bravais são
chamados de vetores primitivos e são ditos gerar ou cobrir a rede.
Precisa-se de um pouco de reflexão para se ver que as duas definições de
uma rede de Bravais são equivalentes. Torna-se evidente, logo que enten-
demos ambas as definiçòes, que qualquer arranjo satisfazendo (b) também
satisfaz (a). Porém, não é óbvio o argumento de que qualquer arranjo sat-
isfazendo (a) possa ser gerado por um conjunto apropriado de três vetores

2 Continuamos com a convenção de que ”inteiro” significo inteiro positivo, zero ou

negativo.
3 Quando n é negativo, n passos numa direção significam n passos na direção oposta.

O ponto alcançado, certamente, não depende da ordem em que os passos n1 + n2 + n3


são realizados.
3.2 Redes Infinitas e Cristais Finitos 59

primitivos. A prova para isto consiste numa receita explícita para construir
três vetores primitivos. A construção é dada no Problema 8a.
A Figura 4.1 mostra uma parte de uma rede de Bravais bidimensional.4
Vê-se claramente que a definição (a) é satisfeita, e o vetores primitivos a1
e a2 requeridos pela definição (b) são mostrados na figura. Mostra-se na
Figura 4.2 uma das mais familiares redes de Bravais tridimensional, a rede
cúbica simples. Sua estrutura especial é devida ao fato de que ela pode ser
gerada por três vetores mutuamente ortogonais e de comprimentos iguais.
É importante observar que não só a disposição, mas também a orien-
tação devem ser as mesmas vistas de qualquer ponto da rede de Bravais.
Considere os vértice de uma ”colméia” bidimensional (Figura 4.3). O ar-
ranjo dos pontos, quando visto de pontos adjacentes, só é o mesmo se a
página for girada por 180o cada vez que nos movemos de um ponto para
o próximo. As relações estruturais são as mesmas, mas as relações orienta-
cionais não, tal que os vértices de uma colméia bidimensional não formam
uma rede de Bravais. Um caso de maior interesse prático, satisfazendo às
exigências estruturais, mas não às orientacionais da definição (a), é a rede
tridimensional hexagonal com agrupamento compacto, que será descrita
mais adiante.

3.2 Redes Infinitas e Cristais Finitos


Uma vez que todos os pontos são equivalente, a rede de Bravais deve ser
infinita em extensão. Evidentemente, os cristais reais são finitos, mas se
eles forem suficietemente grandes, a grande maioria dos pontos estarão tão
distantes da superfície que não serão afetados por sua existência. Então, a
simulação de um sistema infinito é uma idealização muito útil. Se estivermos
interessados nos efeitos de superfície, a noção de uma rede de Bravais ainda
é relevante, mas agora devemos supor que o cristal preencha apenas uma
porção da rede de Bravais ideal.
Frequentemente, consideram-se os cristais finitos, não porque os efeitos
de superfície sejam importante, mas simplesmente por conveniência con-
ceitual, do mesmo modo que no Capítulo 2 colocamos o elétron numa caixa
cúbica de volume V = L3 . Geralmente, escolhe-se uma forma mais simples
possível para a região finita da rede de Bravais. Dados os três vetores prim-
itivas a1 , a2 e a3 ,usualmente, considera-se a rede finita de N sítios como o
conjunto pontos da forma: R = n1 a1 + n2 a2 + n3 a3 , onde 0 ≤ n1 ≤ N1 ,
0 ≤ n2 ≤ N2 , 0 ≤ n3 ≤ N3 e N = N1 N2 N3 . Este artifício está intimamente
relacionado com a generalização, para sistemas cristalinos, das condições
de contorno periódicas usadas no Capítulo 2.

4 Uma rede de Bravais bidimensional é também conhecida como malha.


60 3. Redes Cristalinas

3.3 Mais Ilustrações e Exemplos Importantes


Das duas definições de rede de Bravais, a definição (b) é matematicamente
mais precisa e é o ponto de partida óbvio para qualquer tabalho analítico.
Porém, ela tem dois pequenos defeitos. Primeiro, para qualquer rede de
Bravais, o conjunto de vetores primitivos não é único — pelo contrário,
existe uma infinidade de escolhas não equivalentes (veja Figura 4. 1) — e
é desagradável (e às vezes enganador) confiar plenamente numa definição
que enfatize uma particular escolha. Segundo, quando apresentada com
um arranjo particular de pontos, usualmente pode-se dizer num relance se
a primeira definição é satisfeita, embora a existência de um conjunto de
vetores primitivos, ou uma prova de que tal conjunto não exista, seja mais
difícil de perceber imediatamente.
Considere, por exemplo, a rede cúbica de corpo centrada (bcc), formada
a partir da rede cúbica simples (Figura 4.2) (cujos sítios agora rotulamos
de A), acrescentando-se um ponto adicional, B, no centro de cada cubo
(Figura 4.5). À primeira vista, poder-se-ia pensar que os pontos centrais B
conduzem a relações diferentes daquelas dos pontos A dos vértices. Porém,
podemos imaginar que os pontos centrais B sejam pontos dos vértices de
uma segunda rede cúbica simples. Neste novo arranjo, os pontos A dos
vértices da rede cúbica original são os novos pontos centrais. Então, todos
os pontos têm vizinhança idêntica, de maneira que a rede cúbica de corpo
centrado é uma rede de Bravais. Se a rede cúbica original é gerada pelos
vetores primitivos
ax̂, aŷ, aẑ (3.2)
onde x̂, ŷ e ẑ são três vetores unitários ortogonais, então um conjunto de
vetores primitivos para a rede cúbica de corpo centrado seria (Figura 4.6)
a
a1 = ax̂, a2 = aŷ, a3 = (x̂ + ŷ + ẑ) (3.3)
2
Um conjunto mais simétrico desses vetores (veja Figura 4.7) é
a a a
a1 = (ŷ + ẑ − x̂) , a2 = (x̂ + ẑ − ŷ) , a3 = (x̂ + ŷ − ẑ) . (3.4)
2 2 2
É importante se convencer, do ponto de vista geométrico e analítico, de que
esses conjuntos de vetores primitivos realmente geram a rede de Bravais bcc.
Um outro exemplo, igualmente importante, é a rede cúbica de face cen-
trada (fcc). Para contruí-la, acrescenta-se um ponto adicional no centro de
cada face quadrada da rede cúbica simples (Figura 4.8). Para facilitar a de-
scrição, vamos imaginar que cada cubo na rede cúbica simples tenha duas
faces horizontais (fundo e topo) e quatro faces verticais (norte, sul, leste
e oeste). Pode parecer que todos esses pontos no novo arranjo não sejam
equivalentes, mas de fato eles são. Podemos considerar, por exemplo, a nova
rede cúbica simples formada pelos pontos adicionados ao centro de todas
3.4 Convenções 61

as faces horizontais. Os pontos da rede cúbica simples original são agora


pontos centrais da nova rede cúbica simples, enquanto que os pontos que
foram adicionados aos centros das faces norte-sul da rede cúbica original
estão nos centros das faces leste-oeste da nova rede, e vice-versa.
Da mesma maneira, podemos considerar a rede cúbica simples composta
de todos os pontos centrais das faces norte-sul da rede cúbica simples orig-
inal, ou de todos os pontos centrais das faces leste-oeste da rede cúbica
original. Em qualquer um desses casos, os demais pontos serão encontrados
nos centros das faces da nova estrutura cúbica simples. Então, qualquer
ponto pode ser considerado como um ponto de vértice ou um ponto cental
da face, para qualquer um dos três tipos de face, e, assim, a rede cúbica de
face centrada é realmente uma rede de Bravais.
Um conjunto simétrico de vetores primitivos para a rede cúbica de face
centrada (veja Figura 4.9) é
a a a
a1 = (ŷ + ẑ) , a2 = (ẑ + x̂) , a3 = (x̂ + ŷ) . (3.5)
2 2 2
As redes de Bravais cúbicas de face centrada e de corpo centrado são
de grande importância, uma vez que muitos sólidos se cristalizam nessas
formas, com um átomo (ou íon) em cada sítio da rede. (veja Tabelas 4.1 e
4.2). (Porém, a correspondente forma cúbica simples é muito rara, sendo
a fase alfa do polônio o único exemplo conhecido entre os elementos sob
condições normais.)

3.4 Convenções
Embora se tenha definido o termo ”rede de Bravais” para se aplicar a um
conjunto de pontos, ele é também muito usado com refência a um conjunto
de vetores, ligando um desses pontos a todos os outros. (Uma vez que os
pontos são uma rede de Bravais, este conjunto de vetores não depende da
escolha do ponto que é tomado como origem.) Também, um outro uso do
termo, vem do fato de que qualquer vetor R determina uma translação ou
deslocamento, em que alguma coisa é movida fisicamente através do espaço
por uma distância R na direção do vetor R. O termo ”rede de Bravais” é
também usado para se referir a um conjunto de translações determinadas
pelos vetores, ao invés dos próprios vetores. Na prática, é sempre claro
qual dos contextos, se o conjunto de vetores ou de translações, está sendo
usado.5

5 O emprego mais geral do termo dá uma definição elegante de uma rede de Bravais

com a precisão da definição (b) e a natureza não prejudicial da definição (a): Uma rede
de Bravais é um conjunto discreto de vetores não coplanares fechado sob as operações
de adição e subtração vetoriais (i.e., a soma e a diferença de qualquer dois vetores no
conjunto, também pertencem ao conjunto.)
62 3. Redes Cristalinas

3.5 Número de Coordenação


Os pontos numa rede de Bravais, que são os mais próximos de um de-
terminado ponto são conhecidos como vizinhos mais próximos. Devido à
natureza da rede de Bravais, cada ponto tem o mesmo numero de vizinhos
mais próximos, e esse número é referido como o número de coordenação da
rede. Uma rede cúbica simples tem o número de coordenação igual a 6; uma
rede cúbica de corpo centrado, 8; e uma rede cúbica de face centrada, 12.
A noção de número de coordenação pode ser estendida a outros arranjos,
que não sejam redes de Bravais, desde que cada ponto no arranjo tenha o
mesmo número de vizinhos mais próximos.

3.6 Célula Unitária Primitiva


Um volume do espaço que, quando transladado através de todos vetores
numa rede de Bravais, preenchendo todo o espaço sem sobrepor-se ou deixar
vazios, é chamado de célula primitiva ou célula unitária primitiva da rede.6
Não existe uma maneira unívoca de escolher a célula primitiva para uma
dada rede de Bravais. Várias escolhas possíveis de células primitivas para
um rede de Bravais bidimensional são mostradas na Figura 4.10.
Uma célula primitiva deve conter exatamente um ponto da rede. Segue-
se que, se n é a densidade de pontos da rede e v é o volume da célula
primitiva, então nv = 1. Logo v = 1/n. Uma vez que este resultado vale
para qualquer célula primitiva, o volume da célula primitiva é independente
da escolha da célula.
Segue-se também da definição de uma célula primitiva que, dadas quais-
quer duas células primitivas de formas arbitrárias, é possível dividir a
primeira em pedaços que, quando transladados através de vetores de rede
apropriados, podem ser reagrupados para se obter a segunda célula. Isto é
ilustrado na Figura 4.11.
A célula primitiva intuitiva, associada com um conjunto particular de
vetores primitivos a1 , a2 e a3 , é o conjunto de todos os pontos r da forma

r = x1 a1 + x2 a2 + x3 a3 (3.6)

para todos os xi variando continuamente entre 0 e 1; i.e., o paralelepípedo


gerado pelos três vetores primitivos a1 , a2 , e a3 . Esta escolha tem a desvan-
tagem de não mostrar a simetria completa da rede de Bravais. Por exemplo
(Figura 4.12), a célula unitária (3.6) para a escolha dos vetores primitivos
(3.5) da rede de Bravais fcc é um paralelepípedo oblíquo, que não tem a

6 Translações de células primitivas podem ter pontos comuns de superfície; a condição

de não-sobreposição tem como objetivo proibir superposição de regiões de volume difer-


ente de zero.
3.6 Célula Unitária Primitiva 63

simetria cúbica completa da rede na qual está embutida. Às vezes é im-


portante trabalhar com céluas que têm a simetria completa de sua rede de
Bravais. Existem duas soluções muito usadas para este problema:

3.6.1 Célula Unitária; Célula Unitária Convencional


Pode-se preencher todo o espaço com células unitárias não-primitivas (con-
hecidas apenas como células unitárias ou células unitárias convencionais).
Uma célula unitária é uma região que preenche completamente todo o es-
paço sem sobrepor-se, quando transladada através de algum subconjunto
de vetores da rede de Bravais. A célula unitária convencional é escolhida
geralmente maior do que a célula primitiva, mas tendo a simetria requerida.
Então, frequentemente, descreve-se a rede cúbica de corpo centrado através
de uma célula unitária cúbica (veja Figura 4.13) que tem o dobro do vol-
ume da célula unitária primitiva bcc, e a rede cúbica de face centrada em
termos de uma célula unitária cúbica (Figura 4.12) que tem o quádruplo do
volume da célula unitária primitiva fcc. (Podemos ver facilmente que essas
células convencionais têm 2 ou 4 vezes o volume correspondente das células
unitárias primitivas, calculando-se quantos pontos da rede existem dentro
da célula cúbica convencional, tal que nenhum desses pontos esteja sobre
sua superfície.) Os números que especificam o tamanho dos lados da célula
unitária (tal como o único número a em cristais cúbicos) são chamados de
constantes de rede.

3.6.2 Células Primitivas de Wigner-Seitz


Pode-se sempre escolher uma célula primitiva com a simetria total da rede
de Bravais. A mais comum dessas escolhas a célula de Wigner-Seitz. A
célula de Wigner-Seitz em torno de um ponto da rede é a região do es-
paço que está mais próxima daquele ponto do que de qualquer outro ponto
da rede.7 Devido à simetria translacional da rede de Bravais, a célula de
Wigner-Sitz em torno de qualquer ponto da rede deve-se transformar numa
célula de Wigner-Seitz em torno de qualquer outro ponto, quando translado
através do vetor que liga os dois pontos. Como qualquer ponto no espaço
é representado por um único ponto na rede, este ponto, assim como seu
vizinho mais próximo8 pertencerá a uma célula que contém precisamente
um ponto da rede. Segue-se disto, que uma célula de Wigner-Seitz, quando

7 Uma célula deste tipo pode ser definida como qualquer conjunto discreto de pontos

que não formam necessariamente uma rede de Bravais. Neste contexto mais amplo, a
célula é conhecida como um poliedro de Voronoy. Ao contrário da célula de Wigner-Seitz,
a estrutura e orientação de um poliedro geral de Voronoy depende do ponto do arranjo
sobre o qual se constrói este poliedro.
8 Excetos os pontos sobre as superfícies comuns que separam duas ou mais células de

Wigner-Seitz.
64 3. Redes Cristalinas

transladada através de todos os vetores de rede, preencherá todo o espaço,


sem sobrepor-se; isto é a célula de Wigner-Seitz é uma célula primitiva.
Uma vez que nada existe na definição de célula de Wigner-Seitz que se
refira a qualquer escolha particular dos vetores primitivos, a célula primitiva
será tão simétrica quanto a rede de Bravais.9
A célula de Wigner-Seitz é ilustrada para uma rede bidimensional na
Figura 4.14, e para as redes de Bravais cúbicas tridimensionais de corpo
centrado e de face centrada nas Figuras 4.15 e 4.16.
Observe que a célula de Wigner-Seitz em torno de um ponto da rede, pode
ser construída, traçando-se linhas conectando o ponto a todos os outros na
rede,10 tomando-se a bissecção de cada linha com um plano, e escolhendo-se
o menor poliedro contendo o ponto limitado por esses planos.

3.7 Estrutura Cristalina; Rede com uma Base


Um cristal físico é descrito, fornecendo-se sua rede de Bravais básica, jun-
tamente com a descrição do agrupamento de átomos, moléculas, íons, etc.,
dentro de uma determinada célula primitiva. O termo técnico ”estrutura
cristalina” é usado quando queremos enfatizar a diferença entre o padrão
de pontos abstrato formando a rede de Bravais e um cristal físico real11
ocupando a rede. Uma estrutura cristalina consiste em cópias idênticas da
mesma unidade física, chamada de base, localizada em todos os pontos de
uma rede de Bravais (ou, de forma equivalente, transladada através de to-
dos os vetores da rede de Bravais). Às vezes usamos o termo alternativo
rede com uma base. Porém, o termo ”rede com uma base” é também usado
num sentido mais geral para se referir ao que resulta até mesmo quando a
unidade básica não é um objeto ou objetos físicos, mas qualquer outro con-
junto de pontos. Por exemplo, os vértices de uma colméia bidimensional,
embora não sendo uma rede de Bravais, pode ser representada como uma
rede de Bravais triangular bidimensional12 com uma base de dois pontos
(Figura 4.17). Uma estrutura cristalina com uma base consistindo num
único átomo ou íon é às vezes chamada de rede de Bravais monoatômica.
Pode-se também descrever uma rede de Bravais com uma base, escolhendo-
se uma célula convencional não primitiva. Às vezes, isto é feito para enfati-
zar a simetria cúbica das redes de Bravais bcc e fcc, que são então descritas
como redes cúbicas simples geradas pelos vetores ax̂, aŷ e aẑ,com uma base

9 Uma definição precisa de ”tão simétrica quanto” é dada no Capítulo 7.


1 0 Na prática, somente um pequeno número de pontos vizinhos já dão realmente os
planos que limitam a célula.
1 1 Mas ainda com a idealização de ter uma extensão infinita.
1 2 Gerada por dois vetores primitivos de mesmo comprimento, fazendo um ângulo de

60o entre si.


3.8 Alguns Exemplos Importantes de Estruturas Cristalinas e Redes com Base 65

de dois pontos,
a
(x̂ + ŷ + ẑ)
0, (bcc) (3.7)
2
ou com uma base de quatro pontos
a a a
0, (x̂ + ŷ) , (ŷ + ẑ) , (ẑ + x̂) (fcc) (3.8)
2 2 2

3.8 Alguns Exemplos Importantes de Estruturas


Cristalinas e Redes com Base
3.8.1 Estrutura do Diamante
A rede do diamante13 (formada por átomos de carbono num cristal de
diamante) consiste em duas redes de Bravais cúbicas de face centrada in-
terpenetrantes, deslocadas ao longo da diagonal do corpo de uma célula
cúbica por um quarto do comprimento da diagonal. Pode ser considerada
uma rede fcc com base de dois pontos 0 e (a/4) (x̂ + ŷ + ẑ) . O número
de coordenação é igual a 4 (Figura 4.18). A rede do diamante não é uma
rede de Bravais, porque em volta de qualquer ponto a orientação difere
daquela em torno dos vizinhos mais próximo. Elementos que se cristalizam
na estrutura do diamante são relacionados na Tabela 4.3.

3.8.2 Estrutura Hexagonal com Agrupamento Compacto


Embora não sendo uma rede de Bravais, a estrutura hexagonal com agru-
pamento compacto (hcp) tem a mesma importância que as redes cúbicas de
corpo centrado e de face centrada; mais ou menos 30 elementos cristalizam-
se na forma hcp (Tabela 4.4).
A estrutura básica da rede hcp é uma rede de Bravais hexagonal simples,
obtida pelo empilhamento de redes bidimensionais triangulares diretamente
uma acima da outra. A direção do emplilhamento (a3 ,abaixo) é conhecida
como eixo-c. Os três vetores primitivos são:

a 3
a1 = ax̂; a2 = x̂ + aŷ; a3 = cẑ (3.9)
2 2
Os dois primeiros vetores geram uma rede triangular no plano x-y e o
terceiro empilha os planos a uma distância c um do outro.
A estrutura hexagonal com agrupamento compacto consite em duas re-
des de Bravais hexagonais simples interpenetrantes, deslocadas uma da
outra por a1 /3 + a2 /3 + a3 /2 (Figura 4.20). O nome reflete o fato de que

1 3 Usamos a palavra “rede” sem qualificações para nos referir tanto a uma rede de

Bravais, como a uma rede com base.


66 3. Redes Cristalinas

agrupamento compacto de esferas duras pode ser colocado numa tal estru-
tura. Considere por exemplo o agrupamento de esferas em camadas reg-
ulares, partindo-se do empacotamento numa rede triangular, como sendo
a primeira camada. A próxima camada é formada, colocando-se esferas
nas depressões deixadas no centro de qualquer triângulo na primeira ca-
mada, formando-se assim, uma segunda camada triangular, deslocada em
relação à primeira. O mesmo acontece com a terceira camada em relação
à segunda, embora aquela fique diretamente sobre as esferas da primeira
camada. A quarta, diretamente sobre a segunda, e assim sucessivamente.
A rede resultante é uma hexagonal com agrupamento compacto com um
valor particular (veja Problema 5):
r
8
c= a = 1, 63299a (3.10)
3
Porém, uma vez que a simetria da rede hexagonal com agraupamento com-
pacto é independente
p da razão c/a,o nome não é restrito a este caso. O
valor c/a = 8/3 é conhecido como valor ”ideal” e a verdadeira estrutura
com agrupamento compacto, com um valor ideal de c/a, é conhecida como
uma estrutura hcp ideal. Porém, a menos que as unidades físicas presentes
na estrutura hcp sejam realmente esferas com agrupamento compacto, não
existe motivo para que c/a seja ideal. (veja Tabela 4.4).
Note que, como no caso da estrutura do diamante, a rede hcp não é uma
rede de Bravais, pois a orientação em torno de um ponto varia de camada
para camada ao longo do eixo-c. Note também que, quando vista do eixo-c
os dois tipos de planos se fundem, formando uma arranjo bidimensional do
tipo colméia da Figura 4.3, que não é uma rede de Bravais.

3.8.3 Outras Possibilidades de Empacotamento Compacto


Note que a estrutura hcp não é a única maneira de se agrupar esferas duras
em camadas. Se as primeiras duas camadas são formadas como descritas
acima, mas a terceira colocada em outro conjunto de depressões da segunda
camada — i.e., aquelas depressões que não foram usadas nas duas primeiras
camadas (veja Figura 4.21) — e então a quarta camada é colocada nas
depressões da terceira diretamente acima das esferas da primeira camada,
a quinta acima da segunda, e assim por diante, gera-se uma rede de Bravais.
A rede assim obtida é a fcc com a diagonal do cubo perperdicular aos planos
triangulares (Figuras 4.22 e 4.23).
Existe uma infinidade de outros arranjos compactos, pois cada camada
pode ser colocada em uma das duas posições. Somente a fcc com agrupa-
mento compacto resulta numa rede de Bravais, e as estruturas fcc (...ABCABCABC...)
e hcp (...ABABAB...) são as mais comumente encontradas. Porém, out-
ras estruturas com agraupamento compacto são observadas. Certos metais
terras-raras, por exemplo, têm a estrutura da forma (...ABACABACABAC...) .
3.9 Outros Aspectos das Redes Cristalinas 67

3.8.4 Estrutura do Cloreto de Sódio


Nos casos das estruturas do diamante e hcp, fomos obrigados a descrever
as redes com base, devido ao arranjo geométrico intrínseco dos pontos da
rede. É também necessária uma rede com base para descrever estruturas
cristalinas, nas quais os átomos ou íons são localizados somente nos pontos
da rede de Bravais, mas na qual o cristal perde a simetria translacional
porque mais de uma espécie de átomo ou íon está presente. Por exemplo,
o cloreto de sódio (Figura 4.24) consiste em igual número de íons de cloro
e sódio colocados em pontos alternados de uma rede cúbica simples, de tal
maneira que cada íon tem seis íons de outra expécie como seus vizinhos mais
próximos.14 Esta estrutura pode ser descrita como uma rede de Bravais
cúbica com uma base consistindo em um íon de sódio em 0 e um íon de
cloro no centro da célula cúbica convencional, (a/2) (x̂ + ŷ + ẑ) .

3.8.5 Estrutura do Cloreto de Césio


Similarmente, o cloreto de césio (Figura 4.25) consiste em igual número
de césio e de cloro localizados nos pontos de uma rede cúbica de corpo
centrado, tal que cada íon tem oito íons de outra espécie como seus vizinhos
mais próximos.15 A simetria translacional desta estrutura é a mesma da
rede cúbica simples, e é descrita como uma rede cúbica simples com uma
base consistindo num íon de césio na origem 0 e de cloro no centro do cubo
(a/2) (x̂ + ŷ + ẑ) .

3.8.6 Estrutura do Sulfeto de Zinco (Zincblende)


A estrutura do sulfeto de zinco (ou zincblende) tem números iguais de íons
de zinco e de enxofre distribuídos na rede do diamante, tal que cada íon
tem quatro íons da outra espécie como seus vizinhos mais próximos (Figura
4.18). Esta estrutura16 é um exemplo de uma rede com base, que deve ser
assim descrita, tanto devido à posição geométrica dos íons, como também
à presença de duas espécies de íons.

3.9 Outros Aspectos das Redes Cristalinas


Neste capítulo nos concentramos sobre a descrição da simetria transla-
cional das redes cristalinas no espaço físico real. Dois outros aspectos dos
arranjos periódicos serão tratados em capítulos seguintes: no Capítulo 5,
examinamos as consequências da simetria translacional não no espaço real,

1 4 Veja, por exemplo, a Tabela 4.5.


1 5 Veja, por exemplo, a Tabela 4.6.
1 6 Veja, por exemplo, a Tabela 4.7
68 3. Redes Cristalinas

mas num espaço conhecido como espaço recíproco (ou espaço dos vetores
de onda), e no Capítulo 7 descreveremos algumas propriedades da simetria
rotacional das redes cristalinas.

3.10 Problemas

1. Em cada um dos seguintes casos indique se a estrutura é uma rede de


Bravais. Se for, dê os três vetores primitivos; se não, descreve-a como
uma rede de Bravais com uma base com o menor número de pontos
possível.

(a) Cúbica de base centrada (rede cúbica simples com pontos adi-
cionais nos centros das faces horizontais da célula cúbica).
(b) Cúbica de lado centrado (rede cúbica simples com pontos adi-
cionais nos centros das faces verticais da célula cúbica).
(c) Cúbica de aresta centrada (rede cúbica simples com pontos adi-
cionais nos pontos médios das linha ligando os vizinhos mais
próximos)

2. Qual é a rede de Bravais formada por todos os pontos com coorde-


nadas cartesianas (n1 , n2 , n3 ), se:

(a) Os ni são ou todos pares, ou todos ímpares.


(b) A soma dos ni é par.

3. Mostre que o ângulo entre qualquer duas das linhas (ligações), unindo
um sítio da rede do diamante aos seus quatro vizinhos mais próximos
é cos−1 (−1/3) = 109o 280 .

(a) Prove que a célula de Wigner-Seitz para qualquer rede de Bravais


bidimensional é, ou um hexágono, ou um retângulo.
(b) Mostre que a razão entre os comprimentos das diagonais de cada
face do paralelogramo da célula de Wigner-Seitz
√ para a rede
cúbica de face centrada (Figura 4.16) é 2 : 1.
(c) Mostre que qualquer lado do poliedro que limita a célula de
Wigner-Seitz
√ da rede cúbica de face centrada (Figura 4.15) é
2/4 vezes o comprimento da célula cúbica convencional.
(d) Prove que as faces hexagonais da célula de Wigner-Seitz da rede
bcc são todos hexágonos regulares. (Note que o eixo perpendic-
ular à face hexagonal, passando pelo seu centro tem apenas a
simetria 3, tal que somente esta simetria não é suficiente.)
3.10 Problemas 69

(a) Prove que a razão ideal


√ para a estrutura hexagonal com agru-
pamento compacto é 8/3 = 1, 633.
(b) O sódio transforma-se da rede bcc para hcp a uma temperatura
de 23 K (transformação ”martensitic”). Considerando que a den-
sidade permanece a mesma durante a transição, encontre a con-
stante de rede a da fase hexagonal, dado que a = 4.23 Å na fase
cúbica e que a razão c/a é indistinguível de seu valor ideal.
4. A cúbica de face centrada é a mais densa e a cúbica simple a menos
densa da três redes cúbicas de Bravais. A estrutura do diamente é a
menos densa do que qualquer uma dessas. Uma medida disso, é que os
números de coordenação são: fcc, 12; bcc, 8; sc, 6; diamante, 4. Uma
outra é o seguinte: Suponha que esferas idênticas sejam distribuídas
no espaço de tal maneira que seus centros estejam sobre os pontos de
cada uma dessas quatro estruturas, e que as esferas sobre os pontos
vizinhos apenas se toquem. (Tal arranjo de esferas é chamdado de
arranjo com agrupamento compacto.) Supondo que as esferas tenham
densidade unitária, mostre que a densidade de um conjunto de esferas
com agrupamento compacto em cada uma das quatro estruturas (a
”fração de compactação”) é:

fcc: √2π/6 = 0, 74
bcc: 3π/8 = 0, 68
sc: √ π/6 = 0, 52
diamante: 3π/16 = 0, 34

5. Seja Nn o número dos n-ésimos vizinhos mais proximo de um dado


ponto numa rede de Bravais (e.g., numa rede cúbica simples N1 = 6,
N2 = 12, etc.) Seja rn a distância ao n-ésimo vizinho mais próx-
imo expressa como múltiplo da √ distância aos primeiros vizinhos mais
próximos (e.g., r1 = 1, r2 = 2 = 1, 414). Faça uma tabela de Nn e
rn para n = 1, ..., 6 para as redes de Bravais fcc, bcc e sc.
6. (a) Dada uma rede de Bravais, seja a1 o vetor que liga um ponto
particular a um de seus vizinhos mais próximos. Seja P 0 um
ponto da rede que não pertence a linha que passa por P, mas
que está mais próximo desta do que qualquer outro ponto da
00
rede, e seja a2 um vetor ligando P a P 0 . Seja P um ponto que
não pertence ao plano definido por a1 e a2 , mas que está mais
próximo ao plano do que qualquer outro ponto da rede, e seja
00
a3 um vetor ligando P a P . Prove que a1 , a2 e a3 formam um
conjunto de vetores primitivos para a rede de Bravais.
(b) Prove que uma rede de Bravais pode ser definida como um con-
junto discreto de vetores não coplanares, fechado sob as oper-
ações de adição e subtração (como descrito na pág. 61).
70 3. Redes Cristalinas
This is page 71
Printer: Opaque this

4
Rede Recíproca

A rede recíproca tem um papel importante na maioria dos estudos analíticos


das estruturas periódicas. Está presente na teoria de difração de cristais, es-
tudo abstrato de funções com periodicidade de uma rede de Bravais, ou em
questões como aquela relacionada com a conservação de momento quando a
simetria translacional completa do espaço livre é reduzida àquela do poten-
cial periódico. Neste breve capítulo, descreveremos algumas propriedades
elementares da rede recíproca de um ponto de vista geral sem vincular a
qualquer aplicação em particular.

4.1 Definição de Rede Recíproca


Considere um conjunto de pontos R constituindo uma rede de Bravais, e
uma onda plana, eik·r . Para um k geral, essa onda plana, evidentemente,
não terá a periodicidade da rede de Bravais, mas, certamente, terá, para
certas escolhas especiais do vetor de onda. O conjunto de todos os vetores
de onda K para os quais as ondas planas terão a mesma periodicidade
de uma dada rede de Bravais é conhecida como rede recíproca dessa rede
de Bravais. Analiticamente, K pertence à rede recíproca de uma rede de
Bravais de pontos R, se a relação

eiK·(r+R) = eiK·r (4.1)

for válida para qualquer r, e para todos os R na rede de Bravais. Fatorando


eiK·r , podemos caracterizar a rede recíproca como o conjunto de vetores de
72 4. Rede Recíproca

onda K, satisfazendo a relação

eiK·R = 1 (4.2)

para todos os R na rede de Bravais.


Note que a rede recíproca é definida com relação a uma particular rede
de Bravais. A rede de Bravais que determina uma dada rede recíproca é
referida como rede direta, quando vista em relação à sua recíproca. Note
também que, embora se tenha definido um conjunto de vetores K, satis-
fazendo (4.2) para um conjunto arbitrário de vetores R, tal conjunto de K
é chamado de rede recíproca, somente se o conjunto de vetores R for uma
rede de Bravais.1

4.2 Rede Recíproca é uma Rede de Bravais


Que a rede recíproca é uma rede de Bravais, segue-se da definição de uma
rede de Bravais dada no Capítulo 4, juntamente com o fato de que, se K1
e K2 satisfazem (4.2), obviamente, a soma e a subtração desses vetores
também a satisfarão.
Vale a pena obter uma prova desse fato, que nos forneça um algorítimo
explícito para a construção da rede recíproca. Seja a1 , a2 e a3 o conjunto de
vetores primitivos para a rede direta. Então, os vetores da rede recíproca
podem ser gerados pelos três vetores primitivos
a2 × a3
b1 = 2π
a1 · (a2 × a3 )
a3 × a1
b2 = 2π (4.3)
a1 · (a2 × a3 )
a1 × a2
b2 = 2π
a1 · (a2 × a3 )

Para verificar que (4.3) dá um conjunto de vetores primitivos para a rede


recíproca, devemos primeiro observar que os bi satisfazem2

bi · aj = 2πδ ij (4.4)

1 Em particular, para uma rede com base, usa-se a rede recíproca determinada pela

rede de Bravais básica, melhor do que um conjunto K ter que satisfazer (4.2) para os
vetores R, descrevendo, tanto a rede de Bravais, como os pontos da base.
2 Quando i 6= j, resulta a Eq. (4.4), uma vez que o produto vetorial de dois vetores é

ortogonal a ambos. Quando i = j, ela resulta devido à identidade vetorial

a1 · (a2 × a3 ) = a2 · (a3 × a1 ) = a3 · (a1 × a2 ) .


4.3 Recíproca da Rede Recíproca 73

onde δ ij é o delta de Kronecker:


δ ij = 0, i 6= j;
(4.5)
δ ij = 1, i = j.
Agora, qualquer vetor k pode ser escrito como combinação linear3 dos
vetores bi :
k = k1 b1 + k2 b2 + k3 b3 . (4.6)
Se R é um vetor da rede direta, então:
R = n1 a1 + n2 a2 + n3 a3 (4.7)
onde ni são números inteiros. Segue-se de (4.4) que
k · R = 2π (k1 n1 + k2 n2 + k3 n3 ) (4.8)
Para eik·R ser igual a um para todo R (Eq. (4.2)), k · R deve ser igual
a 2π vezes um número inteiro, para qualquer escolha dos inteiros ni . Isto
requer que os coeficientes ki sejam inteiros. Então a condição (4.2) para
que K sejam um vetor da rede recíproca é satisfeita pelos vetores que são
combinações lineares (4.6) dos bi com coeficientes inteiros. Logo (compare
com a Eq. (3.1)), a rede recíproca é uma rede de Bravais e os bi podem ser
tomados como vetores primitivos.

4.3 Recíproca da Rede Recíproca


Uma vez que a rede recíproca é também uma rede de Bravais, podemos
construir sua rede recíproca. Esta será a rede direta original.
Podemos provar isto, construindo os vetores c1 , c2 e c3 a partir dos ve-
tores bi , de acordo com a mesma fórmula (4.3) pela qual bi foram con-
struídos a partir dos ai . Segue-se então de identidades vetoriais simples
(Problema 1) que ci = ai , i = 1, 2, 3.
Uma prova ainda mais simples, vem da observação de que, de acordo
com a definição básica (4.2), a recíproca da rede recíproca é o conjunto de
todos os vetores G que satisfazem
eiG·K = 1 (4.9)
para todo K na rede recíproca. Como qualquer vetor da rede direta R tem
esta propriedade (novamente por (4.2), todos os vetores da rede direta estão
na rede recíproca da rede recíproca. Além disso, outros vetores não podem
satisfazer esta relação, pois um vetor que não seja da rede direta tem a
forma r =x1 a1 + x2 a2 + x3 a3 com pelo menos um dos xi não sendo inteiro.
Para aquele valor de i, eibi ·r = ei2πxi 6= 1, e a condição (4.9) é violada para
o vetor da rede recíproca K = bi .

3 Isto se aplica para quaisquer três vetores não coplanares. É fácil verificar que os

vetores bi não são coplanares, certificando-se de que os vetores ai também não o são.
74 4. Rede Recíproca

4.4 Exemplos Importantes


A rede de Bravais cúbica simples, com a célula primitiva cúbica de lado a,
tem como sua rede recíproca uma rede cúbica simples com a célula cúbica
primitiva cúbica de lado igual a 2π/a. Isto pode ser visto, por exemplo, da
construção (4.3), pois se
a1 = ax̂, a2 = aŷ, a3 = aẑ (4.10)
então
2π 2π 2π
b1 = x̂, b2 = ŷ, b3 = ẑ (4.11)
a a a
A rede de Bravais cúbica de face centrada, com célula convencional cúbica
de lado a, tem como rede recíproca uma rede cúbica de corpo centrado com
célula convencional cúbica de lado igual a 4π/a. Isto pode ser mostrado,
aplicando-se a construção (4.3) aos vetores primitivos da fcc. O resultado
é
4π 1 4π 1 4π 1
b1 = (ŷ + ẑ − x̂) , b2 = (ẑ + x̂ − ŷ) , b3 = (x̂ + ŷ − ẑ)
a 2 a 2 a 2
(4.12)
Estes vetores tem precisamente a mesma forma dos vetores primitivos da
rede bcc (3.4), desde que o lado da célula cúbica seja igual a 4π/a.
A rede cúbica de corpo centrado com célula convencional cúbica de lado a
tem como rede recíproca a rede cúbica de face centrada com célula conven-
cional cúbica de lado igual a 4π/a. Isto pode ser demonstrado, novamente,
a partir de (4.3), mas pode-se mostrar também do resultado acima para a
rede recíproca da rede fcc, de acordo com o teorema de que a recíproca da
recíproca é a rede original.
É deixado como exercício para o leitor verificar (Problema 2) que a rede
recíproca de uma rede de Bravais hexagonal simples com constantes de rede
c e a (Figura 5.1a)
√ é uma outra rede hexagonal simples com constantes de
rede 2π/c e 4π/ 3a (Figura 5.1b), girada de 30o em torno do eixo-c em
relação à rede direta.4

4.5 Volume da Célula Primitiva da Rede Recíproca


Se v é o volume5 de uma célula primitiva na rede direta, então a célula
3
primitiva da rede recíproca tem um volume (2π) /v. Isto é demonstrado
no Problema 1.

4 A estrutura hexagonal com agrupamento compacto não é uma rede de Bravais e,

portanto, a rede recíproca usada na análise da hcp é a da rede hexagonal simples (veja
nota de rodapé 1).
5 O volume da célula primitiva é independente da escolha da célula, como foi provado

no Capítulo 4.
4.6 Primeira Zona de Brillouin 75

4.6 Primeira Zona de Brillouin


A célula primitiva de Wigner-Seitz da rede recíproca é conhecida como
primeira zona de Brillouin. Como o nome sugere, também se define zonas
de Brillouin de ordens mais elevadas, que são células primitivas de difer-
entes tipos, que se originam na teoria dos níveis eletrônicos num potencial
periódico. Elas são descritas no Capítulo 9.
Embora os termos “célula de Wigner-Seitz” e “primeira zona de Bril-
louin” refiram-se a construções geométrica idênticas, na prática, o último
termo se aplica somente à celula no espaço-k. Em particular, quando se
faz referência à primeira zona de Brillouin de uma determinada rede de
Bravais no espaço-r (associada com uma estrutura cristalina em particu-
lar), significa sempre que estamos nos referindo à célula de Wigner-Seitz da
rede recíproca associada. Então, como a rede recíproca da rede cúbica de
corpo centrado é a rede cúbica de face centrada, a primeira zona de Bril-
louin da rede bcc (Figura 5.2a) é a célula de Wigner-Seitz da fcc (Figura
4.16). Inversamente, a primeira zona de Brillouin de rede fcc (Figura 5.2b)
é justamente a célula de Wigner-Seitz da bcc (Figura 4.15).

4.7 Planos de Rede


Existe uma relação íntima entre vetores na rede recíproca e planos de pontos
na rede direta. Esta relação é importante para o entendimento do papel
fundamental que a rede recíproca tem na teoria de difração, e será aplicado
àquele problemas no próximo capítulo. Aqui, descreveremos as relações em
termos geométricos gerais.
Dada uma rede particular de Bravais, um plano de rede é definido como
qualquer plano contendo pelo menos três pontos não-colineares da rede de
Bravais. Devido à simetria translacional da rede de Bravais, qualquer um
desses planos conterá, na verdade, uma infinidade de pontos da rede, que
formam uma rede de Bravais bidimensional neste plano. Alguns planos de
rede numa rede de Bravais cúbica são esquematizados na Figura 5.3.
Uma família de plano é um conjunto de planos paralelos, igualmente
espaçados, que juntos contém todos os pontos da rede de Bravais tridimen-
sional. Qualquer plano de rede é um membro de tal família de planos.
Evidentemente, a transformação de uma rede de Bravais numa família
de planos não é unívoca (Figura 5.3). A rede recíproca nos fornece uma
maneira muito simples de classificar todos as possíveis famílias de planos
de rede, que está contida no seguinte teorema:

Para qualquer família de planos de rede separados por uma


distância d, existem vetores da rede recíproca perpendiculares
aos planos, sendo que o menor deles tem o comprimento 2π/d.
Inversamente, para qualquer vetor K da rede recíproca, existe
76 4. Rede Recíproca

uma família de planos de rede normais a K e separados por


uma distância d, onde 2π/d é o comprimento do menor vetor
de onda da rede recíproca paralelo a K .

Este teorema é uma consequência direta (a) da definição (4.2) de vetores


da rede recíproca em termos de vetores de onda das ondas planas que têm
valor igual a um nos sítios da rede de Bravais, e (b) do fato de que as ondas
planas têm o mesmo valor em todos os pontos pertencentes a uma mesma
família de planos, cujos planos são perpendiculares ao vetor de onda da
onda plana e estão seperados por um número inteiro de comprimentos de
onda.
Para provar a primeira parte do teorema, dada uma família de planos de
rede, seja n̂ um vetor unitário na direção normal aos planos. Que o vetor
K =2πn̂/d é um vetor da rede recíproca, segue-se do fato de que a onda
plana eiK·r é constante nos planos perpendiculares a K e tem o mesmo
valor nos planos separados pela distância λ = 2π/K = d. Como um desses
planos contém o ponto da rede de Bravais r = 0, eiK·r deve ser igual à
unidade em todos os pontos r em qualquer um dos planos. Uma vez que
os planos contém todos os pontos da rede de Bravais, eiK·r = 1 para todos
os R, tal que K,de fato, é um vetor da rede recíproca. Além disso, K deve
ser o menor vetor da rede recíproca normal aos planos, pois qualquer vetor
menor do que K daria uma onda plana com comprimento de onda maior
do que 2π/K = d. Tal onda plana não pode ter o mesmo valor sobre todos
os planos da família e, portanto, não pode resultar numa onda plana que
seja unitária em todos os pontos da rede de Bravais.
Para provar o teorema inverso, dado um vetor da rede recíproca, seja K
o menor vetor da rede recíproca paralelo ao vetor dado. Considere o con-
junto de planos no espaço real sobre os quais a onda plana eiK·r tem um
valor unitário. Esses planos (um dos quais contém o ponto r = 0) são per-
pendiculares a K e separados por uma distância d = 2π/K. Como todos os
vetores R da rede de Bravais satisfazem eiK·R = 1, para qualquer vetor da
rede recíproca K, todos eles devem pertencer a esses planos. Além disto, a
separação entre os planos da rede é também d (ao invés de algum múltiplo
inteiro de d), pois se somente cada n-ésimo plano da família contivesse os
pontos da rede de Bravais, então de acordo com a primeira parte do teo-
rema, o vetor normal aos planos teria comprimento 2π/nd i.e., o vetor K/n
seria um vetor da rede recíproca. Mas, isto contradiria a nossa suposição
inicial de que nenhum vetor paralelo a K é menor do que K.

4.8 Índices de Miller dos Planos de Rede


A correspondência entre vetores da rede recíproca e família de planos de
rede fornece uma maneira conveniente de especificar a orientação de um
plano de rede. Geralmente, descreve-se a orientação de um plano, dando-se
4.8 Índices de Miller dos Planos de Rede 77

um vetor normal a ele. Como sabemos que existem vetores da rede recíproca
normais a qualquer família de planos de rede, é natural escolher um vetor da
rede recíproca, para representar a normal. Para se fazer a escolha unívoca,
usa-se o menor desses vetores da rede recíproca. Desta maneira, chega-se
aos índices de Miller do plano:
Os índices de Miller de um plano de rede são as coordenadas do menor
vetor da rede recíproca normal àquele plano em relação ao conjunto especí-
fico de vetores primitivos da rede recíproca. Então um plano com índices
de Miller h, k, l, é normal ao vetor da rede recíproca hb1 + kb2 + lb3 .
Assim definidos, os índices de Miller são inteiros, pois qualquer vetor
da rede recíproca é uma combinação linear de três vetores primitivos com
coeficientes inteiros. Uma vez que a normal ao plano é especificada pelo
menor vetor da rede recíproca perpendicular ao plano, os inteiros h, k, l não
possuem fator comum. Note também que os índices de Miller dependem da
escolha particular dos vetores primitivos.
Nas redes cúbicas simples a rede recíproca é também uma rede cúbica
simples e os índices de Miller são as coordenadas de um vetor normal ao
plano no sistema cúbico de coordenadas. Como regra geral, as redes de
Bravais cúbicas de corpo centrado e de face centrada são descritas em
termos de uma célula convencional cúbica, i.e., como redes cúbicas simples
com bases. Como qualquer plano de rede nas redes fcc ou bcc é também
um plano de rede na rede cúbica simples básica, a mesma indexação cúbica
elementar pode ser usada para especificar os planos de rede. Na prática,
é apenas na descrição de cristais não cúbicos que devemos lembrar que os
índices de Miller são as coordenadas da normal num sistema dado pela rede
recíproca, ao invés de pela rede direta.
Os índices de Miller de um plano tem a interpretaçao geométrica na rede
direta, que às vezes é dado como uma maneira alternativa de definí-los.
Uma vez que o plano de rede com índices de Miller h, k, l é perpendicular
ao vetor da rede recíproca K = hb1 + kb2 + lb3 , este estará contido no
plano K · r = A, para uma apropriada escolha da constante A. Este plano
corta os eixos determinados pelos vetores primitivos ai da rede direta nos
pontos x1 a1 , x2 a2 e x3 a3 (Figura 5.4), onde xi é determinado pela condição
de que xi ai deve satisfazer a equação do plano: K· (xi ai ) = A. Como
K · a1 = 2πh, K · a2 = 2πk e K · a3 = 2πl,segue-se que
A A A
x1 = , x2 = , x3 = . (4.13)
2πh 2πk 2πl
Então, as interseções dos planos de rede com os eixos do cristal são inver-
samente proporcionais aos índices de Miller do plano.
Os cristalógrafos colocam a carroça diante do boi, definindo os índices
de Miller como sendo um conjunto de inteiros sem fatores comuns, inver-
samente proporcional às interseções do plano de cristal com os eixos:
1 1 1
h:k:l= : : . (4.14)
h k l
78 4. Rede Recíproca

4.9 Algumas Convenções para Direções Específicas


Os planos de rede são usualmente especificados através de seus índices de
Miller, escritos entre parênteses: (h, k, l). Então, num sistema cúbico, um
plano com uma normal (4, −2, 1) (ou, do ponto de vista cristalográfico, um
plano que tem interseções (1, −2, 4) com os eixos cúbicos) é conhecido como
um plano (4, −2, 1) . As vírgulas são eliminadas sem confusão, escrevendo-
se n̄, ao invés de −n, simplificando a descrição para (42̄1) . Deve-se con-
hecer qual sistema de eixos está sendo usado para interpretar esses símbolos
sem ambiguidades. Os eixos cúbicos são invariavelmente usados, quando o
cristal tem simetria cúbica. Alguns exemplos de planos em cristais cúbicos
são mostrados na Figura 5.5.
Uma convenção similar é usada para especificar as direções nas redes
diretas, mas para evitar confusão com os índices de Miller (direções na rede
recíproca), usam-se colchetes ao invés de parênteses, Assim, a diagonal de
corpo de uma rede cúbica simples está na direção [111] e, em geral, o ponto
da rede n1 a1 + n2 a2 + n3 a3 está na direção [n1 n2 n3 ] da origem.
Existe também uma notação para especificar tanto uma família de planos
de rede, como todas as outras famílias que são equivalentes a ela em virtude
da simetria do cristal. Então, os planos (100), (010) e (001) são todos equiv-
alentes no cristal cúbico. Refere-se a eles coletivamente como planos {100}
e, em geral, usa-se {hkl} para referir-se aos planos (hkl) e todos aqueles que
são equivalentes a eles em virtude da simetria do cristal. Uma convenção
similar é usada com as direções: as direções [100] , [010] , [001] , [1̄00] , [01̄0]
e [001̄] no cristal cúbico são referidas coletivamente como as direções h100i.
Com isto concluímos nossa discussão geométrica geral da rede recíproca.
No Capítulo 6, veremos um exemplo importante da utilidade e do poder
do conceito na teoria da difração de raios-X por um cristal.

4.10 Problemas

1. (a) Prove que os vetores primitivos da rede recíproca definida em


(4.3) satisfaz

(2π)3
b1 · (b2 × b3 ) = (4.15)
a1 · (a2 × a3 )

(Sugestão: Escreva b1 (mas, não b2 ou b3 ) em termos de ai e


use as relações de ortogonalidades ( 4.4).)
(b) Suponha que os vetores primitivos são construídos a partir de
bi da mesma maneira que os bi foram construídos a partir de
4.10 Problemas 79

ai (Eq. (4.3)). Prove que esses vetores são justamente os vetores


ai ; i.e., mostre que
b2 × b3
2π = a1 , etc. (4.16)
b1 · (b2 × b3 )
(Sugestão: Escreva b3 no numerador (mas, não b2 ) em termos
de ai , use a identidade vetorial A× (B × C) = B (A · C) −
C (A · B), as relações de ortogonalidades (4.4) e o resultado
(4.15) acima.)
(c) Prove que o volume de uma célula primitiva de uma rede de
Bravais é
v = |a1 · (a2 × a3 )| , (4.17)
onde ai são os três vetores primitivos. (Juntamente com (4.15),
isto estabelece que o volume da célula primitiva da rede recíproca
3
é (2π) /v.)
2. (a) Usando os vetores primitivos dados na Eq. (3.9) e a construção
(4.3) (ou por qualquer outro método), mostre que a recíproca
de uma rede de Bravais hexagonal simples é √ também hexagonal
simples, com constantes de rede 2π/c e 4π/ 3a, girada de 30o
em torno do eixo-c em relação à rede direta.
(b) Para qual valor de c/a a razão tem o mesmo valor tanto na rede
direta, quanto na rede recíproca? Se c/a é ideal na rede direta,
qual é seu valor na rede recíproca?
(c) A rede de Bravais gerada por três vetores primitivos de mesmo
comprimento a,fazendo ângulos iguais a θ entre si, é conhecida
como rede de Bravais trigonal (veja Capítulo 7). Mostre que a
rede recíproca de uma rede de Bravais trigonal é também trigo-
nal, com ângulo θ∗ dado por − cos θ∗ = cos θ/[1+cos θ], e o com-
−1/2
primento do vetor primitivo a∗ , dado por a∗ = (2π/a) (1 + cos θ cos θ∗ ) .
3. (a) Mostre que a densidade de pontos de rede (por unidade de área)
num plano de rede é d/v, onde v é o volume da célula primitiva
e d, o espaçamento entre planos vizinhos na família, à qual o
plano pertence.
(b) Prove que os planos de rede com a maior densidade de pontos
são os planos {111} na rede de Bravais cúbica de face centrada,
e os planos {110} na rede de Bravais cúbica de corpo centrado.
(Sugestão: Isto é feito mais facilmente, explorando-se as relações
entre as famílias de planos de rede e os vetores da rede recíp-
roca.)
4. Prove que qualquer vetor da rede recíproca K é um múltiplo inteiro do
menor vetor da rede recíproca, K0 , paralelo ao vetor dado. (Sugestão:
80 4. Rede Recíproca

Considere o contrário e deduza que, como a rede recíproca é uma


rede de Bravais, existe um vetor da rede recíproca paralelo a K, que
é menor do que K0 .)
This is page 81
Printer: Opaque this

5
Determinação de Estruturas
Cristalinas por Difração de Raio-X

Distâncias interatômicas típicas em sólidos são da ordem de um Angstron


(10−8 cm). Uma onda eletromagética capaz de explorar a estrutura mi-
croscópica de um sólido deve ter um comprimento de onda pelo menos
dessa ordem, correspondente a uma energia da ordem
hc hc
~ω = = −8 ≈ 12, 3 × 103 eV. (5.1)
λ 10 cm
Energias tais como esta, da ordem de vários milhares de elétrons volts
(quilovolts ou kV), são energias características de raio-X.
Neste capítulo, descreveremos como a distribuição de raios-X espalhada
por um arranjo rígido1 e periódico2 de íons revela a localização dos íons
dentro daquela estrutura. Existem duas maneiras equivalentes de visualisar
o espalhamento de raios-X por estruturas periódicas perfeitas, devidas a
Bragg e a von Laue. Ambos os pontos de vista são ainda largamente usados.
O método de von Laue, que explora a rede recíproca, está mais próximo

1 Na realidade, os íons vibram em torno de seus sítios de equilíbrio ideal (Capítulos


21-26). Isto não afeta as conclusões obtidas neste capítulo (embora logo no início da
aplicação da técnica de difração de raio-X não era bem entendido porque tais vibrações
não destruíam o padrão característico de uma estrutura periódica). Mostra-se que as
vibrações têm duas importantes consequências (veja Apêndice N): (a) diminui a inten-
sidade dos picos característicos, que revelam a estrutura cristalina, mas não a elimina;
e (b) produz um fundo contínuo de radiação muito mais fraco (o “fundo difuso”.)
2 Sólidos amorfos e líquidos têm praticamente a mesma densidade que um sólido

cristalino, e, portanto, são também suscetíveis a investigações com raios-X. Porém, não
são enconntrados os picos discretos da radiação espalhada característicos dos cristais.
82 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

das idéias da física do estado sólido moderna, mas o de Bragg ainda é muito
usado pelos cristalógrafos. Ambos são descritos abaixos, juntamente com a
prova de sua equivalência.

5.1 Formulação de Bragg da Difração de Raio-X


por um Cristal
Em 1913, W. H. Bragg e W. L. Bragg observaram que substâncias, cujas
formas macroscópicas eram cristalinas, produziam padrões característicos
da radiação-X refletida muito diferentes daqueles produzidos pelos líqui-
dos. Em materiais cristalinos, para comprimentos de onda e direções de
incidência bem definidos, foram observados picos muito intensos da radi-
ação espalhada (agora conhecidos como picos de Bragg).
A explicação de W. L. Bragg para a ocorrência desses picos baseou-se na
hipótese de que os cristais são feitos de planos de íons paralelos, espaça-
dos um do outro por uma distância d (i.e., os planos de rede descritos no
Capítulo 5). As condições para o aparecimento de picos bem definidos na
radiação espalhada são: (1) que os raios-X devam ser refletidos especular-
mente3 pelos íons em qualquer plano, e (2) que os raios refletidos oriun-
dos de planos sucessivos devam interferir construtivamente. Na Figura 6.1,
mostram-se os raios refletivos especularmente por planos vizinhos. A difer-
ença de caminho entre os dois raios é igual a 2d sen θ, onde θ é o ângulo
de incidência.4 Para os raios interferirem construtivamente esta diferença
de caminhos deve ser igual a um número inteiro de comprimentos de onda,
levando à famosa condição de Bragg:

nλ = 2d sen θ. (5.2)

O inteiro n é conhecido como a ordem da reflexão correspondente. Para


um feixe de raios-X contendo uma faixa de diferentes comprimentos de onda
(“radiação branca”) podem ser observadas diferentes reflexões. Não apenas
se pode ter reflexões de alta ordem de um dado conjunto de planos de
rede, como, além do que, devemos reconhecer que existem muitas diferentes
maneiras de seccionar o cristal em planos, cada uma das quais produzirão
novas reflexões (veja, por exemplo, Figura 5.3 ou Figura 6.3).

3 Na
reflexão especular, o ângulo de incidência é igual ao ângulo de reflexão.
4Oângulo de incidência na cristalografia de raio-X é medido, convencionalmente, a
partir do plano de reflexão, ao invés da normal ao plano (como em óptica clássica). Note
que θ é justamente a metade do ângulo de deflexão do feixe incidente (Figura 6.2).
5.2 Formulação de von Laue da Difração de Raio-X por um Cristal 83

5.2 Formulação de von Laue da Difração de


Raio-X por um Cristal
O formulação de von Laue difere daquela de Bragg no sentido de que neste
caso não se escolhe nenhum seccionamento do cristal em planos de rede, e
nem é imposta nenhuma hipótese ad hoc de reflexão especular.5 Ao con-
trário disso, considera-se o cristal como composto de objetos microscópicos
(conjunto de íons ou átomos) colocados nos sítios R de uma rede de Bra-
vais, cada um dos quais podendo reemitir a radiação incidente em todas as
direções. Picos bem definidos serão observados somente em direções e em
comprimentos de onda para os quais os raios espalhados a partir de todos
os pontos da rede interferem-se construtivamente.
Para determinar a condição de interferência construtiva, vamos consid-
erar inicialmente apenas dois espalhadores separados por um vetor desloca-
mento d (Figura 6.4). Seja um raio-X incidente ao longo da direção n̂, com
comprimento de onda λ e vetor de onda k = 2πn̂/λ. Um raio espalhado
será observado numa direção n̂0 com comprimento de onda6 λ e vetor de
onda k0 = 2πn̂0 /λ, com a condição de que a diferença entre os caminhos
dos raios espalhados por cada um dos dois íons seja um número inteiro de
comprimentos de onda. Vê-se, da Figura 6.4, que esta diferença é igual a

d cos θ + d cos θ0 = d · (n̂ − n̂0 ) . (5.3)

Então, a condição para interferência construtiva é

d · (n̂ − n̂0 ) = mλ, (5.4)

para m inteiro. Multiplicando-se ambos os membros de (5.4) por 2π/λ


encontra-se uma condição para os vetores de onda incidente e espalhado:

d · (k − k0 ) = 2πm, (5.5)

para m inteiro.
Em seguida, considera-se não apenas dois, mas um arranjo de espal-
hadores localizados nos sítios de uma rede de Bravais. Uma vez que os

5 A hipótese de Bragg da reflexão especular é, todavia, equivalente à hipótese de que

os raios-X espalhados por íons individuais dentro de cada plano de rede inteferem-se
construtivamente. Então, tanto o método de Bragg, como o de von Laue, são baseados
na mesma hipótese física, e sua equivalência (veja pág. ) já é esperada.
6 Aqui (como na formulação de Bragg) considera-se que as radiações incidente e es-

palhada tenham o mesmo comprimento de onda. Em termos de fótons, isto significa


que nenhuma energia é perdida durante o espalhamento, i.e., considera-se que o es-
palhamento é elástico. Para uma boa aproximação, o grosso da radiação espalhada é
espalhada elasticamente, embora exista muito mais coisas a serem aprendidas do es-
tudo daquelas pequenas componentes da radiação que são espalhadas inelasticamente
(Capítulo 24 e Apêndice N).
84 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

sítios são separados um do outro por vetores R da rede de Bravais, a


condição de que todos os raios espalhados interfiram construtivamente é a
mesma condição (5.5) aplicada simultaneamente a todos os vetores d,que
são vetores de rede:

 para m inteiro e
R · (k − k0 ) = 2πm, todos os vetores R (5.6)

da rede de Bravais.

Isto pode ser reescrito na forma equivalente

ei(k −k)·R = 1, para todos os vetores R da rede de Bravais.


0
(5.7)

Comparando-se esta equação com a definição da rede reciproca (4.2),


chega-se à condição de Laue para a qual interferência construtiva ocorrerá
se a variação do vetor de onda, K = k0 − k, for um vetor da rede reciproca.
Às vezes é mais conveniente ter uma formulação alternativa da condição
de Laue estabelecida inteiramente em termos do vetor de onda incidente
k. Note que, devido à rede recíproca ser uma rede de Bravais, se k0 −k for
um vetor da rede recíproca, k − k0 também o será. Chamando de K este
último vetor, a condição de que k e k0 tenham o mesmo módulo é

k = |k − K| . (5.8)

Quadrando ambos os membros de (5.8), obtém-se a condição


1
k · K̂ = K; (5.9)
2
i.e., a componente do vetor de onda incidente k na direção do vetor de onda
da rede recíproca K deve ser metade do comprimento de K.
Então, um vetor incidente k satisfará à condição de Laue se, e somente se,
a extremidade deste vetor estiver num plano que é o bissetor perpendicular
de uma linha ligando a origem do espaço-k ao ponto da rede recíproca K.
Tais planos no espaço-k são chamados de planos de Bragg.
É uma consequência da equivalência dos pontos de vista de Bragg e Laue,
que será demonstrada na seção seguinte, que os planos de Bragg, associados
com um pico particular de difração na formulação de Laue, são paralelos
à família de planos na rede direta responsável pelo pico na formulação de
Bragg.

5.3 Equivalência das Formulações de Bragg e von


Laue
A equivalência desses dois critérios para a interferência construtiva de raios-
X por um cristal, segue da relação entre vetores da rede recíproca e famílias
5.3 Equivalência das Formulações de Bragg e von Laue 85

de planos da rede direta (veja Capítulo 5). Suponha que os vetores de


onda incidente e espalhado, k e k0 , satisfaçam à condição de Laue de que
K = k0 −k seja um vetor da rede recíproca. Uma vez que as ondas incidente
e espalhada têm o mesmo comprimento de onda, k0 e k têm os mesmos
módulos. Segue-se (veja Figura 6.6) que k0 e k fazem o mesmo ângulo θ
com o plano perpendicular a K. Portanto, o espalhamento pode ser visto
como uma reflexão de Bragg, com ângulo de Bragg θ, pela família de planos
da rede direta perpendicular ao vetor da rede recíproca K.
Para demonstrar que esta reflexão satisfaz à condição de Bragg (5.2) note
que o vetor K é um múltiplo inteiro7 do menor vetor da rede recíproca,
K0 , paralelo a K. De acordo com o teorema da página 75, o módulo de K0
é igual a 2π/d, onde d é a distância entre planos sucessivos na família de
planos perpendicular a K0 ou a K. Então

2πn
K= (5.10)
d

Por outro lado, segue-se da Figura 6.6 que K = 2k sen θ, e então

πn
k sen θ = . (5.11)
d

Como k = 2π/λ, a Eq. (5.11) implica que o comprimento de onda satisfaz


à condição de Bragg (5.2).
Então, um pico de difração de Laue, relacionado com a uma variação
do vetor de onda dada pelo vetor da rede recíproca K, corresponde a uma
reflexão de Bragg por uma família de planos da rede direta perpedicular a
K. A ordem, n, da reflexão de Bragg é igual ao comprimento de K dividido
pelo comprimento do menor vetor da rede recíproca paralelo a K.
Uma vez que o vetor da rede recíproca associado com uma dada rede de
Bravais é mais facilmente visualizado do que um conjunto de todos os pos-
síveis planos, nos quais a rede de Bravais pode ser decomposta, é muito mais
simples de se trabalhar com a condição de Laue para os picos de difração
, do que com a condição de Bragg. No restante deste capítulo, aplicaremos
a condição de Laue à descrição das três maneiras mais importantes nas
quais a análise cristalográfica de raio-X de amostras reais são realizadas,
e faremos uma discussão de como podemos extrair informações, não so-
mente, com relação à rede de Bravais básica, mas também de arranjos de
íons dentro da célula primitiva.

7 Esta é uma consequência elementar do fato de que a rede recíproca é uma rede de

Bravais. Veja Capítulo 5, Problema 4.


86 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

5.4 Geometrias Experimentais Sugeridas pela


Condição de Laue
Uma onda incidente com vetor de onda k conduzirá a um pico de difração
(ou “reflexão de Bragg”) se e somente se a extremidade desse vetor estiver
sobre um plano de Bragg no espaço-k. Como o conjunto de todos os planos
de Bragg é uma família discreta de planos, não se pode preencher todo o
espaço-k tridimensional e, em geral, a extremidade do vetor k não estará
sobre um plano de Bragg. Então, para um vetor de onda fixo incidente — i.e.,
para um raio-X com comprimento de onda definido e direção de incidência
relativa aos eixos do cristal, também, definida — poderá não haver picos de
difração.
Se desejamos procurar experimentalmente pelos picos de Bragg, deve-se
relaxar a condição de k fixo de modo que, ou variamos o módulo de k (i.e.,
variando o comprimento do feixe incidente), ou, sua direção (na prática,
variando a orientação do cristal em relação à direção de incidência).

5.5 Construção de Ewald


Uma construção geométrica simples devido a Ewald nos ajudará muito na
visualização desses vários métodos e na dedução da estrutura do cristal a
partir dos picos observados. Traça-se uma esfera no espaço-k centrada na
extremidade do vetor incidente k de raio k (tal que essa esfera passe pela
origem). Evidentemente (veja Figura 6.7), existirá algum vetor k0 satis-
fazendo à condição de Laue se, e somente se, algum ponto da rede recíp-
roca (além da origem) estiver sobre a superfície da esfera, caso em que
ocorrerá uma reflexão de Bragg por uma família de planos da rede direta
perpendiculares àquele vetor da rede recíproca.
Em geral, a esfera no espaço-k, com a origem sobre sua superfície, pode
não ter nenhum outro ponto da rede recíproca sobre essa superfície e, por-
tanto, a construção de Ewald confirma nossa observação de que, para um ve-
tor de onda incidente geral, pode não haver nenhum pico de Bragg. Porém,
usando-se várias técnica, é possível nos assegurarmos que alguns picos de
Bragg serão produzidos.

1. Método de Laue Pode-se continuar espalhando de um único cristal


de orientação fixa a partir de uma direção incidente fixa, n̂, mas pode-
se procurar por picos de Bragg usando-se um feixe de raio-X contendo
comprimentos de onda de λ1 até λ0 , ao invés de um monocromático.
A esfera de Ewald será então expandida na região contida entre as
duas esferas determinadas por k0 = 2πn̂/λ0 e k1 = 2πn̂/λ1 ,e os pi-
cos de Bragg serão observados, correspondendo a quaisquer vetores da
rede recíproca dentro dessa região (Figura 6.8). Fazendo-se a faixa de
5.5 Construção de Ewald 87

comprimentos de onda relativamente grande, é certo encontrarmos


alguns pontos da rede recíproca dentro dessa região; contanto que
essa faixa não seja muito grande, podemos evitar muitas reflexões de
Bragg e, portanto, mantendo-se a idéia razoavelmente simples.
O método de Laue é provavelmente o mais conveniente para deter-
minação da orientação de uma amostra de cristal, cuja estrutura seja
conhecida, pois, por exemplo, se a direção de incidência está ao longo
de um eixo de simetria do cristal, o padrão das franjas produzidas pe-
los raios refletidos de Bragg terão a mesma simetria. Como os físicos
de estado sólido geralmente estudam substância de estrutur cristalina
conhecida, o método de Laue é provavelmente o de maior interesse
prático.
2. Método do Cristal Giratório Este método usa raios-X monocromáti-
cos, mas permite variar o ângulo de incidência. Na prática, fixa-se a
direção do feixe de raio-X e varia-se a orientação do cristal. No método
do cristral giratório, o cristal é girado em torno de um eixo fixo, e
todos os picos de Bragg que ocorrem durante a rotação são gravados
num filme. Como o cristal gira, a rede recíproca correspondente girará
da mesma maneira em torno do mesmo eixo. Então a esfera de Ewald
(que é determinada pelo vetor de onda incidente k) é fixa no espaço-
k,enquanto que a rede recíproca como um todo, girará em torno do
eixo de rotação do cristal. Durante essa rotação, cada ponto da rede
recíproca gira em círculo em torno do eixo de rotação e a reflexão de
Bragg ocorrerá se este círculo intercepta a esfera de Ewald. Isto está
ilustrado na Figura 6.9, para uma geometria particularmente simples.
3. Método do Pó ou Método de Debeye-Scherrer Este é equiv-
alente ao método do cristal giratório, no qual permite-se que o eixo
de rotação varie sobre todas as possíveis orientações. Na prática,
essa média isotrópica da direção incidente, é obtida, usando-se uma
amostra policristalina ou um pó, cujos grãos são grandes bastante,
na escala atômica, capazes de difratarem os raios-X. Devido à orien-
tação aleatória dos eixos cristalinos dos grãos individuais, o padrão
de difração produzido pelo tal pó é o que seria produzido pela com-
binação de todos os padrões de difração para todas as orientações
possíveis de um único cristal.
As reflexões de Bragg são agora determinadas, fixando-se o vetor
incidente k, e, com ele, a esfera de Ewald, e permitindo-se que a
rede recíproca gire através de todos os ângulos possíveis em torno
da origem, tal que cada vetor da rede recíproca K dê origem uma
esfera de raio K em torno da origem. Tal esfera, interceptará a esfera
de Ewald num círculo (Figura 6.10a), com a condição de que K seja
menor do que 2k. O vetor ligando qualquer ponto sobre este círculo
com a extremidade do vetor de onda incidente é um vetor de onda k0 ,
88 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

para o qual a radiação espalhada será observada. Então, cada vetor


da rede recíproca de comprimento menor do que 2k gera um cone de
radiação espalhada para frente num ângulo φ, onde (Figura 6.10b)
1
K = 2k sen φ (5.12)
2

Medindo-se os ângulos φ, para os quais ocorrem as reflexões de Bragg,


determinam-se todos os vetores da rede recíproca menores do que
2k. De posse dessas informações, de alguns fatos sobre a simetria do
cristal macroscópico e do fato de que a rede recíproca é uma rede de
Bravais, pode-se construir a rede recíproca para esse cristal (veja, por
exemplo, Problema 1).

5.6 Difração por uma Rede Monoatômica com


Base; Fator de Estrutura Geométrico
A discussão anterior foi baseada na condição (5.7) de que os raios espalha-
dos de cada célula primitiva interferissem construtivamente. Se a estrutura
cristalina é a de uma rede monoatômica com base de n-átomos (por ex-
emplo, o carbono na estrutura do diamante, ou o berílio hexagonal com
agrupamento compacto, ambos com n = 2), então cada célula pode ser
analisada, levando-se em conta um conjunto de espalhadores idênticos lo-
calizados nas posições d1 , ..., dn dentro da célula. A intensidade da radiação
num dado pico de Bragg dependerá do quanto os raios espalhados por cada
sítio da base interferem-se um com o outro, sendo maior quando a inter-
ferência for completamente construtiva, e anulando-se para interferências
completamente destrutivas.
Se o pico de Bragg está associado com a variação do vetor de onda
k0 − k = K, então a diferença de caminho (Figura 6.4) entre os raios
espalhados em di e dj será K· (di − dj )e as fases dos dois raios diferirão
por um fator ei·K·(di −dj ) . Logo, as fases dos raios espalhados em d1 , ..., dn
estão na razão eiK··d1 , ..., eiK··dn . O raio resultante espalhado que emerge de
uma célula primitiva é, então, a soma individual dos raios, e terá portanto
uma amplitude contendo o fator
n
X
SK = eiK··dj (5.13)
j=1

A quantidade SK , conhecida como fator de estrutura geométrico, ex-


pressa o grau de interferência das ondas espalhadas por íons idênticos,
dentro da base, podendo diminuir a intensidade do pico de Bragg associ-
ado com um vetor da rede recíproca K. A intensidade do pico de Bragg,
sendo proporcional ao quadrado do valor absoluto da amplitude, conterá
5.6 Difração por uma Rede Monoatômica com Base; Fator de Estrutura Geométrico 89

o fator |SK |2 . É importante observar que esta não é a única fonte da de-
pendência em K para a intensidade do pico. Além disso, a dependência com
a mudança no vetor de onda origina-se da dependência angular ordinária
de qualquer espalhamento eletromagnético, junto com a influência sobre
o espalhamento da estrutura interna detalhada de cada íon individual na
base. Portanto, o fator de estrutura sozinho não pode ser usado para predi-
zer a intensidade absoluta num pico de Bragg.8 Ele pode, porém, levar a
uma dependência característica com K que é facilmente distinguida mesmo
que outras dependências com K sejam superpostas. O caso onde o fator
de estrutura pode ser usado com segurança é quando ele se anula. Isto
ocorre quando os elementos da base são distribuídos de tal maneira que ex-
ista interferência destrutiva para o K em questão; naquele caso, nenhuma
característica dos raios espalhados por elementos individuais da base pode
evitar que o raio se anule.
Ilustramos a importância de um fator de estrutura nulo em dois casos:9

5.6.1 Rede Cúbica de Corpo Centrado Considerada como


Cúbica Simples com Base
Como a rede cúbica de corpo centrado é uma rede de Bravais, sabemos que
as reflexões de Bragg ocorrerão quando a variação no vetor de onda K é
um vetor da rede recíproca, que é uma rede cúbica de face centrada. Às
vezes é conveniente considerar a rede bcc como uma rede cúbica simples
gerada pelos vetores primitivos ax̂, aŷ e aẑ, com uma base de dois pontos
consistindo em d1 = 0 e d = (a/2) (x̂ + ŷ + ẑ) . Deste ponto de vista, a
rede recíproca é também uma rede cúbica simples, com uma célula cúbica
de lado 2π/a. Porém, existirá agora um fator de estrutura SK associado
com cada reflexão de Bragg. No presente caso, (5.13) dá
£ ¤
SK = 1 + exp iK· 21 a (x̂ + ŷ + ẑ) . (5.14)
Um vetor geral da rede recíproca cúbica simples tem a forma

K= (n1 x̂ + n2 ŷ + n3 ẑ) . (5.15)
a
Substituindo-se isto em (5.14), encontramos um fator de estrutura
SK = 1 + eiπ(n1 +n2 +n3 ) = 1 + (−1)n1 +n2 +n3
½
2, n1 + n2 + n3 par,
= (5.16)
0, n1 + n2 + n3 ímpar.

8 Uma breve, mas completa discussão do espalhamento de radiação eletromagnética

por cristais, incluindo a dedução das fórmulas da intensidade detalhada para várias
geometrias experimentais descritas acima, é dada por Landau e Lifshitz, Eletrodynamics
of Continuous Media, Capítulo 15, Addison-Wesley, Reading, Mass., 1966.
9 Mais exemplos são dados nos Problemas 2 e 3.
90 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

Então, aqueles pontos da rede recíproca cúbica simples, cuja soma das
coordenadas, tomadas em relação aos vetores primitivos cúbicos, sejam
ímpares, não produzirão reflexão de Bragg. Isto transforma a rede recíproca
cúbica simples numa estrutura cúbica de face centrada que teríamos obtido
se tivéssemos tratado a rede direta cúbica de corpo centrado como uma rede
de Bravais, ao invés de uma rede com base (veja Figura 6.11).
Então, se inadvertidamente ou por razões de maior simetria, escolhe-se
para descrever uma rede de Bravais como uma rede com base, ainda assim
recobramos a descrição correta da difração de raio-X, contanto que o fator
de estrutura nulo seja levado em conta.

5.6.2 Rede Monoatômica do Diamente


A rede monoatômica do diamante (carbono, silício, germânio ou estanho
cinza) não é uma rede de Bravais e deve ser descrita como uma rede com
base. A rede básica é a cúbica de face centrada e a base pode considerada
como d1 = 0 e d2 = (a/4) (x̂ + ŷ + ẑ) , onde x̂, ŷ e ẑ estão ao longo dos
eixos do cubo e a é o lado da célula cúbica convencional. A rede recíproca
é cúbica de corpo centrado com a célula cúbica convencional de lado igual
a 4π/a. Tomando-se os vetores primitivos
2π 2π 2π
b1 = (ŷ + ẑ − x̂) , b2 = (ẑ + x̂ − ŷ) , b3 = (x̂ + ŷ − ẑ)
a a a
P (5.17)
então o fator de estrutura (5.13) para K = ni bi é
£ ¤
SK = 1 + exp 21 iπ (n1 + n2 + n3 ) .

 2, n1 + n2 + n3 duas vezes um número par
= 1 ± i n1 + n2 + n3 ímpar (5.18)

0 n1 + n2 + n3 duas vezes um número ímpar.
P
Para interpretar geometricamente P essas condições sobre a ni ,observe
que, se substituirmos (5.17) em K = ni b, podemos escrever o vetor geral
da rede recíproca na forma

K= (ν 1 x̂ + ν 2 ŷ + ν 3 ẑ) (5.19)
a
onde
3
X
1 1
νj = 2 (n1 + n2 + n3 ) − nj , νj = 2 (n1 + n2 + n3 ) . (5.20)
j=1

Sabemos (veja Capítulo 5) que a recíproca da rede fcc com célula cúbica de
lado a é uma rede bcc com célula cúbica de lado 4π/a. Vamos considerar
esta rede como composta de duas redes cúbicas simples de lado 4π/a. A
5.7 Difração por um Cristal Poliatômico; Fator de Forma Atômico 91

primeira, contendo a origem (K = 0) deve ter todos os ν i inteiros (de


acordo com (??)) e deve, portanto, ser dado para K com n1 +n2 +n3 ímpar
(de acordo com (5.20)). A segunda, contendo o ”ponto de corpo centrado”
(4π/a) 21 (x̂ + ŷ + ẑ) , deve ter todos os ν i inteiros + 21 (de acordo com
(??)) e deve, portanto, ser dado para K com n1 + n2 + n3 ímpar (de acordo
com (5.20)).
Comparando isto com (5.18), encontramos que os pontos com fator de
estrutura 1±i são aqueles na sub-rede cúbica simples formada pelos pontos
de ”corpo centrado”. Aqueles, cujoP fator de estrutura é 2 ou 0 estão na
sub-rede contendo a origem, onde ν i é par, quando S = 2, e ímpar,
quando S = 0. Então os pontos com fator de estrutura zero são novamente
removidos, aplicando-se a construção ilustrada na Figura 6.11 à sub-rede
cúbica simples, contendo a origem, convertendo-a numa estrutura cúbica
de face centrada (Figura 6.12).

5.7 Difração por um Cristal Poliatômico; Fator de


Forma Atômico
Se os íons na base não são idênticos, o fator de estrutura (5.13) toma a
forma n
X
SK = fj (K) eiK·dj (5.21)
j=1

onde fj (K) , conhecido como fator de forma atômico, é determinado in-


teiramente pela estrutura interna do íon que ocupa a posição dj na base.
Íons idênticos têm fatores de forma idênticos (independentes de onde eles
são colocados), tal que, no caso monoatômico, (5.21) reduz-se a (5.13),
multiplicada por um valor comum dos fatores de forma.
Em tratamento elementar, o fator de forma associado com uma reflexão
de Bragg dada pelo vetor da rede recíproca K é considerado ser propor-
cional à transformada de Fourier da distribuição de carga eletrônica do
correspondente íon10
Z
1
fj (K) = − dr eiK·r ρj (r) . (5.22)
e
Então, o fator de forma atômico fj depende de K e da forma detalhada
da distribuição de carga do íon que ocupa a posição dj na base. Como
resultado, não se poderia esperar que o fator de estrutura atômico se anu-
lasse para qualquer K, a menos que exista alguma relação casual entre os

1 0 A densidade de carga eletrônica ρ (r) é aquela de um íon do tipo j colocado em


j
r = 0; então, a contribuição do íon localizado em R + dj para a densidade de carga
eletrônica do cristal é ρj (r − [R + dj ]) . (A carga eletrônica é normalmente fatorada do
fator de forma atômico para torná-lo adimensional.)
92 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

fatores de forma de diferentes tipos. Fazendo suposições razoáveis sobre a


dependência de K dos diferentes fatores de forma, pode-se às vezes distin-
guir conclusivamente entre as várias possíveis estruturas cristalinas sobre
as origens da variação com K das intensidade dos picos de Bragg (veja, por
exemplo, Problema 5).
Isto conclui nossa discussão sobre a reflexão de Bragg dos raios-X. Nossa
análise não explorou nenhuma propriedade dos raios-X, que não fosse sua
natureza ondulatória.11 Consequentemente, encontraremos muitos dos con-
ceitos e resultados deste capítulo reaparecendo em discussões subsequentes
de outros fenômenos ondulatórios em sólidos, tais como elétrons (Capítulo
9) e neutrons (Capítulo 24).12

5.8 Problemas

1. Amostras pulverizadas de três diferentes cristais cúbicos monoatômi-


cos são analisadas com uma câmera de Debeye-Scherrer. Sabe-se que
as amostras são cúbica de face centrada, cúbica de corpo centrado e
uma tem a estrutura de diamante. As posições aproximadas dos qua-
tro primeiros anéis de difração em cada caso são (veja Figura 6.13):

VALORES DE φ PARA AS AM OSTRAS

A B C
42, 2o 28, 8o 42, 8o
49, 2 41, 0 73, 2
72, 0 50, 8 89, 0
87, 3 59, 6 115, 0

(a) Identifique as estruturas cristalinas de A, B e C.


(b) Se o comprimento de onda do feixe do raio-X incidente é 1, 5 Å,
qual é o comprimento do lado da célulca cúbica convencional em
cada caso?
(c) Se a estrutura do diamante fosse substituída pela estrutura zincblende
com a célula cúbica de mesmo lado, a que ângulos ocorreriam,
agora, os quatro primeiros anéis?

1 1 Como resultado disto, não foi possível fazermos afirmações sobre a intensidade ab-

soluta dos picos de Bragg, ou sobre o fundo difuso de radiação nas direções que não
fossem permitidas pela condição de Bragg.
1 2 Considerada sob o ponto de vista da mecânica quântica, uma partícula de momento

p pode ser vista como uma onda de comprimento de onda λ = h/p.


5.8 Problemas 93

2. Às vezes é conveniente representar a rede de Bravais cúbica de face


centrada como uma rede cúbica simples, com o lado da célula cúbica
primitiva a e uma base com quatro pontos.

(a) Mostre que o fator de estrutura (5.13) vale então 4 ou 0 em todos


os pontos da rede recíproca cúbica simples.
(b) Mostre que, quando os pontos com fator de estrutura zero são
removidos, os demais pontos da rede recíproca formam uma rede
cúbica de corpo centrado com o lado da célula convencional
4π/a. Por que isto seria esperado?

3. (a) Mostre que todos os fatores de estrutura para uma estrutura


cristalina hexagonal com agrupamento compacto pode ter qual-
quer um dos seis valores 1 + einπ/3 , n = 1, ..., 6, para todos os
valores de K sobre a rede recíproca hexagonal simples.
(b) Mostre que todos os pontos da rede recíporca tem fator de es-
trutura não nulos no plano perpendicular ao eixo-c, contendo
K = 0.
(c) Mostre que os pontos com fatores de estrutura nulos são en-
contrados em planos alternados na família de planos da rede
recíproca perpendicular ao eixo-c.
(d) Mostre que em nesse plano, o ponto que é deslocado de K = 0
por um vetor paralelo ao eixo-c tem fator de estrutura zero.
(e) Mostre que a remoção desse ponto de todos os pontos de fator
de estrutura nulo reduz a malha triangular de pontos da rede
recíproca ao arranjo tipo colméia (Figura 4.3).
4. Considere uma rede com base de n-íons. Suponha que o i-ésimo íon
na base, quando transladado para r = 0, pode ser considerado como
composto de mi partículas puntiformes de carga −zij e, localizadas
na posição bij, j = 1, ..., mj .

(a) Mostre que o fator de forma atômico fi é dado por


mj
X
fi = zij eiK·bij . (5.23)
j=1

(b) Mostre que o fator de estrutura total (5.21), em consequência de


(5.23), é idêntico ao fator de estrutura que teríamos encontrado
se a rede fosse equivalentemente descrita como tendo uma base
de m1 + ... + mn íons.

5. (a) A estrutura do cloreto de sódio (Figura 4.24) pode ser consider-


ada como uma rede de Bravais fcc de cubo de lado a, com uma
94 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

base consistindo em um íon carregado positivamente localizado


na origem e outro íon carregado negativamente localizado em
(a/2)x̂. A rede recíproca é cúbica de corpo centrado e o vetor
geral da rede recíproca tem a forma (??), com todos os coe-
ficientes ν i inteiros ou inteiros + 12 . Se os fatores de estrutura
atômica para os dois íons são f+ e f− , mostre que o fator de es-
trutura é SK = f+ + f− , se os ν i forem inteiros, e SK = f+ − f−
se ν i forem inteiros + 12 . (Por que SK se anula no último caso,
quando f+ = f− ?)
(b) A estrutura zincblende (Figura 4.18) é também uma rede de
Bravais cúbica de face centrada de cubo de lado a, com uma
base consistindo em um íon carregado positivamente localizado
na origem e o outro íon carregado negativamente localizado em
(a/4) (x̂ + ŷ + ẑ) . Mostre que o fator de estrutura SK é igual P a
f+ ± if− se ν i são inteiros + 12 , f+ + f− sePν i são inteiros e νi
é par, e f+ − f− se ν i são inteiros + 12 e ν i é ímpar.
(c) Suponha que se conheça que um cristal cúbico seja composto
de íons com camada fechada (e então esfericamente simétrico),
tal que f± (K) dependa somente do módulo de K. As posições
dos picos de Bragg revelam que a rede de Bravais é cúbica de
face centrada. Discuta como se poderia determinar, a partir dos
fatores de estrutura associados com os picos de Bragg, qual o
tipo mais provável da estrutura cristalina, se cloreto de sódio ou
zincblende.
This is page 95
Printer: Opaque this

6
Classificação das Redes de Bravais e
Estruturas Cristalinas

Nos Capítulos 4 e 5, descrevemos e exploramos apenas as simetrias transla-


cionais das redes de Bravais. Por exemplo, a existência e propriedades bási-
cas das redes recíprocas dependem somente da existência de três vetores
primitivos da rede direta ai e não das relações especiais que eles possam
ter entre si.1 As simetrias translacionais são as mais importantes para a
teoria geral dos sólidos. Contudo, observa-se dos exemplos já descritos, que
as redes de Bravais ocorrem, naturalmente, em outras categorias com bases
de simetrias diferentes da translacional. Redes de Bravais hexagonais sim-
ples, por exemplo, independentemente da razão c/a, assemelham-se a um
outro tipo de rede diferente dos três tipos de redes cúbicas de Bravais já
descritas.
É objetivo da cristalografia fazer tais distinções sistemáticas e precisas.2
Aqui, indicaremos apenas as bases para uma classificação cristalográfica
mais elaborada, dando algumas das categorias mais importantes e intro-
duzindo a linguagem pela qual elas são descritas. Na maioria das aplicações,
o que de fato interessa são as características de casos particulares, melhor
do que uma teoria geral sistemática, pois poucos físicos do estado sólido
precisam dominar a análise completa da cristalografia. De fato, o leitor
com pouco interesse no assunto pode saltar este capítulo com pouco pre-

1 Um exemplo de tal relação é a condição de ortogonalidade a · a = a2 δ ,válida


i j ij
para vetores primitivos apropriados numa rede de Bravais cúbica simples.
2 Uma visão detalhada do assunto pode ser encontrada em M. J. Buerger, Elementary

Crystallography, Willey, New York, 1963.


96 6. Classificação das Redes de Bravais e Estruturas Cristalinas

juizo para o entendimento dos capítulos subsequentes, voltando a ele por


ocasião de esclarecimentos de termos técnicos.

6.1 Classificação das Redes de Bravais


O problema de classificar todas as possíveis estruturas cristalinas é uma
tarefa muito complexa para se fazer diretamente, de forma que primeiro
consideramos apenas a classificação das redes de Bravais.3 Do ponto de
vista de simetria, uma rede de Bravais é caracterizada pelas especificações
de todas as operações rígidas4 que deixam a rede inalterada. Este conjunto
de operações é conhecido como grupo de simetria ou grupo espacial da rede
de Bravais.5
As operações do grupo de simetria de uma rede de Bravais incluem to-
das as translações através dos vetores de rede. Porém, além das translações,
existem, em geral, rotações, reflexões e inversões6 que mantém a rede inal-
terada. Uma rede de Bravais cúbica, por exemplo, fica inalterada por uma
rotação de 90o em torno de uma linha de pontos da rede numa direção
h100i, por uma rotação de 120o em torno de uma linha de pontos da rede
numa direção h111i, por reflexão de todos os pontos num plano de rede
{100},etc.; um rede de Bravais hexagonal simples, fica inalterada por uma
rotação de 60o em torno de uma linha de pontos da rede paralela ao eixo-c,
por reflexão num plano perpendicular ao eixo-c, etc.
Qualquer operação de simetria de uma rede de Bravais pode ser decom-
posta numa translação TR através de um vetor R da rede e numa operação
rígida, mantendo-se pelo menos um ponto da rede fixo.7 Isto não é imediata-
mente óbvio. Uma rede de Bravais cúbica simples, por exemplo, é mantida
fíxa por uma rotação de 90o em torno de um eixo h100i que passa através
do centro da célula primitiva cúbica com pontos da rede nos oito vértices
do cubo. Isto é uma operação rígida onde nenhum ponto é mantido fixo.
Todavia, ela pode ser decomposta numa translação atavés de um vetor da
rede de Bravais e numa rotação em torno de uma linha de pontos de rede,

3 Neste capítulo, a rede de Bravais é vista como uma estrutura cristalina formada pela

distribuição, em cada ponto de uma rede de Bravais abstrata, de uma base de simetria
máxima possível (tal como uma esfera centrada num ponto da rede), tal que nenhuma
simetria da rede de Bravais de pontos seja perdida devido à inserção da base.
4 Operações que preservam as distâncias entre todos os pontos.
5 Evitaremos a linguagem da teoria matemática de grupo, pois não faremos nenhum

uso das conclusões analíticas às quais elas conduzem.


6 Reflexões num plano substitui um objeto por sua imagem especular naquele plano;

inversões num ponto P transforma o ponto com coordenadas r (com relação a P , tomado
como origem) em −r. Todas as redes de Bravais têm simetria de inversão em qualquer
ponto da rede (Problema 1).
7 Note que numa translação através de um vetor (diferente de 0) nenhum ponto se

mantém fixo.
6.2 Os Sete Sistemas Cristalinos 97

como ilustrado na Figura 7.1. Veremos a seguir, que tal representação é


sempre possível:
Considere uma operação de simetria S que não mantém nenhum ponto
da rede fixo. Suponha que esta operação translade a origem da rede de
O para R. Agora, considere a operação, onde primeiro aplicamos S e, em
seguida, uma translação através do vetor da rede −R, que denotaremos
por T−R . A operação composta, que chamaremos de T−R S é também uma
simetria da rede, mas ela deixa a origem fixa, uma vez que S translada a
origem para R, enquanto que T−R traz R de volta para a origem. Então,
T−R S é uma operação, na qual pelo menos um ponto é mantido fixo (no
caso, a origem). Porém, se após a operação T−R S, realizamos a operação
TR ,o resultado é equivalente à operação S apenas, uma vez que a aplicação
final de TR , desfaz a aplicação precedente de T−R . Portanto, S pode ser
decomposta de T−R S, que deixa um ponto fixo, e TR ,que é uma translação
pura.
Assim, o grupo completo de simetria de uma rede de Bravais8 contém
somente operações das seguintes formas:

1. Translações através de vetore da rede de Bravais;

2. Operações que deixam um ponto particular da rede fixo;

3. Operações que podem ser construídas por sucessivas aplicações das


operações do tipo (1) ou (2).

6.2 Os Sete Sistemas Cristalinos


Quando examinamos simetrias não-translacionais, considera-se às vezes não
o grupo espacial de uma rede de Bravais completo, mas apenas aquelas
operações que deixam um determinado ponta da rede fixo (i.e., operações
na categoria (2) acima). Este subconjunto do grupo de simetria de uma
rede de Bravais é chamado de grupo puntual da rede de Bravais.
Existem somente sete grupos puntuais distintos que uma rede de Bravais
pode ter.9 Qualquer estrutura cristalina pertence a um dos sete sistemas
cristalinos, dependendo do qual desses sete grupos puntuais é o grupo de

8 Veremos mais adiante que uma estrutura cristalina geral pode ter operações de

simetria adicionais que não são dos tipos (1), (2) ou (3). Elas são conhecidas como
”screw axis” e ”glide planes”.
9 Dois grupos puntuais são idênticos se eles contiverem precisamente as mesmas oper-

ações. Por exemplo, o conjunto de todas as operações de simetria de um cubo é idêntico


ao conjunto de todas as operações de simetria de um octaedro regular, como pode ser
visto facilmente, inscrevendo-se apropriadamente o octaedro no cubo (Fig. 7.2a). Por
outro lado, o grupo de simetria do cubo não é equivalente ao grupo de simetria do
tetraedro regular. O cubo possui mais operações de simetris (Fig. 7.2b).
98 6. Classificação das Redes de Bravais e Estruturas Cristalinas

sua rede de Bravais básica. Os sete sistemas cristalinos são enumerados na


próxima seção.

6.3 As Quatorze Redes de Bravais


Quando relaxamos as restrições a operações puntuais e consideramos o
grupo completo de simetria da rede de Bravais, existirão quatorze grupos
espaciais distintos que uma rede de Bravais pode ter.10 Então, do ponto de
vista de simetria, existem quatorze diferentes tipos de redes de Bravais. Esta
enumeração foi feito primeiramente por M. L. Frankheim (1842). Porém,
Frankheim enganou-se reportando quinze possibilidades. A. Bravais (1845)
foi o primeiro a contar as categorias corretamente.

6.4 Enumeração dos Sete Sistemas Cristalinos e


Quatorze Redes De Bravais
Relacionamos abaixo os sete sistemas cristalinos e as redes de Bravais per-
tencentes a cada um deles. O número de redes de Bravais num sistema é
dado entre parênteses após o nome do sistema.

• Cúbico (3) O sistema cúbico contém aquelas redes de Bravais,


cujos grupos puntuais é o grupo de simetria de um cubo (Fig. 7.3a).
Três redes de Bravais com grupos espaciais não equivalentes têm o

10 A equivalência de dois grupos espaciais da rede de Bravais é uma noção mais sutil
do que a equivalência de dois grupos puntuais (embora ambas se reduzam ao conceito
de ”isomorfismo” na teoria de grupo abstrata.) Não é demais dizer que dois grupos são
equivalentes se eles tiverem as mesmas operações, pois operaçòes de grupos espaciais
idênticos podem diferir de formas inconsequentes. Por exemplo, duas redes de Bravais
cúbicas simples com diferentes constantes de rede, a e a0 , são consideradas ter os mesmos
grupos espaciais, embora numa as translações tenham passo a e na outra, a0 . Similar-
mente, gostaríamos de considerar todas as redes de Bravais hexagonais simples como
tendo grupos espaciais idênticos, independentemente, do valor de c/a, que é, obviamente,
irrelevante para a simetria total da estrutura.
Podemos resolver este problema, notando-se que nesses casos, pode-se deformar con-
tinuamente uma estrutura de um dado tipo numa outra de mesmo tipo, sem perder
qualquer uma das operações de simetria. Então, pode-se expandir uniformemente os
eixos do cubo de a até a0 , mantendo-se sempre a simetria cúbica simples, ou pode-se di-
latar (ou comprimir) o eixo-c (ou eixo-a), sempre mantendo a simetria hexagonal simples.
Portanto, duas redes de Bravais podem ser ditas ter o mesmo grupo espacial se for pos-
sível transformar, continuamente, uma na outra, de tal maneira que qualquer operação
de simetria da primeira seja transformada continuamente numa operação de simetria da
segunda, e que não exista nenhuma operação adicional de simetria da segunda rede que
não possa ser obtida das operações de simetria da primeira rede.
6.4 Enumeração dos Sete Sistemas Cristalinos e Quatorze Redes De Bravais 99

grupo puntual cúbico. Eles são cúbica simples, cúbica de corpo cen-
trado e cúbica de face centrada. As três foram descritas no Capítulo
4.

• Tetragonal (2) Pode-se reduzir a simetria de um cubo, puxando-


o por duas faces opostas para esticá-lo e transformá-lo num prisma
retangular com uma base quadrada, mas com a medida da altura
diferente da dos lados do quadrado (Fig. 7.3b). O grupo de sime-
tria deste objeto é o grupo tetragonal. Assim, esticando-se a rede de
Bravais cúbica simples contrói-se a rede de Bravais tetragonal sim-
ples, que pode ser caracterizada como uma rede de Bravais gerada
por três vetores primitivos mutuamene perpendiculares, apenas dois
dos quais, com o mesmo comprimento. O terceiro eixo é chamado de
eixo-c. Similarmente, esticando-se as redes cúbicas de corpo centrado
e face centrada, obtém apenas mais uma rede de Bravais do sistema
tetragonal, a tetragonal centrada.
Para se vê por que não existe distinção entre a tetragonal de corpo
centrado e de face centrada, considere a Fig. 7.4a, que é uma repre-
sentação de uma rede de Bravais tetragonal centrada vista do eixo-
c.O ponto 2 está num plano da rede a uma distância c/2 do plano
contendo os pontos 1. Se c = a, a estrutura é uma rede cúbica de
corpo centrado, e para um c qualquer, ela pode evidentemente ser
vista como o resultado da deformação da rede bcc ao longo do eixo-c.
Porém, a mesma rede pode também ser vista do eixo-c, como na Fig.
7.4b, com os planos da √rede considerados como √ arranjos quadrados
centrados de lado a0 = 2a. Se c = a0 /2 = a/ 2 a estrutura é uma
rede de Bravais cúbica de face centrada, e para c qualquer pode ser
vista como o resultado de se deformar a rede fcc ao longo do eixo-c.
Ou seja, as redes cúbica de face centrada e de corpo centrado são
casos especiais da rede tetragonal centrada, na qual o valor partic-
ular da razão c/a introduz simetrias extras, que são reveladas mais
claramente quando se vê as redes como na Fig. 7.4a (bcc) e Fig. 7.4b
(fcc).
Da mesma maneira, pode-se reduzir a simetria puntual da rede tetrag-
onal centrada para a ortorrômbica, de duas maneira, deformando-a,
ou ao longo do cojunto de linhas paralelas traçadas na Fig. 7.4a para
produzir a ortorrômbica de corpo centrado, ou ao longo do cojunto
de linhas paralelas traçadas na Fig. 7.4b, produzindo a ortorrômbica
de face centrada.
Estas quatro redes esgotam o sistema ortorrômbico.

• Monoclínico (2) Pode-se reduzir a simetria ortorrombica, distorcendo-


se as faces retangulares perpendiculares ao eixo-c na Fig. 7.3c num
paralelogramo geral. Este grupo de simetria do objeto resultante
100 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(Fig. 7.3d) é o grupo monoclínico. Assim, distorcendo-se uma rede


de Bravais ortorrômbica simples produz-se uma rede de Bravais mon-
oclínica simples, cujas simetrias são aquelas requeridas pelo fato de
que elas podem ser geradas por três vetores primitivos, um dos quais
é perpendicular ao plano formado pelos outros dois. Similarmente,
distorcendo-se a rede de Bravais ortorrômbica de base centrada produz-
se uma rede com o mesmo grupo espacial monoclínico simples. Porém,
distorcendo-se ou a rede de Bravais ortorrômibica de face centrada ou
de corpo centrado produz-se a rede de Bravais monoclínica centrada
(Fig. 7.6).

Note que as duas redes monoclínicas correspondem às duas tetrag-


onais. A duplicação no caso ortorrômbico reflete o fato de que uma
rede retangular e uma rede retangular centrada tem dois grupos de
simetria bidimensional distintos, enquanto que a rede quadrada e a
rede quadrada centrada não são distintas, assim como a rede paralel-
ogrâmica e paralelogrâmica centrada que têm a mesma simetria.

• Triclínico (1) A destruição do cubo é completada, inclinando-se


o eixo-c na Fig. 7.3d, tal que nenhum dos lado seja perpendicular aos
outros dois, resultando no objeto ilustrado na Fig. 7.3e, sobre o qual
não existe nenhuma restrição, a não ser que os pares de faces opostos
são paralelas. Assim, distorcendo-se a rede de Bravais monoclínica,
construimos a rede de Bravais triclínica. Ela é uma rede gerada por
três vetores primitivos sem nenhuma relação especial entre si, e é
portanto uma rede de Bravais de simetria mínima. Mas, o grupo
puntual triclínico não é o grupo de um objeto sem qualquer simetria,
pois qualquer rede de Bravais é invariante sob inversão num ponto da
rede. Essa, porém, é a única simetria requerida pela definição geral
da rede de uma Bravais e, portanto, é a única operação11 no grupo
pontual triclínico.

Assim, torturando-se um cubo, chegamos a doze das quatorze redes


de Bravais e cinco dos sete sistemas cristalinos. Podemos encontrar
o décimo terceiro e o sexto, retomando-se o cubo e distorcendo-o de
maneira diferente.

• Trigonal (1) O grupo puntual trigonal descreve uma simetria


de objetos, e produz-se esticando um cubo ao longo da diagonal do
corpo (Fig. 7.3f). A rede assim obtida, distorcendo-se qualquer uma
das três redes de Bravais cúbica é a rede de Bravais romboédrica (ou

1 1 Além da operação identidade (não mexe com a rede), que está sempre presente entre

os membros de um grupo de simetria.


6.5 Grupos Puntuais e Grupos Espaciais Cristalográficos 101

trigonal ). Ela é gerada por três vetores primitivos de mesmo tamanho,


fazendo ângulos iguais entre si.12 .
Finalmente, não relacionada com o cubo é:

• Hexagonal (1) O grupo puntual hexagonal é o grupo de sime-


tria de um prisma reto, tendo como base um hexágono regular (Fig.
7.3g). A rede de Bravais hexagonal simples ( descrita no Capítulo 4)
tem um grupo puntual hexagonal e é a única rede de Bravais no
sistema hexagonal13 ,
Os sete sistemas cristalinos e as quatorze redes de Bravais descritas
a acima esgota todas as possibilidades. Não é óbvio (ou as redes de-
veriam ser conhecidas como redes de Frankheim). Porém, não tem
nenhuma importância prática entender por que esses são os únicos
casos distintos. É o bastante conhecermos por que as categorias exis-
tem e quais são elas.

6.5 Grupos Puntuais e Grupos Espaciais


Cristalográficos
A seguir, descreveremos os resultados de uma análise similar, aplicada não
às rede de Bravais, mas a estruturas cristalinas em geral. Consideremos a
estrutura obtida, tansladando-se um objeto arbitrário através dos vetores
de qualquer rede de Bravais, e tentemos classificar os grupos de simetria
dos arranjos assim obtidos. Isto depende tanto da simetria do objeto, como
da simetria da rede de Bravais. Uma vez que não se exige que os objetos
tenham simetria máxima (e.g., esférica) o número de grupos de simetria
cresce enormemente: existem 230 grupos de simetria diferentes que uma
rede com base pode ter, conhecidos como os 230 grupos espaciais. (Compare
com os quatorze grupos espaciais que resultam, quando se exige que a base
seja completamente simétrica.)
Os grupos puntuas possíveis de uma estrutura cristalina geral também
já foi enumerado. Eles descrevem as operações de simetria que transforma o
cristal nele próprio, deixando um ponto fixo (i.e., simetrias não-translacionais).
Existem trinta e dois grupos puntuais distintos que a estrutura cristalina
pode ter, conhecidos como os trinta e dois grupos puntuais cristalográficos.

1 2 Valores especiais desse ângulo pode introduzir simetrias extras, que, neste caso, a

rede pode ser realmente uma das três redes cúbicas. Veja, por exemplo, Problema 2(a).
1 3 Se tentarmos produzir mais redes de Bravais, a partir das distorções da hexag-

onal simples, encontra-se que, mudando o ângulo entre os dois vetores primitivos de
comprimentos iguais perpendiculares ao eixo-c resulta numa rede ortorrômbica de base
centrada, mudando seus comprimentos, obtém-se a monoclínica, e inclinando-se o eixo-c,
obtém em geral a triclínica.
102 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(Compare com os sete grupos puntuais que resultam, quando se exige que
a base seja completamente simétrica.)
Esses vários números e suas relações entre si são sumarizadas na Tab. 7.1
Os trinta e dois grupos puntuais cristalográficos podem ser construídos
dos sete grupos puntuais da rede de Bravais, considerando-se sistematica-
mente todas as possíveis maneiras de reduzir a simetria dos objetos (Fig.
7.3) caracterizada por esses grupos.
Cada um dos vinte e cinco novos grupos construídos desta maneira é as-
sociado com um dos sete sistemas de acordo com a seguinte regra: Qualquer
grupo construído pela redução da simetria de um objeto caracterizado por
um sistema cristalino particular continua pertencendo àquele sistema até
que a simetria tenha sido reduzida de tal forma, que todas as operações
de simetria do objeto remanescentes são também encontradas em sistemas
cristalinos menos simétricos; quando isto acontece, o grupo de simetria do
objeto é transferido para o sistema crislalino menos simétrico. Então, o sis-
tema cristalino de um grupo puntual cristalográfico é o menos simétrico14
dos sete grupos puntuais da rede de Bravais, contendo qualquer operação
de simetria do grupo cristalográfico.
Objetos com as simetrias dos cinco grupos cristalográficos no sistema
cúbico são ilustrados na Tab. 7.2. Objetos com as simetrias dos vinte e sete
grupos cristalográficos não-cúbicos são mostrados na Tab, 7.3.
Grupos puntuais cristalográficos podem conter os seguintes tipos de op-
erações de simetria:

1. Rotações de Múltiplos Inteiros de 2π/n em Torno de um Eixo


O eixo é chamado de eixo-n de rotação. É facilmente mostrado (Prob-
lema 6) que uma rede de Bravais pode conter somente eixos 2, 3, 4 ou
6. Como os grupos puntuais cristalográficos estão contidos nos grupos
puntuais da rede de Bravais, eles também só podem ter esses eixos.

2. Rotação-Reflexão Mesmo quando uma rotação de 2π/n não


é um elemento de simetria, às vezes tal rotação seguida por uma

14 A noção de hierarquia de simetrias de sistemas cristalinos precisa ser mais elaborada.


Na Fig. 7.7 cada sistema cristalino é mais simétrico do que possa ser atingido a partir
dele, seguindo-se a seta; i.e., o correspondente grupo puntual da rede de Bravais tem
todas as operaçõ es que os grupos, a partir da qual, possam ser atingidos. Parece existir
alguma ambiguidade neste esquema, pois os quatro pares cúbica-heagonal, tetragonal-
heagonal , tetragonal-trigonal e ortorrômbica-trigonal não são ordenados pela seta. En-
tão, poderíamos imaginar um objeto, onde todas as operações de simetria pertencesse
tanto ao grupo tetragonal como trigonal, mas a nenhum dos grupos mais abaixo. O
grupo de simetria de tal objeto pertenceria ou ao sistema tetragonal, ou trigonal, pois
não existiria um sistema único de simetria mais baixa. Segue-se deste e dos três outros
casos ambíguos, que todos os elementos de simetria comuns a ambos os grupos num par
também pertencem ao grupo que está hierarquicamente mais abaixo que os dois. (Por
exemplo, qualquer elemento comum aos grupos tetragonal e trigonal, também pertence
ao grupo monoclínico.) Existe portanto sempre um grupo único de simetria inferior.
6.6 Nomenclatura dos Grupos Puntuais 103

reflexão num plano perpedendicular ao eixo pode ser. O eixo é então


chamado de eixo-n de rotação reflexão. Por exemplo, os grupos S6 e
S4 (Tab. 7.3) têm eixos de rotação-reflexão 6 e 4.

3. Rotação-Inversão Similarmente, às vezes a rotação de 2π/n


seguida por uma inversão num ponto pertencente ao eixo de rotação
é um elemento de simetria, mesmo quando tal rotação em si não o
for. O eixo é então chamado de eixo-n de rotação-inversão. O eixo
em S4 (Tab. 7.3), por exemplo, é também um eixo rotação-inversão
4. Porém, os grupos S6 tem somente um eixo rotação-inversão 3.

4. Reflexões Uma reflexão transforma qualquer ponto em sua im-


agem especular num plano, conhecido como plano do espelho.

5. Inversões Uma inversão tem um único ponto fixo. Se aquele


ponto é considerado como a origem, então qualquer ponto r transforma-
se em −r.

6.6 Nomenclatura dos Grupos Puntuais


Duas nomenclaturas, a de Schöenflies e a internacional, são largamente
usadas. Ambas as designações são dadas nas Tabs. 7.2 e 7.3.

6.6.1 Notação de Schöenflies para Grupos Puntuais


Cristalográficos Não-Cúbicos
As categorias de Schöenflies são ilustradas, agrupando-se a linhas na Tab.
7.3 de acordo com os índices dados do lado esquerdo. São elas:15

1 5 C significa ”cíclico”, D ”diédrico ”, e S ”Spiegel” (espelho). Os subscritos h, v e

d significa ”horizontal ”, ”vertical ” e ”diagonal” e refere-se à colocação dos planos do


espelho com respeito ao eixo-n, considerado na vertical. (Os planos ”diagonal ” em Dnd
são verticais e são a bissetriz do ângulo entre os eixo-2.)
104 6. Classificação das Redes de Bravais e Estruturas Cristalinas

C n: Esses grupos contém somente eixos-n de rotação.


C nv :Além dos eixox-n, esses grupos têm um plano de espelho que contém
o eixo de rotação, e mais tantos planos adicionais, quantos a existência
dos eixos-n exigirem.
C nh : Esses grupos contém, além dos eixos-n,um único plano de espelho
que é perpendicular ao eixo.
Sn Esses grupos contém somente um eixo-n de rotação-reflexão.
Dn Além de um eixo-n de rotação, esses grupos contém um eixo-2
perpendicular ao eixo-n, e mais tantos eixos-2 adicionais forem
requeridos pela existência do eixo-n.
D nh Esses (o mais simétrico dos grupos) contém todos os elementos de
D n , mais um plano de espelho perpendicular ao eixo-n.
D nd Esses contém os elementos de D n e mais planos de espelho
contendo o eixo-n, que é a bissetriz do ângulo entre os eixos-2.
É instrutivo verificar que os objetos mostrados na Tab. 7.3, têm realmente
as simetrias requeridas pelos nomes de Schöenflies.

6.6.2 Notação Internacional para Grupos Puntuais


Cristalográficos Não-Cúbicos
As categorias internacionais são ilustradas, agrupando-se as linhas na Tab.
7.3 de acordo com os índices dados do lado direito. Três categorias são
idênticas às categorias de Schöenflies:
n é a mesma que C n
nmm é a mesma que Cnv . Os dois m’s referem-se a dois tipos distintos de
planos de epelho contendo o eixo-n. O que eles são, é evidente da ilustração
dos objetos 6mm, 4mm e 2mm. Isto demonstra que um eixo-2j transforma
um plano de espelho vertical em j planos, mas em adição, outros j apare-
cem automaticamente como bissetrizes dos angulos entre planos adjacentes
no primeiro conjunto. Porém, um eixo-(2j + 1) transforma um plano de
espelho em 2j + 1 outros planos equivalentes, e portanto16 C3v é chamado
apenas .de 3m.
n22 é o mesmo que D n . A discussão é a mesma que para nmm, mas
agora eixos-2 são envolvidos, ao invés de planos de espelho verticais.
As outras categorias internacionais e suas relações com aquela de Schöen-
flies são as seguintes:
n/m é o mesmo que Cnh , exceto que o sistema internacional prefere
considerar C3h como contendo um eixo-6 rotação-inversão, fazendo-o 6̄ (veja
a próxima categoria). Note também que C1h torna-se simplesmente m, ao
invés de 1/m.

1 6 Para enfatizar a diferença entre eixos−n pares e ímpares, o sistema internaciona, ao

contrário de Schöenflies, trata o eixo-3 como um caso especial.


6.7 Os 230 Grupos Espaciais 105

n̄ é um grupo com um eixo-n de rotação-inversão. Esta categoria contém


C3h , disfarçado de 6̄. Contém também S4 que vai sutilfmente para 4̄. Mas,
S6 torna-se 3̄ e S2 torna-se 1̄ em virtude da difernça entre os eixos rotação-
reflexão e rotação-inversão.
n 2 2
m m m , abreviado por n/mmm, é justamente Dnh exceto que o sistema
internacional prefere considerar D3h como contendo um eixo-6 de rotação-
inversão, fazendo-o 6̄2m (veja a próxima categora, e note a similaridade
para a ejeção de C3h de n/m para n̄). Note também que 2/mmm é con-
vencionalmente abreviado como mmm.
n̄2m é o mesmo que Dnd exceto que D3h é incluído como 6̄2m. O nome na
verdade sugere um eixo-n de rotação inversão com um eixo-2 perpendicular
e um pano de espelho vertical. O caso n = 3 é novamente excepcional, a
2
denominação sendo 3̄ m (abreviado, 3̄m) para enfatizar que neste caso o
plano de espelho vertical é perpendicular ao eixo-2.

6.6.3 Nomenclatura para os Grupos Puntuais Cristalográficos


Cúbicos
Os nomes de Schöenflies e internacionais para os cinco grupos cúbicos são
dados na Tab. 7.2. Oh é grupo de simetria completa do cubo (ou octaedro,
daí o O), incluindo operações impróprias.17 as quais admitem um plano de
reflexão horizontal (h). O é o grupo cúbico (ou octaedro) sem operações
impróprias. Td é o grupo de simetria completo do tetraedro regular, ex-
cluindo todas as operações impróprias, e Th é o grupo de simetria completo
do tetraedro regular, incluindo todas as operações impróprias, T é o grupo
de simetria completo do tetraedro regular, excluindo todas as operações
impróprias e Th é o que resulta quando uma inversão é acrescentada a T.
Os nomes internacionais para os grupos cúbicos são convencionalmente
dintinguidos daqueles de outros grupos puntuais cristalográficos por conter
3 como segundo número, referindo-se ao eixo-3 presente em todos os grupos
cúbicos.

6.7 Os 230 Grupos Espaciais


Teremos pouca coisa a dizer sobre os 230 grupos espaciais, a não ser apon-
tar que o número é muito maior do que poderíamos pensar. Para cada sis-
tema cristalino podemos construir uma estrutura cristalina com um grupo
espacial diferente, colocando-se um objeto com as simetrias de cada um
dos grupos puntuais em cada uma das redes de Bravais do sistema. Desta

1 7 Qualquer operação que transforma um objeto no seu reverso. Todas as outras oper-

ações são próprias. Operações contendo um número ímpar de inversões são impróprias.
106 6. Classificação das Redes de Bravais e Estruturas Cristalinas

maneira, porém, encontramoa somente 61 grupos spaciais, como mostrado


na Tab. 7.4.
Podemos suprir mais cinco, observando-se que um objeto com simetria
trigonal dá um grupo espacial, ainda não enumerado, quando colocado
numa rede de Bravais hexagonal.18 Outros sete originam-se de casos nos
quais um objeto com a simetria de um dado grupo puntual pode ser orien-
tado em mais de uma maneira num dada rede de Bravais, tal que origina
mais de um grupo espacial. Esses 73 grupos espaciais são chamados de
simórfico
A maioria dos grupos espaciais é não-simórfico, contendo operações adi-
cionais que não podem simplesmente ser decompostas em translações da
rede de Bravais e de operação de grupos pontuais. Para existirem tais op-
erações adicionais é essencial que exista alguma relação especial entre as
dimensões da base e as dimensões da rede de Bravais. Quando a base tem
um tamanho razoavelmente casado aos vetores primitivos da rede, podem
se originar dois novos tipos de operações;

1. Eixos ... A uma estrutura cristalina com um eixo XXX

1 8 Embora o grupo puntual trigonal esteja contido no grupo puntual hexagonal, a rede

de Bravais trigonal não pode ser obtida da rede hexagonal simples por uma distorção
infinitesimal. (Isto é contrário a todos os outros pares de sistemas conectados pelas setas
na hierarquia de simetria da Fig. 7.7.) O grupo puntual trigonal está contido no grupo
puntual hexagonal porque a rede de Bravais trigonal pode ser vista como uma hexagonal
simples com uma base de três pontos consistindo em

1
0; a , 1 a , 1 c;
3 1 3 2 3
e 2
a , 2 a , 2 c.
3 1 3 2 3

Como resultado, colocando-se uma base com grupo puntual trigonal numa rede de Bra-
vais hexagonal resulta em diferente grupo espacial daquele obtido colocando-se a mesma
base numa rede trigonal. Em nenhum outro caso isso se repete. Por exemplo, uma base
com simetria tetragonal, quando colocada numa rede cúbica simples, dá exatamente o
mesmo grupo espacial como se tivesse sido colodada numa rede tetragonal simples (a
menos que exista uma relação especial entre as dimensões do objeto e o comprimento do
eixo-c). Isto é refletido fisicamente no fato de que existem cristais que têm bases trigonais
nas redes de Bravais hexagonal, mas não com base tetragonal em redes de Bravais cúbi-
cas. No último caso, nada na estrutura de tal objeto requer que o eixo-c tenha o mesmo
comprimento que os eixox-a; se a rede permaneceu cúbica foi mera coincidência. Ao
contrário, uma rede de Bravais hexagonal simples não pode ser distorcida cotinuamente
para se obter uma rede trigonal, e pode, portanto, manter-se na sua forma hexagonal
simples, mesmo que a base tenha apenas simetria trigonal.
Devido aos grupos puntuais trigonais poderem caracterizar um estrutura cristalina
com uma rede de Bravais hexagonal simples, os cristalógrafos afirmam que existem
somente seis sistemas cristalinos. Isto é porque a cristalografia enfatiza mais a simetria
puntual do que a espacial. Porém, do ponto de vista dos grupos puntuais da rede de
Bravais, existem inquestionavelmente sete sistemas cristalinos: os grupos puntuais D3d
e D6h são ambos grupos puntuais das redes de Bravais e não são equivalentes.
6.8 Exemplos entre os Elementos 107

6.8 Exemplos entre os Elementos


No Capítulo 4, relacionamos aqueles elementos com estruturas cristalinas
cúbica de face centrada, cúbica de corpo centrado, hexagonal com agrupa-
mento compacto ou diamante. Mais de 70 por cento dos elementos estão
nessas quatro categorias. Os demais, estão distribuídos entre uma variedade
de estruturas cristalinas, a maioria com células primitivas poliatômicas que
às vezes são muito complexas. Concluímos este capítulo com mais alguns
exemplos listados na Tabs. 7.5, 7.6 e 7.7. Os dados são de Wickoff (veja
Tab. 4.1) e para a temperatura ambiente e pressão atmosférica normal, a
menos que se diga o contrário.

6.9 Problemas
(a) Prove que qualquer rede de Bravais tem simetria de inversão num
ponto de rede. (Sugestão: Expresse as translações da rede como
combinações lineares dos vetores primitivos com coeficientes in-
teiros.)
(b) Prove que a estrutura do diamante é invariante sob uma inver-
são no ponto central de qualquer ligação entre vizinhos mais
próximos.
(c) Mostre que a estrutura do diamante não é invariante sob inver-
sões em quaisquer outros pontos.
(a) Se os três vetores primitivos para uma rede de Bravais trigonal
formam um ângulo de 90o entre si, a rede tem obviamente mais
simetria do que a trigonal, sendo cúbica simples. Mostre que se
os ângulos são 60o ou arccos (- 31 ) a rede novamente tem mais
simetria do que a trigonal, sendo cúbica de face centrada ou
cúbica de corpo centrado.
(b) Mostre que a rede cúbicas simples pode ser representada como
uma rede trigonal com vetores primitivos ai formando um ângulo
de 60o entre si, com uma base de dois pontos ± 12 (a1 + a2 + a3 ) .
(Compare esses números com as estruturas cristalinas na Tab.
7.5.)
(c) Que estrutura resulta se a base na mesma rede trigonal é con-
siderada como ± 81 (a1 + a2 + a3 )?
1. Se dois sistemas são conectados por setas na hierarquia de simetria
da Fig. 7.7, então a rede de Bravais no sistema mais simétrico pode
ser reduzida para aquela de sistema menor simétrico, fazendo-se dis-
torções infinitesimais, exceto para o par hexagonal-trigonal. As dis-
torções apropriadas foram descritas no texto em todos os caso, exceto
par hexagonal-ortorrômbica e trigonal-monoclínica.
108 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(a) Descreva uma distorção infinitesimal que reduz a rede de Bravais


hexagonal simples a uma no sistema ortorrômbico.
(b) Que espécie de rede de Bravais ortorrômbica pode ser obtida
dessa maneira?
(c) Descreva uma distorção infinitesimal que reduz a rede de Bravais
trigonal a uma no sistema monoclínico.
(d) Que espécie de rede de Bravais monoclínica pode ser obtida dessa
maneira?
(a) Quais dos grupos puntuais trigonais descritos na Tab. 7.3 é um
grupo puntual da rede de Bravais? Isto é, qual dos objetos rep-
resentativos tem a simetria do objeto mostrado na Fig. 7.3f?
(b) Na Fig. 7.9, as faces do objeto da Fig. 7.3f são decoradas de
várias maneiras redotoras de simetria para produzir objetos com
as simetrias dos quatro grupos puntuais trigonais restantes. Referindo-
se à Tab. 7.3, indique a simetria do grupo puntual de cada ob-
jeto.
2. Qual das 14 redes de Bravais, fora as cúbicas de face centrada e de
corpo centrado, que não tenham redes recíprocas da mesma espécie?
(a) Mostre que existe uma família de planos de rede perpendicular
a qualquer eixo-n de rotação de uma rede de Bravais, n ≥ 3. (O
resultado é também verdadeiro quando n = 2, mas requer um
muito mais elaborado (Problema 7).)
(b) Deduza de (a) que um eixo-n não pode existir em qualquer rede
de Bravais tridimensional, a menos que ela possa existir em al-
guma rede de Bravais bidimensional.
(c) Prove que nenhuma rede de Bravais bidimensional pode ter um
eixo-n com n = 5 ou n ≥ 7.(Sugestão: Primeiro mostre que
o eixo pode ser escolhido para passar por um ponto da rede.
Então demonstre por reductio ad absurdum, usando o conjunto
de pontos nos quais os vizinhos mais próximos do ponto escolhido
é tomado por n rotações para construir um ponto mais próximo
do ponto escolhido do que seu ”vizinho mais próximo” .(Note
que o caso n = 5 reque um tratamento ligeiramente diferente do
dos outros casos.))
(a) Mostre que, se uma rede de Bravais tem um plano de espelho,
então existe uma família de planos de rede paralela ao plano de
espelho. (Sugestão: Mostre do argumento da pág. 97 que a ex-
istência de um plano de espelho implica a existência de um plano
de espelho contendo um ponto da rede. Basta então provar que
aquele plano contém dois outros pontos de rede não colineares
com o primeiro.)
6.9 Problemas 109

(b) Mostre que, se uma rede de Bravais tem um eixo-2 de rotação,


então existe uma família de planos de rede perpendicular ao eixo.
110 6. Classificação das Redes de Bravais e Estruturas Cristalinas
This is page 111
Printer: Opaque this

7
Níveis Eletrônicos num Potencial
Periódico: Propriedades Gerais

Como os íons num cristal perfeito estão distribuídos num arranjo periódico
regularO, devemos considerar o problema de um elétron num potencial
U (r) que tenha a periodicidade da rede de Bravais, isto é:

U (r + R) = U (r) (7.1)

para todos os vetores R da rede de Bravais.


Além disto, a escala da periodicidade desse potencial U (∼ 10−8 cm)
é idêntica ao comprimento de onda de de Broglie típico para um elétron
no modelo de elétrons livres de Sommerfeld, o que nos obriga a usar a
mecânica quântica para levarmos em conta os efeitos da periodicidade sobre
o movimento do elétron.
Neste capítulo, discutiremos aquelas propriedades dos níveis eletrônicos
que dependem somente da periodicidade do potencial, independentemente
de sua forma particular. A discussão continuará nos Capítulos 9 e 10 para
tratar dois casos limites de grande interesse físico e servirá como ilustração
dos resultados gerais obtidos neste capítulo. No Capítulo 11, são resumi-
dos alguns dos métodos mais importantes do cálculo detalhado de níveis
eletrônicos. Nos Capítulos 12 e 13, discutiremos a importância destes resul-
tados, primeiro nos problemas da teoria de transporte eletrônico levantados
nos Capítulos 1 e 2 e indicaremos quanto das anomalias da teoria de elétron
livre (Capítulo 3) é removido dessa maneira. Nos Capítulos 14 e 15, exam-
inaremos as propriedades de metais específicos que ilustram e confirmam a
teoria geral.
112 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

Enfatizamos no início que a periodicidade perfeita é um idealização. Os


sólidos reais nunca são absolutamente puros, e na vizinhança dos átomos
de impureza, o sólido não é o mesmo como em outra parte do cristal. Além
disso, sempre há uma pequena probabilidade dependente da temperatura
de encontrar íons ausentes ou íons fora de suas posições (Capítulo 30),
o que destrói a simetria translational perfeita de até mesmo um cristal
absolutamente puro. Finalmente, os íons não são de fato estacionários, mas
sofrem, continuamente, vibrações térmicas em torno de suas posições de
equilíbrio.
Estas imperfeições têm grande importância. Por exemplo, elas são re-
sponsáveis, no final das contas, pelo fato de que a condutividade elétrica
dos metais não é infinita. Porém, podemos avançar mais, dividindo artifi-
cialmente o problema em duas partes: (a) o cristal perfeito ideal fictício,
no qual o potencial é genuinamente periódico, e (b) os efeitos sobre as
propriedades de um cristal perfeito hipotético devido aos desvios da peri-
odicidade serão tratados como pequenas perturbações.
Também, enfatizamos que o problema de elétrons num potencial per-
iódico não se origina somente no contexto dos metais. A maioria de nossas
conclusões gerais aplicam-se a todos os sólidos cristalinos, e terá um papel
importante em nossas discussões subseqüentes de isolantes e semicondu-
tores.

7.1 O Potencial Periódico


O problema de elétrons num sólido é, em princípio, um problema de muitos
corpos, pois o Hamiltoniano total do sólido não contém somente potenciais
de um elétron, descrevendo as interações dos elétrons com o núcleo atômico,
mas também potenciais de pares, descrevendo as intereçòes elétron-elétron.
Na aproximação de elétrons independentes essas interações são represen-
tadas por um potencial efetivo de um elétron U (r) . Como escolher qual
o melhor potencial efetivo é um problema complicado, que será tratado
nos Capítulos 11 e 17. Aqui, não estamos interessados na forma particular
desse potencial, uma vez que, se o cristal é perfeitamente periódico, esse
potencial efetivo deve satisfazer a Eq. (7.1). Muitas conclusões podem ser
obtidas, levando-se em conta apenas este fato. Qualitativamente porém um
potencial cristalino típico comporta-se como aquele mostrado na Fig. 8.1,
assemelhando-se aos potenciais atômicos individuais na região próxima aos
íons e achatando-se na região entre eles.
Vamos então examinar as propriedades gerais da equação de Schrödinger
para um único elétron,

Hψ = εψ (7.2)
7.2 Teorema de Bloch 113

derivadas do fato de que U (r) tem a periodicidade (7.1). A equação de


Schrödinger (2.4) é um caso especial de (7.2) (embora, em alguns aspectos,
muito patológico), sendo o potencial nulo o exemplo mais simples de um
potencial periódico.
Elétrons independentes, cada um deles obedecendo uma equação de Schrödinger
com um potencial periódico, são conhecidos como elétrons de Bloch (em
contraste com elétrons livres, aos quais se reduzem os elétrons de Bloch,
quando o potencial periódico é identicamente nulo). Os estados estacionários
dos elétrons de Bloch têm a seguinte propriedade, decorrente da periodici-
dade do potencial U :

7.2 Teorema de Bloch


Teorema.1 Os autoestados ψ do Hamiltoniano de um elétron H =
−~2 ∇2 /2m+U (r) , onde U (r + R) = U (r) para todo R numa rede de Bra-
vais, podem ser escolhidos como sendo uma onda plana vezes uma função
que tem a mesma periodicidade da rede de Bravais:

ψ nk (r) = eik·r unk (r) , (7.3)


onde
unk (r + R) = unk (r) (7.4)
2
para todo R na rede de Bravais.
Note que (7.3) e (7.4) implica que

ψ nk (r + R) = eik·R ψ nk (r) . (7.5)


Às vezes, o teorema de Bloch é enunciado da seguinte forma:3 os autoes-
tados de H podem ser escolhidos tal que, associado com cada ψ, existe um
vetor de onda k tal que

ψ nk (r + R) = eik·R ψ nk (r) (7.6)


para qualquer R da rede de Bravais.
A seguir, proporemos algumas demonstrações do teorema de Bloch, uma
baseada em considerações gerais da mecânica quântica e a outra, por con-
strução explícita.4 .

1O teorema foi demonstrado pela primeira vez por Floquet no caso unidimensional,
onde é frequentemente conhecido como teorema de Floquet.
2 O índice n é conhecido como índice de banda e ocorre porque, para um dado k,

como veremos, existirão muitos autoestados independentes.


3 A Eq. (7.6) implica (7.3) e (7.4), pois ela requer que a função u(r) =

exp (−ik · r) ψ (r) tenha a periodicidade da rede de Bravais.


4 A primeira prova é baseada em alguns resultados formais da mecânica quântica. A

segundo é mais elementar, mas também, em termos de notação, mais complicada.


114 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

7.2.1 Primeira Demonstração do Teorema de Bloch


Para cada vetor R da rede de Bravais, vamos definir um operador de
translação T̂R que, operando sobre uma funçào qualquer f (r) , desloca
o argumento da função pela quantidade R:

T̂R f (r) = f (r + R) (7.7)


Como o Hamiltoniano é periódico, tem-se:

T̂R Hψ = H (r + R) ψ (r + R) = H (r) ψ (r + R) = H T̂R ψ (r) (7.8)

Então, uma vez que (7.8) vale para qualquer função ψ, tem-se a identi-
dade de operadores:

T̂R H = H T̂R (7.9)


Além disto, o resultado da aplicação de duas translações sucessivas não
depende da ordem em que são aplicadas, pois para qualquer função ψ (r)

T̂R T̂R0 ψ (r) = T̂R0 T̂R ψ (r) = ψ (r + R + R0 ) (7.10)


Portanto

T̂R T̂R0 = T̂R0 T̂R = T̂R+R0 (7.11)


As equações (7.9) e (7.11) asseguram que T̂R , para qualquer vetor R da
rede de Bravais, e o Hamiltoniano H formam um conjunto de operadores
que comutam entre si. Segue-se do teorema fundamental da mecânica quân-
tica5 que os autoestados de H podem ser escolhidos para serem simultane-
amente autoestados de todos os operadores T̂R :

Hψ = εψ

T̂R ψ = c (R) ψ (7.12)

Os autovalores c (R) dos operadores de translação estão relacionados, por


um lado, devido à condição (7.11)

T̂R0 T̂R ψ = c (R) T̂R0 ψ = c (R) c (R0 ) ψ (7.13)


enquanto que, de acordo com (7.11),

T̂R0 T̂R ψ = TR+R0 ψ = c (R + R0 ) (7.14)

5 Veja, por exemplo, D. Park, Introduction to the Quantum Theory, McGraw-Hill,

New York, 1964, pág. 123.


7.2 Teorema de Bloch 115

Segue-se que os autovalores devem satisfazer


¡ ¢
c R + R0 = c (R) c (R0 ) (7.15)
Agora, sejam ai (i = 1, 2, 3) os três vetores primitivos de uma rede de
Bravais. Podemos sempre escrever c (ai ) na forma

c (ai ) = e2iπxi (7.16)


escolhendo-se convenientemente xi .6 Segue-se das aplicações sucessivas de
(7.15), que, se R for um vetor geral da rede dado por

R = n1 a1 + n2 a2 + n3 a3 (7.17)
então
n1 n2 n3
c (R) = c (a1 ) + c (a2 ) + c (a3 ) (7.18)
Mas isto é equivalente a:

c (R) = eik·R (7.19)


onde
k = x1 b1 + x2 b2 + x3 b3 (7.20)
e os bi são os vetores primitivos da rede recíproca, satisfazendo (5.4): bi ·
aj = 2πδ ij .
Em resumo, mostramos que podemos escolher os autoestados ψ de H tal
que, para qualquer vetor R da rede de Bravais,

T̂R ψ = ψ (r + R) = c (R) ψ = eik·R ψ (r)


Isto é precisamente o teorema de Bloch na forma (7.6).

7.2.2 Condições de Contorno de Born-von Karman


Impondo uma condição de contorno apropriada sobre a função de onda,
podemos demonstrar que o vetor de onda k deve ser real e ter valores
permitidos restritos. A condição geralmente escolhida é a generalizaçào
natural da condição (2.5) usada na teoria de Sommerfeld para elétrons livres
numa caixa cúbica. Como naquele caso, introduzimos o volume contendo
os elétrons através da condição de Born-von Karman com periodicidade
macroscópica (v. Eq. (2.5)). Porém, a menos que a rede de Bravais seja
cúbica e L é um múltiplo inteiro da constante de rede a, não é conveniente
continuar trabalhando com um volume cúbico de lado L. Ao invés disto,

6 Veremos que, para condições de contorno adequadas, os x devem ser reais, mas por
i
enquanto eles podem ser considerados como números complexos gerais.
116 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

é mais conveniente trabalharmos com volumes proporcionais àqueles das


células primitivas. Portanto, vamos generalizar as condições de contorno
periódicas (2.5) para:

ψ (r+Ni ai ) = ψ (r) , (i = 1, 2, 3.) (7.21)


onde√ ai são os três vetores primitivos e Ni são todos inteiros da ordem
de 3 N ,com N = N1 N2 N3 sendo o número total de células primitivas do
cristal.
Como no Capítulo 2, adotamos esta condição de contorno supondo-se que
as propriedades do sólido nas quais estamos interessados não dependem da
condição de contorno, que é escolhida por conveniência analítica.
Aplicando o teorema de Bloch (7.6) à condição de contorno (7.21) encontra-
se

ψ nk (r+Ni ai ) = eiNi k·ai ψ nk (r) , (i = 1, 2, 3) (7.22)


que requer

eiNi k·ai = 1, i = 1, 2, 3, (7.23)


Quando k tem a forma (7.20), a Eq. (7.23) exige que

ei2πNi xi = 1 (7.24)
e, consequentemente, devemos ter
mi
xi = , mi = inteiro (7.25)
Ni
Portanto, a forma geral para os vetores de onda de Bloch permitidos é7
3
X mi
k= bi , (mi = inteiro). (7.26)
i=1
Ni

Segue-se de (7.26) que o volume ∆k do espaço-k para cada valor permi-


tido de k é o volume do pequeno paralelepípedo de lados bi /Ni :
µ ¶
b1 b2 b3 1
∆k = · × = b1 · (b2 × b3 ) (7.27)
N1 N2 N3 N
Uma vez que b1 · (b2 × b3 ) é o volume de uma célula primitiva da rede
recíproca, então a Eq. (7.27) assegura que o número de vetores permitidos
numa célula primitiva da rede recíproca é igual ao número de sítios no
cristal.

7 Note que (7.26) reduz-se à forma (2.16) usada na teoria de elétron livre, quando a

rede de Bravais é cúbica simples, sendo ai os vetores primitivos e N1 = N2 = N3 = L/a.


7.2 Teorema de Bloch 117

O volume de uma célula primitiva da rede recíproca é (2π)3 /v,onde


v = V /N é o volume da célula primitiva da rede direta, tal que a Eq. (7.27)
pode ser escrita na forma alternativa

(2π)3
∆k = (7.28)
V
Isto é precisamente o resultado (2.18) que encontramos no caso de elétron
livre.

7.2.3 Segunda Demonstração do Teorema de Bloch8


Esta segunda prova do teorema de Bloch mostra seu significado de um
ponto de vista bastante diferente, que exploraremos mais adiante no Capí-
tulo 9. Vamos partir com a observação de que podemos sempre expandir
qualquer função, obedecendo a condição de contorno de Born-von Karman
(7.21), no conjunto de todas as ondas planas, satisfazendo a condição de
contorno e, portanto, que tenham vetores de onda da forma (8.27):9
X
ψ (r) = cq eiq·r (7.29)
q

Uma vez que potencial U (r) é periódico na rede, sua expansão de onda
plana conterá somente ondas planas com a periodicidade da rede e, por-
tanto, com vetores de onda que são vetores da rede recíproca, 10
X
U (r) = UK eiK·r (7.30)
K

Os coeficientes de Fourier UK estão relacionados a U (r) por:11


Z
1
UK = dr e−iK·r U (r) (7.31)
v célula
Como se tem liberdade para mudar a energia potencial por uma constante
aditiva, vamos escolher que a média espacial U0 do potencial sobre a célula
primitiva seja nula:

8 Embora sendo mais elementar que a primeira demonstração, a segunda prova tam-
bém é, em termos de notação, mais complicada, e de grande importância, principalmente,
como ponto de partida para o cálculo aproximado do Capítulo 9. O leitor pode, portanto,
desejar saltá-la neste momento.
9 Daqui por diante, devemos sempre lembrar que as somas sobre o índice mudo k será

sobre todos os vetores de onda da forma (7.26) permitidos pela condição de contorno de
Born-von Karman.
1 0 A soma indexada por K será feita sobre todos os vetores da rede recíproca.
1 1 Veja Apêndice D, onde é discutida a relevância da rede recíproca para expansão de

Fourier de funções periódicas.


118 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

Z
1
U0 = dr U (r) = 0 (7.32)
v célula

Note que, devido o potencial U (r) ser real, segue-se de (7.31) que os
coeficientes de Fourier satisfazem

U−K = UK (7.33)
12
Se admitirmos que o cristal tem simetria de inversão tal que, para uma
escolha adequada da origem, U (r) = U (−r) , então (7.31) implica que UK
é real, e assim

U−K = UK = UK (para cristais com simetria de inversão) (7.34)
Agora, substituimos as expansões (7.29) e (7.30) na equação de Schrödinger
(7.2). O termo de energia cinética dá:

p2 ~2 2 X ~2
ψ=− ∇ ψ= q 2 cq eiq·r . (7.35)
2m 2m q
2m

O termo na energia potencial pode ser escrito13

à !à !
X X
iK·r iq·r
Uψ = UK e cq e
K q
X X 0
= UK cq ei(K+q)·r = UK cq0 −K eiq ·r , (7.36)
K, q K, q0

Mudamos os nomes dos índices da soma em (7.36) — de K e q0 , para K0 e


q — tal que a equação de Schrödinger torna-se:
(µ ¶ )
X ~2 X
eiq·r q 2 − ε cq + UK0 cq−K0 = 0. (7.37)
q
2m 0 K

Como as ondas planas, satisfazendo a condição de contorno de Born-von


Karman constituem um conjunto ortogonal, o coeficiente de cada termo,
separadamente, deve se anular14 e, portanto, para todos os vetores de onda
q permitidos,

1 2 Pede-se ao leitor para seguir o argumento desta seção (e do Capítulo 9) sem a


suposição de simetria de inversão, que é feita aqui somente para evitar complicações
desnecessárias na notação.
1 3 O último passo segue-se, fazendo-se a substituição K + q = q0 , e notando-se que,

como K é um vetor da rede recíproca, a soma sobre todos os q da forma (7.26) é o


mesmo que somar sobre todos os q0 daquela forma.
1 4 Isto também pode ser deduzido da Eq. (D.12), do Apêndice D, multiplicando-se

(7.37) pela onda plana apropriada e integrando-se sobre o volume do cristal.


7.2 Teorema de Bloch 119

µ ¶ X
~2 2
q − ε cq + UK0 cq−K0 = 0 (7.38)
2m 0 K

É conveniente escrever q na forma q = k − K,onde K é um vetor da rede


recíproca, escolhido de maneira que k esteja sempre na primeira zona de
Brillouin. A Eq. (7.38) torna-se
µ 2 ¶ X
~
(k − K)2 − ε ck−K + UK0 ck−K−K0 = 0 (7.39)
2m 0 K
0
ou, fazendo-se a mudança de variáveis K0 → K − K,
µ 2 ¶ X
~ 2
(k − K) − ε ck−K + UK0 −K ck−K0 = 0 (7.40)
2m 0 K

Enfatizamos que as Eqs. (7.38) e (?? nada mais é do que representação


da equação de Schrödinger no espaço dos momentos, simplificada pelo fato
de que, devido à periodicidade, Uk só difere de zero quando k for um vetor
da rede recíproca.
Para um k fixo na primeira zona de Brillouin, o conjunto de equações
(7.40), para todos os vetores da rede recíproca K, acopla somente aqueles
coeficientes ck , ck−K , ck−K0 , ck−K00 , ..., cujo vetor de onda difere de k
por um vetor da rede recíproca. Então, o problema original foi separado
em N problemas independentes: um para cada valor permitido de k na
primeira zona de Brillouin. Cada um desses problemas tem soluções que
são superposição de ondas planas, contendo somente o vetor de onda k e
os vetores diferindo de k por um vetor da rede recíproca.
Levando esta informação para a expansão (7.29) da função de onda ψ,
vê-se que, se o vetor de onda q tiver somente os valores k, k − K, k − K0 ,
k − K00 , ..., então a função de onda será da forma:
X
ψk = ck−K ei(k−K)·r (7.41)
K

Se escrevermos esta equação como


à !
X
ψ k (r) = eik·r ck−K e−iK·r (7.42)
K

isto, então, terá a forma da função de Bloch (7.3), com a função periódica
u (r) dada por15

1 5 Note que existirão (infinitamente) muitas soluções para o conjunto (infinito) de

equações (7.40) para um dado k. Essas soluções são classificadas pelo índice de banda n
(veja a nota de rodapé 2).
120 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

X
uk (r) = ck−K e−iK·r . (7.43)
K

7.3 Observações Gerais sobre o Teorema de Bloch


1. O teorema de Bloch introduz um vetor de onda k que tem o mesmo
papel para o movimento num potencial periódico que o vetor de onda
do elétron livre na teoria de Sommerfeld. Note, porém, que, embora
o vetor de onda do elétron livre seja simplesmente p/~, onde p é
o momento do elétron, no caso de Bloch k não é proporcional ao
momento eletrônico. Isto está de acordo com os princípios gerais, pois
o o Hamiltoniano não tem invariância translacional total na presença
de um potencial que não é constante, e portanto seus autoestados não
serão autoestados simultâneos do operador momento. Esta conclusão
é confirmada pelo fato de que o operador momento p = ~i ~∇, atuando
sobre ψ nk dá

~ ~ ¡ ik·r ¢
∇ψ nk = ∇ e uk (r)
i i
~
= ~kψ nk + eik·r ∇uk (r) (7.44)
i
que não é, em geral, uma constante vezes ψ nk ; isto é, ψ nk não é um
autoestado do momento.
Entretanto, em muitos aspectos, ~k é uma extensão natural de p para
o caso do potencial periódico. É conhecido como momento cristalino
do elétron, para enfatizar essa similaridade, mas não pode ser con-
fundido com o momento, pois não o é. Uma compreensão intuitiva do
significado dinâmico do vetor de onda k só pode ser obtida, quando
se considera a resposta dos elétrons de Bloch a campos eletromag-
néticos aplicados externamente (Capítulo 12). Só então, emergirá sua
semelhança com p/~. Por enquanto, o leitor deveria ver k como um
número quântico característico da simetria translacional de um po-
tencial periódico, da mesma maneira que o momento p é um número
quântico característico da mais completa simetria translacional do
espaço livre.

2. O vetor de onda k, que aparece no teorema de Bloch sempre pode ser


limitado à primeira zona de Brillouin (ou a qualquer célula primitiva
conveniente da rede recíproca). Isto é porque qualquer k0 , não na
primeira zona de Brillouin, pode ser escrito como
7.3 Observações Gerais sobre o Teorema de Bloch 121

k0 = k + K (7.45)
onde K é um vetor da rede recíproca, sendo k um vetor da primeira
zona de Brillouin. Como eiK·R = 1 para qualquer vetor da rede recíp-
roca, se o teorema de Bloch (7.6) vale para k0 , ele valerá também para
o vetor de onda k.

3. O índice n aparece no teorema de Bloch porque, para um dado k,


existem muitas soluções da equação de Schrödinger. Observamos isto
na segunda prova do teorema de Bloch, mas também pode ser visto
do seguinte argumento:
Vamos ”olhar ” para todas as soluções da equação de Schrödinger
(7.2) que tem a forma de Bloch

ψ = eik·r u (r) (7.46)

onde k é fixo e u (r) tem a periodicidade da rede de Bravais. Substituindo-


se isto na equação de Schrödinger encontramos que u é determinado
pelo problema de autovalor

à µ ¶2 !
~2 1
Hk uk (r) = ∇ + k + U (r) uk (r) (7.47)
2m i

= εk uk (r)

com a condição de contorno

uk (r) = uk (r + R) (7.48)

Devido à condiçào de contorno periódica, podemos considerar (7.47)


como um problema de autovalores Hermitiano restrito a uma única
célula primitiva do cristal. Uma vez que o problema de autovalor é
estabelecido num volume finito, esperamos, baseados em princípios
gerais, que exista uma família infinita de soluções com autovalores
discretos,16 que rotulamos com o índice de banda n.
Note que, em termos do problema de autovalores especificado por
(7.47) e (7.48), o vetor de onda k aparece apenas como um parâmetro
no Hamiltoniano Hk . Esperamos, portanto, que cada um dos níveis

1 6 Da mesma forma que o problema de um elétron livre em uma caixa de dimensões

finitas fixas tem um conjunto de níveis de energias discretas, os modos normais de


vibração de um tambor finito têm um conjunto de freqüências discretas etc.
122 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

de energia, para um dado k, varie continuamente com k.17 Desta


maneira, chega—se à descrição dos níveis de um elétron num potencial
periódico em termos de uma família de funções contínuas18 εn (k) .
4. Embora o conjunto completo dos níveis possa ser descrito com k
restrito a uma única célula primitiva, é útil permitir que k varie em
todo espaço-k, mesmo que isto resulte numa descrição completamente
redundante. Devido o conjunto de todas as funções de onda e níveis
de energia para dois valores de k, diferindo por um vetor da rede
recíproca serem idênticos, podemos atribuir os índices n aos níveis de
tal maneira que, para um dado n, os autoestados e autovalores sejam
funçòes periódicas de k na rede recíproca:
ψ n,k+K (r) = ψ n,k (r)
(7.49)
εn (k + K) = εn (k)

Isto leva à descrição dos níveis de energia de um elétron num poten-


cial periódico em termos de uma família de funções contínuas εnk (ou
εn (k)), cada uma com a periodicidade da rede recíproca. A infor-
mação contida nessas funções é referida como estrutura de banda do
sólido.
Para cada n,o conjunto de níveis eletrônicos especificado por εn (k)
é chamado de banda de energia. A origem do termo ”banda” será
visto no Capítulo 10. Aqui, notamos apenas que, como cada εn (k) é
periódica e contínua em k, tem um limite superior e inferior, tal que
todos os níveis εn (k) estão entre esses limites.
5. Pode-se mostrar, de uma maneira geral (veja Apêndice E), que um
elétron num nível especificado por n e k tem uma velocidade média
não nula, dada por:

1
vn (k) = ∇k εn (k) (7.50)
~
Isto é um fato muito importante. Ele assegura que existem níveis
estacioários (i.e., independentes do tempo) para um elétron num po-

1 7 Esta expectativa está implícita, por exemplo, na teoria de perturbação ordinária,


que só é possível porque pequenas variações dos parâmetros no Hamiltoniano conduzem
a pequenas variações dos níveis de energia. No Apêndice E são calculadas explicitamente
as variações nos níveis de energia para pequenas variações em k.
1 8 O fato de que a condição de contorno de Born-von Karman restringe os vetores k a

valores discretos da forma (7.26) não tem nenhuma influência sobre a continuidade de
εn (k) como uma função de uma variável contínua k, pois o problema de autovalor dado
por (7.47) e (7.48) não faz nenhuma referência ao tamanho do cristal e é bem definido
para qualquer k. Deve-se notar também que o conjunto de valores de k da forma (7.26)
torna-se denso no espaço-k no limite de um cristal infinito.
7.4 Superfície de Fermi 123

tencial periódico, nos quais, a despeito da interação do elétron com os


íons fixos na rede, os elétrons se movem continuamente sem qualquer
degradação de sua velocidade média. Isto está em contraste com a
idéia de Drude de que as colisões seriam simplesmente choques en-
tre o elétron e o íon estático. Suas implicações são de fundamental
importância, e serão exploradas nos Capítulos 12 e 13.

7.4 Superfície de Fermi


O estado fundamental de N elétrons livres19 é construído, ocupando-se
todos os níveis de um elétron k com energias ε (k) = ~2 k2 /2m menores do
que εF ,onde εF é determinada, exigindo-se que o número total de níveis de
um elétron com energias menores do que εF seja igual ao número total de
elétrons (Capítulo 2).
O estado fundamental de N elétrons de Bloch é construído de uma
maneira similar, exceto que os níveis de um elétron são agora rotulados
pelos números quânticos n e k, εn (k) não tem a forma simples daquela
do elétron livre, e k deve estar confinado a uma única célula primitiva da
rede recíproca se contarmos cada nível somente uma vez. Quando os mais
baixos desses níveis estão ocupados por um número específico de elétrons,
podemos obter duas configuraçòes distintas:

1. Um certo número de bandas pode estar completamente ocupadas,


enquanto que todas as demais permanecem vazias. A diferença em
energia entre o nível mais “alto” ocupado e o mais “baixo” (isto é, o
“topo” da banda mais alta ocupada e o “fundo” da banda vazia mais
baixa) é conhecida como faixa de energia proibida ou gap de energia.
Encontraremos que sólidos com um gap de energia muito maior do que
kB T (T próximo da temperatura ambiente) são isolantes (Capítulo
12). Se o gap for comparável a kB T , o sólido é conhecido como um
semicondutor intrínseco ( Capítulo 28). Uma vez que o número de
níveis numa banda é igual ao número de células primitivas do cristal
(pág. 116) e como cada nível pode acomodar dois elétrons (um para
cada estado de spin), uma configuração contendo um gap de energia
pode ocorrer (embora isso não seja necessário) somente se o número
de elétrons por célula primitiva é par.

2. Determinado número de bandas pode estar parcialmente ocupada.


Quando isto ocorre, a energia do nível mais alto ocupado, a energia

1 9 Não distinguiremos, em termos de notação, entre o número de elétrons de condução

e o número de células primitivas, quando esta distinção estiver clara no contexto; porém,
esses números só serão iguais numa rede de Bravais monovalente monoatômica (e.g., os
metais alcalinosi).
124 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

de Fermi εF , está dentro do limite de energia de uma ou mais ban-


das. Para cada banda parcialmente ocupada, existe uma superfície no
espaço-k, separando os niveis ocupados dos níveis vazios. O conjunto
de todas essas superfícies é conhecido como superfície de Fermi e é
uma generalização, para os elétrons de Bloch, da esfera de Fermi de
elétrons livres. As partes da superfície de Fermi originadas das ban-
das parcialmente ocupadas são conhecidas como ramos da superfície
de Fermi.20 Veremos (Capítulo 12) que um sólido tem propriedades
metálicas, quando existir uma superfície de Fermi.

Analiticamente, o ramo da superfície de Fermi na n-ésima banda é uma


superfície no espaço-k determinada por21

εn (k) = εF (7.51)

Então, a superfície de Fermi é uma superfície de energia constante (ou um


conjunto de superfícies de energia constante) no espaço-k, da mesma forma
que as mais familiares superfícies equipotenciais da teoria eletrostática são
superfícies de energia constante no espaço real.
Como εn (k) são periódicas na rede recíproca, a solução completa de
(7.51) para cada n é uma superfície no espaço-k com periodicidade da
rede recíproca. Quando um ramo da superfície é representado por uma
estrutura periódica completa, diz-se que é descrito no esquema de zona
repetida. Às vezes, todavia, é preferível representar cada ramo de maneira
que qualquer nível fisicamente distinto seja representado apenas por um
ponto da superfície. Isto é obtido, representando-se cada ramo por aquela
porção da superfície periódica completa contida dentro de uma única célula
primitiva da rede recíproca. Tal representação é descrita como um esquema
de zona reduzida. A célula primitiva escolhida é às vezes, mas nem sempre,
a primeira zona de Brillouin.
A geometria da superfície de Fermi e suas implicações físicas serão ilustradas
em muitos dos próximos capítulos, particularmente, nos Capítulos 9 e 15.

2 0 Em muitos casos importantes, a superfície de Fermi está completamente dentro

de uma única banda, e geralmente é encontrada dentro de um número razoavelmente


pequeno de bandas (Capítulo 15).
2 1 Se ε é, geralmente, definida como a energia que separa o mais alto nível ocupado do
F
mais baixo nível desocupado, então não é especificada univocamente num sólido com um
gap de energia, pois qualquer energia no gap satisfaz esta condição. Não obstante, fala-se
de ”energia de Fermi” de um semicondutor intrínseco. O que se quer dizer é potencial
químico, que é bem definido a qualquer temperatura diferente de zero (Apêndice B).
Quando T → 0, o potencial químico de um sólido com um gap de energia aproxima-se
da energia do meio do gap (Capítulo 28) e às vezes considera-se que esta é a ”energia de
Fermi” de um sólido com um gap. Quer com a definição correta (indeterminado) quer
com a definição coloquial de εF , a Eq. (7.51) assegura que os sólidos com gap de energia
não têm superfície de Fermi.
7.5 Densidade de Níveis 125

7.5 Densidade de Níveis22


Frequentemente precisamos calcular quantidades, que são somas ponder-
adas sobre níveis eletrônicos, de várias propriedades de um elétron. Tais
quantidades são da forma23
X
Q=2 Qn (k) (7.52)
n,k
onde para cada n, soma-se sobre todos os k permitidos, correspondentes
a níveis fisicamente distintos, isto é, todos os k que são da forma (7.26),
pertencendo a uma única célula primitiva.24
No limite de um cristal muito grande, os valores de k permitidos (7.26)
estão muito próximos um do outro e a soma pode ser substituída por uma
integral. Como o volume do espaço-k ocupado por cada k permitido tem o
mesmo valor como no caso do elétron livre, a prescriçào derivada naquele
caso (Eq. (2.29)) continua válida, e encontramos que25
Q X Z dk
q = lim =2 3 Qn (k) (7.53)
V →∞ V (2π)
n
onde a integral é sobre uma célula primitiva.
Se, como às vezes é o caso,26 Qn (k) depende de n e k somente através
da energia εn (k) , então, por analogia com o caso do elétron livre, podemos
definir uma densidade de níveis por unidade de volume (ou densidade de
níveis) g (ε) tal que q tenha a forma (cf. Eq. (2.60)):
Z
q = dε g (ε) Q (ε) (7.54)

Comparando (7.54) e (7.53) encontramos que


X
g (ε) = gn (ε) (7.55)
n
onde gn (ε), a densidade na n-ésima banda, é dada por
Z
dk
gn (ε) = δ (ε − ε (k)) (7.56)
4π3

2 2 Numa primeira leitura, pode-se pular esta seção, sem perda de continuidade,
voltando-se a ela em capítulos subsequentes, quando necessário.
2 3 O fator 2 é porque cada nível especificado por n e k pode acomodar dois elétrons

de spins contrários. Nós consideramos que Qn (k) não depende do spin s do elétron. Se
depender, o fator 2 deve ser substituído por uma soma em s.
2 4 A função Q (k) tem geralmente a periodicidade da rede recíproca, tal que a escolha
n
da célula primitiva é irrelevante.
2 5 Veja o Capítulo 2 para as observações apropriadas.
2 6 Por exemplo, se q é a densidade de número eletrônico n, então Q (ε) = f (ε) , onde

f é a função de Fermi; se q é a densidade de energia eletrônica u, então Q (ε) = ε f (ε) .


126 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

onde a integral é sobre uma célula primitiva.


Uma representação alternativa da densidade de níveis pode ser con-
struída, notando-se que, como no caso do elétron livre (Eq. (2.62)):

½
número de vetores de onda permitidos na n-ésima
gn (ε) dε = (2/V ) ×
banda no intervalo de energia entre ε e ε + dε
((8.58))
O número de vetores de onda permitidos na n-ésima banda neste inter-
valo de energia é justamente o volume de uma célula primitiva no espaço-k,
com ε ≤ εn (k) ≤ ε + dε, dividido pelo volume ocupado por cada valor de
3
k permitido, ∆k = (2π) /V. Então
Z ½
dk 1, se ε ≤ εn (k) ≤ ε + dε
gn (ε) dε = × (7.57)
cp 4π
3 0, se outra situção
Como dε é infinitesimal, isto também pode ser expresso como uma inte-
gral de superfície. Seja Sn (ε) a porção da superfície εn (k) = ε contida na
célula primitiva, e seja δk (k) a distância perpendicular entre as superfícies
Sn (ε) e Sn (ε + dε) no ponto k. Então (Fig. 8.2):
Z
dS
gn (ε) dε = 3
δk (k) (7.58)
Sn (ε) 4π

Para encontrar uma expressão explícita para δk (k), note que, como
Sn (ε) é uma superfície de energia constante, o gradiente-k de εn (k) ,
∇εn (k) é um vetor normal àquela superfície, cuja magnitude é igual à
taxa de variação de εn (k) na direção normal; isto é,

ε + dε = ε + |∇εn (k)| δk (k) (7.59)


e então


δk (k) = (7.60)
|∇εn (k)|
Substituindo (7.60) em (7.58), chegamos na forma
Z
dS 1
gn (ε) = 3 |∇ε (k)|
(7.61)
Sn (ε) 4π n

que dá a relaçào explícita entre a densidade de níveis e a estrutura de


banda.
A equação (7.61) e a análise que conduz a ela serão aplicadas em capítulos
subseqüentes.27 Aqui só chamamos a atenção para a seguinte propriedade
bastante geral da densidade de níveis:

2 7 Veja também Problema 2.


7.6 Problemas 127

Uma vez que εn (k) é periódica na rede recíproca, limitada acima e abaixo
para cada n, difenciável em todo o espaço, deve existir valores de k em cada
célula primitiva para os quais |∇ε| = 0. Por exemplo, o gradiente de uma
função diferenciável se anula nos pontos de máximos e mínimos, mas como
cada εn (k) é limitada e periódica, isto assegura que para cada n existirá
pelo menos um máximo e um mínino em cada célula primitiva.28
Quando o gradiente de εn (k) se anula, o integrando na densidade de
níveis (7.61) diverge. Pode-se mostrar que em três dimensões29 tais singu-
laridades são integráveis, dando valores finitos para gn . Porém, elas resul-
tam em divergências da inclinação dgn /dε. Estas são conhecidades como
singularidades de van Hove.30 Elas ocorrem em valores de ε para os quais a
superfície de energia constante Sn (ε) contém pontos nos quais ∇εn (k) se
anula. Como as derivadas da densidade de estados na energia de Fermi
entram em todos os termos, exceto no primeiro, na expansão de Som-
merfeld,31 deve-se estar previnido para as anomalias no comportamento
a baixas temperaturas se existirem pontos de ∇εn (k) anulando-se na su-
perfície de Fermi.
Singularidades típicas de van Hove são mostradas na Fig. 8.3 e são ex-
aminadas no Problema 2, Capítulo 9.
Isto conclui nossa discussão dos aspectos gerais dos níveis de um elétron
num potencial periódico.32 Nos dois capítulos seguintes, consideramos dois
casos limites muito importante, mas bem diferentes, que fornecem ilus-
trações concretas das discussões, bastante abstratas, deste capítulo.

7.6 Problemas
1. Potenciais Periódicos em Uma Dimensão
A análise geral dos níveis eletrônicos num potencial periódicos, inde-
pendentes dos aspectos detalhados do potencial, pode ser levado con-
sideravelmente mais adiante em uma dimensão. Embora o caso uni-
dimensional seja, em muitos aspectos, atípicos (não há nenhuma ne-
cessidade para um conceito de uma superfície de Fermi) ou enganoso
(a possibilidade - realmente, em duas e três dimensões, a probabili-
dade - de superposição de banda desaparece), apesar disso, permite
ver algumas das características de estrutura de banda tridimensional,

2 8 Uma análise geral de quantos pontos de gradiente nulos têm que ocorrer é bastante
complexo. Veja, por exemplo, G. Weinreich, Solids, Willey, New York, 1965, págs. 73-79.
2 9 Em uma dimensão, o próprio g (ε) será infinito em uma singularidade de van Hove.
n
3 0 Essencialmente, as mesmas singularidades ocorrem na teoria das vibrações de rede.

Veja Capítulo 23.


3 1 Veja, por exemplo, Problema 2f, Capítulo 2.
3 2 O Problema 1 leva a análise geral um pouco mais adiante no caso tratável, mas um

pouco ilusório, de um potencial periódico unidimensional.


128 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

que descreveremos por cálculo aproximado nos Capítulos 9, 10 e 11,


obtidas de um tratamento exato em uma dimensão.
Considere, então, um potencial unidimensional U (x) (Fig. 8.4).
É conveniente visualizar os íons como residindo nos pontos de mínimo
de U que nós tomamos para definir o zero de energia. Visualisamos o
potencial periódico como uma superposição de barreiras de potenciais
v (x) de largura a, centradas nos pontos x = ±na (Fig. 8.5):

X
U (x) = v (x − na) (7.62)
n=−∞

O termo v (x − na) representa a barreira de potencial para um elétron


tunelando entre os íons sobre lados opostos do ponto na. Por sim-
plicidade, vamos considerar que v(x) = v (−x) (o análogo em uma
dimensão da simetria de inversão que consideramos acima), mas não
faremos nenhuma outra suposição sobre v, tal que a forma do poten-
cial U é muito geral.
A estrutura de banda do sólido unidimensional pode ser expressa
na forma muito simples em termos das propriedades de um elétron
na presença de uma única barreira de potencial v (x) . Considere,
portanto, um elétron incidente do lado esquerdo de uma barreira de
potencial v (x) com energia33 ε = ~2 K 2 /2m. Como v (x) = 0 quando
|x| ≥ a/2, nessas regiões a função de onda ψ l (x) terão a forma
a
ψ l (x) = eiKx + r e−iKx , x ≤ −
2
iKx a
= te , x ≥ (7.63)
2
Isto é ilustrado esquematicamente na Fig. 8.5a.
Os coeficientes de transmissão e reflexão t e r dão a amplitude
de probabilidade com que um elétron tunelará ou será refletido pela
barreira, respectivamente; eles dependem do vetor de onda incidente
K numa maneira determinada pelos aspectos detalhados da barreira
de potencial v. Porém, podem-se deduzir muitas propriedades da es-
trutura de banda do potencial periódico U, recorrendo-se apenas a
propriedades muito gerais de t e de r. Uma vez que v é par, ψ r (x) =
ψ l (−x) é também uma solução para a equação de Schrödinger com
energia ε. De (7.63) segue-se que ψ r (x) tem a forma
a
ψ r (x) = t e−iKx , x ≤ −
2
−iKx iKx a
= e +re , x ≥ (7.64)
2

3 3 Nota : neste problema, K é uma variável contínua e não tem nada a ver com a rede

recíproca.
7.6 Problemas 129

Evidentemente, isto descreve uma partícula incidente do lado direito


da barreira, como representado na Fig. 8.5b.
Como ψ l e ψ t são duas soluções independentes da equação de
Schrödinger para a barreira única com a mesma energia, qualquer
outra solução com aquela energia será uma combinação linear34 dessas
duas: ψ = A ψ l + B ψ r . Em particular, como o Hamiltoniano do
cristal é idêntico àquele para um único íon na região a/2 ≤ x ≤ a/2,
qualquer solução da equação de Schrödinger com energia ε deve ser
uma combinação linear de ψ l e ψ r naquela região:
a a
ψ (x) = A ψ l (x) + B ψ r (x) , − ≤x≤ . (7.65)
2 2
Agora, o teorema de Bloch assegura que a escolha de ψ deve satisfazer

ψ (x + a) = eika ψ (x) (7.66)

para um apropriado k. Diferenciando-se (7.66) encontramos também


que ψ 0 = dψ/dx satisfaz

ψ 0 (x + a) = eika ψ 0 (x) (7.67)

(a) Impondo a condição (7.66) e (7.67) em x = −a/2, e usando


(7.63) a (7.65), mostre que a energia do elétron de Bloch está
relacionada com seu vetor de onda k por:

t2 − r2 ika 1 ~K 2
cos ka = e + e−ika , ε = (7.68)
2t 2t 2m
Verifique que isto dá a resposta certa no caso de elétron livre
(v ≡ 0) .

A equação (7.68) é mais informativa quando fornecemos um pouco


mais de informação sobre os coeficientes de transmissão e de reflexão.
Escrevemos o número complexo t em termos de sua magnitude e fase:

t = |t| eiδ (7.69)

O número real δ é conhecido como deslocamento de fase, pois ele


especifica a mudança na fase das ondas transmitidas relativa àquela
da onda incidente. Conservação do elétron requer que a probabilidade
de transmissão mais a probabilidade de reflexão seja um:

1 = |t|2 + |r|2 . (7.70)

3 4 Um caso especial do teorema geral de que existem n soluções independentes para

uma equação diferencial linear de n-ésima ordem.


130 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

Isto, e alguma outra informação útil, pode ser provada como segue.
Sejam φ1 e φ2 quaisquer duas soluções da esquação de Schrödinger
de uma barreira com a mesma energia:

~2 00 ~2 K 2
− φi + v φi = φ , i = 1, 2 (7.71)
2m 2m i
Defina w (φ1 , φ2 ) (o ”Wronskiano”) por

w (φ1 , φ2 ) = φ01 (x) φ2 (x) − φ1 (x) φ02 (x) (7.72)

(b) Prove que w é independente de x, deduzindo de (7.71) que sua


derivada se anula.
(c) Prove (7.70), através do cálculo de w (ψ l , ψ ∗l ) para x ≤ −a/2 e
x ≥ a/2, notando que, devido v (x) ser real, ψ ∗l será uma solução
para a mesma equação de Schrödinger como ψ l .
(d) Calculando w (ψ l , ψ ∗r ) , prove que rt∗ é imaginário puro, tal que
r deve ter a forma
r = ± i |r| eiδ , (7.73)
onde δ é o mesmo que em (7.69).
(e) Mostre, como consequência de (7.68), (7.69) e (7.73), que a en-
ergia e vetor de onda do elétron de Bloch são relacionados por

cos (Ka + δ) ~2 K 2
= cos ka, ε = (7.74)
|t| 2m

Como |t| é sempre menor que um, mas se aproxima da


unidade para grandes valores de K (a barreira torna-se crescen-
temente menos efetiva à medida que energia incidente cresce), o
lado esquerdo de (7.74) plotado contra K tem a estrutura repre-
sentada na Fig. 8.6. Para um dado k, os valores permitidos de K
(e consequentemente as energias permitidas ε (k) = ~2 K 2 /2m)
são dados pela interseção da curva na Fig. 8.6 com a linha hor-
izontal de altura igual a cos (ka) . Note que os valores de K na
vizinhança desses, satisfazendo

Ka + δ = nπ (7.75)

dá |cos (Ka + δ)| / |t| > 1, e são, portanto, valores não permi-
tidos para qualquer k. As regiões de energia correspondentes
são gaps de energia. Se δ é uma função limitada de K (como
geralmente é o caso), então haverá infinitamente muitas regiões
de energia proibida, e também, infinitamente muitas regiões de
energias permitidas para cada valor de k.
7.6 Problemas 131

(f) Suponha que a barreira seja muito fraca (tal que |t| ≈ 1, |r| ≈ 0).
Mostre que o gaps de energia são então muito estreitos, a largura
do gap contendo K = nπ/a, sendo

~2
εgap ≈ 2πn |r| . (7.76)
ma2
(g) Suponha que a barreira seja muito forte, tal que |t| ≈ 0, |r| ≈
1. Mostre que as bandas de energia permitida são então muito
estreitas, com larguras

εmáx − εmín = O (|t|) (7.77)

(h) Como exemplo concreto, considera-se às vezes o caso no qual


v (x) = gδ (x) , onde δ (x) é a função delta de Dirac (um caso
especial do ”modelo Kronig-Penney”). Mostre que neste caso

~2 K
cotg δ = − , |t| = cos δ. (7.78)
mg
Este modelo é um exemplo comum nos livros-textos de um po-
tencial periódicos em uma dimensão. Note, porém, que a maioria
das estruturas que temos estabelecido é, num grau considerável,
independente da dependência funcional particular de |t| e δ com
K.

2. Densidade de Níveis

(a) No caso de elétron livre a densidade de níveis na energia de Fermi


pode ser escrita na forma (2.64) g (εF ) = mkF /~2 π 2 . Mostre que
a forma geral (7.61) reduz-se a esta, quando εn (k) = ~2 k2 /2m
e a superfície (esférica) de Fermi está completamente dentro de
uma célula primitiva.
(b) Considere uma ¡banda¢ ¡na qual, para k suficientemente
¢ pequeno,
εn (k) = ε0 + ~2 /2 kx2 /mx + kz2 /mz + kz2 /mz ( como pode
ser o caso num cristal de simetria ortorrômbica) onde mx , my
e mz são constantes positivas. Mostre que se ε estiver próximo
bastante de ε0 , tal que esta forma seja válida, então gn (ε) é
1/2
proporcional a (ε − ε0 ) , assim sua derivada torna-se infinita
(singularidade de van Hove) à medida que ε se aproxima do
mínimo da banda (Sugestão: Use a forma (8.57) para a densi-
dade de níveis). Deduza disso que, se a forma quadrática para
εn (k) permanecer válida até εF , então gn (εF ) pode ser escrita
na generalização óbvia da forma para elétron livre (2.65):
3 n
g (εF ) = (7.79)
2 εF − ε0
132 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

onde n é a contribuição dos elétrons na banda para a densidade


eletrônica total.
(c) Considere a densidade de níveis
¡ ¢na
¡ vizinhança de um ponto ¢
de sela, onde εn (k) = ε0 + ~2 /2 kx2 /mx + kz2 /mz − kz2 /mz ,
onde mx , my e mz são constantes positivas. Mostre que, quando
ε ≈ ε0 , a derivada da densidade de níveis tem a forma

gn0 (ε) ≈ constante, ε̇ > ε0


−1/2
≈ (ε − ε0 ) , ε̇ < ε0 (7.80)
This is page 133
Printer: Opaque this

8
Elétrons num Potencial Periódico
Fraco

Pode-se obter muito informação a respeito da estrutura imposta sobre os


níveis de energia eletrônicos pelo potencial periódico, se este potencial for
fraco. Esta abordagem antigamente pode ter sido considerada como um ex-
ercírcio acadêmico instrutivo. Porém, sabemos agora, que em muitos casos
esta hipótese, aparentemente, irrealista, dá resultados surpreendentemente
muito próximo do esperado. Estudos teórico e experimental modernos dos
metais, que se encontram nos grupos I, II, III e IV da tabela periódica
(i.e., metais, cuja estrutura atômica consiste em elétrons s e p fora de uma
camada fechada de configuração de gás nobre) indicam que os elétrons de
condução podem ser descritos como se estes estivessem em movimento num
potencial quase constante. Esses elementos são frequentemente referidos
como matais de elétrons quase-livres, pois o ponto de partida para sua de-
scrição é o gás de elétrons livres de Sommerfeld, modificado pela presença
de um potencial periódico fraco. Neste capítulo, examinaremos algumas
das características mais gerais da estrutura de banda do ponto de vista de
elétrons quase-livres. Aplicações a metais particulares serão examinadas no
Capítulo 15.
Não parece óbvio porque as bandas de condução desses metais sejam
assim tal como elétrons livres. Existem duas razões fundamentais do porquê
das interações fortes dos elétrons entre si e com os íons positivos podem
resultar em efeitos de um potencial muito fraco:

1. A interação elétron-íon é mais forte a distâncias muito pequenas, mas


os elétrons são proibidos (pelo princípio de Pauli) de chegarem muito
134 8. Elétrons num Potencial Periódico Fraco

próximos dos íons, pois esta região já está ocupado por elétrons de
”caroço”.
2. Na região permitida para os elétrons de condução, sua mobilidade
diminui ainda mais o potencial resultante sobre um elétron, pois
eles podem ”blindar” os campos dos íons carregados positivamente,
diminuindo o potencial efetivo total.

Essas observações oferecem apenas a indicação mais simples do porquê a


discussão que se segue tem aplicação prática muito ampla. Retornaremos
mais tarde ao problema de justificar esta abordagem de elétrons quase-
livres, tomando-se o ponto 1 no Capítulo 11 e o ponto 2 no Capítulo 17.

8.1 Aproximação Geral da Equação de Schrödinger


quando o Potencial é Fraco
Quando o potencial é nulo, as soluções da equação de Schrödinger são on-
das planas. Um ponto de partida razoável para o tratamento de potenciais
periódicos fracos é, portanto, a expansão da soluçào exata em ondas planas
descrita no Capítulo 8. A função de onda de um nível de Bloch com mo-
mento cristalino k pode ser escrito na forma dada na Eq. (7.41):
X
ψ k (r) = ck−K ei(k−K)·R (8.1)
K

onde os coeficientes ck−K e a energia ε do nível são determinados pelo


conjunto de equações (7.40):
· 2 ¸ X
~ 2
(k − K) − ε ck−K + UK0 −K cK0 −K = 0. (8.2)
2m 0 K

A soma em (8.1) é sobre todos os vetores K da rede recíproca, e para um


dado k, existe uma equação da forma (8.2) para cada vetor K da rede
recíproca. As (infinitamente muitas) soluções diferentes da Eq. (8.2) para
um dado k são rotuladas com o índice de banda n. O vetor de onda k
pode (mas, não é necessário) ser considerado pertencente à primeira zona
de Brillouin do espaço-k.
No caso de elétron livre, todas as componentes de Fourier UK são exata-
mente nulas. A Eq. (8.2), torna-se, então,
¡ 0 ¢
εk−K − ε ck−K = 0, (8.3)

onde introduzimos a notação:


~2 2
ε0q = q . (8.4)
2m
8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 135

A Eq. (8.3) requer que, para cada K, ou ck−K = 0 ou ε = ε0k−K . A


última possibilidade pode ocorrer somente para um único K, a menos que
aconteça de alguns dos ε0k−K serem iguais para diferentes escolhas de K. Se
tal degenerescência não ocorre, então a classe de soluções esperadas para
elétrons livres:
ε = ε0k−K , ψ k ∝ ei(k−K) · r (8.5)
Porém, existindo um grupo de vetores da rede recíproca K1 , ..., Km , sat-
isfazendo
ε0k−K1 = · · · = ε0k−Km , (8.6)
então, quando ε for igual ao valor comum dessas energias de elétrons livres
existem m soluções de ondas planas degeneradas independentes. Como
qualquer combinação de soluções degeneradas é também uma solução, tem-
se a completa liberdade de escolher os coeficientes ck−K para K = K1 , ..., Km .
Essas observações simples adquirem mais essência, quando os UK não
são nulos, mas muito pequenos. A análise ainda se divide, naturalmente,
em dois casos, correspondendo aos casos não-degenerados e degenerados
para elétrons livres. Porém, agora, a base para a distinção não é mais a
igualdade exata1 de dois ou mais níveis de elétrons livres distintos, mas
somente se eles são iguais à parte termos da ordem de U.
Caso 1 Fixa-se k e considera-se um particular vetor da rede recíproca
K1 tal que as energias de elétrons livres ε0k−K1 estão distantes dos valores
ε0k−K (para todos os demais K) comparados com U (veja Fig. 9.1):2
¯ 0 ¯
¯εk−K − ε0k−K ¯ À U, para k fixo e todos os K 6= K1 . (8.7)
1

Queremos investigar os efeitos do potencial sobre o nível de elétron livre


dado por
ε = ε0k−K1 , ck−K = 0, K 6= K1 . (8.8)
Na situação em que K = K1 na Eq. (8.2) (e, usando a notação simplificada
(8.4)), temos (abandonando a linha do índice K0 do somatório):
¡ ¢ X
ε − ε0k−K1 ck−K1 = UK−K1 ck−K (8.9)
K

1 O leitor que é familiar com a teoria de perturbação estacionária pode pensar que,

se não existir nenhuma degenerescência exata, podemos sempre considerar grandes as


diferenças de energia entre todos os níveis comparadas com U, considerando U suficien-
temente pequeno. Isto é ainda verdadeiro para qualquer k dado. Porém, uma vez que
temos dado U bem definido, não importa quão pequeno ele seja, queremos um procedi-
mento válido para todos os k na primeira zona de Brillouin. Veremos que não importa
quão pequeno U seja, poderemos sempre encontrar alguns valores de k para os quais
a separação entre os níveis não perturbados é muito menor do que U. Portanto, o que
estamos fazendo é mais sutil do que a teoria de perturbação degenerada convencional.
2 Nas igualdades desta forma, usaremos U para nos referirmos a uma componente de

Fourier típica do potencial.


136 8. Elétrons num Potencial Periódico Fraco

Uma vez que escolhemos a constante aditiva na energia potencial tal que
UK = 0, quando K = 0 (veja pág. 117), somente os termos com K 6= K1
aparecem do lado direito de (8.9). Como estamos examinando aquelas
soluções para as quais ck−K se anulam para K 6= K1 no limite de U se
anulando, esperamos que o lado direito de (8.9) seja de segunda ordem em
U. Isto pode ser explicitamente confirmado, escrevendo a Eq. (8.2) para
K 6= K1 como

UK1 −K ck−K1 X UK0 −K ck−K0


ck−K = 0 + . (8.10)
ε − εk−K ε − ε0k−K
0K 6=K1

Separamos da soma em (8.10) o termo contendo ck−K1 , pois ele será uma or-
dem de magnitude maior do que os demais termos, que envolvem ck−K0 para
K0 6= K1 . Esta conclusão depende da suposição (8.7) de que o nível ε0k−K1
não é quase-degenerado com algum outro ε0k−K . Essa quase-degenerescência
faria com que alguns dos denominadores em (8.10) fosse da mesma ordem
de grandeza de U, cancelando o termo explicito em U no numerador e resul-
tando em termos adicionais na soma (8.10) comparáveis ao termo K = K1 .
Portanto, se não existir nenhuma quase-degenerescência,
UK1 −K ck−K1 ¡ ¢
ck−K = + O U2 (8.11)
ε − ε0k−K

Inserindo esta equação em (8.9), encontramos:


¡ ¢ X UK−K UK −K ¡ ¢
ε − ε0k−K1 ck−K1 = 1 1
ck−K1 + O U 3 (8.12)
ε − ε0k−K
K

Então o nível de energia perturbado ε difere do valor para elétron livre


por termos da ordem de U 2 . Para resolver a Eq. (8.12) para ε até a ordem
de U 2 , é suficiente substituir o valor de ε aparecendo no denominador do
lado direito por ε0k−K1 , levando à seguinte expressão3 para ε, correta até
segunda ordem em U :
X |UK−K |2 ¡ ¢
ε = ε0k−K1 + 1
ck−K1 + O U 3 (8.13)
ε0k−K1 − ε0k−K
K

A Eq. (8.13) nos diz que bandas não-degeneradas fracamente pertur-


badas repelem-se mutuamente, pois qualquer nível ε0k−K que esteja abaixo
de ε0k−K1 contribui com um termo em (8.13) que aumenta o valor de ε,
enquanto que qualquer nível que esteja acima de ε0k−K1 contribiu com um
termo que diminui a energia. Porém, a característica mais importante que
emerge desta análise do caso de nenhuma quase-degenerescência, grosso

3 Usamos ∗.
a Eq. (7.33), U−K = UK
8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 137

modo, é o desvio em segunda ordem em U na energia em relação ao valor


de elétron livre. No caso quase-degenerado (como veremos agora) o desvio
na energia pode ser linear em U. Portanto, para um potencial periódico
fraco, somente os níveis de elétrons livres quase-degenerados é que são sig-
nificantemente desviados dos seus valores não perturbados e por isto vamos
dedicar mais atenção a esse importante caso.
Caso 2 Suponha que o valor de k seja tal que existam vetores da rede
recíproca K1 , K2 , . . . , Km com ε0k−K1 , ε0k−K2 , . . . , ε0k−Km todas diferindo
entre si por termos da ordem4 de U, mas muito separadas das demais ε0k−K
na escala de U :
¯ 0 ¯
¯εk−K − ε0k−K ¯ À U, i = 1, . . . , m, K 6= K1 , . . . , Km (8.14)
i

Neste caso, devemos tratar separadamente aquelas equações dadas por


(8.2), quando K é igual a qualquer um dos m valores K1 , . . . , Km . Isto
dá m equações correspondendo a uma única equação (8.9) no caso não-
degenerado. Nessas m equações, separamos da soma aqueles termos con-
tendo os coeficientes ck−Kj , j = 1, . . . , m, que não são pequenos no limite
da interação nula, dos demais ck−K , que serão pelo menos da ordem de U.
Então temos:
Xm X
¡ 0
¢
ε − εk−Ki ck−Ki = UKi −Kj ck−Kj + UK−Ki ck−K , i = 1, . . . m.
j=1 K6=K1 ...Km
(8.15)
Fazendo a mesma separação na soma, podemos escrever (8.2) para os de-
mais níveis como
 
Xm X
1 
ck−K = UKj −K ck−Kj + UK0 −K ck−K0  , K 6= K1 , . . . Km
ε − ε0k−K j=1 0 K 6=K1 ,...Km
(8.16)
(que corresponde à equação (8.10) no caso não-degenerado).
Como ck−K será pelo menos da ordem de U, quando K 6= K1 , . . . Km , a
Eq. (8.16) dá
Xm
1 ¡ ¢
ck−K = 0 UKj −K ck−Kj + O U 2 (8.17)
ε − εk−K j=1

Substituindo esta equação em (8.15), encontra-se que


 
Xm Xm X
¡ ¢ UK−Ki UKj −K ¡ ¢
ε − ε0k−Ki ck−Ki = UKi −Kj ck−Kj +   ck−Kj +O U 3
0
ε − εk−K
j=1 j=1 K6=K1 ...Km
(8.18)

4 Em uma dimensão m não pode ser maior que 2, mas em três dimensões m pode ser

muito grande.
138 8. Elétrons num Potencial Periódico Fraco

Compare este resultado com o da Eq. (8.12) para o caso não-degenerado. Ali
encontramos uma expressão explícita para o desvio na energia da ordem
de U 2 (ao qual se reduz o conjunto de equações (8.18) quando m = 1).
Agora, porém, encontramos que, até a ordem de U 2 , a determinação dos
desvios nos m níveis quase-degenerados reduz-se à solução de m equações
acopladas5 para ck−Ki . Entretanto, os coeficientes no segundo termo do
lado direito dessas equações são de ordem mais alta em U do que aqueles
no primeiro termo.6 Consequentemente, para encontramos as correções em
U mais importantes, podemos substituir (8.18) pelas equações mais simples:
m
X
¡ ¢
ε − ε0k−Ki ck−Ki = UKi −Kj ck−Kj , i = 1, . . . , m. (8.19)
j=1

que são justamente as equações gerais para um sistema de m níveis quân-


ticos.7

8.1.1 Níveis de Energia Próximos de um Único Plano de


Bragg
O exemplo mais simples e mais importante da discussão precedente é
quando dois níveis de elétrons livres diferem um do outro por uma energia
da ordem de U, mas estando muito distantes de todos os demais, comparado
com U. Quando isto acontece, a Eq. (8.19) reduz-se a duas equações:
¡ ¢
ε − ε0k−K1 ck−K1 = UK1 −K2 ck−K2 ,
(8.20)
¡ 0
¢
ε − εk−K2 ck−K2 = UK2 −K1 ck−K1
Quando apenas dois níveis estão envolvidos não há razão para contin-
uarmos com a convenção notacional que rotula esses níveis simetricamente.
Portanto, introduzimos variáveis particularmente mais convenientes para o
problema de dois níveis:
q = k − K1 e K = K2 − K1 , (8.21)

5 Estas equações são muito parecidas com as equações da teoria de perturbação de-

generada de segunda ordem, para as quais elas se reduzem quando todas as εk−Ki forem
rigorosamente iguais, i = 1, . . . , m. (Veja L. D. Landau and E. M. Lifshitz, Quantum
Mechanics, Addison-Wesley, Reading Mass., 1965, pág. 134.)
6 O numerador é explicitamente da ordem de U 2 , e como somente valores de K difer-

entes de K1 , . . . , Km aparecem na soma, o denominador não é da ordem de U, quando


o valor de ε estiver próximo de ε0k−K , i = 1, . . . , m.
i
7 Observe que uma regra prática para voltar de (8.18) para a forma mais precisa dada

em (8.19) é simplesmente substituir U por U 0 , onde


0
X UKj −K UK−Ki
UK j −Ki
= UKj −Ki + .
K6=K ,...,K
ε − ε0k−K
1 m
8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 139

e escrevemos (8.20) como


¡ ¢
ε − ε0q cq = UK cq−K
(8.22)
¡ ¢ ∗
ε − ε0q−K cq−K = U−K cq = UK cq .

Temos:
¯ ¯
ε0q ≈ ε0q−K , ¯ε0q − ε0q−K0 ¯ À U, para K0 6= K, 0. (8.23)

Agora ε0q é igual a ε0q−K para algum vetor da rede recíproca somente quando
|q| = |q − K| . Isto significa (Figura 9.2a) que q deve estar com a extremi-
dade sobre o plano de Bragg, que divide ao meio a linha ligando a origem
do espaço k ao ponto da rede recíproca K. A proposição de que ε0q = ε0q−K 0
apenas para K0 = K requer que q esteja somente sobre este plano de Bragg
e sobre nenhum outro plano.
Então a condição (8.23) tem o significado geométrico de que q deve estar
próximo de um plano de Bragg (mas não deve estar próximo a uma região
onde dois ou mais planos de Bragg se interceptem). Portanto, o caso de dois
níveis quase-degenerados refere-se a um elétron cujo vetor de onda satisfaz,
aproximadamente, a condição para um único espalhamento de Bragg.8 Cor-
respondentemente, o caso geral de muitos níveis quase-degenerados aplica-
se ao tratamento de um nível de elétron livre, cujo vetor de onda esteja
próximo a uma região onde ocorra simultaneamente muitas reflexões de
Bragg. Como os níveis quase-degenerados são os mais profundamente afe-
tados por um potencial periódico fraco, concluimos que um potencial per-
iódico fraco tem seus maiores efeitos somente sobre os níveis de elétrons
livres, cujos vetores de onda estão próximos de uma região onde podem
ocorrer reflexões de Bragg.
Mais adiante, discutiremos sistematicamente quando os vetores de onda
de um elétron livre estão ou não sobre planos de Bragg, assim como a
estrutura geral que isto impõe sobre os níveis de energia num potencial
fraco. Em primeiro lugar, porém, vamos examinar a estrutura de níveis,
quando apenas um único plano de Bragg está envolvido, determinado por
(8.22). Essas equações têm uma solução quando
¯ ¯
¯ ε − ε0q −UK ¯¯
¯ ∗ =0 (8.24)
¯ −UK ε − ε0q−K ¯

Isto leva a uma equação quadrática


¡ ¢¡ ¢
ε − ε0q ε − ε0q−K = |UK |2 (8.25)

8 Um feixe de raio-X incidente sofre uma reflexão de Bragg somente se seu vetor de

onda estiver sobre um plano de Bragg (veja Capítulo 6).


140 8. Elétrons num Potencial Periódico Fraco

As duas raízes
Ã !2 1/2
0 0
¡
1 0 ¢ εq − ε
+ |UK |2 
q−K
ε= ε + ε0q−K ±  (8.26)
2 q 2

dão o efeito dominante do potencial periódico sobre as energias dos dois


níveis de elétron livre ε0q e ε0q−K , quando q está próximo de um plano de
Bragg determinado por K. Esta situação é mostrada na Figura 9.3.
O resultado (8.26) é particularmente simples para pontos estando sobre
o plano de Bragg, pois, quando q está sobre o plano de Bragg, ε0q = ε0q−K .
Assim
ε = ε0q ± |UK | , q sobre um único plano de Bragg. (8.27)
Então, em todos os pontos sobre o plano de Bragg, um nível é deslocado
uniformemente para cima pela quantidade |UK | e o outro é uniformemente
deslocado para baixo pela mesma quantidade.
Verifica-se facilmente de (8.26) que quando ε0q = ε0q−K ,
µ ¶
∂ε ~2 1
= q− K ; (8.28)
∂q m 2
i.e., quando o ponto q está sobre o plano de Bragg o gradiente de ε é paralelo
ao plano (veja Figura 9.2b). Como o gradiente é perpendicular a superfícies
nas quais a função é constante, as superfícies de energia constante no plano
de Bragg são perpendiculares ao plano.9
Quando q está sobre um único plano de Bragg, podemos facilmente de-
terminar a forma das funções de onda correspondendo às duas soluções
ε = ε0q ± |UK | . De (8.22), quando ε é dado por (8.27), os dois coeficientes
cq e cq−K satisfazem10

cq = ± sgn (UK ) cq−K . (8.29)

Como esses dois coeficiente são aqueles dominantes na espansão em ondas


planas (8.1), segue-se que se UK > 0, então
µ ¶2
2 1
|ψ (r)| ∝ cos K · r , ε = ε0q + |UK | ,
2
µ ¶2
1
|ψ (r)|2 ∝ sen K · r , ε = ε0q − |UK | ,
2

9 Este resultado, às vezes, mas nem sempre, é verdadeiro mesmo quando o potencial

periódico não é fraco, pois os planos de Bragg ocupam posições de razoavelmente alta
simetria.
1 0 Por simplicidade, consideramos aqui que U
K é real (o cristal tem simetria de inver-
são).
8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 141

enquanto que, se UK < 0, então


µ ¶2
2 1
|ψ (r)| ∝ sen K · r , ε = ε0q + |UK | ,
2
µ ¶2
2 1
|ψ (r)| ∝ cos K · r , ε = ε0q − |UK | . (8.30)
2

Às³ vezes os dois tipos ´de combinações


³ lineares são chamadas
´ de tipo-
2 2 1 2 2 1
p |ψ (r)| ∼ sen 2 K · r e tipo-s |ψ (r)| ∼ cos 2 K · r , devido a de-
pendência de sua posição próximo a um ponto da rede. A combinação tipo-s
não se anula na posição do íon; na combinação tipo-p a densidade de carga
se anula com o quadrado da distância do íon para pequenas distâncias, que
é também uma característica dos níveis atômicos-p.

8.1.2 Bandas de Energia em uma Dimensão


Podemos ilustrar essas conclusões gerais em uma dimensão, onde a de-
generescência dupla é a maior que pode ocorrer neste caso. Na ausência de
qualquer interação os níveis de energia eletrônica são justamente parábo-
las no espaço-k (Figura 9.4a). Até a ordem dominante no fraco potencial
periódico unidimensional esta curva permanece correta exceto próximo dos
”planos” de Bragg (que são pontos em uma dimensão). Quando q está
próximo de um ”plano” de Bragg correspondendo ao vetor K da rede recíp-
roca (i.e., o ponto 21 K) os níveis de energia corrigidos são determinados,
traçando-se uma outra parábola de elétron livre centrada em K (Figura
9.4b), observando que a degenerescência no ponto de interseção é sepa-
rada pela quantidade 2 |UK | de tal maneira que ambas as curva tenham
inclinação nula naquele ponto, e traçando novamente a Figura 9.4b para
obtermos a Figura 9.4c. A curva de elétron livre original é modificada como
na Figura 9.4d. Quando todos os planos de Bragg e suas associadas com-
ponentes de Fourier forem incluidas, encontramos um conjunto de curvas
tais como aquele mostrado na Figura 9.4e. Esta maneira particular de rep-
resentar os níveis de energia é conhecido como esquema de zona estendida.
Se insistirmos em especificar todos os níveis pelo vetor de onda k na
primeira zona de Brillouin, então devemos transladar os pedaços da Figura
9.4e através de vetores da rede recíproca para a primeira zona de Brillouin.
O resultado é mostrado na Figura 9.4f. A representação é aquela do esquema
de zona reduzida (veja pág. 124)
Podemos também enfatizar a periodicidade no espaço-k, estendendo-se
periodicamente a Figura 9.4f através de todo espaço-k para obtermos a
Figura 9.4g. que enfatiza que um nível particular em k pode ser descrito por
qualquer vetor de onda diferindo de k por um vetor da rede recíproca. Esta
representação é o esquema da zona repetida (veja pág. 124). O esquema da
zona repetida classifica cada nível com um valor de k pertencente à primeira
142 8. Elétrons num Potencial Periódico Fraco

zona de Brillouin, enquanto que o esquema de zona estendida enfatiza a


continuidade com os níveis de elétrons livres. O esquema de zona repetida
é a representação mais geral, embora altamente redundante, pois o mesmo
nível é mostrado muitas vezes, para todos os vetores de onda equivalentes
k, k ± K, k ± 2K, ....

8.2 Curvas Energia-Vetor de Onda em Três


Dimensões
Em três dimensões a estrutura das bandas de energia é às vezes mostrada
pelo gráfico ε vs. k ao longo de linhas retas particulares no espaço-k. Tais
curvas são geralmente mostradas num esquema de zona reduzida, pois para
direções gerais no espaço-k elas não são periódicas. Mesmo na aproximação
de elétron completamente livre essas curvas são surpreendentemente com-
plexas. Um exemplo é mostrado na Figura 9.5, que foi construído, plotando,
enquanto k variava ao longo de linhas particulares mostradas na figura,
os valores de ε0k−K = ~2 (k − K)2 /2m para todos os vetores K da rede
recíproca, suficientemente próximos da origem para que as energias sejam
menores do que o topo da escala vertical.
Observe que a maioria das curvas são altamente degeneradas. Isto é
porque as direções ao longo das quais as energias foram plotadas são linhas
de simetria bastante alta, tal que pontos ao longo delas estejam provavel-
mente à mesma distância de vários vetores da rede recíproca como de
qualquer um vetor dado. A adição de um potencial periódico fraco, em
geral, removerá algumas, mas nem todas, destas degenerescências. A teo-
ria (matemática) de grupos às veze é usada para determinar quantas tais
degenerescências serão removidas.

8.3 O Gap de Energia


Geralmente um potencial periódico fraco introduz um ”gap de energia” nos
planos de Bragg. Por isto, entendemos o seguinte:
Quando UK = 0, enquanto k cruza um plano de Bragg a enegia muda
continuamente da menor raiz de (8.26) para a maior, como ilustrado na
Figura 9.4b. Quando UK 6= 0, isto não é bem assim. A energia somente
varia continuamente com k, quando se cruza um plano de Bragg, se per-
manecermos na menor (ou maior) raiz, como ilustrado na Figura 9.4c. Para
mudarmos de ramo, quando k variar continuamente, agora é necessário que
a energia varie descontinuamente pelo menos pela quantidade 2 |UK | .
Veremos no Capítulo 12 que esta separação matemática das duas bandas
é refletida numa separação física: quando a ação de um campo externo
muda o vetor de onda do elétron, a presença do gap de energia requer que
8.4 Zonas de Brillouin 143

sobre o cruzamento do plano de Bragg, o elétron deve emergir num nível,


cuja energia permaneça no ramo original de ε (k) . É esta propriedade que
torna o gap de energia de fundamental importância nas propriedades de
transporte eletrônico.

8.4 Zonas de Brillouin


Usando a teoria de elétrons num potencial periódico fraco para determinar
a estrutura de banda completa de um cristal tridimensional resulta em
construções geométricas de grande complexidade. Às vezes é importante
determinar a superfície de Fermi (veja pág. 123) e o comportamento de
εn (k) na sua vizinhança.
Fazendo-se isto para potenciais fracos, o procedimento é inicialmente
desenhar a esfera de Fermi para elétrons livres centrada em k = 0. Em
seguida, observa-se que a esfera será deformada de uma maneira da qual a
Figura 9.6 é caracterísitca,11 quando cruza um plano de Bragg e de uma
maneira correspondentemente mais complexa, quando ela passa próximo de
vários planos de Bragg. Quando os efeitos de todos os planos de Bragg são
inseridos, isto leva a uma representação da superfície de Fermi como uma
esfera fraturada no esquema da zona estendida. Para construir as porções
da superfície de Fermi situadas várias bandas no esquema da zona reduzida,
translada-se todas as porções de uma única esfera fraturada de volta para
a primeira zona através de vetores da rede recíproca. Este procedimento é
tornado sistemático através da noção de zonas de Brillouin mais elevadas.
Relembre que a primeira zona de Brillouin é a célula primitiva de Wigner-
Seitz da rede recíproca (págs. 64 e 75), i.e. o conjunto de pontos que estão
mais próximos de K = 0 do que de qualquer outro ponto da rede recíproca.
Como os planos de Bragg dividem ao meio as linhas ligando a origem
aos pontos da rede recíproca, pode-se também definir a primeira zona de
Brillouin como um conjunto de pontos que podem ser alcançados a partir
da origem sem cruzar nenhum plano de Bragg.12
Zonas de Brillouin mais elevadas são simplesmente outras regiões limi-
tadas por planos de Bragg, definidas como segue:
A primeira zona de Brillouin é o conjunto de pontos no espaço-k que
podem ser alcançados a partir da origem sem cruzar nenhum plano de
Bragg. A segunda zona de Brillouin é o conjunto de pontos que podem ser
alcançados a partir da primeira zonas, cruzando-se somente um plano de

1 1 Isto segue-se da demonstração da pág.140 de que a superfície de energia constante

é perpendicular a um plano de Bragg, quando eles se interceptam, na aproximaçào de


elétron quase-livre.
1 2 Excluimos das considerações os pontos situados sobre os planos de Bragg, que são

pontos comuns à superfície de duas ou mais zonas. Definimos as zonas em termos de


seus pontos interiores.
144 8. Elétrons num Potencial Periódico Fraco

Bragg. A (n + 1)-ésima zona de Brillouin é o conjunto de pontos que não


pertencem a (n − 1)-ésima zona e que podem ser alcançados a partir da
n-ésima zona, cruzando-se apenas um plano de Bragg.
Alternativamente, a n-ésima zona de Brillouin pode ser definida como o
conjunto de pontos que podem ser alcançados, a partir da origem, cruzando-
se n − 1 planos de Bragg.
Essas definições são ilustradas na Figura 9.7 para o caso bidimensional.
As superfícies das três primeiras zonas para as redes fcc e bcc são mostradas
na Figura 9.8. Ambas as definições enfatizam o fato fisicamente importante
de que as zonas são delimitadas por planos de Bragg. Então elas são regiões,
em cujas superfícies os efeitos de um potencial periódico fraco são impor-
tante (i.e., primeira ordem), mas em cujo interior os níveis de energia de
elétrons livres são perturbados somente em segunda ordem.
É muito importante observar que cada zona de Brillouin é uma célula
primitiva da rede recíproca. Isto é porque a n-ésima zona de Brillouin
é simplesmente o conjunto de pontos que tem a origem como o n-ésimo
ponto da rede recíproca mais próximo (um ponto K da rede recíproca é
mais próximo de um ponto k do que k é da origem se e somente se k é
separado da origem por um plano de Bragg determinado por K). Dado
isto, a prova de que a n-ésima zona de Brillouin é uma célula primitiva é
idêntica à prova dada na página 63 de que a célula de Wigner-Seitz (i.e.,
a primeira zona de Brillouin) é primitiva, substituindo-se a frase ”n-ésimo
vizinho mais próximo” por ”vizinho mais próximo” naquele argumento.
Como cada zona é uma célula primitiva, existe um algorítmo simples para
construir os ramos da superfície de Fermi no esquema de zona repetida13 :

1. Desenhe a esfera de Fermi de elétron livre.

2. Deforme-a ligeiramente (como ilustrado na Figura 9.6) na vizinhança


imediata de um plano de Bragg. (No limite de potenciais extrema-
mente fracos esta etapa às vezes pode ser ignorada para uma primeria
aproximação.)

3. Pegue o pedaço da superfície de elétron livre que está dentro da n-


ésima zona de Brillouin e translade-o através de todos os vetores da
rede recíproca. A superfície resultante é o ramo da superfície de Fermi
(convencionalmente atribuído à n-ésima banda) no esquema de zona
repetida.14

1 3 A representação da superfície de Fermi no esquema de zona repetida é a mais geral.

Depois de inspecionar cada ramo em toda sua intensidade periódica, podemos escolher
com clareza aquela cela primitiva que representa a estrutura topological do todo (que
às vezes, mas nem sempre, é a primeira zona de Brillouin).
1 4 Um procedimento alternativo é transladar os pedaços da superfície de Fermi na n-

ésima zona através daqueles vetores da rede recíproca que transferem os pedaços da
n-ésima zona na qual eles contidos para a primeira zona. (Tais translações existem,
8.5 Fator de Estrutura Geométrico em Redes Monoatômicas com Base 145

Geralmente falando, o efeito do potencial periódico fraco sobre as super-


fícies construídas a partir da esfera de Fermi de elétron livre sem a etapa
2, é simplesmente arredondar as arestas e cantos da superfície. Porém, se
o ramo da superfície de Fermi consistir em pedaços muito pequenos de su-
perfície (envolvendo níveis ocupados ou vazios, conhecidos como ”bolsões
de elétrons” ou ”bolsões de buracos”), então o potencial periódico fraco
pode fazê-los desaparecer. Além disso, se a superfície de Fermi de elétron
livre tiver partes com secções transversais muito estreitas, um potencial
periódico fraco pode desconectá-la em tais pontos.
Algumas construções adicionais apropriadas para a discussão de elétrons
quase-livres em cristais fcc são ilustradas na Figura 9.10. Essas superfícies
de Fermi tais como de elétrons livres são de grande importância no entendi-
mento de superfícies de Fermi reais de muitos metais. Isto é ilustrado no
Capítulo 15.

8.5 Fator de Estrutura Geométrico em Redes


Monoatômicas com Base
Nada foi dito até aqui que explorasse qualquer propriedade do potencial
U (r) além de sua periodicidade, e, por conveniência, a simetria de inversão.
Se olharmos com mais atenção para a forma de U, reconhecendo que ele
é derivado de uma soma de potenciais atômicos centrados na posição dos
íons, poderemos obter mais informações que serão importantes no estudo
de estruturas eletrônicas de redes monoatômicas com base, tal como as
estruturas do diamante e hexagonal com agrupamento compacto (hcp).
Suponha que a base consista de íons idênticos localizados nas posições
dj . Então, o potencial periódico U (r) terá a forma
XX
U (r) = φ (r − R − dj ) (8.31)
R j

Levando-se isto na Eq. (7.31) para UK , encontramos que


Z X
1
UK = dr e−iK· r φ (r − R − dj )
v célula
R, j
Z X
1
= dr e−iK· r φ (r − dj ) (8.32)
v todo j
espaço
ou
1 ∗
UK = φ (K) SK , (8.33)
v

uma vez que a n-ésima zona é uma célula primitiva.) Isto é ilustrado na Figura 9.9. A
superfície de Fermi no esquema de zona repetida é então constuída, transladando-se as
estruturas resultante na primeira zona através de todos os vetores da rede recíproca.
146 8. Elétrons num Potencial Periódico Fraco

onde φ (K) é a transformada de Fourier do potencial atômico,


Z
φ (K) = dr e−iK· r φ (r) (8.34)
todo
espaço

e SK é o fator de estrutura geométrico introduzido em nossa discussão de


difração de raio-X (Capítulo 6):
X
SK = e−iK· dj . (8.35)
j

Então, quando a base leva a um fator de estrutura nulo para alguns


planos de Bragg, i.e., quando os picos de difração de raio-X desses planos
estão ausentes, então a componente de Fourier do potencial periódico as-
sociada com tais planos se anulam; i.e., a separação dos níveis em ordem
mais baixa desaparece.
O resultado é de particular importância na teoria dos metais com es-
trutura hexagonal com agrupamento complacto, dos quais existem mais de
25 (Tabela 4.4). A primeira zona de Brillouin para a rede hexagonal sim-
ples é um prisma com base hexagonal regular. Porém, o fator de estrutura
associado com a base e o topo do prisma se anula (Problema 3, Capítulo
6).
Portanto, de acordo com a teoria de elétrons quase-livres, não existe nen-
huma quebra de degenerescência dos níveis de elétrons livres nesses faces.
Poderia parecer, ainda, que pequenas separações desses níveis ocorreriam
devido a efeitos de segunda ordem (ou ordem mais elevada). Todavia, se o
Hamiltoniano de um-elétron é independente do spin, então, pode-se mostrar
que, numa estrutura hcp, qualquer nível de Bloch com vetor de onda k sobre
a face hexagonal da primeira zona de Brillouin é pelo menos duplamente de-
generado. Consequentemente, a separação dos níveis é rigorosamente nula.
Em situações tais com esta às vezes é mais conveniente considerar a rep-
resentação da estrutura da zona onde esses planos com gap nulo sejam de
fato ignorados. As regiões em que isso é considerado são conhecidas com
zonas de Jones ou grandes zonas.

8.6 Importância do Acoplamento Spin-Órbita em


Pontos de Alta Simetria
Até agora consideramos que o spin do elétron fosse completamente inerte
sob o ponto de vista da dinânica. De fato, porém, um elétron movendo-
se sob a ação de um campo elétrico, tal como aquele de um potencial
periódico, experimenta um potencial proporcional ao produto escalar de seu
momento magnético de spin pelo produto vetorial de sua velocidade com
8.7 Problemas 147

o campo elétrico. Refere-se a esta interação adicional como acoplamento


spin-órbita e é de grande importância na física atômica (veja Capítulo 31).
O acoplamento spin-órbita é importante no cálculo de quase todos os níveis
de elétrons livres em pontos do espaço-k de alta simetria, pois acontece às
vezes de os níveis que são rigorosamente degenerados, quando esse efeito é
ignorado, a degenerescência é quebrada na presença do acoplamento spin-
órbita.
Por exemplo, a seperação dos níveis eletrônicos nas faces hexagonais
da primeira zona em metais hcp é inteiramente devido ao acoplamento
spin-órbita. Como a magnitude do acoplamento spin-órbita cresce com o
número atômico, esta separação é sensível em metais pesados hexagonais,
mas muito pequeno e pode ser ignorado em metais leves. Consequente-
mente, existem dois diferentes esquemas para construir superfícies de Fermi
tal como as de elétrons livres. Isto é ilustrado nas Figuras 9.11 e 9.12.

8.7 Problemas
1. Superfície de Fermi para elétrons quase-livres próximo de
um único plano de Bragg
Para investigar a estrutura de banda para elétrons quase-livres dada
por (8.26) próximo a um plano de Bragg, é conveniente medir o ve-
tor de onda q em relaçào ao ponto 21 K sobre o plano de Bragg. Es-
crevendo q = 12 K + k, e decompondo k em suas componenetes paralela
(kk ) e perpendicular (k⊥ ) ao vetor K, então (8.26) torna-se
µ ¶1/2
~2 2 ~2
ε = ε0K/2 + k ± 4ε0K/2 kk2 + |UK | (8.36)
2n 2n

É também conveniente medir a energia de Fermi εF em relação ao


menor valor de qualquer uma das bandas obtidas de (8.36) no plano
de Bragg, escrevendo:

εF = ε0K/2 − |UK | + ∆ (8.37)

tal que, quando ∆ < 0, nenhuma superfície de Fermi intercepta o


plano de Bragg.

(a) Mostre que, quando 0 < ∆ < 2 |UK | , a superfície de Fermi está
contida inteiramente na banda mais baixa e intercepta o plano
de Bragg num cículo de raio
r
2m∆
ρ= (8.38)
~2
148 8. Elétrons num Potencial Periódico Fraco

(b) Mostre que, se ∆ > 2 |UK | , a superfície de Fermi está contida


em ambas as bandas, cortando o plano de Bragg em dois círculos
de raios ρ1 e ρ2 (Figura 9.6), e que a diferença das áreas dos dois
círculos é
¡ ¢ 4mπ
π ρ22 − ρ21 = 2 |UK | . (8.39)
~
(A área desses círculos pode ser medida diretamente em alguns
metais por meio do efeito Haas-van Alphen (Capítulo 14), e
portanto |UK | pode ser determinado diretamente da experiência
para metais de elétrons quase-livres.)

2. Densidade de níveis para um modelo de duas bandas


Até certo ponto este problema é artificial no que os efeitos de planos
de Bragg ignorados podem conduzir a correções comparáveis aos
desvios, que encontraremos aqui, do resultado de elétron livre. Por
outro lado, o problema é instrutivo no sentido de que as característi-
cas qualitativas são gerais.
Decompondo-se q em suas componentes paralela (qk ) e perpendicular
(q⊥ ) ao vetor K então (8.26) torna-se

~2 2 ¡ ¢
ε= q⊥ + h± qk (8.40)
2m
onde
(· ¸ )1/2
¡ ¢ ~2 h 2 1
¡ 2 ¢i ~2 1 ¡ 2 ¢ 2 2
h± qk = q + K − 2qk K ± K − 2qk K + |UK |
2m k 2 2m 2
(8.41)
é função apenas de qk . A densidade de níveis pode ser calculada de
(7.56), resolvendo-se a integral numa célula primitiva apropriada so-
bre os vetores de onda q em coordenadas cilíndricas com o exio-z na
direção de K.

(a) Mostre que, quando a integral sobre q é efetuada, o resultado


para cada banda é
µ ¶
1 2m ³ máx mín
´
g (ε) = 2 qk − qk (8.42)
4π ~2
¡ ¢
onde, para cada banda, qkmáx e qkmín são soluções de ε = h± qk .
Verifique que o resultado familiar para elétrons livres é obtido
no limite |UK | → 0.
(b) Mostre que
r
2mε ¡ 2¢
qkmín =− + O UK , (ε > 0) , qkmáx = 12 K (8.43)
~2
8.7 Problemas 149

para a banda mais baixa, se a superfície de energia constante


(com energia ε) corta o plano da zona (isto é, εK/2 − |UK | ≤ ε ≤
εK/2 + |UK |).
(c) Mostre que para a banda superior, deveria ser interpretado como
dando uma densidade de níveis
µ ¶
1 2m ³ máx 1 ´
g+ (ε) = 2 qk − 2 K , para ε > εK/2 + |UK |
4π ~2
(8.44)
(d) Mostre que dg/dε é singular em ε = εK/2 ± |UK | , tal que a
densidade de níveis tem a forma mostrada na Figura 9.13. (Essas
singularidades não são características do potencial fraco nem da
aproximação de duas banda. Veja página 127.

3. Efeito do potencial fraco em regiões do espaço-k onde planos


de Bragg se encontram
¡ ¢
Considere o ponto W (kW = (2π/a) 1, 12 , 0 na zona de Brillouin
da estrutura fcc mostrada na Figura 9.14. Nesse ponto, três planos
de Bragg ((200) , (111) , (111̄)) se encontram e, consequentemente, as
energias de elétron livre

~2 2
ε01 = k ,
2m
µ ¶2
~2 2π
ε02 = k− (1, 1, 1) ,
2m a
µ ¶2
~2 2π
ε03 = k− (1, 1, 1̄) ,
2m a
µ ¶2
~2 2π
ε04 = k− (2, 0, 0) , (8.45)
2m a

são degeneradas quando k = kW e iguais a εW = ~2 k2W /2m.

(a) Mostre que numa região do espaço-k próximo do ponto W, as


energias em primeira ordem são dadas pelas soluções de15
¯ 0 ¯
¯ ε1 − ε U1 U1 U2 ¯¯
¯
¯ U1
¯ ε02 − ε U2 U1 ¯¯
¯ U1 0 =0
¯ U2 ε3 − ε U1 ¯¯
¯ U2 U1 U1 ε04 − ε ¯

1 5 Considere que o potencial periódico U tem simetria de inversão, tal que U


K seja
real.
150 8. Elétrons num Potencial Periódico Fraco

onde U2 = U200 , U1 = U111 = U111̄ , e que no ponto W as raízes


são

ε = εW − U2 (duas vezes), ε = εW + U2 ± 2 |U1 | (8.46)

(b) ¡Usando um método


¡ similar,
¢¢ mostre que as energias no ponto U
kU = (2π/a) 1, 41 , 14 são
¡ 2 ¢1/2
ε = εU − U2 , ε = εU + 21 U2 ± 1
2 U2 + 8U12 , (8.47)

onde εU = ~2 k2U /2m.

4. Definição alternativa de zonas de Brillouin


Seja k um ponto no espaço recíproco. Suponha que esferas de raio k
sejam traçadas em torno de cada ponto K da rede recíproca exceto
a origem. Mostre que, se k está no interior de n − 1 esferas, e sobre a
superfície de nenhuma, então este ponto estará no interior da n-ésima
zona de Brillouin. Mostre que se k está no interior de n − 1 esferas,
e na superfície de m esferas adicionais, então é um ponto comum aos
limites da n-, (n + 1)-, ..., (n + m)-ésimas zonas de Brillouin.
5. Zonas de Brillouin numa rede quadrada bidimensional
Considere uma rede quadrada bidimensional com constante de rede
a.

(a) Escreva, em unidades de 2π/a, o raio de um círculo que pode


acomodar m elétrons livres por célula primitiva. Construa uma
tabela relacionando quais das sete primeiras zonas de Brillouin
da rede quadrada (Figura 9.15a) estão completamente cheias,
quais estão parcialmente cheias e quais estão completamente
vazias, para m = 1, 2, . . . , 12. Verifique que, se m ≤ 12, os níveis
ocupados estão inteiramente dentro das sete primeiras zonas, e
que, quando m ≥ 13, os níveis na oitava e nas zonas mais ele-
vadas tornam-se ocupados.
(b) Esboce todos os ramos da superfície de Fermi para os caso
m = 1, 2, . . . , 7 em células primitivas adequadas. A superfície
na terceira zona, por exemplo, pode ser vista como na Figura
9.15b.
This is page 151
Printer: Opaque this

9
Método das Ligações Fortes

No Capítulo 9 calculamos os níveis eletrônicos num metal, considerando-o


como um gás de elétrons de condução quase-livres, perturbado apenas fraca-
mente por um potencial periódico dos íons. Podemos também considerá-lo
sob um ponto de vista diferente, dependendo do sólido (metal ou isolante),
como uma coleção de átomos neutros fracamente interagentes. Como um
exemplo extremo disto, imagine agruparmos átomos de sódio numa rede
cúbica de corpo centrado com uma constante de rede da ordem de cen-
tímetros ao invés de angstrons. Todos os elétrons estariam então em níveis
atômicos localizados em sítios da rede e não teriam nenhuma semelhança
com as combinações lineares de algumas ondas planas descritas no Capítulo
9.
Se diminuíssemos a constante de rede, artificialmente grande, de nosso
arranjo de átomos de sódio, em algum ponto antes de atingirmos o valor
verdadeiro da constante de rede do sódio metálico, teríamos que abandonar
a idéia de identificar os níveis eletrônicos da rede com os níveis atômicos de
átomos de sódio isolados. Isto se tornaria necessário para um nível atômico
particular, quando as distâncias interatômicas ficassem comparáveis à ex-
tensão espacial de sua função de onda, pois um elétron naquele nível sen-
tiria, então, a presença dos átomos vizinhos.
A situação real para os níveis 1s, 2s, 2p e 3s do sódio atômico é mostrada
na Figura 10.1. As funções de onda atômicas para estes níveis são traçadas
em torno de dois núcleos separados por uma distância de 3, 7 Å, que é a
distância entre vizinhos mais próximos no sódio metálico. A sobreposição
das funções de onda 1s centradas nos dois sítios é totalmente desprezível e
indica que estes níveis atômicos ficam essencialmente inalterados no sódio
152 9. Método das Ligações Fortes

metálico. A sobreposição dos níveis 2s e 2p é extremamente pequena, e


esperamos encontrar níveis no metal que sejam muito parecidos com esses
níveis atômicos. Porém, a sobreposição dos níveis 3s (que contém os elétrons
da valência atômica) é considerável e não existe nenhuma razão para es-
perarmos que os níveis eletrônicos do metal assemelhem-se a esses níveis
atômicos.
A aproximação de ligações fortes ou de cabresto-curto (tight-binding)
trata o caso em que a sobreposição das funções de onda atômicas são sufi-
cientes para requerer correções à idéia de átomo isolado, mas não ao ponto
de tornar a descrição atômica completamente irrelevante. A aproximação é
mais útil para descrever bandas de energia que se originam de camadas-d
parcialmente preenchidas dos átomos de metal de transição e para descrever
estruturas eletrônicas de isolantes.
À parte de sua utilidade prática, a aproximação de ligações fortes provê
um modo instrutivo de visualização complementar entre os níveis de Bloch e
de elétron quase-livre, permitindo uma reconciliação entre as características
aparentemente contraditórias entre níveis atômicos localizados e níveis de
ondas planas tipo elétrons livres.

9.1 Formulação Geral


No desenvolvimento da aproximação das ligações fortes, admitimos que na
vizinhança de cada ponto da rede o Hamiltoniano do cristal periódico, H,
pode ser aproximado pelo Hamiltoniano, Hat , de um único átomo local-
izado naquele ponto da rede. Admitimos, também, que os níveis ligados do
Hamiltoniano atômico são bem localizados; i.e., se ψ é um nível ligado de
Hat para um átomo na origem,

Hat ψ n = En ψ n (9.1)

então exigimos que ψ n (r) seja muito pequena quando r exceder a distância
da ordem da constante de rede, que nós nos referimos como o ”alcance” de
ψn.
No caso extremo no qual o Hamiltoniano do cristal só começa a diferir
de Hat (para um átomo, cujo ponto da rede tomamos como a origem) para
pontos distantes de r = 0 que excedam o alcance de ψ n (r), a função de
onda ψ n (r) será uma excelente aproximação para a função de onda do
estado estacionário do Hamiltoniano completo, com autovalor En . Assim
também serão as funções ψ n (r − R) para todos os R na rede de Bravais,
pois H tem a periodicidade da rede.
Para calcular as correções para este caso extremo, escrevemos o Hamil-
toniano H do cristal como

H = Hat + ∆U (r) (9.2)


9.1 Formulação Geral 153

onde ∆U (r) contém todas as correç ões para os potenciais atômicos necessários
para produzir o potencial periódico do cristal (veja Figura 10.2). Se ψ n (r)
satisfaz a equação de Schrödinger atômica (9.1), então satisfará também a
equação de Schrödinger (9.2), com a condição de que ∆U (r) se anule onde
ψ n (r) não se anular. Se assim for, então cada nível atômico ψ n (r) pro-
duziria N níveis no potencial periódico, com funções de onda ψ n (r − R) ,
uma para cada um dos N sítios na rede. Para preservar a descrição de
Bloch, devemos encontrar as N combinações lineares dessas funções de
onda degeneradas que satisfaçam à condição de Bloch (veja Eq. (7.6)):

ψ (r + R) = ei k ·R ψ (r) (9.3)

As N combinações lineares que precisamos são


X
ψ nk (r) = ei k ·r ψ n (r − R) (9.4)
R

onde k sãos os N valores do vetor de onda na primeira zona de Brillouin


consistentes com a condição de contorno periódica de Born-von Karman.1
A condição de Bloch (9.3) é satisfeita pela função de onda (9.4), notando-se
que
X 0 ¡ ¢
ψ (r + R) = ei k ·R ψ n r + R − R0
R0
" #
X
i k ·R i k ·(R0 −R) 0
= e e ψ n (r− (R −R))
R0
" #
X ¡ ¢
i k ·R i k ·R̄
= e e ψ n r − R̄

= ei k ·R ψ (r) (9.5)

Então, a função de onda (9.4) satisfaz a condição de Bloch com o vetor


de onda k, continuando a exibir o carácter atômico dos níveis. Porém, as
bandas de energia obtidas desta maneira têm pouca estrutura, εn (k) sendo
simplismente a energia do nível atômico En , independente do valor de k.

1 Exceto quando estamos estudando explicitamente os efeitos de superfície, devemos

evitar a tentação de tratar um cristal finito restringindo a soma sobre os vetore R em


(9.4) aos sítios de uma porção finita da rede de Bravais. É mais conveniente somar
sobre uma rede de Bravais infinita (a soma convergindo rapidamente devido ao curto
alcance da função de onda atômica ψn (r)) e representar o cristal finito com a condição
de contorno usual de Born-von Karman, que impõe a restrição (7.7) sobre k, quando
vale a condição de Bloch. Somando-se sobre todos os sítios, é admissível, por exemplo,
0
fazermos a substituição da variável da soma R0 por R̄ = R − R, na penúltima linha da
Eq. (9.5).
154 9. Método das Ligações Fortes

Para corrigir esta deficiência devemos reconhecer que uma hipótese mais
realista é que ψ n (r) torna-se pequeno, mas não exatamente nula, antes que
∆U torne-se apreciável (veja Figura 10.2). Isto sugere que buscamos uma
solução para a equação de Schrödinger do cristal que mantenha a forma
geral (9.4):2 X
ψ (r) = ei k ·R φ (r) , (9.6)
R
mas com a função φ (r) não necessariamente uma função de onda exata
do estado estacionário atômico, mas que deve ser determinada através de
cálculo adicional. Se o produto ∆U (r) ψ n (r) , embora não nulo, é extrema-
mente pequeno, podemos esperar que a função φ (r) seja muito parecida
com a função de onda atômica ψ n (r) ou com as funções de onda com as
quais ψ n (r) é degenerada. Baseados nesta espectativa, podemos procu-
rar φ (r) que possa ser expandida num número relativamente pequeno de
funções de onda atômicas localizadas:3 ,4
X
φ (r) = bn ψ n (r) (9.7)
n

Se multiplicarmos a equação de Schrödinger do cristal


H ψ (r) = (Hat + ∆U (r)) ψ (r) = ε (k) ψ (r) (9.8)
pela função de onda atômica ψ ∗m (r), integrarmos em todo o espaço r e
usarmos o fato de que
Z Z Z

ψ m (r) H ψ (r) = (H ψ m (r)) ψ (r) dr = Em ψ ∗m (r) ψ (r) dr

(9.9)
encontramos que
Z Z
(ε (k) − Em ) ψ ∗m (r) ψ (r) dr = ψ ∗m (r) ∆U (r) ψ (r) dr (9.10)

Substituindo-se (9.6) e (9.7) em (9.10) e usando a ortonormalidade das


funções de onda atômicas,
Z
ψ ∗m (r) ψ n (r) dr = δ mn (9.11)

2 Pode-se mostrar (veja página ??) que qualquer função de Bloch pode ser escrita na
forma (9.6), a função φ, sendo conhecida como função de Wannier, tal que nenhuma
generalidade é perdida nesta suposição.
3 Incluindo somente funções de onda atômicas localizadas (i.e., ligadas) em (9.7),

fazemos nossa primeira aproximação séria. Um conjunto completo de níveis atômicos


inclui também níveis ionizados. Este é o ponto no qual o método deixa de ser aplicável
para níveis bem descritos pela aproximação de elétrons quase-livres.
4 Devido a esta método de aproximação de φ, o método de ligações fortes às vezes é

conhecido como o método de combinações lineares de orbitais atômicos ( ou LCAO das


iniciais de Linear Combination of Atomic Orbitals ).
9.1 Formulação Geral 155

chegamos numa equação de autovalores que determina os coeficientes bn (k)


e as energias de Bloch ε (k):
 
X XZ
(ε (k) − Em ) bm = − (ε (k) − Em )  ψ ∗m (r) ψ n (r − R) eik·R dr bn
n R6=0
X
+ (ψ ∗m (r) ∆U (r) ψ n (r) dr) bn
n
 
X XZ
+  ψ ∗m (r) ∆U (r) ψ n (r − R) eik·R dr bn(9.12)
n R6=0

O primeiro termo do lado direito da Eq. (9.12) contém integrais do tipo5


Z
ψ ∗m (r) ψ n (r − R) dr (9.13)

Interpretamos nossa hipótese de níveis atômicos bem localizados com o


significado de que (9.13) é pequena comparada com a unidade. Admitimos
que as integrais no terceiro termo do lado direito de (9.12) sejam peque-
nas, uma vez que elas também contém o produto de duas funções de onda
atômicas centradas em diferentes sítios. Finalmente, admitimos que o se-
gundo termo do lado direito de (9.12) é pequeno, uma vez que esperamos
que as funções de onda atômicas tornem-se pequenas a distâncias suficien-
temente grandes onde o potencial periódico desvia-se apreciavelmente do
correspondente potencial atômico.6
Consequentemente, o lado direito de (9.13) (e, portanto (ε (k) − Em ) bm )
é sempre pequeno. Isto é possível se ε (k) − Em for pequeno sempre que
bn não o for (e vice-versa). Então, ε (k) deve ser semelhante a um nível
atômico, digamos E0 , e todos os bm , exceto aqueles correspondentes a esse
nível e níveis degenerados com ele (ou próximo dele) em energia, devem ser
pequenos:7
ε (k) ≈ E0 , bm ≈ 0, exceto quando Em ≈ E0 (9.14)

5 Integrais, cujos integrandos contém um produto de funções de onda centradas em

diferentes sítios da rede, são conhecidas como integrais de sobreposição (overlap inte-
grals ). A aproximação de ligações fortes explora a pequena magnitude dessas integrais.
Estas integrais têm também um papel importante na teoria do magnetismo (Capítulo
32).
6 Esta última suposição tem menos fundamento do que as outras, uma vez que os

potenciais iônicos não precisam necessariamente decair tão rapidamente como as funções
de onda atômicas. Porém, é também menos importante para a obtenção das conclusões
que obteremos, pois o termo em questão não depende de k. De certo modo, este termo
simplesmente serve para corrigir os potenciais atômicos dentro de cada célula, incluindo
os campos dos íons que estão fora dessa célula.
7 Note a semelhança deste raciocínio com aquele empregado nas páginas 134 a 138.

Ali, porém, concluímos que a função de onda era uma combinação linear de apenas um
156 9. Método das Ligações Fortes

Se a estimativa em (9.14) fosse exatamente uma igualdade, voltaríamos


ao caso extremo no qual os níveis do cristal eram idênticos aos níveis atômi-
cos. Porém, agora podemos determinar os níveis no cristal com maior pre-
cisão, explorando (9.14) para estimar o lado direito de (9.12), considerando
na soma sobre n somente aqueles níveis com energias ou degeneradas ou
muito próximas de E0 . Se o nível atômico 0 é não-degenerado,8 i.e., um
nível-s, na aproximação (9.12) reduz-se a uma única equação, dando uma
expressão explícita para a energia da banda, originando-se desse nível-s
(geralmente chamada ”banda-s”). Se estivermos interessados em bandas
originando-se de um nível atômico p, que é triplamente degenerado, então
(9.12) daria um conjunto de três equações homogêneas, cujos autovalores
dariam ε (k) para as três bandas-p, e cujas soluções b (k) dariam as com-
binações lineares apropriadas dos níveis atômicos p que compõem φ nos
vários k na zona de Brillouin. Para obtermos uma banda-d a partir dos
níveis atômicos d, teríamos que resolver uma equação secular 5 × 5, etc.
Se o ε (k) resultante estiver suficientemente longe dos valores atômicos
num certo k, seria necessário repetir o procedimento, incluindo-se à expan-
são (9.7) de φ, aqueles níveis atômicos adicionais, de cujas energias o ε (k)
se aproxima. Na prática, por exemplo, geralmente resolve-se uma equação
6 × 6 que inclui ambos, os níveis d e s, no cálculo da estrutura de banda dos
metais de transição, que tem no estado atômico uma camada-s externa e
uma camada-d parcialmente preenchida. Este procedimento recebe o nome
de ”mistura s − d” ou ”hibridização”.
Às vezes as funções de onda atômicas tem um alcance muito curto, tal que
precisamos manter na soma sobre R em (9.12) apenas os termos de vizinhos
próximos, o que simplifica bastante a análise subsequente. De passagem,
ilustramos a estrutura de banda que emerge no caso mais simples.9

9.1.1 Aplicação a uma banda-s originária de um único nível


atômico-s
Se todos os coeficiente b em (9.12) forem nulos, exceto aquele para um
único nível atômico s, então (9.12) dá diretamente a estrutura de banda da

pequeno número de ondas planas, cujas energias de elétrons livres eram muito próximas
uma da outra. Aqui, concluímos que a função de onda pode ser representada, através
de (9.7) e de (9.6), por apenas um pequeno número de funções de onda atômicas, cujas
energias atômicas são muito próximas uma da outra.
8 No momento ignoramos o acoplamento spin-órbita. Podemos, portanto, nos concen-

trar inteiramente nas partes orbital dos níveis. O spin pode ser incluído, simplesmente,
multiplicando-se as funções de onda orbital pelos spinores apropriados, e duplicando-se
a degenerescência de cada um dos níveis orbitais.
9 O caso mais simples é aquele de uma banda-s. O próximo caso mais complicado,

uma banda-p, é discutido no Problema 2.


9.1 Formulação Geral 157

correspondente banda-s:
P
β + R γ (R) ei k·R
ε (k) = Es − P (9.15)
1 + R α (R) ei k·R
onde Es é a energia do nível atômico s, e
Z
2
β = − dr ∆U (r) |φ (r)| , (9.16)
Z
α (R) = dr φ∗ (r) φ (r − r) (9.17)
e Z
γ (R) = − dr φ∗ (r) ∆U (r) φ (r − R) . (9.18)

Os coeficiente (9.16) a (9.18) podem ser simplificados, recorrendo-se a


certas simetrias. Uma vez que φ é um nível s, φ (r) é real e depende so-
mente do módulo de r. Disto segue-se que α (−R) = α (R) . Isto e a simetria
de inversão da rede de Bravais, que requer que ∆U (−r) = ∆U (r) , tam-
bém implica que γ (−R) = γ (R) . Nós desprezamos os termos em α no
denominador de (9.15), pois eles dão pequenas correções ao numerador.
Uma última simplificação vem ao admitirmos que apenas as separaçoes
entre vizinhos mais próximos dão integrais de sobreposição com valores
apreciáveis.
Juntando estas observações, podemos simplificar (9.15) para
X
ε (k) = Es − β − γ (R) cos k · R (9.19)
v m p

onde a soma é apenas sobre os R na rede de Bravais que conectam a origem


aos seus vizinhos mais próximos.
Para sermos explícitos, vamos aplicar (9.19) ao cristal cúbico de face
centrada. Os 12 vizinhos mais próximos da origem (veja Figura 10.3) estão
em
a a a
R = (±1, ±1, 0) , (±1, 0, ±1) , (0, ±1, ±1) . (9.20)
2 2 2
Se k = (kx , ky , kz ) , então os 12 valores correspondentes de k · R são
a
k · R = (±ki , ±kj ) , i, j = x, y; y, z; z, x. (9.21)
2
Agora ∆U (r) = ∆U (x, y, z) tem a simetria cúbica completa da rede, e
é então inalterado por permutações de seus argumentos ou mudanças nos
seus sinais. Isto, junto com o fato de que a função de onda de nível-s φ (r)
só depende do módulo de r, implica que γ (R) é a mesma constante γ para
todos os 12 vetores (9.20). Por conseguinte, a soma em (9.19) dá, com a
ajuda de (9.21),
¡ ¢
ε (k) = Es −β−4γ cos 12 kx a cos 21 ky a + cos 21 ky a cos 21 kz a + cos 21 kz a cos 12 kx a
(9.22)
158 9. Método das Ligações Fortes

onde Z
¡ ¢
γ= dr φ∗ (x, y, z) ∆U (x, y, z) φ∗ x − 21 a, y − 21 a, z

A equação (9.22) revela o aspecto característico das bandas de energia


na aproximação de ligações fortes: a largura de banda — i.e., a separação
entre as energias mínima e máxima na banda — é proporcional ao pequeno
valor da integral de sobreposição (overlap) γ. Então, as bandas de ligações
fortes são bandas estreitas, e, quanto menor a sobreposição, mais estreita
é a banda. No limite de subreposição nula a largura da banda também
se anula, e a banda torna-se N vezes degenerada, correspondendo ao caso
extremo no qual o elétron simplesmente reside em qualquer um dos N
átomos isolados. A dependência da largura da banda com a integral de
sobreposição é ilustrada na Figura 10.4.
Além de exibir o efeito da sobreposição na largura da banda, a Eq, (9.22)
ilustra várias características gerais da estrutura de banda do um cristal
cúbico de face centrada que não são peculiares ao caso de ligações fortes.
São elas:
1. No limite de ka pequeno, (9.22) reduz-se a:
ε (k) = Es − β − 12γ + γk2 a2 . (9.23)
Isto é independente da direção de k — i.e., as superfícies de energia
constante nas proximidades de k = 0 são esféricas.10
2. Se ε é plotada na direção de qualquer linha perpendicular a uma das
faces do quadrado da primeira zona de Brillouin (Figura 10.5), ela
cruza a face quadrada com inclinação nula (Problema 1).11
3. Se ε é plotada na direção de qualquer linha perpendicular a uma
das faces hexagonais da primeira zona de Brillouin (Figura 10.5), em
geral, ela não cruza a face hexagonal com inclinação nula.

9.2 Observações Gerais sobre o Método de


Ligações fortes
1. Nos casos de interesse prático, mais de um nível atômico aparecem
na expansão (9.7), levando a uma equação secular 3 × 3 no caso dos três

1 0 Isto pode ser deduzido, de uma maneira geral, para qualquer banda não-degenerada

num cristal com simetria cúbica.


1 1 Compare o caso de elétron quase-livre (página 140), onde a taxa de variação de ε

ao longo de uma linha normal a um plano de Bragg era sempre nula, assim que o plano
era cruzado, para pontos distantes de qualquer outros planos de Bragg. O resultado do
método de ligações compactas ilustra a possibilidade mais geral que surge porque não
há nenhum plano de simetria de espelho paralelo à face hexagonal.
9.2 Observações Gerais sobre o Método de Ligações fortes 159

níveis-p, a uma equação secular 5 × 5 para os cinco níveis-d etc. A Figura


10.6, por exemplo, mostra a estrutura de banda que se origina dos cálculos
baseados no método das ligações fortes para os 5 vezes degenerados níveis-
3d no níquel. As bandas são plotadas para três direções de simetria na zona,
cada uma das quais tendo seu conjunto característico de degenerescências.12
2. Uma característica muito geral do método de ligações fortes é a
relação entre a largura de banda e as integrais de sobreposição (overlap)
Z
γ ij (R) = − dr φi (r) ∆U φj (r − R) . (9.24)

Se os γ ij são pequenos, então a largura de banda é correspondentemente


pequena. Como uma regra prática, quando a energia de um dado nível
atômico aumenta (i.e., a energia de ligação diminui), o mesmo acontece
com a extensão espacial de sua função de onda. Consequentemente, as
bandas mais baixas num sólido são muito estreitas, mas as larguras de
banda aumentam com a energia. Em metais, quanto mais elevada for a
banda (ou as bandas) mais larga ela será, pois o alcance espacial dos níveis
atômicos mais altos são comparáveis à constante de rede, e a aproximação
de ligações fortes tem sua validade questionável.
3. Embora as funções de onda das ligações fortes (9.6) sejam obtidas
de níveis atômicos localizados φ, a probabilidade de se encontrar um elétron
num nível de ligações fortes será a mesma para qualquer célula do cristal,
uma vez que sua função de onda (tal como qualquer função de onda de
Bloch) só muda pelo fator de fase eik · r quando nos movemos de uma célula
para outra separadas por uma distância R. Então, quando r varia de uma
célula para outra, sobrepõe-se à estrutura atômica dentro de cada célula
uma variação sinusoidal nas amplitudes de Re ψ e Im ψ, como ilustrado na
Figura 10.7.
Uma outra indicação de que os níveis de ligações fortes têm uma onda
com caráter viajante ou itinerante vem do teorema de que a velocidade
média de um elétron num nível de Bloch com vetor de onda k e energia
ε (k) é dada por v (k) = (1/~) ∂ε/∂k. (Veja Apêndice E.) Se ε é inde-
pendente de k, ∂ε/∂k é zero, que é consistente com o fato de que em
níveis atômicos genuinamente isolados (que conduzem à largura de banda
zero) os elétrons realmente são mantidos em átomos individuais. Porém,
se houver qualquer sobreposição não nula nas funções de onda atômicas,
então ε não será constante em toda zona. Como uma pequena variação em
ε implica num pequeno valor diferente de zero de ∂ε/∂k, e conseqüente-
mente, numa pequena, mas não nula, velocidade média, contanto que haja
qualquer sobreposição, os elétrons poderão mover-se livremente pelo cristal!
Diminuindo-se a sobreposição, reduz-se somente a velocidade; isso não elim-
ina o movimento. Pode-se imaginar este movimento como um tunelamento

1 2 As bandas calculadas são tão largas que lançam dúvidas sobre a validade de toda a

expansão. Um cálculo mais realista teria que incluir, pelo menos, o efeito dos níveis 4s.
160 9. Método das Ligações Fortes

quântico de um sítio da rede para outro. Quanto menor a sobreposição


(overlap), menor é a probabilidade de tunelamento e, conseqüentemente,
maior é o tempo que o elétron leva para percorrer uma dada distância.
4. Em sólidos que não são redes de Bravais monoatomicas, a aprox-
imação de ligações fortes é mais complicada. Este problema aparece nos
metais hexagonais com agrupamento compacto, que são hexagonais sim-
ples com uma base de dois pontos. Formalmente, pode-se tratar a base de
dois pontos como uma molécula, cujas funções de onda admite-se serem
conhecidas, e procede-se como acima, usando funções de onda moleculares,
em vez de funções de onda atômicas. Se a sobreposição de vizinhos próximos
continua pequena, então, em particular, será pequena em cada ”molécula” ,
e um nível atômico s dá lugar a dois níveis moleculares quase-degenerados.
Assim, um único nível atômico s dá origem a duas bandas de ligações fortes
para a estrutura hexagonal com agrupamento compacto.
Alternativamente, pode-se continuar construindo combinações lineares
de níveis atômicos centrados nos pontos da rede de Bravais e nos pontos
da base, generalizando-se (9.6) para
X
ψ (r) = eik · r (a φ (r − R) + b φ (r − d − R)) , (9.25)
R

(onde d é a separação entre dois átomos da base). Essencialmente, isto pode


ser visto como a primeira maneira de abordar o problema, na qual, porém,
as funções de onda moleculares aproximadas são usadas, a aproximação
para os níveis moleculares sendo combinados com a aproximação de ligações
fortes para os níveis do cristal todo.13
5. Em elementos mais pesados, o acoplamento spin-órbita é de grande
importância (veja página 146) para determinar os níveis atômicos, e, por-
tanto, deveria ser incluído no tratamento de ligações fortes do alargamento
destes níveis em bandas no sólido. Em princípio, a extensão é direta. Sim-
plesmente, inclui-se em ∆U (r) a interação entre o spin do elétron e o campo
elétrico de todos os íons, exceto daquele na origem, e incorpora-se aquela
interação no Hamiltonian atômico. Uma vez que isto é feito, já não podemos
mais usar combinações lineares de funções de onda de orbitais atômicos in-
dependentes do spin, mas tem-se que trabalhar com combinações lineares
de ambos os níveis, orbital e spin. Assim, a teoria de ligações fortes de um
nível-s, quando o acoplamento spin-órbita é apreciável, não aproximaria φ
por um único nível atômico s, mas por uma combinação linear (com os
coeficientes dependendo de k) de dois níveis com a mesma função de onda
orbital e dois spins opostos. A teoria de ligações fortes de uma banda-d
iria de um problema determinantal 5 × 5 para 10 × 10 etc. Como men-
cionamos no Capítulo 9, os efeitos do acoplamento spin-órbita, embora,
às vezes pequeno, freqüentemente pode ser bastante crucial, como quando

1 3 As ”funções de onda moleculares aproximadas” serão portanto dependentes de k.


9.2 Observações Gerais sobre o Método de Ligações fortes 161

eles eliminam degenerescências que, rigorosamente, estariam presentes se


tal acoplamento fosse ignorada.14
6. Toda a análise de níveis eletrônicos em um potencial periódico
neste capítulo (e nos dois precedentes) foi feita dentro da aproximação de
elétron independente, que, ou ignora a interação entre elétrons, ou, no máx-
imo, a inclui de algum maneira através de um potencial periódico efetivo
experimentado por cada elétron. Veremos no Capítulo 32 que a aproxi-
mação de elétron independente pode falhar quando ela dá pelo menos uma
banda parcialmente cheia, que deriva de níveis atômicos bem localizados
com pequenas integrais de sobreposição. Em muitos casos de interesse (no-
tadamente, em isolantes e para as bandas muito baixas em metais) este
problema não aparece, uma vez que as bandas de ligações fortes são tão
baixas em energia que são completamente cheias. Porém, a possibilidade
de um tal fracasso da aproximação de elétron independente deve ser lem-
brada quando a bandas estreitas de ligações fortes são derivadas de ca-
mada atômicas parcialmente cheias — em metais, geralmente as camadas d
e f. Deveria-se estar, particularmente, atento desta possibilidade em sólidos
com uma estrutura magnética.
Esta falha da aproximação de elétron independente obscurece a imagem
simples que a aproximação de ligações forte sugere: o de uma transição
contínua do estado metálico ao estado atômico, quando a distância in-
teratômica é aumentada continuamente.15 Se olhamos a aproximação de
ligações fortes, então quando a constante de rede em um metal aumenta, a
sobreposição entre todos os níveis atômicos tornam-se, eventualmente, pe-
quenos, e todas as bandas – até mesmo a banda (ou bandas) de condução
parcialmente cheia – se tornariam bandas estreitas de ligações fortes. Es-
treitando a banda de condução, a velocidade dos elétrons diminuiria e a
condutividade do metal baixaria. Então, esperaríamos que a condutividade
fosse diminuindo continuamente para zero, proporcionalmente às integrais
de sobreposição, à medida que o metal for se expandido.
Porém, é provável que um cálculo mais completo, que vá além da aprox-
imação de elétron independente, prediga que, além de um certo valor da
separação entre os vizinhos mais próximos, a condutividade caisse abrup-
tamente para zero, tornando o material um isolante (a chamada transição
de Mott).
A razão para este desvio da predição do método de ligações fortes está na
inabilidade da aproximação de elétron independente para tratar a repulsão
adicional muito forte que um segundo elétron sente num determinado sítio
atômico, quando outro elétron já está ali. Comentaremos isto mais adiante

1 4 A inclusão do acoplamento spin-órbita no método de ligações compactas é descrita

por J. Friedel, P. Lenghart, and G. Leman, J. Phys. Chem. Solids 25, 781 (1964).
1 5 Um procedimento difícil para se realizar no laboratório, mas muito tentador para

visualizar teoricamente, como uma ajuda para entender a natureza das bandas de ener-
gia.
162 9. Método das Ligações Fortes

no Capítulo 32, mas mencionamos o problema aqui porque às vezes é de-


scrito como uma falha do método das ligações fortes.16 Isto é ilusório, pois
a aproximação de ligações fortes para o modelo de elétron independente
é a melhor aproximação do modelo; a falha é da própria aproximação de
elétron independente.

9.3 Funções de Wannier


Concluímos este capítulo com uma demonstração de que a funções de Bloch
para qualquer banda sempre pode ser escrito na forma (9.4), na qual a
aproximação de ligações fortes é baseada. As funções φ que representam o
papel das funções de onda atômicas são conhecidas como funções de Wan-
nier. Tais funções de Wannier podem ser definidas para qualquer banda, in-
dependente se ela é ou não bem descrita pela aproximação de ligações fortes;
mas, se a banda não é uma banda de ligações fortes estreita, as funções de
Wannier guardarão pouca semelhança com quaisquer das funções de onda
eletrônicas para o átomo isolado.
Para estabelecer que qualquer Bloch funcionam ψ nk (r) pode ser escrita
na forma (9.4), notamos primeiro que, considerada como uma função de
k para r fixo, ψ nk (r) é periódica na rede recíproca. Portanto, tem uma
expansão em série de Fourier em ondas planas com vetores de onda na
recíproca da rede recíproca, i.e., na rede direta. Assim, para qualquer r
fixo, podemos escrever
X
ψ nk (r) = fn (R, r) ei R · k , (9.26)
R

onde os coeficientes na soma dependem tanto de r como dos ”vetores de


onda” R, pois para cada r é uma função diferente de k que está sendo
expandida.
Os coeficientes de Fourier em (9.26) são dados pela fórmula de inversão17
Z
1
fn (R, r) = dk e−iR·k ψ nk (r) (9.27)
v0

A Equação (9.26) é da forma (9.4), desde que a função fn (R, r) só de-


penda de r e R através de sua diferença r − R. Mas se r e R são ambos
deslocados pelo vetor R0 da rede Bravais, então f fica inalterado como

1 6 Veja, por exemplo, H. Jones, The Theory of Brillouin Zone and Electrons States in

Crystals, North-Holland, Amsterdam, 1960, pág. 229.


1 7 Aqui v é o vulume no espaço-k da primeira zona de Brillouin, e a integral é sobre a
0
zona. As Equações (9.26) e (9.27) (com r considerado um parâmetro fixo) são justamente
as Eqs. (D.1) e (D.2) do Apêndice D, com os espaços direto e recíproco permutados.
9.3 Funções de Wannier 163

uma conseqüência direta de (9.27) e do teorema de Bloch, na forma (7.5).


Assim fn (R, r) tem a forma

fn (R, r) = φn (r − R) (9.28)

Diferente das funções atômicas de ligações fortes φ (r), as funções de Wan-


nier φn (r − R) em sítios diferentes (ou com índices de banda diferentes)
são ortogonais (veja Problema 3, Eq. (9.34)). Como o conjunto completo de
funções de Bloch pode ser escrito como combinações lineares das funções
de Wannier, as funções Wannier φn (r − R) para todo n e R forma um
conjunto completo ortogonal. Essas funções oferecem uma base alterna-
tiva para uma descrição exata dos níveis de elétron independente em um
potencial cristalino.
A semelhança formal da função de Wannier com a função de ligações
fortes cria a expectativa de que as funções de Wannier também serão local-
izadas — i.e, quando r é muito maior do que algum comprimento na escala
atômica, φn (r) será extremamente pequena. Para a extensão que isto pode
ser estabelecido, a função de Wannier oferece uma ferramenta ideal por dis-
cutir fenômenos no qual a localização espacial dos elétrons tem um papel
importante. Talvez as áreas mais importantes de aplicação são estas:

1. Tentativas para derivar uma teoria de transporte para elétrons de


Bloch. A analogia de pacotes de onda de elétron livres, níveis eletrôni-
cos num cristal, que são localizados em r e k, são construídos conve-
nientemente com o uso de funções de Wannier. A teoria das funções
de Wannier é proximamente relacionada à teoria de quando e como
a teoria de semiclassical de transporte através de elétrons de Bloch
(Capítulo 12 e 13) falha.
2. Fenômenos envolvendo níveis eletrônicos localizados, devido, por ex-
emplo, a impurezas atrativas que ligam um elétron. Um exemplo
muito importante é a teoria de níveis doador e aceitador em semi-
condutores (Capítulo 28).
3. Fenômenos magnéticos, nos quais os momentos magnéticos localiza-
dos existem nos sítios de impurezas.

As discussões teóricas do alcance das funções de Wannier são em geral


muito sutil.18 Grosso modo, o alcance das funções de Wannier diminui com
o aumento do gap da banda (como se pode esperar da aproximação de
ligações fortes, na qual as bandas tornam-se mais estreitas à medida que
o alcance das funções de onda atômicas diminui). Os vários fenômenos

1 8 Um argumento relativamente simples, mas apenas em uma dimensão, é dado por

W. Kohn, Phys. Rev. 115, 809 (1959). Uma discussão mais geral pode ser encontrada
em E. I. Blount, Solid State Physics, Vol. 13, Academic Press, New York, 1962, pág.
305.
164 9. Método das Ligações Fortes

de ”breakdown”e ”breakthrough” que mencionaremos no Capítulo 12 que


ocorrem quando o gap da banda é pequeno, encontram sua reflexão no
fato de que as teorias baseadas na localização da função de Wannier ficam
menos confiáveis neste limite.

9.4 Problemas
1. (a) Mostre que ao longo das direções de simetria principais mostradas
na Figura 10.5 a expressão de ligações fortes para a energia (9.22)
de uma banda-s num cristal cúbico de face centrada reduz-se às
seguintes:
i. Ao longo de ΓX (ky = kz = 0, kx = µ2π/a, 0 ≤ µ ≤ 1)

ε = Es − β − 4γ (1 + 2 cos µπ)
¡ 1
¢
ii. Ao longo de ΓL kx = ky = kz = µ2π/a, 0 ≤ µ ≤ 2

ε = Es − β − 12γ cos2 µπ
¡ 1
¢
iii. Ao longo de ΓK kz = 0, kx = ky = µ2π/a, 0 ≤ µ ≤ 2
¡ ¢
ε = Es − β − 4γ cos2 µπ + 2 cos µπ
¡ ¢
iv. Ao longo de ΓW kx = 0, ky = µ2π/a, kz = 21 µ2π/a, 0 ≤ µ ≤ 1
¡ ¢
ε = Es − β − 4γ cos µπ + cos 21 µπ + cos µπ cos 12 µπ

v. Mostre que, sobre as faces quadradas da zona, a derivada


normal de ε se anula.
vi. Mostre que, sobre as faces hexagonais da zona, a derivada
normal de ε se anula somente ao longo das linhas ligando o
centro do hexágono a seus vértice.

2. Bandas-p de ligações fortes em cristais cúbicos


Lidando com cristais cúbicos, as combinações lineares mais conve-
nientes dos três níveis atômicos p degenerados têm a forma x φ (r) ,
y φ (r) e z φ (r), onde as funções φ só dependem do módulo do ve-
tor r. As energias das três correspondentes bandas-p de (9.12) são
encontradas, fazendo-se zero o determinante
¯ ¯
¯(ε (k) − Ep ) δ ij + β ij + γ̄ ij (k)¯ = 0 (9.29)
9.4 Problemas 165

onde
X
γ̄ ij (k) = eik · r γ ij (R) ,
R
Z
γ ij (R) = − dr ψ ∗i (r) ψ j (r − R) ∆U (r) ,

β ij = γ ij (R = 0) . (9.30)
(Omitiu-se em (9.29) um termo multiplicando ε (k) − Ep que dá
origem a correções muito pequenas, análogas àquelas dadas pelo de-
nominador de (9.15) no caso da banda-s.)
(a) Como uma consequência da simetria cúbica, mostre que
β xx = β yy = β zz = β

β xy = 0 (9.31)
(b) Admitindo que γ ij (R) sejam desprezíveis, exceto para vizinhos
mais próximos R, mostre que γ̄ ij (k) é diagonal para uma rede
de Bravais cúbica simples, tal que xφ (r), yφ (r) e zφ (r) gera,
cada uma, bandas independentes. (Note que isto deixa de ser o
caso se os γ ij (R) para os próximos vizinhos mais próximos R
são também considerados na expressão.)
(c) Mostre que, para uma rede de Bravais cúbica de face centrada,
com apenas os γ ij correspondentes a vizinhos mais próximos
apreciáveis, as bandas de energia são dadas pelas raízes de
¯ ¯
¯ ε (k) − ε0 (k) + 1 1 1 1
¯
¯ −4γ 1 sen 2 kx a sen 2 ky a −4γ 1 sen 2 kx a sen 2 kz a ¯¯
¯ 4γ 0 cos 1 ky a cos 1 kz a
¯ 2 2 ¯
¯
¯ 1 1 ε (k) − ε0 (k) + 1 1
¯
0 = ¯ −4γ 1 sen 2 ky a sen 2 kx a 1 1 −4γ 1 sen 2 ky a sen 2 kz a ¯¯
¯ 4γ 0 cos 2 kz a cos 2 kx a ¯
¯
¯ −4γ 1 sen 1 kz a sen 1 kx a −4γ 1 sen 1 kz a sen 1 ky a ε (k) − ε0 (k) + ¯
¯
¯ 1 1
2 2 2 2 4γ 0 cos 2 kx a cos 2 ky a ¯
(9.32)
onde
¡ ¢
ε0 (k) = Ep − β − 4γ 2 cos 21 kx a cos 21 kz a + cos 12 kx a cos 21 ky a + cos 21 ky a cos 12 kz a
Z µh ¶
£ 2 ¡ 1
¢¤ 2
¡ 1
¢2 ¡ 1
¢2 i1/2
γ0 = − dr x − y y − 2 a φ (r) φ x + y − 2 a + z − 2 a ∆U (r) ,
Z µh i1/2 ¶
¡ 1
¢¡ 1
¢ ¡ 1
¢2 ¡ 1
¢2 2
γ1 = − dr x − 2 a y − 2 a φ (r) φ x − 2a + y − 2a + z ∆U (r) ,
Z µh i1/2 ¶
¡ ¢ ¡ ¢2 ¡ ¢2
γ2 = − dr x x − 21 a φ (r) φ x − 21 a + y − 21 a + z 2 ∆U (r) (9.33)
166 9. Método das Ligações Fortes

(d) Mostre que todas as três bandas são degeneradas em k = 0 e


que, quando k está na direção, ou do eixo do cubo (ΓX), ou de
uma diagonal do cubo (ΓL), existe uma dupla degenerescência.
Esboce as bandas de energia (em analogia com a Figura 10.6)
ao longo dessas direções.

3. Prove que as funções de Wannier centradas em diferentes sítios da


rede são ortogonais,
Z
¡ ¢
φ∗n (r − R) φn0 r − R0 dr ∝ δ n,n0 δ R,R0 , (9.34)

recorrendo à ortonormalidade das funções de Bloch e à identidade


(F.4) do Apêndice F. Mostre também que
Z
dr |φn (r)|2 = 1 (9.35)

se a integral de |ψ nk (r)|2 sobre uma célula primitiva for normalizada


a unidade.

Você também pode gostar