Você está na página 1de 280

Sumário

Séries de Funções de Duas (ou mais) Variáveis ............................................................... 9


Série Dupla ................................................................................................................... 9
Produtos Infinitos ......................................................................................................... 9
Somabilidade ................................................................................................................ 9
Série Assintótica ......................................................................................................... 10
Integrais Impróprias Contendo um Parâmetro de Convergência Uniforme ................... 10
Critérios Especiais para Convergência Uniforme das Integrais ................................. 10
O Operador Linear .......................................................................................................... 12
Função Zeta de Riemann ................................................................................................ 12
Hipótese de Riemann .................................................................................................. 13
Riemann e Números Primos ....................................................................................... 13
Teorema dos Números Primos ................................................................................... 14
Transformada de Laplace ............................................................................................... 15
Propriedades da Transformada de Laplace ................................................................. 16
Calculando Erros ........................................................................................................ 17
Operações ................................................................................................................... 18
Transformada de Fourier ................................................................................................ 19
A Série de Fourier ...................................................................................................... 24
Transformadas Gerais ................................................................................................. 26
Desenvolvimento dos Coeficiente de Fourier ............................................................ 27
Exercícios Resolvidos ................................................................................................ 29
Equações Diferenciais .................................................................................................... 33
O que são equações diferenciais ................................................................................. 35
Interpretação Geométrica de Equações Diferenciais .................................................. 37
Equações Diferenciais Exatas de 1ª Ordem ................................................................ 37
Fator Integrante....................................................................................................... 39
Variáveis Separáveis............................................................................................... 39
Equações Diferenciais Homogêneas .......................................................................... 40
Problema do Valor Inicial ...................................................................................... 42
Equações Diferenciais Lineares.................................................................................. 42
Equações Diferenciais Lineares de Primeira Ordem .............................................. 43
Equação Linear Homogênea ................................................................................... 44
Equações Diferenciais Homogêneas de Primeira Ordem ........................................... 44
Um Fator Integrante................................................................................................ 45
Trajetórias Ortogonais ............................................................................................ 45

1
Equações Redutíveis às Equações de Primeira Ordem .......................................... 46
Equações Diferenciais Lineares com Coeficientes Constantes .................................. 46
Dependência Linear ................................................................................................ 48
Raízes Reais Distintas ............................................................................................ 48
Raízes Reais Múltiplas ........................................................................................... 48
Raízes Complexas .................................................................................................. 49
Equação de Euler .................................................................................................... 49
Equação de Bernoulli.............................................................................................. 50
Equações Diferenciais Não Homogêneas ................................................................... 50
Equações Diferenciais Lineares de Ordem n ............................................................. 51
Existência de Soluções para uma Equação Diferencial .............................................. 52
Teorema da Existência e Unicidade (T.E.U) .......................................................... 53
Fator Integrante....................................................................................................... 53
Método dos Coeficientes Indeterminados .............................................................. 54
Método da Variação dos Parâmetros ...................................................................... 56
O Operador Linear L(y) .......................................................................................... 57
Princípio da Superposição ...................................................................................... 57
Dependência Linear de Soluções ............................................................................ 57
Sistemas de Equações Diferenciais Lineares.............................................................. 60
Sistema Fundamental de Soluções ......................................................................... 61
Sistemas Lineares com Coeficientes Constantes .................................................... 61
Soluções em Séries de Potências ................................................................................ 64
Transformada de Laplace para Equações Diferenciais............................................... 66
Métodos Numéricos para Equações Diferenciais ....................................................... 67
Exercícios de Equações Diferenciais .......................................................................... 68
Geometria Diferencial ................................................................................................ 76
Equações Diferenciais Estocásticas ............................................................................ 77
Equações de Diferença ................................................................................................... 78
Equação de Diferença Homogênea............................................................................. 79
Equação de Diferença de Primeira Ordem ................................................................. 79
Equação de Diferença de Segunda Ordem ................................................................. 81
Álgebra Abstrata ............................................................................................................. 82
Congruência ................................................................................................................ 82
O Inverso Multiplicativo ........................................................................................ 84
Propriedades de Congruência ................................................................................. 86
Resumo Ilustrativo .................................................................................................. 87
Classes de Equivalência.......................................................................................... 87

2
Congruência Linear .................................................................................................... 88
Método de Transformação de Coeficientes (nível de diofantina) .......................... 91
Método do Algoritmo de Euclides (Algoritmo da Divisão) ................................... 92
Conjuntos .................................................................................................................... 94
Funções ....................................................................................................................... 94
Relações de Equivalência ........................................................................................... 95
Partições ................................................................................................................. 95
Ordem ......................................................................................................................... 98
O Método da Repetição dos Quadrados ..................................................................... 99
Simetria..................................................................................................................... 100
Ordem de Simetria Rotacional ............................................................................. 100
Simetria de Reflexão ............................................................................................ 102
Simetria de Translação ......................................................................................... 102
Simetrias no Triângulo ......................................................................................... 103
Propriedades da Simetria ...................................................................................... 105
Tipos de Simetrias ................................................................................................ 105
Grupos ...................................................................................................................... 106
Reforçando a Definição ........................................................................................ 108
Grupo Abeliano .................................................................................................... 108
Tabela de Cayley .................................................................................................. 109
Características de um Grupo................................................................................. 110
Ordem de um Grupo ............................................................................................. 111
Grupos de Ordem 2 ....................................................................................................... 111
Grupos de Ordem 3 ....................................................................................................... 111
Grupos de Ordem 4 ....................................................................................................... 112
Grupos Finitos e Infinitos .............................................................................................. 112
Grupos e Subconjuntos ......................................................................................... 112
Grupo de Permutações .......................................................................................... 114
Notação Cíclica .............................................................................................................. 114
Ordem da Composição .................................................................................................. 120
Resumo dos Cálculos na Notação Cíclica ...................................................................... 121
Transposições ................................................................................................................ 123
Simetrias ........................................................................................................................ 127
Definições ...................................................................................................................... 128
Permutação Identidade ............................................................................................. 128
Permutação Inversa .................................................................................................. 128
Órbita de um Ciclo ..................................................................................................... 130

3
Comprimento de um Ciclo ........................................................................................ 130
Ordem de uma Permutação ...................................................................................... 130
Grau de uma Permutação ......................................................................................... 130
Subgrupos ............................................................................................................. 131
Cosets ................................................................................................................... 133
Teorema de Lagrange .................................................................................................... 138
Grupos Normais .................................................................................................... 140
Grupos Triviais ..................................................................................................... 140
Grupos Simples .................................................................................................... 140
Subgrupos Normais .............................................................................................. 140
Grupo Quociente ou Grupo Fator ......................................................................... 141
Redefinindo Grupo Simples........................................................................................... 143
Grupos Cíclicos .................................................................................................... 144
Grupos Multiplicativos de Números Complexos ................................................. 147
O Grupo Cíclico e as Raízes da Unidade ............................................................. 147
Função φ de Euler ................................................................................................. 148
Isomorfismo .......................................................................................................... 149
Produtos Diretos ................................................................................................... 151
Produto Interno Direto .......................................................................................... 152
Homomorfismo..................................................................................................... 153
Grupos Matriciais ................................................................................................. 154
O Grupo Ortogonal ............................................................................................... 155
Grupos Wallpaper (Papel de Parede).................................................................... 157
Lattices .......................................................................................................................... 158
Subgrupos Simples ............................................................................................... 159
Classificação dos Grupos Finitos ......................................................................... 159
Como Categorizar os Grupos Finitos ............................................................................. 160
Grupos de Lie ....................................................................................................... 161
Grupos Alternantes ............................................................................................... 161
Grupos Esporádicos .............................................................................................. 162
O Monster Group .................................................................................................. 162
Ações de Grupos ................................................................................................... 164
A Equação de Classe ............................................................................................ 165
Teorema da Contagem de Burnside ..................................................................... 166
Aplicação - Funções de Comutação............................................................................... 168
Teoremas de Sylow .............................................................................................. 171
Subgrupos Não Simples ....................................................................................... 172

4
Anéis ......................................................................................................................... 173
Anel Comutativo .................................................................................................. 173
Unidade em Anéis ................................................................................................ 173
Anel Divisão ......................................................................................................... 174
Divisor Nulo ................................................................................................................... 174
Anéis em Congruências ........................................................................................ 175
Anéis Inteiros................................................................................................................. 175
Subanéis ................................................................................................................ 176
Características de um Anel ................................................................................... 176
Homomorfismo em Anéis .................................................................................... 176
Ideal de um Anel................................................................................................... 177
Anéis de Polinômios ............................................................................................. 178
Polinômios Irredutíveis ................................................................................................. 180
Estruturas em Rede (Lattice) ................................................................................ 181
Lattices – Conjuntos Parcialmente Ordenados ............................................................. 181
Domínios Integrais ................................................................................................... 182
Álgebra Booleana ..................................................................................................... 183
Álgebras Booleanas Finitas .................................................................................. 184
Espaços Vetoriais – Parte 2 ...................................................................................... 185
Subespaços ........................................................................................................... 186
Independência Linear ........................................................................................... 186
Campos ..................................................................................................................... 188
Campos Estendidos .............................................................................................. 189
Teorema Fundamental dos Campos (TFC – Kronecker) ................................................ 189
Elementos Algébricos .................................................................................................... 189
Fechamento Algébrico .................................................................................................. 191
Teorema Fundamental da Álgebra (Gauss) .......................................................... 191
Campos de Separação (Splitting Fields) ............................................................... 191
Campos Finitos ..................................................................................................... 192
Teoria de Galois........................................................................................................ 193
Automorfismo de Campos .................................................................................... 194
Teorema Fundamental da Teoria de Galois .......................................................... 195
Teorema Fundamental de Galois .......................................................................... 196
Resumo – Grupos, Campos, Anéis, Domínios Integrais .......................................... 197
Grupo .................................................................................................................... 199
Grupo Abeliano .................................................................................................... 199
Anel ...................................................................................................................... 199

5
Domínio Integral .................................................................................................. 199
Campo................................................................................................................... 199
Anel Ordenado e Campo Ordenado...................................................................... 200
Campo Completamente Ordenado........................................................................ 200
Campo Algebricamente Fechado ......................................................................... 200
Aplicações da Teoria de Grupos ............................................................................... 201
Criptografia........................................................................................................... 201
Teoria da Codificação Algébrica .......................................................................... 204
Covetores ...................................................................................................................... 205
Propriedades dos Covetores ..................................................................................... 205
Visualizando Covetores ............................................................................................ 206
Operações em Covetores .......................................................................................... 209
Variação (Scaling) ................................................................................................ 209
Adição ................................................................................................................... 211
Análise Complexa ........................................................................................................ 214
Revisão e Conceitos ................................................................................................. 214
Discos e Conjuntos ............................................................................................... 215
Conectividade ....................................................................................................... 217
Funções Complexas .................................................................................................. 218
Equação de Cauchy-Riemann............................................................................... 219
Funções Complexas Compostas ........................................................................... 219
Polinômios Complexos ......................................................................................... 219
Limites de Funções Complexas ................................................................................ 220
Continuidade em Funções Complexas ..................................................................... 222
Diferenciação e Holomorficidade em Funções Complexas ..................................... 223
Funções Complexas Constantes ............................................................................... 225
Funções Polinomiais ................................................................................................. 225
Transformações de Möbius ...................................................................................... 226
Infinito e Razão Cruzada .......................................................................................... 227
Projeção Estereográfica ............................................................................................ 228
Funções Exponenciais Complexas ........................................................................... 229
Funções Trigonométricas Complexas ...................................................................... 230
Funções Hiperbólicas Complexas ............................................................................ 231
Funções Logarítmicas Complexas ............................................................................ 231
Integrais de Funções Complexas .............................................................................. 233
Antiderivada ......................................................................................................... 234
Sequências Complexas ............................................................................................. 236

6
Séries Complexas ..................................................................................................... 236
Regiões de Convergência ..................................................................................... 237
Séries de Taylor e Laurent .................................................................................... 237
Álgebra Geométrica...................................................................................................... 238
Bivetores ................................................................................................................... 238
Multiplicação Escalar de Bivetores ...................................................................... 239
Adição de Bivetores.............................................................................................. 239
Bases Bivetoriais .................................................................................................. 240
Multiplicação de Bivetores ................................................................................... 240
Produto Exterior ....................................................................................................... 240
Comparando Produto Externo e Produto Exterior................................................ 242
Formas-N ....................................................................................................................... 245
Propriedades do Produto Exterior ........................................................................ 246
Fechamento no Plano ............................................................................................... 247
Produto Geométrico .................................................................................................. 248
Produto Geométrico de Vetores Base ................................................................... 250
Álgebra Geométrica em 2D ...................................................................................... 253
Álgebra Geométrica em 3D ...................................................................................... 257
Números Complexos em 3D..................................................................................... 260
Introdução à Teoria dos Grafos .................................................................................... 261
Grafo Direcionado .................................................................................................... 261
Multigrafo ................................................................................................................. 261
Loops ........................................................................................................................ 261
Ordem de um Grafo .................................................................................................. 261
Exemplos de Grafos ................................................................................................. 262
Tamanho de um Grafo .............................................................................................. 262
Grau de um Vértice................................................................................................... 262
Relação de Adjacência.............................................................................................. 263
Matriz de Adjacência ................................................................................................ 264
Matriz de Incidência ................................................................................................. 264
Grafos e Outras Estruturas ........................................................................................ 264
Número de Ramsey .................................................................................................. 265
Propriedades ......................................................................................................... 266
Grafos na Vida Real ................................................................................................. 266
Grafos e Matrizes...................................................................................................... 267
Brincando com Números .............................................................................................. 269
Operando Com Formas ............................................................................................. 269

7
Derivada ou Derivação? ........................................................................................... 272
Função Derivada ou Taxa de Variação? ............................................................... 272
Integração Numérica................................................................................................. 275
O Pulo Complexo ..................................................................................................... 276
Coordenadas e Rotações ....................................................................................... 278
Números Complexos e R2 .................................................................................... 279
Conclusão ............................................................................................................. 280

8
VOLUME 5

Séries de Funções de Duas (ou mais) Variáveis


Tais como ∑+∞
𝑛=0 𝑈𝑛 (𝑥, 𝑦) podem ser tratadas de maneira análoga à das séries de uma
variável. Em particular, discute-se a série em x e y:

𝑎00 + (𝑎10 𝑥 + 𝑎01 𝑦) + (𝑎20 𝑥 2 + 𝑎11 𝑥𝑦 + 𝑎02 𝑦 2 ) + ⋯

usando-se índices duplos para as constantes.

Série Dupla

Consideremos o quadro de números (ou funções):

𝑈11 𝑈12 𝑈13 …


𝑈
( 21 𝑈22 𝑈23 …)
𝑈31 𝑈 𝑈33 …
… 32
… …

Seja 𝑆𝑚𝑛 = ∑𝑚 𝑛
𝑝=1 ∑𝑞=1 𝑈𝑝𝑞 a soma dos números nas m primeiras linhas e nas n
Lim 𝑆𝑚𝑛 = 𝑆, diremos que a série
primeiras colunas. Se existir um número S tal que 𝑚→+∞
𝑛→+∞
dupla ∑+∞ +∞
𝑝=1 ∑𝑞=1 𝑈𝑝𝑞 converge para a soma S; caso contrário, diverge.

Produtos Infinitos

Seja Pn = (1 + U1)(1 + U2)(1 + U3)...(1 + Un) representado por ∏𝑛𝑘=1(1 + 𝑈𝑘 ) onde


supomos Uk ≠ -1. Se existir um número P ≠ 0 tal que Lim 𝑃𝑛 = 𝑃, diremos que o
𝑛→+∞
produto infinito ∏(1 + 𝑈𝑘 ) converge para P; caso contrário, diverge.

Somabilidade

Sejam S1, S2, S3, ... as somas parciais de uma série divergente ∑ 𝑈𝑛 . Se a sucessão dada
por
𝑆1 + 𝑆2 𝑆1 + 𝑆2 + 𝑆3
𝑆1 , , ,…
2 3

que é formada com as médias aritméticas dos n primeiros termos de S1, S2, S3,...
convergir para S, diremos que a série ∑ 𝑈𝑛 é somável no sentido de Cesaro.

9
Série Assintótica

Consideremos a série
𝑎1 𝑎2 𝑎𝑛
𝑆(𝑥) = 𝑎0 + + 2 + ⋯+ 𝑛 + ⋯ (1)
𝑥 𝑥 𝑥
e suponhamos que
𝑎1 𝑎2 𝑎𝑛
𝑆𝑛 (𝑥) = 𝑎0 + + 2 + ⋯ + 𝑛 , 𝑛 = 1 → +∞
𝑥 𝑥 𝑥

representa as somas parciais desta série.


Se Rn(x) = f(x) – Sn(x), onde f(x) é dado tal que para cada n, Lim 𝑥 𝑛 𝑅𝑛 (𝑥) = 0, então
|𝑥|→∞
denominamos S(x) de desenvolvimento assintótico de f(x), que designamos pela
notação f(x) ~ S(x). Na prática, a série (1) diverge. Contudo, tomando a soma dos
termos sucessivos da série e parando no momento em que a série começa a crescer,
obteremos uma boa aproximação para f(x).

Integrais Impróprias Contendo um Parâmetro de Convergência


Uniforme
Seja
+∞
∅(𝛼) = ∫ 𝑓(𝑥, 𝛼)𝑑𝑥
𝑎

Esta integral é análoga a uma série de funções. Denominamos esta integral de


uniformemente convergente em [α1, α2] se, para cada ϵ > 0, achamos um número N,
dependendo de ϵ, mas, não de α, tal que

𝑢
|∅(𝛼) − ∫ 𝑓(𝑥, 𝛼)𝑑𝑥| < 𝜖
𝑎

para todo u > N e todo α em [α1, α2].

Critérios Especiais para Convergência Uniforme das Integrais

1) Critérios M de Wierstrass: Se pudermos achar uma função M(x) ≥ 0, tal que


a. |f(x, α)| ≤ M(x), α1 ≤ α ≤ α2, x > a.
+∞ +∞
b. ∫𝑎 𝑀(𝑥)𝑑𝑥 converge, então ∫𝑎 𝑓(𝑥, 𝛼)𝑑𝑥 é uniforme e
absolutamente convergente em α1 ≤ α ≤ α2.
2) Critério de Dirichlet: Suponhamos que
a. T(x) é uma função monótona decrescente e positiva que tende para
zero quando x tende para mais infinito.

10
𝑢
b. |∫𝑎 𝑓(𝑥, 𝛼)𝑑𝑥| < 𝑃 para todo u > a e α1 ≤ α ≤ α2.
+∞
Então, a integral ∫𝑎 𝑓(𝑥, 𝛼)𝑇(𝑥)𝑑𝑥 é uniformemente convergente
para α1 ≤ α ≤ α2.

+∞
Teorema: Se f(x, α) é contínua para x ≥ a e α1 ≤ α ≤ α2, e se ∫𝑎 𝑓(𝑥, 𝛼)𝑑𝑥 é
+∞
uniformemente convergente para α1 ≤ α ≤ α2, então ∅(𝛼) = ∫𝑎 𝑓(𝑥, 𝛼)𝑑𝑥
é contínua
em α1 ≤ α ≤ α2. Em particular, se α0 é um ponto de α1 ≤ α ≤ α2, podemos escrever:

+∞ +∞
Lim ∅(𝛼) = Lim ∫ 𝑓(𝑥, 𝛼)𝑑𝑥 = ∫ Lim 𝑓(𝑥, 𝛼)𝑑𝑥
𝛼→𝛼0 𝑥→𝛼0 𝑎 𝑎 𝛼→𝛼0

Se α0 é um dos pontos extremos, usamos os limites à direita ou à esquerda.

Teorema: Com as condições acima, podemos integrar Ø(x) em relação a α, de α1 a α2


para obter:

𝛼2 𝛼2 +∞ +∞ 𝛼2
∫ ∅(𝛼)𝑑𝛼 = ∫ {∫ 𝑓(𝑥, 𝛼)𝑑𝑥} 𝑑𝛼 = ∫ {∫ 𝑓(𝑥, 𝛼)𝑑𝛼 } 𝑑𝑥
𝛼1 𝛼1 a a 𝛼1

Teorema: Se f(x, α) é contínua e admite derivada parcial contínua em relação a α, para


+∞ 𝜕𝑓
x ≥ a e α1 ≤ α ≤ α2, e se ∫a 𝑑𝑥 converge uniformemente em α1 ≤ α ≤ α2, então, se a
𝜕𝛼
não depende de α:
+∞
𝑑∅ 𝜕𝑓
=∫ 𝑑𝑥
𝑑𝛼 a 𝜕𝛼

11
O Operador Linear
Os seguintes símbolos são operadores

𝑏
𝑑 𝜕
, ∫ 𝑑𝑥 , ∫ 𝑑𝑥 ,
𝑑𝑥 𝑎 𝜕𝑡

Normalmente, usa-se a letra L para representar um operador.

Um operador é uma função que aceita outra função como argumento, em vez de um
número, como uma função comum. Por exemplo, se o argumento é a função u(x),
temos:
𝑏
𝑑𝑢 𝜕𝑢
𝐿(𝑢) = , 𝐿(𝑢) = ∫ 𝑢(𝑥)𝑑𝑥 , 𝐿(𝑢) = ∫ 𝑢(𝑥)𝑑𝑥 , 𝐿(𝑢) =
𝑑𝑥 𝑎 𝜕𝑡

Um operador linear é um operador que satisfaz a seguinte condição:

𝑳(𝒄𝟏 𝒖𝟏 + 𝒄𝟐 𝒖𝟐 ) = 𝒄𝟏 𝑳(𝒖𝟏 ) + 𝒄𝟐 𝑳(𝒖𝟐 )

Função Zeta de Riemann


Seja a seguinte série harmônica

+∞
1 1 1
∑ 𝑝
= 𝑝+ 𝑝+⋯
𝑛 1 2
𝑛=1

A função zeta de Riemann é dada por

+∞
1 1 1 1
𝜁(𝑧) = ∑ 𝑧
= 𝑧+ 𝑧+ 𝑧+⋯
𝑛 1 2 3
𝑛=1

onde z é um número complexo da forma a + ib.


Se z é um número real maior que 1, temos a Função Zeta de Euler.
Euler provou que
𝜋2
𝜁(2) =
6
E mostrou que
∞ ∝
1 1
𝜁(𝑠) = ∑ 𝑠 = ∏
𝑛 1 − 𝑝𝑠
𝑛=1 𝑝

12
Onde p percorre todo o conjunto dos números primos.

Os pontos na função zeta de Riemann em que ζ(z) = 0 são chamados de zeros da


função zeta. Riemann provou que todos os inteiros pares negativos são raízes da
função zeta, ou seja, são zeros da função, chamados de zeros triviais.

Hipótese de Riemann

Riemann fez diversos testes e concluiu que todas as soluções não triviais (zeros não
triviais) pertencem à linha real x = 1/2 do plano complexo, ou seja, são números
complexos da forma
1
𝑧= + 𝒊𝑏
2
Riemann e Números Primos

Riemann hipotetizou que o espaçamento entre os números primos decorre


logicamente dos zeros não triviais da função zeta.
A adição desses valores até uma determinada quantidade deles dá a quantidade de
números primos que existem até ali. Porém, isso só vale para aqueles números
complexos como z, acima, em que a = 1/2.
A figura a seguir mostra o plano complexo e a reta x = 1/2 onde caem os zeros não
triviais, chamada de linha crítica. O intervalo (0, 1) é onde se localizam as soluções para
a função zeta.

Todos os valores até hoje computados (10 trilhões deles) caem sobre a linha crítica,
mas, ainda não foi provado que TODOS os zeros não triviais da função zeta caem sobre
esta reta. Este é um problema em aberto, parecido com o de provar que o conjunto
dos números perfeitos é finito ou infinito.

13
Teorema dos Números Primos

Seja π(x) uma função que retorna a quantidade de números primos existentes entre 2
e x. Então, π(x) é, assintoticamente, equivalente a uma função definida:

𝑥
𝜋(𝑥) ≅
ln(𝑥)

Para x muito grande, a curva da sequência de números primos se aproxima bastante


do formato da curva da função x/ln(x). Por isso o assintoticamente.

A função π(x) procura mostrar a distribuição probabilística dos números primos. Por
exemplo, você pode determinar, facilmente, que π(10) = 4.
A fórmula a seguir dá uma aproximação melhor.

𝑥
𝜋(𝑥) ≅
ln(𝑥) − 1

Por exemplo: Quantos números primos existem até 1000?

1000 1000 1000


𝜋(1000) ≅ = = = 169,269
ln(1000) − 1 6.907755 − 1 5.907755

O valor correto é 168.

Foi provado que o n-ésimo número primo é aproximado pela seguinte fórmula, para n
bastante grande (acima de 1 bilhão):

𝑃(𝑛) ≅ 𝑛 × ln(𝑛)

Sendo que esta fórmula dá uma aproximação mais acurada:

𝑃(𝑛) ≅ 𝑛[ln(𝑛) + ln[ln(𝑛)] − 1]

14
Transformada de Laplace
Define-se a transformada de Laplace de uma função F(x) por:

+∞
𝑓(𝑆) = ℒ{𝐹(𝑥)} = ∫ 𝑒 −𝑆𝑥 𝐹(𝑥)𝑑𝑥
0

L[f] existirá se a integral for convergente.


Isto é análogo à série de potências na qual se troca e-S por t, de modo que e-Sx = tx.

Tabela de transformada de Laplace, na qual a é uma constante real:


F(x) L{F(x)}
𝑎 𝑎
ℒ{𝑎} = , 𝑆 > 0
𝑆
𝑥 1
ℒ{𝑥} = 2 , 𝑆 > 0
𝑆
𝑒 𝑎𝑥 1
,𝑆 > 𝑎
(𝑆 − 𝑎)
𝑆𝑒𝑛(𝑎𝑥) 𝑎
,𝑆 > 0
(𝑆 + 𝑎2 )
2

𝐶𝑜𝑠(𝑎𝑥) 𝑆
,𝑆 > 0
(𝑆 2 + 𝑎2 )
𝑥 𝑛 , 𝑛 = 1 → +∞ 𝑛!
,𝑆 > 0
𝑆 𝑛+1
Υ ′ (𝑥) 𝑆ℒ{Υ(𝑥)} − Υ(0)
′′ 2
Υ (𝑥) 𝑆 ℒ{Υ(𝑥)} − 𝑆Υ(0) − Υ′(0)
Υ ′′′ (𝑥) 𝑆 3 ℒ{Υ(𝑥)} − 𝑆 2 Υ(0) − 𝑆Υ ′ (0) − Υ′′(0)
Υ (𝑛) (𝑥) 𝑆 𝑛 ℒ{Υ(𝑥)} − 𝑆 𝑛−1 Υ(0) − ⋯ − 𝑆Υ (𝑛−2) (0) − Υ (𝑛−1) (0)
Esta tabela não é completa.

A transformada de Laplace permite-nos transformar integrações e derivações em


multiplicações e divisões, semelhante ao que logaritmos fazem para transformar
multiplicações em adições. Equações diferenciais serão transformadas em equações
polinomiais, muito mais fáceis de serem resolvidas.

Teorema 1: Se para x suficientemente grande |f(x)| < Meax, sendo M e a constantes,


+∞
então f(x) possui uma TL, isto é, a integral ∫0 𝑒 −𝑆𝑥 𝑓(𝑥)𝑑𝑥 existe para todo S
suficientemente grande.

+∞
Se existir uma função positiva g(x) tal que |f(x)| ≤ g(x) e se ∫0 𝑔(𝑥)𝑑𝑥 converge,
+∞
então ∫0 𝑓(𝑥)𝑑𝑥 converge absolutamente.

+∞
Teorema 2: Se ∫0 𝑒 −𝑆𝑥 𝑓(𝑥)𝑑𝑥 converge absolutamente para S = S0, ela converge
absolutamente para cada S > S0.

15
Teorema 3:
Se f(x) e g(x) são de ordem exponencial (satisfazem o teorema 1) e se L[f] = L[g],
então f(x) = g(x) em todo ponto x onde as funções são contínuas.

xn, eax e Sen(10x) são de ordem exponencial e, portanto, possuem transformadas de


2
Laplace. 𝑒 𝑥 não possui uma TL porque não é de ordem exponencial.

Propriedades da Transformada de Laplace

ℒ[𝑎 ± 𝑏] = ℒ[𝑎] ± ℒ[𝑏]


+∞
ℒ[𝐶1 𝑓1 + 𝐶2 𝑓2 ] = ∫ (𝐶1 𝑓1 (𝑥) + 𝐶2 𝑓2 (𝑥))𝑒 −𝑆𝑥 𝑑𝑥 =
0
+∞ +∞
= 𝐶1 ∫ 𝑓1 (𝑥)𝑒 −𝑆𝑥 𝑑𝑥 + 𝐶2 ∫ 𝑓2 (𝑥)𝑒 −𝑆𝑥 𝑑𝑥 =
0 0
= 𝐶1 ℒ(𝑓1 ) + 𝐶2 ℒ(𝑓2 )

A transformada de Laplace é um operador linear!

Exemplo: Consideremos o sistema diferencial y’’ + y = x, com y(0) = 0 e y’(0) = 2.


Suponhamos que exista uma solução y(x) para a qual sejam aplicados estes resultados.
Então, y’’(x) + y(x) ≡ x, e tomando a TL de ambos os membros: L[y’’] + L[y] = L[x],
temos:
1
{𝑆 2 ℒ[𝑦] − 𝑆𝑦(0) − 𝑦 ′ (0) + ℒ[𝑦] = 2 , 𝑐𝑜𝑚 𝑆 > 0
𝑆
ou
2
1 2𝑆 2 + 1
(𝑆 + 1)ℒ[𝑦] = 2 + 2 ⇒ ℒ[𝑦] = 2 2
𝑆 𝑆 (𝑆 + 1)

Nosso problema será resolvido se pudermos encontrar uma função y(x) cuja TL seja
igual a acima. Necessita-se de tabelas, mas, decompondo-se a equação acima em
frações parciais, temos:
1 1
ℒ[𝑦] = 2 + 2
𝑆 𝑆 +1

Consultando a tabela de transformadas, temos que ℒ[𝑦] = 𝑥 + 𝑆𝑒𝑛(𝑥), que é a


solução procurada.

Proposição: Se an ≠ 0 para todo n ϵ N e se existe r ϵ R (reais) em que 0 < r < 1, e n0 ϵ


𝑎 +1
N tal que, se | 𝑛 | ≤ 𝑟 para todo n ≥ n0, então ∑+∞𝑛=1 𝑎𝑛 é absolutamente
𝑎𝑛
convergente.
𝑎𝑛 +1
Se | | > 1 para n ≥ n1, então a série é divergente.
𝑎𝑛

16
Calculando Erros

Dada uma série convergente de termos an, definimos sua soma:

+∞

𝑆 = ∑ 𝑎𝑛
𝑛=1
Para cada n, temos:
+∞

𝑆𝑛 = ∑ 𝑎𝑗
𝑗=1
que é a reduzida de ordem n, e:
𝑆 = Lim |𝑆𝑛 |
𝑛→+∞

Rn é chamado de erro de ordem n e é definido por:

+∞

𝑅𝑛 = 𝑆 − 𝑆𝑛 = ∑ 𝑎𝑚
𝑚=𝑛+1
Observe que
Lim 𝑅𝑛 = 0
𝑛→+∞

Proposição: Suponhamos que ∑+∞


𝑛=1 𝑏𝑛 é convergente e, para n ≥ n1 temos |an| ≤ bn.
Então:
+∞

|𝑅𝑛 | ≤ ∑ 𝑏𝑗 = 𝑇𝑛 (𝑝𝑎𝑟𝑎 𝑛 ≥ 𝑛2 )
𝑗=𝑛+1

Proposição: Se ∑+∞
𝑛=1 𝑎𝑛 é convergente pelo critério da integral com y = f(x) como
função, então:
+∞
|𝑅𝑛 | ≤ ∫ 𝑓(𝑥)𝑑𝑥 𝑝𝑎𝑟𝑎 𝑛 ≥ 𝑐
𝑛

𝑎𝑛+1
Proposição (pela razão): Se an ≠ 0 para todo n ϵ N e se | | ≤ 𝑟 < 1 para n ≥ n1,
𝑎𝑛
então:
|𝑎𝑛+1 |
|𝑅𝑛 | ≤ 𝑇𝑛 =
1−𝑟
𝑎𝑛+1
Obs.: Se Lim | 𝑎 | = 𝐿 < 1 então sempre existe um tal r.
𝑛→+∞ 𝑛

17
𝑛
Proposição (pela raiz enésima): Se existe r > 0 tal que √|𝑎𝑛 | ≤ 𝑟 < 1 para n ≥ n0,
então:
𝑟 𝑛+1
|𝑅𝑛 | ≤
1−𝑟
para todo n ≥ n0.
Observações:
1) 𝑆𝑒 Lim 𝑛√|𝑎𝑛 | = 𝐿 < 1, 𝑒𝑛𝑡ã𝑜 𝑠𝑒𝑚𝑝𝑟𝑒 𝑒𝑥𝑖𝑠𝑡𝑒 𝑢𝑚 𝑡𝑎𝑙 𝑟.
𝑛+1 𝑛+2 |𝑎 |
2) 𝑆𝑒 1 > √|𝑎𝑛+1 | ≥ √|𝑎𝑛+2 | 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑛 ≥ 𝑛0 , 𝑒𝑛𝑡ã𝑜 |𝑅𝑛 | ≤ 1− 𝑛+1𝑛+1
√|𝑎𝑛+1 |

Operações

Produto de Cauchy:

(∑ 𝑎𝑛 ) (∑ 𝑏𝑛 ) = 𝑎1 𝑏1 + 𝑎1 𝑏2 + 𝑎1 𝑏3 + ⋯ + 𝑎2 𝑏1 + 𝑎2 𝑏2 + ⋯

O produto de duas séries convergentes é convergente e tem como soma o


produto das somas das duas séries.

Se uma série é multiplicada por um número, também o é a sua soma.

Subtraímos e somamos séries sendo a soma igual à soma e subtração das respectivas
somas.

18
Transformada de Fourier
Ao processo de se quebrar uma onda arbitrária qualquer em seus componentes
harmônicos e se identificar o conteúdo dessas sub-ondas é chamado de Análise de
Fourier. A análise de Fourier se baseia no fato de que qualquer frequência mais
complexa pode ser representada por uma adição simples de senos e/ou cossenos
(adição de uma série de frequências bem mais simples), a Série de Fourier. A
Transformada de Fourier decompõe a onda complexa em ondas senoides (seno e
cosseno), seja a onda complexa periódica ou não periódica.

As figuras abaixo mostram o que acontece quando variamos A e B para seno e cosseno
e fazemos uma adição das duas funções.

Seja g uma função definida no interval [0, T]. Se juntarmos (adicionar) várias cópias de
g, gerando uma função h, a função h pode ser estendida de –∞ a +∞ e será periódica a
cada T, ou em T. A cada intervalo T, h vai ter o mesmo valor.

19
Lembrete

Período de uma função

Uma função g(x) tem período T quando g(x + T) = g(x) para todos os x
considerados. Isto significa que a função vai apresentar o mesmo valor a cada
período T. Cada período pode ser representado por kT, onde T é o período
fundamental e k é uma constante multiplicativa, ou seja, g(x + 2T) = g(x), por
exemplo.
Como vimos em Trigonometria, tanto o seno quanto o cosseno têm período
igual a 2π, ou seja, Sen(x) = Sen(x + 2π). Outro exemplo:

2𝜋𝑛𝑡 2𝜋𝑛 2𝜋𝑛𝑡 2𝜋𝑛 × 2𝑇


𝑆𝑒𝑛 ( ) = 𝑆𝑒𝑛 ( × [𝑡 + 2𝑇) = 𝑆𝑒𝑛 ( + )=
𝑇 𝑇 𝑇 𝑇
2𝜋𝑛𝑡 2𝜋𝑛𝑡
= 𝑆𝑒𝑛 ( + 4𝜋𝑛) = 𝑆𝑒𝑛 ( )
𝑇 𝑇

Discorramos um pouco sobre a função seno, (isso vale para o cosseno também):

20
A amplitude de uma onda é a altura de um pico ou a profundidade de um vale. O
período, normalmente representado pela letra T, é o tempo gasto para percorrer a
distância entre dois pontos de mesmo valor para a função (onde o valor se repete). A
distância é o comprimento da onda, ou ciclo. O período é a duração de um ciclo.
Nas figuras acima, à esquerda temos duas ondas fora de fase (deslocamento de fase);
do lado direito há um deslocamento vertical.

Segue-se a definição completa da função seno (isso pode ser aplicado ao cosseno
também):

Para a análise de Fourier, os deslocamentos de fase e vertical não precisam ser


considerados.

Define-se, também, a frequência (f), que é a quantidade de comprimentos de onda


(quantidade de ciclos) que passam por unidade de tempo considerada.
Se N ciclos de duração T passam em NT unidades de tempo, então a frequência é dada
por
𝑁 1
𝑓= =
𝑁𝑇 𝑇

Então, a frequência é dada pelo inverso do período e o período é dado pelo inverso da
frequência. Na fórmula do seno acima, você vê que a frequência é B/2π.

Exemplo:

5 x Sen(2π4t) é uma onda senoide de amplitude 5 e de frequência 4Hz. O


período é 1/4 = 0.25 segundos. Como B = 2π/T, temos que: B = 8π. Isso pode
ser visto reescrevendo o exemplo: 5 x Sen(2π4t) = 5 x Sen(8πt).

21
Lembrete

Função Par e Função Ímpar

A função g é par se g(-x) = g(x); se g(-x) = -g(x), então g é ímpar.


Dadas duas funções quaisquer, par ou ímpar, teremos os seguintes
resultados ao multiplicar uma pela outra:

ÍMPAR x ÍMPAR = PAR


PAR x PAR = PAR
PAR x ÍMPAR = ÍMPAR

Seja g(-x) = -g(x). Vamos ver o que acontece quando integramos uma função
ímpar como essa.
Gerando o gráfico de g:

As duas áreas A correspondem à integral da função naqueles intervalos.


Assim:
0
∫ 𝑔(𝑥)𝑑𝑥 = −𝐴
−𝑥1
𝑥1
∫ 𝑔(𝑥)𝑑𝑥 = +𝐴
0
𝑥1
∫ 𝑔(𝑥)𝑑𝑥 = −𝐴 + 𝐴 = 0
−𝑥1

Ou seja, a integral de uma função ímpar no intervalo [-x, x] é nula!

22
Vamos ver o que ocorre com uma função par.

Calculando as integrais:
0
∫ 𝑔(𝑥)𝑑𝑥 = 𝐴
−𝑥1
𝑥1
∫ 𝑔(𝑥)𝑑𝑥 = 𝐴
0
𝑥1 𝒙𝟏
∫ 𝑔(𝑥)𝑑𝑥 = 𝐴 + 𝐴 = 2𝐴 = 𝟐 ∫ 𝑨
−𝑥1 𝟎

Como vimos em Trigonometria, o seno é uma função ímpar, enquanto o


cosseno é uma função par. Assim, use senos para aproximar uma função
ímpar e cosseno para aproximar uma função par, via análise de Fourier.

23
A Série de Fourier

A série de Fourier converge para a função g, conforme veremos em um teorema mais


adiante. Para a convergência ocorrer, os valores dos coeficientes devem ser
calculados.
A série de Fourier converte uma função periódica em uma soma de valores discretos
de senos e cossenos. A série de Fourier não se aplica para o caso de funções não
periódicas. Podemos dizer que a série de Fourier é a transformada de Fourier para
funções periódicas.
A seguinte série de função de tempo descreve qualquer onda periódica, por mais
complicada que ela pareça:

2𝜋𝑛𝑡 2𝜋𝑛𝑡
𝑔(𝑡) = 𝑎0 + ∑ [𝑎𝑛 𝐶𝑜𝑠 ( ) + 𝑏𝑛 𝑆𝑒𝑛( )]
𝑇 𝑇
𝑛=1

onde a0, an, bn são os Coeficientes de Fourier. T é o período da onda. Os valores


ótimos (que dão uma aproximação inicial para o resultado da série) para os
coeficientes são:

1 𝑇
𝑎0 = ∫ 𝑔(𝑡)𝑑𝑡
𝑇 0

2 𝑇 2𝜋𝑛𝑡
𝑎𝑛 = ∫ 𝑔(𝑡) × 𝐶𝑜𝑠 ( ) 𝑑𝑡
𝑇 0 𝑇

2 𝑇 2𝜋𝑛𝑡
𝑏𝑛 = ∫ 𝑔(𝑡) × 𝑆𝑒𝑛 ( ) 𝑑𝑡
𝑇 0 𝑇

O valor 2π/T é, exatamente, o valor B que vimos antes (por isso, o período aqui é T).

Quando o período T = 2π, teremos de B = 2π/T que B = 1, resultando em:


𝑔(𝑡) = 𝑎0 + ∑[𝑎𝑛 × 𝐶𝑜𝑠(𝑛 × 𝑡) + 𝑏𝑛 × 𝑆𝑒𝑛(𝑛 × 𝑡)]


𝑛=1

Onde an e bn correspondem aos valores de amplitude que vimos e n dentro dos


parêntesis é um multiplicador do valor B, ou seja, temos an=A.Cos(x)+bn=A.Sen(x),
como esperado.

24
Com T = 2π, os coeficientes ficam:
1 𝑇
𝑎0 = ∫ 𝑔(𝑡)𝑑𝑡
2𝜋 0

1 𝑇
𝑎𝑛 = ∫ 𝑔(𝑡) × 𝐶𝑜𝑠(𝑛𝑡)𝑑𝑡
𝜋 0

1 𝑇
𝑏𝑛 = ∫ 𝑔(𝑡) × 𝑆𝑒𝑛(𝑛𝑡)𝑑𝑡
𝜋 0

Também usa-se período igual a 2T. De B = 2π/T, temos B = 2π/2T = π/T:



𝜋𝑛𝑡 𝜋𝑛𝑡
𝑔(𝑡) = 𝑎0 + ∑ [𝑎𝑛 𝐶𝑜𝑠 ( ) + 𝑏𝑛 𝑆𝑒𝑛( )]
𝑇 𝑇
𝑛=1

1 𝑇
𝑎0 = ∫ 𝑔(𝑡)𝑑𝑡
2𝑇 0

1 𝑇 𝜋𝑛𝑡
𝑎𝑛 = ∫ 𝑔(𝑡) × 𝐶𝑜𝑠 ( ) 𝑑𝑡
𝑇 0 𝑇

1 𝑇 𝜋𝑛𝑡
𝑏𝑛 = ∫ 𝑔(𝑡) × 𝑆𝑒𝑛 ( ) 𝑑𝑡
𝑇 0 𝑇

25
Transformadas Gerais

Transformada de Fourier
Transformada Normal Transformada Inversa
+∞ +∞
ℱ{𝑔(𝑡)} = 𝐺(𝑓) ≡ ∫ 𝑔(𝑡)𝑒 −𝑖2𝜋𝑓𝑡 𝑑𝑡 ℱ −1 {𝐺(𝑓)} = 𝑔(𝑡) ≡ ∫ 𝐺(𝑓)𝑒 𝑖2𝜋𝑓𝑡 𝑑𝑓
−∞ −∞

Dá o quanto a frequência está dentro do Mostra como recuperar o sinal original


sinal original g(t). g(t) sabendo-se as frequências.

Notação alternativa, usando a velocidade angular w = 2πf


Transformada Normal Transformada Inversa
ℱ{𝑔(𝑡)} = 𝐺(𝑤) ℱ −1 {𝐺(𝑤)} = 𝑔(𝑡)
−∞ < 𝑤 < +∞ −∞ < 𝑡 < +∞
+∞
1 +∞
ℱ{𝑔(𝑡)} = 𝐺(𝑤) ≡ ∫ 𝑔(𝑡)𝑒 −𝑖𝑤𝑡 𝑑𝑡 ℱ −1 {𝐺(𝑤)} = 𝑔(𝑡) ≡ ∫ 𝐺(𝑤)𝑒 𝑖𝑤𝑡 𝑑𝑤
𝑡=−∞ 2𝜋 −∞

A Transformada de Fourier converte uma função periódica ou não periódica em somas


de valores contínuos (integração) para o domínio de frequências (f). A função inversa
recupera a função original.

Série de Fourier
Transformada Normal Transformada Inversa
+∞
1 𝑡=𝑇 −𝑖2𝜋𝑘𝑡 𝑖2𝜋𝑘𝑡
ℱ{𝑔(𝑡)} = 𝐺(𝑘) ≡ ∫ 𝑔(𝑡)𝑒 𝑇 𝑑𝑡 ℱ −1 {𝐺(𝑘)}
= 𝑔(𝑡) = ∑ 𝐺(𝑘)𝑒 𝑇
𝑇 𝑡=0
𝑘=−∞

Notação alternativa, movendo o fator escalar para a outra equação


Transformada Normal Transformada Inversa
ℱ{𝑔(𝑡)} = 𝐺(𝑘) ℱ −1 {𝐺(𝑘)} = 𝑔(𝑡)
k = ..-2,-1,0,1,2,... 0≤t≤T
𝑡=𝑇 −𝑖2𝜋𝑘𝑡 +∞
ℱ{𝑔(𝑡)} = 𝐺(𝑘) ≡ ∫ 𝑔(𝑡)𝑒 𝑇 𝑑𝑡 −1 {𝐺(𝑘)}
1 𝑖2𝜋𝑘𝑡
ℱ = 𝑔(𝑡) = ∑ 𝐺(𝑘)𝑒 𝑇
𝑡=0 𝑇
𝑘=−∞

A Série de Fourier é expressa como uma soma de senos e cossenos de variadas


amplitudes e frequências, enquanto a Transformada de Fourier é expressa como a
integral de senos e cossenos multiplicados por fatores de ponderação (peso).

26
As principais variações de notação, conforme o autor, além das duas mostradas acima,
são:
𝑇
𝑇 2 0
1) Usar ∫0 𝑜𝑢 ∫ −𝑇 𝑜𝑢 ∫−𝑇
2
2) Substituir T por f0 = 1/T.

Desenvolvimento dos Coeficiente de Fourier

𝟏 𝑻 𝟏 𝟎 𝟏 𝑻 𝟏 𝑻 𝟏 𝑻
∫ 𝒈(𝒙)𝒅𝒙 = ∫ 𝒈(𝒙)𝒅𝒙 + ∫ 𝒈(𝒙)𝒅𝒙 = 𝟐 × ∫ 𝒈(𝒙)𝒅𝒙 = ∫ 𝒈(𝒙)𝒅𝒙
𝟐𝑻 −𝑻 𝟐𝑻 −𝑻 𝟐𝑻 𝟎 𝟐𝑻 𝟎 𝑻 𝟎

Se g é par, então:
1 𝑇
𝑎0 = ∫ 𝑔(𝑥)𝑑𝑥
𝑇 0

1 𝑇 𝑛𝜋𝑥 2 𝑇 𝑛𝜋𝑥
𝑎𝑛 = ∫ 𝑔(𝑥) × 𝐶𝑜𝑠 ( ) 𝑑𝑥 = ∫ 𝑔(𝑥) × 𝐶𝑜𝑠 ( ) 𝑑𝑥
𝑇 −𝑇 𝑇 𝑇 0 𝑇

Isto porque Cos(x) também é par (e par x par = par).

1 𝑇 𝑛𝜋𝑥 1 𝑇 0
𝑏𝑛 = ∫ 𝑔(𝑥) × 𝑆𝑒𝑛 ( ) 𝑑𝑥 = ∫ − ∫ = 0
𝑇 −𝑇 𝑇 𝑇 0 −𝑇

Isto porque Sen(x) é ímpar e par x ímpar = ímpar.

Se g é par, basta calcular só a0 e an. Daqui você conclui facilmente que, se g é ímpar, an
vai ser nulo, pois, Cos(x) é par, o que vai zerar a integral, ficando apenas bn: (a0 é an
para n = 0, por isso é nulo também!)

1 𝑇 𝑛𝜋𝑥 2 𝑇 𝑛𝜋𝑥
𝑏𝑛 = ∫ 𝑔(𝑥) × 𝑆𝑒𝑛 ( ) 𝑑𝑥 = ∫ 𝑔(𝑥) × 𝑆𝑒𝑛 ( ) 𝑑𝑥
𝑇 −𝑇 𝑇 𝑇 0 𝑇

Isto porque Sen(x) também é ímpar (e ímpar x ímpar = par).

27
Assim a série de Fourier pode ser escrita:

𝑛𝜋𝑥
ℱ{𝑔(𝑥)} = 𝑎0 + ∑ 𝑎𝑛 . 𝐶𝑜𝑠 ( ) 𝑠𝑒 𝑔 é 𝑃𝐴𝑅 (𝐹1)
𝑇
𝑛=1


𝑛𝜋𝑥
ℱ{𝑔(𝑥)} = ∑ 𝑏𝑛 . 𝑆𝑒𝑛 ( ) 𝑠𝑒 𝑔 é Í𝑀𝑃𝐴𝑅 (𝐹2)
𝑇
𝑛=1

Teorema: Se f(x) é uma função periódica com continuidade seccional em um período


igual a 2L (contínua em intervalos iguais a 2L) e sua derivada f’(x) existe ao longo de
cada um desses períodos, então existe uma série de Fourier que converge em f para
todos os pontos de continuidade e para [f(x+) + f(x-)]/2 em cada ponto de
descontinuidade.

Teorema: A transformada da soma de duas funções é igual à soma das transformadas


de cada uma das funções separadamente: F{g(x) + h(x)} = F{g(x)} + F{h(x)}.

Teorema:
ℱ{𝑎 × 𝑔(𝑥)} = 𝑎 × ℱ{𝑔(𝑥)}

A transformada de Fourier é uma transformação linear.

Teorema (do deslocamento): Uma função g(x) deslocada ao longo do eixo x pela
quantidade –a, denotada f(x – a), tem transformada de Fourier dada por:

𝑓(𝑥 − 𝑎) = 𝑒 −2𝜋𝑖𝑎𝑠 ℱ(𝑠)

Se a função f(x) é par, então a série de Fourier não conterá coeficientes ímpares e bn
será zero; se a função f(x) é par, então a série de Fourier não conterá coeficientes
pares e an será zero.

28
Exercícios Resolvidos

Exercício 1 - Calcule a série de Fourier para a função abaixo

3, 𝑠𝑒 0 < 𝑥 < 1
𝑔(𝑥) = { , 𝑜𝑛𝑑𝑒 𝑔(𝑥) = 𝑔(𝑥 + 2), 𝑜𝑢 𝑠𝑒𝑗𝑎, 𝑜 𝑝𝑒𝑟í𝑜𝑑𝑜 é 2.
−3, 𝑠𝑒 − 1 < 𝑥 < 0

Veja que g(x) possui continuidade seccional. Como g(-x) = -g(x), g é ímpar.
Agora usamos as relações a seguir:

1 𝑇
𝑎0 = ∫ 𝑔(𝑥)𝑑𝑥 (1)
𝑇 −𝑇

2 𝑇 2𝜋𝑛𝑥
𝑎𝑛 = ∫ 𝑔(𝑥) × 𝐶𝑜𝑠 ( ) 𝑑𝑥 (2)
𝑇 −𝑇 𝑇

2 𝑇 2𝜋𝑛𝑥
𝑏𝑛 = ∫ 𝑔(𝑥) × 𝑆𝑒𝑛 ( ) 𝑑𝑥 (3)
𝑇 −𝑇 𝑇

Do que já vimos, podemos concluir que (1) e (2) se igualam a zero (ímpar x 1 =
ímpar e ímpar x par = ímpar). Assim, basta calcular bn (ímpar x ímpar = par):

2 𝑇 2𝜋𝑛𝑥
𝑏𝑛 = ∫ 𝑔(𝑥) × 𝑆𝑒𝑛 ( ) 𝑑𝑥 ⇒
𝑇 −𝑇 𝑇
2 2 2𝜋𝑛𝑥
⇒ 𝑏𝑛 = 2 × ∫ 3 × 𝑆𝑒𝑛 ( ) 𝑑𝑥 ⇒
2 0 2
2
⇒ 𝑏𝑛 = 2 × ∫ 3 × 𝑆𝑒𝑛(𝜋𝑛𝑥)𝑑𝑥 ⇒
0

Usamos g(x) = 3 por é isso que a função vale em 0≤ x ≤ 1. Como a integral do


seno é –cosseno:

⇒ 𝑏𝑛 = 2 × 3 × (−𝐶𝑜𝑠(𝜋𝑛𝑥)) ⇒
𝑥=1
⇒ 𝑏𝑛 = −6 × 𝐶𝑜𝑠(𝜋𝑛𝑥) | ⇒
𝑥=0

Pelo teorema fundamental do cálculo, em que a integral definida de f(x) de a


até b é dada por F(b) – F(a):
⇒ 𝑏𝑛 = −6 × [𝐶𝑜𝑠(𝜋 × 𝑛 × 1) − 𝐶𝑜𝑠(𝜋 × 𝑛 × 0)] ⇒
⇒ 𝑏𝑛 = −6 × [𝐶𝑜𝑠(𝑛𝜋) − 1] ⇒

Cos(nπ) vai ficar oscilando entre –1 e +1 para todos os valores de n. Assim, essa
função pode ser substituída por (–1)n:

⇒ 𝑏𝑛 = −6[(−1)𝑛 − 1]

29
Esta função equivale a:

0, 𝑠𝑒 𝑛 é 𝑝𝑎𝑟 (+1 − 1 = 0 × −6 = 0)
{
12, 𝑠𝑒 𝑛 é í𝑚𝑝𝑎𝑟 (−1 − 1 = −2 × 6 = 12)

Então, de acordo com a fórmula (F2):



𝑛𝜋𝑥
ℱ{𝑔(𝑥)} = ∑ 𝑏𝑛 . 𝑆𝑒𝑛 ( ) 𝑠𝑒 𝑔 é Í𝑀𝑃𝐴𝑅
𝑇
𝑛=1

Temos que, para n sempre ímpar:



𝑛𝜋𝑥
ℱ{𝑔(𝑥)} = ∑ 12 × 𝑆𝑒𝑛 ( )
2
𝑛=1

Essa é a função que serve para aproximar a função g(x) original.

Exercício 2 - Calcule a série de Fourier para a função abaixo.

𝑒 −𝑎𝑥 , 𝑠𝑒 𝑥 ≥ 0
𝑔(𝑥) = {
𝑒 𝑎𝑥 , 𝑠𝑒 𝑥 < 0

Eis o gráfico de g(x):

30
Lembrete de Integrais

1 𝑘𝑥
∫ 𝑒 𝑘𝑥 𝑑𝑥 = 𝑒
𝑘

1 2𝑥−1
∫ 𝑒 2𝑥−1 𝑑𝑥 = 𝑒
2

Usando a notação alternativa em que w = 2πf:

+∞
ℱ{𝑔(𝑡)} = 𝐺(𝑤) ≡ ∫ 𝑔(𝑡)𝑒 −𝑖𝑤𝑡 𝑑𝑡
𝑡=−∞

Com x em lugar de t e integrando para cada um dos dois intervalos:

𝑥=0 𝑥=+∞
∫ 𝑒 𝑎𝑥 . 𝑒 −𝑖𝑤𝑥 𝑑𝑥 + ∫ 𝑒 −𝑎𝑥 . 𝑒 −𝑖𝑤𝑥 𝑑𝑥 =
𝑥=−∞ 𝑥=0

𝑥=0 𝑥=+∞
𝑥(𝑎−𝑖𝑤)
=∫ 𝑒 𝑑𝑥 + ∫ 𝑒 𝑥(−𝑎−𝑖𝑤) 𝑑𝑥 =
𝑥=−∞ 𝑥=0

Com a ajuda do lembrete podemos calcular as integrais definidas:

𝑒 𝑥(𝑎−𝑖𝑤) 0 𝑒 𝑥(−𝑎−𝑖𝑤) +∞
| + |
𝑎 − 𝑖𝑤 −∞ −𝑎 − 𝑖𝑤 0

Integrando cada termo separadamente.

Primeiro termo (limitante 0):

𝑒 𝑥(𝑎−𝑖𝑤) 0 𝑒 0×(𝑎−𝑖𝑤) 𝑒0 1
| = = =
𝑎 − 𝑖𝑤 −∞ 𝑎 − 𝑖𝑤 𝑎 − 𝑖𝑤 𝑎 − 𝑖𝑤

Primeiro termo (limitante -∞):

𝑒 𝑥(𝑎−𝑖𝑤) 0 𝑒 −∞×(𝑎−𝑖𝑤) 0
| = = =0
𝑎 − 𝑖𝑤 −∞ 𝑎 − 𝑖𝑤 𝑎 − 𝑖𝑤

Pelo teorema fundamental do cálculo, temos que:

1 𝟏
−0=
𝑎 − 𝑖𝑤 𝒂 − 𝒊𝒘

31
Segundo termo (limitante +∞):

𝑒 𝑥(−𝑎−𝑖𝑤) +∞ 𝑒 ∞×(−𝑎−𝑖𝑤) 0
| = = =0
−𝑎 − 𝑖𝑤 0 −𝑎 − 𝑖𝑤 −𝑎 − 𝑖𝑤

Segundo termo (limitante 0):

𝑒 𝑥(−𝑎−𝑖𝑤) +∞ 𝑒 0×(−𝑎−𝑖𝑤) 𝑒0 𝟏
| = = =
−𝑎 − 𝑖𝑤 0 −𝑎 − 𝑖𝑤 −𝑎 − 𝑖𝑤 −𝒂 − 𝒊𝒘

Pelo teorema fundamental do cálculo, temos que:

1 −1 𝟏
0− = =
−𝑎 − 𝑖𝑤 −𝑎 − 𝑖𝑤 𝒂 + 𝒊𝒘

Finalmente:
𝟏 𝟏
+ =
𝒂 − 𝒊𝒘 −𝒂 − 𝒊𝒘

Reduzindo ao denominador comum (operação de frações!):

(𝒂 + 𝒊𝒘) + (𝒂 − 𝒊𝒘)
= =
(𝒂 − 𝒊𝒘)(𝒂 + 𝒊𝒘)

O denominador é um produto notável! Então:

(𝑎 + 𝑎) + (𝑖𝑤 − 𝑖𝑤) 2𝑎
= =
𝑎2 − (𝑖𝑤)2 𝑎2 − (𝑖𝑤)2

O número complexo i ao quadro é igual a -1. Então:

2𝑎 𝟐𝒂
= = 𝟐 = 𝑮(𝒘)
𝑎2 − (−1 × 𝑤 ) 𝒂 + 𝒘𝟐
2

A função resultante é uma função real e par. Seu gráfico é:

32
Equações Diferenciais
Se F é uma função definida pela equação

𝑦 = 𝐹(𝑥)
e f é a derivada de F, então
𝑑𝑦
= 𝑓(𝑥) [1]
𝑑𝑥
e F é uma integral de f.
Usando diferenciais, temos que:
𝑑𝑦 = 𝑓(𝑥)𝑑𝑥 [2]

[1] e [2] são tipos muito simples de equações diferenciais.

Estas são equações diferenciais de primeira ordem (porque somente derivadas de


primeira ordem estão envolvidas), para as quais as variáveis são separáveis.

Para resolvermos [2], devemos encontrar todas as funções G para as quais


obtenhamos y = G(x), de tal modo que a equação [2] seja satisfeita.
Assim, se F é uma integral de f, todas as funções G são definidas por G(x) = F(x) + C,
onde C é uma constante arbitrária.
Em outras palavras, se
𝑑[𝐺(𝑥)] = 𝑑[𝐹(𝑥) + 𝐶] = 𝑓(𝑥)𝑑𝑥

então, o que denominamos a solução completa da equação [2] é dada por:

𝑦 = 𝐹(𝑥) + 𝐶

Esta equação representa uma família de funções que dependem de uma constante
arbitrária C. Isto é chamado de uma família a um parâmetro.

Exemplo: Encontre a solução completa da equação diferencial dy = 2xdx.

A integral mais geral do lado esquerdo da equação é dada por (y + C1), e a


integral mais geral do lado direito é (x2 + C2).
Assim, temos que:
𝑦 + 𝐶1 = 𝑥 2 + 𝐶2 ⇒ 𝑦 = 𝑥 2 + 𝐶2 − 𝐶1

Como (C2 – C1) é uma constante arbitrária se C1 e C2 são constantes arbitrárias,


podemos substituir (C2 – C1) por C, obtendo:

𝑦 = 𝑥2 + 𝐶

que é a solução completa da equação diferencial dada.

33
Um outro tipo de equação diferencial é

𝑑2𝑦
= 𝑓(𝑥)
𝑑2𝑥

Esta é uma equação diferencial de segunda ordem. Serão necessárias duas


integrações sucessivas para a resolução e aparecem duas constantes arbitrárias na
solução completa, tendo-se uma família de funções a dois parâmetros.

Um tipo mais geral de equação diferencial de primeira ordem é da forma:

𝑑𝑦 𝑓(𝑥)
=
𝑑𝑥 𝑔(𝑥)

Para tais equações, as variáveis podem ser separadas multiplicando-se ambos os lados
da equação por g(y)dx, obtendo-se:

𝑔(𝑦)𝑑𝑦 = 𝑓(𝑥)𝑑𝑥

Observação

Funções definidas por séries são muito úteis nas aplicações e, frequentemente,
aparecem como soluções de equações diferenciais. Por exemplo, a função definida
por
𝑥𝑝 𝑥2 𝑥4
𝐽𝑝 (𝑥) = 𝑝 {1 − + −⋯} =
2 𝑝! 2(2𝑝 + 2) 2 × 4(2𝑝 + 2)(2𝑝 + 4)

+∞ 𝑥
(−1)𝑛 × (2)𝑛+𝑝
=∑
𝑛! (𝑛 + 𝑝)!
𝑛=0

É uma solução da equação diferencial de Bessel:

𝑥 2 𝑦" + 𝑥𝑦′ + (𝑥 2 − 𝑝2 )𝑦 = 0

Essa equação se chama Função de Bessel de ordem p.


Analogamente, a função hipergeométrica:

𝑎𝑏 𝑎(𝑎 + 1)𝑏(𝑏 + 1) 2
𝐹(𝑎, 𝑏, ; 𝐶; 𝑥) = 1 + 𝑥+ 𝑥 +⋯
1𝑐 1 × 2 × 𝑐(𝑐 + 1)

é uma solução da equação diferencia de Gaus:

x(1 – x)y” + {C – (a+b+1)x}y’ –aby = 0.

34
O que são equações diferenciais

Uma equação diferencial é uma equação formada por uma função junto com pelo
menos uma de suas derivadas, como f(x) + f’’(x) = 2x. É uma relação entre uma
variável x, uma função de x e derivadas até ordem n da função em relação à variável x:

𝑦 ′ = 𝑓(𝑥) [1𝑎]

𝑦 ′′ + 𝑦 = 0 [2𝑎]

1
𝑦 ′′ = (1 + [𝑦 ′ ]2 )2 [3𝑎]

𝜕 2𝑢 𝜕 2𝑢
+ = 0 [4𝑎]
𝜕𝑥 2 𝜕𝑦 2

Para resolver a equação algébrica x2 – 3x + 2 = 0, procura-se um número que,


substituindo x na equação, reduza o membro da esquerda a zero.

Para resolver uma equação diferencial, devemos procurar funções em lugar de


números. Então, resolver uma equação diferencial é achar uma função, ou funções,
cuja derivada resulta na equação diferencial satisfazendo a igualdade. No exemplo
dado de f(x) + f’’(x) = 2x, o objetivo é achar a função f(x).

E, para achar essa função, basta fazer a operação inversa da derivação, ou seja,
integrar os dois lados da equação no intervalo (se for dado). Eis um exemplo:

𝑑𝑦 1
= 𝑥 2 − 3 → ∫ 𝑑𝑦 = ∫(𝑥 2 − 3)
𝑑𝑥 𝑑𝑥

A primeira integral pede que se integre 1 em relação a y (é o dy que diz isso – e


qualquer expressão em x, nesse caso, é considerada uma constante) e se multiplique o
resultado por 1/dx. Então:

1 1 1 𝑦
∫ 𝑑𝑦 = ∫ 𝑑𝑦 = ×𝑦 =
𝑑𝑥 𝑑𝑥 𝑑𝑥 𝑑𝑥

Substituindo lá em cima e operando:


𝑦
= ∫(𝑥 2 − 3) ⇒ 𝑦 = ∫(𝑥 2 − 3) 𝑑𝑥
𝑑𝑥

Agora, integrando o lado direito:

1 3
𝑦 = ∫(𝑥 2 − 3) 𝑑𝑥 ⇒ 𝑦 = 𝑥 − 3𝑥
3

35
A equação y’ = y tem solução y = aex, pois:

𝑑(𝑎𝑒 𝑥 )
𝑦′ = = 𝑎𝑒 𝑥 = 𝑦
𝑑𝑥

Existem dois tipos de equação diferenciais:


1) Ordinárias: São as equações diferenciais em que só aparece uma variável
independente. [1a], [2a] e [3a], acima, são exemplos de equações diferenciais
ordinárias.
2) Parciais: São as equações diferenciais em que aparecem duas ou mais variáveis
independentes (processos que dependem de duas ou mais variáveis). [4a] é um
exemplo, em que a função y depende de x e de u.

A ordem de uma equação diferencial é a ordem da mais alta derivada da função


incógnita que aparece na equação.
Exemplos: y + y’’ = 0 (2ª ordem); y’(x) = F(x, y) (1ª ordem).

O grau de uma equação diferencial é o valor do expoente da derivada de ordem mais


alta.

Forma Geral das EDOs: y(n)(x) = F[x,y,y’(x),y’’(x),...,y(n-1)(x)].


Forma Geral das EDPs:
𝜕𝑢
𝑦 (𝑛) (𝑥) = 𝐹(𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝑢, , … )
𝜕𝑥

Onde (n) é a ordem da equação diferencial (quantas vezes a função inicial foi derivada)
e n é o grau da equação diferencial.

Uma equação diferencial ordinária pode ser, ainda, linear, que é quando ela não
contém expoentes maiores que 1 ou funções. A forma geral de uma equação
diferencial linear é:
𝑑𝑦
+ 𝑃(𝑥) = 𝑄(𝑥)
𝑑𝑥

A seguintes equações não são lineares:


 y’’ + (1 – y2)y’ + y = 0 – Contém um expoente 2 em y.
 y’ + Sen(y) – Contém uma função.

A equação diferencial M(x, y)x’ + N(x, y)y’ = 0 é de primeira ordem. É útil escrevê-la
sob a forma:

𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 = 0

36
Interpretação Geométrica de Equações Diferenciais

Seja y’ = F(x, y).


F(x, y) significa a inclinação da reta tangente ao ponto (x, y). Traçando-se pequenos
segmentos nestes pontos aparecerá o esboço das curvas soluções.
O quadro a seguir mostra um exemplo.

As soluções da equação diferencial y’ = F(x, y) constituem uma família de curvas do


plano tal que, para cada ponto (x, y), passa uma única curva solução.

Equações Diferenciais Exatas de 1ª Ordem

A equação diferencial 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 = 0 se diz exata quanto existe uma
função g(x, y) tal que 𝑑[𝑔(𝑥, 𝑦)] = 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦, isto é, quando existe uma
função g(x, y) tal que
𝑔𝑥 (𝑥, 𝑦) = 𝑀(𝑥, 𝑦) 𝑒 𝑔𝑦 (𝑥, 𝑦) = 𝑁(𝑥, 𝑦)

Exemplo:
A equação (4x – y)dx + (2y – x)dy = 0 é exata porque o membro da esquerda é
a diferencial (derivada) da função g(x, y) = 2x2 –xy + y2, pois:

𝑑(2𝑥 2 − 𝑥𝑦 + 𝑦 2 )
= 4𝑥 − 𝑦
𝑑𝑥

𝑑(2𝑥 2 − 𝑥𝑦 + 𝑦 2 )
= −𝑥 + 2𝑦 = 2𝑦 − 𝑥
𝑑𝑦

37
Evidentemente, poderíamos, também, escolher g(x, y) = 2x2 –xy + y2 + C, sendo C
uma constante.
Quando g(x, y) for uma função diferenciável tal que 𝑑[𝑔(𝑥, 𝑦)] = 𝑀(𝑥, 𝑦)𝑑𝑥 +
𝑁(𝑥, 𝑦)𝑑𝑦, qualquer função g(x, y) – C, sendo C uma constante, é denominada uma
integral da correspondente equação diferencial.

As curvas definidas pelas equações g(x, y) = C (C constante) são denominadas de


curvas integrais da equação diferencial.

A função 2x2 –xy + y2 é uma integral da equação do exemplo acima. As curvas integrais
dessa função são dadas pela equação 2x2 –xy + y2 = C. Quando C > 0, as curvas dadas
são elipses.

Teorema: Se as funções M(x, y), N(x, y) e suas derivadas parciais My(x, y) e Nx(x, y)
forem contínuas em um quadrado R, uma condição necessária e suficiente para que a
equação diferencial M(x, y)dx + N(x, y)dy = 0 seja exata é que

𝜕𝑀 𝜕𝑁
=
𝜕𝑦 𝑑𝑥
Exemplo:
(3𝑥 2 + 𝑦 2 )𝑑𝑥 + 2𝑥𝑦𝑑𝑦 = 0

𝑀(𝑥, 𝑦) = 3𝑥 2 + 𝑦 2 , 𝑁(𝑥, 𝑦) = 2𝑥𝑦

𝑀𝑦 = 2𝑦, 𝑁𝑥 = 2𝑦

Como My = Nx, a equação diferencial é exata!

Teorema:
Se g(x, y) for uma integral de uma equação diferencial exata M(x, y)dx + N(x, y)dy = 0,
qualquer solução diferenciável y(x) da equação g(x, y) = C é uma solução da equação
diferencial.

Resolve-se via integrais curvilíneas.


No exemplo anterior, para encontrar uma integral g(x, y), escolhe-se o ponto (x0, y0)
como origem, obtendo-se:
𝑥 𝑦
𝑔(𝑥, 𝑦) = ∫ (3𝑥 2 + 02 )𝑑𝑥 + ∫ 2𝑥𝑦 𝑑𝑦 = 𝑥 3 + 𝑥𝑦 2
0 0

As curvas integrais são dadas pela equação x3 + xy2 = C.

38
Outro método:
Para encontrar uma solução, integra-se o termo 2xydy relativamente a y,
obtendo-se xy2. A seguir, determina-se a função f(x), de x somente, tal que
d[xy2 + f(x)] seja igual ao primeiro membro ([3x2 + y2]dx + 2xydy = 0). Ou seja,
deseja-se encontrar uma função f(x) tal que:

2𝑥𝑦𝑑𝑦 + 𝑦 2 𝑑𝑥 + 𝑓(𝑥) = (3𝑥 2 + 𝑦 2 )𝑑𝑥 + 2𝑥𝑦𝑑𝑦

Pode-se também começar integrando o termo (3x2 + y2), obtendo-se x3 +xy2. A


seguir, procura-se uma função g(y), de y somente, tal que d[x3 + xy2 + g(y)]
seja igual ao membro da esquerda da equação.

Fator Integrante

Quando uma equação da forma 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 = 0 não for exata, tenta-se
encontrar um fator integrante, isto é, uma função I(x, y) tal que a equação

𝐼(𝑥, 𝑦)[𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦] = 0

seja exata. Veja a demonstração em Soluções em Séries, adiante.

Variáveis Separáveis

Quando a equação diferencial possui a forma a(x)k(y)dx + b(x)h(y)dy = 0, diz-se que


𝟏
as variáveis são separáveis. Verifica-se que 𝒃(𝒙)𝒌(𝒚) é um fator integrante, na região do
plano xy, onde b(x)k(y) ≠ 0. A equação diferencial acima se transforma em

𝑎(𝑥) ℎ(𝑦)
𝑑𝑥 + 𝑑𝑦 = 0
𝑏(𝑥) 𝑘(𝑦)

(pela divisão por b(x)k(y), ou multiplicação por 1/b(x)k(y)).

A equação acima é exata. As curvas integrais são dada por:


𝑥 𝑦
𝑎(𝑥) ℎ(𝑦)
∫ 𝑑𝑥 + ∫ 𝑑𝑦 = 𝐶
𝑥0 𝑏(𝑥) 𝑦0 𝑘(𝑦)

As equações com variáveis separáveis são sempre exatas.

39
Exemplo1 : xdy – ydx = 0.

Qualquer das seguintes funções é fator integrante:

1 1 1 1
, 2, 2, 2
𝑥𝑦 𝑥 𝑦 𝑥 + 𝑦 2

exceto para valores de x e de y que não dão sentido a estas funções. Usando o
primeiro fator integrante:

𝑥𝑑𝑦 𝑦𝑑𝑥 𝑑𝑦 𝑑𝑥
− =0⟹ − =0
𝑥𝑦 𝑥𝑦 𝑦 𝑥

e as curvas integrais são dadas por:

𝑦 𝑦
ln|𝑦| − ln|𝑥| = |𝐶| ⇒ 𝑙𝑛 ( ) = 𝐶 ⇒ = 𝐶 ⇒ 𝑦 = 𝐶𝑥
𝑥 𝑥

Exemplo 2:
𝑑𝑦 𝑑𝑦
= 5𝑥𝑦 ⇒ 𝑑𝑦 = 5𝑥𝑦𝑑𝑥 ⇒ = 5𝑥𝑑𝑥
𝑑𝑥 𝑦

Equações Diferenciais Homogêneas

O quociente de dois polinômios homogêneos de mesmo grau é uma função


homogênea. Um polinômio homogêneo é da forma a0xn + a1xn-1 y + a2xn-2 y, isto é, os
coeficientes são iguais entre todos os monômios.

Uma equação diferencial diz-se homogênea se F(x, y) depender de uma só variável


após a substituição y = vx.
Exemplo:
𝑥2 − 𝑦2 𝑣2 + 1
𝑦′ = → 𝑦′ =
𝑥𝑦 𝑣

𝑦
𝑦 ′ = 𝐹(𝑥, 𝑦) = 𝐺(𝑣) 𝑞𝑢𝑎𝑛𝑑𝑜 𝑣 = ⇒ 𝑦 = 𝑣𝑥 ⇒
𝑥

𝑑𝑣
⇒ 𝑦′ = 𝑣 + 𝑥 = 𝐺(𝑣)
𝑑𝑥
Multiplicando por dx:
𝑑𝑥 𝑑𝑣
𝑣𝑑𝑥 + 𝑥𝑑𝑣 = 𝐺(𝑣)𝑑𝑥 ⇒ =
𝑥 𝐺(𝑣) − 𝑣

40
Aí temos variáveis separadas. Basta integrar:

𝑑𝑥 𝑑𝑣 𝑑𝑣
∫ =∫ ⇒ ln(𝑥) = ∫ +𝐶 ⟹
𝑥 𝐺(𝑣) − 𝑣 𝐺(𝑣) − 𝑣

𝑑𝑣
⟹ ln(𝑥) − ∫ =𝐶
𝐺(𝑣) − 𝑣

Fazendo G(v) = (v2 + 1)/v:


𝑑𝑣
ln(𝑥) − ∫ =𝐶
1 + 𝑣2
𝑣 −𝑣
Como temos que
𝑑𝑣 𝑑𝑣 1 2
∫ = ∫ = ∫ 𝑣𝑑𝑣 = 𝑣
1 + 𝑣2 1/𝑣 2
− 𝑣
𝑣
Resulta:
1 1 𝑦 2
ln|𝑥| − 𝑣 2 = 𝐶 ⟹ ln|𝑥| − ( ) = 𝐶
2 2 𝑥

Seja a equação
𝑦+𝑥
𝑦′ =
𝑥

Esta equação é homogênea, pois

𝑡𝑦 + 𝑡𝑥 𝑦+𝑥
𝑓(𝑡𝑥, 𝑡𝑦) = = = = 𝑓(𝑥, 𝑦)
𝑡𝑥 𝑥

Já a equação a seguir não é homogênea

𝑦2
𝑓(𝑥, 𝑦) = 𝑦 ′ =
𝑥
pois

(𝑡𝑦)2 𝑡𝑦 2 𝑦 2
𝑓(𝑡𝑥, 𝑡𝑦) = = = ≠ = 𝑓(𝑥, 𝑦)
𝑡𝑥 𝑥 𝑥

Esse exemplo é bem mais simples:

𝑑𝑦 𝑦
= 𝐹( )
𝑑𝑥 𝑥

41
Problema do Valor Inicial

Como várias funções podem derivar para uma função única, dando, assim, várias
soluções para uma única equação diferencial, impõe-se condições iniciais para que seja
selecionada uma solução única entre as várias possíveis.
Por exemplo:
𝑦 ′′ = 3𝑦 ′ − 2𝑦, 𝑐𝑜𝑚 𝑦(0) = −1 𝑒 𝑦 ′ (0) = 0

y(0) e y’(0) são os valores iniciais. Veja que eles são dados para o mesmo ponto. O
chamado problema do valor inicial surge quando os valores iniciais são dados para
pontos diferentes.

Equações Diferenciais Lineares

São equações da forma

𝑏𝑛 (𝑥)𝑦 (𝑛) + 𝑏𝑛−1 (𝑥)𝑦 (𝑛−1) + ⋯ + 𝑏1 (𝑥)𝑦 ′ + 𝑏0 (𝑥)𝑦 = 𝑔(𝑥)

Onde bi(x) e g(x) só dependem de x. Se bn(x) ≠ 0 no intervalo, teremos:

𝑦 (𝑛) + 𝑎𝑛−1 (𝑥)𝑦 (𝑛−1) + ⋯ + 𝑎2 (𝑥)𝑦 ′′ + 𝑎1 (𝑥)𝑦 ′ + 𝑎0 (𝑥)𝑦 = ∅(𝑥)

Se Ø(x) = 0, a equação é dita homogênea; se os ai são constantes, a equação é dita de


coeficientes constantes.

42
Equações Diferenciais Lineares de Primeira Ordem

Denomina-se equação diferencial linear de primeira ordem, aquela que pode ser posta
sob a forma k(x)y’ + m(x)y = s(x). Se k(x) ≠ 0, temos (dividindo tudo por k(x)):

𝑦 ′ + 𝑎(𝑥)𝑦 = 𝑏(𝑥)

Há dois métodos para resolver esta equação:


1) Este é um fator integrante: 𝑒 ∫ 𝑎(𝑥)𝑑𝑥 . Multiplicando ambos os membros da
equação por este fator integrante, obtém-se:

𝑒 ∫ 𝑎(𝑥)𝑑𝑥 [𝑦 ′ + 𝑎(𝑥)𝑦] = 𝑒 ∫ 𝑎(𝑥)𝑑𝑥 𝑏(𝑥)

de onde resulta que


[𝑒 ∫ 𝑎(𝑥)𝑑𝑥 ]′ = 𝑏(𝑥)𝑒 ∫ 𝑎(𝑥)𝑑𝑥

Resolvendo-se relativamente a y, obtém-se:

𝑒 ∫ 𝑎(𝑥)𝑑𝑥 𝑦 = 𝐶 + ∫ 𝑏(𝑥) 𝑒 ∫ 𝑎(𝑥)𝑑𝑥 𝑑𝑥


onde C é uma constante. Finalmente:

𝑦 = 𝑒 − ∫ 𝑎(𝑥)𝑑𝑥 [𝐶 + ∫ 𝑏(𝑥) 𝑒 ∫ 𝑎(𝑥)𝑑𝑥 𝑑𝑥]

Exemplo: Resolver a equação diferencial x2y’ + xy = 2 + x2, com x > 0.

Dividindo ambos os membros por x2 e desenvolvendo:

𝑦 2 1 2
𝑦′ + = 2 + 1 → 𝑎(𝑥) = 𝑒 𝑏(𝑥) = 1 + 2
𝑥 𝑥 𝑥 𝑥
𝒅𝒙
Um fator integrante será 𝒆∫ 𝒙 = 𝒆𝐥𝐧(𝒙) = 𝒙. Se ambos os membros forem
𝟐
multiplicados por x, obtém-se (𝒙𝒚)′ = 𝒙 + 𝒙, resultando que:

𝑥2 2 𝑥 𝐶
𝑥𝑦 = 2 ln(𝑥) + + 𝐶 ⇒ 𝑦 = ln(𝑥) + + , 𝑥 > 0
2 𝑥 2 𝑥

43
2) Este método generaliza-se para equações diferenciais de ordem superior
[prova: multiplique a equação por 1/y].
Consideremos a equação diferencial y’ + a(x)y = b(x) e a equação homogênea
associada y’ + a(x)y = 0. Por substituição, verifica-se que 𝒆− ∫ 𝒂(𝒙)𝒅𝒙 é uma
solução da última equação. Para completar a solução, introduz-se uma nova
variável v, por meio da substituição 𝒚 = 𝒗𝒆− ∫ 𝒂(𝒙)𝒅𝒙 e 𝒚′ = [𝒗′ −
𝒂(𝒙)𝒗]𝒆− ∫ 𝒂(𝒙)𝒅𝒙 . A equação y’ + a(x)y = b(x) se transforma em:

𝑣 ′ 𝑒 − ∫ 𝑎(𝑥)𝑑𝑥 = 𝑏(𝑥)

resultando 𝑣 ′ = 𝑏(𝑥)𝑒 ∫ 𝑎(𝑥)𝑑𝑥 , dando:

𝑣 = 𝐶 + ∫ 𝑏(𝑥)𝑒 ∫ 𝑎(𝑥)𝑑𝑥 𝑑𝑥

Equação Linear Homogênea

Para resolver a equação linear homogênea k(x)y’ + m(x)y = 0, nota-se que as variáveis
são separáveis e
𝑑𝑦 𝑚(𝑥)
+ 𝑑𝑥 = 0, 𝑞𝑢𝑎𝑛𝑑𝑜 𝑘(𝑥) ≠ 0
𝑦 𝑘(𝑥)

Equações Diferenciais Homogêneas de Primeira Ordem

Se os coeficientes M(x, y) e N(x, y) da equação diferencial 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 =


0 com [𝑁(𝑥, 𝑦) ≢ 0] são tais que:
𝑀(𝑎𝑥, 𝑎𝑦) 𝑀(𝑥, 𝑦)

𝑁(𝑎𝑥, 𝑎𝑦) 𝑁(𝑥, 𝑦)

sendo a um número real não nulo, então a equação diferencial acima diz-se ter
coeficientes homogêneos. Quando isso acontece, qualquer das substituições

𝑦 = 𝑣𝑥, 𝑑𝑦 = 𝑣𝑑𝑥 + 𝑥𝑑𝑣 [2]

𝑥 = 𝑤𝑦, 𝑑𝑥 = 𝑤𝑑𝑦 + 𝑦𝑑𝑤 [3]

reduzirá a equação diferencial 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 = 0 a uma equação com
variáveis separáveis.

44
Exemplo:

A equação diferencial (x2 + y2)dx + 3xydy = 0 [4] possui coeficientes


homogêneos porque:
(𝑎𝑥)2 + (𝑎𝑦)2 𝑥 2 + 𝑦 2
≡ , (𝑎𝑥𝑦 ≠ 0)
3(𝑎𝑥)(𝑎𝑦) 3𝑥𝑦

Fazendo a substituição com [2], acima, [4] se transforma em:

(𝑥 2 + 𝑣 2 𝑥 2 )𝑑𝑥 + 3𝑥(𝑣𝑥)(𝑣𝑑𝑥 + 𝑥𝑑𝑣) = 0


ou
𝑑𝑥 3𝑣𝑑𝑣
+ =0
𝑥 1 + 4𝑣 2
A integração formal é simples:

3 3
= ln|𝑥| + ln(1 + 4𝑣 2 ) = ln(𝐶)
8 8

Fazendo v = y/x, implica que x2(x2 + 4y2)3 = C.

Um Fator Integrante

Quando a equação 𝑀(𝑥, 𝑦)𝑑𝑥 + 𝑁(𝑥, 𝑦)𝑑𝑦 = 0 possui coeficientes homogêneos,


𝟏
então é um fator integrante desta equação.
𝒙𝑴+𝒚𝑵

Teorema: Se os coeficientes M(x, y) e N(x, y) da equação acima são homogêneos e


possuem derivadas parciais contínuas em alguma região R do plano xy, então:

𝑥𝑀𝑥 + 𝑦𝑀𝑦 𝑀

𝑥𝑁𝑥 + 𝑦𝑁𝑦 𝑁

Trajetórias Ortogonais

Uma família de curvas que interceptam curvas de outra família ortogonalmente.

45
Equações Redutíveis às Equações de Primeira Ordem

Consideremos a equação diferencial y’’ – y’ = 0 [1]. Esta equação é de primeira ordem


na variável y’. Por esta razão, faz-se, habitualmente, a substituição P = y’ [2] e [1] se
transforma na equação diferencial de primeira ordem P’ – P = 0 [3], cuja solução é
dada por P = C1ex (C1 constante).
Dessa forma escreve-se y’ = C1ex, e após integração y = C1ex + C2 (C2 constante). A
substituição [2] tem sucesso quando na equação não aparece y explicitamente.
Quando x não aparece explicitamente na equação, faz-se a substituição:

𝑑𝑃 𝑑𝑃 𝑑𝑦 𝑑𝑃
𝑦′ = 𝑃 𝑦 ′′ = = × =𝑃× [4]
𝑑𝑥 𝑑𝑦 𝑑𝑥 𝑑𝑦

Equações Diferenciais Lineares com Coeficientes Constantes

As mais simples equações diferenciais lineares são aquelas que podem ser escritas sob
a forma:
𝑎0 𝑦 (𝑛) + 𝑎1 𝑦 (𝑛−1) + ⋯ + 𝑎𝑛−1 𝑦 ′ + 𝑎𝑛 𝑦 = 𝑓(𝑥) [1]

onde a0, a1, ..., an são constantes reais. A equação homogênea associada é:

𝑎0 𝑦 (𝑛) + 𝑎1 𝑦 (𝑛−1) + ⋯ + 𝑎𝑛−1 𝑦 ′ + 𝑎𝑛 𝑦 = 0 [2]

Quando a0 ≠ 0, estas equações são ditas de ordem n.


Verifica-se, facilmente, que se u(x), v(x) forem soluções de [2], então C1u(x) + C2v(x),
onde C1 e C2 são constantes, também será solução de [2]. O método geral para
resolver [2] é procurar uma solução da forma y = emx, sendo m uma constante.
Se substituirmos em [2], obtemos:

𝑒 𝑚𝑥 (𝑎0 𝑚𝑛 + 𝑎1 𝑚𝑛−1 + ⋯ + 𝑎𝑛−1 𝑚 + 𝑎𝑛 ) = 0 [3]

É claro que se m1 for uma qualquer raiz da equação polinomial em m (denominada


equação auxiliar ou equação indicial):

(𝑎0 𝑚𝑛 + 𝑎1 𝑚𝑛−1 + ⋯ + 𝑎𝑛−1 𝑚 + 𝑎𝑛 ) = 0 [4]

então 𝒆𝒎𝟏 𝒙 é uma solução de [2]. O método varia de acordo com a natureza das raízes
de [4], isto é, se são reais ou complexas, simples ou múltiplas.

46
Para tornar clara a exposição, necessitamos do resultado seguinte sobre as equações
homogêneas. Consideremos a equação:

𝑎0 (𝑥)𝑦 (𝑛) + 𝑎1 (𝑥)𝑦 (𝑛−1) + ⋯ + 𝑎𝑛−1 (𝑥)𝑦 ′ + 𝑎𝑛 (𝑥)𝑦 = 0 [5]

sendo a0(x), a1(x), ..., an-1(x), funções contínuas no intervalo (a,b), sendo a0(x) ≠ 0.

Teorema: Existem n soluções y1(x), y2(x), ..., yn(x) [6] de [5] no intervalo (a,b) com
propriedade:
𝑦1 (𝑥) 𝑦2 (𝑥) … 𝑦𝑛 (𝑥)
𝑦 ′1 (𝑥) 𝑦 ′ 2 (𝑥) … 𝑦 ′ 𝑛 (𝑥)
| … … … | ≠ 0 [7]
(𝑛−1)
𝑦1 (𝑥) 𝑦2
(𝑛−1)
(𝑥) … 𝑦𝑛(𝑛−1) (𝑥)

Isso significa que as soluções são linearmente independentes.

Também, se y1(x), y2(x), ..., yn(x) forem n soluções de [5] para as quais vale a condição
[7], então toda solução de [5] escreve-se sob a forma:

𝐶1 𝑦1 (𝑥) + 𝐶2 𝑦2 (𝑥) + ⋯ + 𝐶𝑛 𝑦𝑛 (𝑥) [8]

sendo C1, C2, ..., Cn constantes.

A função [8] é denominada a solução geral de [5], desde que toda solução pode ser
escrita sob esta forma e toda combinação linear de soluções é ainda solução de [5].
O determinante [7] é chamado o wronskiano das n soluções.

Se existir um x em (a,b) para o qual uma ou mais funções a0(x), a1(x), ..., an-1(x), an(x)
deixa de ser contínua ou anula a0(x), ele será denominado um ponto singular da
equação [5].
Diz-se que uma equação diferencial linear homogênea de segunda ordem possui um
ponto singular regular em x = a se ela puder ser escrita sob a forma:

(𝑥 − 𝑎)2 𝑝0 (𝑥)𝑦 ′′ + (𝑥 − 𝑎)𝑝1 (𝑥)𝑦 ′ + 𝑝2 (𝑥)𝑦 = 0

sendo p0(x), p1(x), p2(x) representáveis em séries de potências de (x – a), convergentes


no intervalo comum |x – a| < h, com h > 0 e p0(x) ≠ 0 neste intervalo.

47
Dependência Linear

Duas soluções u1, u2 são linearmente dependentes se existem C1 e C2, não ambos
nulos, tal que C1u1(x) + C2u2(x) ≡ 0 para todo x ϵ (a,b).

Teorema: Existem duas soluções linearmente independentes y1(x), y2(x) da equação

𝑎0 (𝑥)𝑦 ′′ + 𝑎1 (𝑥)𝑦 ′ + 𝑎2 (𝑥)𝑦 = 0 [2.1]

com a propriedade de que toda solução y(x) de [2.1] pode ser escrita sob a forma

𝑦(𝑥) = 𝐶1 𝑦1 (𝑥) + 𝐶2 𝑦2 (𝑥)

Sendo C1, C2 constantes escolhidas adequadamente.

Teorema: Duas soluções y1(x) e y2(x) de [2.1] são linearmente dependentes se, e
somente se, seu wronskiano for nulo:
𝑦1 (𝑥0 ) 𝑦2 (𝑥)
| |≡0
𝑦′1 (𝑥) 𝑦′2 (𝑥)

Raízes Reais Distintas

Se as raízes de [4] são os n números reais e distintos m1, m2, ..., mn, as funções 𝒆𝒎𝟏 𝒙 ,
𝒆𝒎𝟐 𝒙 , ..., 𝒆𝒎𝒏 𝒙 constituem o conjunto de n soluções que satisfazem [7], e a solução
geral de [2] é:
𝑪 𝟏 𝒆𝒎 𝟏 𝒙 + 𝑪 𝟐 𝒆𝒎 𝟐 𝒙 + ⋯ + 𝑪 𝒏 𝒆𝒎 𝒏 𝒙
Exemplo:
y'’ + y’ – 2y = 0. A equação auxiliar é m2 + m – 2 =0 e possui raízes 1 e -2,
que são reais e distintas. A solução geral será:

𝑦 = 𝐶1 𝑒 𝑥 + 𝐶2 𝑒 −2𝑥

Raízes Reais Múltiplas

Se a equação diferencial é de terceira ordem conduzindo a uma equação auxiliar com


raízes 2, 2, 2, a solução geral da equação é

𝑦 = 𝐶1 𝑒 2𝑥 + 𝐶2 𝑒 2𝑥 + 𝐶3 𝑒 2 𝑒 2𝑥

E assim por diante.

48
Exemplo:

y’’’ – y’’ – y’ + y = 0.

O polinômio característico associado r3 – r2 – r + 1 = 0 tem raízes 1, 2, 3 e


soluções y1(x) = ex, y2(x) = e2x, y3(x) = e3x. A solução geral é:

𝑦(𝑥) = 𝐶1 𝑒 𝑥 + 𝐶2 𝑒 2𝑥 + 𝐶3 𝑒 3𝑥

Raízes Complexas

Se a equação auxiliar possui raiz complexa (a + bi), ela também possui a raiz conjugada
(a – bi). As funções eax.Cos(bx), eax.Sen(bx) são soluções linearmente independentes
correspondentes àquelas raízes.
Exemplo:
y'’ – 4y’ + 13y = 0

A eq. auxiliar correspondente possui raízes c = (2 + 3i) e h = (2 - 3i). De


acordo com a teoria acima, as funções e2x.Cos(3x), e2x.Sen(3x) serão
soluções da equação. Para provar, basta derivar uma dessas funções e
substituir na equação.

Se a equação auxiliar possui raízes complexas repetidas, (a + bi), (a + bi), (a - bi), (a -


bi), verifica-se que a solução geral da equação é:

𝐶1 𝑒 𝑎𝑥 𝐶𝑜𝑠(𝑏𝑥) + 𝐶2 𝑒 𝑎𝑥 𝑆𝑒𝑛(𝑏𝑥) + 𝐶3 𝑥𝑒 𝑎𝑥 𝐶𝑜𝑠(𝑏𝑥) + 𝐶4 𝑥𝑒 𝑎𝑥 𝑆𝑒𝑛(𝑏𝑥)

Equação de Euler

Seja a equação

𝑎0 𝑥 𝑛 𝑦 (𝑛) + 𝑎1 𝑥 𝑛−1 𝑦 (𝑛−1) + 𝑎2 𝑥 𝑛−2 𝑦 (𝑛−2) + ⋯ + 𝑎𝑛−1 𝑥1 𝑦 ′ + 𝑎𝑛 𝑦 = 0

com a0 ≠ 0, sendo a0, a1, a2, ..., an constantes. A transformação x = et reduz esta
equação a uma equação linear com coeficientes constantes.

49
Exemplo:

Encontre a solução geral da equação diferencial x2y’’ – 2xy’ + 2y = 0.


Fazendo x = et:
𝑑𝑦 𝑑𝑦/𝑑𝑡 1 𝑑𝑦
𝑦′ = = = ×
𝑑𝑥 𝑑𝑥/𝑑𝑡 𝑥 𝑑𝑡

𝑑𝑦 𝑑𝑦
𝑑( ) 𝑑( )/𝑑𝑡 1 𝑑 2 𝑦 𝑑𝑦
′′
𝑦 = 𝑑𝑥 = 𝑑𝑥 = 2( 2 − )
𝑑𝑥 𝑑𝑥/𝑑𝑡 𝑥 𝑑𝑡 𝑑𝑡

O que transforma a equação em:

𝑑2𝑦 𝑑𝑦
2
−3 + 2𝑦 = 0
𝑑𝑡 𝑑𝑡
Cuja solução geral é:
𝑦 = 𝐶1 𝑒 𝑡 + 𝐶2 𝑒 2𝑡

Assim, a solução geral da equação será:

𝑦 = 𝐶1 𝑥 + 𝐶2 𝑥 2

Obs.: As soluções devem ser definidas em intervalos em que x ≠ 0, pois a


equação de Euler é singular neste ponto: para x = et, 0 = et não é definido.

Equação de Bernoulli

É uma equação da forma y’ + a(x)y = b(x)yn, que não é linear. Para linearizar, fazemos
u = y1-n, de onde u’ = (1 – n)y-n x y’, o que implica que y’ = (1 – n)yn x u’. Substituindo
na equação inicial: (1 –n)yn.u’ + a(x)y = yn e multiplicando tudo por y-n resultará na
equação (1 – n).u’ + a(x)y1-n = 1. Mas, de cima, temos u = y1-n, o que nos leva à
equação linear
(𝟏 − 𝒏). 𝒖′ + 𝒂(𝒙)𝒖 = 𝟏

Equações Diferenciais Não Homogêneas

Consideremos a equação diferencial y’’ – 3y’ + 2y = 4. Com ela, associamos a equação


homogênea y’’ – 3y’ + 2y = 0. A solução geral desta equação homogênea é dada por
C1ex + C2e2x. Queremos encontrar a solução geral de y’’ – 3y’ + 2y = 4. Usamos o
seguinte:

50
Teorema: Se C1y1(x) + C2y2(x) é a solução geral de a(x)y’’ + b(x)y’ + c(x)y = 0, e se
qualquer y0(x) é qualquer solução particular da equação não homogênea dada por
a(x)y’’ + b(x)y’ + c(x)y = f(x), a solução geral desta é y0(x) + C1y1(x) + C2y2(x).

Exemplo 1:
𝑦 ′′ − 𝑦 ′ − 2𝑦 = −2𝑒 𝑥 − 10𝐶𝑜𝑠(𝑥)

Esta equação contém os termos ex e Cos(x). Suas possíveis derivadas são ex e


Sen(x), a menos de fatores constantes. O plano é tentar determinar as
constantes a, b, c de modo que a função aex +bSen(x) +cCos(x) seja uma
solução para a equação acima.
Substituindo os termos da equação pelos termos desta função, obtemos:

−2𝑎𝑒 𝑥 + (𝑐 − 3𝑏)𝑆𝑒𝑛(𝑥) − (3𝑐 + 𝑏)𝐶𝑜𝑠(𝑥) = −2𝑒 𝑥 − 10𝐶𝑜𝑠(𝑥)

Daí obtém-se o sistema

−2𝑎 = −2 𝑎 = 1
𝑐 − 3𝑏 = 0 } 𝑏 = 1
3𝑐 + 𝑏 = 10 𝑐 = 3

Uma solução para 𝑦 ′′ − 𝑦 ′ − 2𝑦 = −2𝑒 𝑥 − 10𝐶𝑜𝑠(𝑥) será 𝑒 𝑥 + 𝑆𝑒𝑛(𝑥) +


3𝐶𝑜𝑠(𝑥).
Sendo C1e-x + C2e2x a solução geral da equação homogênea y’’ – y’ – 2y = 0, a
solução geral da equação não homogênea será:

𝑒 𝑥 + 𝑆𝑒𝑛(𝑥) + 3𝐶𝑜𝑠(𝑥) + 𝐶1 𝑒 −𝑥 + 𝐶2 𝑒 2𝑥

Exemplo 1:
𝑦 ′′ + 𝑦 = 3 [1]

A solução geral da equação homogênea correspondente y’’ + y = 0 será dada


por C1Sen(x) + C2Cos(x). Por inspeção, verifica-se que uma solução particular de
[1] é 3. Assim, a solução geral de [1] é 3 + C1Sen(x) + C2Cos(x).

Equações Diferenciais Lineares de Ordem n

Entende-se por equação diferencial linear de ordem n aquela equação da forma:

𝑎0 (𝑥)𝑦 (𝑛) + 𝑎1 (𝑥)𝑦 (𝑛−1) + ⋯ + 𝑎𝑛−1 (𝑥)𝑦 ′ + 𝑎𝑛 (𝑥)𝑦 = 𝑓(𝑥) [1.1]

Com a0(x) ≠ 0 em (a,b) e a0(x), a1(x), ..., an(x), f(x) contínuas em (a,b).

51
Teorema: Seja x = x0 um ponto no intervalo (a,b) e seja C0, C1, C2, ..., Cn-1 um conjunto
arbitrário de n números reais. Existe uma, e somente uma, solução y(x) da equação
[1.1] com propriedade y(x0) = C0, y’(x0) = C1, ..., y(n-1)(x0) = Cn-1. Ainda mais: essa
solução é definida sobre o intervalo inteiro (a,b). Se f(x) ≡ 0 sobre (a,b), então [1.1] é
homogênea.

Corolário: Uma solução y(x) da homogênea tal que y(x0) = 0, y’(x0) = 0, ..., y(n-1)(x0) = 0
para algum x0 em (a,b) é identicamente zero em (a,b).

Existência de Soluções para uma Equação Diferencial

Definição: Uma solução de uma equação diferencial de ordem n yn = f[x,y,y’,...,y(n-1)] é


uma função y(x) definida sobre um intervalo do eixo x, tal que

𝑦 (𝑛) (𝑥) ≡ 𝑓[𝑥, 𝑦(𝑥), 𝑦 ′ (𝑥), … , 𝑦 (𝑛−1) (𝑥)]

Para todo x no intervalo.

Teorema: Sejam f(x,y) e fy(x,y) funções contínuas das variáveis x e y em uma região R
do plano xy, contendo o ponto (x0, y0). Podemos tomar uma constante positiva h tal
que exista uma, e somente uma, solução y(x) da equação diferencial y’ = f(x,y) no
intervalo x0 ≤ x ≤ (x0 + h), sendo y(x0) = y0.

Exemplo:
y’ = y – Desejamos encontrar uma solução y(x) que satisfaça a condição
y(0) = 1. Aqui f(x,y) = y e fy(x,y) = 1.
Existe só uma solução – nota-se que é ex.

Teorema (para equações de segunda ordem): Sejam f(x,y,z), fy(x,y,z) e fz(x,y,z)


funções contínuas das variáveis x, y, z em alguma região tridimensional R, contendo o
ponto (x0,y0,z0). Se h for positivo e suficientemente pequeno, existe uma, e somente
uma, solução y(x) da equação diferencial y’’ = f(x,y,y’) no intervalo x0 ≤ x ≤ (x0+h), tal
que y(x0) = y0 e y’(x0) = z0.

52
Teorema da Existência e Unicidade (T.E.U)

Seja uma equação diferencial y(n) = F(x,y,y’,y’’,...,y(n-1)). Suponhamos que F seja


definida, contínua e com derivadas parciais de primeira ordem em relação a y,
y’, ..., y(n-1) contínuas na região |x – x0| < h, |y – y0| < h, ..., |y(n-1) – y0(n-1)| < h.
Então existe y = f(x) em |x – x0| < h1 que é solução da equação diferencial,
satisfazendo as condições iniciais:

(𝑛−1)
𝑦(𝑥0 ) = 𝑦0 , 𝑦 ′ (𝑥0 ) = 𝑦′0 , … , 𝑦 (𝑛−1) (𝑥0 ) = 𝑦0

Mais ainda, se y = g(x) é uma solução da equação que satisfaz as condições


iniciais, então f(x) = g(x), onde as duas estiverem definidas, isto é, a solução é
única.

Seja P(x,y)dx + Q(x,y)dy = 0. Nos pontos onde Q(x,y) ≠ 0 temos que:

𝑑𝑦 𝑃(𝑥, 𝑦)
=− = 𝐹(𝑥, 𝑦)
𝑑𝑥 𝑄(𝑥, 𝑦)
Seja
𝜕𝑃 𝜕𝑄
𝜕𝐹 𝑄 −𝑃
𝜕𝑦 𝜕𝑦
=− 2
𝜕𝑦 𝑄

𝜕𝑃 𝜕𝑄
Nos pontos onde 𝑃, 𝑄, 𝜕𝑦 𝑒 são contínuas e Q não se anula, podemos aplicar o
𝜕𝑦
T.E.U. Onde o T.E.U não pode ser aplicado é, claramente, um ponto de singularidade.

Fator Integrante

Suponhamos Pdx + Qdy = 0 não exata. Seja h uma função de x, e seja h um fator
integrante. Nesse caso, temos hPdx + hPdy = 0 exata. Se essa equação é exata, temos
que:
𝜕(ℎ𝑄) 𝜕(ℎ𝑃)
= ⟹ ℎ𝑄𝑥 + ℎ′ 𝑄 = ℎ𝑃𝑦 ⟹
𝜕𝑥 𝜕𝑦

ℎ′ 𝑃𝑦 − 𝑄𝑥
⟹ ℎ′ 𝑄 = ℎ(𝑃𝑦 − 𝑄𝑥 ) ⟹ =
ℎ 𝑄

Vemos que
𝑷𝒚 −𝑸𝒙
1 𝑑[ln(ℎ)] 𝑃𝑦 − 𝑄𝑥 ∫
× ℎ′ = ⟹ ln(ℎ) = ∫ ⟹𝒉=𝒆 𝑸
ℎ 𝑑𝑥 𝑄

53
𝑷𝒚 −𝑸𝒙
𝑃𝑦 −𝑄𝑥 ∫ 𝒅𝒙
Portanto, se é uma função só de x, então 𝒆 𝑸 é um fator integrante. Se
𝑄
𝑸𝒙 −𝑷𝒚
𝑄𝑥 −𝑃𝑦 𝒅𝒙
é uma função que depende só de y, 𝒆∫ −𝑷 é um fator integrante.
−𝑃

TODA EQUAÇÃO DIFERENCIAL LINEAR É DO PRIMEIRO GRAU, MAS, NEM TODA


EQUAÇÃO DIFERENCIAL DO PRIMEIRO GRAU É LINEAR.

Método dos Coeficientes Indeterminados

Consideremos a equação diferencial y’’ – y = 2ex [4.7]. A solução geral da equação


homogênea correspondente y’’ – y = 0 [4.8] é C1ex + C2e-x.
Tentaremos determinar a constante a ≠ 0 tal que y = aex seja uma solução de [4.7].
Substituindo isso em [4.7] temos 0 = 2ex, para a determinação da constante a. Isto não
é possível, sendo necessário outro método.

Este método falhou porque o termo ex (em 2ex) na equação [4.7] é também uma
solução da equação homogênea [4.8]. Pode-se superar essa dificuldade procurando-se
determinar a constante a ≠ 0, tal que y = aex seja uma solução de [4.7].
Tem-se: 2aex = 2ex, o que implica a = 1, e a solução particular de [4.7] é xex. Sua
solução geral é, então: xex + C1ex + C2e-x.
Exemplo:
𝑦 ′′ − 𝑦 ′ − 2𝑦 = 4𝑥 2

A solução geral da equação homogênea associada é:

𝑦ℎ = 𝑐1 𝑒 −𝑥 + 𝑐2 𝑒 2𝑥

Ø(x) = 4x2 é um polinômio de segundo grau. Temos, então, que:

𝑦𝑝 = 𝐴2 𝑥 2 + 𝐴1 𝑥 + 𝐴0 [1]

Assim, y’p = 2A2x + A1 e y’’ = 2A2. Substituindo este resultado na equação


diferencial, temos:

2𝐴2 − (2𝐴2 𝑥 + 𝐴1 ) − 2(𝐴2 𝑥 2 + 𝐴1 𝑥 + 𝐴0 ) = 4𝑥 2


Ou
−2𝐴2 𝑥 2 + (−2𝐴2 − 2𝐴1 )𝑥 + (2𝐴2 − 𝐴1 − 2𝐴0 ) = 4𝑥 2 + 0𝑥 + 0

54
Igualando os coeficientes de mesmas potências de x:

−2𝐴2 = 4, −2𝐴2 − 2𝐴1 = 0, 2𝐴2 − 𝐴1 − 2𝐴0 = 0

E A2 = -2, A1 = 2, A0 = 3 e [1] se transforma em:

𝑦𝑝 = −2𝑥 2 + 2𝑥 − 3
E a solução geral é:
𝑦 = 𝑦ℎ + 𝑦𝑝

Ø(x) não pode ter termos comuns com yh.

Regras:
1) Se Ø(x) = Pn(x), fazemos yp = Anxn + An-1xn-1 + ...+ A1x + A0
2) Se Ø(x) = eαx.Pn(x), fazemos yp = eαx(Anxn + An-1xn-1 + ...+ A1x + A0)
3) Se Ø(x) = eαx.Pn(x).Sen(βx), α e β conhecidos, fazemos yp =
eαx.Sen(βx).(Anxn + An-1xn-1 + ...+ A1x + A0) + eαx.Cos(βx).(Bnxn + ... + B0)

Exemplo:
𝑦 ′′ − 𝑦 ′ − 2𝑦 = 0
𝑦 ′′ − 𝑦 ′ − 2𝑦 = 𝑒 3𝑥 {
𝑦ℎ = 𝑐1 𝑒 −𝑥 + 𝑐2 𝑒 2𝑥

∅(𝑥) = 𝑒 𝛼𝑥 𝑃𝑛 (𝑥) 𝑒 𝛼 = 3, 𝑃𝑛 (𝑥) = 1

Então (de cima):

𝑦𝑝 = 𝐴0 𝑒 3𝑥 𝑒 𝑦′1 = 3𝐴0 𝑒 3𝑥 , 𝑦′′𝑝 = 9𝐴0 𝑒 3𝑥

Substituindo na equação resulta:

9𝐴0 𝑒 3𝑥 − 3𝐴0 𝑒 3𝑥 − 2𝐴0 𝑒 3𝑥 = 𝑒 3𝑥

Ou
1
4𝐴0 𝑒 3𝑥 = 𝑒 3𝑥 ⟹ 4𝐴0 = 1 ⟹ 𝐴0 =
4
Então:
1 3𝑥
𝑦𝑝 = 𝑒
4
E a solução geral é yh + yp = y.

55
Método da Variação dos Parâmetros

Estudaremos a equação 𝑎0 (𝑥)𝑦′′ + 𝑎1 (𝑥)𝑦′ + 𝑎2 (𝑥)𝑦 = 𝑓(𝑥) [3.1], sendo,


usualmente, a0(x), a1(x), a2(x) e f(x) contínuas, com a0 ≠ 0, em (a,b). A esta equação
associamos a correspondente equação homogênea:

𝑎0 (𝑥)𝑦′′ + 𝑎1 (𝑥)𝑦′ + 𝑎2 (𝑥)𝑦 = 0 [3.2]

A equação [3.2] possui uma solução geral da forma 𝐶1 𝑦1 (𝑥) + 𝐶2 𝑦2 (𝑥) [3.3] com
y1(x) e y2(x) soluções linearmente independentes de [3.2], com C1 e C2 constantes
quaisquer.

Teorema: Se y0(x) for uma qualquer solução de [3.1], a solução geral de [3.1] pode ser
escrita sob a forma 𝑦0 (𝑥)𝐶1 𝑦1 (𝑥) + 𝐶2 𝑦2 (𝑥), sendo y1(x) e y2(x) soluções linearmente
independentes de [3.2], C1 e C2 constantes quaisquer.

Suponhamos que y1(x) e y2(x) sejam soluções linearmente independentes da


correspondente equação homogênea [3.2]. Determinaremos as funções u1(x) e u2(x)
tais que 𝑦0 (𝑥) = 𝑢1 (𝑥)𝑦1 (𝑥) + 𝑢2 (𝑥)𝑦2 (𝑥) seja uma solução particular de [3.1] e tal
que 𝑢′1 (𝑥)𝑦1 (𝑥) + 𝑢′ 2 (𝑥)𝑦2 (𝑥) = 0 [3.4] (“variação dos parâmetros”).

Substituindo y0(x) em [3.1] e usando [3.4], obtém-se

𝑓(𝑥)
𝑢′1 (𝑥)𝑦′1 (𝑥) + 𝑢′ 2 (𝑥)𝑦′2 (𝑥) = [3.5]
𝑎0 (𝑥)
e
𝑦2 (𝑥)𝑓(𝑥) 𝑦1 (𝑥)𝑓(𝑥)
𝑢′1 (𝑥) = − , 𝑢′2 (𝑥) =
𝑎0 (𝑥)𝑤(𝑥) 𝑎0 (𝑥)𝑤(𝑥)
sendo
𝑤(𝑥) = 𝑦1 (𝑥)𝑦′2 (𝑥) − 𝑦′1 (𝑥)𝑦2 (𝑥)
o wronskiano de y1(x), y2(x).
Ainda:
𝑥 𝑥
𝑦2 (𝑡)𝑓(𝑡) 𝑦1 (𝑡)𝑓(𝑡)
𝑢1 (𝑥) = − ∫ 𝑑𝑡; 𝑢2 (𝑥) = ∫ 𝑑𝑡
𝑥0 𝑎0 (𝑡)𝑤(𝑡) 𝑥0 𝑎0 (𝑡)𝑤(𝑡)

Uma solução particular de [3.1] é, portanto:

𝑦0 (𝑥) = 𝑢1 (𝑥)𝑦1 (𝑥) + 𝑢2 (𝑥)𝑦2 (𝑥)

Seja a equação y’’ + y = 1 [3.6] e a homogênea associada y’’ + y = 0 [3.7]. Para


encontrar a solução geral de [3.6], inicialmente encontrar-se a solução geral de [3.7]. A
seguir, determina-se uma solução particular de [3.6] por algum método adequado. A
soma das duas é a solução geral de [3.6].

56
A solução geral de [3.7] é C1Sen(x) + C2Cos(x). Verifica-se, substituindo na equação que
y = 1 é uma solução particular de [3.6]. Desta forma, a solução geral de [3.6] é:

1 + 𝐶1 𝑆𝑒𝑛(𝑥) + 𝐶2 𝐶𝑜𝑠(𝑥)
Com C1 e C2 constantes quaisquer.

O Operador Linear L(y)

𝐿(𝑦) = 𝑦 (𝑛) + 𝑎𝑛−1 (𝑥)𝑦 (𝑛−1) + ⋯ + 𝑎2 (𝑥)𝑦 ′′ + 𝑎1 (𝑥)𝑦 ′ + 𝑎0 (𝑥)𝑦

Se a equação é homogênea, L(y) = 0.

O operador L(y) é linear, isto é, L(c1y1 +c2y2) = c1L(y1) + c2L(y2), sendo c1, c2 constantes
quaisquer e y1, y2 funções diferenciáveis arbitrárias de ordem até n.

Princípio da Superposição

Se y1 e y2 são duas soluções de L(y) = 0, então c1y1 + c2y2 são também soluções de
L(y), para duas constantes c1 e c2 quaisquer.

Se Q(x) = k1Q1(x) + k2Q2(x) e se y1(x) e y2(x) são, respectivamente, soluções das


equações L(y) = Q1(x) e L(y) = Q2(x), então y(x) = k1y1(x) + k2y2(x) é solução da
equação L(y) = Q(x).

Dependência Linear de Soluções

Um conjunto de funções {y1(x), y2(x), ..., yn(x)} é linearmente dependente em a ≤ x ≤ b


se existem constantes c1, c2, ..., cn, não todas nulas, tal que:

𝑐1 𝑦1 (𝑥) + 𝑐2 𝑦2 (𝑥) + ⋯ + 𝑐𝑛 𝑦𝑛 (𝑥) ≡ 0, 𝑐𝑜𝑚 𝑎 ≤ 𝑥 ≤ 𝑏

Exemplo: O conjunto {x, 5x, 1, Sen(x)} é linearmente dependente, pois, existem c1 = -5,
c2 = 1, c3 = 0 e c4 = 0 (não todos nulos, como se vê) tal que:

−5(𝑥) + 1(5𝑥) + 0(1) + 0(𝑆𝑒𝑛(𝑥)) = 0

Se apenas c1 = c2 = ... = cn = 0 satisfazem a definição, então temos independência


linear.

57
Teorema: A equação diferencial de n-ésima ordem L(y) = 0 tem sempre n soluções
linearmente independentes. Se y1(x), y2(x), ..., yn(x) representam estas soluções,
então a solução geral de L(y) = 0 é:

𝑦(𝑥) = 𝑐1 𝑦1 (𝑥) + 𝑐2 𝑦2 (𝑥) + ⋯ + 𝑐𝑛 𝑦𝑛 (𝑥)

Definição: Seja {Z1(x), Z2(x), ..., Zn(x)} um conjunto de funções sobre a ≤ x ≤ b, cada
uma possuindo (n – 1) derivadas. O wronskiano do conjunto de soluções é dado por:

𝑍1 𝑍2 … 𝑍𝑛
𝑍1′ 𝑍2′ … 𝑍𝑛′
| |
𝑊(𝑍1 , 𝑍2 , … , 𝑍𝑛 = 𝑍1′′ 𝑍2′′ … 𝑍𝑛′′
| ⋮ ⋮ ⋮ ⋮ |
(𝑛−1) (𝑛−1) (𝑛−1)
𝑍1 𝑍2 ⋯ 𝑍𝑛

O wronskiano de {x, x2, x3} é:


𝑥 𝑥2 𝑥3
|1 2𝑥 3𝑥 2 | = 2𝑥 3
0 2 6𝑥

Teorema: Seja {y1(x), y2(x), ..., yn(x)} um conjunto de soluções da equação diferencial
de n-ésima ordem homogênea L(y) = 0. Este conjunto é linearmente independente em
a ≤ x ≤ b se, e somente se, o wronskiano do conjunto não é identicamente nulo.

Exemplo:
As duas soluções y1(x) = Sen(2x) e y2(x) = Cos(2x) de y’’ + 4y = 0 são
linearmente independentes para qualquer x, pois:

𝑆𝑒𝑛(2𝑥) 𝐶𝑜𝑠(2𝑥)
| | = −2 ≠ 0
2𝐶𝑜𝑠(2𝑥) −2𝑆𝑒𝑛(2𝑥)

As soluções em erx, Sen(ax), Cos(bx) só são válidas se a equação é linear e tem


coeficientes constantes.

Uma solução particular de L(y) = Ø(x), que vimos acima, tem a forma:

𝑦𝑝 = 𝑣1 𝑦1 (𝑥) + 𝑣2 𝑦2 (𝑥) + ⋯ + 𝑣𝑛 𝑦𝑛 (𝑥)

58
Onde os yi(x) são as soluções da homogênea associada e os vi são funções a serem
determinadas (substituem os parâmetros Ci).
Para encontrar os vi, primeiro resolva as seguintes equações lineares simultaneamente
para v’i:
𝑣′1 𝑦1 + 𝑣′2 𝑦2 + ⋯ + 𝑣′𝑛 𝑦𝑛 = 0
𝑣′1 𝑦′1 + 𝑣′2 𝑦′2 + ⋯ + 𝑣′𝑛 𝑦′𝑛 = 0

(𝑛−2) (𝑛−2) (𝑛−2)
𝑣′1 𝑦1 + 𝑣′2 𝑦2 + ⋯ + 𝑣′𝑛 𝑦𝑛 =0
(𝑛−1) (𝑛−1) ′ (𝑛−1)
𝑣′1 𝑦1 + 𝑣′2 𝑦2 + ⋯ + 𝑣 𝑛 𝑦𝑛 = ∅(𝑥)

e então integrar cada v’i para obter vi, sem considerar as constantes na integração.
Isto é permitido porque estamos procurando apenas uma solução particular.

Se n = 3, temos Se n = 2, temos Se n = 1, temos

𝑣′1 𝑦1 + 𝑣′2 𝑦2 + 𝑣′3 𝑦3 = 0 𝑣′1 𝑦1 + 𝑣′2 𝑦2 = 0 𝑣′1 𝑦1 = ∅(𝑥)


𝑣 ′1 𝑦′1 + 𝑣 ′ 2 𝑦′2 + 𝑣 ′ 3 𝑦′3 = 0 𝑣 ′1 𝑦′1 + 𝑣 ′ 2 𝑦′2 = 0
𝑣′1 𝑦′′1 + 𝑣′2 𝑦′′2 + 𝑣′3 𝑦′′3 = 0

Exemplo: y’’’ + y’ = Sec(x)

Para n = 3 e a solução da homogênea associada, que é yn(x) = C1 + C2Cos(x) + C3Sen(x),


daí, substituindo os Ci pelos vi:

𝑦𝑝 = 𝑣1 + 𝑣2 𝐶𝑜𝑠(𝑥) + 𝑣3 𝑆𝑒𝑛(𝑥)

desde que y1 =1, y2 = Cos(x), y3 = Sen(x) e Ø(x) = Sec(x), temos:

𝑣 ′1 (1) + 𝑣 ′ 2 [𝐶𝑜𝑠(𝑥)] + 𝑣 ′ 3 [𝑆𝑒𝑛(𝑥)] = 0


𝑣 ′1 (0) + 𝑣 ′ 2 [−𝑆𝑒𝑛(𝑥)] + 𝑣 ′ 3 [𝐶𝑜𝑠(𝑥)] = 0 ⇒
′ (0) ′ [−𝐶𝑜𝑠(𝑥)] ′ [−𝑆𝑒𝑛(𝑥)]
𝑣1 +𝑣 2 +𝑣 3 = 𝑆𝑒𝑐(𝑥)

𝑣 ′1 + 𝑣 ′ 3 [𝑆𝑒𝑛(𝑥)] = −𝑣 ′ 2 [𝐶𝑜𝑠(𝑥)] [1]


⇒ −𝑣 ′ 2 [𝑆𝑒𝑛(𝑥)] = 𝑣 ′ 3 [𝐶𝑜𝑠(𝑥)] [2]
−𝑣 ′ 2 [𝐶𝑜𝑠(𝑥)] = −𝑆𝑒𝑐(𝑥) + 𝑣 ′ 3 [𝑆𝑒𝑛(𝑥)] [3]

59
Fazendo [1] + [3], temos que v1 = Sec(x), v2 = –1, v3 = –Tan(x), então:

𝑣′1 = ∫ 𝑆𝑒𝑐(𝑥)𝑑𝑥 = ln |𝑆𝑒𝑐(𝑥) − 𝑇𝑎𝑛(𝑥)|

𝑣′2 = − ∫ 𝑑𝑥 = −𝑥

𝑣′3 = − ∫ 𝑇𝑎𝑛(𝑥)𝑑𝑥 = ln |𝐶𝑜𝑠(𝑥)|

Substituindo em yp, temos:

𝑦𝑝 = ln|𝑆𝑒𝑐(𝑥) − 𝑇𝑎𝑛(𝑥)| − 𝑥𝐶𝑜𝑠(𝑥) + 𝑆𝑒𝑛(𝑥) × ln |𝐶𝑜𝑠(𝑥)|

e a solução geral é dada por y = yh + yp.

Sistemas de Equações Diferenciais Lineares

São sistemas do tipo

𝑑𝑥1
= 𝑎11 (𝑡)𝑥1 + 𝑎12 (𝑡)𝑥2 + ⋯ + 𝑎1𝑛 (𝑡)𝑥𝑛
𝑑𝑡
𝑑𝑥2 [1.1]
= 𝑎21 (𝑡)𝑥1 + 𝑎22 (𝑡)𝑥2 + ⋯ + 𝑎2𝑛 (𝑡)𝑥𝑛
𝑑𝑡

𝑑𝑥𝑛
= 𝑎𝑛1 (𝑡)𝑥1 + 𝑎𝑛2 (𝑡)𝑥2 + ⋯ + 𝑎𝑛𝑛 (𝑡)𝑥𝑛
𝑑𝑡

Suporemos que as funções aij(t) sejam contínuas no intervalo I: a ≤ t ≤ b.

Denomina-se solução do sistema a uma coluna de funções [x1(t) x2(t) ... xn(t)]T [1.2].

Teorema: Se a1, a2, ..., an for uma coleção arbitrária de constantes, t0 um ponto
qualquer do intervalo I, existe uma, e somente uma, solução de [1.1] tal que:

x1(t0) = a1, x2(t0) = a2, ..., xn(t0) = an,

Corolário: A solução [1.2] de [1.1] tal que x1(t0) = x2(t0) = ... = xn(t0) para algum t0
pertencente a I, é identicamente nula, isto é x1(t0) ≡ x2(t0) ≡ ... ≡ xn(t0) ≡ 0 para todo
t pertencente a I.

60
Quando n = 3, o sistema [1.1] fica:

𝑑𝑥1
= 𝑎11 (𝑡)𝑥1 + 𝑎12 (𝑡)𝑥2 + 𝑎13 (𝑡)𝑥3
𝑑𝑡
𝑑𝑥2
= 𝑎21 (𝑡)𝑥1 + 𝑎22 (𝑡)𝑥2 + 𝑎23 (𝑡)𝑥3 [1.1]′
𝑑𝑡
𝑑𝑥3
= 𝑎31 (𝑡)𝑥1 + 𝑎32 (𝑡)𝑥2 + ⋯ + 𝑎33 (𝑡)𝑥3
𝑑𝑡

Teorema: Existem três soluções linearmente independentes de [1.1]’. Toda solução do


sistema pode ser escrita como uma combinação linear dessas três soluções.

Sistema Fundamental de Soluções

Suponhamos que as colunas


𝑢1 (𝑡) 𝑣1 (𝑡) 𝑤1 (𝑡)
𝑢2 (𝑡) 𝑣2 (𝑡) 𝑤2 (𝑡)
𝑢3 (𝑡) 𝑣3 (𝑡) 𝑤3 (𝑡)

sejam soluções u(t), v(t), w(t), respectivamente de [1.1]’ e formemos o determinante

𝑢1 (𝑡) 𝑣1 (𝑡) 𝑤1 (𝑡)


∆(𝑡) = |𝑢2 (𝑡) 𝑣2 (𝑡) 𝑤2 (𝑡)|
𝑢3 (𝑡) 𝑣3 (𝑡) 𝑤3 (𝑡)

Se ∆(𝑡) ≢ 0, as três soluções formam um sistema fundamental de solução. E elas são


linearmente independentes.

Sistemas Lineares com Coeficientes Constantes

Resolva o sistema
𝑑𝑥1 1 1
= 𝑥1 + 𝑥2
{ 𝑑𝑡 2 2 [3.2]
𝑑𝑥2 3 5
= − 𝑥1 + 𝑥2
𝑑𝑡 2 2

61
𝜆𝑡
Vamos determinar as constante A, B e λ tais que a coluna 𝐴𝑒 𝜆𝑡 seja uma
𝐵𝑒
solução de [3.2].
Se substituirmos x1 e x2, respectivamente, em [3.2], por estas funções, resulta
que A, B e λ devem satisfazer as equações

1 1
( − 𝜆) 𝐴 + 𝐵 = 0
{ 2 2 [3.3]
3 5
− 𝐴 + ( − 𝜆) 𝐵 = 0
2 2

Para que as soluções A e B, não simultaneamente nulas, da equação [3.3]


existam, é necessário e suficiente que

1 1
( − 𝜆) ( )
| 2 2 | = 0 [3.4]
3 5
(− ) ( − 𝜆)
2 2

que é equivalente a λ2 - 3λ + 2 = 0, cujas raízes são 1 e 2.


Com λ = 1 em [3.3] teremos que:
𝐴 𝐵
− + =0
2 2

3𝐴 3𝐵
− + =0
2 2

Com λ = 2 em [3.3] teremos que:


3𝐴 𝐵
− + =0
2 2

3𝐴 𝐵
− + =0
2 2
𝑡
Escolhendo A = B = 1 nos conduz à solução 𝑒 𝑡 de [3.2].
𝑒
2𝑡
Uma solução não trivial é A = 1, B = 3, e teremos 𝑒 2𝑡 .
3𝑒
A solução geral seria:
𝐶1 𝑒 𝑡 + 𝐶2 𝑒 𝑡
𝐶1 𝑒 𝑡 + 3𝐶2 𝑒 2𝑡

[3.4] é chamada de equação característica.

62
Seja
𝑓𝑖 (𝑡)
𝑑𝑥
= 4𝑥 − 9𝑦 + 5𝑧 + ⏞
1 + 13𝑡
𝑑𝑡 4 −9 5 𝑥 1 + 13𝑡
𝑑𝑦 = ( 1 −10 7 ) (𝑦 ) + ( 3 + 15𝑡)
= 𝑥 − 10𝑦 + 7𝑧 + 3 + 15𝑡
𝑑𝑡 1 −17 12 𝑧 2 + 26𝑡
𝑑𝑧
{ 𝑑𝑡 = 𝑥 − 17𝑔 + 12𝑧 + 2 + 26𝑡

Se os fi(t) = Ø, o sistema é homogêneo. Se as soluções são linearmente independentes,


o sistema só admite a solução trivial (0, 0, 0). Para se obter soluções A, B, C não triviais,
temos de impor a condição:

𝑎1 − 𝜆 𝑏1 𝑐1
| 𝑎2 𝑏2 − 𝜆 𝑐2 | = 𝜙
𝑎3 𝑏3 𝑐3 − 𝜆

e teremos a equação característica do sistema em termos de λ.


A solução é do tipo;
𝐴𝑒 𝜆𝑡
(𝐵𝑒 𝜆𝑡 )
𝐶𝑒 𝜆𝑡

Se as raízes do polinômio são imaginárias, temos A1eλt , B1eλt, C1eλt e A2eλt , B2eλt, C2eλt.

Exemplo:
𝑑𝑥1
= 0𝑥1 + 𝑥2
{ 𝑑𝑡
𝑑𝑥2
= −2𝑥1 + 3𝑥2
𝑑𝑡

Temos
(0 − 𝜆)𝐴 + 𝐵 = 0
{ [1.0]
−2𝐴 + (3 − 𝜆)𝐵 = 0
Daí
(0 − 𝜆) 1
| | = 0 ⇒ 𝜆2 − 3𝜆 + 2 = 0
−2 (−3 − 𝜆)

As raízes são
𝜆1 = 1 𝑒 𝜆2 = 2
Com λ = 1, [1.0] fica
−𝐴 + 𝐵 = 0
{
−2𝐴 + 2𝐵 = 0

63
𝑡
Fazendo A = 1 implica B = 1 e a solução é do tipo (𝑒 𝑡 )
𝑒

Com λ = 2, [1.0] fica


−2𝐴 + 𝐵 = 0
{
−2𝐴 + 𝐵 = 0

2𝑡
Fazendo A = 1 implica B = 2 e a solução é do tipo ( 𝑒 2𝑡 )
2𝑒
E a solução geral é:
𝐶1 𝑒 𝑡 + 𝐶2 𝑒 2𝑡
𝐶1 𝑒 𝑡 + 𝐶2 2𝑒 2𝑡

Soluções em Séries de Potências

Admite-se que a solução y(x) é dada pela série

+∞

𝑦(𝑥) = ∑ 𝑎𝑛 (𝑥 − 𝑎)𝑛
𝑛=0

Substitui-se y na equação definida dada; a seguir, igualam-se os coeficientes de


mesmas potências de (x – a) em ambos os membros da equação.

Exemplo 1: Encontrar a solução em séries de potência da seguinte equação:

𝑦 ′′ + 𝑦 = 0, 𝑜𝑛𝑑𝑒 𝑦(0) = 0 𝑒 𝑦 ′ (0) = 1 [1]

Tentaremos uma solução em séries de potências de (x – 0) = x, isto é, procuraremos


determinar constantes a0, a1, a2 ,..., an tais que a série de potência

+∞

𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 + ⋯ = ∑ 𝑎𝑛 𝑥 𝑛
2

𝑛=0

seja solução de [1]. Se admitirmos que [1] tem uma solução nesta forma e
substituirmos esta série no lugar de y na equação diferencial, obtém-se:
∞ ∞

∑ 𝑛(𝑛 − 1)𝑎𝑛 𝑥 𝑛−2 + ∑ 𝑎𝑛 𝑥 𝑛 ≡ 0


𝑛=2 𝑛=0
Ou

∑[(𝑛 + 2)(𝑛 + 1)(𝑎𝑛+2 ) + 𝑎𝑛 ]𝑥 𝑛 ≡ 0


𝑛=0

64
Para que esta série seja identicamente nula, todos os seus coeficientes dever ser nulos,
isto é;
(𝑛 + 2)(𝑛 + 1)(𝑎𝑛+2 ) + 𝑎𝑛 = 0 [2]

A condição de contorno em [1] conduz-nos a concluir que a0 = 0 e a1 = 1. De [2] obtém-


se 0 = a2 = a4 = a5 = ... e
𝑎2𝑛−1
𝑎2𝑛+1 = −
2𝑛(2𝑛 + 1)
Assim, a3 = -1/(2 x 3) e a5 = 1/(1 x 2 x 3 x 4 x 5), ..., e nós encontramos a série de
𝑥3 𝑥5
potências 𝑦 = 𝑥 − + − ⋯, que é Sen(x).
3! 5!

Exemplo 2: Encontrar a solução em séries de potências de (x – 1) do sistema

(4 − 𝑥 2 )𝑦 ′′ − 2𝑥𝑦 ′ + 12𝑦 = 0, 𝑐𝑜𝑚 𝑦(1) = −1 𝑒 𝑦 ′ (1) = 3 [1.4]

Escreve-se, inicialmente, os coeficientes da equação diferencial em potências de (x–1):

4 − 𝑥 2 → 3 − 2(𝑥 − 1) − (𝑥 − 1)2

−2𝑥 → −2 − 2(𝑥 − 1)

12 → 12

Então, a equação [1.4] pode ser reescrita sob a forma:

[3 − 2(𝑥 − 1) − (𝑥 − 1)2 ]𝑦 ′′ + [−2 − 2(𝑥 − 1)]𝑦 ′ + 12𝑦 = 0 [1.4]′

E temos que:
+∞

𝑦 = ∑ 𝑎𝑛 (𝑥 − 1)𝑛
𝑛=0

+∞

𝑦′ = ∑ 𝑛. 𝑎𝑛 (𝑥 − 1)𝑛−1
𝑛=0

+∞

𝑦′′ = ∑ 𝑛. (𝑛 − 1). 𝑎𝑛 (𝑥 − 1)𝑛−2


𝑛=0

65
Substituindo em [1.4]’:

+∞

[3 − 2(𝑥 − 1) − (𝑥 − 1)2 ] ∑ 𝑛. (𝑛 − 1). 𝑎𝑛 (𝑥 − 1)𝑛−2


𝑛=0
+∞ +∞
𝑛−1
+ [−2 − 2(𝑥 − 1)] ∑ 𝑛. 𝑎𝑛 (𝑥 − 1) + 12 ∑ 𝑎𝑛 (𝑥 − 1)𝑛 = 0
𝑛=0 𝑛=0
Ou
+∞

∑{[3 − 2(𝑥 − 1) − (𝑥 − 1)2 ] × 𝑛. (𝑛 − 1). 𝑎𝑛 (𝑥 − 1)𝑛−2 + [−2 − 2(𝑥 − 1)]


𝑛=0
× 𝑛. 𝑎𝑛 (𝑥 − 1)𝑛−1 12 × 𝑎𝑛 (𝑥 − 1)𝑛 } = 0

Transformada de Laplace para Equações Diferenciais

A Transformada de Laplace transforma uma equação diferencial em uma simples


equação algébrica, na qual deve-se basicamente isolar a variável desejada e usar a
tabela de transformadas de Laplace, evitando várias integrações e definições de
constantes. O método da TL é ideal para resolver Problemas de Valor Inicial, pois,
devido as propriedades da T.L., para cada nível de derivada precisa-se de um valor da
função inicial e/ou de suas derivadas.
Reproduzimos o exemplo lá da seção de Transformada de Laplace:

Consideremos o sistema diferencial y’’ + y = x, com y(0) = 0 e y’(0) = 2. Suponhamos


que exista uma solução y(x) para a qual sejam aplicados estes resultados. Então, y’’(x)
+ y(x) ≡ x, e tomando a TL de ambos os membros: L[y’’] + L[y] = L[x], temos:
1
{𝑆 2 ℒ[𝑦] − 𝑆𝑦(0) − 𝑦 ′ (0) + ℒ[𝑦] = 2 , 𝑐𝑜𝑚 𝑆 > 0
𝑆
ou
1 2𝑆 2 + 1
(𝑆 2 + 1)ℒ[𝑦] = 2 + 2 ⇒ ℒ[𝑦] = 2 2
𝑆 𝑆 (𝑆 + 1)

Nosso problema será resolvido se pudermos encontrar uma função y(x) cuja TL seja
igual a acima. Necessita-se de tabelas, mas, decompondo-se a equação acima em
frações parciais, temos:
1 1
ℒ[𝑦] = 2 + 2
𝑆 𝑆 +1

Consultando a tabela de transformadas, temos que ℒ[𝑦] = 𝑥 + 𝑆𝑒𝑛(𝑥), que é a


solução procurada.

66
Métodos Numéricos para Equações Diferenciais

Como calcular uma integral equivale a calcular a área sob a curva da função num dado
intervalo, costuma-se usar o método numérico para calcular integrais complicadas ou
aquelas cujas integrais não são conhecidas, por não se ter um método analítico para
calculá-las, como por exemplo as seguintes integrais:

∫ ln[ln(𝑥)]

2
∫ 𝑒𝑥

O que um método numérico faz é discretizar o intervalo considerado, ou subdividi-lo


em subintervalos, achando a integral em cada subintervalo e adicionando todos eles.
Como é um cálculo aproximativo, quanto maior for o número de intervalos, menor
será o erro de aproximação.
Os métodos numéricos mais usados são aqueles que utilizam séries, como a Série de
Taylor e a Transformada de Fourier.
Outro método que pode ser usado é aquele que define a derivada:

𝑓(𝑥 + ∆𝑥) − 𝑓(𝑥)


𝑓′(𝑥) =
∆𝑥

Onde Δx é um subintervalo. O Método Numérico de Euler baseado neste método.

67
Exercícios de Equações Diferenciais

Nada no mundo está parado. Há movimento, inclusive numa pedra parada


(aparentemente) no chão. Tudo muda, e muda a uma taxa mais ou menos perceptível.
Equações diferenciais são usadas, exatamente, para modelar esses “sistemas” que
estão sempre em mudança. Preste atenção a essa última expressão, “sempre em
mudança”. Uma equação comum retorna um valor fixo ou um conjunto de valores
fixos. Não há como fazer esse retorno representar uma mudança. O único “valor” que
pode representar uma mudança é uma função. É por isso que as equações diferenciais
retornam uma função, em vez de um valor fixo.
Por exemplo, em uma população de coelhos, quanto mais a quantidade de coelhos
aumenta, mais rápido ela vai aumentar na próxima mudança, ou seja, funciona como
uma taxa fixa sempre aplicada ao novo montante.
Para modelar com uma equação diferencial, basta entender que a taxa de mudança da
população de coelhos ao longo do tempo é igual à taxa de crescimento (a taxa fixa)
multiplicada pela população atual considerada. Uma equação diferencial que
espelharia isso é:
𝑑𝑁
𝑖×𝑁 =
𝑑𝑡

Onde i é taxa, N a população atual considerada e t o período de tempo considerado.


O lado direito é a taxa de mudança (diferença do N anterior para o atual dividida pelo
período de tempo considerado).

Exercícios

(1)
𝑒𝑥
𝑦 ′′ − 2𝑦 ′ + 𝑦 =
𝑥5

1 −3 𝑥
𝑦 = 𝐶1 𝑒 𝑥 + 𝐶2 𝑥𝑒 𝑥 + 𝑥 𝑒
12

(2)
𝑦 ′′ + 𝑦 = 𝑆𝑒𝑐(𝑥)

𝑦 = 𝐶1 𝐶𝑜𝑠(𝑥) + 𝐶2 𝑆𝑒𝑛(𝑥) + [𝐶𝑜𝑠(𝑥)] ln|𝐶𝑜𝑠(𝑥)| + 𝑥𝑆𝑒𝑛(𝑥)

(3)
𝑦 ′′′ = 12

𝑦 = 𝐶1 + 𝐶2 𝑥 + 𝐶3 𝑋 2 + 2𝑥 3
(4)
Uma barra de metal, a uma temperatura de 100 oF, é colocada em uma sala
com uma temperatura constante de 0 oF. Se, após 20 minutos, a temperatura
da barra é de 50 oF, encontre:

68
(a) Quanto tempo a barra levará para alcançar 25 oF?
(b) A temperatura da barra após 10 minutos.

Solução:
De Isaac Newton:

𝑑𝑇
+ 𝑘𝑇 = 𝑘𝑇𝑚
𝑑𝑡

Onde T: temperatura do corpo; Tm: Temperatura ambiente; k: constante


positiva de proporcionalidade.
No processo, T é sempre maior do que Tm e, por isso, (T – Tm) > 0.
Aqui, Tm = 0 (temperatura da sala).
Assim, temos:
𝑑𝑇
+ 𝑘𝑇 = 0
𝑑𝑡

Esta é uma equação diferencial ordinária linear (T’ + kT = 0), cuja solução
é T = Ce-kt [1].

Desde que T = 100 em t = 0, segue do resultado anterior que:

100 = 𝐶𝑒 −𝑘×0 ⟹ 𝐶 = 100

Substituindo C em [1]:

𝑇 = 100𝑒 −𝑘𝑡 [2]

Em t = 20, é dado que T = 50, daí:

50 = 100𝑒 −20𝑘

Tomando o logaritmo dos dois lados:

ln(50) = ln(100𝑒 −20𝑘 ) ⇒


⇒ ln(50) = ln(100) + ln(𝑒 −20𝑘 ) ⇒
⇒ ln(50 = ln(100) + [−20𝑘 × ln(𝑒)] ⇒
ln(50) = ln(100) + (−20𝑘) ⇒
⇒ 20𝑘 = ln(100) − ln(50) ⇒
100
⇒ 20𝑘 = 𝑙𝑛 ( ) ⇒ 20𝑘 = ln(2) ⇒ 20𝑘 = 0.6931471 ⇒
50
0.6931471
𝑘= ⇒ 𝑘 = 0.035
20

69
Substituindo esse valor de k em [2], obtemos que:

A temperatura da barra a qualquer momento t é: T = 100e-0.035t

Quando T = 25, temos que 25 = 100e-0.035t.


Fazendo as manipulações com logaritmos, chegamos a:

1
−0.035𝑡 = 𝑙𝑛 ( )
4

O que nos dá, respondendo (a), t = 39.6 minutos.

Respondendo (b), queremos T quando t = 10:

𝑇 = 100𝑒 (−0.035)(10) ⟹ 𝑇 = 100(0.705) = 70.5 ∘ F

(5)
Encontre as trajetórias ortogonais da família de curvas x2 + y2 = c2.

Uma família no plano xy é definida por F(x,y,c) = 0, onde c denota o parâmetro.


O problema é encontrar outra família a um parâmetro, chamado de trajetórias
ortogonais daquela família, e dada analiticamente por G(x,y,k) = 0, tal que toda
curva desta nova família intercepte em ângulos retos cada curva da outra.
Primeiramente, diferenciamos implicitamente a primeira em relação a x,
eliminando c.
Temos uma equação em termos de x, y e y’, que resolvemos para y’, obtendo
uma equação diferencial da forma
𝑑𝑦
= 𝑓(𝑥, 𝑦)
𝑑𝑥

As trajetórias ortogonais são soluções de

𝑑𝑦 1
=− [∗]
𝑑𝑥 𝑓(𝑥, 𝑦)

A família é dada por F(x,y,c) = x2 + y2 – c2. São círculos com centro na origem e
raio c.
Diferenciando implicitamente em relação a x:

−𝑥 𝑑𝑦
2𝑥 + 2𝑦𝑦 ′ = 0 𝑜𝑢 𝑦 ′ = =
𝑦 𝑑𝑥

70
Aqui,
−𝑥
𝑓(𝑥, 𝑦) =
𝑦

E [*] se torna y’ = y/x. Esta equação linear é de variáveis separáveis.


Resolvendo:
𝑑𝑦 𝑦 𝑑𝑦 𝑑𝑥
= ⇒ =
𝑑𝑥 𝑥 𝑦 𝑥

y = kx, que representa as trajetórias ortogonais.

(6)

Encontrar as soluções em série de Respostas


potências para
𝑦 ′′ + 𝑦 = 0, 𝑦(0) = 1, 𝑦 ′ (0) = 0 𝑥2 𝑥4
Em potências de x 1−( )+( )−⋯
2! 4!
𝑦 ′′ − 3𝑦 ′ + 2𝑦 = 0, 𝑦(0) = 0, 𝑦 ′ (0) = 1 3𝑥 2
7𝑥 3
15𝑥 4
Em potências de x 𝑥+( )+( )+( )+⋯
2! 3! 4!
(𝟏 − 𝒙𝟐 )𝒚′′ − 𝟐𝒙𝒚′ + 𝟔𝒚 = 𝟎, 𝒚(𝟎) = −𝟏, 𝒚′ (𝟎) = 𝟎 3𝑥 2 − 1
Em potências de x
𝑦 ′′ + 𝑦 = 0, 𝑦(10) = 0, 𝑦 ′ (10) = 1 𝟏 𝟏
(𝒙 − 𝟏𝟎) − ( ) (𝒙 − 𝟏𝟎)𝟑 + ( ) (𝒙 − 𝟏𝟎)𝟒 − ⋯
𝟑! 𝟓!
Em potências de x – 10.
𝑥 2 𝑦 ′′ − 𝑥𝑦 ′ + 2𝑦 = 0, 𝑦(1) = 0, 𝑦 ′ (1) 𝟏 𝟐
(𝒙 − 𝟏) + ( ) (𝒙 − 𝟏)𝟐 − ( ) × 𝟐(𝒙 − 𝟏)𝟑
𝟐! 𝟑!
=1 𝟒(𝒙 − 𝟏)𝟒 𝟏𝟎(𝒙 − 𝟏)𝟓
Em potências de x – 1. +
𝟒!

𝟓!

Encontrar as soluções gerais Respostas


dos sistemas de equações
diferenciais lineares
𝑑𝑥1 𝑑𝑥2 𝑐1 𝑒 𝑡 + 𝑐2 𝑒 2𝑡
= 𝑥2 {
𝑑𝑡 𝑑𝑡 𝑐1 𝑒 𝑡 + 2𝑐2 𝑒 2𝑡
= −2𝑥1 + 3𝑥2
𝑑𝑥1 𝑑𝑥2 𝑐 𝑒 𝑡 + 𝑐2 𝑡𝑒 𝑡
= 𝑥2 { 𝑡1
𝑑𝑡 𝑑𝑡 𝑐1 𝑒 + 𝑐2 (𝑡 + 1)𝑒 𝑡
= −𝑥1 + 2𝑥2
𝑑𝑥1
= −2𝑥2
𝑑𝑥2
= 𝑥1 + 2𝑥2 2𝑐1 𝑒 𝑡 𝐶𝑜𝑠(𝑡) + 2𝑐2 𝑒 𝑡 𝑆𝑒𝑛(𝑡)
𝑑𝑡 𝑑𝑡 {
𝑐1 𝑒 𝑡 [𝑆𝑒𝑛(𝑡) − 𝐶𝑜𝑠(𝑡)] − 𝑐2 𝑒 2𝑡 [𝑆𝑒𝑛(𝑡) + 𝐶𝑜𝑠(𝑡)]
𝑑𝑥1 𝑐1 𝑒 𝑡 + 𝑐2 𝑡𝑒 2𝑡 + 𝑐3 𝑒 2𝑡
= 𝑥2
𝑑𝑡 {𝑐1 𝑒 𝑡 + 𝑐2 (1 + 𝑡)𝑒 𝑡 + 2𝑐3 𝑒 2𝑡
𝑑𝑥2
2 = −3𝑥1 + 6𝑥2 − 𝑥3 𝑐1 𝑒 𝑡 + 𝑐2 (2 + 𝑡)𝑒 𝑡 + 𝑐2 𝑒 2𝑡
𝑑𝑡
𝑑𝑥3
= −𝑥1 + 𝑥2 + 𝑥3
𝑑𝑡

71
E um sistema fundamental de Respostas
soluções para cada um dos
sistemas
𝑑𝑥1 𝑒 2𝑡 𝑡𝑒 2𝑡 𝑡 2 𝑒 2𝑡
= 𝑥2
𝑑𝑡 { 𝟐𝑒 2𝑡 (1 + 2𝑡)𝑒 2𝑡 (2𝑡 2 + 2𝑡)𝑒 2𝑡
𝑑𝑥2 4𝑒 2𝑡 (4 + 4𝑡)𝑒 2𝑡 (4𝑡 2 + 8𝑡 + 2)𝑒 2𝑡
= 𝑥3
𝑑𝑡
𝑑𝑥3
= 8𝑥1 − 12𝑥2 + 6𝑥3
𝑑𝑡
𝑑𝑥1
= 𝑥2
𝑑𝑡
𝑒𝑡 𝑡𝑒 𝑡 𝐶𝑜𝑠(𝑡) 𝑆𝑒𝑛𝑡(𝑡)
𝑑𝑥2 𝑒𝑡 (𝑡 + 1)𝑒 𝑡 − 𝑆𝑒𝑛(𝑡) 𝐶𝑜𝑠(𝑡)
= 𝑥3
𝑑𝑡 𝑒𝑡 (𝑡 + 2)𝑒 𝑡 − 𝐶𝑜𝑠(𝑡) 𝑆𝑒𝑛(𝑡)
𝑡 (𝑡 + 3)𝑒 𝑡
𝑑𝑥3 {𝑒 𝑆𝑒𝑛(𝑡) − 𝐶𝑜𝑠(𝑡)
= 𝑥4
𝑑𝑡

𝑑𝑥4
= −𝑥1 + 2𝑥2 − 2𝑥3 + 2𝑥4
𝑑𝑡

(7)
Seja um bloco de massa M preso a uma mola e deslocado de um pequeno espaço x.

Uma força F, contrária ao deslocamento, surge e é dada por F = M.a (I).


A aceleração a é dada por
𝑑𝑣
𝑎= (𝐼𝐼)
𝑑𝑡
Então:
𝑑𝑣
𝐹 =𝑀× (𝐼𝐼𝐼)
𝑑𝑡
A velocidade v é dada por
𝑑𝑥
𝑣= (𝐼𝑉)
𝑑𝑡

72
Substituindo (IV) em (II):
𝑑𝑥
𝑑( ) 2
𝑎= 𝑑𝑡 = 𝑑 × 𝑑𝑥 = 𝑑 𝑥 (𝑉)
𝑑𝑡 𝑑𝑡 𝑑𝑡 (𝑑𝑡)2

O 2 em d2 significa “derivada segunda”, pois, temos d(dx).

Substituindo essa expressão em (I):

𝑑2𝑥
𝐹=𝑀× (𝑉𝐼)
(𝑑𝑡)2

Agora, seja k a constante de proporcionalidade da mola. Então, a força de expansão


produzida pela mola é F = –k.x. Substituindo isso na equação (VI):

𝑑2𝑥
−𝑘 × 𝑥 = 𝑀 ×
(𝑑𝑡)2

Multiplicando os dois lados por 1/M:

𝑑2𝑥 −𝑘 𝒅𝟐 𝒙 𝒌
2
= 𝑥⟹ 𝟐
+ =𝟎
(𝑑𝑡) 𝑀 (𝒅𝒕) 𝒙

Esta é a equação diferencial para o movimento oscilatório de um bloco preso a uma


mola. Resolvendo esta equação, obtemos a solução para qualquer valor de
deslocamento x. A solução é a função

𝑥 = 𝐴 × 𝑆𝑒𝑛(√𝑘/𝑀 × 𝑡)

Onde A é a amplitude da oscilação.

(8)
Uma bola é atirada verticalmente para cima com uma velocidade de 50 m/s.
Desprezando-se a resistência do ar, encontre:
a) A velocidade da bola em qualquer instante (essa é uma típica solicitação para
que você encontre uma função, não um valor fixo).
b) A distância percorrida em qualquer instante (idem).
c) A altura máxima que a bola alcança.

73
Solução:

Seja v e h a velocidade e altura da bola, respectivamente, em qualquer instante t.


Como a taxa de variação da velocidade no tempo é a aceleração, então a = dv/dt.

Como a bola é atirada para cima, sua aceleração é –a (no caso, usaremos –g, que é a
contra aceleração gravitacional). Daí:

𝑑𝑣
−𝑔 = (𝐼)
𝑑𝑡

Separando as variáveis, temos que

𝑑𝑣 = −𝑔𝑑𝑡 (𝐼𝐼)

Que é a equação diferencial. Então:

a) Como a velocidade inicial é 50m/s, para obter a velocidade a qualquer instante


t, basta integrar o lado esquerdo de (II) de 50 até v e o lado direito de 0 até t:

𝑣 𝑡
𝑣 𝑡
∫ 𝑑𝑣 = −𝑔 ∫ 𝑑𝑡 ⟹ 𝑣 | = −𝑔𝑡 | ⟹ 𝑣 − 50 = −𝑔(𝑡 − 0) ⟹
50 0
50 0

⟹ 𝑣 − 50 = −𝑔𝑡 ⟹ 𝑣 = 50 − 𝑔𝑡 (𝐼𝐼𝐼)

Considerando g = 10m/s2, temos que:

𝑣 = 50 − 10𝑡 (𝐼𝑉)

b) Como a velocidade é a taxa de variação do espaço no tempo, temos:

𝑑ℎ
𝑣= (𝑉)
𝑑𝑡

Substituindo (V) em (IV):

𝑑ℎ
= 50 − 10𝑡 ⟹ 𝑑ℎ = [50 − 10𝑡]𝑑𝑡 (𝑉𝐼)
𝑑𝑡

74
Para encontrar a distância percorrida em qualquer instante t, basta integrar o
lado esquerdo de 0 até h e o lado direito de 0 até t:

ℎ 𝑡
ℎ 𝑡
∫ 𝑑ℎ = ∫ (50 − 10𝑡)𝑑𝑡 ⟹ ℎ | = 50𝑡 − 5𝑡 2 | ⟹
0 0 0 0

⟹ ℎ = 50𝑡 − 5𝑡 2 (𝑉𝐼𝐼)

Essa é a função que dá a distância (agora um valor fixo) percorrida em qualquer


instante.

c) Como a velocidade é zero na altura máxima, fazemos v = 0 em (IV):

50 − 10𝑡 = 0 ⟹ 10𝑡 = 50 ⟹ 𝑡 = 5

Isto implica que a altura máxima ocorre nos 5 segundos. Substituindo isso em
(VII):

ℎ = 50 × 5 − 5 × (5)2 ⟹ ℎ = 250 − 5 × 25 ⟹ ℎ = 250 − 125 = 125

75
Geometria Diferencial

A geometria diferencial surgiu e se desenvolveu como resultado da conexão e em


conexão com a análise matemática de curvas e superfícies. A análise matemática de
curvas e superfícies foi desenvolvida para responder a algumas das perguntas
incômodas e não respondidas que apareceram no cálculo, como as razões para
relações entre formas e curvas complexas, séries e funções analíticas. Essas perguntas
não respondidas indicavam relacionamentos ocultos maiores.
A geometria diferencial usa técnicas do cálculo diferencia, cálculo integral, álgebra
linear e álgebra multilinear aplicados a problemas de geometria.
Formas, como um triângulo, por exemplo, assentadas num plano em forma de sela
(paraboloide hiperbólico) ou numa esfera, bem como linhas paralelas, como os
meridianos terrestres, são estudadas e analisadas na geometria diferencial.

Desde o final do século XIX, a geometria diferencial tornou-se um campo voltado para
as estruturas geométricas em espaços diferenciáveis, os manifolds.

A geometria diferencial está intimamente relacionada à topologia diferencial e aos


aspectos geométricos da teoria das equações diferenciais.

A topologia diferencial considera as propriedades e estruturas que requerem apenas


uma estrutura suave a ser definida em um manifold. Manifolds suaves são mais
flexíveis que os manifolds com estruturas geométricas extras, que podem atuar como
obstruções a certos tipos de equivalências e deformações que existem na topologia
diferencial. Por outro lado, os manifolds suaves são mais rígidos que os manifolds
topológicos. John Milnor descobriu que algumas esferas têm mais de uma estrutura
suave - veja esfera exótica e o teorema de Donaldson. Kervaire mostrou manifolds
topológicos sem nenhuma estrutura suave.

A topologia diferencial e a geometria diferencial são, primeiramente, caracterizadas


pelas suas similaridades. Ambas estudam, principalmente, as propriedades de
manifolds diferenciáveis, às vezes com uma variedade de estruturas impostas a elas.

Uma grande diferença entre as duas reside na natureza dos problemas que cada uma
tenta abordar. De um ponto de vista, a topologia diferencial distingue-se da geometria
diferencial, estudando, principalmente, os problemas que são inerentemente globais.
Considere o exemplo da caneca e do donut, visto em Topologia. Do ponto de vista da
topologia diferencial, o donut e a caneca têm a mesma forma (em certo sentido).

Essa é uma visão inerentemente global, no entanto, pois, não há como o topologista
diferencial dizer se os dois objetos são os mesmos (nesse sentido), olhando apenas
para uma pequena parte (local) de um deles. Ele deve ter acesso a cada objeto inteiro
(global).

76
Do ponto de vista da geometria diferencial, a caneca e o donut são diferentes, porque
é impossível girar a caneca de tal forma que sua configuração corresponda à do donut.

Esta é também uma maneira global de pensar sobre o problema. Mas, uma distinção
importante é que o geômetra não precisa do objeto inteiro para decidir isso. Ao olhar,
por exemplo, para apenas um pedacinho da alça da caneca, ele pode decidir que a ela
é diferente do donut porque a alça é mais fina (ou mais curva) do que qualquer pedaço
do donut.

Em suma, a topologia diferencial estuda estruturas em manifolds que, em certo


sentido, não possuem nenhuma estrutura local interessante. A geometria diferencial
estuda estruturas em manifold que, realmente, possuem uma estrutura local
interessante (às vezes, até, infinitesimal).

A geometria diferencial é muito usada hoje em campos da Física e da Inteligência


Artificial e, até mesmo, em Engenharia e Arquitetura.

Equações Diferenciais Estocásticas

Equações diferenciais estocásticas são equações diferenciais em que, a qualquer


instante, “ruído” é inserido no sistema. Interpretamos “ruído” como perturbações
feitas no sistema pelo meio. A modelagem com equações diferenciais estocásticas se
aproxima mais da realidade. Muitos processos estocásticos são baseados em funções
contínuas, porém, não diferenciáveis em ponto algum.

Uma equação diferencial estocástica é como uma equação diferencial comum cujos
coeficientes são números aleatórios ou funções aleatórias da variável independente
(ou variáveis independentes).

A forma geral de uma equação diferencia estocástica é:

𝑢̂ = 𝐹(𝑢, 𝑡; 𝛾(𝑡))

Onde u e F pode ser vetores e ϒ(t) representa uma ou mais funções aleatórias cujas
propriedades randômicas são dadas. A solução de uma EDE é a distribuição da variável
no futuro, dada por uma função densidade.

77
Equações de Diferença
Equações diferenciais são perfeitas para a modelagem de situações em que uma
população muda de modo contínuo. Porém, se a mudança é de modo discreto,
pontual, as equações diferenciais mostram falhas.

Para problemas onde as equações diferenciais não se adequam são usadas as


chamadas equações de diferença.

Uma equação de diferença é uma igualdade matemática que envolve a diferença entre
valores sucessivos de uma função de variável discreta (uma função cujos valores de
variáveis diferem por uma quantidade finita – como, por exemplo, o conjunto dos
números inteiros). Por exemplo, a variável discreta x pode ter os valores x0 = a, x1 =
a+1, x2 = a+2, ..., xn = a+n. A função y tem os valores correspondentes y0, y1, y2, ...,
yn, dos quais as diferenças podem ser encontradas:

∆y0 = y1 – y0
∆y1 = y2 – y1
...
∆yn = yn+1 – yn

Qualquer equação que relacione os valores ∆yi um ao outro ou aos valores xi é uma
equação de diferença. Em geral, uma equação assim tem a forma

𝑦𝑖 = 𝑎𝑖 𝑦𝑖−1 + 𝑏𝑖

Vê-se, claramente, que uma função recursiva. Também, trata-se de uma equação
linear (de diferença). A equação é linear porque os termos do polinômio que a formam
têm grau zero ou um. Este tipo de equação é conhecido, também, como conjunto de
relações lineares recorrentes.

Os coeficientes a e b podem ser constantes (caso comum) ou funções de período (caso


geral). A solução para uma equação assim é uma função do período, não um valor de
iteração, dado o valor da iteração em qualquer período.

Ordem de uma Equação de Diferença

Uma equação de diferença de ordem n tem a seguinte forma:

𝑦𝑡 = 𝑎1 𝑦𝑡−1 + ⋯ + 𝑎𝑛 𝑦𝑡−𝑛 + 𝑏

O valor n é o maior tempo entre as iterações, por isso ele representa a ordem da
equação.

78
Equação de Diferença Homogênea

A seguinte equação de diferença é dita não-homogênea:

𝑦𝑖 = 𝑎𝑖 𝑦𝑖−1 + 𝑏𝑖

Se b = 0, então é equação e homogênea:

𝑦𝑖 = 𝑎𝑖 𝑦𝑖−1

Equação de Diferença de Primeira Ordem

Uma equação de diferença de primeira ordem é uma sequência definida


recursivamente na forma

𝑦𝑛+1 = 𝑓(𝑛, 𝑦𝑛 ) (𝐸𝐷𝑃𝑂1)

Onde n = 0, 1, 2, ...

O que faz essa equação ser de primeira ordem é que nós só precisamos conhecer o
valor anterior mais recente para encontrar o próximo valor. Ela pode, também, ser
deduzida da equação diferencial y’ = g(n, y(n)). Isso pode ser provado usando-se a
definição de derivadas:

𝑦(𝑛 + ℎ) − 𝑦(𝑛)
Lim = 𝑓 ′ (𝑛) = 𝑦′(𝑛)
ℎ→0 ℎ

Considerando-se h e n como inteiros e que o menor valor que h pode alcançar sem se
tornar nulo é 1.

Este é um sistema linear de equações de diferença:

79
Podemos escrever (EDPO1) na seguinte forma:

𝑦𝑡+1 = 𝑎𝑦𝑡 + 𝑏 (𝐸𝐷𝑃𝑂2)

Desenvolvendo a iteração a partir de 1:

𝑦1 = 𝒂𝒚𝟎 + 𝒃

𝑦2 = 𝑎𝑦1 + 𝑏 = 𝑎(𝑎𝑦0 + 𝑏) + 𝑏 = 𝑎2 𝑦0 + 𝑎𝑏 + 𝑏 = 𝒂𝟐 𝒚𝟎 + 𝒃(𝒂 + 𝟏)


.
.
.
𝑡 𝑡−1
𝑦𝑡 = 𝑎 𝑦0 + 𝑏(𝑎 + 𝑎𝑡−2 + ⋯ + 𝑎1 + 𝑎0 )

A expressão destacada em amarelo é uma série dada pela seguinte expressão:

1 − 𝑎𝑡
1−𝑎

Então:
1 − 𝑎𝑡
𝑦𝑡 = 𝑎𝑡 𝑦0 + 𝑏 ⟹
1−𝑎

𝑏 𝑏
⟹ 𝑦𝑡 = 𝑎𝑡 (𝑦0 − )+ (𝐸𝐷𝑃𝑂3)
1−𝑎 1−𝑎

O termo mais à direita é chamado de estado estável (steady state). Se a iteração for
iniciada no estado estável, o termo à esquerda do estado estável será nulo. Este termo
(o termo à esquerda) é chamado de desvio inicial do estado estável.

Se 0 < a < 1, at converge para 0 e alcançamos o estado estável. Se a > 0, a solução


diverge.
Quando é dada uma condição inicial, essa condição é sempre y0.

Exemplo: 3yt+1 + yt = 15.

Dividindo tudo por 3 e desenvolvendo:


1 −𝟏
𝑦𝑡+1 + 𝑦𝑡 = 5 ⟹ 𝒚𝒕+𝟏 = 𝒚 +𝟓
3 𝟑 𝒕

Por (EDPO2), vemos que a = –1/3 e b = 5. Agora, basta aplicar (EDPO3). A expressão
resultante será:

−1 𝑡 15 15
𝑦𝑡 = ( ) (𝑦0 − ) +
3 4 4

80
Com t = 0, teremos yt = y0. Com t =1, teremos que

−1
𝑦1 = 𝑦 +5
3 0

Equação de Diferença de Segunda Ordem

Uma equação de diferença de segunda ordem é definida como

∆2 𝑦𝑖 = ∆(∆𝑦𝑖 ) = ∆𝑦𝑖+1 − ∆𝑦𝑖 =

= (𝑦𝑖+2 − 𝑦𝑖+1 ) − (𝑦𝑖+1 − 𝑦𝑖 ) = 𝑦𝑖+2 + 2𝑦𝑖+1 + 𝑦𝑖

81
Álgebra Abstrata

Podemos dizer que a álgebra abstrata é uma extensão (um superconjunto) da álgebra
comum. Onde esta trabalha com operações (+, –, x, ÷) e conjuntos numéricos, a
álgebra abstrata trabalha com tudo isso e, também, com objetos quaisquer, como
figuras geométricas, por exemplo e, também, com operações extras, como rotação e
inversão (flipping). Vimos, em um volume anterior desta série de linguagem
matemática, como multiplicar um círculo por uma linha para obter um cilindro. É esse
tipo de operação que estende a álgebra comum para a álgebra abstrata.
Em outras palavras, o que a álgebra abstrata faz é encarar os conjuntos numéricos
como se fosse conjunto de objetos e aplica neles algumas operações. Abstrair é sair do
específico para o geral. Por exemplo, especificamente, uma figura com quatro lados
iguais e quatro ângulos retos é um quadrado, mas, no geral ele é um retângulo.

Congruência

O número a é congruente ao número b se a – b é divisível (divisão inteira, ou seja, o


resto da divisão é zero1) por um número m dado e diz-se que a é congruente a b
módulo m.
Notação: 𝒂 ≡ 𝒃(𝒎𝒐𝒅 𝒎)

Para um inteiro m positivo, dois números a e b são congruentes módulo m se a


diferença a – b é um múltiplo inteiro de m, ou a – b = km, para um inteiro k. O
número a será congruente a b se b puder ser escrito assim: b = a – km, para um k
qualquer (positivo ou negativo).

Se você tem a e m e quer gerar uma lista finita de congruentes de a, escolha um k


inteiro positivo e crie a sequência a + qm, com q em [–k , k].
Por exemplo, para k = 5, a = 3 e m = 4:

..., –17, –13, –9, –5, – 1, 3, 7, 11, 15, 19, 23, ...

Você obtém a mesma sequência se tiver b, em vez de a.


Como o número a pode ser o resultado de uma expressão, então o próprio a pode ser
substituído por: expressão ≡ n (mod m).

1
Supondo o operador ‘/’ para divisão normal e ‘//’ para divisão inteira, podemos defininir a divisão
inteira de A por B assim: A // B ≡ floor(A / B), onde a função ‘floor(x)’ retorna o maior inteiro que seja
igual ou menor do que x. Por exemplo, -13//12 = -2 porque -2 é o inteiro mais alto que é menor que o
resultado de -13 / 12 = -1.083. A função floor tem a função ceiling(x) como companheira. Esta retorna o
menor inteiro que seja igual ou maior que x.

82
𝒂 ≡ 𝒃(𝒎𝒐𝒅 𝒎) diz que a e b produzem o mesmo resto (r) quando cada um é dividido
por m, (quando dois números produzem o mesmo resto ao serem divididos pelo
mesmo valor, estes dois números são congruentes) ou:

a = pm + r
b = qm + r

Onde p e q são os respectivos quocientes. Disso, podemos ver que:

𝑟 = 𝑎 − 𝑝𝑚 e 𝑟 = 𝑏 − 𝑞𝑚 ⟹
𝑎 − 𝑝𝑚 = 𝑏 − 𝑞𝑚 ⟹ 𝑎 = 𝑏 − 𝑞𝑚 + 𝑝𝑚 ⟹
⟹ 𝑎 − 𝑏 = 𝑝𝑚 − 𝑞𝑚 ⟹ 𝑎 − 𝑏 = 𝑚(𝑝 − 𝑞)

Exemplos:

38 ≡ 14 (mod 12):
38 | 12
2 3

14 | 12
2 1

E 38 – 14 = 24, que é um múltiplo de 12, ou seja 38 – 14 = 2 x 12, ou seja, k = 2.

–8 ≡ 7 (mod 5):
–8 | 5
–3 –1

7|5
–3 2

E –8 – 7 = –15, que é um múltiplo de 5, ou seja –8 – 7 = –3 x 5, ou seja, k = 2.


Também:
−8 = 𝑝 × 5 + (−3) ⟹ 𝑝 = −1
7 = 𝑞 × 5 + (−3) ⟹ 𝑞 = 2

A relação de congruência a ≡ b (mod m) pode ser reescrita com a = km + b, que é a


chamada divisão euclidiana (D = qd + r), mas, na congruência, b não precisa ser o resto
da divisão de a por m.

Observações:
 Qualquer número par x é congruente com 0 (mod 2), pois, x = 2q + 0.
 Qualquer número ímpar y é congruente com 1 (mod 2) e y = 2q + 1.

83
Definição: Se a ≡ b (mod m), então b é chamado de resíduo de a (mod m). Quando 0 ≤
b ≤ m – 1, então b é chamado de o mínimo resíduo não negativo de a mod m).

O Inverso Multiplicativo

Definição: O inverso de um módulo m é um inteiro b tal que ab ≡ 1 (mod m).

Isso nos diz que ab – 1 = km. Denotamos assim: a-1 = b (mod m).
Existe um inteiro a-1 tal que a.a-1 ≡ 1 (mod m) se, e somente se, a é primo com m.

Dois números congruentes a e b são inversos módulo m se o resto da divisão inteira de


ab por m for igual a 1.

Por exemplo, 5 e –7 são inversos no módulo 12, pois, 5 x (–7) = –35 e o –35 é
congruente com 1 (–35 ÷ 12 = –3. –3 x 12 = –36 e –36 + 1 [o resto] = –35). O 5 e o –7
são congruentes módulo 12 (o resto é 5).
Também 5 x (–7) –1 = –36. Fazendo –36 = k x 12, ou –36 = –3 x 12.

...
[ 1 ]: [...,–59, –47, –35, –23, –11, 1, 13, 25, 37, 49, 61, ...]
...
[ 5 ]: [...,–55, –43, –31, –19, –7, 5, 17, 29, 41, 53, 65, ...]
...

Teorema: Seja m ≥ 2 um inteiro e a um número tal que 1 ≤ a ≤ m – 1. Então a tem um


inverso multiplicativo módulo m se a e m são primos entre si: MDC(a, m) = 1.

 3 tem o 7 como o inverso módulo 10, pois, 3 x 7 = 21 mostra que

3 x 7 ≡ 1 (mod 10), pois 3 x 7 – 1 = 21 – 1 = 2 x 10


Veja:
...
[ 1 ]: [...,–49, –39, –29, –19, –9, 1, 11, 21, 31, 41, 51, ...]
...
[ 3 ]: [...,–47, –37, –27, –17, –7, 3, 13, 23, 33, 43, 53, ...]
...
[ 7 ]: [...,–43, –33, –23, –13, –3, 7, 17, 27, 37, 47, 57, ...]
...

84
 5 não tem um inverso módulo 10, pois, se 5 x b ≡ 1 (mod 10), então isso implica
que 5 x b – 1 = 10k para algum k. Em outras palavras, 5b = 10k + 1, o que é
impossível. Teria que existir um múltiplo de 5 em [1]10:
...
[ 1 ]: [..., -49, -39, -29, -19, -9, 1, 11, 21, 31, 41, 51, ...]
...
Para completar a sequência para a esquerda e para a direita, basta subtrair 10 e
adicionar 10, respectivamente. Porém, você nota que, nem para um lado e nem
para o outro vai aparecer um múltiplo de 5.

Podemos calcular que números têm inversos módulo m calculando que números são
primos com m.

O programa, em Python, a seguir faz esse cálculo.

# coPrimes.py
#---Dado um número x, ache y tal que x e y sejam primos entre si
# ou seja: MDC(x,y) = 1

def mdc(a, b):


while b != 0:
a, b = b, a % b
return a

x=int(input("Valor de x:"))

#---Liste 10 números que sejam primos com x


count=0
y=2
primos=[]
while True:
if(mdc(x,y) == 1):
primos.append(y)
count += 1

if count > 10:


break

y += 1

print("Coprimos de ",x,":")
print(primos)

85
O inverso multiplicativo nada mais é que a operação de divisão. A álgebra abstrata
usa o termo inverso multiplicativo para a divisão (e inverso aditivo, para a subtração)
porque, nela, nem sempre os operandos são números.

Propriedades de Congruência

a ≡ a (mod m) – Reflexiva.
a ≡ b (mod m) se, e somente se, b ≡ a (mod m) – Simétrica.
Se a ≡ b (mod m) e b ≡ c (mod m), então a ≡ c (mod m) – Transitiva.

Se a1 ≡ b1 (mod m) e a2 ≡ b2 (mod m) ou a ≡ b (mod m) e um inteiro k,então:

a + k ≡ b + k (mod m)
ak ≡ bk (mod m)
a1 + a2 ≡ b1 + b2 (mod m)
a1 - a2 ≡ b1 - b2 (mod m)
a1 . a2 ≡ b1 . b2 (mod m)
ak ≡ bk (mod m), para qualquer k ≥ 0.
P(a) ≡ P(b) (mod m), para qualquer polinômio P(x) com coeficientes
inteiros.

Se a + k ≡ b + k (mod m), para qualquer k ϵ z, então a ≡ b (mod m).


Se ak ≡ bk (mod m) e k é primo com m [MDC(k, m) = 1], então a ≡ b (mod m).
Se ak ≡ bk (mod m) e MDC(k, m) = d, então a ≡ b (mod m / d).
Se a ≡ b (mod m) e c ≡ d (mod m), então ac ≡ bd (mod m).

86
Resumo Ilustrativo

Veja como a diferença entre quaisquer dois números de uma sequência [r] é sempre
igual a 12.

Classes de Equivalência

A sequência dos restos, como no exemplo acima: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 é


chamada de classe de equivalência. Assim, Z mod 12 possui 12 classes de equivalência.

87
Congruência Linear

Seja x ≡ 16 (mod 12). Essa “equação congruente” tem várias soluções, pois, os
seguintes valores para x a satisfazem:

x = ... ≡ –20 ≡ –8 ≡ 4 ≡ 16 ≡ 28 ≡ 40 ≡ ... ≡ a (mod 12)

Porém, podemos criar uma restrição escolhendo apenas uma solução da lista.

Definição: b (mod m) é o menor inteiro positivo x tal que x = b (mod m).

x ≡ b (mod m) é uma relação de equivalência (ver) com muita soluções para x,


enquanto x = b (mod m) é uma igualdade. Assim, x = b (mod m) é a menor solução
positiva para x ≡ b (mod m).
No exemplo dado acima, a solução é 4, ou seja, para –8 e 40, temos que:

4 = –8 (mod 12) e 4 = 40 (mod 12)

Note que a solução é o próprio resto!

Soluções de congruências lineares são consideradas como o resíduo mínimo.

Em uma equação normal (=), você pode fazer:

𝑎 𝑏
=
𝑦 𝑦

Mas, numa equação congruente, você só pode fazer isso:

𝑎 𝑏 (𝑚𝑜𝑑 𝑚)

𝑦 𝑦

se y for primo com m, ou seja MDC(y, m) = 1.

Para converter uma equação normal para uma equação congruente, basta reduzi-la ao
módulo m, como mostra o exemplo 1. Se dois inteiros são iguais, x = y, então, com
certeza, eles são congruentes. Por isso, a única coisa que muda na expressão é,
praticamente, o operador (= para ≡).

Exemplo 1:
2𝑥 = 5 → 2𝑥 ≡ 5 (𝑚𝑜𝑑 12)

A figura a seguir ilustra.

88
Para converter uma equação congruente para uma equação normal, deve-se ter um
pouco mais de cuidado, pois, se dois inteiros são congruentes, não implica que eles
sejam iguais.

Teorema: ax ≡ b (mod m) se, e somente se, MDC(a, m) divide b.

Se essa condição é satisfeita, então a congruência tem, exatamente, MDC(a, m)


soluções módulo m. Se o MDC(a, m) não divide b, então a congruência linear não tem
solução.

Corolário: A equação [a]m x [x]m = [c]m tem solução se, e somente se, o MDC(a,m)
divide c (c é múltiplo do máximo divisor comum entre a e m).

Facilmente, você nota que, se o MDC = 1, sempre tem solução.

Teorema: Se m é primo e m não divide a, o que implica MDC(a,m) = 1,então a


congruência ax ≡ b (mod m) sempre tem solução e essa solução é única.

A notação [r]m denota um subconjunto dos números cujo resto da divisão por m
resulta em r. Por exemplo, se m = 3, temos:

[ 0 ]3: [..., -15, -12, -9, -6, -3, 0, 3, 6, 9, 12, 15, ...]
[ 1 ]3: [..., -14, -11, -8, -5, -2, 1, 4, 7, 10, 13, 16, ...]
[ 2 ]3: [..., -13, -10, -7, -4, -1, 2, 5, 8, 11, 14, 17, ...]

89
Exemplo 2:
2𝑥 ≡ 5 (𝑚𝑜𝑑 12) → 2𝑥 = 5 + 12𝑞, 𝑐𝑜𝑚 𝑞 ∈ ℤ

MDC(2, 12) = 2. Como 2 não divide 5, a equação não tem solução.


Outra maneira de verificar isso é notar que 12q sempre será um número
par. Como 5 é ímpar e uma soma de ímpar com par sempre dá ímpar,
temos uma contradição, pois, 2x, sendo par, não pode ser igual a um
ímpar.

Teorema: Se a ≡ b (mod m) e a-1 existe, então a-1 ≡ b-1 (mod m).

Lema: Resolver a congruência ax ≡ b (mod m) é equivalente a resolver a equação linear


diofantina ax – my = b, para um inteiro y.

Esta equação pode ser escrita assim também: ax – b = my. E se o MDC(a, m) divide b,
então divide ax – b também.

As soluções são das pelas fórmulas:

𝑚
𝑥 = 𝑥0 + ( ).𝑞 (𝐴)
𝑀𝐷𝐶(𝑎, 𝑚)

𝑎
𝑦 = 𝑦0 + ( ).𝑞 (𝐵)
𝑀𝐷𝐶(𝑎, 𝑚)

para um inteiro q, com x0 e y0 duas soluções iniciais. Isso significa que uma congruência
linear também tem infinitas soluções, dadas na forma

𝑚
𝑥 = 𝑥0 + ( ) . 𝑞, 𝑞∈ℤ
𝑀𝐷𝐶(𝑎, 𝑚)

e q = 0, 1, ..., [MDC(a, m)] – 1.

Exemplo 3: 3x ≡ 8 (mod 2)

MDC(3, 2) = 1, o que implica que tem solução e que 3x – 8 (expressão da


equação diofantina) é divisível por 2. Então, existe um inteiro y tal que:

3𝑥 − 8
=𝑦
2
Ou seja, 3x – 2y = 8.
Uma solução particular para esta equação é x0 = 0 e y0 = -4. Então, 3x0 – 2y0 = 8
é uma equação válida. Com essas raízes, temos: 3(x – x0) – 2(y – y0) = 0.

90
E, por (A) temos que:
2
𝑥 − 𝑥0 = ( ) . 𝑞 = 2𝑞
𝑀𝐷𝐶(3,2)

Por isso, as soluções para a congruência 3x ≡ 8 (mod 2) é x = x0 + 2q, com q ϵ z,


ou seja, x = 2q (porque x0 é solução e x0 + k é solução, o que implica que k é
solução – veja as propriedades, acima), ou x ≡ 0 (mod 2), o que implica que x é
divisível por 2, o que implica que x é par.

Método de Transformação de Coeficientes (nível de diofantina)

Esse método usa o fato de que podemos adicionar a a e a b números que são
congruentes a eles.

Exemplo 4: 7x ≡ 6 (mod 15)


Como MDC(7, 15) = 1, só existe uma solução.
Adicionamos à congruência original a seguinte congruência: 0 ≡ 15 (mod 15),
obtendo 7x ≡ 21 (mod 15).

Dividindo tudo por 7, temos x ≡ 3 (mod 15) ou x = 3 + 15q, que é a solução final.

Teorema: Se ax ≡ b (mod m) e a é primo com m, a solução para essa congruência


linear é dada por x ≡ a-1b (mod m).

Exemplo 5: Considere o sistema de equações congruentes lineares a seguir e encontre


a solução para o mesmo.

𝑥 ≡ 2 (𝑚𝑜𝑑 5)
{
𝑥 ≡ 1 (𝑚𝑜𝑑 3)

Alguns dos inteiros que satisfazem a primeira equação são:

..., -8, -5, 2, 7, 12, 17, 22, 27, 32,...

Alguns dos inteiros que satisfazem a segunda equação são:

..., -8, -5, -3, 1, 4, 7, 10, 13, 16, 19, 22,...

Os valores marcados em vermelho satisfazem ambas as equações. Provavelmente,


existem outras soluções.

91
Método do Algoritmo de Euclides (Algoritmo da Divisão)

Exemplo 6: 5x ≡ 12 (mod 23)

MDC(5, 23) = 1, o que implica uma solução única.


Usando o algoritmo da divisão:

23 = 5(4) + 3
5 = 3(1) + 2
4 = 5 + 1(–1)
3 = 2(1) + 1
2 = 5 + 3(–1)

1 = 3 + 2(–1) = 3 + [5 + 3(–1)] – 1 = 5(–1) + 3(2) = 5(–1) + [23 + 5(–4)](2) =


= 23(2) + 5(–9).

Daí, –9 pode ser usado como um inverso para a congruência linear do


exemplo. Então (–9)5x ≡ (–9)12 (mod 23), o que implica x ≡ –108 (mod
23) ou x ≡ 7 (mod 23). [–108 e 7 geram o mesmo resto, quando
divididos por 23].

Duas soluções são consideradas a mesma se elas diferem por um múltiplo de m. Se x


é solução, então x + km é solução; se x + km é solução, x é solução.

Em uma congruência linear ax ≡ b (mod m), x é um número que, multiplicado por a, é


congruente com b módulo m. A ideia é encontrar um número x que, multiplicado por
a resulte num número igual a b ± km, onde k é um inteiro positivo qualquer.

Exemplo 7: 4x ≡ 2 (mod 10) significa que Resto(4x / 10) = 2. Se você usar a seguinte
equação: D = qd + r, você pode ver que 4x = 10q + 2 e visualizar como transformar
uma congruência linear numa equação.

Exemplo 8: 35x ≡ 14 (mod 84)

MDC(35, 84) = 7. Como 7 divide 14, o sistema tem solução, e são 7 soluções em
módulo 84.

A equação diofantina correspondente é 35x + 84y = 14 que, ao se dividir por 7


os dois lados, equivale a 5x + 12y = 2.
Por inspeção, x0 = –2 e y = 1 é uma solução.

92
Todas as soluções terão a forma x = –2 + 12q. Podemos pegar qualquer valor de
q em 1 ≤ q ≤ 83. As soluções de congruência têm a forma ax ≡ x0 (mod m).
As 7 soluções são: x ≡ 10 (mod 84), x ≡ 22 (mod 84), x ≡ 34 (mod 84), x ≡ 46
(mod 84), x ≡ 58 (mod 84), x ≡ 70 (mod 84), x ≡ 82 (mod 84).

Se você multiplicar esses valores de x (10, 22, 34, 46, 58, 70, 82) por 35, obterá os
valores 350, 770, 1190, 1610, 2030, 2450 e 2870, que são todos congruentes com 14,
em módulo 84.

Exemplo 9: 23x ≡ 7 (mod 91)

MDC(23, 91) = 1, o que implica uma única solução.

23x + 91y = 1. Pelo algoritmo da divisão, 91 = 4(23) – 1. Multiplicando os dois


lados por 7: 91(7) = 28(23) – 7, e a congruência 28(23) ≡ 7 (mod 91). Assim,
temos que x0 = 28 é uma solução para a congruência 23x ≡ 7 (mod 91).

Pelo passo 2, todas as soluções têm a forma x = 28 + 91q, isto é, x ≡ 7 (mod 91)
é a única solução.

Este programa em Python acha as soluções de uma congruência linear dada. Se não
houver solução, a lista volta vazia:

#---modCongruence.py
#
# Dada uma congruência linear Ax ≡ B (mod M), lista todos
# os números Ax em {B ± M} e calcula x para cada um (dividindo
# cada um deles por A)

soluc=[] # lista de soluções para x

A=int(input("Coeficiente de x:"))
B=int(input("Valor Congruente ao Coeficiente:"))
M=int(input("Modulo da Divisao:"))

LC=str(A)+"x ≡ "+str(B)+" (mod "+str(M)+")"

restoB = B % M

for x in range(0,M):
resto = (A * x) % M
if resto == restoB:
soluc.append(x)

print("Solutions for ",LC,":")


print(soluc)

93
Conjuntos

Um conjunto é, usualmente, especificado como uma lista de seus elementos entre


chaves ou pela afirmação de uma propriedade que determina se um objeto x pertence
ou não ao conjunto:

X = {x1, x2, ..., xn}


ou
X = { x | x satisfaz P}

se cada elemento x em X satisfaz uma dada propriedade P

Funções

As principais características gerais de funções são a composição (funções compostas),


a injeção (um elemento do domínio corresponde a um, e apenas a um, elemento do
contradomínio, e vice-versa), a sobrejeção (os elementos do domínio cobrem todos os
elementos do contradomínio) e a inversão (que requer injeção).

As funções f : R → R+, definida por f(x) = ex (sempre > 0, nunca zero ou negativa no
contradomínio), para todo x ϵ R, e g : R+ → R, definida por g(y) = ln(y) (só valores
maiores que zero no domínio), para todo y ϵ R+, dão um dos exemplos mais
importantes de um par de funções inversas.

Uma função f : S → T é uma “regra” que assinala um (ou mais) elementos de S a um


único elemento de T.

Considerando o gráfico de uma função, o teste da linha vertical diz que uma curva no
plano xy é o gráfico de uma função de x se, e somente se, nenhuma linha vertical corta
o gráfico em mais que um ponto (se isso ocorrer, então a “regra” não é uma função).

94
O teste da linha horizontal diz que uma função é injetora se, e somente se, uma linha
horizontal não corta o gráfico em mais de um ponto. Por exemplo, a função f(x) = x2
não passa neste teste.

Uma das ideias mais fundamentais da álgebra abstrata é que duas estruturas
algébricas são as mesmas (equivalentes) se a única diferença entre elas for o nome
que se dá aos seus elementos (por exemplo, um conjunto de 10 frutas diferentes e o
subconjunto dos inteiros de 1 a 10 são equivalentes). Isso é chamado de isomorfismo
de conjuntos.
Para ser mais preciso, dizemos que duas estruturas são a mesma se pudermos achar
uma função inversa de uma (estrutura) para a outra que preserve a estrutura algébrica
essencial.

Relações de Equivalência

Em diversas situações, torna-se útil dividir um conjunto em subconjuntos nos quais os


elementos têm propriedades comuns. Podemos descrever três maneiras de dividir um
conjunto:
1) Definição de uma relação de equivalência R, que diz em que situação dois
elementos de R pertencem ao mesmo subconjunto.
2) Noção de uma partição R, que enfatiza a descrição dos subconjuntos.
3) Cada partição (também chamada de relação de equivalência), na verdade, sai
de uma função f : R → T, onde dizemos que x1 e x2 são equivalentes se f(x1) =
f(x2).

Uma relação de equivalência em um conjunto X é uma relação 𝑅 ⊂ 𝑋 × 𝑋, tal que:


 (x, x) ϵ R para todo x – Propriedade Reflexiva.
 (x, y) ϵ R implica (y, x) ϵ R – Propriedade Simétrica.
 (x, y) e (y, z) ϵ R implica (x, z) ϵ R – Propriedade Transitiva.

Dada uma equivalência R num conjunto X, escrevemos x ~ y , em vez de (x, y) ϵ R. Se a


equivalência já tem uma notação associada, como =, ≡, ≅, então, resumimos ela.

Partições

Uma partição P, de um conjunto X, é uma coleção de conjuntos não vazios X1, X2, ...,
tal que 𝑿𝒊 ∩ 𝑿𝒋 = ∅ para i ≠ j e UkXk = X (os subconjuntos são disjuntos e união deles é
o próprio conjunto X). Seja ~ uma relação de equivalência em um conjunto X e x ϵ X.
Então [x] = { y ϵ X | y ~ x } é chamado de classe equivalente de x.

P = { {X1}, {X2}, ..., {Xn} }

95
Exemplo:

X = {1, 2, 3}. Então { {1}, {2}, {3} } e { {1, 2}, {3} } são duas partições do conjunto X. { {1,
2}, {2, 3} } não é uma partição de X, pois X1 e X2 não são disjuntos.

Teorema: Dada uma relação de equivalência ~ em um conjunto X, as classes


equivalentes de X formam uma partição de X. De modo inverso, se P = {Xi} é uma
partição de um conjunto X, então existe uma relação de equivalência em X com as
classes de equivalência de Xi.

Corolário: Duas classes de equivalências de uma relação de equivalência são iguais ou


são disjuntas (a intersecção é vazia).

Dois inteiros a e b são equivalentes MOD m se m divide a – b. Os inteiros MOD m


particionam o conjunto Z em m classes de equivalências diferentes, cada uma
denotada por Zm.

Por exemplo, para os inteiros MOD 12:

Aqui temos 12 partições do conjunto Z, ou classes de equivalência no conjunto Z.


Como se pode ver, um dado elemento de qualquer [ri] é único ali, por todo o conjunto
Zm, ou seja, os subconjuntos são disjuntos e cobrem todo o conjunto Z, por isso são
partições. Veja que quando o dividendo atinge um múltiplo de 12, cada classe começa
a se repetir, até m – 1 em Zm. Costuma-se denotar a primeira partição por dZ (neste
exemplo: 12Z).

96
Imagine que cada partição acima – de 0 a 11 – seja as marcas de hora em um
relógio. Pegue, por exemplo, o [6]. Então, todos os números nessa linha (aqueles
dentro das chaves na linha [6]), que chamamos de dividendo, podem ser
considerados como uma hora marcada e, cada um deles, corresponderá à marca 6h.
Como 6h e 18h correspondem à mesma hora, dizemos que 6 e 18 são congruentes
módulo 12.

São 8h. Que horas serão daqui a 25 horas? Serão 9h, pois:
(8 + 25) mod 12 ≡ 33 mod 12 = 9 ou 8 mod 12 + 25 mod 12 = 8 + 1 = 9.

Definimos um conjunto Zm assim: Zm = {[r]m | 0 ≤ r ≤ m – 1}.

Por exemplo, para Z3:

[ 0 ]3: [..., -15, -12, -9, -6, -3, 0, 3, 6, 9, 12, 15, ...]
[ 1 ]3: [..., -14, -11, -8, -5, -2, 1, 4, 7, 10, 13, 16, ...]
[ 2 ]3: [..., -13, -10, -7, -4, -1, 2, 5, 8, 11, 14, 17, ...]

Temos três classes de equivalências (ou três partições) de Z: [0]3, [1]3, [2]3,
onde [0]3 U [1]3 U [2]3 = Z.

As classes Zm são disjuntas e sua união é o próprio conjunto Z.

Uma partição de um conjunto X é um subconjunto não vazio de X que, unido com as


demais partições de X, que são disjuntas entre si, cobrem todo o conjunto X.

Exemplo:
Z2 = {[0]2, [1]2} são partições de Z.

Z3 = {[0]3, [1]3, [2]3} são partições de Z.

{ {n ϵ Z | n < 0}, {0}, {n ϵ Z | n > 0)} } são partições de Z.

{ {n ϵ Z | n < 0}, {n ϵ Z | n > 0)} } não são partições de Z, pois a união


dos subconjuntos não cobre todo o conjunto Z.

{ {n ϵ Z | n ≤ 0}, {n ϵ Z | n ≥ 0)} } não são partições de Z, pois os dois


subconjunto não são disjuntos.

97
Seja Zm o conjunto de classes de equivalência de inteiros (mod m) e a, b, c ϵ Z . Então:
1) Adição e multiplicação são comutativas:
a + b ≡ b + a (mod m)
ab ≡ ba (mod m)
2) Adição e multiplicação são associativas:
(a + b) + c ≡ a + (b + c) (mod m)
(ab)c ≡ a(bc) (mod m)
3) Existem as identidades aditivas e multiplicativas:
a + 0 ≡ a (mod m)
a.1 ≡ a (mod m)
4) A multiplicação é distributiva na adição:
a(b + c) ≡ ab + ac (mod m)
5) Para todo inteiro a, existe um inverso aditivo –a:
a + (–a) ≡ 0 (mod m)
6) Seja a ≠ 0, um número inteiro. Então o MDC(a, m) = 1 se, e somente se, existe
um inverso multiplicativo b para a (mod m), isto é, um inteiro b não nulo tal que
ab ≡ 1 (mod m).

Propriedades:
[a]m + [b]m = [a + b]m
[a]m x [b]m = [ab]m

Ordem

Um subconjunto não vazio S de Z é bem ordenado se S contém um elemento mínimo.


Veja que Z não é bem ordenado, pois, Z não contém um elemento mínimo. Porém, N
é bem ordenado (N contém o zero como elemento mínimo. Zero é o maior elemento
de Z que é igual ou menor que todos os elementos de N. Por causa disso, zero é,
também, um ínfimo de N – como Z vai de +∞ a –∞, Z não tem mínimo, ínfimo,
supremo e nem máximo. O ínfimo é sempre maior que o mínimo; o supremo é sempre
menor que o máximo. Veja Sequências Monótonas e Limitadas, no Volume 4).

Princípio da Bem Ordenança: Qualquer subconjunto não vazio de N é bem ordenado.


Este princípio é equivalente ao princípio 1 da indução matemática.

Lema: O princípio 1 da indução matemática implica que 1 é o menor número natural


positivo.

Prova: Seja S = { n ϵ N | n ≥ 1}. Então 1 ϵ S. Agora, assuma que n ϵ S, isto é, n ≥ 1.


Como n+1 ≥ 1, n+1 ϵ S. Daí, por indução, todo número natural é igual ou maior que 1.

Teorema: O princípio da indução matemática implica o princípio da bem ordenança,


isto é, qualquer subconjunto não vazio de N contém um elemento mínimo.

98
O Método da Repetição dos Quadrados

Achar o resultado de potências grandes pode consumir bastante tempo. Qualquer um


1000000
pode calcular 22 ou 28 e, também, sabe como calcular 22 , porém, números assim
são tão grandes que acabamos por desistir de efetuar os cálculos. Além disso, depois
de um certo ponto, não teremos mais como continuar os cálculos, mesmo que
tivéssemos, ao nosso dispor, todos os computadores que existem no mundo. Porém,
se pudermos computar algo como 237398332 (mod 46389), podemos, facilmente, chegar
ao resultado, pois, ele seria um valor entre 0 e 46389.
Para isso, uma coisa a se notar é que qualquer número a pode ser escrito como soma
de potências de 2, assim:
𝑎 = 2𝑘1 + 2𝑘2 + ⋯ + 2𝑘𝑛

onde k1 < k2 < ... < kn.

Esta é, exatamente, a representação de a na base binária, onde kn é a posição de um 0


ou um 1 que multiplica 2𝑘𝑛 .

As propriedades da exponenciação funcionam normalmente no nosso conjunto Zn


aqui, isto é, se b ≡ ax (mod n) e c ≡ ay (mod n), então bc ≡ ax+y (mod n).
𝑘
Podemos calcular 𝑎2 com k multiplicações assim:

Exemplo 1: Vamos calcular 271321 (mod 481).

Vemos que 321 = 20 + 26 + 28.

Então, calcular 271321 (mod 481) é o mesmo que calcular o seguinte:


0 +26 +28 0 6 8
2712 ≡ 2712 × 2712 × 2712 (𝑚𝑜𝑑 481)

𝑖
Assim, é suficiente calcular 2712 (𝑚𝑜𝑑 481), onde i = 0, 6, 8.

Usando o método da repetição dos quadrados podemos completar o cálculo.

99
Simetria

Basicamente, simetria (ou isometria) é uma operação sobre um objeto que não o
modifica – ele sai de um estado para outro, mas, permanece com a mesma “cara”.
Reflexão, rotação e translação são as principais operações que podem resultar em
simetria. Por exemplo, um quadrado rotacionado por 90 graus em torno de um eixo
passando pelo seu centro geométrico vai ficar com a mesma cara.

Uma simetria de uma figura geométrica é um rearranjo de seus lados e de seus


vértices, assim como das distâncias e ângulos. Um mapeamento do plano nele mesmo,
preservando a simetria de um objeto é chamado de movimento rígido.

Quando é feita uma operação de simetria, ocorre o mapeamento de pontos do objeto:

As transformações possíveis correspondem, exatamente, ao número de combinações


possíveis das quatro letras. No caso acima, serão 4! = 24 combinações possíveis. Mas,
algumas delas são repetições e, assim só existem 8 simetrias verdadeiras no quadrado,
onde uma delas é uma das duas figuras do lado esquerdo (que são a mesma).

Ordem de Simetria Rotacional

Quando um objeto tem simetria rotacional, a ordem daquela simetria é a quantidade


de posições diferentes que o objeto assume após uma quantidade precisa de rotações
antes dele se mostrar na mesma posição de partida de novo. Em palavras mais
simples, a ordem de uma simetria é a quantidade de vezes, dentro de uma volta
completa, que o objeto mostra “caras” diferentes da que ele tinha antes de iniciar a
rotação. Se ele chegar na mesma “cara” só após ter completado a volta, então ele
não tem simetria de rotação.

As figuras a seguir mostram vários objetos com rotação no plano desta página.

100
Claramente, você percebe que a ordem é dada pela seguinte fórmula:

360
𝑜𝑟𝑑𝑒𝑚 =
𝑔𝑟𝑎𝑢𝑠 𝑚𝑒𝑠𝑚𝑎 𝑐𝑎𝑟𝑎

Desse modo, para cada figura acima, temos, sequencialmente, a seguinte ordem: 3, 1,
2, 2, 4, 5, 1, 4, 360 (considerando a rotação do círculo em graus inteiros, apenas), 5.
Note que as figuras que têm ordem 1, chegaram na mesma cara só após uma volta
completa. Portanto, elas não têm simetria de rotação.

A figura a seguir é autoexplicativa. Ela mostra as simetrias das letras do alfabeto


rotacionadas nos três planos do espaço 3-D.
Para a letra I no plano zx, considere ela como se fosse um carretel ou uma letra assim
(um cilindro girando em torno de seu eixo longitudinal): I. Para a letra O no plano xy,
considere-a perfeitamente circular. Diferentemente do círculo acima, estamos
considerando o conjunto R para os giros. Daí, o 0+ significa desde o primeiro real após
o zero até o infinito pode ser o valor da ordem.

101
Simetria de Reflexão

Um objeto tem simetria de reflexão se existe uma linha na qual o objeto possa ser
refletido (biseccionado) de tal modo que as suas duas partes tenham a mesma “cara”.
Por exemplo:

Simetria de Translação

Um objeto tem simetria de translação quando ele permanece com a mesma “cara”
depois que é deslocado. Por exemplo, no conjunto de azulejos abaixo, se você pegar o
subconjunto destacado e movê-lo um passo para cima, para baixo, para a esquerda ou
para a direita, a figura como um todo não será modificada. Esta é uma simetria de
translação.

102
Simetrias no Triângulo

Um conjunto de operações de simetrias possíveis em um triângulo forma o conjunto de


elementos possíveis:

103
Para determinar simetrias no triângulo equilátero ∆ABC, primeiro examinamos as
permutações dos vértices A, B e C, e, então, verificamos se a permutação gera uma
simetria do triângulo. Os três vértices têm 3! = 6 permutações. Então o triângulo tem,
no máximo, seis simetrias. E o conjunto destas permutações é {1, r, r2, f, fr, fr2} ou {id,
p1, p2, μ1, μ2, μ3}, pois, todas as demais permutações repetem uma destas. Por
exemplo, como r3 = 1, então temo que r4 = r1 x r3 = r1+3 = r1 x 1 = r1. Da mesma maneira,
f3 = f.

Para especificar a permutação dos vértices de um triângulo equilátero que muda os


vértices de A para B, B para C e C para A, escrevemos:

104
Note que esta permutação (ver Grupo de Permutações) em particular, corresponde a
um movimento rígido de rotação do triângulo por 120 graus no sentido dos ponteiros
de um relógio.

Estas operações de transformação equivalem às transformações + e x em conjuntos


numéricos, ou seja, às operações que causam estas transformações. Por exemplo, fr,
no conjunto de permutações acima equivale a f x r.

Propriedades da Simetria

1) A composição de simetrias é uma simetria.


2) A composição de simetrias é associativa.
3) “Nenhuma ação”, ou seja, nenhuma transformação (ou a transformação
identidade, como 0 na adição e 1 na multiplicação) é uma simetria.
4) A ação de desfazer uma simetria é uma simetria.

Tipos de Simetrias

Simetrias são de dois tipos:


 Discreta – Como a simetria bilateral do rosto humano.
 Contínua – Como a forma invariável de uma esfera em rotação.

Simetrias discretas estão associadas com grupos finitos, enquanto as simetrias


contínuas estão associadas com grupos infinitos.

Os “átomos” da simetria são os grupos simples, pois, estes não podem ser divididos
em unidades menores.

105
Grupos

Um grupo é uma coleção de simetrias ou uma coleção de elementos com respeito a


alguma operação (transformação).
De modo simples, um grupo G é um conjunto onde se define uma operação binária
associativa (+, x, por exemplo) que possui um elemento identidade e, também, a
inversa de cada um de seus elementos.

Notação Identidade Elemento Inverso Ação


(G, +) 0 a –a a + –a = 0, a + 0 = a
(G, x) 1 b 1/b b x 1/b = 1, b x 1 = b

A definição de um grupo não requer a propriedade comutativa, ou seja, mesmo que


não se possa comutar a operação num grupo, ele continua sendo um grupo.

Os conjuntos Z, Q, R e C são grupos sob a adição. Os conjuntos Q*, R* e C* (cada


conjunto com o elemento nulo excluído) são grupos sob a multiplicação. O conjunto
dos números naturais N não é um grupo, pois, não possui elementos inversos.

O conjunto das matrizes n x n (matrizes quadradas), com elementos de R, é um grupo


sob a adição, mas, não é um grupo sob a multiplicação.

O conjunto das matrizes inversíveis, com elementos de R, é um grupo sob a


multiplicação, mas, não é um grupo sob a adição.

Os inteiros (mod m) e as simetrias de um triângulo ou de um retângulo são exemplos


de grupos.
Uma operação binária (ou lei de composição) op em um conjunto G é uma função G x
G em G que atribui a cada par (a, b) ϵ G um único elemento <a op b> de G, chamado
de composição de a e b (pares de elementos em G operados para um elemento de G).
Um grupo (G, op) é um conjunto G junto com uma lei de composição dada por (a, b) →
<a op b> que satisfaz os seguintes axiomas:

 A lei de composição é associativa: (a op b) op c = a op (b op c), para a, b, c ϵ G.


 Existe um elemento e ϵ G, chamado de elemento identidade, tal que, para
qualquer elemento a ϵ G, temos: e op a = a op e = a.
 Para cada elemento a ϵ G, existe um elemento inverso em G, denotado por a-1,
tal que: a op a-1 = a-1 op a = e.

106
Por exemplo, sejam os seguintes três conjuntos e suas respectivas operações:

Você pode notar que:


 Os três conjuntos são fechados relativamente às suas operações
(transformações):
Para o conjunto do relógio: 3 + 5 = 8 = 1. Se o ponteiro sair do 3 mais 5 passos
teremos: 4, 5, 6, 0, 1. Em outras palavras, a adição do elemento 3 ao elemento
5 resulta em um elemento do próprio conjunto (1). Por isso esse conjunto é
fechado em relação à adição (também 1 – 3 = 1 + –3 = 5. Faça o teste com o
ponteiro do relógio saindo do 1 para trás por três passos). Esse conjunto
corresponde ao conjunto formado pelos restos de qualquer divisão por 7.
Para o conjunto dos inteiros é óbvio.
 Na multiplicação, o inverso de um elemento x é denotado por x-1, o que
1 𝑥
implica que 𝑥 × 𝑥 −1 = 1 = 𝑥 × 𝑥 = 𝑥. Aqui temos o chamado inverso
multiplicativo. Na adição se chama inverso aditivo.
Para o conjunto de simetrias do triângulo vimos que r3 = r2 x r1 = 1, o que
implica que o elemento inverso do elemento r é o r2, e vice-versa. Para o
conjunto do relógio e dos inteiros, o inverso do elemento x é o elemento –x, o
que implica que x + –x = 0.
 Os três conjuntos contêm um elemento identidade:
Para o conjunto do relógio e dos inteiros esse elemento é o zero: x + 0 = x. Para
o conjunto das simetrias do triângulo, esse elemento é o 1: 1 x r2 = r2.
 Nos três conjuntos a propriedade associativa se aplica.

Por isso estes três conjuntos formam um grupo, cada um. Mesmo que a propriedade
comutativa não se aplique às simetrias do triângulo, onde fr ≠ rf:

𝐴 𝐵 𝐶 𝐴 𝐵 𝐶
𝑓𝑟 = ( ) ≠ 𝑟𝑓 = ( )
𝐴 𝐶 𝐵 𝐵 𝐴 𝐶

Ainda assim, as simetrias do triângulo formam um grupo (um grupo não abeliano, no
caso).

107
Reforçando a Definição

 Uma operação com um ou mais elementos do conjunto resulta em um


elemento do conjunto. Aqui temos fechamento e associação (operando três ou
mais elementos do conjunto).
 Existe um elemento que devolve o mesmo elemento sobre o qual ele opera. O
primeiro elemento é o elemento identidade (a identidade do elemento
operado é preservada). Aqui vemos um toque de simetria (a “cara” do objeto
não é alterada).
 Todo elemento do conjunto tem um inverso que resulta no elemento
identidade quando o elemento e seu inverso são operados.

Podemos aplicar estas regras em termos de simetria também:


 Composição de simetrias é simetria (o elemento resultante continua sendo um
elemento do conjunto de simetrias – fechamento e associativa).
 A simetria não altera a “cara” do objeto (pela definição de simetria). Aqui
temos o elemento identidade.
 Desfazer uma simetria é simetria. Aqui temos o elemento inverso.

Definição Abstrata de um Grupo


1) A combinação de um objeto do conjunto com outro objeto do mesmo conjunto
resulta em um terceiro objeto daquele conjunto.
2) Existe um objeto no conjunto que, quando combinado com outro objeto do
conjunto, resulta neste próprio objeto.
3) Para cada objeto no conjunto, existe um objeto associado a ele que, quando se
combina os dois, resulta o objeto do item 2.

Grupo Abeliano

Se um grupo G apresenta a propriedade comutativa, ou seja, a op b = b op a para todo


a, b ϵ G, G é chamado de grupo abeliano (ou grupo comutativo). Grupos que não
satisfazem essa propriedade são chamados de grupos não abelianos.
Um grupo abeliano é um grupo em que a aplicação da operação do grupo a quaisquer
dois elementos do grupo não depende da ordem desses elementos – o mesmo que
grupo comutativo. O grupo (G, op) é não abeliano se existe pelo menos um par de
elementos a e b tal que a op b ≠ b op a.
O grupo Z, exemplificado acima, é um grupo abeliano sob a adição e sob a
multiplicação. As simetrias no triângulo equilátero formam um grupo não abeliano.

108
Tabela de Cayley

É conveniente descrever um grupo em termos de uma tabela de adição e de


multiplicação usando um dispositivo chamado de Tabela de Cayley. Por exemplo, os
inteiros módulo m formam um grupo sob a adição. Consideremos Z5, consistindo das
classes de equivalências 0, 1, 2, 3 e 4. A operação de grupo em Z5 é chamada de adição
modular. O elemento 0 é a identidade [exemplo: 2+3 = 3+2 = 0] do grupo 5Z2 (o
expoente 2 é uma referência – pé da página – não uma potência) e cada elemento de
5Z tem um inverso. A tabela de Cayley para (5Z, +) é:

+ 0 1 2 3 4
0 0 1 2 3 4
1 1 2 3 4 0
2 2 3 4 0 1
3 3 4 0 1 2
4 4 0 1 2 3

Em uma tabela de Cayley, a primeira linha é uma repetição dos valores nas colunas e
a primeira coluna é uma repetição dos valores nas linhas (por causa do elemento
identidade). A reflexão na diagonal principal é simétrica (não ocorre modificação da
tabela). Isso ocorre quando o grupo é abeliano. Se o grupo não for abeliano, a
simetria não ocorre. Em uma tabela de Cayley não existem elementos duplicados na
mesma linha e nem na mesma coluna.

Nem todo conjunto com uma operação binária é um grupo. Por exemplo, o conjunto
Zm com a operação binária de multiplicação não forma um grupo. O elemento 1 (em
[1]m) é o elemento identidade do grupo, porém, o elemento 0 ([0]m) não tem um
inverso multiplicativo. Teríamos que remover o zero do conjunto para torná-lo um
grupo sob a multiplicação. Porém, nem sempre funciona. Para Z5 não vai funcionar
porque não existe um múltiplo de 5 que esteja na partição [1].

Vimos que um número não nulo a de Zm tem um inverso se, e somente se, a é primo
com m. Denotemos o conjunto dos elementos de Zm que são primos com m por U(m).
Assim U(m) será um grupo sob a multiplicação chamado de grupo das unidades de Zm
(o grupo das unidades de Zm é formado pelos elementos de Zm que têm um inverso
multiplicativo).
Consideremos, por exemplo o conjunto U(8).
Estes são os dez primeiros números que são primos com 8: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21

2
Mantenha em mente que Zd se refere ao conjunto de classes, enquanto que dZ, se refere aos
múltiplos de d. Então Z5 é o conjunto de classes e 5Z é a classe [0], ou múltiplos de 5. Note que as
classes maiores que zero NÃO possuem o elemento identidade, o que implica que elas NÃO SÃO grupos
em si.

109
E estas são as partições do conjunto Z8:

[ 0 ]: [..., -40, -32, -24, -16, -8, 0, 8, 16, 24, 32, 40, ...]
[ 1 ]: [..., -39, -31, -23, -15, -7, 1, 9, 17, 25, 33, 41, ...]
[ 2 ]: [..., -38, -30, -22, -14, -6, 2, 10, 18, 26, 34, 42, ...]
[ 3 ]: [..., -37, -29, -21, -13, -5, 3, 11, 19, 27, 35, 43, ...]
[ 4 ]: [..., -36, -28, -20, -12, -4, 4, 12, 20, 28, 36, 44, ...]
[ 5 ]: [..., -35, -27, -19, -11, -3, 5, 13, 21, 29, 37, 45, ...]
[ 6 ]: [..., -34, -26, -18, -10, -2, 6, 14, 22, 30, 38, 46, ...]
[ 7 ]: [..., -33, -25, -17, -9, -1, 7, 15, 23, 31, 39, 47, ...]

Os elementos de Z8 são 0, 1, 2, 3, 4, 5, 6, 7. Desses, são primos com 8: 1, 3, 5, 7. Com


isso, a tabela Cayley para o grupo U(8) é (multiplique os números que se cruzam na
primeira linha e primeira coluna, procure o resultado nas partições acima e pegue o
número correspondente da partição):

x 1 3 5 7
1 1 3 5 7
3 3 1 7 5
5 5 7 1 3
7 7 5 3 1

Características de um Grupo

Proposição: O elemento identidade em um grupo G é único, isto é, existe apenas um


elemento e ϵ G tal que eg = ge =g, para todo g e G.

Proposição: Se g é qualquer elemento em um grupo G, então o inverso de g, g-1, é


único.

Proposição: Seja G um grupo. Se a, b ϵ G, então (ab)-1 = a-1b-1.

Proposição: Seja G um grupo. Para qualquer a e G, (a-1)-1 = a.

Proposição: Seja G um grupo e a e b dois elementos de G. Então, as equações ax = b e


xa = b têm soluções únicas em G.

Proposição: Se G é um grupo e a, b, c ϵ G, então ba = ca implica b = c e ab = ac implica b


= c.

Teorema: Num grupo, as leis normais de potências se aplicam: gm.gn = gm+n, (gm)n =
gmn, (gh)n = (h-1.g-1)-n. E, se G for um grupo abeliano: (gh)n = gnhn.

110
Ordem de um Grupo

A ordem de um grupo G, denotada |G|, é a quantidade de elementos no grupo. Se G é


um grupo contendo m elementos, escrevemos |G| = m. Lê-se “a ordem de G vale m”.

Existe apenas um grupo de ordem 1 e é aquele que contém o elemento identidade. Ele
é um dos grupos triviais. Podemos construir a tabela de Cayley dele:

x I
I I

Grupos de Ordem 2

Podemos começar construindo uma tabela de Cayley:

x I a
I I a
a a ?

Como não pode ser a no lugar da ? (não pode haver repetição na linha e nem na
coluna), tem que ser I no lugar da ?, o que implica que a x a = a2 = I.

Só existe um grupo de ordem 2. Por coincidência, ele é o grupo Z (mod 2):

Z 1 2 3 4 5 ...
Z (mod 2) 1 0 1 0 1 ...

E a sua tabela de Cayley é:

x 1 0
1 1 0
0 0 1

Grupos de Ordem 3

Também, só existe um grupo de ordem 3. É o conjunto Z (mod 3). Use a regra da não
repetição e complete a tabela a seguir.

x I a b
I 1 a b
a a ? ?
b b ? ?

111
A tabela com as letras e a tabela com os (mod) são equivalentes (basta mapear), o que
implica isomorfismo.

Grupos de Ordem 4

Conseguiremos gerar quatro tabelas de Cayley, porém, três delas serão iguais, o que
implica que só existem dois grupos de ordem 4.

Grupos Finitos e Infinitos

Um grupo é finito, ou tem ordem finita, se ele contém um número finito de


elementos; de outra maneira, o grupo é infinito ou tem ordem infinita.

Grupos e Subconjuntos

Vamos pegar o conjunto Z e particioná-lo em vários subconjuntos em que cada


subconjunto é determinado pelo resto da divisão de z1 ϵ Z por z2 ϵ Z. Por exemplo,
para z2 = 5 conseguiremos particionar Z em 5 subconjuntos (conjuntos de equivalência
ou conjuntos de congruência) que são:

Veja que a diferença entre um elemento de um conjunto de equivalência e o elemento


de mesma posição em um conjunto adjacente é 1.
Note, também, que isto equivale a um relógio que vai de 0 a 4. Com isso, se você
adicionar qualquer elemento do conjunto de equivalência ri com qualquer elemento
do conjunto rj, obterá um elemento do conjunto ri+j.

112
Por exemplo, se adicionarmos os elementos da classe 0 com os elementos da classe 3,
obteremos a própria classe 3 (r0 + r3 = r0+3 = r3); se adicionarmos os elementos da
classe 3 com os elementos da classe 4, obteremos a classe x: r3 + r4 = r3+4 = r7 = r2, pois,
saindo do 3 e andando 4 passos no “relógio”, chegamos no 2. Em resumo: 0 + 1 = 1, 0 +
2 = 2, 0 + 3 = 3, 0 + 4 = 1, 1 + 1 = 2, 1 + 2 = 3, 1 + 3 = 4, 1 + 4 = 0, 2 + 3 = 0, 2 + 4 = 1, 3 +
4 = 2.

Se tratarmos as identificações dos cinco conjunto acima como se fossem um conjunto


numérico 𝑋 = {0̅, 1̅, 2̅, 3̅, 4̅}, então temos um grupo, chamado de grupo dos inteiros
módulo 5, ou Z mod 5. Mas, vamos ver se X é um grupo mesmo.
Para ser um grupo, X tem que ter o elemento identidade e o elemento inverso, pois, já
constatamos que o conjunto é fechado em relação à soma. Porém, constatamos
também que o 0̅ é o elemento identidade quando fizemos esta conta: r0 + r3 = r0+3 = r3.
Só falta então achar os elementos inversos. Podemos acha-los facilmente calculando
os elementos em que 𝑒̅1 + 𝑒̅2 = 5 = 0̅. Nesse caso, temos: 1̅ + 4̅ e 2̅ + 3̅. Concluímos
que o conjunto X é um grupo. Claramente, você vê que o grupo Z mod 5 cobre todo o
conjunto Z.

113
Grupo de Permutações

Uma permutação é um rearranjo de n objetos. Por exemplo, cada vez que você
embaralha as 26 letras do alfabeto, você tem uma permutação. Com as 26 letras você
consegue 26! permutações diferentes. Desse modo, com n objetos você conseguirá
rearranjá-los de n! maneiras diferentes.
Numerando os objetos de 1 a n, podemos escrever uma permutação da seguinte
maneira:
1 2 3 … 𝑛−1 𝑛
( ) (𝑅1)
5 1 7 … 2 3

Onde na primeira linha estão os objetos ordenados de 1 a n e na segunda linha esses


mesmos objetos em uma das n! maneiras.
Existe uma maneira mais compacta de escrever a representação (R1), que é chamada
de notação cíclica.

A permutação de n objetos pode ser transformada num grupo que chamamos de


grupo permutativo, grupo simétrico ou grupo de ordem n!, denotado por Sn. Em
geral, as permutações em um conjunto X formam um grupo Sx. Se X é um conjunto
finito, podemos assumir X = {1, 2, ..., n}. Nesse caso, escrevemos Sn em vez de Sx. Um
grupo permutativo tem ordem que divide n!

Duas permutações formam um grupo se, e somente se, uma é o elemento identidade
e a outra é uma permutação que é sua própria inversa.

Notação Cíclica

Uma permutação τ ϵ Sx é um ciclo de comprimento k se existem elementos a1, a2, ..., ak


ϵ X, tal que:
τ(a1) = a2
τ(a2) = a3
...
τ(ak) = a1

e τ(x) = x para todos os demais elementos x ϵ X. Escrevemos (a1, a2, ..., ak) para
denotar o ciclo τ.

Sejam as duas permutações a seguir.

1 2 3 4 5) 1 2 3 4 5
( ( )
3 5 4 1 2 3 1 5 2 4

114
A primeira linha de cada (matriz de) permutação mostra as entradas e a segunda linha
mostra as saídas correspondentes.

Se considerarmos uma permutação como uma função (mapeamento), então as


operação que aplicaremos ao grupo é a composição (função composta), que é
efetuada da direita para a esquerda [f(g(x))]:

1 2 3 4 5) 1 2 3 4 5
𝑓=( 𝑔=( )
3 5 4 1 2 3 1 5 2 4

E o resultado da composição começa assim: f(g(1)) = f(3) = 4. Em palavras: g mapeia 1


em 3, que é entregue a f, que mapeia 3 em 4. Isso implica que, na composição (ou
produto) 1 é mapeado em 4. Em seguida: f(g(2)) = f(1) = 3. Então 2 mapeia para 3.
Fazendo isso para o resto da sequência de entrada, obteremos:

1 2 3 4 5
𝑓∘𝑔 =( )
4 3 2 5 1

Veja que este processo é muito demorado. É aqui que a notação cíclica pode ajudar
bastante, pois, conseguiremos escrever a mesma coisa em apenas uma linha e com a
quantidade de objetos (números, no caso) diminuída.

Você notou que a primeira linha é sempre a sequência ordenada do objeto. Então, não
trabalharemos com ela diretamente, mas, apenas com a segunda linha.

Mas, para o nosso controle e clareza da explicação, anotaremos a primeira linha, que
você pode manter apenas na mente, depois. Para cada número que usarmos,
marcaremos ele na sequência anotada para não o reusarmos (esse é o controle). Veja
a sequência de operações para esta permutação:

1 2 3 4 5)
(
3 5 4 1 2

Na parte da figura onde são mostradas a setas, aponte a seta (para o 3, por exemplo)
e, depois, risque-o na sequência ordenada. O ciclo completo deve ficar representado
com parêntesis, como mostrado. O que os parêntesis dizem é que: 1 mapeia para 3,
que mapeia para 4, que mapeia para um. Por isso temos um ciclo.

115
Ainda não acabou, pois sobraram dois valores, 2 e 5. Isso indica que teremos, pelo
menos, mais um ciclo.

Começando com o 2 (risque o 2), ele mapeia no 5 (risque o 5), que mapeia de volta ao
2. Como riscamos todos os valores na sequência ordenada, temos o ciclo final (25), que
ficará justaposto à direita do primeiro ciclo. Isso implica que a permutação
representada pela matriz acima pode ser escrita como (134)(25). Esta expressão é
chamada de decomposição cíclica e diz que a expressão é a multiplicação do ciclo
(134) pelo ciclo (25). Cada valor aparece em, exatamente, um dos ciclos, isto é, os
ciclos formam conjuntos disjuntos. Cada ciclo descreve uma parte da permutação. A
permutação original pode ser escrita assim:

1 2 3 4 5) = (134)(25)
(
3 5 4 1 2

Veja como podemos recuperar, facilmente, o formato matriz através do formato


(134)(25), escrevendo a sequência ordenada antes e preenchendo os valores de
acordo com a composição mostrada por cada ciclo:

Começando com (134) Finalizando com (25)


1 2 3 4 5 1 2 3 4 5
( ) ( )
3 ? 4 1 ? 3 5 4 1 2

Cada ciclo tem um comprimento e esse comprimento é a quantidade de valores que


tem nele. O primeiro ciclo acima tem comprimento 3 (3-cycle) e o segundo ciclo tem
comprimento 2 (2-cycle, também chamado de transposição).

Poderíamos, também, ter trabalhado na matriz, assim:

Veja como cada linha se fecha num ciclo. Note como esse esquema já risca os valores
visitados, equivalendo ao primeiro método que aprendemos.

116
(134)(25) é o modo mais compacto de escrever a função f. Se você gerar a forma
compacta da função g, obterá (13542). Com isso, podemos calcular a função composta
fog na forma compacta:

Mas, vemos que temos uma composição tripla, ou seja, temos uma nova função h e
reescrevemos a composição acima dessa maneira:

Para calcular esse produto triplo, basta usar a fórmula fog = f(g(h(x))).

Veja que alguns valores são mapeados neles mesmos (como se fossem um ciclo de
comprimento 1), conforme mostrado pelas setas vermelhas.

117
Veja o que acontece quando colocamos a sequência 43251 em uma matriz e usamos
aquele esquema de completar os ciclos:

Na produção da forma compacta (134)(25), começamos com o valor 1 da sequência


ordenada, mas, isso não é obrigatório. Vamos ver um exemplo em que não
começamos com o primeiro número da sequência ordenada:

1 2 3 4 5
( )
2 4 3 1 5

Se começarmos pelo valor 2, fazendo todos os passos:

Disso resulta que:


1 2 3 4 5
( ) = (241)(3)(5)
2 4 3 1 5

Porém, como os ciclos de comprimento 1 não fazem nenhuma alteração de valor, eles
podem ser ignorados sem nenhum problema, implicando que

1 2 3 4 5
( ) = (241)
2 4 3 1 5

118
Se começarmos com o valor 4, obteremos:

1 2 3 4 5
( ) = (412)
2 4 3 1 5

Se começarmos com 1 obteremos (124).

Então, variando o valor inicial, variaremos a solução. Porém, na verdade, trata-se da


mesma solução com sua ordem alterada, como você pode notar: os mapeamentos são
sempre os mesmos nas três sequências obtidas acima: 1  2; 2  4; 4  1.

Esta sequência de figuras mostra uma visualização do que ocorre:

O efeito será o mesmo se você girar o círculo no sentido horário. Então, estas três
sequências representam uma única sequência e a regra que se adota é sempre
começar com o menor valor. Então, no caso acima, a sequência única é (124).

119
Ordem da Composição

Em (a)(b)(c), não importa a ordem dos fatores, desde que a, b e c não compartilhem
algum valor. No caso mínimo: a ≠ b ≠ c. Por exemplo, a sequência (136)(25)(4), do
grupo simétrico S6, pode ser escrita em qualquer ordem, ou seja, vale a propriedade
comutativa. Ela sempre vale para ciclos disjuntos.

A sequência (137)(46), do grupo simétrico S7 não mostra o 2 e nem o 5, o que implica


que ambos são ciclos de comprimento 1: (137)(46)(2)(5). Veja o que ocorre quando
plugamos alguns valores na sequência normal e, depois, na mesma sequência com a
ordem dos ciclos invertida:

Veja como 2 mapeia para ele mesmo, criando um ciclo de comprimento 1. O mesmo
ocorrerá com 5. O que sobra é 1 para 3, 3 para 7 e 6 para 4, ou (137)(46).
Se você plugar outros valores (4 e 7), ainda assim obterá o mapeamento mostrado
pela sequência.
Nota-se que, quando ocorre uma alteração no valor de entrada, apenas um dos ciclos
causa a alteração. Quando isso acontece, não importa a ordem em que os ciclos estão
colocados – o resultado será o mesmo. Veja a sequência (132)(13):

120
À esquerda, 3 mapeia para 3, sobrando 1 para 2 e 2 para 1, ou (12); à direita, 1 mapeia
para 1, sobrando 2 para 3 e 3 para 2, ou (23). Como (12) ≠ (23), a comutação falha.

Resumo dos Cálculos na Notação Cíclica

Se te derem uma permutação em forma de matriz, você pode transformá-la em um


ciclo:

Se te derem uma permutação em forma de ciclo (134), você pode transformá-la em


uma matriz (a primeira linha é a sequência ordenada – no caso, 1234) e a segunda
linha são os mapeamentos 1-3-4-1:

1 2 3 4
( )
3 2 4 1

Pelo fato de o 2 não aparecer em (134), ele mapeia para ele mesmo.

Da mesma maneira, se te derem uma composição de ciclos (12)(143), você pode


transformá-la em uma composição de matrizes:

1 2 3 4 1 2 3 4
( )( )
2 1 3 4 4 2 1 3

Para resolver um e outro, você pode usar o método das funções compostas:

1 2 3 4 1 2 3 4
𝑓=( ), 𝑔=( )
2 1 3 4 4 2 1 3

Começando com o menor valor, 1, e alimentando a próxima entrada com a saída


anterior:

𝑓(𝑔(1)) = 𝑓(4) = 4
𝑓(𝑔(4)) = 𝑓(3) = 3
𝑓(𝑔(3)) = 𝑓(1) = 2
𝑓(𝑔(2)) = 𝑓(2) = 1

Daí, 1 mapeia em 4, 4 mapeia em 3, 3 mapeia em 2, 2 mapeia em 1: (1432).

Usando esse método na sequência de ciclos:

121
𝑓(𝑔(1)) = 𝑓(4) = 4, 𝑝𝑜𝑖𝑠, 4 𝑛ã𝑜 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑒𝑚 𝑓
𝑓(𝑔(4)) = 𝑓(3) = 3, 𝑝𝑜𝑖𝑠, 3 𝑛ã𝑜 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑒𝑚 𝑓
𝑓(𝑔(3)) = 𝑓(1) = 2
𝑓(𝑔(2)) = 𝑓(2) = 1

Ou o método de plugar valores, que é semelhante a este acima:

1 entrando pela direita, vira 4, que passa direto para a esquerda: 4.


4 entrando pela direita, vira 3, que passa direto para a esquerda: 3.
3 entrando pela direita, vira 1, que vira 2 pela esquerda: 2.
2 entrando pela direita passa direto, virando 1 na esquerda: 1.
Então: 1-4-3-2-1 = (1432).

Lembre-se de que começar com valores de partida diferentes na sequência ordenada,


gera a mesma saída, mas, com a ordem invertida.

Podemos, também, descrever a composição de funções de um modo bem informal,


assim:
(a)(b) – Aplique b, depois aplique a.

Por exemplo, sendo a = 1352 e b = 256, ou (1352)(256). Temos que a mapeia 1 em 3, 3


em 5, 5 em 2 e 2 em 1. Começamos com 1 em b, onde 1 mapeia para si mesmo.
Vamos, então, para a, onde 1 mapeia para 3. Então, podemos escrever, inicialmente,
ab = 13...
Agora, começamos com 3 em b. Como com o 1, b mantém 3 fixo (como nada há em b,
vamos para a) e a mapeia o 3 em 5, o que implica que ab = 135...
Começando com 5 em b, ele é mapeado em 6; indo para a, 6 é mantido fixo, o que
implica ab = 1356... Agora, 6 em b é mapeado para 2; indo para a, 2 é mapeado para 1,
o que fecha o ciclo: 13561. Como 1 já está no ciclo, o resultado final é (1356).

Para reforçar, usaremos os outros dois métodos:

𝑓(𝑔(1)) = 𝑓(1) = 3
𝑓(𝑔(3)) = 𝑓(3) = 5
𝑓(𝑔(5)) = 𝑓(6) = 6
𝑓(𝑔(6)) = 𝑓(2) = 1

122
Então 1 mapeia para 3, 3 para 5, 5 para 6 e 6 para 1: (1356).

Plugando valores pela direita de (a)(b) = (1352)(256):

(Sempre faça a leitura da direita para a esquerda)

3=a1=b1 (1 em b é mapeado em 1 que, em a, é mapeado em 3: 1 vai para 3).


5=a3=b3 (3 vai para 5).
6=a6=b5 (5 vai para 6).
1=a2=b6 (6 vai para 1).

O que resulta em (1356).

Mais um exemplo: (13245)(31425). Usando o método de plugar valores (começando


com o valor 1), obteremos o seguinte ciclo (estou escrevendo os valores da esquerda
para a direita, mas, estou operando da direita para a esquerda):

1-4-5, 5-3-2, 2-5-1 (fechou) = (152).

Se transformarmos (152) em sua matriz:

1 2 3 4 5
( )
5 1 3 4 2

Temos a prova que 3 e 4 não apareceram porque mapeiam para si mesmos. Se você
usar o método de caminhar na matriz, vai recuperar o ciclo (152).

Outro exemplo: (246)(12)(47).

1-2-4, 4-7-7, 7-4-6, 6-2, 2-1 (fechou) = (14762).

Faltaram o 3 e o 5. 3 sai como (3) e 5 sai como (5) e são ignorados.

Transposições

Uma transposição é um ciclo de comprimento 2, ou seja, para a, b ϵ {1, 2, 3, ..., n}, se a


transposição de a é b e a transposição de b é a, então (ab) = (ba) é uma transposição.
Por exemplo, considere o conjunto {1, 2, 3, 4, 5}. Então, a transposição (12) é dada por:

(12) = (1 2 3 4 5
)
2 1 3 4 5

A transposição (13) é dada por:

123
(13) = (1 2 3 4 5
)
3 2 1 4 5

Proposição: A quantidade de transposições distintas no conjunto finito de n elementos


{1, 2, 3, ..., n} é dada por:
𝑛−1

∑𝑘
𝑘=1

Qualquer ciclo pode ser decomposto em composições de dois ciclos. A quantidade de


transposições em uma permutação é importante porque ela dá o número mínimo de
permutações de dois elementos para se obter este tipo particular de arranjo via o
arranjo identidade 1, 2, 3, ..., n.
O pareamento da quantidade de ciclos de comprimento 2 diz se a permutação é par ou
ímpar.
Por exemplo, o ciclo (5 1 2 4 3) pode ser escrito como (5 3)(5 4)(5 2)(5 1). Aqui temos 4
transposições, o que implica uma permutação par. Similarmente, (5 1 2) pode ser
escrito como (5 2)(5 1), dando duas transposições, sendo a permutação uma
permutação par. Já (5 1 2)(4 3) é escrito (5 2)(5 1)(4 3), que são três transposições, o
que implica que a permutação é ímpar. Veja que a quantidade de transposições é
sempre igual ao comprimento do ciclo – 1, conforme a proposição acima.

Existem muitas maneiras de se gerar transposições de um ciclo. Por exemplo:

Seja T = (1 3 4 6 7 9) ϵ S9.

Método 1: T = (1 3 4 6 7 9) = (1 9)(1 7)(1 6)(1 4)(1 3).


Método 2: T = (1 3 4 6 7 9) = (1 3)(3 4)(4 6)(6 7)(7 9).

Ambos os produtos (método 1 e método 2) representam a mesma permutação T. Note


que a ordem do ciclo disjunto T é 6, mas, em ambas expressões de T como o produto
de transposições, T tem um número ímpar de transposições. Daí, T é uma permutação
ímpar.

Se fizermos executarmos a composição (1 9)(1 7)(1 6)(1 4)(1 3) ou a composição (1 3)(3


4)(4 6)(6 7)(7 9), obteremos o ciclo (1 3 4 6 7 9).

Se recuperarmos a matriz que gerou o ciclo (1 3 4 6 7 9):

1 2 3 4 5 6 7 8 9
( )
3 2 4 6 5 7 9 8 1

Se começarmos no 1 inferior direito e seguirmos a sequência pela qual esse um pode


passar, obteremos (1 9)(1 7)(1 6)(1 4)(1 3)(1 1). Se começarmos com o 1 superior
esquerdo e caminharmos na matriz, obteremos (1 3)(3 4)(4 6)(6 7)(7 9)(9 1).

124
Veja que a sequência de transposições para antes do ciclo ser fechado, o que ocorre
com a “transposição” em vermelho.
Assim, temos uma maneira de gerar as transposições usando o método da matriz de
permutações. Como uma transposição é um ciclo de dois elementos (ou um ciclo de
comprimento 2) e a matriz tem, sempre, 2 linhas, a transposição é, certamente,
consequência da matriz.

Formalmente, dada um ciclo (a1, a2, ..., an), ele pode ser decomposto de duas maneiras
principais:
(𝑎1 𝑎2 … 𝑎𝑛 ) = (𝑎1 𝑎𝑛 )(𝑎1 𝑎𝑛−1 ) … (𝑎1 𝑎2 )

(𝑎1 𝑎2 … 𝑎𝑛 ) = (𝑎1 𝑎2 )(𝑎2 𝑎3 ) … (𝑎𝑛−1 𝑎𝑛 )

O programa (em Python 3) a seguir aceita uma permutação, gera os ciclos


correspondentes a ela e a decompõe em suas transposições, além de mostrar outras
características da permutação.

import numpy as np
from sympy.combinatorics import Permutation
from sympy.combinatorics.permutations import Perm, Cycle
from sympy.interactive import init_printing

# Lê a linha 2 da matriz:
# 1 2 3 4 ... N
# a b c d ... n <-- linha 2
matrizl2 = []
print("Entre com a segunda linha da matriz de permutacao")
print("(separe os elementos com brancos)")

while not matrizl2 or len(matrizl2) < 1:


matrizl2.append(list(map(int, input().split())))

linha2 = matrizl2[0] # segunda linha da matriz de permutação


#print(linha2) # linha2 é uma lista
#---linha2 tem que ter tantos valores quanto for o maior valor da
# sequência e aqueles valores não podem se repetir.

#---Garanta que linha2 não tenha elementos repetidos:


#linha2 =list(set(linha2))
linha2=list(dict.fromkeys(linha2))

#---Garanta que linha2 tenha N elementos, onde N é o


# maior valor em linha2

# Pegue o len(linha2):
len_l2 = len(linha2)

125
#---Pegue o maior valor em linha2:
maior_l2 = 0
for valor in linha2:
if valor > maior_l2:
maior_l2 = valor
##print("len linha2 =",len_l2)
##print("maior valor =",maior_l2)
#-------------------------------------------------
#--- Gere a linha 1 da matriz de permutação
linha1 = [i for i in range(1,maior_l2+1)]

# Se len(linha2) < maior valor em linha2, complete linha2 com os


# valores presentes apenas em linha1:
if len_l2 < maior_l2:
supl = list(set(linha1) - set(linha2))
linha2.extend(supl)

matriz = np.array([linha1,linha2])
##print(matriz)

q = linha2
if 0 not in q:
q.insert(0,0) # a função Permutation do sympy exige 0 na primeira posição
p = Permutation(q)

print("Forma Vetorial:",p.array_form) # a segunda linha da matriz


print("Mostrando a Bijetividade:")
print({i: p(i) for i in range(p.size)})

print("Forma Ciclica:",p.cyclic_form)
print("Ciclo Inverso:",p.__invert__())
print("Forma Ciclica Completa:",p.full_cyclic_form)

print("Comprimento:",p.size)
print("Cardinalidade:",p.cardinality) # Número de permutações possiveis
print("Ordem:",p.order())

print("Transposicoes:",p.transpositions())
print("Paridade:",p.parity())
print("Par?",p.is_even)
print("Impar?:",p.is_odd)

126
Simetrias

Uma isometria, ou movimento rígido, em Rn é uma função de preservação de distância


f de Rn em Rn. Isto significa que f deve satisfazer ||f(x) – f(y)|| = ||x – y||, para todo
x, y ϵ Rn.

As únicas isometrias em R2 são as rotações e reflexões em torno da origem, e


translações e combinações destas duas. Por exemplo, uma reflexão de deslizamento
(glide reflection) é uma reflexão seguida de uma translação, como ilustra a figura:

A célula de unidade (unit cell) é representada pelo retângulo. De uma unit cell para
outra o objeto se move. A translação, usualmente, ocorre em passos de meia unit cell
ou de um quarto.

127
Definições

Permutação Identidade

A permutação identidade de um conjunto é a permutação que deixa o conjunto


inalterado, ou a função que mapeia cada elemento a ele mesmo:

1234 … 𝑛
( )
1234 … 𝑛

A permutação identidade é sempre par. Ela é representada pelo valor 1.

Permutação Inversa

Para encontrar o inverso de um ciclo, basta escrever o ciclo de trás para diante:

(4 6 2 7 3)–1 = (3 7 2 6 4)

(1243)(67)–1 = (76)(3421)

Este último resultado pode ser escrito assim também: (1342)(67).

Como permutações formam um grupo, então um elemento operado com o seu inverso
tem que gerar a identidade. Você pode verificar que (12)(21) = (1).

Vamos escrever o ciclo (46273) na forma matricial:

1 2 3 4 5 6 7
( )
1 7 4 6 5 2 3

Note que a forma cíclica se torna, nesse caso, (27346), que é equivalente a (46273).
Para escrevermos a matriz do ciclo inverso, basta olharmos para a primeira linha da
matriz em relação à segunda linha da mesma matriz e lermos assim: o 1 vai para a
posição 1 da nova matriz; o 2 vai para a posição 7; o 3 vai para a posição 4, e assim
por diante. Note que “posição” é sempre dada pela primeira linha da matriz. Desse
modo, a matriz do ciclo inverso é:

1 2 3 4 5 6 7
( )
1 6 7 3 5 4 2

O ciclo correspondente é (26437), que é equivalente a (37264).


Então, podemos concluir que a permutação inversa de 1746523 é 1673542 e o ciclo
inverso de (27346) é (26437).

128
O processo grifado com verde, acima, é o processo que deve ser usado para se
encontrar a inversa de uma permutação.

Mais um exemplo: A permutação 3, 8, 5, 10, 9, 4, 6, 1, 7, 2 em como inversa a


permutação 8, 10, 1, 6, 3, 7, 9, 2, 5, 4. Você pode verificar isso usando o processo lá de
cima.

Como exemplo, seguem composições com a permutação identidade e permutações


inversas. Você pode verificar os resultados usando o esquema de funções compostas,
por exemplo.

1 2 3 1 2 3 1 2 3
( )( )=( )≡𝑎×1=𝑎
2 3 1 1 2 3 2 3 1

1 2 3 1 2 3 1 2 3
( )( )=( )≡ 1×𝑎 =𝑎
1 2 3 2 3 1 2 3 1

1 2 3 1 2 3 1 2 3
( )( )=( ) ≡ 𝑎 × 𝑎−1 = 1
2 3 1 3 1 2 1 2 3

Podemos, também, usar transposições para achar a inversa. Por exemplo, a inversa de
(231) é a inversa de (1 2)(2 3)(3 1), que é (2 1)(3 2)(1 3) ou (1 3)(2 1)(3 2), ou (312).

O programa a seguir calcula a inversa de uma permutação.

# Naive Python3 Program to find inverse permutation.


def inversePermutation(arr, size):

# Loop to select Elements one by one


for i in range(0, size):
# Loop to print position of element where we find an element
for j in range(0, size):

# checking the element in increasing order


if (arr[j] == i + 1):
# print position of element where
# element is in inverse permutation
print(j + 1, end = " ")
break

# Driver Code
arr = [3,2,4,1]
size = len(arr)
inversePermutation(arr, size)

#This code is cotributed by Smitha Dinesh Semwal

129
Órbita de um Ciclo

No conjunto S7, a permutação T = (13)(265) tem uma órbita de comprimento 2, que é o


(13), uma órbita de comprimento 3, que é o (265) e duas órbitas de comprimento 1, o
(4) e o (7). Para melhor visualização, veja a matriz correspondente:

1234567
( )
3614257

Comprimento de um Ciclo

O comprimento (length) de um ciclo é igual à quantidade de elementos em sua maior


órbita. Um ciclo de comprimento k é chamado de k-ciclo.
A órbita de um ciclo de comprimento 1 (1-ciclo) é chamada de ponto fixo da
permutação, mas, como uma permutação, todo 1-ciclo é a permutação identidade.

Ordem de uma Permutação

A ordem de uma permutação de um conjunto finito na forma de ciclos disjuntos é o


mínimo múltiplo comum entre os comprimentos de cada um dos ciclos. A ordem de
um grupo (de qualquer tipo) é a quantidade de elementos (cardinalidade) no grupo.

Grau de uma Permutação

O grau de um grupo de permutações de um conjunto finito é igual à quantidade de


elementos no conjunto.

130
Subgrupos

Um subgrupo H de um grupo G é um subconjunto H de G tal que quando um grupo de


operações em G é restrito a H, H é um grupo também. No exemplo anterior o conjunto
Z é o G aqui e o subconjunto H aqui é, por exemplo, o conjunto 0̅ , que, então, é um
subconjunto de G e é um grupo (é fechado, tem a unidade e tem inversos) e, por ser
um subconjunto-grupo, é um subgrupo. O conjunto dos números pares forma um
subgrupo do grupo dos inteiros sob a operação de adição

Observe que todo grupo G com, pelo menos, dois elementos, sempre conterá dois
subgrupos: o grupo contendo o elemento identidade e todo o grupo G.

Seja e o elemento identidade de um grupo. O subgrupo H = {e} de um grupo G é


chamado de subgrupo trivial.

Proposição: Um subconjunto H de G é um subgrupo se, e somente se, ele satisfaz as


seguintes condições:
1. A identidade e, de G, está em H.
2. Se h1, h2 ϵ H, então h1 op h2 ϵ H.
3. Se h ϵ H, então h-1 ϵ H.

Notação:
H ≤ G implica que G é subgrupo de G.
H < G implica que H é subgrupo de G e é um subgrupo próprio de G.

O grupo Z sob adição tem um número infinito de subgrupos: Z, 2Z, 3Z, 4Z, 5Z, 6Z, ...
São os múltiplos de 1, 2, 3, 4, 5, 6, etc. Você vai entender logo porque os múltiplos são
subgrupos. Vamos dar uma olhada em 5Z, do grupo Z mod 5. Na classe 0 temos os
múltiplos de 5, ou 5Z. A figura a seguir mostra isso e as outras 4 classes (lembra
quando eu disse que a diferença entre os conjuntos adjacentes é 1? Pois é, isso está
mostrado na figura).

131
Com uma inspeção visual e alguns cálculos simples, você constata que 5Z é um grupo,
mas que 1 + 5Z, por exemplo, não é um grupo, pois, ele não é fechado sob adição. Se
você somar –9 com –4, obterá –13, que não pertence ao conjunto 1 + 5Z.

Com a ajuda do seguinte mnemônico, obtido através do cálculo modular (por exemplo,
4 + 4 = 8 – 5 = 3 – ou utilize o dispositivo relógio que usamos anteriormente), você
pode descobrir em qual conjunto o resultado vai cair:

{ri} 0 1 2 3 4
{ri} + {ri} 0 2 4 1 3

Também, 1 + 5Z não tem o elemento identidade e nem elementos inversos. Na


verdade, você constata que nenhum dos n + 5Z, com n > 0, é um subgrupo. Porém,
estes conjuntos (n + 5Z, com n > 0) tem um nome: co-conjuntos, ou cosets (em inglês),
que é o nome que usarei daqui pra frente.

Dessa maneira, o grupo original Z fica completamente coberto pelo subgrupo 5Z e os


quatro cosets. Note que 0 + 5Z pode ser considerado um coset também. Na verdade,
todo subgrupo é um coset. Apesar dos cosets de 1 a 4 não serem grupos, juntos com o
subgrupo 0 eles formam um grupo (o grupo original Z).

Devido a isso, o subgrupo 5Z é chamado de subgrupo normal e o grupo dos cinco


cosets é chamado de grupo quociente, denotado por Z/5Z. O significado desta
denotação é: O conjunto Z é distribuído (dividido) em cinco cosets.
Nem sempre os cosets formam um grupo.

O grupo quociente Z/5Z não é um subgrupo de Z, denotado assim: Z/5Z ≰ Z. Na


verdade, ele é um grupo totalmente diferente de Z.

Generalizando:
Grupo: (G, op)
Subgrupo: N
Cosets: N, g1 op N, g2 op N, g3 op N, ...

Os valores gi são os restos da divisão. No caso de N = 5Z, eles são 1, 2, 3, 4. Por


exemplo, para g = 3:

3 + {... –25, –20, –15, –10, –5, 0, 5, 10, 15, 20, 25 ...} = {... –22, –17, –12, –7, –2, 3, 8, 13, 18, 23, 28 ...}

Se os cosets não formarem um grupo, N não será um subgrupo normal e não


poderemos obter um grupo quociente.

O conjunto {0, 1, 2, 3, 4} contém os 5 subconjuntos r + 5Z e cada um desses


subconjuntos é um coset.

132
Cosets

Para melhor compreender um grupo, deve-se encontrar os subconjuntos que o


compõem (chamados de subgrupos). Isso pode ser feito com a ajuda de objetos
chamados cosets. Um coset é uma translação de um subgrupo feita por um elemento
do grupo: 1 + 5Z é uma translação (esquerda) de 5Z feita por 1 ϵ Z.

Seja G um grupo e H um subgrupo de G. Define-se um coset esquerdo de H, com o


elemento representativo g ϵ G, como o conjunto gH = {gh, com h ϵ H}.
Um coset direito é definido de maneira similar: Hg = {hg, com h ϵ H}.

gH e gh são formas abreviadas de g op H e g op H, assim como Hg e hg.

Exemplo 1: Considere o conjunto dos múltiplos de 3 (3Z). Ele é um subgrupo do grupo


(Z, +):

3Z = {..., –9, –6, –3, 0, 3, 6, 9, ...}

Adicionando 1 aos elementos de 3Z, obtemos um novo subgrupo de Z:

{...,–8, –5, –2, 1, 4, 7, 10, ...}

Adicionando 2 aos elementos de 3Z, obtemos outro subgrupo de Z:

{...,–7, –4, –1, 2, 5, 8, 11, ...}

Estes três subconjuntos cobrem todo o conjunto Z, ou seja, formam três partições
dele. Os cosets de um grupo são partições desse grupo.
Um ponto interessante nestes três conjuntos é que a diferença entre dois elementos
de um deles será um múltiplo de 3, ou seja, a diferença pertence ao subgrupo que
gerou estes subgrupos.

Tanto 1 quanto 2 são os (únicos) elementos, g, representativos de Z (que chamamos


de G) que são operados em 3Z (que chamamos de H na definição inicial de cosets).

Dessa maneira, podemos escrever os dois últimos subgrupos assim:

1 + 3Z = {...,–8, –5, –2, 1, 4, 7, 10, ...}, também representado: 1 + 3Z = {1 + h, h ϵ 3Z} e


2 + 3Z = {...,–7, –4, –1, 2, 5, 8, 11, ...} ou 2 + 3Z = {2 + h, h ϵ 3Z}.

Estes dois conjuntos são exemplos de coset esquerdos (g + 3z). E quais seriam os
cosets direitos? Simplesmente, isto: 3Z + 1 e 3Z + 2.

133
Nesse caso, os cosets são iguais. O que você conclui disso? Você conclui que o grupo G
é comutativo sob aquela operação. Um G assim é chamado de grupo normal.

Em um grupo comutativo (grupo abeliano), os cosets direito e esquerdo são idênticos


(gH = Hg).

Como já vimos, no exemplo para 5Z, juntamente com o coset 0 + 3Z = 3Z + 0 = 3Z, que
é o único subgrupo desse conjunto Z (mod 3), cobrem todo o conjunto Z.

Grupo de matrizes sob a operação de multiplicação nem sempre são comutativos,


logo, os cosets, direito e esquerdo, serão diferentes.

Exemplo 2: Seja H um subgrupo de Z6 consistindo dos elementos 0 e 3: {0, 3}.

[ 0 ]: {..., –30, –24, –18, –12, –6, 0, 6, 12, 18, 24, 30, ...}
[ 1 ]: {..., –29, –23, –17, –11, –5, 1, 7, 13, 19, 25, 31, ...}
[ 2 ]: {..., –28, –22, –16, –10, –4, 2, 8, 14, 20, 26, 32, ...}
[ 3 ]: {..., –27, –21, –15, –9, –3, 3, 9, 15, 21, 27, 33, ...}
[ 4 ]: {..., –26, –20, –14, –8, –2, 4, 10, 16, 22, 28, 34, ...}
[ 5 ]: {..., –25, –19, –13,–7, –1, 5, 11, 17, 23, 29, 35, ...}

Por que H = {0, 3} é um subgrupo de Z6? Porque o conjunto é fechado na adição (–12 +
–3 = –15, que está em [3]); tem o elemento identidade 0; tem os inversos.

Os cosets são:

0 + H = 3 + H = {0, 3} – Adicionando 0 a [0] fica o [0]; 3 a [0] = [3]; 0 a [3] = [3]; 3 a [3] = [0]
1 + H = 4 + H = {1, 4} – Adicionando 1 a [0] fica o [1]; 4 a [0] = [4]; 1 a [3] = [4]; 4 a [3] = [1]
2 + H = 5 + H = {2, 5}

Este é o conjunto H:
H = {..., -30, -27, -24, -21, -18, -15, -12, -9, -6, -3, 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, ...}

Vamos verificar 3 + H:
{..., -27, -24, -21, -18, -15, -12, -9, -6, -3, 0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36 ...} = H = 0 + H

4 + H: {..., -26, -23, -20, -17, -14, -11, ...} = 1 + H (confira)


5 + H: {..., -25, -22, -19, -16, -13, ...} = 2 + H (confira)

Exemplo 3: Seja H um subgrupo de S3, (veja que S3 tem seis permutações: 123, 132,
213, 231, 312, 321) definido pelas permutações {(1), (123), (132)}.

Os cosets esquerdos são:


(1)H = (123)H = (132)H = {(1), (123), (132)}
(12)H = (13)H = (23)H = {(12), (13), (23)}

134
Os cosets direitos são exatamente iguais aos esquerdos.

Vamos executar as operações para confirmarmos os dois cosets esquerdos e os dois


cosets direitos. Sendo H = {(1), (123), (132)}, temos que:

Coset esquerdo 1:
(1)H = {(1)(1), (1)(123), (1)(132)} = (1), (123), (132)
(123)H = {(123)(1), (123)(123), (123)(132)} = (123), (132), (1)(3)(2)
(132)H = {(132)(1), (132)(123), (132)(132)} = (132), (1)(3)(2), (123)

Coset direito 1:
H(1) = {(1)(1), (123)(1), (132)(1)} = (1), (123), (132)
H(123) = {(1)(123), (123)(123), (132)(123)} = (123), (132), (1)(3)(2)
H(132) = {(1)(132), (123)(132), (132)(132)} = (132), (1)(3)(2), (123)

Coset esquerdo 2:
(12)H = {(12)(1), (12)(123), (12)(132)} = (12), (1)(23), (13)(2)
(13)H = {(13)(1), (13)(123), (13)(132)} = (13), (12)(3), (1)(23)
(23)H = {(23)(1), (23)(123), (23)(132)} = (23), (13)(2), (12)(3)

Coset direito 2:
H(12) = {(1)(12), (123)(12), (132)(12)} = (12), (13)(2), (1)(23)
H(13) = {(1)(13), (123)(13), (132)(13)} = (13), (1)(23), (12)(3)
H(23) = {(1)(23), (123)(23), (132)(23)} = (23), (12)(3), (13)(2)

Claramente, os cosets esquerdo 1 e direito 1 são iguais. Mas, os cosets esquerdo 2 e


direito 2 são iguais também, apesar da ordem dos elementos. Basta rearranjar a
ordem. Assim, temos que:

(1)H = (123)H = (132)H = H(1) = H(123) = H(132)


(12)H = (13)H = (23)H = H(12) = H(13) = H(23)

Se tivéssemos H = {(1), (12)} de um conjunto S2, com g1 = (23):

(23)(1) = (23) (1)(23) = (23)


(23)(12) = 132 (12)(23) = 123

Coset esquerdo = {(23), (132}. Coset direito = {(23), (123). Daí, g1H ≠ Hg1.

135
Lema: Seja H um subgrupo de G e suponha g1, g2 ϵ G. As seguintes condições são
equivalentes:
1) 𝑔1 𝐻 = 𝑔2 𝐻
2) 𝐻 −1 𝑔1 = 𝐻𝑔2−1
3) 𝑔1 𝐻 ⊆ 𝑔2 𝐻
4) 𝑔2 ∈ 𝑔1 𝐻
5) 𝑔1−1 𝑔2 ∈ 𝐻

Teorema: Seja H um subgrupo de um grupo G. Então os cosets esquerdos de H em G


particionam G. Isto é, o grupo G é a união disjuntiva dos cosets esquerdos de H em G.

Cosets direitos particionam G da mesma maneira.

Proposição: Seja G um grupo e H um subgrupo de G. Defina o índice k de H em G como


a quantidade de cosets esquerdos de H em G, denotada por [G:H] = k.

Exemplo: Seja o conjunto S4 e o conjunto H = {e, (143), (134), (13), (14), (34)}. S4 tem
24 elementos (= 4!); H tem 6 elementos. Então, o índice de H em G é dado por:

|𝐺| 24
= =4
|𝐻| 6

Esta é a quantidade de cosets esquerdos de H em G. Sabemos que H é um coset que é


subgrupo de G. Precisamos, então, encontrar os outros três cosets que não são
subgrupos. Vamos tentar com (12), que é um elemento de G (S4, no caso):

(12)H = {(12)e, (12)(143), (12)(134), (12)(13), (12)(14), (12)(34)}

Já sabemos como operar com composições. Obviamente, (12)e = (12). Para os demais,
temos que:
 (12)(143) = (1432) [começando com o 1, sai 4, que passa direto pelo (12): 14.
Entrando o 4, sai 3, que passa direto pelo (12): 143. Entrando o 3, sai 1, que
mapeia para 2 em (12) = 1432].
 (12)(134) = (1342) [basta usar o mesmo processo de entrar pela direita]
 (12)(13) = (132)
 (12)(14) = (142)
 (12)(34) = (12)(34)

Para a última operação, use a composição de funções, pois, fica mais fácil entender o
efeito: f(g(1)) = f(1) = 2 [1 mapeia para 2]; f(g(2)) = f(2) = 2 [2 mapeia para 2, o que
fecha o ciclo = (12)]; f(g(3)) = f(4) = 4 [3 mapeia para 4]; f(g(4)) = f(3) = 3 [4 mapeia para
3, o que fecha o ciclo = (34)].

136
Então (12)H = {(12), (1432), (1342), (132), (142), (12)(34)}. Achamos o segundo coset.

Para o terceiro coset, vamos tentar (23)H:


 (23)e = (23)
 (23)(143) = (1423)
 (23)(134) = (1234)
 (23)(13) = (123)
 (23)(14) = (14)(23)
 (23)(34) = (234) – Comece sempre com o menor valor entre todos os ciclos.
Aqui, esse valor é o 2: 2. Entrando pela direita, ele passa pelo (34) e mapeia o 3
em (23). Entrando o 3, ele mapeia para o 4 em (34), que passa direto pelo (23).

(23)H = {(23), (1423), (1234), (123), (14)(23), (342)}

Para o último coset, vamos tentar com (24)H:


 (24)e = (24)
 (24)(143) = (1243)
 (24)(134) = (1324)
 (24)(13) = (13)(24)
 (24)(14) = (124)
 (24)(34) = (243)

(24)H = {(24), (1243), (1324), (13)(24), (124)), (243)}

Encontramos todos os três cosets esquerdos. Falta encontrarmos os três cosets


direitos:
 e(12) = (12)
 (143)(12) = (1243)
 (134)(12) = (1234)
 (13)(12) = (123)
 (14)(12) = (124)
 (34)(12) = (12)(34)

 e(23) = (23)
 (143)(23) = (1432)
 (134)(23) = (1324)
 (13)(23) = (132)
 (14)(23) = (14)(23) – Comece os ciclos adicionais sempre com o menor valor.
 (34)(23) = (243)
 e(24) = (24)
 (143)(24) = (1423)
 (134)(24) = (1342)
 (13)(24) = (13)(24)

137
 (14)(24) = (142)
 (34)(24) = (234)

Vamos colocar os seis cosets juntos:

(12)H = {(12), (1432), (1342), (132), (142), (12)(34)}


H(12) = {(12), (1243), (1234), (123), (124), (12)(34)}

(23)H = {(23), (1423), (1234), (123), (14)(23), (342)}


H(23) = {(23), (1432), (1324), (132), (14)(23), (243)}

(24)H = {(24), (1243), (1324), (13)(24), (124)), (243)}


H(24) ={(24), (1423), (1342), (13)(24), (142), (234)}

Teorema: Seja H um subgrupo de um grupo G. A quantidade de cosets esquerdos de H


em G é igual à quantidade de cosets direitos de H em G.

Proposição: Seja H um subgrupo de G, com g ϵ G, e defina a função φ : H → gH através


do mapeamento φ(h) = gh. A função φ é bijetiva. Daí, o número de elementos em H é
igual ao número de elementos em gH.

Cosets são uma consequência do teorema de Lagrange.

Teorema de Lagrange

Seja G um grupo finito e H um subgrupo de G. Então |G| ÷ |H| = [G:H] = k é a


quantidade de cosets esquerdos distintos de H em G. Em particular, a quantidade de
elementos em H deve dividir a quantidade de elementos em G. A inversa é falsa.

De uma maneira mais sucinta: Se H ≤ G, então a ordem de H é um divisor da ordem de


G:
𝐻 ≤ 𝐺 ⟹ |𝐻| 𝑑𝑖𝑣𝑖𝑑𝑒 |𝐺|

O que o teorema diz é: a ordem de G dividida pela ordem de H é igual ao índice de H


em G (ou número de cosets [d cosets], ou seja, 1 subgrupo + [d – 1] cosets que não são
subgrupos). Todos os cosets (esquerdos, por exemplo) são do mesmo tamanho e esse
tamanho é o tamanho do subgrupo H. Se |H| = d, cada coset tem d elementos.
Também, d x k = n, onde n é a ordem (tamanho) de G. Como d divide n, a ordem de H
divide a ordem de G, conforme o teorema diz.

138
Corolário 1: Suponha G um grupo finito e g ϵ G. Então, a ordem de g deve dividir a
quantidade de elementos de G.

Corolário 2: Seja |G| = p, sendo p primo. Então G é cíclico e qualquer g ϵ G, tal que g
não é a identidade é um gerador.

Corolário 3: Seja H e K subgrupos de um grupo finito G tal que G ⊃ H ⊃ K.


Então: [G:K] = [G:H][H:K].

Exemplo: Seja G um grupo em que |G| = 323. Os fatores de 323 são 17 e 19, ou seja,
17 x 19 = 323. Assim, os divisores de 323 são 1, 17, 19, 323. Daí, qualquer subgrupo de
G deve ter ordem 1, 17, 19 ou 323, onde, obviamente, os de ordem 1 e 323 são os
subgrupos triviais (isso implica que se G tiver outros subgrupos, eles só podem ser de
ordem 17 ou 19).

Lagrange não afirma que os subgrupos existem. Afirma que, se existirem, os tamanhos
só podem ser 17 ou 19. No entanto, existem grupos em que podemos gerar a lista de
divisores de suas ordens, mas, um ou mais dos tamanhos (divisores) não possuem um
subgrupo naquele grupo cujo tamanho total foi fatorado. A única certeza que se tem é
a dos subgrupos triviais.

A lista de divisores mostra os possíveis tamanhos (ordem) dos subgrupos, não


implicando que existe pelo menos um subgrupo para cada um dos divisores.

139
Grupos Normais

Um grupo N ≤ G é normal se para todo g ϵ G, temos que g op N op g-1 = N. Se g não


pertence a N e N < G, N é um subgrupo normal.

Grupos Triviais

Todo grupo normal G tem, pelo menos, dois subgrupos normais:


1) O grupo trivial {1}.
2) O próprio grupo G.

Isso é similar ao fato de um número inteiro ter, pelo menos, dois divisores: a unidade e
ele mesmo.

Grupos Simples

Um grupo G é simples se ele contém apenas os dois subgrupos triviais (a unidade e ele
próprio). Um grupo simples é um grupo normal (ele não contém outros grupos
normais). Equivalentemente, um grupo simples é um grupo que possui exatamente
dois subgrupos normais: o subgrupo trivial {1} e o próprio grupo G. Pode-se também
dizer que um subgrupo normal é trivial se, e somente se, ele não for G, ou é trivial se
for um subconjunto próprio de G. Observe que o próprio grupo trivial não é
considerado simples, pois possui apenas um subgrupo normal.

Os grupos simples estão para os grupos assim como os números primos estão para os
inteiros, ou seja, os grupos simples são os formadores primordiais dos grupos. Um
grupo simples não pode ser construído a partir de grupos menores. Os grupos simples
são os blocos constituintes dos grupos finitos.

Subgrupos Normais

Um subgrupo normal é um subgrupo que não varia sob a conjugação por um elemento
do grupo original. O subgrupo H é normal se, e somente se, g op H op g–1 = H (isto é
uma conjugação por g) para qualquer g ∈ G. Equivalentemente, um subgrupo H de G é
normal se, e somente se, gH = Hg para qualquer g ∈ G.

Definição: Um subgrupo H de um grupo G é normal em G se g op H = H op g para todo


g ϵ G. Ou seja, um subgrupo normal de um grupo G é um grupo em que os cosets
esquerdos e direitos são iguais.

140
Teorema: Seja G um grupo e N um subgrupo de G. Então, as seguintes afirmações são
equivalentes:
1) O subgrupo N é normal em G.
2) Para todo g ϵ G, g op N op g-1 ⊂ N.
3) Para todo g ϵ G, g op N op g-1 = N.

Em um subgrupo normal, as transformações permanecem dentro do subgrupo.

Um subgrupo N ⊂ G é normal em G se, e somente se, g op n op g–1 ϵ N para todo g ϵ


G e n E N.

Subgrupos normais são importantes porque só eles podem ser usados para a
construção de grupos quocientes.
{e} ϵ G e o próprio G são sempre subgrupos normais. Se eles forem os únicos
subgrupos normais em G, então G é um grupo simples.

Se N é um subgrupo normal de um grupo G, então os cosets de N em G formam um


grupo G/N sob a operação (a op N)(b op N) = a op b op N. O grupo G/N é, então,
chamado de grupo fator, ou grupo quociente, de G e N.

Grupo Quociente ou Grupo Fator

Teorema: Seja H um subgrupo normal de um grupo G. Os cosets de H em G formam o


grupo G/H de ordem [G:H]. Com H ≤ G, G/H é lido “G módulo H”.

Os elementos em um grupo fator são conjuntos de elementos do grupo original. O


grupo fator é um subconjunto de G que cria um isomorfismo para um subconjunto
H.

Exemplo: Considere o subgrupo normal 3Z de Z. Os cosets de 3Z em Z são:


0 + 3Z = {...,-3, 0, 3, 6, ...}
1 + 3Z = {...,-2, 1, 4, 7, ...}
2 + 3Z = {...,-1, 2, 5, 8, ...}

O grupo Z / 3Z é dado pela tabela aditiva abaixo:

+ 0 + 3Z 1 + 3Z 2 + 3Z
0 + 3Z 0 + 3Z 1 + 3Z 2 + 3Z
1 + 3Z 1 + 3Z 2 + 3Z 0 + 3Z
2 + 3Z 2 + 3Z 0 + 3Z 1 + 3Z

141
Os cosets de Z / nZ são:
nZ
1 + nZ
2 + nZ
...
(n – 1) + nZ

Considere G = {0, 1, 2, 3} o conjunto dos inteiros módulo 4 (Z4) e tome o subgrupo H =


{0, 2}. Temos dois cosets: H e 1+H, ou {0, 2} e {1+0, 1+2} = {1, 3}.

Para obtermos uma estrutura de grupo, precisamos escolher uma operação binária.
Digamos que escolhemos a adição, ou seja, adição módulo 4. Como adicionamos dois
cosets? Tentemos elemento a elemento:

{0, 2} + {1, 3} = {0+1, 0+3, 2+1, 2+3} = {1, 3, 3, 5}. Devemos eliminar valores repetidos e
como no módulo 4 o 4 é 0 e o 5 é 1, eliminamos o 1 também, resultando {1, 3}. Então,
a soma de dois cosets resultou em outro coset de H, o que implica que temos um
fechamento sob a operação binária escolhida.

Receita para o Grupo Quociente:


 Um grupo G, um subgrupo H e cosets gH:
O conjunto gH = {gh, h ϵ H} é o coset esquerdo de H.
O conjunto Hg = {hg, h ϵ H} é o coset direito de H.
 Ter uma estrutura de grupo.

A ordem de G é 4; a ordem de H é 2. Então H tem dois cosets. Porém, aprendemos a


calcular os cosets de um conjunto Zn assim: r + H, onde r vai de 0 a n – 1. Então todos
os cosets de Z4 são: 0 + H = {0, 2}, 1 + H = {1, 3}, 2 + H = {2, 4} = {2, 0} = {0, 2}, 3 + H = {3,
5} = {3, 1} = {1, 3}. O que implica que só temos dois cosets mesmo: {{0, 2}, {1, 3}}. Esse
conjunto forma um grupo? Falta uma operação binária. Vamos continuar com a
adição:
{0, 2} + {0, 2} = {0+0, 0+2, 2+0, 2+2} = {0, 2, 2, 4} = {0, 2}
{0, 2} + {1, 3} = {0+1, 0+3, 2+1, 2+3} = {1, 3, 3, 5} = {1, 3}
{1, 3} + {1, 3] = {1+1, 1+3, 3+1, 3+3} = {2, 4, 4, 6} = {2, 0, 0, 2} = {0, 2}

Basta a operação ser fechada no conjunto.

G/H tem o elemento identidade H e o elemento inverso aH, que pode ser escrito como
a–1H. Por isso, o conjunto G/H, junto com a operação definida por (aH)(bH) = (ab)H,
forma um grupo – o grupo quociente de G por H.

142
Propriedades:

G / {1} aproximadamente igual G


G / G aproximadamente igual {1}

Redefinindo Grupo Simples

Um grupo simples é um grupo G que contém, exatamente, dois grupos quocientes: o


quociente trivial {1} ≅G/G e o próprio grupo G ≅ G/{1}.

143
Grupos Cíclicos

Seja G um grupo com a transformação x (multiplicação). Seja o elemento x ϵ G. Qual é


o menor subgrupo de G que contém x?

{... x ...} (falta unidade e inverso)


{... x–1, x ...} (falta unidade)
{... x–1, 1, x ...} (falta x2)
{... x–1, 1, x, x2, ...} (falta x-2)
{... x–2, x–1, 1, x, x2, ...} (falta x-3 e x3)
{... x-3, x–2, x–1, 1, x, x2, x3 ...}

Este é o menor subgrupo de G que contém x e é chamado de grupo gerado por x,


denotado por <x> = {... x-3, x–2, x–1, 1, x, x2, x3 ...}.

Se um grupo G = <x>, para algum x, então G é um grupo cíclico.

Um grupo cíclico é um grupo que é gerado por um único elemento, ou seja, ele é
constituído de um conjunto de elementos com uma única operação de inversão
associativa e contém um elemento g tal que qualquer outro elemento do grupo pode
ser obtido através da aplicação repetitiva da operação ou de sua inversa a g. Cada
elemento pode ser escrito como uma potência de g, em notação multiplicativa ou
como um múltiplo de g em notação aditiva. O elemento g é o gerador do grupo.

Sob a transformação +, temos algo semelhante:

<y> = {..., –3y, –2y, –y, 0, y, 2y, 3y, ... }

Assim, um grupo H = <y> implica que H é um grupo cíclico.

Nos exemplos dados, G é gerado por um seu elemento x (G = <é gerado por x>) e H é
gerado por um seu elemento y (H = <é gerado por y>). Por isso, G e H são chamados de
grupos cíclicos.

Exemplo 1: Suponha que consideremos 3 ϵ Z e listamos todos os múltiplos de 3


(negativos e positivos). Como um conjunto seria:

3Z = {..., -3, 0, 3, 6, ...}

É fácil ver que 3Z é um subgrupo dos inteiros. Este subgrupo é completamente


determinado pelo elemento 3, pois, podemos obter todos os outros elementos através
de múltiplos de 3 (operação de adição). Qualquer elemento do grupo é gerado pelo 3.
3Z é um grupo cíclico.

144
Definição: Um grupo G é cíclico se existe g e G tal que o subgrupo cíclico gerado por g
é o próprio conjunto G: G = {gk, k ϵ Z}. O valor g é o gerador de G: <g> = G.

Esta é a chamada notação multiplicativa. Podemos dar a mesma definição usando uma
notação aditiva:

Um grupo G é cíclico se existe g e G tal que o subgrupo cíclico gerado por g é o


próprio conjunto G: G = { kg, k ϵ Z}.

Cada elemento de um grupo cíclico é uma potência ou um múltiplo de um elemento


fixo do grupo (exatamente o gerador).

Exemplo 2: Seja o grupo Z6 = {0, 1, 2, 3, 4, 5} sob adição. Vamos gerar os subgrupos


cíclicos (com o mesmo tipo de ciclo que vimos em Grupos de Permutações) tomando
cada valor do conjunto como gerador do subgrupo (o que vamos fazer é adicionar o
gerador a ele mesmo e usar aquele esquema de um relógio que marca de 0 a 5 para
calcular o resultado – use a tabela a seguir, para ajudar [o resultado está na primeira
linha, para qualquer total da soma nas demais linhas):

0 1 2 3 4 5
6 7 8 9 10 11
12 13 14 15 16 17

<1> = {1, 2, 3, 4, 5, 0}
<2> = {2, 4, 0}
<3> = {3, 0}
<4> = {4, 2, 0}  4+0 = 4, 4+4 = 8 = 2, 4 + 2 = 6 = 0, 4 + 0 = 4 (recicla – fecha).
<5> = {5, 4, 3, 2, 1, 0}
<0> = {0}

Veja que <1> e <5> gera Z6 inteiramente, ou seja <1> = <5> = Z6. Se nenhum dos
subgrupos fosse igual a Z6, então Z6 não seria um grupo cíclico.

Definição: Um grupo cíclico pode ter mais que um gerador. Tanto o 1 quanto o 5
geram Z6.

Agora, fica fácil deduzir que os elementos geradores de Z são +1 e -1. Desse modo,
podemos escrever Z = <1> U <–1>. Z é um grupo cíclico infinito. Existem grupos
cíclicos finitos. Um exemplo destes o grupo Z6 acima.

Teorema: Qualquer subgrupo de um grupo cíclico é cíclico.

Corolário: Os subgrupos cíclicos de Z são, exatamente, nZ, para n = 0, 1, 2, 3, ...

145
Proposição: Seja G um grupo cíclico de ordem n e suponha que g é um gerador de G.
Então, gk = e se, e somente se, n divide k. Lembre-se que e é o elemento unidade.

Proposição: Seja G um grupo e g ϵ G. A ordem de g (gerador) é o menor inteiro


positivo n tal que gn = 1. Se não existir n tal que gn = 1, então g tem ordem infinita.

Teorema: Seja G um grupo cíclico de ordem n e suponha que g ϵ G seja um gerador do


grupo. Se b = gk, então a ordem de b é n ÷ d, onde d = MDC(k, n).

Corolário: Os geradores de Zm são inteiros r tal que 1 ≤ r < m e MDC(r, m) = 1.

Por exemplo, para Z3, r = 0, 1, 2. O MDC entre 3 e qualquer r é 1.

Qualquer grupo cíclico é um grupo abeliano, mas, nem todos os grupos abelianos são
grupos cíclicos.

146
Grupos Multiplicativos de Números Complexos

O conjunto dos números complexos é denotado por C = {a + ib, a e b ϵ R}, sendo a a


parte real e ib a parte imaginária. Já vimos as operações possíveis sobre números
complexos.
A forma polar de um número complexo é dada por:

Costuma-se representar o lado central por r.Cisθ

Exemplo 1:
Se z = 2.Cis60o, então:

𝑎 = 2. 𝐶𝑜𝑠60𝑜 = 1
𝑏 = 2. 𝑆𝑒𝑛60𝑜 = √3
Daí,
𝑧 = 1 + 𝑖√3

Proposição: Seja z = r.Cisθ e w = s.Cisφ dois números complexos não nulos. Então
temos que z.w = r.s.Cis(θ + φ).

Teorema de De Moivre: Seja z = r.Cisθ um número complexo não nulo. Então temos
que [r.Cisθ]n = rn.Cis(nθ), para n = 1, 2, ...

O Grupo Cíclico e as Raízes da Unidade

O grupo multiplicativo dos números complexos, C*, possui subgrupos interessantes.


Enquanto Q* e R* não têm grupos de ordem finita interessantes, o C* tem vários.
O grupo do círculo é definido assim: T = { z ϵ C* tal que |z| = 1}.

Proposição: O grupo do círculo é um subgrupo de C*.

Apesar de o grupo do círculo ter ordem infinita, ele tem vários subgrupos finitos
interessantes.

147
Suponha que H = {1, -1, i, -i}. Então H é um subgrupo do grupo do círculo. Também, os
valores 1, -1, i, -i são, exatamente, aqueles números complexos que satisfazem a
equação z4 = 1. Os números complexos que satisfazem a equação zn = 1 são chamados
de raízes enésimas da unidade.

Teorema: Se zn = 1, então as raízes enésimas da unidade são:

2𝑘𝜋
𝑧 = 𝐶𝑖𝑠 ( )
𝑛

Onde k = 0, 1, 2, ..., n – 1. Além disso, as raízes enésimas formam um subgrupo cíclico


de T de ordem n.

Um gerador do grupo de raízes da unidade é chamado de raiz enésima primitiva da


unidade.

Função φ de Euler

A função de Euler é o mapeamento φ : N → N, definida por φ(n) = 1 para n = 1 e, para


n > 1, φ(n) é a quantidade de inteiros positivos m em que 1 ≤ m < n e MDC(m,n) = 1.

Teorema: Seja U(n) o grupo das unidades em Zn. Então |U(n)| = φ(n).

Teorema de Euler: Sejam a e n inteiros tais que n > 0 e MDC(a,n) = 1. Então aφ(n) ≡ 1
(mod n).

Se considerarmos um caso especial do teorema de Euler em que n = p, com p primo e


que φ(p) = p – 1, obteremos o Pequeno Teorema de Fermat:

Seja p um número primo qualquer e suponha que p não divide a.


Então ap-1 ≡ 1 (mod p). Além disso, para qualquer inteiro b, bp ≡ b (mod p).

148
Isomorfismo

Muitos grupos parecem diferentes à primeira vista, mas, podem, na verdade, serem
mostrados como iguais pelo simples fato de se renomear seus elementos.
Por exemplo, Z4 e o subgrupo do grupo circular T gerado por i podem ser provados
como sendo o mesmo grupo estrutural ao se mostrar que há uma correspondência
biunívoca entre os elementos destes dois grupos e entre as operações de cada um.
Em casos assim, os grupos são chamados de isomórficos.

Definição: Dois grupos (G, op1) e (H, op2) são isomórficos se existe uma
correspondência biunívoca entre os elementos dos dois grupos e existe um
mapeamento sobrejetor de G em H (φ : G → H), tal que as operações de cada grupo
são preservadas, ou seja:

φ(a op1 b) = φ(a) op2 φ(b)

para todo a, b ϵ G.
Se G é isomórfico com H, escrevemos G ≅ H. O mapeamento φ é chamado de um
isomorfismo.

A função φ pode ser pensada como um simples renomeamento dos elementos de G


(em H), já que a função é injetora e sobrejetora, ou seja, bijetora.
A condição de que φ(a op1 b) = φ(a) op2 φ(b), para todo a, b ϵ G, dá a certeza que a
multiplicação pode ser feita em um dos grupos e, então, transferida para o outro, já
que a função inversa φ–1 também respeita as operações nos dois grupos.

Exemplo 1: Para mostrar que Z4 ≅ <i>, defina um mapeamento φ : Z4 → <i> através


da função φ(n) = in. Devemos mostrar que φ é bijetiva e preserva a operação do grupo.
O mapeamento φ é injetor e sobrejetor porque:

φ(0) = 1
φ(1) = i
φ(2) = -1
φ(3) = -i

Como φ(m + n) = im+n = im x in = φ(m) x φ(n), a operação do grupo é preservada.

Exemplo 2: Os inteiros são isomórficos ao subgrupo Q* dos racionais que contém


elementos da forma 2n.

149
Defina a função φ : Z → Q* por φ(n) = 2n. Então φ(m+n) = 2m+n = 2m2n = φ(m)φ(n).

Os grupos Z8 e Z12 não são isomórficos, pois, têm ordens diferentes.

Apesar de S3 e Z6 possuírem a mesma quantidade de elementos (S3 – um grupo


permutativo - tem 3! = 6 elementos), eles não são isomórficos porque Z6 é um grupo
abeliano e S3 é um grupo não abeliano.

Teorema: Seja φ : G → H um isomorfismo. Então:


a) φ-1 : H → G é um isomorfismo.
b) |G| = |H| (as ordens são iguais)
c) Se G é abeliano, H é abeliano.
d) Se G é cíclico, H é cíclico.
e) Se G tem um subgrupo de ordem n, então H tem um subgrupo de ordem n.

Teorema: Qualquer grupo cíclico de ordem infinita é isomórfico com Z.

Teorema: Se G é um grupo cíclico de ordem n, então G é isomórfico com Zn.

Teorema: O isomorfismo de grupos determina uma relação de equivalência na classe


de todos os grupos.

Teorema de Cayley: Todo grupo é isomórfico com um grupo permutativo.

150
Produtos Diretos

Dados dois grupos G e H, é possível construir um novo grupo através do produto


cartesiano de G com H, G x H. De modo inverso, dado um grupo grande, às vezes, é
possível decompor o grupo. Em outras palavras, um grupo é, às vezes, isomórfico ao
produto direto de dois grupos menores.

Se (G, op1) e (H, op2) são grupos, então podemos criar um produto cartesiano de G
com H em um novo grupo. Como um conjunto, esse novo grupo é apenas um conjunto
de pares ordenados (g, h) ϵ G x H, onde g ϵ G e h ϵ H. Podemos definir uma operação
binária em G x H por (g1,h1)(g2,h2) = (g1 op1 g2, h1 op1 h2).

Proposição: Sejam G e H dois grupos. O conjunto G x H é um grupo sob a operação


(g1,h1)( g2,h2), onde g1, g2 ϵ G e h1, h2 ϵ H.

Exemplo: Seja R o grupo dos reais sob adição. O produto cartesiano de R com ele
mesmo, R x R = R2 é um grupo também, em que a operação no grupo é apenas a
adição em cada coordenada: (a, b) + (c, d) = (a+c, b+d). A identidade é (0, 0) e a inversa
de (a, b) é (-a, -b).

O grupo G x H é chamado de Produto Externo Direto de G e H. Esse produto pode


ocorrer entre dois ou mais grupos.

Teorema: Seja (g, h) ϵ G x H. Se G e H têm ordem finita r e s, respectivamente, então a


ordem de (g, h) em G x H é o MDC(r, s).

Teorema: O grupo Zm x Zn é isomórfico com Zmn se, e somente se, MDC(m, n) = 1 (o


produto direto de dois grupos cíclicos é um grupo cíclico se o MDC = 1).

151
Produto Interno Direto

O produto interno direto equivale a “quebrar” um grupo em seus subgrupos, ou seja,


mostrar que um grupo é isomórfico ao produto direto de dois de seus subgrupos.

Seja G um grupo com os subgrupos H e K que satisfazem as seguintes condições:


 G = HK = {hk, com h ϵ H, k ϵ K}
 H ∩ K = {e}
 hK = Kh para todo k ϵ K e h ϵ H.

Então G é o produto interno direto de H e K.

Exemplo: O grupo U(8) – o grupo das unidades de Z8 - é o produto interno direto de H


= {1, 3} e K = {1, 5}.

Nem todo subgrupo pode ser escrito como o produto interno direto de dois de seus
subgrupos.

Teorema: Seja G o produto interno direto dos subgrupos H e K. Então G é isomórfico


com H x K.

Exemplo: O grupo Z6 é um produto interno direto isomórfico a {0,2,4} x {0,3}.

152
Homomorfismo

O homomorfismo é um caso especial de isomorfismo quando há apenas sobrejeção ou


apenas injeção num subgrupo imagem.

Definição: Um homomorfismo entre grupos (G, op1) e (H, op2) é um mapeamento φ :


G→H tal que φ(g1 op1 g2) = φ(g1) op2 φ(g2) para g1, g2 ϵ G. A imagem de φ em H é
chamada de imagem homomórfica de φ. Se φ é injetora e sobrejetora, temos um
isomorfismo e os conjuntos G e H são idênticos.

Dois grupos têm a relação mais forte possível se eles são isomórficos. O
homomorfismo é uma relação mais fraca.

Exemplo 1: Seja G um grupo e g ϵ G. Defina a função φ : Z → G por φ(n) = gn. Então φ


é um homomorfismo de grupo, pois, φ(m+n) = gm+n = gmn = φ(m)φ(n).
Este homomorfismo mapeia Z no subgrupo cíclico de G gerado por g.

Exemplo 2: G : R+ sob multiplicação e H : R sob adição são homomórficos, pois, com a


função φ = log, temos que log(mn) = log(m) + log(n). São isomórficos?

Para serem, cada m deve apontar para um único n e vice-versa (injeção) e m deve
cobrir todos os n (sobrejeção). Temos que Dom(R+) = R+ e Im(R+) = R. Então a função
é sobrejetora. Se log(m) = log(n), então elog(n) = elog(m), o que implica que m = n e a
função é injetora. Então os dois conjuntos são isomórficos.

Proposição: Seja φ : G1 → G2 um homomorfismo de grupos. Então:


1) Se e é a identidade de G1, então φ(e) é a identidade de G2.
2) Para qualquer elemento g ϵ G1, φ(g-1) = [φ(g)]-1.
3) Se H2 é um subgrupo de G2, então φ-1(H2) = {g ϵ G1, com φ(g) ϵ H2} é um
subgrupo de G1. Além disso, se H2 é um grupo normal em G2, φ-1(H2) é normal
em G1.

Apesar de não ser evidente, à primeira vista, grupos quocientes correspondem,


exatamente, a imagens homomórficas. Assim, grupos quocientes podem ser usados no
estudo de homomorfismo.

O objetivo último da teoria dos grupos é classificar os grupos por isomorfismo, isto é,
dado um grupo em particular, devemos ser capazes de compará-lo como igual a um
grupo conhecido via o isomorfismo.

153
Grupos Matriciais

O conjunto de todas as matrizes n x n inversíveis (determinantes diferentes de zero)


formam um grupo chamado de grupo linear geral, denotado por GLn(R). O elemento
unidade é a matriz unidade correspondente. O grupo linear geral tem vários subgrupos
importantes. As propriedades multiplicativas dos determinantes implicam que o
conjunto de matrizes com determinante igual a 1 é um subgrupo do grupo linear geral.
Dito de outra maneira, suponha que det(A) = 1 e det(B) = 1. Então:

1
𝑑𝑒𝑡(𝐴𝐵) = 𝑑𝑒𝑡(𝐴) × 𝑑𝑒𝑡(𝐵) = 1 𝑒 𝑑𝑒𝑡(𝐴−1 ) = =1
𝑑𝑒𝑡(𝐴)

Este grupo é chamado de grupo linear especial e é denotado por SLn(R).

𝑎 𝑏
Exemplo: Dada a matriz 2 x 2, 𝐴 = ( ), o determinante de A é ad – bc.
𝑐 𝑑

O grupo GL2(R) consiste daquelas matrizes em que ad – bc ≠ 0. A inversa de A é:

1 𝑑 −𝑏
𝐴−1 = ( )
𝑎𝑑 − 𝑏𝑐 −𝑐 𝑎

Se A está em SL2(R), então:


𝑑 −𝑏
𝐴−1 = ( )
−𝑐 𝑎

Geometricamente, SL2(R) é o grupo que preserva as áreas de paralelogramos.

1 1
Seja 𝐴 = ( ) em SL2(R). Na figura abaixo, o quadrado unitário correspondente aos
0 1
vetores x = (1, 0)T e y = (0, 1)T é pego por A e levado ao paralelogramo de lados (1, 0)T e
(1, 1)T, ou seja, Ax = (1, 0)T e Ay = (1, 1)T. Veja que os dois paralelogramos têm a mesma
área.

154
O Grupo Ortogonal

Outro grupo de GLn(R) é o grupo ortogonal. Uma matriz A é ortogonal se A-1 = AT. O
grupo ortogonal é o conjunto de todas as matrizes ortogonais. O grupo ortogonal nxn
é denotado por O(n).

Exemplo: As seguintes matrizes são ortogonais:

3 −4 1 −√3
(5 5 ), 2 2
4 3 √3 1
5 5
(2 2 )

As matrizes ortogonais são, exatamente, aquelas matrizes que preservam o


comprimento dos vetores (||A.v|| = ||v||).

Podemos definir o comprimento de um vetor usando o produto interno euclidiano, ou


produto escalar de dois vetores. Como já vimos, calculamos o produto escalar de dois
vetores assim:
Sendo x = (x1, x2, ..., xn)T e y = (y1, y2, ..., yn)T:

𝑦1
𝑇 𝑦
< 𝑥, 𝑦 ≥ 𝑥 𝑦 = (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) ( …2 ) = 𝑥1 . 𝑦1 + 𝑥2 . 𝑦2 + ⋯ + 𝑥𝑛 . 𝑦𝑛
𝑦𝑛

Definimos o comprimento do vetor x = (x1, x2, ..., xn)T como:

||𝑥|| = √< 𝑥, 𝑥 >= √𝑥12 + 𝑥22 + ⋯ + 𝑥𝑛2

Associado à noção do comprimento de um vetor é a ideia de distância entre dois


vetores. Definimos a distância entre dois vetores x e y como || x – y ||.

Como det(AAT) = det(I) = 1 e det(A) = det(AT), o determinante de qualquer matriz


ortogonal é igual a 1 ou igual a -1.

Sejam os vetores coluna

𝑎1𝑗
𝑎2𝑗
𝑎𝑗 = ( … )
𝑎𝑛𝑗

155
da matriz ortogonal A = (aij). Como AAT = I, temos <ar, as> = δrs, onde 𝛿𝑟𝑠 =
1, 𝑠𝑒 𝑟 = 𝑠
{ é o delta de Kronecker.
0, 𝑠𝑒 𝑟 ≠ 𝑠

De acordo com isso, vetores coluna de uma matriz ortogonal têm comprimento igual a
1, e o produto escalar de vetores coluna distintos é igual a zero. Qualquer conjunto de
vetores que satisfazem estas propriedades é chamado de conjunto ortonormal. De
outro modo, dada uma matriz nxn A, cujas colunas formam um conjunto ortonormal
implica que A-1 = AT.

Teorema: Seja A uma matriz nxn. As seguintes afirmações são equivalentes:


1) As colunas da matriz A formam um conjunto ortonormal.
2) A-1 = AT.
3) Para os vetores x e y, <Ax, Ay > = < x, y>
4) Para os vetores x e y, ||Ax, Ay|| = ||x – y||
5) Para qualquer vetor x, ||Ax|| = ||x||

156
Grupos Wallpaper (Papel de Parede)

Padrões wallpaper são, simplesmente, padrões que se repetem no plano. O análogo do


wallpaper no espaço R3 sãos os cristais, que podemos considerar como padrões
repetitivos de moléculas em três dimensões.
Tais padrões ocorrem com frequência na arquitetura e na arte decorativa,
especialmente em tecidos (tapetes, por exemplo) e azulejos, bem como em papel de
parede.

A figura a seguir (da Wikipedia) mostra alguns padrões.

Os exemplos A e B pertencem ao mesmo grupo wallpaper. O exemplo C pertence a um


grupo diferente. Para verificar isso, basta aplicar as simetrias (movimentos) que vimos
anteriormente.
Foi provado que existem apenas 17 grupos wallpaper, ou seja, mesmo que você
apresente mil padrões diferentes, todos eles vão ser classificados dentro de um desses
17 grupos!
A próxima figura (clarku.edu) mostra 17 padrões diferentes. Qualquer outro
pertencerá ao mesmo grupo que um desses.

O equivalente matemático de um wallpaper ou cristal é chamado de lattice (treliça,


tela com trançados em formas geométricas).

157
Lattices

Suponha que x e y são vetores linearmente independentes em R2. Um lattice de x e y


é o conjunto de todas as combinações mx + ny, onde m e n são inteiros. Diz-se que os
vetores x e y formam a base do lattice.

Um lattice pode ter mais que uma base. Por exemplo, os vetores (1, 1)T e (2, 0)T têm o
mesmo lattice que os vectores (-1, 1)T e (-1, -1)T. Contudo, um lattice é completamente
determinado por uma base. Dadas duas bases para o mesmo lattice, sendo elas, por
exemplo, { x1, x2} e {y1, y2}, podemos escrever:

y1 = α1x1 + α2x2
y2 = β1x1 + β2x2

onde α1, α2, β1, β2 são inteiros. A matriz que corresponde a essa transformação é

𝛼1 𝛼2
𝑈 = (𝛽 𝛽2 )
1

Se quisermos definir x1 e x2 em termos de y1 e y2, devemos calcular a inversa U-1:

𝑦1 𝑥1
𝑈 −1 (𝑦 ) = (𝑥 )
2 2

Como U tem elementos inteiros, U-1 também deve ter; daí, os determinantes de cada
um devem ser inteiros. Como UU-1 = I, então det(UU-1) = det(U) x det(U-1) = 1.
Consequentemente, det(U) = ± 1. Uma matriz com determinante ± 1 com elementos
inteiros é chamada de matriz unimodular.

Os lattices são classificados pelo estudo de seus grupos de simetria. O grupo de


simetria de um lattice é o subgrupo de E(2) que mapeia o lattice nele mesmo (lembre
que E(2) é o grupo euclidiano).

Dois lattices em R2 são equivalentes se eles têm o mesmo grupo de simetria.


Similarmente, a classificação de cristais em R3 é obtido pela associação de um grupo
de simetria, chamado de grupo de espaço, a cada tipo de cristal. Um grupo de espaço
é composto de duas partes: um subgrupo de translação e um grupo pontual. O
subgrupo de translação é um subgrupo abeliano infinito do grupo de espaço feito de
simetrias translacionais do cristal. O grupo pontual é um grupo finito consistindo de
rotações e reflexões do cristal em torno de um ponto.

Teorema: Todo grupo translacional em R2 é isomórfico a Z x Z.

Teorema: O grupo pontual em grupos wallpaper é isomórfico a Zn ou Dn, onde n = 1, 2,


3, 4, 5, 6.

158
Em R3 existem 230 grupos de espaço diferentes. No espaço R4 existem 4783. Em Rn,
com n > 4 não se sabe.

É interessante notar que os 230 grupos cristalográficos de R3 foram encontrados antes


(matematicamente) do que os 230 tipos de cristais que existem na natureza.

O grupo wallpaper também é chamado de grupo de simetrias no plano ou grupo


cristalográfico no plano.

Subgrupos Simples

Um subgrupo simples é um grupo cujos únicos subgrupos normais são o subgrupo


trivial de ordem 1 e o subgrupo não próprio, que é todo o grupo original. Entre os
grupos simples estão incluídos a família infinita dos grupos alternantes de grau maior
que 5, os grupos cíclicos de ordem p (onde p é um número primo), os grupos do tipo
Lie e 26 grupos chamados de grupos esporádicos.

Uma vez que todos os subgrupos de um grupo abeliano são normais e todos os grupos
cíclicos são abelianos, os únicos grupos cíclicos simples são aqueles que não têm
subgrupos diferentes do subgrupo trivial e do subgrupo impróprio consistindo de todo
o grupo original. E uma vez que grupos cíclicos de ordem composta podem ser escritos
como um produto direto do grupo de grupos quocientes, isso significa que apenas os
grupos cíclicos de ordem p (p primo) não têm subgrupos não triviais. Portanto, os
únicos grupos cíclicos simples são os grupos cíclicos principais. Além disso, esses são os
únicos grupos simples abelianos.

Classificação dos Grupos Finitos

Os grupos foram classificados em 18 grupos clássicos (18 famílias de grupos simples


infinitos) e 26 grupos esporádicos (por não se encaixarem entre os clássicos), também
chamados de leftovers ou outliers.

A classificação dos grupos finitos consiste em se determinar se o grupo sob análise


pertence a uma das classes: cíclicos, alternantes, classe infinita de Lie, classe dos
esporádicos.

Teorema: Todo grupo simples é isomórfico a um dos seguintes grupos:


 É membro de uma das três classes infinitas: grupos cíclicos de primeira ordem;
grupos alternantes de grau 5 ou menor; grupos do tipo Lie.
 É membro de um dos 26 grupos esporádicos.
 É membro do grupo de Tits (que não se sabe se é o 27º grupo esporádico)

159
A prova do teorema da classificação de grupos consiste de mais de 10 mil páginas!

Os fatores primos de um número inteiro determinam este número unicamente, mas,


os grupos simples (que são os fatores que compõem um grupo) podem determinar um
ou mais grupos, pois, podem existir muitos grupos não isomórficos que possuem a
mesma série de composição entre si.

Como Categorizar os Grupos Finitos

1) Tenha em mãos todos os grupos simples.


2) Encontre todas as maneiras de combinar os grupos simples onde uma delas
forma o grupo. É como combinar átomos para formarem moléculas.

À maneira da tabela periódica na Química, foi, até, criada uma tabela periódica (ver
adiante) dos grupos simples, como se fossem os "átomos" formadores das
"moléculas", que são os grupos na Álgebra Abstrata.

160
Grupos de Lie

Um grupo de Lie (Sophus Lie, 1842-1899) é um grupo cujos elementos são organizados
de modo contínuo e suave (como o conjunto dos números reais), como oposição aos
grupos discretos, onde os elementos são separáveis. Isso faz dos grupos de Lie
manifolds diferenciáveis.

Classicamente, estes grupos foram descobertos no estudo de subgrupos matriciais G


contidos em GLn(R) ou GLn(C), ou seja, o grupo de matrizes n x n reversíveis sobre R
e C.

Os grupos de Lie proveem um modelo natural para o conceito de simetria contínua,


como a simetria rotacional em três dimensões (como uma esfera, por exemplo).
A motivação inicial de Lie na criação de tais grupos foi a de modelar as simetrias
contínuas apresentadas pelas equações diferenciais, da mesma maneira que os grupos
finitos são usados na teoria de Galois para modelar as simetrias discretas das equações
algébricas.

Exemplo: A matriz real inversível 2 x 2 forma um grupo sob multiplicação, denotada


por GL(2, R) ou por GL2(R):
𝑎 𝑏
𝐺𝐿2 (ℝ) = {𝐴 = ( ) : det(𝐴) = 𝑎𝑑 − 𝑏𝑐 ≠ 0}
𝑐 𝑑

Este é um grupo de Lie real de 4 dimensões não compacto. Ele é um subconjunto


aberto de R4. Este grupo é desconectado. Ele tem dois componentes conectados
correspondendo aos valores positivo e negativo do determinante.

O círculo e a esfera são exemplos de manifolds suaves (têm um grupo contínuo de


simetrias). Tanto o círculo como a esfera podem ser rotacionados em qualquer grau
que ficarão com a mesma “cara”.

O conceito de grupo foi criado para capturar a essência das simetrias. O conjunto de
simetrias de um objeto é um grupo e todo grupo é um conjunto de simetrias de algum
objeto.

Sob adição, a linha real é um grupo de Lie.

Grupos Alternantes

Um grupo alternante é o grupo de permutações pares do grupo simétrico de um


conjunto finito. O grupo alternante em um conjunto de n elementos é chamado de
grupo alternante de grau n, denotado por An.

161
O grupo alternante é importante porque para A5 ou maior, ele é um grupo simples (o
que significa que ele não pode ser fatorado em grupos menores), tendo um
importante papel, então, na categorização de grupos.

Ocorre que metade das permutações do grupo simétrico é par e a outra metade é
ímpar, isto é, se permutarmos um conjunto com N elementos, o grupo simétrico tem N
fatorial (N!) permutações e o grupo alternante tem N!/2 permutações.

Grupos Esporádicos

Os grupos esporádicos é um conjunto de 26 grupos simples finitos que não se


encaixam em nenhuma das 4 famílias de grupos simples finitos:
1) Grupos cíclicos de ordem 1.
2) Grupos alternantes de grau mínimo 5.
3) Grupo de Lie
4) Grupos de Chevalley (grupos de Lie em campos finitos).

O menor grupo esporádico que se conhece é o grupo Mathieu (M11), que tem ordem
igual a 7.920 (sete mil e novecentos e vinte). O maior grupo esporádico conhecido até
hoje é o monster group.

O Monster Group

O monster group M é um grupo finito que é o maior entre todos os grupos simples
finitos esporádicos. Ele contém 19 dos 26 grupos esporádicos, totalizando
20 grupos (o conjunto é chamado de Família Feliz - Happy Family). A família feliz é,
então, um conjunto finito de 20 dos 26 grupos esporádicos. Os 19 subgrupos da família
feliz são subquocientes3 do monster group: são 5 grupos do grupo de Mathieu M24; 7
subquocientes do grupo de Conway Co0 e 8 subquocientes do monster group. Os
outros 6 grupos esporádicos não se encaixam, por suas vezes, no monster e, assim, são
chamados de grupos párias. O monster é formado de cerca de 8 x 1053 simetrias de
rotação (esse número é maior do que a quantidade de átomos que formam toda a
massa do planeta Júpiter!). Essa quantidade de transformações simétricas não é
possível em 3 dimensões, mas, em, exatamente, 196.883 (cento e noventa e seis mil e
oitocentas e oitenta e três) dimensões! É por isso que ele é chamado de grupo-
monstro. Esta é fatoração (em fatores primos) do monster group:

246 × 320 × 59 × 76 × 112 × 133 × 17 × 19 × 23 × 29 × 31 × 41 × 47 × 59 × 71

A seguir, a tabela periódica dos grupos finitos.

3
Um subquociente de um objeto X em uma categoria é um objeto que é quociente de um subobjeto de
X.

162
163
Ações de Grupos

Ações de grupos generalizam a multiplicação em grupo. Se G é um grupo e X é um


conjunto arbitrário, a ação de grupo de um elemento g ϵ G e x ϵ X é o produto gx
pertencente a X. Muitos problemas em álgebra são melhor abordados via ações de
grupo.

Seja X um conjunto e G um grupo. Uma ação (à esquerda) de G em X é um


mapeamento G x X → X dado por (g, x) ⟼ gx, onde:
1) ex = x para todo x ϵ X.
2) (g1g2)x = g1(g2x) para todo x ϵ X e todo g1, g2 ϵ G.

Sob estas condições, X é chamado de um G-conjunto (G-set). Veja que não se requer
que X tenha qualquer relacionamento com G. É verdadeiro que cada grupo G age em
cada conjunto X pela ação trivial (g, x) ⟼ x; contudo, grupos de ação são mais
interessantes se o conjunto X está relacionado a G de alguma maneira.

A seta com uma barrinha significa que a função mapeia o elemento a ao elemento b,
enquanto a seta simples significa a função mapeia o conjunto A no conjunto B.

Exemplo 1: Seja G = GL2(R) e X = R2. Então, G age em X por multiplicação à esquerda.


Se v ϵ R2 e I é a matriz identidade, então Iv = v. Se A e B são matrizes 2x2 inversíveis,
então (AB)v = A(Bv), pois, a multiplicação de matrizes é associativa.

Exemplo 2: Seja G = D4 o grupo de simetria de um quadrado. Se X = {1,2,3,4} é o


conjunto dos vértices do quadrado, então podemos considerar D4 consistindo das
seguintes partições: {(1), (13), (24), (1432), (1234), (12)(34), (14)(23), (13)(24)}. Os
elementos de D4 agem em X como funções. A permutação (13)(24) age no vértice 1
levando-o ao vértice 3; no vértice 2, levando-o para o vértice 4, e assim por diante. É
fácil verificar que os axiomas de ações de grupos são satisfeitos.

Proposição: Seja X um G-set. Então, uma G-equivalência é uma relação de equivalência


em X.

Se X é um G-set, então cada partição de X associada com uma G-equivalência é


chamada de uma órbita sob G. Denotamos a órbita que contém um elemento x de X
por Ox.

Agora, suponha que G é um grupo agindo em um conjunto X e seja g um elemento de


G. O conjunto ponto fixo de g em X, denotado por Xg, é o conjunto de todos os x ϵ X,
tal que gx =x. Podemos, também, estudar os elementos g que fixam um dado x ϵ X.

164
Este conjunto é muito mais do que um subconjunto de G, ele é um subgrupo. Este
subgrupo é chamado de subgrupo estabilizador ou subgrupo de isotropia de x, que
denotamos por por Gx.

Proposição: Seja G um grupo agindo em um conjunto X e seja x ϵ X. O grupo


estabilizador de x, Gx, é um subgrupo de G.

Teorema: Seja G um grupo finito e X um G-set finito. Se x ϵ X, então |Ox| = |G : Gx|.

A Equação de Classe

Seja X um G-set finito e XG o conjunto de pontos fixos em X, ou, na linguagem dos


conjuntos, XG = {x ϵ X | gx = x, para todo g ϵ G}. Com isso, as órbitas da partição de
ação X, dadas por
𝑛

|𝑋| = |𝑋𝐺 | + ∑|𝑂𝑥𝑖 |


𝑖=𝑘

Onde xk, ..., xn são os representativos das órbitas não triviais distintas de X.
Agora, considere o caso especial em que G age em si mesmo por conjugação, ou seja,
(g, x) ⟼ gxg-1. O centro de G, Z(G) = {x | xg = gx, para todo g ϵ G}, é o conjunto de
pontos que são fixos por conjugação. As órbitas não triviais da ação são chamadas de
classes de conjugações de G. Se x1, ..., xk são os representativos de cada uma das
classes de conjugações não triviais de G e |Ox1| = n1, ..., |Oxk| = nk, então |G| = |Z(G)|
+ n1 + ... + nk.

Os subgrupos estabilizadores de cada um dos xi, C(xi) = {g ϵ G | gxi = xig}, são


chamados de subgrupos centralizadores dos xi. Do teorema acima, obtemos a equação
de classe: |G| = |Z(G)| + |G : C(x1)| + ... + |G : C(xk)|.
Uma das consequências da equação de classe é que a ordem de cada classe de
conjugação deve dividir a ordem de G.

Exemplo 1: É fácil verificar que as classes de conjugação em S3 são as seguintes:

{(1)}, {(123), (132)}, {(12), (13), (23)}

A equação de classe é: 6 = 1 + 2 + 3.

Teorema: Seja G um grupo de ordem pn, onde p é primo. Então G tem um centro não
trivial.

Corolário: Seja G um grupo de ordem p2, onde p é primo. Então G é abeliano.

165
Teorema da Contagem de Burnside

Suponha que queiramos colorir os vértices de um quadrado com duas cores diferentes,
como vermelho e verde. A princípio, teremos 24 = 16 coloridos diferentes. Contudo,
veremos que alguns deles são equivalentes. Se pintarmos o primeiro vértice de
vermelho e os demais de verde equivale a pintar o segundo vértice de vermelho e os
demais de verde, pois, podemos obter a segunda pintura simplesmente fazendo uma
rotação de 90 graus da primeira.

O teorema da contagem de Burnside oferece um método para se computar a


quantidade de maneiras diferentes que algo pode ser feito. Além de suas aplicações
geométricas, o teorema tem aplicações interessantes na Teoria de Comutação e em
Química. A prova do teorema de Burnside depende o seguinte lema:

Lema: Seja X um G-set e suponha que x ~ y. Então Gx é isomórfico com Gy. Em


particular, | Gx | = | Gy |.

Teorema de Burnside: Seja G um grupo finito agindo em um conjunto X e seja k a


quantidade de órbitas de X, então:

1
𝑘= ∑|𝑋𝑔 |
|𝐺|
𝑔∈𝐺

Exemplo:

Seja X = {1,2,3,4,5} e suponha que G é o grupo permutativo G = {(1),(13)(25),(25)}.


As órbitas de X são {1, 3}, {2, 5} e {4}. Os pontos fixos são:

X(1) =X
X(13) = {2, 4, 5}
X(13)(25) = {4}
X(25) = {1, 3, 4}

166
O teorema de Burnside diz que

1 1
𝑘= ∑|𝑋𝑔 | = (5 + 3 + 1 + 3) = 3
|𝐺| 9
𝑔∈𝐺

Aplicando aos Quadrados Coloridos

O grupo de simetria de um quadrado, D4, é dado pelas seguintes permutações:

(1) (13) (24) (1432)


(1234) (12)(34) (14)(23) (13)(24)

O grupo age no conjunto de vértices {1, 2, 3, 4} da maneira usual. Podemos descrever


os diferentes mapas de cores de X em Y = {r, g}, onde r e g representam as cores
vermelho e verde, respectivamente. Cada mapeamento f : X →Y descreve uma
maneira de colorir os ângulos do quadrado. Cada 𝜎 induz uma permutação 𝜎̃ dos
possíveis colorimentos dados por 𝜎̃(𝑓) = 𝑓 para f : X → Y. Por exemplo, suponha que f
é definida por
f(1) = r
f(2) = g
f(3) = g
f(4) = g

e 𝜎 = (12)(34). Então 𝜎̃(𝑓) = 𝑓 o 𝜎 envia o vértice 2 para r e os vértices restantes para


g.
O conjunto de todos esses 𝜎̃ é um grupo de permutação 𝐺̃ no conjunto dos
colorimentos possíveis.
Seja 𝑋̃ o conjunto de todos os colorimentos possíveis, isto é, 𝑋̃ é o conjunto de todos
os mapeamentos possíveis de X para Y. Agora, computamos a quantidade das classes
de 𝐺̃ –equivalências:

1) 𝑋̃(1) = 𝑋̃, pois, a identidade garante todos os colorimentos possíveis: 𝑋̃ = 24 =


16
2) 𝑋̃(1234) consiste de todos 𝑓 ∈ 𝑋̃ tal que f fica inalterada pela permutação
(1234). Neste caso, f(1) = f(2) = f(3) = f(4), tal que todos os valores de f devem
ser iguais, isto é, ou f(x) = r ou f(x) = g para todo vértice x do quadrado. Então:
|𝑋̃(1234) | = 2.
3) |𝑋̃(1432) | = 2.
4) Para 𝑋̃(13)(24) , 𝑓(1) = 𝑓(3) = 𝑓(4). Assim, |𝑋̃(13)(24) | = 22 = 4
5) |𝑋̃(12)(34) | = 4.

167
6) |𝑋̃(14)(23) | = 4.
7) Para 𝑋̃(13) , 𝑓(1) = 𝑓(3) e os outros vértices podem ter qualquer cor. Daí,
|𝑋̃(13) | = 23 = 8
8) |𝑋̃(24) | = 8

Pelo teorema de Burnside, podemos concluir que existem, exatamente,

1 4
(2 + 21 + 22 + 21 + 22 + 22 + 23 + 23 ) = 6
8

(seis) maneiras diferentes de colorir os vértices de um quadrado.

Aplicação - Funções de Comutação

Na teoria da comutação nos preocupamos com o design de circuitos eletrônicos com


entradas e saídas binárias. Os circuitos mais simples desse tipo é uma função de
comutação que tem n entradas e apenas uma saída.

Circuitos maiores são construídos através de combinações de circuitos simples assim.

O problema inerente aqui é que, mesmos circuitos simples como este, um grande
número de funções de comutação podem ser construídas. Com apenas 4 entradas e 1
saída, podemos construir 65536 funções de comutação diferentes. Contudo, diversas
vezes, podemos substituir uma função por outra simplesmente fazendo uma
permutação dos terminais de entrada.

Definimos uma comutação ou função booleana de n variáveis como sendo uma função
de ℤ𝑛2 𝑒𝑚 ℤ2 . Como qualquer função de comutação pode ter dois valores possíveis
𝑛
para cada n-upla binária e existem 2n n-uplas binárias, 22 funções de comutação são
possíveis para n variáveis.

168
Em geral, ao se permitir a permutação das entradas, pode-se obter uma redução
considerável na quantidade de módulos diferentes necessários para se montar um
circuito bem maior.

A figura a seguir mostra uma função de comutação para duas variáveis.

Duas funções de comutação f e g são equivalentes se g pode ser obtida de f através da


permutação dos valores de entrada. Por exemplo g(a,b,c) = f(b,c,a). Neste caso, temos
que g ~ f via a permutação (acb).
De acordo com a fórmula, é possível construir 16 funções. A tabela mostra estas
funções.

Entradas Saídas
f0 f1 f2 f3 f4 f5 f6 f7
0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 1 1 1 1
1 0 0 0 1 1 0 0 1 1
1 1 0 1 0 1 0 1 0 1
Entradas Saídas
f8 f9 f10 f11 f12 f13 f14 f15
0 0 1 1 1 1 1 1 1 1
0 1 0 0 0 0 1 1 1 1
1 0 0 0 1 1 0 0 1 1
1 1 0 1 0 1 0 1 0 1

Neste caso de funções de comutação com duas variáveis, a permutação (ab) reduz as
16 possibilidades a 12 funções equivalentes, pois:

f2 ~ f4
f3 ~ f5
f10 ~ f12
f11 ~ f13

169
3
Para 3 variáveis de entrada haverá 22 = 256 funções de comutação possíveis. No
caso de 4 variáveis, serão 65536. A quantidade de classes de equivalência se torna
extremamente grande para se calcular diretamente. É necessário usar o teorema de
Burnside.

É importante notar que a permutação das funções de comutação não é simplesmente


a permutação dos valores de entrada {a, b, c}, por exemplo. Uma função de comutação
é um conjunto de valores de saída para as entradas a, b e c, o que implica que quando
consideramos as funções de comutação equivalentes, estamos permutando 2 3 saídas
possíveis, não apenas os três valores de entrada.
Por exemplo, cada tripla binária (a, b, c) tem uma saída específica associada a ela. A
permutação (acb) altera a saída assim:

(0,0,0) ⟼ (0,0,0)
(0,0,1) ⟼ (0,1,0)
(0,1,0) ⟼ (1,0,0)
...
(1,1,0) ⟼ (1,0,1)
(1,1,1) ⟼ (1,1,1)

Seja X o conjunto de valores de saída de uma função de permutação de n variáveis.


Então |X| = 2n. Podemos enumerar esses valores assim:

(0, … ,0,1) ⟼ 0
(0, … ,1,0) ⟼ 1
(0, … ,1,1) ⟼ 2
...
(0, … ,0,1) ⟼ 2𝑛 − 1

Consideremos um circuito com 4 variáveis de entrada e 1 saída. Suponha que


possamos permutar os terminais de qualquer circuito de acordo com o seguinte grupo
permutativo: (a), (ac), (bd), (adcb), (abcd), (ab)(cd), (ad)(bc), (ac)(bd). A permutação
das 4 entradas possíveis induzem as permutação dos valores de saída conforme a
tabela abaixo. Daí, existem
1 16
(2 + 2 × 212 + 2 × 26 + 3 × 210 ) = 9616
8

9616 funções de comutação possíveis de 4 variáveis sob esse grupo permutativo. Esse
número pode diminuir se considerarmos o grupo simétrico completo de 4 letras.

Veja tabela a seguir.

170
Permutação no Grupo Permutação de f Número de Ciclos
(a) (0) 16
(ac) (2,8)(3,9)(6,12)(7,13) 12
(bd) (1,4)(3,6)(9,12)(11,14) 12
(adcb) (1,2,4,8)(3,6,12,9)(5,10)(7,14,13,11) 6
(abcd) (1,8,4,2)(3,9,12,6)(5,10)(7,11,13,14) 6
(ab)(cd) (1,2)(4,8)(5,10)(6,9)(7,11)(13,14) 10
(ad)(bc) (1,8)(2,4)(3,12)(5,10)(7,14)(11,13) 10
(ac)(bd) (1,4)(2,8)(3,12)(6,9)(7,13)(11,14) 10

Em um sentido, grupos agrupam milhares, milhões de milhões de coisas que parecem


famílias diferentes, mas, que podem ter o mesmo comportamento e correspondência
(isomorfismo). Assim, famílias "complicadas" podem ser compreendidas através da
análise de famílias mais simples.

Teoremas de Sylow

Seja G um grupo finito. Seja p um número primo que divide a ordem de G.


Escreva |G| = pk, com k >= 1 e p ł m (p não divide m).

Primeiro Teorema de Sylow: Existe um subgrupo H ⊆ G de ordem pk. H é chamado de


subgrupo p de Sylow.

Segundo Teorema de Sylow: Quaisquer dois sugrupos p de Sylow são conjugados: Se H


e K são subgrupos p de Sylow, existe um elemento g ϵ G tal que g–1 op H op g = K.

Terceiro Teorema de Sylow: Seja np a quantidade de subgrupos p de Sylow. Então


 np | m (np divide m)
 np ≅ 1 (mod p)
 np = |G| / |NG(H)|, onde H é um subgrupo p de Sylow qualquer e NG(H) denota
o normalizador de H (o maior subgrupo de G em que H é um subgrupo normal.

Os teoremas de Sylow são úteis na classificação de grupos simples finitos. O primeiro


teorema garante a existência de um subgrupo de Sylow em G para qualquer número
primo p que divide a ordem de G. Um subgrupo de Sylow é um subgrupo cuja ordem é
uma potência de p e cujo índice é primo com p (primos entre si).

O segundo teorema afirma que todos os subgrupos de Sylow de uma dada ordem são
conjugados.

O terceiro teorema dá informações sobre a quantidade de subgrupos de Sylow.

171
Exemplo. Identifique os subgrupos de Sylow em S4.

|S4| = 24 = 23 x 3. Os subgrupos 2 (p = 2) têm ordem 8.

Existe um exemplo natural de um subgrupo de ordem 8 em S4, chamado de grupo


diedral D4 : Rotulando os vértices de um quadrado com 1, 2, 3, 4, o grupo diedral é o
conjunto de simetrias desse quadrado. O conjunto é gerado por rotações de 90 graus,
que é um ciclo-4 e uma inversão (flip), que é uma transposição dupla. São 4 inversões e
4 rotações (com a identidade incluída).

O grupo diedral não é normal dentro de S4 - rotulando os vértices de maneiras


diferentes geram-se cópias diferentes. Por exemplo, uma cópia é gerada por (13)(24) e
(1234), mas, uma outra é gerada por (12)(34) e (1324), e uma terceira cópia é gerada
por (14)(23) e (1243). Todas estas são conjugadas, como previsto pelo segundo
teorema de Sylow. E n2 = 3 vai de encontro ao terceiro teorema: n2 ≅ (mod 2) e n2
divide 3.

Subgrupos Não Simples

Se a quantidade (np) de p subgrupos de Sylow é igual a 1 no grupo G, então esse único


subgrupo de Sylow é normal e, assim, G não é trivial. G não sendo trivial, o subgrupo
não é simples.

Um grupo que não é simples é o grupo A5, que é cheio de grupos não triviais que não
são normais. A5 é o grupo alternante de grau 5. Ele é o grupo de permutações pares.

Seja G o grupo S3. Considere o subgrupo H = {e, (12)}. Este grupo não é normal em S3.

172
Anéis

Um anel é um conjunto de elementos em que se pode adicionar (subtrair) e


multiplicar, mas, não há divisão e a multiplicação pode não ser comutativa.

Definição: Um conjunto não vazio R é um anel se esse conjunto possui duas operações
binárias fechadas, adição e multiplicação, que satisfaçam as seguintes condições:

1) a + b = b + a para a, b ϵ R. Comutativa.
2) (a + b) + c = a + (b + c), para a, b, c ϵ R. Associativa da adição.
3) Existe um elemento 0 em R tal que a + 0 = a para todo a ϵ R. Elemento Neutro.
4) Para todo a ϵ R, existe um elemento –a em R tal que a + (-a) = 0. Inverso aditivo.
5) (ab)c = a(bc), para a, b, c ϵ R. Associativa da multiplicação.
6) Para a, b, c ϵ R: a(b + c) = ab + ac e (a + b)c = ac + bc.

Esta última condição, o axioma distributivo, relaciona a operação de adição com a


operação de multiplicação. O conjunto Z é um anel.

Anel Comutativo

Se existe um elemento 1 ϵ R tal que 1 ≠ 0 e 1a = a1 = a para cada elemento a ϵ R,


dizemos que R é um anel com unidade ou identidade. Um anel no qual ab = ba para
todo a, b ϵ R, é chamado de anel comutativo.

Um anel comutativo é um conjunto que gostaria de ser um campo (ver), mas, falta a
ele inversos multiplicativos para alguns de seus elementos. No anel Z, só podemos
dividir por +1 ou por –1, mas, no campo Q, podemos dividir por qualquer elemento
não nulo. Z é um anel comutativo sob +.

Unidade em Anéis

Seja R um anel, a ϵ R é uma unidade se a x b = 1 e b x a = 1 para algum b ϵ R.

Unidades são elementos de um anel que formam um grupo sob a multiplicação. Todos
os elementos de um anel podem formar um grupo sob a adição, pois, todos têm um
inverso aditivo, mas, nem todos têm o inverso multiplicativo (só as unidades têm).

Zx = Grupo de Unidades = {1, –1}

173
Anel Divisão

Um anel divisão é um anel R com a identidade no qual todo elemento não nulo em R é
uma unidade, ou seja, para cada a ϵ R, com a ≠ 0, existe um único elemento a-1 tal que
a-1 . a = a . a-1 = 1. Um anel divisão comutativo define um campo.

Um anel comutativo R com a identidade é chamado de domínio integral se, para todo
a, b ϵ R, tal que ab = 0, a é zero ou b é zero.

De fato, Z é um domínio integral. Porém, Z não é um campo: não existe um inteiro que
seja o inverso multiplicativo de 2 (1/2 não é um inteiro!). Os únicos inteiros que têm
inverso multiplicativo são o +1 e o –1.

Sob as operações ordinárias de adição e multiplicação, todos os conjuntos numéricos


familiares são anéis: Z, Q, R e C. Os três últimos são campos também.

Em Cálculo, as funções de valores reais no intervalo [a, b] formam um anel comutativo.


Adicionamos ou multiplicamos duas funções adicionando ou multiplicando seus
valores. Se f(x) = x2 e g(x) = Cos(x), então [f+g](x) = f(x) + g(x) = x2 + Cos(x) e [fg](x) =
f(x) . g(x) = x2 . Cos(x).

Matrizes 2 x 2 com elementos de R formam um anel sob as operações usuais de


adição e multiplicação de matrizes.
Esse anel não é comutativo, pois, nem sempre AB = BA. Também, há o caso de AB = 0
quando nem A e nem B são nulos, o que implica que o anel não é um domínio integral
também.

Podemos definir o produto de dois elementos a e b em Zm por ab (mod m). Por


exemplo, 5 x 7 ≡ 11 (mod 12) em Z12 torna Z12 um anel (anel inteiro).
Certamente, Z12 é um anel comutativo. Entretanto, ele pode não ser um domínio
integral: se considerarmos 3 x 4 ≡ 0 (mod 12) em Z12, é fácil ver que o produto de dois
elementos não nulos no anel pode resultar em zero (para ser um domínio integral,
pelo menos um deles tem que ser zero).

Divisor Nulo

Um elemento não nulo a em um anel R é chamado de divisor nulo se existe um


elemento não nulo b em R tal que ab = 0.

174
Anéis em Congruências

Congruência entre valores é uma operação como outra qualquer que envolve adição e
multiplicação. Desse modo, pode-se definir conjuntos onde essa operação pode ser
aplicada e derivar daí propriedades.

Anéis Inteiros

O anel inteiro Zm consiste de:

 Conjunto Zm = {0, 1, 2, ..., m – 1}, que são as m classes de equivalência do


modulo m.
 Duas operações + e x para todo a, b ϵ Zm tal que:
a + b ≡ c mod m, c ϵ Zm
a x b ≡ d mod m, d ϵ Zm

Exemplo: Seja m = 9, isto é, estamos trabalhando com o anel Z9 = {0, 1, 2, 3, 4, 5, 6, 7,


8}. Temos então que:
6 + 8 = 14 ≡ 5 mod 9
6 x 8 = 48 ≡ 3 mod 9

As seguintes propriedades são importantes:

1) Podemos adicionar e multiplicar dois números e o resultado permanece no


anel. O anel é fechado sob estas operações.
2) Adição e multiplicação são associativas:
a + (b + c) = (a + b) + c
a x (b x c) = (a x b) x c
3) Existe um elemento neutro 0 na adição tal que a + 0 ≡ a mod m para toda a ϵ Zm
4) Para todo elemento a no anel, existe sempre o seu negativo –a, tal que a + (–a)
≡ 0 mod m, isto é, o inverso aditivo sempre existe.
5) Existe um elemento neutro 1 na multiplicação tal que a x 1 = a para todo a em
Zm.
6) O inverso multiplicativo existe apenas para alguns elementos, tal que a x a–1 ≡ 1
mod m para todo a ϵ Zm.
7) Se existe um inverso de a, então podemos fazer divisão por esse elemento, pois
b/a ≡ b x a–1 mod m.
8) Se MDC(a, m) = 1, então a tem um inverso multiplicativo.
9) A multiplicação é distributiva.

175
Subanéis

Da mesma maneira que temos subgrupos de grupos, temos uma classe análoga a
subestruturas para anéis.
Um subanel S de um anel R é um subconjunto S de R tal que S é também um anel sob
as operações herdadas de R. O anel nZ (os múltiplos do módulo n – classe de
equivalência [0]) é um subanel de Z.
Temos a seguinte cadeia de subanéis:

ℤ⊂ℚ⊂ℝ⊂ℂ

Proposição: Seja R um anel e S um subconjunto de R. Então S é um subanel de R se, e


somente se, as seguintes condições forem satisfeitas:
1) S ≠ 0.
2) r x s ϵ S para todo r, s ϵ S.
3) r – s ϵ S para todo r, s ϵ S.

Características de um Anel

Para qualquer inteiro n não negativo e qualquer elemento r em um anel R, escrevemos


r + r +...+ r (n vezes) como n x r.
A característica de um anel R é o menor inteiro positivo n tal que nr = 0, para todo
valor r ϵ R. Se tal inteiro não existe, então a característica de R é zero.

Lema: Seja R um anel com identidade. Se 1 tem ordem n, então a característica de R é


n.

Homomorfismo em Anéis

Similarmente a grupos, um homomorfismo entre anéis preserva as operações de


adição e multiplicação no anel. Mais especificamente, se R e S são anéis, então um
homomorfismo é um mapeamento φ : R → S que satisfaz as seguintes operações:

φ(a+b) = φ(a) + φ(b)

φ(ab) = φ(a) . φ(b)

para todo a, b ϵ R.
Se φ : R → S tem uma correspondência biunívoca cobrindo todo o conjunto S (a função
é injetora e sobrejetora), então temos um isomorfismo de anéis.

176
Ideal de um Anel

O ideal de um anel é uma classe de subanéis que correspondem àquela que chamamos
de subgrupos normais (ideais estão para anéis assim como subgrupos normais estão
para grupos). O ideal de um anel R é um subanel I de R tal que, se a está em I e r está
em R, então tanto ar quanto ra estão em I.

I é um ideal do anel R se I é um subgrupo de R (I ≤ R) para qualquer r ϵ R e x ϵ I tal


que(x x r) ϵ I e (r x x) ϵ I.

Todo anel R tem, pelo menos, dois ideais: {0} e o próprio R. Estes ideais são chamados
de ideais triviais.

Seja R um anel com identidade e suponha que I é um ideal em R tal que 1 está em I.
Como, para qualquer r ϵ R, r x 1 = r x I, pela definição de ideal, I = R.

Se a é um elemento qualquer em um anel comutativo R com identidade, então o


conjunto <a> = {a x r, com r ϵ R} é um ideal em R.

Se R é um anel comutativo com identidade, então um ideal da forma <a> = {a x r, com r


ϵ R} é chamado de ideal principal.
Teorema: Todo ideal no anel de inteiros Z é um ideal principal.

Proposição: O kernel de qualquer homomorfismo de anel φ : R → S é um ideal em R.

177
Anéis de Polinômios

Não é uma surpresa que os polinômios formam um anel, pois, dados dois polinômios
p(x) = x3 – 3x + 2 e q(x) = 3x2 – 6x + 5, temos que p(x) + q(x) = [p+q](x) = (x3 – 3x + 2) +
(3x2 – 6x + 5) = x3 – 9x + 7 e p(x). q(x) = [pq](x) = (x3 – 3x + 2) x (3x2 – 6x + 5) = 3x5 –
9x3 + 6x2 – 6x4 + 18x2 – 12x = 3x5 – 4x3 + 24x2 – 6x4 + 18x2 – 27x + 10.

Seja R um anel comutativo com a identidade. Qualquer expressão da forma:


𝑛

𝑓(𝑥) = ∑ 𝑎𝑖 𝑥𝑖 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + ⋯ + 𝑎𝑛 𝑥 𝑛
𝑖=0

Onde ai ϵ R e an ≠ 0, é chamado de um polinômio em R com a incógnita x.

Os elementos a0, a1, ..., an são chamados de coeficientes de f. O coeficiente an é


chamado de coeficiente principal.

Um polinômio é chamado de monômio se seu coeficiente principal é igual a 1. Se n é o


maior valor não negativo para o qual an ≠ 0, dizemos que o grau de f é n e escrevemos
deg f(x) = n. Se tal n não existe, ou seja, se f = 0, temos o polinômio nulo e o grau de f é
definido como –∞ (menos infinito).

O conjunto de todos os polinômios com coeficientes em um anel R é denotado por


R[x]. No exemplo inicial, temos dois polinômios em Z[x].

Dois polinômios são exatamente iguais quando os seus coeficientes correspondentes


são iguais. Para mostrar que o conjunto de todos os polinômios formam um anel,
devemos, antes, definir a adição e a multiplicação de polinômios.

Definimos a soma de dois polinômios assim:

Sejam p(x) = a0 + a1x + ... + anxn e q(x) = b0 + b1x + ... + bnxn


Então, a soma de p(x) e q(x) é: p(x) + q(x) = c0 + c1x + ... + cnxn

onde ci = ai + bi, para cada i.

Definimos o produto p(x) . q(x) como

𝑝(𝑥)𝑞(𝑥) = 𝑐0 + 𝑐1 𝑥 + ⋯ + 𝑐𝑚+𝑛 𝑥 𝑚+𝑛

178
Onde
𝑖

𝑐𝑖 = ∑ 𝑎𝑘 𝑏𝑖−𝑘 = 𝑎0 𝑏𝑖 + 𝑎1 𝑏𝑖−1 + ⋯ + 𝑎𝑖−1 𝑏1 + 𝑎𝑖 𝑏0


𝑘=0

para cada i.

Teorema: Seja R um anel comutativo com a identidade. Então R[x] é um anel


comutativo com a identidade.

Proposição: Sejam p(x) e q(x) polinômios em R[x], onde R é um domínio integral.


Então, deg p(x) + deg q(x) = deg (p(x) . q(x)). Além disso R[x] é um domínio integral.

Teorema da Divisão para Polinômios: Sejam f(x) e g(x) polinônios em F[x], onde F é
um campo e g(x) é um polinômio não nulo. Então, existem polinômios únicos q(x), r(x)
ϵ F[x], tal que f(x) = g(x)q(x) + r(x), onde deg r(x) < deg g(x), ou r(x) é o polinômio
nulo.

Seja p(x) um polinômio em F[x] e α ϵ F[x]. Dizemos que α é um zero ou raiz de p(x) se
p(x) estiver no kernel da função de homomorfismo φα. O que estamos dizendo aqui é
que α é uma raiz de p(x) se p(x) = 0.

Corolário: Seja F um campo. Um elemento α ϵ F é um zero de p(x) ϵ F se, e somente


se, x – α é um fator de p(x) em F[x].

Corolário: Seja F um campo. Um polinômio não nulo p(x) de grau n em F[x] pode ter,
no máximo, n zeros distintos em F.

Seja F um campo. Um monômio d(x) é o MDC dos polinômios p(x), q(x) ϵ F[x] se d(x)
divide p(x) e q(x) igualmente. Escrevemos: d(x) = MDC[p(x), q(x)].

Dois polinômios p(x) e q(x) são primos entre si, sem MDC[p(x), q(x)] = 1.

Proposição: Seja F um campo e suponha que d(x) é o MDC de p(x) e q(x) em F[x].
Então, existem r(x) e s(x), polinômios, tais que d(x) = r(x)p(x) + s(x)q(x). Além disso, o
MDC de dois polinômios é único.

179
Polinômios Irredutíveis

Um polinômio não constante f(x) ϵ F[x] é irredutível num campo F se f(x) não puder
ser colocado como produto de dois outros polinômios g(x) e h(x) em F[x], onde os
graus de g(x) e de h(x) são, ambos, menores do que o grau de f(x). Polinômios
irredutíveis funcionam como “números primos” de um anel de polinômios.

Exemplo 1 O polinômio x2 – 2 ϵ Q[x] é irredutível, pois, ele não pode mais ser fatorado
dentro do conjunto dos racionais. Similarmente, x2 + 1 é irredutível dentro do conjunto
dos números reais.

𝑟
Lema: Seja p(x) ϵ Q[x]. Então 𝑝(𝑥) = 𝑠 (𝑎0 + 𝑎1 𝑥 + ⋯ + 𝑎𝑛 𝑥 𝑛 ), onde r, s, a0, ..., an são
inteiros, os ai são primos entre si e r e s são primos entre si.

Exemplo 2: No campo dos racionais, use o algoritmo de Euclides para mostrar que os
polinômios f(x) = 2x3 – 2x2 – 3x + 1 e g(x) = 2x2 – x – 2 são primos entre si.

1 3
Dividindo f(x) por g(x), temos 𝑓(𝑥) = (𝑥 − 2) × 𝑔(𝑥) − 2 𝑥. No próximo passo,
podemos usar x em vez de 3x/2 e, então, dividindo g(x) por x nos dá o seguinte
resultado: g(x) = (2x – 1) x (x) – 2. O resto constante neste passo mostra que o
MDC[f(x), g(x)] = MDC[g(x), x) = 1.

Exemplo 3: No campo dos racionais, encontre o MDC de f(x) = x4 + x3 + 2x2 + x + 1 e


g(x) = x3 – 1 e o expresse como uma combinação linear dos polinômios dados.

Pela divisão de polinômios: f(x) = (x + 1) x g(x) + 2(x2 + x + 1), e o próximo passo


nos dá g(x) = (x – 1) x (x2 + x + 1). Então, MDC[f(x), g(x)] = (x2 + x + 1).

Exemplo 4: Expresse x4 + x como o produto de dois polinômios irredutíveis em Z5.

Em geral, x4 + x = x(x3 + 1) = x(x + 1)(x2 – x + 1). O fator p(x) = x2 – x + 1 é


irredutível em Z5 porque p(x) não tem raízes em Z5.
Temos p(0) = 1, p(1) =1, p(-1) = 3, p(2) = 3, p(-2) = 2.

Exemplo 5: Fatore x4 + 2 em Z3.

Se substituirmos 2 pelo seu congruente -1, temos que:


x4 + 2 = x4 – 1 = (x2 – 1)(x2 + 1) = (x – 1)( x + 1)( x2 + 1). Como x2 + 1 não tem raiz
em Z3, ele é irredutível em Z3. Usando as classes congruentes padrão de Z3,
temos a fatoração: x4 + 2 = (x + 1)( x + 2)( x2 + 1).

180
Estruturas em Rede (Lattice)

Os axiomas de um anel proveem as estruturas para as operações de adição e


multiplicação em um conjunto. Contudo, podemos construir estruturas algébricas
conhecidas como lattice e álgebra booleana para generalizar outros tipos de
operações, como, por exemplo, inclusão, união e intersecção.

Lattices – Conjuntos Parcialmente Ordenados

Uma relação em um conjunto S é um subconjunto de S x S. Uma relação parcial P de S


é chamada de um ordenamento parcial de S se ela satisfaz os seguintes axiomas:
1) A relação é reflexiva: (a, a) ϵ P para todo a ϵ S.
2) A relação é antisimétrica: se (a, b) ϵ P e (b, a) ϵ P, então a = b.
3) A relação é transitiva: se (a, b) ϵ P e (b, c) ϵ P, então (a, c) ϵ P.

Normalmente, escrevemos a ≼ b para significar (a, b) ϵ P, a menos que algum símbolo


é naturalmente associado com uma ordem parcial, tal como a ≤ b, com inteiros a e b,
ou A ⊆ B, para os conjuntos A e B.
Um conjunto X com uma ordem parcial ≼ é chamado de conjunto parcialmente
ordenado, ou poset.

Exemplo 1: Seja X qualquer conjunto. Definimos o conjunto potência de X como o


conjunto de todos os subconjuntos de X. Em qualquer conjunto potência de um
conjunto X, a operação de inclusão, ⊆, é uma ordem parcial.

Exemplo 2: Seja G um grupo. O conjunto de subgrupos de G é um poset, onde a ordem


parcial é a operação de inclusão.

181
Domínios Integrais

Um anel comutativo com identidade é chamado de domínio integral se o anel não


tiver divisores nulos. Em outras palavras, um domínio integral é um anel comutativo
que contém a unidade e não contem o divisor nulo.

Se um elemento a num anel R com identidade tem um inverso multiplicativo (a-1),


dizemos que a é uma unidade. Se todo elemento não nulo em um anel R é uma
unidade, então R é um anel divisão. Se esse R é, ainda, comutativo, R é um campo.

Proposição (Lei do Cancelamento): Seja D um anel comutativo com identidade. Então


D é um domínio integral se, e somente se, para todo elemento não nulo a ϵ D, com ab
= ac, temos b = c.

Teorema: A característica de um domínio integral é um número primo ou então é zero.

Teorema: Todo domínio integral finito é um campo.

182
Álgebra Booleana

Pela definição de um conjunto potência P(X), o maior elemento de P(X) é o próprio


conjunto X, e o menor elemento é φ ou {}.
Para qualquer conjunto A em P(X), sabemos que A ∩ X = A e A ∪ φ = A. Isto sugere a
seguinte definição:
Um elemento I em um poset X é o maior elemento de X se a ≼ I para todo a ϵ
X. Um elemento O é o menor elemento de X se O ≼ a para todo a ϵ X.

Seja A um subconjunto de P(X). Lembre-se que o complemento de A é A’ = X – A = {x |


x ϵ X e x ∉ A}. Sabemos que A ∪ A’ = X e A’ ∩ A = φ. Podemos generalizar isso para
lattices:

Um lattice L com um maior elemento I e um menor elemento O é


complementado se, para cada a ϵ X, existe um a’ tal que a ∨ a’ = I e a ∧ a’ = O.

Em um lattice L, as operações binárias ∨ e ∧ satisfazem as leis comutativa e


associativa. No entanto, estas operações não necessitam satisfazer a lei distributiva:

𝑎 ∧ (𝑏 ∨ 𝑐) = (𝑎 ∧ 𝑏) ∨ (𝑎 ∧ 𝑐)

Contudo, em P(X), a lei distributiva é satisfeita, pois

𝐴 ∩ (𝐵 ∪ 𝐶) = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)

Para A, B e C ϵ P(X).

Dizemos que o lattice L é distributivo se a seguinte lei distributiva valer:

𝑎 ∧ (𝑏 ∨ 𝑐) = (𝑎 ∧ 𝑏) ∨ (𝑎 ∧ 𝑐)

para todo a, b, c ϵ L.

Teorema: Um lattice L é distributivo se, e somente se, 𝑎 ∨ (𝑏 ∧ 𝑐) = (𝑎 ∨ 𝑏) ∧ (𝑎 ∨ 𝑐),


para todo a, b, c ϵ L.

Uma álgebra booleana é um lattice B com um maior elemento I e um menor elemento


O, tal que B é distributivo e complementado, simultaneamente. O conjunto potência
P(X) é nosso protótipo para a álgebra booleana.

183
Teorema: Um conjunto B é uma álgebra booleana se, e somente se, existem operações
binárias ∨ e ∧ em B satisfazendo as seguintes propriedades:
1) 𝑎 ∨ 𝑏 = 𝑏 ∨ 𝑎 e 𝑎 ∧ 𝑏 = 𝑏 ∧ 𝑎, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑎, 𝑏 ∈ 𝐵.
2) 𝑎 ∨ (𝑏 ∨ 𝑐) = (𝑎 ∨ 𝑏) ∨ 𝑐 e 𝑎 ∧ (𝑏 ∧ 𝑐) = (𝑎 ∧ 𝑏) ∧ 𝑐, 𝑝𝑎𝑟𝑎 𝑎, 𝑏, 𝑐 ∈ 𝐵.
3) 𝑎 ∧ (𝑏 ∨ 𝑐) = (𝑎 ∧ 𝑏) ∨ (𝑎 ∧ 𝑐) e 𝑎 ∨ (𝑏 ∧ 𝑐) = (𝑎 ∨ 𝑏) ∧ (𝑎 ∨
𝑐), 𝑝𝑎𝑟𝑎 𝑎, 𝑏, 𝑐 ∈ 𝐵.
4) Existem elementos I e O tal que 𝑎 ∨ 𝑂 = 𝑎 e 𝑎 ∧ 𝐼 = 𝑎, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑎 ∈ 𝐵.
5) Para todo a ϵ B existe um a’ ϵ B tal que a ∨ a’ = I e a ∧ a’ = O.

Teorema: Seja B uma álgebra booleana. Então:


1) 𝑎 ∨ 𝐼 = 𝐼, 𝑎 ∧ 𝑂 = 𝑂 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑎 ∈ 𝐵.
2) 𝑆𝑒 𝑎 ∨ 𝑏 = 𝑎 ∨ 𝑐 𝑒 𝑎 ∧ 𝑏 = 𝑎 ∧ 𝑐, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑎, 𝑏, 𝑐 ∈ 𝐵, 𝑒𝑛𝑡ã𝑜 𝑏 = 𝑐
3) 𝑆𝑒 𝑎 ∨ 𝑏 = 𝐼 𝑒 𝑎 ∧ 𝑏 = 𝑂, 𝑒𝑛𝑡ã𝑜 𝑏 = 𝑎′
4) (𝑎′ )′ = 𝑎, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑎 ∈ 𝐵
5) 𝐼 ′ = 𝑂 𝑒 𝑂′ = 𝐼
6) (𝑎 ∨ 𝑏)′ = 𝑎′ ∧ 𝑏 ′ 𝑒 (𝑎 ∧ 𝑏)′ = 𝑎′ ∨ 𝑏 ′ (𝐷𝑒 𝑀𝑜𝑟𝑔𝑎𝑛)

Álgebras Booleanas Finitas

Uma álgebra booleana é finita se ela contém um número finito de elementos como um
conjunto.

Teorema: Seja B uma álgebra booleana finita. Então, existe um conjunto X tal que B é
isomórfico com P(X) [o conjunto potência de X].

Corolário: A ordem de qualquer álgebra booleana finita deve ser igual a 2n, para algum
inteiro positivo n.

O design de chips de computadores pode ser expresso em termos de álgebra


booleana. Toda expressão booleana representa um circuito de comutação.

Teorema: O conjunto de todos os circuitos é uma álgebra booleana.

184
Espaços Vetoriais – Parte 2

Definição: Um espaço vetorial V sobre um campo F é um grupo abeliano com um


produto escalar α.v ou αv, definido por todo α ϵ F e todo v ϵ V, satisfazendo os
seguintes axiomas:
1) α(βv) = (αβ)v
2) (α + β)v = αv + βv
3) α(u + v) = αu + βv
4) 1v = v

Onde α, β ϵ F e u, v ϵ V.

Os elementos de V são chamados de vetores. Os elementos de F são chamados de


escalares. Tem-se um grupo de vetores e um campo de escalares no espaço de
vetores. Se em vez de um campo de escalares tivermos um anel de escalares, o espaço
de vetores é chamado de módulo. Um módulo é uma generalização do espaço de
vetores.

A multiplicação de um escalar por um vetor é sempre possível, mas, a multiplicação de


um vetor por outro vetor nem sempre é possível.

As n-uplas de número reais, denotadas por Rn, formam um espaço de vetores sobre R.

Se F é um campo vetorial, então F[x] é um espaço vetorial sobre F. Os vetores em F[x]


são, simplesmente, polinômios e adição vetorial é a adição de polinômios. Se α ϵ F e
p(x) ϵ F[x], então a multiplicação por escalar é definida por α x p(x).

O conjunto de todas as funções reais contínuas em um intervalo fechado [a, b] é um


espaço de vetores sobre R.

Se f(x) e g(x) são contínuas em [a, b], então [f + g](x) é definida como f(x) + g(x). A
multiplicação escalar é definida como [αf](x) = αf(x), para todo α ϵ R.

Proposição: Seja V um espaço vetorial sobre F. Então, cada uma das seguintes
afirmações são verdadeiras:
1) 0v = 0 para todo v ϵ V.
2) α0 = 0 para todo α ϵ F.
3) Se αv = 0, então α = 0 ou 𝑣 = ⃗0
4) (–1)v = –v, para todo v ϵ V.
5) –(αv) = (–α)v = α(–v), para todo α ϵ F e v ϵ V.

185
Subespaços

Da mesma maneira que grupos têm subgrupos e anéis têm subanéis, o espaço de
vetores possui subestruturas.

Seja V um espaço vetorial sobre um campo F e seja W um subconjunto de V. Então W é


um subespaço de V se W é fechado sob as operações de adição de vetores e
multiplicação por escalar.

Seja V um espaço vetorial qualquer sobre um campo F e suponha que v1, v2, ..., vn são
vetores em V e α1, α2, ..., αn são escalares em F. Qualquer vetor w em V da forma
abaixo é chamado de combinação linear dos vetores v1, v2, ..., vn.

𝑤 = ∑ 𝛼𝑖 𝑣𝑖 = 𝛼1 𝑣1 + 𝛼2 𝑣2 + ⋯ + 𝛼𝑛 𝑣𝑛
𝑖=1

O conjunto cobertura (spanning set) de vetores v1, v2, ..., vn é o conjunto de vetores
obtido de todas as possíveis combinações lineares de v1, v2, ..., vn. Se W é o conjunto
cobertura de v1, v2, ..., vn, então dizemos que W é coberto por v1, v2, ..., vn.

Proposição: Seja S = { v1, v2, ..., vn} vetores num espaço vetoria V. Então a cobertura de
S é um subespaço de V.

Independência Linear

Seja S = { v1, v2, ..., vn} um conjunto de vetores num espaço vetorial V. Se existem
escalares α1, α2, ..., αn ϵ F tal que nem todos αi são nulos e α1v1 + α2v2 + ... + αnvn = 0,
então diz-se que S é linearmente dependente.

Se S não é linearmente dependente, então ele é dito linearmente independente. Mais


especificamente, S é linearmente independente se α1v1 + α2v2 + ... + αnvn = 0 implicar
que α1 = α2 = ... = αn = 0, para qualquer conjunto de escalares { α1, α2, ..., αn}.

Proposição: Seja {v1, v2, ..., vn} um conjunto de vetores linearmente independentes em
um espaço vetorial. Suponha que v = α1v1 + α2v2 + ... + αnvn = β1v1 + β2v2 + ... + βnvn
então α1 = β1, α2 = β2, ..., αn = βn.

Proposição: Um conjunto {v1, v2, ..., vn} de vetores em um espaço vetorial V é


linearmente dependente se, e somente se, algum dos vi é uma combinação linear dos
demais.

186
Proposição: Suponha que um espaço vetorial V é coberto por n vetores. Se m > n,
então, qualquer conjunto de m vetores em V deve ser linearmente dependente.

Um conjunto {e1, e2, ..., en} de vetores no espaço vetorial V é chamado de base de V se
{e1, e2, ..., en} é um conjunto linearmente independente que cobre V.

Exemplo: Os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1) formam uma base para
R3. Esse conjunto, certamente, cobre R3, pois, qualquer vetor arbitrário (x1, x2, x3) em
R3 pode ser escrito como x1e1 + x2e2 + x3e3. Também, nenhum e1, e2, e3 pode ser
escrito como uma combinação linear dos outros dois. Assim, eles são linearmente
independentes.

Um espaço vetorial pode ter várias bases.

Proposição: Sejam {e1, e2, ..., em} e {f1, f2, ..., fn} duas bases para um espaço vetorial V.
Então m = n.

Teorema: Se V é um espaço de vetores de dimensão n, então:

1) Se S = {v1, v2, ..., vn} é um conjunto linearmente independente de vetores em V,


então S é uma base para V.
2) Se S = {v1, v2, ..., vn} cobre V, então S é uma base para V.
3) Se S = {v1, v2, ..., vk} é um conjunto de vetores linearmente independentes em
V, com k < n, então existem os vetores vk+1, ..., vk+n tal que {v1, ..., vk, vk+1, ..., vn}
é uma base para V.

187
Campos

Um campo é um conjunto em que as operações de adição, subtração, multiplicação e


divisão são definidas e se comportam da mesma maneira a quando são aplicadas nos
números racionais e nos números reais, que são os campos mais conhecidos. Um
campo é um grupo que é fechado nas quatro operações. Z não é um campo, pois,
alguns inversos multiplicativos caem para fora de Z. Q é um campo. Z/5Z é um campo.
Z/6Z não é um campo. R e C são campos.

Todo campo é um anel. Todo anel é um grupo. Nem todo anel é um campo. Nem todo
grupo é um anel.

Definição: Um campo é um conjunto F com duas operações, + e x, onde:


 <F, +> é um grupo comutativo.
 <F, x> é um grupo comutativo.
 a x (b + c) = a x b + a x c.
 (b + c) x a = b x a + c x a.

O relacionamento entre dois campos é dado pelo conceito de extensão de campo ou


campos estendidos.

Será que existem campos dentro de campos? Mais especificamente, dado um campo F
e um polinômio p(x) em F[x], podemos questionar se podemos encontrar um campo E
contendo F tal que p(x) possa ser fatorado em fatores lineares em E[x].

Por exemplo, se considerarmos o polinômio p(x) = x4 – 5x2 + 6 em Q[x], então p(x)


pode ser fatorado em (x2 – 2)(x2 – 3). Contudo, estes dois fatores são irredutíveis para
dentro de Q[x]. Se quisermos achar um zero para p(x), devemos considerar um campo
mais amplo. Certamente, o campo real serve (onde se acrescentam os racionais e os
irracionais), pois, 𝑝(𝑥) = (𝑥 − √2)(𝑥 + √2)(𝑥 − √3)(𝑥 + √3).

É possível encontrar um campo menor em que p(x) tenha um zero (raiz) como, por
exemplo, 𝑄(√2) = {𝑎 + 𝑏√2, 𝑎, 𝑏 ∈ ℚ}.

188
Campos Estendidos

Um campo E é um campo estendido de um campo F se F é um subcampo de E. O


campo F é chamado de campo base. Escrevemos F ⊂ E.

Por exemplo, seja 𝐹 = 𝑄(√2) = {𝑎 + 𝑏√2, 𝑐𝑜𝑚 𝑎, 𝑏 ∈ ℚ} e seja 𝐸 = 𝑄(√2 + √3) o


menor campo contendo tanto Q quanto √2 + √3. Tanto E quanto F são campos
estendidos dos números racionais.
Para ver isso, precisamos apenas mostrar que √2 está em E. Como √2 + √3 está em
1
E, então = √3 − √2 deve estar em E também. Tomando a combinação linear
√2+√3
entre √2 + √3 e √3 − √2, concluímos que √2 e √3 estão, ambos, em E.

Teorema Fundamental dos Campos (TFC – Kronecker)

Seja F um campo e p(x) um polinômio não constante em F [x]. Então, existe um campo
estendido E de F e um elemento α ϵ E tal que p(α) = 0.

Elementos Algébricos

Um elemento α de um campo estendido E de F é algébrico em F se f(α) = 0 para algum


polinômio não nulo f(x) ϵ F [x]. Um elemento em E que não é algébrico em F é
chamado de transcendental em F.

Um campo estendido E de um campo é uma extensão algébrica de F se cada elemento


de E é algébrico em F. Se E é um campo estendido de F e α1, α2, ..., αn estão contidos
em E, denotamos o menor campo contendo F e alfa1 por F (α1, α2, ..., αn). Se E = F(α)
para algum α ϵ E, então E é uma extensão simples de F.

Exemplo:

Tanto √2 quanto i são algébricos em Q, pois, eles são raízes de x2 – 2 e x2 + 1,


respectivamente. Claramente, π e e são algébricos em R, contudo, não é um fato
trivial que eles são transcendentes em Q. Números em R que são algébricos em Q são
bastante raros. Quase todos os reais são transcendentais em Q. Não se sabe se π + e é
algébrico ou transcendental.

Um número complexo que é algébrico em Q é um número algébrico. Um número


transcendental é um elemento de C que é transcendental em Q.

189
Teorema: Seja E um campo estendido de F e α ϵ E. Então α é transcendental em F se,
e somente se, F(α) é isomórfico com F(x), o campo de frações de F[x].

Teorema: Seja E um campo estendido de F e α ϵ E com α algébrico em F. Então, existe


um monômio único irredutível p(x) ϵ F [x] de grau mínimo tal que p(α) = 0. Se f(x) é
outro polinômio em F [x] tal que f(α) = 0, então p(x) divide f(x).

Seja E um campo estendido de F e α ϵ E com α algébrico em F. O monômio único p(x)


do teorema anterior é chamado de polinômio mínimo para α em F. O grau de p(x) é o
grau de α em F.

Proposição: Seja E uma extensão de F e α ϵ E um número algébrico em F. Então


𝐹[𝑥]
𝐹(𝛼) ≅
< 𝑝(𝑥) >

onde p(x) é o polinômio mínimo de α em F.

Teorema: Seja E = F(α) uma extensão simples de F, onde α ϵ E é algébrico em F.


Suponha que o grau de α em F seja n. Então, cada elemento β E E pode ser expresso
unicamente da forma β = b0 + b1α + ... + bn-1αn-1 para bi ϵ F.

Definição: Se um campo estendido E de um campo F é um espaço vetorial finito em F


com dimensão n, então dizemos que E é uma extensão finita de grau n em F. Escreve-
se [E : F] = n, para indicar a dimensão de E em F. Lê-se “dimensão de uma
mapeamento de E sobre F”.

Teorema: Cada campo de extensão finita E de um campo F é uma extensão algébrica.

Teorema: Se E é um campo de extensão finita de F e K é uma extensão finita de E,


então K é uma extensão finita de F e [K : F] = [K : E][E : F].

Teorema: Seja E uma extensão de F. Então, as seguintes afirmações são equivalentes:


1) E é uma extensão finita de F.
2) Existe um número finito de elementos algébricos α1, α2, ..., αn ϵ E tal que E =
F(α1, α2, ..., αn).
3) Existe uma sequência de campos 𝐸 = 𝐹(𝛼1 , … , 𝛼𝑛 ) ⊃ 𝐹(𝛼1 , … , 𝛼𝑛−1 ) ⊃ ⋯ ⊃
𝐹(𝛼1 ) ⊃ 𝐹, onde cada campo F(α1, α2, ..., αi) é algébrico em F(α1, α2, ..., αi-1).

190
Fechamento Algébrico

Teorema: Seja E uma extensão do campo F. O conjunto de elementos em E que são


raízes algébricas em F formam um campo.

Este teorema responde à seguinte questão: Dado um campo F, podemos encontrar um


campo E em F tal que qualquer polinômio p(x) tem uma raiz em E?

Corolário: O conjunto de todos os números algébricos formam um campo, ou seja, o


conjunto de todos os números complexos que são algébricos em Q formam um
campo.

Definição: Seja E um campo que estende o campo F. Definimos o fechamento


algébrico de um campo F em E como sendo o campo que consiste de todos os
elementos de E que são algébricos em F. Um campo F é algebricamente fechado se
todo polinômio não constante em F[x] tem uma raiz em F.

Teorema: Um campo F é algebricamente fechado se, e somente se, todo polinômio


não constante em F[x] pode ser fatorado em fatores lineares sobre F[x].

Corolário: Um campo algebricamente fechado F não possui uma extensão algébrica


própria E.

Teorema: Todo campo F tem um único fechamento algébrico.

Teorema Fundamental da Álgebra (Gauss)

O campo dos números complexos é algebricamente fechado, ou seja, todo polinômio


em C[x] tem uma raiz em C).

Campos de Separação (Splitting Fields)

Seja F um campo e p(x) = a0 + a1x + ... + anxn um polinômio não constante em F[x].
Uma extensão E de F é um campo de separação de p(x) se existem elementos α1, α2,
..., αn em E tal que E = F(α1, α2, ..., αn) e p(x) = (x – α1)(x – α2) ... (x – αn).

Um polinômio p(x) ϵ F[x] é separado em E se ele for produto de fatores lineares de


E[x].

Um campo de separação em F é uma extensão de F que contém todas as raízes de


p(x).

191
Campos Finitos

Campos finitos aparecem em muitas aplicações da álgebra, incluindo a teoria da


codificação e criptografia. Campos finitos são chamados, também, de Campos de
Galois.

Lembremos que um campo F tem característica p se p é o menor inteiro positivo tal


que, para cada elemento não nulo α em F, temos pα = 0. Se tal inteiro não existe,
então F tem característica 0.

Proposição: Se F é um campo finito, então a característica de F é p, onde p é primo.

Proposição: Se F é um campo finito de característica p (primo), então a ordem de p é


pn, para algum n ϵ N.

Lema (Sonho de Calouro): Seja p primo e D um domínio integral de característica p.


𝑛 𝑛 𝑛
Então, 𝑎𝑝 + 𝑏 𝑝 = (𝑎 + 𝑏)𝑝 para todo inteiro positivo n.

Lema: Seja F um campo e f(x) ϵ F[x]. Então, f(x) é separável se, e somente se, f(x) e
sua derivada f’(x) forem primos entre si.

192
Teoria de Galois

Um problema clássico da álgebra é aquele que tenta encontrar soluções (raízes) de


polinômios. As soluções gerais para polinômios até o 4º grau já são conhecidas, mas,
até agora, não se conseguiu uma solução geral para um polinômio da forma

𝑎𝑥 5 + 𝑏𝑥 4 + 𝑐𝑥 3 + 𝑑𝑥 2 + 𝑒𝑥 + 𝑓 = 0

apesar de se conhecer soluções particulares, como para x5 – 1 = 0 ou x6 – x3 – 6 = 0.

No início do século 19, Ruffini e Abel encontraram ‘quinticos’ que não podiam ser
resolvidos por fórmula alguma. No entanto, foi Evariste Galois (1811 – 1832 – sim,
morreu antes de completar 21 anos de idade!) que conseguiu provar que tipos de
polinômios podiam ser resolvidos por fórmulas e que tipos não podiam. Galois
descobriu que há uma forte conexão entre grupos e campos estendidos.

Usando a teoria de Galois, alguns problemas da teoria de campos podem ser reduzidos
a problemas da teoria de grupos que, em certo sentido, é mais simples e mais
compreensível do que a teoria de campos.

Galois usou permutações de grupos para descrever como as várias raízes de uma
equação polinomial são relacionadas entre si. O argumento da teoria de Galois se
deveu à seguinte questão, cuja resposta é conhecida como Teorema de Abel-Ruffini:

Por que não existe uma fórmula para calcular as raízes de equações polinomiais
de grau 5 (ou superior) em termos dos coeficientes dos polinômios usando
apenas as operações algébricas comuns (+, -, x, ÷) mais a aplicação de radicais?

A teoria de Galois não só pode responder esta questão, mas, também, explica, com
detalhes, o porquê de ser possível resolver equações de grau 4, ou menores, da
maneira descrita acima e porque as soluções são daquela forma. Mostra, também,
como casos específicos de equações de grau 5 ou maior podem ser resolvidas daquela
maneira. A teoria também mostra o porquê da impossibilidade de se triseccionar um
ângulo ou desenhar certos polígonos regulares usando-se apenas um compasso e uma
régua.

193
Automorfismo de Campos

Proposição: O conjunto de automorfismos de um campo F é um grupo sob a


composição de funções.

Proposição: Seja E um campo extensivo de F. Então, o conjunto de todas os


automorfismos de E que ajusta F, elemento a elemento, é um grupo, ou seja, o
conjunto de todos os automorfismos σ : E → E, tal que σ(α) = α para todo x ϵ F é um
grupo.

Seja E um campo extensivo de F. Denotaremos o grupo completo de automorfismos


de E por Aut(E). Definimos o Grupo de Galois de E em F como sendo o grupo de
automorfismos de E que ajustam F, elemento a elemento:

𝐺(𝐸|𝐹) = {𝜎 ∈ 𝐴𝑢𝑡(𝐸) ∶ 𝜎(𝑥) = 𝛼, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝛼 ∈ 𝐹}

Se f(x) é um polinômio em F[x] e E é o campo de separação de f(x) em F, então,


definimos o grupo de Galois de f(x) como G(E | F). Lê-se “grupo de Galois de E sobre
F”.

Proposição: Seja E uma extensão de F e f(x) é um polinômio em F[x]. Então, qualquer


automorfismo em G(E | F) define uma permutação das raízes de f(x) que estão em E.

Seja E uma extensão algébrica de um campo F. Dois elementos α, β ϵ E são


conjugados em F se eles têm o mesmo polinômio mínimo.
Por exemplo, no campo 𝑄(√2), os elementos √2 e −√2 são conjugados em Q, pois,
ambos são raízes do polinômio irredutível x2 – 2.

Proposição: Se α e β são conjugados em F, então existe um isomorfismo σ : F(α) →


F(β) tal que σ é a identidade quando restrito a F.

Teorema: Seja f(x) um polinômio em F[x] e suponha que E é o grupo de separação


para f(x) em F. Se f(x) não tiver raízes repetidas, então | G(E | F)| = [E : F].

Corolário: Seja F um campo finito com uma extensão finita E tal que [E : F] = k. Então
G(E | F) é cíclico de ordem k.

194
Seja E um campo de separabilidade de um polinômio f(x) ϵ F[x]. Suponha que f(x) se
fatores em E como:
𝑟

𝑓(𝑥) = (𝑥 − 𝛼1 )𝑛1 (𝑥 − 𝛼2 )𝑛2 … (𝑥 − 𝛼𝑟 )𝑛𝑟 = ∏(𝑥 − 𝛼𝑖 )𝑛𝑖


𝑖=1

Definimos a multiplicidade de uma raiz αi de f(x) como sendo ni.

Proposição: Seja f(x) um polinômio irredutível em F. Se a característica de F é zero,


então f(x) é separável. Se a característica de F é p e f(x) ≠ g(xp), para algum g(x) ϵ F[x],
então f(x) é separável também.

Teorema do Elemento Primitivo: Seja E uma extensão finita separável de um campo F.


Então, existe um α ϵ E tal que E = F (α).

O elemento primitivo é α.

Teorema Fundamental da Teoria de Galois

Este teorema explica a conexão que existe entre os subgrupos G(E | F) e os campos
intermediários E e F.

Proposição: Seja {σi | i ϵ I} uma coleção de automorfismos de um campo F. Então, F{σi}


= {a ϵ F tal que σi(a) = a para todo σi} é um subcampo de F.

Corolário: Seja F um campo e G um subgrupo de Aut(F). Então FG = {α ϵ F tal que σ(α)


= α para todo σ ϵ G} é um subcampo de F.

O subcampo F{σi} de F é chamado de campo fixo de {σi}. O campo fixo de um subgrupo


G de Aut(F) é denotado por FG.

Exemplo: Seja 𝜎 ∶ 𝑄(√3, √5) → 𝑄(√3, √5) um automorfismo que mapeia √3 a −√3.
Então, 𝑄(√5) é um subcampo de 𝑄(√3, √5) fixado à esquerda de σ.

Proposição: Seja E um campo de separação sobre F de um polinômio separável. Então,

𝐸𝐺(𝐸|𝐹) = 𝐹

195
Lema: Seja G um grupo finito de automorfismos de E e seja F = EG. Então [E : F] ≤ |G|.

Seja E uma extensão algébrica de F. Se todo polinômio irredutível em F[x] com uma
raiz em E tem todas as suas raízes em E, então E é chamado de extensão normal de F.
Isto é, todo polinômio irredutível em F[x] contendo uma raiz em E é o produto dos
fatores em E[x].

Teorema: Seja E um campo de extensão de F. Então, as seguintes afirmações são


equivalentes:
1) E é uma extensão de F, separável, finita e normal.
2) E é um campo de separação de F de um polinômio separável.
3) F = EG para algum grupo finito G de automorfismos de E.

Corolário: Seja K um campo de extensão de F tal que F = KG, para algum grupo finito
de automorfismos G de K, então, G = G(K | F).

Teorema Fundamental de Galois

Seja F um campo finito ou um campo com característica zero. Se E é uma extensão


normal finita de F, com grupo de Galois G(E | F), então, as seguintes afirmações são
verdadeiras:
1) O mapeamento K → G(E | K) é uma bijeção do subcampo K de E contendo F
com os subgrupos de G(E | F).
2) Se 𝐹 ⊂ 𝐾 ⊂ 𝐸, então [E : K] = |G(E | K)| e [K : F] = [G(E | F) : G(E | K)]
3) 𝐹 ⊂ 𝐾 ⊂ 𝐿 ⊂ 𝐸 se, e somente se, {𝑖𝑑} ⊂ 𝐺(𝐸|𝐿) ⊂ 𝐺(𝐸|𝐾) ⊂ (𝐸|𝐹)
4) K é uma extensão normal de F se, e somente se, G(E |K) é um subgrupo normal
de G(E | F). Neste caso, G(K| F) ≅ G(E | F) | G(E |K).

Em 3, {id} representa o mapeamento de um conjunto em si mesmo, ou seja, a


função identidade.

Teorema: Seja f(x) em F[x], onde a característica de F = 0. Se f(x) é solucionável via


radicais, então o grupo de Galois de f(x) em F tem solução.

Um polinômio f(x) é solucionável via radicais em F se o campo separador K de f(x)


em F estiver contido em uma extensão de radicais de F.

Um campo de extensão E de um campo F é uma extensão de radicais se existe uma


cadeia de subcampos 𝐹 = 𝐹0 ⊆ 𝐹1 ⊆ ⋯ ⊆ 𝐹𝑟 = 𝐸, em que, para i = 1, 2, ..., r,
𝑛
tivermos Fi = Fi-1(αi) e 𝛼𝑖 𝑖 ∈ 𝐹𝑖−1 para algum inteiro positivo ni.

196
A figura a seguir mostra relação entre anéis, domínios integrais e campos.

Resumo – Grupos, Campos, Anéis, Domínios Integrais

Grupo
Um grupo tem uma única operação binária op (pode ser + ou x, mas,
não ambas). A operação op não precisa ser comutativa. Um grupo
possui o elemento identidade e inversos de todos os elementos, além
das propriedades de fechamento (a op b = c, então c está em G) e
associativa.

Campo
Um campo tem duas operações binárias op, ambas comutativas.

Grupos modelam simetrias; campos são modelados por sistemas de números.

197
Anel
Um anel é um grupo que ganha uma segunda operação. Ele deixa de ser
chamado de grupo e passa a ser chamado de anel.
Por exemplo (G,+,x) é um anel. Removendo-se ‘x’, o anel vira um grupo
(G, +), com a identidade sendo o zero. É um grupo sempre comutativo.
Os inversos são os negativos. Removendo-se o ‘+’ não vira um grupo,
pois, apesar de ter a identidade 1, alguns elementos, como o 0, não têm
inversos.

Anel Comutativo

Um anel comutativo é um campo em que todos os elementos não nulos


têm inversos multiplicativos. Neste caso, se removermos o + e o
elemento zero, teremos um grupo (G, x) comutativo.

Anel Divisão

Um anel divisão é um anel (não necessariamente comutativo) em que


todos os elementos não nulos têm inversos multiplicativos. Se
removermos o + e o 0, teremos um grupo (G, x) não necessariamente
comutativo.

Domínio Integral

É um anel comutativo com o elemento identidade e sem divisores nulos.


É um anel comutativo não nulo em que o produto de dois elementos
não nulos é não nulo.
Em um domínio integral, todo elemento não nulo a tem a propriedade
do cancelamento, ou seja, se a ≠ 0, uma igualdade ab = ac implica b = c.

Usar a tabela para melhorar as definições acima

198
Grupo

Um conjunto é um grupo em relação a uma operação se:


 A operação é associativa. Por exemplo: A+(B+C) = (A+B)+C. (1a)
 Existe o elemento identidade: a operação de um elemento A do conjunto
com o elemento identidade resulta no próprio elemento A. (1b)
 Todo elemento do conjunto tem seu elemento oposto (quando o elemento é
operado com seu oposto, resulta no elemento identidade). (1c)

 Exemplos:
Dado um elemento de N, não existe um oposto dele (dado x, o oposto de x é
1/x na multiplicação e –x na adição, por exemplo. Mas, nem 1/x e nem –x
pertencem a N). Por isso N não é um grupo, apesar das regras 1a e 1b serem
satisfeitas. O elemento identidade na adição é o zero.
Z é um grupo, na adição, porque inclui N e os opostos de Z. Em relação à
multiplicação, Z não é um grupo, pois, só 1 e –1 têm opostos.

Grupo Abeliano

Um grupo é abeliano se a operação é comutativa, ou seja, se A op B = B op A. O


conjunto Z é um grupo abeliano em relação à adição, pois, além de ser um grupo,
temos que, por exemplo, 5+3 = 3+5 = 8. Também -2 + 7 = 5 = 7 – 2.

Anel

Um Grupo Abeliano é um Anel se uma segunda operação for associativa e


distributiva em relação à primeira operação.
Por exemplo, a multiplicação é distributiva em relação à adição, pois a seguinte
relação é válida: A × (B + C) = (A × B) + (A × C).
Se a segunda operação ainda for comutativa, temos um anel comutativo. Z é um
anel comutativo.

Domínio Integral

Se A × B = 0, com A ≠ 0 e B ≠ 0, A é divisor de zero. Se um conjunto não tem um


divisor de zero, ele é um domínio integral.

Campo

Se os elementos de um anel, exceto o zero, formam um grupo abeliano, então ele é


um campo ou corpo.

199
Vamos testar o conjunto Z6 = { [1], [2], [3], [4], [5], [0] } em relação à operação de
multiplicação:

1a – Associativa: [2] × ([3] × [4]) = ([2] × [3]) × [4]


1b – Elemento Identidade: [5] × [1] = [5]
1c – Elemento Oposto: Não existe A tal que [2] × [A] = [1], pois todos os números
que são divisíveis por 6 que deixam resto 1 são impares, e qualquer 2n é par. Então
Z6 não é um grupo.

Anel Ordenado e Campo Ordenado

Um anel é ordenado se o resultado da soma ou da multiplicação de dois elementos


de um subconjunto do anel continua pertencendo ao subconjunto do anel.
O subconjunto R- (só os negativos de R) não é um subconjunto válido, pois –a × –a
não pertence a R-, apesar de –a + –a cumprir o requisito.

Campo Completamente Ordenado

Um campo é completamente ordenado se todo subconjunto não-vazio dele que


possui um limitante superior possui, também, um supremo (o supremo é aquele
limite acima do qual começa a haver sobra, desperdício, ou sai-se do conjunto).
O conjunto Q não é completo.

Campo Algebricamente Fechado

Um campo algebricamente fechado é aquele em que toda expressão algébrica


resulta em zero (pertence ao próprio campo), como numa equação em que o termo
direito é zero.
Um campo algebricamente fechado é aquele em que todo polinômio pode ser
fatorado – colocado na forma de uma expressão cujo efetuação resulta no
polinômio – em fatores lineares (sem xn, com n > 1), ou seja, na forma ax + b.

Por exemplo, x2 + x – 6 pode ser fatorado em (x + 3)(x – 2).

O polinômio x2 +1 não pode ser fatorado no campo R, mas o pode ser no campo C:

x2 + 1 = (x – i)(x + i) = x2 + ix – ix – i2 ==> x2 – i2 = x2 – 1, pois, i2 = – 1.

200
Aplicações da Teoria de Grupos

Criptografia

(Refira-se ao livro O QUE É CRIPTOGRAFIA)

Os sistemas modernos de criptografia são altamente dependentes da álgebra


abstrata e da teoria dos números.
A função a seguir reflete o sistema de codificação de Júlio César:

f(p) = p + 3 (mod 26)

(a cifra equivale à letra número ‘p’ do alfabeto latino deslocada [matematicamente]


de 3 posições).

A função inversa decodifica a mensagem cifrada e pode ser escrita assim:

f-1(p) = p – 3 (mod 26)

ou assim:
f-1(p) = p + 23 (mod 26)

Este é um exemplo de um sistema de cifragem chamado de monoalfabético, em que


um caractere na mensagem cifrada corresponde a, exatamente, um caractere na
mensagem original. São sistemas relativamente fáceis de serem quebrados.
Um sistema assim possui apenas 26 chaves possíveis, sendo mais fácil testar todas as
possibilidades do que tentar análise de frequência, por exemplo.

A função a seguir tenta melhorar o sistema anterior:

f(p) = ap + b (mod 26)

Para ele funcionar, temos que achar uma inversa, isto é, temos que resolver a
equação c = ap + b (mod 26) para p.

Vemos que essa função inversa vai existir se a tiver um inverso ou,
equivalentemente, MDC(a, 26) = 1. Nesse caso:

f-1(p) = a-1.p – a-1.b (mod 26)

Um sistema assim é chamado de criptosistema afim.

201
Exemplo: Seja o criptosistema afim f(p) = ap + b (mod 26). Para este sistema
funcionar, devemos escolher um a ϵ Z26 que seja inversível. Isso só é possível se
MDC(a,26) = 1. Reconhecendo este fato, escolhemos a = 5, pois, MDC(5,26) = 1. É
fácil verificar que a-1 = 21:
Estas são as partições que nos interessam:
...
[ 1 ]: [...,-129, -103, -77, -51, -25, 1, 27, 53, 79, 105, 131,...]
...
[ 5 ]: [..., -125, -99, -73, -47, -21, 5, 31, 57, 83, 109, 135, ...]
...

Aprendemos que o inverso é a partição [b] tal que [5][b] = [1]. Então, temos
que achar um múltiplo de 5 em [1]. Na lista acima, eles são -25 e 105.
Com isso -25 ÷ 5 = -5 e 105 ÷ 5 = 21. Olhando na partição [21], vemos estes
dois resultados lá: [ 21 ]: [-109, -83, -57, -31, -5, 21, 47, 73, 99, 125, 151]

Por isso, podemos fazer nossa função de encriptação igual a f(p) = 5p + 3 (mod 26) e
a de decriptação igual a f-1(p) = 21p – 21 x 3 (mod 26) = 21p – 63 (mod 26). Como -63
(mod 26) é congruente com 15 (mod 26), podemo usar também esta inversa:

f-1(p) = 21p + 15 (mod 26)

Um sistema de criptografia seria mais seguro se um caractere na cifragem


representasse mais que um caractere no texto normal, tornando-o um sistema
chamado de polialfabético.
Generalizaremos o sistema afim usando matrizes: em vez de codificar um caracter
por vez, como antes, vamos encriptar pares de caracteres. Podemos colocar um par
de letras, p1 e p2, num vetor:
𝑝1
𝑃 = (𝑝 )
2

Seja A uma matriz 2 x 2, inversível, com elementos de Z26. Podemos definir uma
função f(p) = Ap + b, onde b é um vetor coluna e operações de matrizes em Z26 são
efetuadas.
A função de decodificação será: f-1(p) = A-1 x p – A-1 x b.

Exemplo: Suponha que queiramos codificar a palavra HELP, cujo código digital
(números na sequência 1 a 26) é 07, 04, 11, 15.

Seja A a matriz
3 5
𝐴=( )
1 2
Sua inversa será:
2 21
𝐴−1 = ( )
25 3

202
Se
2
𝑏=( )
2

Então, nossa mensagem cifrada será RRCR. A letra cifrada R representa mais que um
caractere normal.

Criptografia com Chave Pública

Em 1976 Whitfield Diffie e Martin Helmann propuseram a criptografia com chave


pública (de conhecimento público), que era baseada na observação de que as chaves
de codificar e decodificar não precisavam ser iguais. Isso eliminava o requerimento
de manter a chave de encriptação em segredo.
A função de codificação f tem que ser relativamente fácil de computar, mas, f-1 tem
que ser extremamente difícil de ser computada.

O sistema RSA (Rivest-Shamir-Adleman) é baseado na dificuldade de se fatorar


números grandes (large composite numbers). Apesar de não ser difícil encontrar
dois números primos grandes aleatórios e multiplicar um deles pelo outro,
resultando num número N, se N tiver, por exemplo, 150 dígitos, serão necessários
100 milhões de computadores, operando a 10 milhões de instruções por segundo,
cada um, por cerca de 50 milhões de anos para fatorá-lo nos dois números primos.

O RSA funciona assim: Suponha que escolhamos dois números primos de 150 dígitos
cada, P e Q. Computamos N = P x Q e φ(N) = M = (P – 1)(Q – 1), onde φ é a função de
Euler. Depois, achamos um número E que seja primo com M, isto é, MDC(E,M) = 1.
Usando o algoritmo de Euclides, achamos um número D tal que D x E ≡ 1 (mod M).
N e E serão públicos.

Uma mensagem a ser codificada é, primeiro, transformada em uma cadeia numérica


(como A=0, B=1, etc.), onde cada valor é menor do que N. Suponha que X seja um
desses valores. Então, o valor codificado será Y = XE (mod N). O valor X será
recuperado no destino assim: X = YD. Por exemplo:

Suponha que temos o valor 25 a ser enviado. Seja P=23 e Q=29 (primos bem
pequenos para facilitar o exemplo).
Então, N = PQ = 667 e φ(N) = M = (P – 1)(Q – 1) = 616.
Escolhamos E=487, já que MDC(616,487) = 1.
A mensagem codificada será 25487 (mod 667) = 169 (este cálculo pode ser
feito usando o Método da Repetição dos Quadrados).

Usando o algoritmo de Euclides, determinamos que 191xE = 1 + 151xM.


Então, a chave de codificação é (N, D) = (667, 191).
Para recuperar a mensagem original: 169191 (mod 667) = 25.

203
Teoria da Codificação Algébrica

Quando fazemos uma transmissão de dados, nos preocupamos ao enviar a mensagem


por um canal sujeito a ruídos. Desejamos codificar e decodificar as informações de
uma maneira que permita a detecção e, possivelmente, a correção de erros causados
por ruídos.
Probabilidades, combinatória, teoria de grupos, álgebra linear e anéis de polinômios
sobre grupos finitos têm papéis importantes na teoria da codificação.

204
Covetores
De repente, isto pode te fazer lembrar de seno e cosseno, pois, estes são
complementares, isto é, seno(a) = cosseno(90 – a). Mas, o co, em covetor, não tem a
ver com isso. O covetor não é um complemento de um vetor.

Um covetor é uma função que mapeia um espaço vetorial V para um campo numérico
como R. Formalmente: f: V  R.

Propriedades dos Covetores

 𝑓(𝑣 + 𝑤⃗⃗ ) = 𝑓(𝑣) + 𝑓(𝑤


⃗⃗ ) 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑣, 𝑤
⃗⃗ ∈ 𝑉
 𝑓(𝑛𝑣 ) = 𝑛𝑓(𝑣) 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑣 ∈ 𝑉 𝑒 𝑛 ∈ 𝑘, 𝑜𝑛𝑑𝑒 𝑘 é 𝑢𝑚 𝑐𝑎𝑚𝑝𝑜 𝑛𝑢𝑚é𝑟𝑖𝑐𝑜

Na Álgebra Linear, um covetor é chamado, também, de linear funcional e forma


linear. É um mapeamento linear de um espaço vetorial para o campo de escalares
desse mesmo espaço vetorial. Em outras palavras, se V é um espaço vetorial sobre um
campo k, (os elementos de V vêm de k) então um linear funcional f é uma função de V
em k que é linear, conforme mostram as duas propriedades (lineares) acima.

Note a dualidade: Os elementos do campo criam um espaço vetorial; uma função f,


chamada de covetor, mapeia os elementos do espaço vetorial ao campo. Então, se
pensarmos em um vetor como um mapeamento de elementos de um campo numérico
para um espaço vetorial, um covetor é o mapeamento de um vetor para um campo
numérico.

Em Rn, se os vetores são representados como vetores-coluna, então os covetores são


representados como vetores-linha, e ação deles (dos covetores, ou do linear funcional)
sobre os vetores é dada pelo produto interno (produto escalar – produz um número),
ou pelo produto externo (produto vetorial – produz um vetor), com o vetor linha à
esquerda do vetor coluna. A figura a seguir ilustra isso.

205
O argumento da função pode ser uma operação vetorial (como adição e produto
vetorial) que pode ser calculada antes da aplicação da função no argumento ou pode-
se aplicar a função antes da operação dos argumentos, de acordo com as propriedades
listadas lá em cima.

Existem dois tipos de vetores: vetores covariantes e vetores contra variantes. Os


vetores covariantes sofrem transformações com suas bases e os vetores contra
variantes sofrem uma transformação inversa com suas bases.

Um exemplo de vetor contra variante é a velocidade. Se você tem uma velocidade


dada pelo vetor (0, 0, 1) m/s e altera a base de metros para centímetros, você vai estar
dividindo a base por 100, mas, o vetor resultante estará multiplicado por 100.

Um exemplo de covetor é o gradiente. Se você tem um gradiente de 1/metro e você o


altera para 1/centímetro, você estará multiplicando a base (m) por 100 e o vetor
resultante estará multiplicado por 100 também.

Tipicamente, vetores contra variantes tem unidades de distância e vetores covariantes


tem unidade de 1/distância.

Então, podemos dizer que o co do covetor vem de covariante.

Visualizando Covetores

Seja a seguinte operação covetorial:

𝑥
[2 1] ([𝑦]) = 2𝑥 + 1𝑦

O gráfico será uma curva de nível no plano, como aquelas mostradas em mapas
topográficos.

206
Uma curva de nível pode mostrar tanto aclives quanto declives. Em qualquer caso,
quanto mais próxima uma curva estiver da outra (como no ponto A), mais forte é a
inclinação; quanto maior a separação entre duas curvas, mais suave será a inclinação.
O ponto B tem uma inclinação (para cima ou para baixo) menor do que a inclinação no
ponto A.

Vamos pegar a função 2x + 1y e traçar curvas de nível para ela (no caso, serão retas).
Para isso, criamos algumas equações com a função, igualando-a a alguns valores. Para
cada equação obtida, traçaremos um gráfico. Primeiro as equações:

2𝑥 + 1𝑦 = −4 ⟹ 𝑦 = −2𝑥 − 4
2𝑥 + 1𝑦 = −3 ⟹ 𝑦 = −2𝑥 − 3
2𝑥 + 1𝑦 = −2 ⟹ 𝑦 = −2𝑥 − 2
2𝑥 + 1𝑦 = −1 ⟹ 𝑦 = −2𝑥 − 1
2𝑥 + 1𝑦 = 0 ⟹ 𝑦 = −2𝑥
2𝑥 + 1𝑦 = 1 ⟹ 𝑦 = −2𝑥 + 1
2𝑥 + 1𝑦 = 2 ⟹ 𝑦 = −2𝑥 + 2
2𝑥 + 1𝑦 = 3 ⟹ 𝑦 = −2𝑥 + 3
2𝑥 + 1𝑦 = 4 ⟹ 𝑦 = −2𝑥 + 4

Claramente, teremos nove retas inclinadas para a esquerda, com coeficiente angular
igual 2 (–2 indica inclinação para a esquerda) com um deslocamento paralelo igual a 1.

Na próxima figura, mostramos dois vetores unitários (o vetor unitário é a base de


criação de qualquer vetor – qualquer vetor pode ser representado por k.u, onde k é
um escalar e u é um vetor unitário) u1 e u2 e setinhas apontando os sentidos positivo e
negativo de acumulação das retas.

207
Dessa maneira, podemos visualizar covetores como um empilhamento de retas,
separadas por intervalos unitários. A próxima figura deixa isso muito mais claro.

Aqui, temos quatro covetores (funções) e suas visualizações:

208
Veja como o covetor transforma um vetor de tal modo que ela aja como o gradiente
age. Por isso o gradiente é classificado como um covetor.

Operações em Covetores

Basicamente, existe duas operações que podem ser aplicadas a covetores, sendo elas a
variação e a adição de covetores.

Variação (Scaling)

Variação se refere a alterar a escala (tamanho) de um covetor, para mais ou para


menos. Seja um covetor agindo no vetor v abaixo. Como podemos aumentar a sua
magnitude?

A primeira ideia que virá na tua cabeça será para multiplicar a magnitude do vetor v
por um escalar, não é? É quase isso, mas, não é isso, porque um covetor não funciona
como um vetor.

Para aumentar (diminuir) o valor do vetor resultante v, basta diminuir (aumentar) o


intervalo entre as linhas na proporção que se quer. O vetor resultante é um vetor
contra variante (lembra lá de cima, sobre a velocidade?).

A próxima figura mostra a operação, onde diminuímos o intervalo entre as linhas


(acompanhadas pelos vetores unitários) e mantivemos a escala de v. O vetor
resultante sofreu uma multiplicação por 2, neste exemplo.

209
Na figura, você pode ver, também, a propriedade que foi usada.

Se você aumentar o intervalo original duas vezes, o vetor resultante ficará dividido por
2.

210
Adição

Sejam os seguintes dois covetores. Vamos ver como adicioná-los.

Você viu que o scaling é bem intuitivo, tanto graficamente quanto matematicamente.
Mas, a adição de covetores só é intuitiva matematicamente e não é, exatamente, a
mesma coisa que adição de vetores. Vou usar a próxima figura para explicar.

211
Os vetores u e v serão as componentes do vetor u + v.

Posicione v na horizontal (de acordo com o apontamento das setinhas de f – reproduzi


isso com uma seta pontilhada em azul, no gráfico acima), girando a pilha de linhas de f;
posicione u na vertical (de acordo com o apontamento das setinhas de g – seta
pontilhada vermelha). Os vetores u e v têm que manter seus valores, de acordo com a
quantidade de linhas que tocam depois da origem. Use a regra do paralelogramo para
encontrar u + v. Pronto.

As próximas figuras mostram os três vetores e as densidades que ocupam (a


quantidade de linhas que tocam).

212
Em termos de espaços vetoriais, podemos anotar as diferenças entre vetores e
covetores da seguinte maneira:
 Espaço Vetorial: (V, S, +, .)
 Espaço Covetorial: (V*, S, +, .)

Onde V e V* são os espaços duais; S é um subespaço de V ou V* (qualquer operação


em V ou V* vale para seu subespaço S. A inversa não é verdadeira). V* é o espaço de
covetores que agem nos elementos V, ou seja, nos vetores do espaço V.

Os operadores + e . estão em cores diferentes porque eles atuam diferentemente


entre V e V*, como vimos aqui para covetores.

213
Análise Complexa
A análise complexa é a parte da matemática que investiga as funções que estão
definidas em alguma região do plano complexo, e que tomam valores complexos e são
diferenciáveis como funções complexas. Este tipo de função é chamado, também, de
funções holomorfas.

Revisão e Conceitos

Definição: Números complexos são pares de número reais, C = {(x,y) | (x,y) ϵ R },


equipados com a operação de adição: (x,y) + (a,b) = (x + a, y + b), e a operação de
multiplicação: (x,y) . (a,b) = (xa – yb , xb – ya).

Proposição: (C, +, .) é um campo, ou seja, para todo (x,y), (a,b), (c,d) ϵ C:


1. (x,y) + (a,b) ϵ C
2. ((x,y) + (a,b)) + (c,d) = (x,y) + ((a,b) + (c,d)) - Associativa
3. (x,y) + (a,b) = (a,b) + (x,y) - Comutativa
4. (x,y) + (0,0) = (x,y) – Identidade da adição
5. (x,y) + (-x, -y) = (0, 0) – Inverso da adição
6. (x,y) . ((a,b) + (c,d)) = (x,y) . (a,b) + (x,y) . (c,d) – Distributiva
7. (x,y) . (a,b) ϵ C
8. ((x,y) . (a,b)) . (c,d) = (x,y) . ((a,b) . (c,d)) - Associativa
9. (x,y) . (a,b) = (a,b) . (x,y) - Comutativa
10. (x,y) . (1,0) = (x,y) – Identidade da multiplicação
𝑥 −𝑦
11. 𝑃𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 (𝑥, 𝑦) ∈ ℂ − {(0,0)}, (𝑥, 𝑦). ( 2 2 , 2 2) = (1,0) – Inverso
𝑥 +𝑦 𝑥 +𝑦

As equações de 1 a 5 mostram que (C, +) é um grupo abeliano com elemento


identidade (0, 0). As equações de 7 a 11 mostram que { C – {(0,0)}, .) é um grupo
abeliano com elemento identidade (1,0).

Sabemos que, em (x,y), se y = 0, então (x,y) é um número real; se x = 0, então (x,y) é


um número imaginário. Assim, (1, 0) é real e (0, 1) é imaginário.
A definição que demos para a operação de multiplicação de números complexos,
implica que (1, 0)(1, 0) = (1, 0) e (0, 1)(0, 1) = (-1, 0).
Esta última expressão, mais o fato que (a, 0)( x, y) = (ax, ay) permite uma alternativa
para se escrever um número complexo:

(𝑥, 𝑦) = (𝑥, 0) + (0, 𝑦) = (𝑥, 0). (1,0) + (𝑦, 0). (0,1)

Se considerarmos que os números complexos (x, 0) e (y, 0) como os números reais x e


y, então podemos escrever qualquer número complexo (x, y) como uma combinação
linear de (1, 0) e (0, 1), com os coeficientes reais x e y.

214
Sabemos que (1, 0) pode ser considerado como o número real 1. Por isso, podemos
dar um nome especial para o número (0, 1): i, por exemplo. Desta maneira, o número
que estávamos chamando de (x, y) pode ser escrito com x.1 + y.i, ou x + iy.

Definição: O número x é chamado de parte real e y é chamado de parte imaginária do


número complexo x + iy.

Sabemos agora, também, que o número complexo (0, 1) pode ser considerado como o
número real –1. Com isso e com as operações que fizemos acima, podemos reescrever
a operação (0, 1)(0, 1) como i2 = -1.

Discos e Conjuntos

Proposição: Sejam z e w dois número complexos, considerados como vetores em R2, e


denote d(z, w) como a distância entre esses vetores. Então, essa distância é definida
pelo valor absoluto (ou módulo) da diferença entre esses vetores:

𝑑(𝑧, 𝑤) = |𝑧 − 𝑤| = |𝑤 − 𝑧| = √(𝑧1 − 𝑧2 )2 + (𝑤1 − 𝑤2 )2

Se fixarmos um número complexo a e um real positivo r, então, todo z ϵ C ,


satisfazendo a relação |z – a | = r forma um conjunto de pontos que estão a uma
distância r de, isto é, o conjunto forma um círculo de centro a e raio r, que denotamos
por:
𝐶[𝑎, 𝑟] = {𝑧 ∈ ℂ 𝑡𝑎𝑙 𝑞𝑢𝑒 |𝑧 − 𝑎| = 𝑟}

A parte interna deste círculo é chamada de disco aberto com centro em a e raio r. O
disco aberto é denotado por

𝐷[𝑎, 𝑟] = {𝑧 ∈ ℂ 𝑡𝑎𝑙 𝑞𝑢𝑒 |𝑧 − 𝑎| < 𝑟}

Veja que os pontos de fronteira foram excluídos.

Definição: Suponha que G é um subconjunto de C. Então:


 Um ponto a ϵ G é um ponto interno de G se um disco aberto com centro em a
é um subconjunto de G.
 Um ponto b ϵ G é um ponto fronteira de G se cada disco aberto com centro
em b contém um ponto em G e, também, um ponto fora de G.
 Um ponto c ϵ G é um ponto de acumulação de G se todo disco aberto com
centro em c contém um ponto de G diferente de c.
 Um ponto d ϵ G é um ponto isolado de G se algum disco aberto com centro em
d só contém o ponto d de G.

215
Definição: Um conjunto é aberto se todos os seus pontos são pontos interiores. Um
conjunto é fechado se ele contém todos os seus pontos de fronteira.

O plano complexo C e o conjunto vazio {} são os únicos conjuntos que são abertos e
fechados, ao mesmo tempo.

O que é disco aberto?


Na reta real, só se pode ter intervalos, tipo o intervalo aberto (a, b) ou intervalo
fechado [a, b], onde podemos determinar um ponto central.
No plano complexo, temos vários pontos ao redor de um ponto central a partir do
qual podemos traçar, por exemplo, um vetor (a, b). Ao girar esse vetor, estaremos
determinando um disco, que pode ser um disco fechado ou um disco aberto,
dependo de periferia do disco fazer parte do vetor ou não, respectivamente.

216
Conectividade

Uma noção um tanto sutil no domínio complexo é a ideia de conexão. Intuitivamente,


um conjunto é conectado se ele é, de todo, contínuo em seus elementos. Em R, um
conjunto é conectado se, e somente se, for um intervalo. No entanto, no plano há uma
grande variedade de subconjuntos com a propriedade de conectados.

Definição: Dois conjunto 𝑋, 𝑌 ⊆ ℂ são separáveis se existem conjuntos disjuntos


abertos 𝐴, 𝐵 ⊂ ℂ tal que 𝑋 ⊆ 𝐴 e 𝑌 ⊆ 𝐵. Um conjunto 𝐺 ⊆ ℂ é conectado se for
impossível encontrar-se dois conjuntos não vazios separáveis cuja união resulte em G.
Uma região é um conjunto aberto conectado.

A ideia de separabilidade é a de que dois conjuntos abertos A e B garantam que X e Y


não podem “colar” um no outro. Normalmente, é mais fácil verificar que um conjunto
não é conectado.

Exemplo: Os intervalos X = [0, 1) e Y = (1, 2] no eixo real são separáveis: Existem


infinitas escolhas para A e B que satisfazem isso. Uma escolha é A = D[0, 1] e B=D[2,1].
Daí, X U Y = [0, 2] – {1} não é conectado.

Continuidade Seccional – Diz-se de funções que são definidas através da junção de


outras funções, cujos intervalos são separáveis, gerando descontinuidades nos pontos
de junção (O termo em Inglês para esse tipo de função é piecewise function.). Um
intervalo formado assim, de intervalos contínuos, porém, separáveis é chamado de
caminho seccionado.

Exemplos:

1) Função Degrau Unitário:

0, 𝑠𝑒 𝑥 < 0
𝑓(𝑥) = {
1, 𝑠𝑒 𝑥 ≥ 0

2) Função Sinal:
−1, 𝑠𝑒 𝑥 < 0
𝑠𝑔𝑛(𝑥) = { 0, 𝑠𝑒 𝑥 = 0
1, 𝑠𝑒 𝑥 > 0

Se você traçar os gráficos de f(x) e sgn(x), verá os pontos de descontinuidade na


junção das linhas.

217
Funções Complexas

Uma função complexa f é um mapeamento de um subconjunto G de C em C,


denotado por:
𝑓: 𝐺 → ℂ
onde G é o domínio de f.
Cada elemento z ϵ G é mapeado para um único número complexo que será uma
imagem de z, denotado por f (z).

Uma função complexa não é diferente de uma função real de Rm>1 em Rn>m. Podemos
escrever funções em C:

1
𝑓(𝑧) = 𝑧, 𝑓(𝑧) = 2𝑧 + 𝑖, 𝑓(𝑧) = 𝑧 3 , 𝑓(𝑧) =
𝑧

E podemos escrever funções que fazem uso de uma certa representação de z:

𝑓(𝑥, 𝑦) = 𝑥 − 2𝑖𝑦

𝑓(𝑥, 𝑦) = 𝑦 2 − 𝑖𝑥

𝑓(𝑟, 𝜃) = 2𝑟 × 𝑒 𝑖(𝜙+𝜋)

É conveniente, e tradicional, escrever a função f em termos de suas partes reais e


imaginárias, f (z) = f (x,y) = u(x,y) + iv(x,y), onde u é a parte real de f e v é parte
imaginária de f.

Exemplo – Escreva a seguinte função f (z) na forma f (z) = u(x,y) + iv(x,y) em


coordenadas cartesianas, com u(x,y) = Re[f(z)] e v(x,y) = Im[f(z)].

𝒇(𝒛) = 𝒛𝟑 + 𝒛 + 𝟏

Solução:
𝑓(𝑧) = (𝑥 + 𝑖𝑦)3 + (𝑥 + 𝑖𝑦) + 1 =

= (𝑥 + 𝑖𝑦)(𝑥 2 − 𝑦 2 + 2𝑖𝑥𝑦) + 𝑥 + 𝑖𝑦 + 1 =

= 𝑥 3 − 𝑥𝑦 2 + 2𝑖𝑥 2 𝑦 + 𝑖𝑥 2 𝑦 − 𝑖𝑦 3 − 2𝑥𝑦 2 + 𝑥 + 𝑖𝑦 + 1 =

= 𝒙𝟑 − 𝟑𝒙𝒚𝟐 + 𝒙 + 𝟏 + 𝒊(𝟑𝒙𝟐 𝒚 − 𝒚𝟑 + 𝒚)

218
Equação de Cauchy-Riemann

A equação de Cauchy-Riemann é uma equação que relaciona uma função real de duas
variáveis com uma função complexa. Ela é, exatamente, a equação lá de cima:

f (x,y) = u(x,y) + iv(x,y)

Funções Complexas Compostas

Definição: A imagem da função g: G → C é o conjunto {g(z), z ϵ G}. Se a imagem de g


está contida no domínio de outra função f: H → C, definimos a função composta de f
com g, fog: G → C por [fog](z) = f (g (z)).

Polinômios Complexos

Um polinômio complexo é uma função da forma


𝑛

𝑃(𝑧) = ∑ 𝑎𝑘 𝑧 𝑘
𝑘=0

Onde ak são números complexos, não todos nulos, e z é uma variável complexa.
Também, é usada a expressão polinômio analítico (refletindo o fato de que o
polinômio é uma função analítica) ou polinômio algébrico (pois, o polinômio contém
apenas operações algébricas na variável z).

Se an ≠ 0, o polinômio é dito ter grau n. Em particular, o polinômio de grau zero é, por


definição, uma constante não nula.
A função que é identicamente nula é, sempre, considerada um polinômio de grau –∞.

Quando os ak são todos reais, o polinômio P(z) é chamado de polinômio real.


̅̅̅̅̅̅) = 𝑃(𝑧), para todo z ϵ C.
Observe que P(z) é um polinômio real se, e somente se, 𝑃(𝑧̅

Lembre-se que um complexo com uma barra sobre ele é o conjugado do mesmo
número sem a barra.

Lema: Um polinômio complexo de grau n tem, no máximo, n raízes.

219
Como o campo dos números complexos é algebricamente fechado, todo polinômio
com coeficientes complexos possui uma decomposição linear:

𝑧 3 − 3𝑧 2 = 6𝑧 − 4 = (𝑧 − 1)(𝑧 − 1 + √3𝑖)(𝑧 − 1 − √3𝑖)

Onde se pode ver, facilmente, as soluções. Uma maneira fácil de encontrar uma tal
decomposição é, simplesmente, fazer:

z3 – 3z2 + 6z –4 = i(z – α)(z – β)(z – γ)

Teorema da Unicidade: Se P(z) e Q(z) são polinômios de grau menor ou igual a n e se a


equação P(z) = Q(z) for satisfeita por (n+1) pontos distintos, então P = Q.
De outra maneira, P – Q é um polinômio de grau menor ou igual a n com (n+1) zeros
(ou raízes).

Limites de Funções Complexas

Seja f: G → C e z0 um ponto de acumulação de G. Se w0 é um número complexo, tal


que, para cada ϵ > 0, podemos encontrar δ > 0, tal que, para todo z ϵ G, que satisfaça
a 0 < | z – z0| < δ , termos | f (z) – w0| < ϵ, então w0 é o limite de f quando z se
aproxima de z0, ou:

Lim 𝑓(𝑧) = 𝑤0
𝑧→𝑧0

Exemplo 1 – Calcule o limite da função complexa abaixo.

𝒊𝒛𝟑 + 𝟏
𝐋𝐢𝐦
𝒛→−𝒊 𝒛𝟐 + 𝟏
Solução:

𝑖𝑧 3 + 1 𝑖(𝑧 3 + 𝑖 3 ) 𝑖(𝑧 + 𝑖)(𝑧 2 − 𝑖𝑧 + 𝑖 2 )


Lim = Lim = Lim =
𝑧→−𝑖 𝑧 2 + 1 𝑧→−𝑖 𝑧 2 + 1 𝑧→−𝑖 (𝑧 + 𝑖)(𝑧 − 𝑖)

220
Cancelando (z+i) em cima e em baixo:

Lim (𝑧 2 − 𝑖𝑧 + 𝑖 2 )
𝑖(𝑧 2 − 𝑖𝑧 + 𝑖 2 ) 𝑧→−𝑖
= Lim = =
𝑧→−𝑖 (𝑧 − 𝑖) Lim (𝑧 − 𝑖)
𝑧→−𝑖

Lim 𝑧 2 − 𝑖 × Lim 𝑧 + Lim 𝑖 2


𝑧→−𝑖 𝑧→−𝑖 𝑧→−𝑖
=𝑖× =
Lim 𝑧 − Lim 𝑖
𝑧→−𝑖 𝑧→−𝑖

𝑖[(−𝑖)2 − 𝑖 × (−𝑖) + 𝑖 2 ] 𝑖(−1 − 1 − 1) −3𝑖 3


= = = =
−𝑖 − 𝑖 −2𝑖 −2𝑖 2

Exemplo 2 – Encontre o limite da seguinte função:

𝑰𝒎(𝒛)
𝐋𝐢𝐦
𝒛→𝟎 𝒛
Solução:
𝐼𝑚(𝑧) 𝑦
𝐶𝑜𝑚𝑜 Lim = Lim = −𝑖
𝑅𝑒(𝑧)=0,𝑧→0 𝑧 𝑦→0 𝑖𝑦

e
𝐼𝑚(𝑧) 0
Lim = Lim = 0
𝐼𝑚(𝑧)=0,𝑧→0 𝑧 𝑥→0 𝑥

Então o limite não existe. Isso vai ficar mais claro com o próximo exemplo.

Exemplo 3 – Encontre o limite desta função complexa:

𝒛̅
𝐋𝐢𝐦
𝒛→𝟎 𝒛
Solução:

Este limite não existe, como nos reais, porque, fazendo z = x ϵ R (tendendo a zero
pelo eixo x), temos que:

𝑧̅ 𝑥̅ 𝑥
Lim = Lim = Lim = 1
𝑧→0 𝑧 𝑥→0 𝑥 𝑥→0 𝑥

Nota: Como vimos em Números Complexos, sendo z = a + ib, o conjugado de z (z


barra) é a – ib. Usando x e y, com z = x, implica x + i0 e x – i0 como conjugado.
Então, o conjugado de x é o próprio x. Veja, abaixo, que temos – ib (ou – iy).

221
E fazendo z = iy, com y ϵ R, com z tendendo a zero pelo eixo y, temos que:

𝑧̅ 𝑖𝑦
̅ −𝑖𝑦
Lim = Lim = Lim = −1
𝑧→0 𝑧 𝑦→0 𝑖𝑦 𝑦→0 𝑖𝑦

Como obtemos limites diferentes, dependendo por onde se aproxima de zero, o limite
não é único e, assim, não existe.

Nota: Na reta real, uma variável pode se aproximar de zero por apenas dois lados,
mas, no plano complexo, a aproximação pode vir de várias direções.

Proposição: Sejam f e g funções complexas no domínio G e seja z0 um ponto de


acumulação de G e um valor c ϵ G.
Se 𝐋𝐢𝐦 𝒇(𝒛) e 𝐋𝐢𝐦 𝒈(𝒛) existem, então:
𝒛→𝒛𝟎 𝒛→𝒛𝟎

a) Lim (𝑓(𝑧) + 𝑐. 𝑔(𝑧)) = Lim 𝑓(𝑧) + 𝑐. Lim 𝑔(𝑧)


𝑧→𝑧0 𝑧→𝑧0 𝑧→𝑧0
b) Lim (𝑓(𝑧) × 𝑔(𝑧)) = Lim 𝑓(𝑧) × Lim 𝑔(𝑧)
𝑧→𝑧0 𝑧→𝑧0 𝑧→𝑧0
lim 𝑓(𝑧)
𝑓(𝑧) 𝑧→𝑧0
c) Lim 𝑔(𝑧) = , 𝑜𝑛𝑑𝑒 𝑔(𝑧) ≠ 0
𝑧→𝑧0 lim 𝑔(𝑧)
𝑧→𝑧0

Continuidade em Funções Complexas

Definição: Seja f: G → C. Se z0 ϵ G é um ponto isolado de G, ou:

Lim 𝑓(𝑧) = 𝑓(𝑧0 )


𝑧→𝑧0

então f é contínua em z0.


Mais geralmente, f é contínua em 𝐸 ⊆ 𝐺 se f é contínua em todo z ϵ E.

Se z0 é um ponto de acumulação de G, lim 𝑔(𝑧) = 𝑤0 ∈ 𝐻 e se f é contínua em w0,


𝑧→𝑧0
então:
Lim 𝑓(𝑔(𝑧)) = 𝑓 (Lim 𝑔(𝑧))
𝑧→𝑧0 𝑧→𝑧0

222
Diferenciação e Holomorficidade em Funções Complexas

Definição: Seja f: G → C uma função complexa e z0 um ponto interior de G. A derivada


de f no ponto z0 é dada por:
𝒇(𝒛) − 𝒇(𝒛𝟎 )
𝒇′ (𝒛𝟎 ) = 𝐥𝐢𝐦
𝒛→𝒛𝟎 𝒛 − 𝒛𝟎

dado que o limite exista. Nesse caso, f é dita diferenciável em z0.


Se f for diferenciável para todos os pontos no disco aberto com centro em z0, então f é
dita holomórfica em z0. O designativo holomórfico para uma função significa que a
função é diferenciável, não só no ponto central do disco, mas, em todos os pontos ao
redor desse centro. Isso permite que uma função complexa pode ser infinitamente
diferenciável, o que não ocorre com funções reais.

A função f é holomórfica no conjunto aberto 𝐸 ⊆ 𝐺 se ela for diferenciável em todos


os pontos de E. Funções que são diferenciáveis (e, daí, holomórficas) em todo o plano
complexo C são chamadas de funções inteiras (no sentido de serem completas ou
integrais – vamos usar o termo inglês ‘entire’ aqui).

Exemplo – A função f: C → C, dada por f (z) = z3 é entire, ou seja, é holomórfica em C,


pois, para qualquer z0 ϵ C:

𝑓(𝑧) − 𝑓(𝑧0 ) 𝑧3 − 𝑧3
lim = lim =
𝑧→𝑧0 𝑧 − 𝑧0 𝑧→𝑧0 𝑧 − 𝑧0

(𝑧 2 + 𝑧𝑧0 + 𝑧02 )(𝑧 − 𝑧0 )


= lim = 𝟑𝒛𝟐𝟎
𝑧→𝑧0 𝑧 − 𝑧0

Se f é holomórfica, ela é diferenciável, mas, se ela for diferenciável, não implica que ela
é holomórfica.

Proposição: Suponha que f e g sejam diferenciáveis em z ϵ C e h é diferenciável em


g(z). Então:
a) [f (z) + c. g(z)]’ = f’(z) + c. g’(z), para qualquer c ϵ C.
b) [f (z).g(z)]’ = f’’(z)g(z) + f (z)g’(z)
𝑓(𝑧) ′ 𝑓′ (𝑧)𝑔(𝑧)−𝑓(𝑧)𝑔′(𝑧)
c) [ ] = , 𝑐𝑜𝑚 𝑔(𝑧) ≠ 0
𝑔(𝑧) [𝑔(𝑧)]2
d) [zn]’ = n.zn-1, para qualquer inteiro n.
e) g é contínua em z.
f) [h (g (z))]’ = h’.[ g (z)]. g’(z)

223
Quando se considera uma função de valores reais f: R2→ R (função de duas
variáveis), não existe a noção de derivada da função. Em vez disso, o que se tem
𝜕𝑓 𝜕𝑓
são derivadas parciais 𝜕𝑥 (𝑥0 , 𝑦0 ) e 𝜕𝑦 (𝑥0 , 𝑦0 ) (e, também, derivadas direcionais),
que dependem da maneira pela qual é feita a aproximação ao ponto (x0, y0) ϵ R2.

Para uma função complexa f (z) não se tem um novo conceito da derivada f (z0), a
qual, por definição, não pode ser dependente do lado pelo qual é feita a
aproximação ao ponto z0 = (x0, y0) ϵ C.

É de se esperar, então, que haja uma relação entre a derivada complexa f ’(z0) e
derivadas parciais:

𝜕𝑓 𝑓(𝑥0 , 𝑦) − 𝑓(𝑥0 , 𝑦0 )
(𝑧0 ) = lim
𝜕𝑥 𝑥→𝑥0 𝑦 − 𝑦0

e
𝜕𝑓 𝑓(𝑥, 𝑦0 ) − 𝑓(𝑥0 , 𝑦0 )
(𝑧0 ) = lim
𝜕𝑦 𝑦→𝑦0 𝑥 − 𝑥0

[Esta definição é, exatamente, aquela feita para as funções reais]

Esta relação entre as derivadas complexas e as derivadas parciais é muito forte, e é


uma ferramenta computacional poderosa. Ela é descrita pela equação de Cauchy e
Riemann.

Para a função complexa f: C → C, temos que f (x,y) = u(x,y) + iv(x,y), que é a equação
de Cauchy-Riemann, onde u,v: R2→ R (função do plano para a linha).
A equação de Cauchy-Riemann afirma que f é complexamente diferenciável quando:

𝜕𝑢 𝜕𝑣 𝜕𝑢 𝜕𝑣
= 𝑒 =−
𝜕𝑥 𝜕𝑦 𝜕𝑦 𝜕𝑥

Teorema:
a) Suponha que f seja diferenciável em z0 = x0 – iy0. Então, as derivadas parciais
de f existem e satisfazem:

𝜕𝑓 𝜕𝑓
(𝑧0 ) = −𝑖 (𝑧 ) (2.2)
ð𝑥 𝜕𝑦 0

b) Suponha que f é uma função complexa tal que as derivadas parciais ꝺf/ꝺx e
ꝺf/ꝺy existam em um disco aberto com centro em z0 e são contínuas em z0. Se
estas derivadas parciais satisfazem (2.2), então f é diferenciável em z0.

224
Nos dois casos, a e b, f ’ é dada por:

𝜕𝑓
𝑓 ′ (𝑧0 ) = (𝑧 )
𝜕𝑥 0

Assim, usando a forma abreviada usual fx = ꝺf/ꝺx, fy = ꝺf/ꝺy:

𝒇𝒙 = 𝒖𝒙 + 𝒊𝒗𝒙 𝒆 − 𝒊𝒇𝒚 = −𝒊(𝒖𝒚 + 𝒊𝒗𝒚 ) = 𝒗𝒚 − 𝒊𝒖𝒚

Com esta terminologia, podemos reescrever (2.2) como o par de equações:

𝒖𝒙 (𝒙𝟎 , 𝒚𝟎 ) = 𝒗𝒚 (𝒙𝟎 , 𝒚𝟎 )

𝒖𝒚 (𝒙𝟎 , 𝒚𝟎 ) = −𝒗𝒙 (𝒙𝟎 , 𝒚𝟎 )

Funções Complexas Constantes

Teorema: Se 𝐺 ⊆ ℂ é uma região e f: G → C é uma função complexa, com f ’(z)


definida e igual a zero para todo z ϵ G, então f é constante.

Funções Polinomiais

Teorema (Fórmula Interpolativa de Lagrange): Seja z1, z2, ..., zn+1 os (n+1) pontos
distintos e seja w1, w2, ..., wn+1 números complexos arbitrários (não necessariamente
distintos, mas, não todos nulos). Entre todos os polinômios de graus não maiores que
n, existe um único polinômio P(z) tal que P(zk) = wk, com 1 ≤ k ≤ n+1.
Isto é representado por:

𝑛+1
𝑄(𝑧)
𝑃(𝑧) = ∑ 𝑤𝑘
𝑄′(𝑧𝑘 )(𝑧 − 𝑧𝑘 )
𝑘=1

Onde
𝑛+1

𝑄(𝑧) = ∏(𝑧 − 𝑧𝑘 )
𝑘=1

Definição: Um polinômio analítico real é uma expressão da forma:


𝑚 𝑛

𝑃(𝑥, 𝑦) = ∑ [∑ 𝑎𝑗,𝑘 𝑥 𝑗 𝑦 𝑘 ]
𝑗=0 𝑘=0

225
Onde os coeficientes aj,k são números reais ou complexos e onde x e y são reais.

O grau do termo aj,kxjyk é (j+k), desde que aj,k ≠ 0 e o grau de P é o maior grau entre
os termos individuais.

Teorema de Bezót: Seja P(x,y) = u(x,y) + iv(x,y), com u e v reais, um polinômio


analítico de valor complexo, onde u tem grau m e v tem grau n, e suponha que u e v
sejam primos entre si. Então P tem, no máximo, m x n raízes em C.

Transformações de Möbius

Definição: Uma transformação fracional linear é uma função na forma

𝑎𝑧 + 𝑏
𝑓(𝑧) =
𝑐𝑧 + 𝑑
Onde a, b, c, d ϵ C.
Se ad – bc ≠ 0, então f é chamada de Transformação de Möbius.

𝑎 𝑎
Proposição: Se a, b, c, d ϵ C, com c ≠ 0. Então 𝑓: ℂ − {− 𝑐 } → ℂ − { 𝑐 }, dada por:

𝑎𝑧 + 𝑏
𝑓(𝑧) =
𝑐𝑧 + 𝑑
𝑎 𝑎
tem uma função inversa 𝑓 −1 : ℂ − { 𝑐 } → ℂ − {− 𝑐 }, dada por:

𝑑𝑧 − 𝑏
𝑓 −1 (𝑧) =
−𝑐𝑧 + 𝑎

A fórmula f -1(z) vale também quando c = 0, porém, nesse caso, tanto o domínio
quanto a imagem são C. Em qualquer caso, nota-se que a inversa de uma
transformação de Möbius também é uma transformação de Möbius.

𝑎𝑧+𝑏
Proposição: Suponha 𝑓(𝑧) = uma transformação linear. Se c = 0, então
𝑐𝑧+𝑑
𝑎 𝑏 𝑏𝑐−𝑎𝑑 𝑎
𝑓(𝑧) = 𝑧 + ; se c ≠ 0, então 𝑓(𝑧) = 𝑑 + .
𝑑 𝑑 𝑐 2 𝑧+ 𝑐
𝑐

Teorema: A transformação de Möbius mapeia linhas em linhas, linhas em círculos,


círculos em linhas e círculos em círculos.

226
Infinito e Razão Cruzada

Definição: Suponha que f: G → C. Temos que:


a) Lim 𝑓(𝑧) = ∞ significa que, para cada M > 0, podemos encontrar δ > 0, tal
𝑧→𝑧0
que, para todo z ϵ G satisfazendo 0 < |z – z0| < δ, temos | f (z)| > M.
b) Lim 𝑓(𝑧) = 𝐿 significa que, para todo ϵ > 0, podemos encontrar N > 0, tal que,
𝑧→∞
para todo z ϵ G, satisfazendo |z| > N, temos | f (z) – L | < ϵ.
c) Lim 𝑓(𝑧) = ∞ significa que, para cada M > 0, podemos encontrar N > 0, tal
𝑧→∞
que, para todo z ϵ G satisfazendo |z| > N, temo | f (z)| > M.

Note que ∞ não é um número em C, assim como ±∞ não são números em R2. Porém,
podemos estender C, colocando ∞ nele, com cuidado. Fazemos isso, mantendo em
mente que estamos sempre falando de limites quando tratando ∞.

Definição: O plano complexo estendido é o conjunto ℂ̂ = ℂ ∪ {∞}, junto com as


seguintes propriedades algébricas: Para qualquer a ϵ C, temos que
a) ∞ + a = a + ∞ = ∞
b) Se a ≠ 0, então ∞ . a = a . ∞ = ∞
c) ∞ . ∞ = ∞
d) a / ∞ = 0
e) Se a ≠ 0, então a / 0 = ∞

O plano complexo estendido é chamado, também, de Esfera de Riemann, ou Linha


Projetiva Complexa (CPL).

Se os cálculos envolvendo ∞ não forem cobertos pelas regras acima, então deve-se
investigar o limite com mais cuidado.

Definição: Se z, z1, z2, z3 são quatro pontos quaisquer ℂ̂, com z1, z2 e z3 distintos entre
si, então a sua razão cruzada é definida como:

(𝑧 − 𝑧1 )(𝑧2 − 𝑧3 )
[𝑧, 𝑧1 , 𝑧2 , 𝑧3 ] =
(𝑧 − 𝑧3 )(𝑧2 − 𝑧1 )

Isto inclui as definições implícitas [z, z1, z2, z3] = ∞ e, se um de z, z1, z2 ou z3, for ∞,
então os dois termos contendo ∞ são cancelados, ou seja:

(𝑧2 − 𝑧3 )
[𝑧, ∞, 𝑧2 , 𝑧3 ] =
(𝑧 − 𝑧3 )

227
Projeção Estereográfica

A adição de ∞ ao plano complexo dá a ele uma estrutura muito útil. Esta estrutura é
revelada por uma função famosa, chamada de projeção estereográfica, que nos dá
uma maneira de visualizar o plano complexo estendido, isto é, com o ponto no infinito,
em R3, como a esfera unitária. Ela, também, provê uma maneira de ver que uma linha
no plano complexo estendido é, na verdade, um círculo e, também, visualizar as
funções de Möbius.

Imagine C como o plano (x, y) em R3, isto é, C = {(x, y, 0) ϵ R3}. Para descrever a
projeção estereográfica, estaremos menos preocupados com os números complexos
do tipo x + iy e mais com as suas coordenadas.
Considere a esfera unitária S2 = {( x, y, z) ϵ R3, tal que x2 + y2 + z2 = 1}. A esfera e o
plano complexo se interseccionam no conjunto {(x, y, 0) : x2 + y2 = 1}, que corresponde
ao equador da esfera e ao círculo unitário no plano complexo, como mostrado na
figura.

Seja N = (0, 0, 1) o polo norte de S2 e S = (0, 0, -1) seu polo sul.

Definição: A projeção estereográfica de S2 para ℂ̂, a partir de N, é o mapeamento dado


pela função φ: S2 →ℂ̂, definido a seguir. Para qualquer ponto P e S2 – {N} como a
coordenada z de P estritamente menor do que 1, a linha de N a P intersecciona C,
exatamente em um ponto Q.

Defina φ(P) = Q. Também, declaramos que φ(N) = ∞.

Proposição: O mapeamento φ é dado por

𝑥 𝑦
ϕ(𝑥, 𝑦, 𝑧) = { 1 − 𝑧 1 − 𝑧 , 0) 𝑠𝑒 𝑧 ≠ 1
( ,
∞ 𝑠𝑒 𝑧 = 1

228
Essa função é bijetiva, com mapeamento inverso dado por

−1 (𝑝,
2𝑝 2𝑞 𝑝2 + 𝑞 2 − 1
ϕ 𝑞, 0) = ( 2 , , )
𝑝 + 𝑞 2 + 1 𝑝2 + 𝑞 2 + 1 𝑝2 + 𝑞 2 + 1

e
𝜙 −1 (∞) = (0,0,1)

Funções Exponenciais Complexas

Definição: A função complexa exponencial é f: C → C, definida para z = x + iy como:

𝑓(𝑧) = 𝑒 𝑥 [𝐶𝑜𝑠(𝑦) + 𝑖 × 𝑆𝑒𝑛(𝑦)] = 𝑒 𝑥 𝑒 𝑖𝑦

O segundo fator da extrema direita vem do fato de que eit = Cos(t) + iSen(t).

Se z = x ϵ R, então y = 0, implicando que ex[Cos(0) + i.Sen(0)] = ex[1+0] = ex, o que


prova que a função exponencial complexa não redefine a função exponencial real.

Proposição: Para todo z, z1, z2, z3 ϵ C e a função exponencial complexa f:


a) 𝑓(𝑧1 ). 𝑓(𝑧2 ) = 𝑓(𝑧1 + 𝑧2 )
1
b) 𝑓(𝑧) = 𝑓(−𝑧)
c) 𝑓(𝑧 + 2𝜋𝑖) = 𝑓(𝑧)
d) |𝑓(𝑧)| = 𝑓[𝑅𝑒(𝑧)]
e) 𝑓(𝑧) ≠ 0
𝑑𝑓(𝑧)
f) 𝑑𝑧 = 𝑓(𝑧)

A identidade c é muito especial e não tem nenhuma equivalente no conjunto dos reais.
Ela diz que a função exponencial complexa f é periódica, com período 2πi. Isto tem
várias consequências interessantes.

229
Funções Trigonométricas Complexas

As funções trigonométricas reais também têm suas análogas complexas, mas, estas
não têm, aqui, tanta proeminência quanto as do campo real.
Na verdade, elas são definidas aqui como meras combinações da função exponencial
complexa vista anteriormente:

1
𝑆𝑒𝑛(𝑧) = (𝑓(𝑖𝑧) − 𝑓(−𝑖𝑧))
2𝑖

1
𝐶𝑜𝑠(𝑧) = (𝑓(𝑖𝑧) + 𝑓(−𝑖𝑧))
2

𝑆𝑒𝑛(𝑧) 𝑓(2𝑖𝑧) − 1
𝑇𝑎𝑛(𝑧) = = −𝑖
𝐶𝑜𝑠(𝑧) 𝑓(2𝑖𝑧) + 1

𝐶𝑜𝑠(𝑧) 𝑓(2𝑖𝑧) + 1
𝐶𝑜𝑡(𝑧) = =𝑖
𝑆𝑒𝑛(𝑧) 𝑓(2𝑖𝑧) − 1

Faça z = x ϵ R para mostra que não está havendo redefinição das funções reais.

Proposição: Para todo z, z1, z2 ϵ C:


a) Sen(-z) = -Sen(z)
b) Cos(-z) = Cos(z)
c) Sen(z+2π) = Sen(z)
d) Cos(z+2π) = Cos(z)
e) Tan(z+π) = Tan(z)
f) Ctg(z+π) = Ctg(z)
g) Sen(z + π/2) = Cos(z)
h) Cos(z + π/2) = -Sen(z)
i) Sen(z1 + z2) = Sen(z1) . Cos(z2) + Cos(z1) . Sen(z2)
j) Cos(z1 + z2) = Cos(z1) . Cos(z2) – Sen(z1) . Sen(z2)
k) Cos2(z) + Sen2(z) = 1
l) Cos2(z) – Sen2(z) = Cos(2z)
𝑑𝑆𝑒𝑛(𝑧)
m) = 𝐶𝑜𝑠(𝑧)
𝑑𝑧
𝑑𝐶𝑜𝑠(𝑧)
n) = −𝑆𝑒𝑛(𝑧)
𝑑𝑧

Diferentemente dos reais, seno e cosseno no campo complexo não são limitados ao
intervalo [0, 1].

230
Funções Hiperbólicas Complexas

São definidas, também, em termos da função complexa exponencial.

1
𝑆𝑒𝑛ℎ(𝑧) = [𝑓(𝑧) − 𝑓(−𝑧)]
2

1
𝐶𝑜𝑠ℎ(𝑧) = [𝑓(𝑧) + 𝑓(−𝑧)]
2

𝑆𝑒𝑛ℎ(𝑧) 𝑓(2𝑧) − 1
𝑇𝑎𝑛ℎ(𝑧) = =
𝐶𝑜𝑠ℎ(𝑧) 𝑓 (2𝑧) + 1

𝐶𝑜𝑠ℎ(𝑧) 𝑓(2𝑧) + 1
𝐶𝑜𝑇𝑎𝑛ℎ(𝑧) = =
𝑆𝑒𝑛ℎ(𝑧) 𝑓(2𝑧) − 1

𝑑(𝑆𝑒𝑛(𝑧))
= 𝐶𝑜𝑠ℎ(𝑧)
𝑑𝑧

𝑑(𝐶𝑜𝑠ℎ(𝑧))
= 𝑆𝑒𝑛ℎ(𝑧)
𝑑𝑧

Estas funções estão relacionadas às suas companheiras trigonométricas assim:

Senh(iz) = iSen(z) e Cosh(iz) = Cos(z)

Funções Logarítmicas Complexas

A função logarítmica complexa tem, mesmo, uma natureza complexa. Isso é motivado
pelo inverso da função exponencial complexa (vamos denotá-la de exp), ou seja,
estamos procurando por uma função Log, tal que exp(Log(z)) = z = Log(exp(z)).
O problema aqui é que exp não é uma função bijetora. Daí, é necessário restringir-se o
domínio de Log.

Definição: Dada uma região G, qualquer função contínua Log : G → C que satisfaz à
equação exp[Log (z)] = z é uma ramificação do logaritmo (em G).

Definição: Seja Arg(z) o argumento único de z ≠ 0 no intervalo (-π, π) (o argumento


principal de z). Então, o logaritmo principal é a função Log : C – {0} → C, definida por:

Log (z) = ln |z| + i . Arg(z)

231
Lembrete: O argumento de um número complexo corresponde ao seu ângulo
de fase. Para os complexos positivos, Arg(z) = 0; para os complexos negativos
Arg(z) = π; para os imaginários positivos, Arg(z) = π / 2; para imaginários
negativos, Arg(z) = (3π) / 2.

Exemplos:
1) Log (2) = ln (2) + iArg(2) = ln (2)
2) Log (i) = ln (1) + iArg(i) = (iπ) / 2
3) Log (-3) = ln (3) + iArg(-3) = ln (3) + iπ

A função logaritmo principal não é contínua na parte negativa da linha real e, assim, a
função log é uma ramificação do logaritmo em C – R ≤0.

Proposição: Se Log é uma ramificação do logaritmo em G (uma região de C), então


Log é diferenciável em G, com

𝑑[ℒℴℊ(𝑧)] 1
=
𝑑𝑧 𝑧

E a definição final de exponenciais complexas:

Dados a, b, ϵ C, com a ≠ 0, o valor principal de ab é definido como:

ab = exp(b . Log(a))

232
Integrais de Funções Complexas

A integração complexa é muito mais rica do que a integração real. Na integração real
do tipo abaixo, só existe um caminho para se ir de a até b, ao longo da linha real.

𝑏
∫ 𝑓(𝑥)𝑑𝑥
𝑎

Mas, no campo complexo existem vários caminhos de a até b, pois, caminha-se numa
região, ou disco. À primeira vista, a integração complexa não é tão diferente da
integração real.

Seja a, b ϵ R e seja g: [a, b] → C contínua. Então:

𝑏 𝑏 𝑏
∫ 𝑔(𝑡)𝑑𝑡 = ∫ 𝑅𝑒[𝑔(𝑡)]𝑑𝑡 + ∫ 𝐼𝑚[𝑔(𝑡)]𝑑𝑡
𝑎 𝑎 𝑎

Esta definição é análoga àquela da integração da curva paramétrica em R2.

Teorema A.6: Se g : [a, b] → R é diferenciável, g’ é contínua e f : [g(a), g(b)] → R é


contínua, então:
𝑏 𝑔(𝑏)
∫ 𝑓[𝑔(𝑡)]𝑔′(𝑡)𝑑𝑡 + ∫ 𝑓(𝑥)𝑑𝑥
𝑎 𝑔(𝑎)

Definição: Suponha que ϒ seja um caminho suave (em vez de um intervalo, como na
integração real) parametrizado por ϒ(t), com a ≤ t ≤ b e f uma função complexa
contínua em ϒ. Então, definimos a integral de f em ϒ como:

𝑏
∫ 𝑓 = ∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓[𝛾(𝑧)]𝛾 ′ (𝑧)𝑑𝑧
𝛾 𝛾 𝑎

233
Antiderivada

Teorema Fundamental do Cálculo

Suponha f : [a, b] → R contínua. Assim:


𝑥
a) A função F : [a, b] → R, definida por 𝐹(𝑥) = ∫𝑎 𝑓(𝑡)𝑑𝑡 é diferenciável e
temos que F ’(x) = f(x).
b) Se F é qualquer antiderivada de f, isto é, F ’ = f, então:

𝑏
∫ 𝑓(𝑥)𝑑𝑥 = 𝐹(𝑏) − 𝐹(𝑎)
𝑎

Definição: Se F é holomórfica na região 𝐺 ⊆ ℂ e F ’ (z) = f(z) para todo z ϵ G, então F é


uma antiderivada de f em G, também chamada de primitiva de f em G.

Teorema (análogo ao TFC): Suponha 𝐺 ⊆ ℂ uma região em C e 𝛾 ⊂ 𝐺 um caminho


seccionado suave com parametrização ϒ(t), com a ≤ t ≤ b. Se f é contínua em G e F é
qualquer antiderivada de f em G, então

∫ 𝑓 = 𝐹[𝛾(𝑏)] − 𝐹[𝛾(𝑎)]
𝛾

1
Exemplo: Como 𝐹(𝑧) = 2 𝑧 2 é uma antiderivada de f(z) = z em C, então:

1 1
∫𝑓 = (1 + 𝑖)2 − 02 = 𝑖
𝛾 2 2

Corolário: Supondo 𝐺 ⊆ ℂ é aberta, 𝛾 ⊂ 𝐺 é um caminho seccionado suave fechado,


se f é contínua em G e tem antiderivada em G, então:

∫𝑓 = 0
𝛾

Teorema (análogo ao TFC-a): Suponha 𝐺 ⊆ ℂ uma região e z0 ϵ G. Seja f: G → C uma


função contínua tal que ∫𝛾 𝑓 = 0 para qualquer caminho seccionado suave fechado
𝛾 ⊂ 𝐺. Então, a função F: G → C, definida por 𝐹(𝑧) = ∫𝛾 𝑓, onde ϒz é qualquer
caminho seccionado suave em G, de z0 até z, é uma antiderivada para f em G.

234
Corolário: Suponha 𝐺 ⊆ ℂ uma região e z0 ϵ G. Seja f: G → C uma função contínua tal
que ∫𝛾 𝑓 = 0 para qualquer caminho poligonal fechado 𝛾 ⊂ 𝐺. Então, a função F: G →
C, definida por 𝐹(𝑧) = ∫𝛾 𝑓, onde ϒz é qualquer caminho poligonal em G, de z0 até z, é
uma antiderivada para f em G.

Definição: Suponha que ϒ0 e ϒ1 sejam caminhos fechados na região 𝐺 ⊆ ℂ,


paramerizados por ϒ0(t), com 0 ≤ t ≤ 1 e ϒ1(t), com 0 ≤ t ≤ 1, respectivamente. Então, ϒ0
é G-homotópico com ϒ1 se existe uma função contínua h : [0, 1]2 → G, tal que, para
cada s, t ϵ [0, 1] temos:
ℎ(𝑡, 0) = 𝛾0 (𝑡)

ℎ(𝑡, 1) = 𝛾1 (𝑡)

ℎ(0, 𝑠) = ℎ(1, 𝑠)

Usamos a notação ϒ1 ~G para significar que ϒ1 é G-homotópico com ϒ2.

A função h(t, s) é chamada de uma hematopia. Para cada s fixo, uma hematopia h(t, s)
é um caminho parametrizado por t e, à medida que s vai de 0 até 1, os caminhos se
transformam, continuamente, de ϒ0 para ϒ1.

Teorema de Cauchy: Suponha 𝐺 ⊆ ℂ uma região, f holomórfica em G, ϒ0 e ϒ1 caminhos


seccionados suaves em G e ϒ0 ~G ϒ1. Então:

∫ 𝑓=∫𝑓
𝛾0 𝛾1

235
Sequências Complexas

Como no caso dos reais, uma sequência complexa é uma função de inteiros positivos
(às vezes, não negativos) para os complexos. Seus valores são, usualmente, escritos
como an e a sequência é, unicamente, denotada por (𝒂𝒏 )∞ 𝑛=1 , (an)n≥1, ou,
simplesmente (an).

Definição: Suponha que (an) é uma sequência e L ϵ C, tal que, para todo ϵ > 0, existe
um inteiro N, tal que, para todo n ≥ N, temos | an – L| < ϵ. Então, a sequência (an) é
convergente e L é seu limite:

Lim 𝑎𝑛 = 𝐿
𝑛→∞
Se L não existe, an é divergente.

Séries Complexas

Uma série é uma sequência (an) cujos membros são da forma


𝑛

𝑎𝑛 = ∑ 𝑏𝑘
𝑘=1
Ou com k iniciando em 0.

Chamamos bk de sequência de termos da série.


Uma série converge para L se:
𝑛

lim ∑ 𝑏𝑘 = 𝐿
𝑛→∞
𝑘=1

Sequências e Séries de Funções Complexas

Definição: Seja 𝐺 ⊆ ℂ e fn: G → C para n ≥ 1. Dizemos que fn converge pontualmente


para f: G → C se, para cada z ϵ G:

lim 𝑓𝑛 (𝑧) = 𝑓(𝑧)


𝑛→∞

Dizemos que (fn) converge uniformemente para f: G → C se, para todo ϵ > 0 existe um
N tal que, para todo z ϵ G e todo n ≥ N, | fn(z) – f(z)| < ϵ.

236
Regiões de Convergência

Definição: Uma série de potências com centro em z0 é uma série da forma


∑ 𝑐𝑘 (𝑧 − 𝑧0 )𝑘
𝑘≥0
Onde c0, c1, ..., ck, ... ϵ C.

Séries de Taylor e Laurent

A série de Taylor só é definida se a função é holomórfica. A série de Laurent é definida,


inclusive, nos pontos de singularidade. A série de Laurent é uma série de potências que
contém termos negativos e positivos, enquanto a série de Taylor não pode ser
negativa (não tem potências negativas). Eis uma série de Taylor para o cálculo de uma
integral que não pode ser calculada via fórmulas:

𝑥
𝑆𝑒𝑛(𝑧) 𝑥3 𝑥5 𝑥7
∫ 𝑑𝑧 = 𝑥 − + − =
0 𝑧 3 × 3! 5 × 5! 7 × 7!


𝑥 2𝑛+1
= ∑(−1)𝑛
(2𝑛 + 1)[(2𝑛 + 1)!]
𝑛=0

E a série de Taylor que calcula o π:



4
∑(−1)𝑛 =𝜋
2𝑛 + 1
𝑛=0

A série de Laurent de uma função complexa f(z) é uma representação daquela função
em termos de uma série de potências que incluem termos de grau negativo. Ela pode
ser usada para representar funções complexas que não podem ser representadas por
uma série de Taylor. A série de Laurent para uma função complexa f(z), em torno de
um ponto c, é dada por:

𝑓(𝑧) = ∑ 𝑎𝑛 (𝑧 − 𝑐)𝑛
𝑛=−∞

Onde an e c são constantes definidas por uma integral de linha que é uma
generalização da fórmula integral de Cauchy:

1 𝑓(𝑧)𝑑𝑧
𝑎𝑛 = ∮
2𝑖𝜋 𝛾 (𝑧 − 𝑐)𝑛+1

237
Álgebra Geométrica
A álgebra geométrica, ou álgebra exterior, é um poderoso sistema matemático que
engloba vários conceitos matemáticos, entre eles número complexos e quaternions.
Toda a matemática usada na física se assenta sobre a álgebra geométrica. Álgebra
geométrica é o estudo de multivetores e do produto geométrico.

A álgebra exterior começa com a definição de uma operação sobre elementos. Os


elementos, por exemplo: (u, v, x, y, z, etc.), pertencem a um espaço vetorial em sua
forma mais abstrata como tuplas, tais como X = (x1, x2, x3, ..., xn) em um espaço de
dimensão n. Sobre estes elementos existe uma operação chamada produto exterior
(wedge product, grassman product). Essa operação é definida entre dois elementos x e
y, por exemplo, como 𝑥 ∧ 𝑦. Ela explicita o sentido de orientação através da anti
comutatividade, em que 𝑥 ∧ 𝑦 = −𝑦 ∧ 𝑥.
Apesar de ser uma definição bastante simples, ela enseja, virtualmente, todas as
manipulações possíveis que se pode fazer com vetores, graças aos trabalhos de dois
grandes matemáticos: Hermann Grassmann (alemão, 1809-1877) e William Clifford
(inglês, 1845-1879).

Bivetores

Em uma dimensão (1D), um ponto na reta é um escalar que pode ter sua magnitude
aumentada ou diminuída por outro ponto, independentemente do sinal do primeiro
ponto. Em 2D, uma linha no plano é um vetor que pode ter sua magnitude aumentada
ou diminuída por um escalar ou ser rotacionada no plano por um número complexo. O
sinal do escalar pode afetar o sentido o vetor. O vetor é uma linha orientada.

Também em 2D, podemos ter um simiplano (um “segmento” de plano) orientado, que
pode ser visualizado assim:

A orientação é dada pelas setas. A magnitude, representada por ‖𝐴‖,é dada pela área
do paralelogramo formado pelos dois vetores. A uma estrutura formada assim é dado
o nome de bivetor. Assim como todos os objetos nascido na dimensão nD, bivetores
existem nas dimensões superiores.

238
Independentemente da figura formada, se a orientação e a magnitude dela for igual à
orientação e magnitude de outra figura diferente, temos um mesmo bivetor. Então, já
podemos ver aí o início de um espaço bivetorial:

Multiplicação Escalar de Bivetores

Da mesma forma que um vetor, um bivetor pode ser multiplicado por um escalar, que
vai alterar a magnitude (área) do bivetor.

Adição de Bivetores

Podemos adicionar dois bivetores, simplesmente, justapondo-os:

Para adicionar dois bivetores de orientações diferentes é preciso fazer com que eles se
alinhem em um dos lados, ou seja, eles devem sofrer uma rotação no espaço em que
se encontram. A figura a seguir mostra uma soma vetorial e uma soma bivetorial.

239
Bases Bivetoriais

Como vetores, bivetores podem ser descritos em relação a uma base. As bases
vetoriais são mostradas na figura a seguir.

A base forma três semiplanos, E1, E2, E3 em cada plano.

Multiplicação de Bivetores

O produto interno de dois vetores a e b, dado por a • b, resulta em um escalar. Dado


esse escalar, é impossível recuperar os dois vetores termos ou qualquer informação
sobre eles. O que ocorre é uma redução de dimensão (de 1 para 0 – da linha para o
ponto). Será que existe algum tipo de produto que nos permite recuperar alguma
informação sobre os termos geradores do produto?

Como estamos trabalhando em D2, o produto externo (produto vetorial) não serve,
pois, ele só é definido em D3 (ocorre um aumento de dimensão – de 2 para 3). É
necessária uma operação em que o resultado permaneça em D2. Além do mais, ele
gera um escalar, como veremos mais pra frente.

Produto Exterior

A operação que nos permitirá isso é o produto exterior, cujo resultado é representado
pela área do paralelogramo que vimos acima e que corresponde à multiplicação de
dois dos lados do paralelogramo. Este produto é chamado de produto exterior, que é
representado pela seguinte expressão:


⃗ ∧𝒃
𝒂

240
Onde a e b são os dois lados principais do paralelogramo:

Dessa maneira, o produto exterior é um bivetor, cuja magnitude corresponde à área


do paralelogramo formado e a orientação é dada pelo sentido do vetor a.
Se aplicarmos a propriedade comutativa, fazendo 𝑏 ∧ 𝑎, a orientação será dada, então,
pelo sentido do vetor b.

Nota-se que a orientação não será a mesma, implicando que os dois produtos são
diferentes, implicando, por sua vez, que o produto exterior não é comutativo, como o
produto interno é. Diz-se que o produto exterior é anticomutativo, ou seja:

⃗ = −𝒃
⃗ ∧𝒃
𝒂 ⃗ ∧𝒂

As demais propriedades do produto interno continuam valendo para o produto


exterior.

O valor escalar da área do paralelogramo, ou a magnitude do bivetor, pode ser escrito


também em termos do ângulo entre os dois vetores a e b. A fórmula é semelhante à
fórmula do produto interno, com a diferença de que é usado o seno em vez do
cosseno do ângulo (sim, é a mesma fórmula do produto externo, com a diferença que
o vetor unitário n não está explicitado aqui – ver volume 3):

|𝑎 ∧ 𝑏| = |𝑎| × |𝑏| × 𝑆𝑒𝑛(𝜃)

O produto exterior de dois vetores paralelos é um bivetor nulo, pois, a área formada
entre eles é nula (o ângulo é nulo, e seno de zero vale zero). Assim:

𝑎∧𝑎 =𝑏∧𝑏=0

É possível fazer o produto exterior de um vetor a com um bivetor A, resultando em um


trivetor (enquanto um bivetor é associado a uma área, um trivetor é associado a um
volume):
⃗𝒂 ∧ ⃗𝑨 = ⃗𝑻

241
O produto exterior nos permite especificar a base bivetorial em termos de uma base
vetorial. Dada a base vetorial {𝑥̂, 𝑦̂, 𝑧̂ } e a base bivetorial {e1, e2, e3}, a figura a seguir nos
mostra que:

̂𝒚
𝒆𝟏 = 𝒙 ̂, ̂𝒛̂,
𝒆𝟐 = 𝒚 ̂𝒛̂
𝒆𝟑 = 𝒙

Note que os componentes da base vetorial formam os lados dos semiplanos e o


produto de cada dois desses componentes geram a área de cada semiplano, que
corresponde, então, a cada bivetor ei.

Comparando Produto Externo e Produto Exterior

Recordando o produto vetorial (produto externo) lá no volume 3, dados dois vetores


em D3: u = (a1, b1, c1) e v = (a2, b2, c2), o produto externo é dado por:

𝑢 × 𝑣 = (𝑏1 𝑐2 − 𝑐1 𝑏2 ) + (𝑐1 𝑎2 − 𝑎1 𝑐2 ) + (𝑎1 𝑏2 − 𝑏1 𝑎2 )

Este resultado corresponde a um escalar que pode ser calculado da seguinte maneira,
como já vimos no volume 3, quando estudamos o produto vetorial:

242
Caminhando da esquerda para a direita, multiplique os dois elementos da seta
vermelha, no sentido apontado por ela, e subtraia do resultado a multiplicação dos
elementos apontados pela seta azul que cruza com essa vermelha. Vá adicionando as
parcelas formadas por cada par de setas.

Isto equivale a cálculo do determinante da matriz formada pelos vetores.


Por exemplo, quando os vetores estiverem especificados em uma base, o produto
vetorial será:

𝑢 × 𝑣 = (𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑖 + (𝑐1 𝑎2 − 𝑎1 𝑐2 )𝑗 + (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑘

Isto equivale ao cálculo do determinante da seguinte matriz:

𝑖 𝑗 𝑘
(𝑎1 𝑏1 𝑐1 )
𝑎2 𝑏2 𝑐2

Usando a regra de Laplace, o determinante é dado por:

𝑏 𝑐1 𝑎1 𝑐1 𝑎1 𝑏1
𝑖| 1 | − 𝑗 |𝑎 𝑐2 | + 𝑘 |𝑎2 |
𝑏2 𝑐2 2 𝑏2

O resultado do produto externo é sempre um valor escalar em R3 (ou D3) em forma de


vetor. O resultado do produto exterior é sempre um bivetor.

Para os dois vetores u = (a1, b1, c1) e v = (a2, b2, c2) em R3, o produto exterior é definido
como:

0 𝑎1 𝑏2 − 𝑎2 𝑏1 𝑎1 𝑐2 − 𝑎2 𝑐1
𝑢 ∧ 𝑣 = 𝑢⨂𝑣 − 𝑣⨂𝑢 = (𝑏1 𝑎2 − 𝑏2 𝑎1 0 𝑏1 𝑐2 − 𝑏2 𝑐1 )
𝑐1 𝑎2 − 𝑐2 𝑎1 𝑐1 𝑏2 − 𝑐2 𝑏1 0

Onde o operador ⨂ é o produto tensorial.

243
Justificativa:

Lembrete: O produto tensorial de dois vetores (mesmo de dimensões diferentes) é dado por (exemplo
1):
𝑎×𝑑
𝑎 𝑎×𝑒
𝑑 𝑏 ×𝑑
(𝑏 ) ⨂ ( ) =
𝑒 𝑏×𝑒
𝑐
𝑐×𝑑
(𝑐 × 𝑒)

Exemplo 2:

2 5×2 5×1 5 × (−3)


(5 2 −7)⨂ ( 1 ) = ( 2 × 2 2×1 2 × (−3) ) =
−3 −7 × 2 −7 × 1 −7 × (−3)
10 5 −15
=( 4 2 −6 )
−14 −7 21

Assim:
𝑎2 𝑎1 𝑎2 𝑎1 𝑏2 𝑎1 𝑐2
𝑢⨂𝑣 = (𝑎1 𝑏1 𝑐1 )⨂ (𝑏2 ) = (𝑏1 𝑎2 𝑏1 𝑏2 𝑏1 𝑐2 )
𝑐2 𝑐1 𝑎2 𝑐1 𝑏2 𝑐1 𝑐2

𝑎1 𝑎1 𝑎2 𝑎2 𝑏1 𝑎2 𝑐1
𝑣⨂𝑢 = (𝑎2 𝑏2 𝑐2 )⨂ (𝑏1 ) = (𝑏2 𝑎1 𝑏1 𝑏2 𝑏2 𝑐1 )
𝑐1 𝑐2 𝑎1 𝑐2 𝑏1 𝑐1 𝑐2

𝑎1 𝑎2 𝑎1 𝑏2 𝑎1 𝑐2 𝑎1 𝑎2 𝑎2 𝑏1 𝑎2 𝑐1
𝑢⨂𝑣 − 𝑣⨂𝑢 = (𝑏1 𝑎2 𝑏1 𝑏2 𝑏1 𝑐2 ) − (𝑏2 𝑎1 𝑏1 𝑏2 𝑏2 𝑐1 ) =
𝑐1 𝑎2 𝑐1 𝑏2 𝑐1 𝑐2 𝑐2 𝑎1 𝑐2 𝑏1 𝑐1 𝑐2

0 𝑎1 𝑏2 − 𝑎2 𝑏1 𝑎1 𝑐2 − 𝑎2 𝑐1
= (𝑏1 𝑎2 − 𝑏2 𝑎1 0 𝑏1 𝑐2 − 𝑏2 𝑐1 )
𝑐1 𝑎2 − 𝑐2 𝑎1 𝑐1 𝑏2 − 𝑐2 𝑏1 0

244
Formas-N

Uma vez que os elementos de um espaço vetorial foram definidos, é possível definir
formatos nesse espaço vetorial. Como exemplo, uma forma-1, também chamada de
vetor, é qualquer função da forma F = ax + by + cz, onde a, b e c são escalares.
O produto exterior de duas formas-1, F = ax + by + cz e G = dx + ey + fz, é dado por:

𝐹 ∧ 𝐺 = (𝑎𝑥 + 𝑏𝑦 + 𝑐𝑧) ∧ (𝑑𝑥 + 𝑒𝑦 + 𝑓𝑧) =

= 𝑎𝑒𝑥 ∧ 𝑦 + 𝑎𝑓𝑥 ∧ 𝑧 + 𝑏𝑑𝑦 ∧ 𝑥 + 𝑏𝑓𝑦 ∧ 𝑧 + 𝑐𝑑𝑧 ∧ 𝑥 + 𝑐𝑒𝑧 ∧ 𝑦 =

= (𝑎𝑒 − 𝑏𝑑)𝑥 ∧ 𝑦 + (𝑎𝑓 − 𝑐𝑑)𝑥 ∧ 𝑧 + (𝑏𝑓 − 𝑐𝑒)𝑦 ∧ 𝑧

Isto produz uma forma-2, ou seja, um bivetor.

Este exemplo específico mostra uma conexão direta com o produto externo (produto
vetorial) em R3, assim:

𝑥̂ 𝑦̂ 𝑧̂
𝐹 ∧ 𝐺 = (𝑎 𝑏 𝑐 ) = (𝑏𝑓 − 𝑐𝑒)𝑥̂ + (𝑐𝑑 − 𝑎𝑓)𝑦̂ + (𝑎𝑒 − 𝑏𝑑)𝑧̂ =
𝑑 𝑒 𝑓

= (𝑏𝑓 − 𝑐𝑒)𝑦̂ ∧ 𝑧̂ + (𝑐𝑑 − 𝑎𝑓)𝑧̂ ∧ 𝑥̂ + (𝑎𝑒 − 𝑏𝑑)𝑥̂ ∧ 𝑦̂

Onde os vetores unitários são mapeados em formas-2:

𝑦 ∧ 𝑧 → 𝑥̂
𝑧 ∧ 𝑥 → 𝑦̂
𝑥 ∧ 𝑦 → 𝑧̂

De fato, muitas identidades vetoriais em D3 (melhor dizer D3 do que R3, pois, estamos
falando de geometria, de formas) podem ser expressas em termos de produtos
exteriores, sendo, porém, apenas casos especiais, pois, o produto exterior é mais geral.

Isso implica que o produto externo (produto vetorial) é um caso especial do produto
exterior. Por exemplo, enquanto o triplo produto vetorial não é associativo, o produto
exterior é, ou seja:
(𝐹 ∧ 𝐺) ∧ 𝐻 = 𝐹 ∧ (𝐺 ∧ 𝐻) = 𝐹 ∧ 𝐺 ∧ 𝐻

O produto externo e o produto exterior, quando escritos na forma de determinantes


são calculados da mesma maneira.
Sejam os vetores A = (a1, a2, a3) e B = (b1, b2, b3). O produto externo e o produto
exterior serão dados pelo cálculo do determinante da matriz respectiva criada com
esses vetores:

245
𝑒1 𝑒2 𝑒3 𝑒23 𝑒31 𝑒12
𝐴 × 𝐵 = 𝑑𝑒𝑡 (𝑎1 𝑎2 𝑎3 ) , 𝐴 ∧ 𝐵 = 𝑑𝑒𝑡 ( 𝑎1 𝑎2 𝑎3 )
𝑏1 𝑏2 𝑏3 𝑏1 𝑏2 𝑏3

A nota eij na matriz da direita corresponde aos índices do mapeamento de {𝑥̂, 𝑦̂, 𝑧̂ },
acima (e23 ≡ e1, ou seja 𝑦̂ ∧ 𝑧̂ = 𝑥̂).

Propriedades do Produto Exterior

1) (𝑎 ∧ 𝑏) ∧ 𝑐 = 𝑎 ∧ (𝑏 ∧ 𝑐)
2) (𝑎 + 𝑏) ∧ (𝑐 + 𝑑) = (𝑎 ∧ 𝑐) + (𝑎 ∧ 𝑑) + (𝑏 ∧ 𝑐) + (𝑏 ∧ 𝑑)
3) 𝑎 ∧ 𝑏 = −𝑏 ∧ 𝑎
4) 𝑎∧𝑎 =0

Sejam os dois vetores u e v, em D3, sob a base {e1, e2, e3}. A fórmula do produto
exterior é:
𝑢 ∧ 𝑣 = (𝑢1 𝑒1 , 𝑢2 𝑒2 , 𝑢3 𝑒3 ) ∧ (𝑣1 𝑒1 , 𝑣2 𝑒2 , 𝑣3 𝑒3 )

Aplicando a propriedade distributiva:

𝑢 ∧ 𝑣 = 𝑢1 𝑒1 ∧ 𝑣1 𝑒1 + 𝑢1 𝑒1 ∧ 𝑣2 𝑒2 + 𝑢1 𝑒1 ∧ 𝑣3 𝑒3 +
+𝑢2 𝑒2 ∧ 𝑣1 𝑒1 + 𝑢2 𝑒2 ∧ 𝑣2 𝑒2 + 𝑢2 𝑒2 ∧ 𝑣3 𝑒3 +
+𝑢3 𝑒3 ∧ 𝑣1 𝑒1 + 𝑢3 𝑒3 ∧ 𝑣2 𝑒2 + 𝑢3 𝑒3 ∧ 𝑣3 𝑒3

Claramente, os vetores marcados em amarelo são ortogonais, daí, o produto exterior é


nulo:
𝑢 ∧ 𝑣 = 0 + 𝑢1 𝑒1 ∧ 𝑣2 𝑒2 + 𝑢1 𝑒1 ∧ 𝑣3 𝑒3 +
+𝑢2 𝑒2 ∧ 𝑣1 𝑒1 + 0 + 𝑢2 𝑒2 ∧ 𝑣3 𝑒3 +
+𝑢3 𝑒3 ∧ 𝑣1 𝑒1 + 𝑢3 𝑒3 ∧ 𝑣2 𝑒2 + 0

246
Uma coisa interessante a ser notada é que o produto exterior, em D3, entre vetores de
mais de três dimensões é sempre nulo, pois, sempre haverá uma ortogonalidade entre
dois dos vetores.

Também, a vantagem do produto exterior é que ele pode ser estendido para
dimensões superiores, e a derivação da fórmula na dimensão escolhida ocorre de uma
maneira bem mais natural do que a do produto externo.

O produto exterior é, conceitualmente, mais simples do que o produto externo.

Fechamento no Plano

O produto exterior apresenta o mesmo problema do produto interno: o resultado


nada nos diz sobre os vetores termos. O que podemos fazer é juntar os dois produtos
através de uma operação qualquer para ver se conseguimos algo.

Que operação nos daria um resultado e ainda nos permitiria manter os termos que nos
levaram ao resultado?

A principal operação em matemática é a adição. Todas as demais podem ser resumidas


a ela. Junto com a adição, a multiplicação é bastante útil também, mas, a multiplicação
não vai no ajudar no que queremos, pois, dados a e b, a x b sempre será um escalar,
pois, o resultado é a adição de b com ele mesmo a vezes.

Por outro lado, a + b só será uma escalar se a e b forem objetos do mesmo tipo. Por
exemplo: 2 bananas + 3 bananas = 5 (bananas).
Se forem objetos diferentes, ainda teremos um resultado, mas, ele ficará na forma da
adição: 2 bananas + 3 laranjas = 2 + 3. Poderíamos dizer que resulta em 5 frutas,
porém, não é banana e não é laranja. É como se o resultado fosse para outro conjunto,
diferente do conjunto original. É a mesma coisa que acontece quando extraímos a raiz
quadrada do número racional 2. O resultado vai para o conjunto dos números
irracionais.

Você poderia dizer: Ah, a princípio, eu posso multiplicar 2 bananas por 3 laranjas sem
resultar em um escalar, ou seja, eu manteria 2 x 3. Sim, porém, a princípio também,
você não obteria 6 frutas, mas, 8 frutas: 6 laranjas e 2 bananas, o que levaria à
operação 6 + 2, que é uma adição, como fizemos com 2 bananas + 3 laranjas. Além
disso, estaria errado, matematicamente.

247
Em resumo, a + b é mais complexo4 do que ab e é essa complexidade que vai nos
permitir manter os termos iniciais.

Então, adição é a operação que usaremos para juntarmos o produto interno com o
produto exterior:
𝑎 ∙ 𝑏⃗ + 𝑎 ∧ 𝑏⃗

Esta é uma soma de um escalar com um bivetor. É a soma de dois produtos diferentes,
mas, ainda assim, é uma soma válida. A expressão acima recebe o nome de:

Produto Geométrico

Que é dado por:


⃗𝒂⃗𝒃 = ⃗𝒂 ∙ ⃗𝒃 + ⃗𝒂 ∧ ⃗𝒃

E este produto está no coração da álgebra geométrica.

Veja o produto geométrico de um vetor com ele mesmo:

𝑎𝑎 = 𝑎 ∙ 𝑎 + 𝑎 ∧ 𝑎

O ângulo entre os vetores é nulo. O produto interno usa o cosseno, enquanto o


produto exterior usa o seno. Assim, a primeira parcela é multiplicada pelo cosseno de
zero, enquanto a segunda é multiplicada pelo seno de zero:

É um resultado bem simples: o produto geométrico de um vetor por ele mesmo é igual
ao quadrado da magnitude desse vetor. Agora, veja esta expressão:

𝑎 𝑎2
× 𝑎 = =1
|𝑎|2 |𝑎|2

Isto significa que o termo da esquerda (em vermelho) é a inversa de 𝑎, ou seja 𝑎−1 .
Isto também significa que não só podemos multiplicar vetores, mas, também fazer
divisão com eles.

4
Sim, a + b, da maneira que foi colocado aqui é um número complexo
248
Vamos ver o que acontece quando trocamos de posição os termos do produto
geométrico 𝑎𝑏⃗ = 𝑎 ∙ 𝑏⃗ + 𝑎 ∧ 𝑏⃗. Já sabemos que o produto interno é comutativo e que
o produto exterior é anticomutativo. A figura esclarece a operação que vamos fazer:

Agora, temos duas fórmulas interessantes para o produto geométrico. Uma com os
termos (não as parcelas) numa dada posição e outra para quando os termos são
trocados de posição:
⃗ ⃗𝒃 = 𝒂
𝒂 ⃗ ∙ ⃗𝒃 + 𝒂
⃗ ∧ ⃗𝒃 (𝑃𝐺1)

⃗𝒃𝒂 ⃗ ∙ ⃗𝒃 − 𝒂
⃗ =𝒂 ⃗ ∧ ⃗𝒃 (𝑃𝐺2)

Uma coisa interessante que podemos fazer com estas duas equações é adicioná-las e
subtraí-las:

Manipulando estes resultados, podemos chegar às seguintes fórmulas para o produto


interno e o produto exterior em termos do produto geométrico:

𝑎𝑏⃗ + 𝑏⃗𝑎 𝑎𝑏⃗ − 𝑏⃗ 𝑎


𝑎 ∙ 𝑏⃗ = , 𝑎 ∧ 𝑏⃗ =
2 2

249
Produto Geométrico de Vetores Base

Sejam 𝑒1 = 𝑥̂, 𝑒2 = 𝑦̂, 𝑒3 = 𝑧̂ .

Sabemos que
𝑎
×𝑎 =1
|𝑎|2

Se 𝑎 é um vetor unitário, então:


𝑎
× 𝑎 = 1 ⟹ 𝑎2 = |𝑎|2 = 1
|1|2

Desse modo, para qualquer ei:

𝒆𝒊 𝒆𝒊 = 𝑒𝑖2 = |𝑒𝑖 |2 = 𝟏 (𝑃𝐺3)

Qual é o produto geométrico de dois vetores base diferentes? Sabendo o que o


produto geométrico faz com os vetores base poderemos determinar o produto
geométrico de quaisquer dois vetores escrevendo-os em termos dos vetores base.
O quadro a seguir ilustra a dedução das equações.

Combinando PG4 com PG5 temos:

𝒆𝒊 𝒆𝒋 = −𝒆𝒋 𝒆𝒊 (𝑃𝐺6)

Dessa maneira, os vetores base são escritos como produtos geométricos, em vez de
como produtos exteriores:
{𝒙
̂𝒚̂, 𝒚 ̂𝒛̂}
̂𝒛̂, 𝒙

250
As equações PG3 e PG6 serão importantes para nós daqui pra frente.

Agora temos uma maneira de escrever o produto geométrico sem a necessidade de


mencionarmos o produto interno ou o produto exterior. Podemos demonstrar isso
com dois vetores genéricos em 3D:

𝑢
⃗ = 𝑎1 𝑥̂ + 𝑏1 𝑦̂ + 𝑐1 𝑧̂

𝑣 = 𝑎2 𝑥̂ + 𝑏2 𝑦̂ + 𝑐2 𝑧̂

Então, para escrevermos o produto geométrico usamos o que já aprendemos, como as


propriedades distributiva, associativa, comutativa, mais as equações PG3 e PG6 e as
simplificações que já estudamos, chegando ao seguinte resultado:

𝑢
⃗ 𝑣 = 𝑎1 𝑎2 + 𝑏1 𝑏2 + 𝑐1 𝑐2 +
+(𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑥̂𝑦̂ +
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑦̂𝑧̂ +
+(𝑎1 𝑐2 − 𝑐1 𝑎2 )𝑥̂𝑧̂

Isto representa o produto geométrico de dois vetores em três dimensões.

Comparando a expressão acima com a fórmula original do produto geométrico:

𝑢
⃗𝑣=𝑢
⃗ ∙𝑣+𝑢
⃗ ∧𝑣

Podemos ver nas duas expressões uma parte escalar e uma parte bivetor. Então,
podemos obter uma igualdade:

⃗ ∙𝒗
𝒖 ⃗ = 𝑎1 𝑎2 + 𝑏1 𝑏2 + 𝑐1 𝑐2

⃗ = (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑥̂𝑦̂ +
⃗ ∧𝒗
𝒖
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑦̂𝑧̂ +
+(𝑎1 𝑐2 − 𝑐1 𝑎2 )𝑥̂𝑧̂

Veja como a última expressão lembra a fórmula do produto externo (produto vetorial).
Fazendo:
𝑢
⃗ = 𝑎1 𝑖 + 𝑏1 𝑗 + 𝑐1 𝑘

𝑣 = 𝑎2 𝑖 + 𝑏2 𝑗 + 𝑐2 𝑘

251
Efetuando o produto vetorial, mantendo a ordem do produto exterior lá de cima e
trocando o sinal da última parcela externa para manter a ordem das parcelas internas
como está no produto externo:

⃗ = (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑘 +
⃗ ×𝒗
𝒖
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑖 −
−(𝑎1 𝑐2 − 𝑐1 𝑎2 )𝑗

Sem a troca de sinal que fizemos, o produto vetorial fica da maneira como ele é
calculado normalmente:

⃗ = (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑘 +
⃗ ×𝒗
𝒖
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑖 +
+(𝑐1 𝑎2 − 𝑎1 𝑐2 )𝑗

Eis um exemplo mais concreto:

Efetuando a multiplicação, distribuindo os termos, usando as equações PG3 e PG6 e


simplificando, chegaremos ao seguinte resultado:

12𝑥̂𝑦̂𝑧̂ − 20𝑧̂ + 4𝑦̂

252
Álgebra Geométrica em 2D

Em álgebra linear, trabalhamos com vetores que contêm dois componentes em 2D (os
dois componentes estão grifados em amarelo):

𝑢
⃗ = 𝑎𝑥̂ + 𝑏𝑦̂

Na álgebra geométrica, trabalhamos com multivetores:

Um multivetor é a soma de diferentes espécies de vetores. Então, um multivetor em


2D possui quatro componentes, como mostrado acima.

Um bivetor em 2D tem apenas um componente (𝑎𝑥̂𝑦̂), parecendo, assim, como um


escalar. Na verdade, eles são diferentes de escalares, sendo chamados, então, de
pseudo-escalares e o par base 𝑥̂𝑦̂ é representado por uma única letra no pseudo-
escalar: i. Suponha o vetor 𝒗
⃗ = 𝟐𝒙̂ + 𝟑𝒚 ̂, onde 𝑥̂ e 𝑦̂ é uma base. Fazendo 𝑣 𝑖 =
(2𝑥̂ + 3𝑦̂)𝑖 vai causar uma rotação de 90 graus para a esquerda no vetor. Se o produto
for feito pela esquerda 𝑖𝑣 = 𝑖(2𝑥̂ + 3𝑦̂), ocorre, também, uma rotação de 90 graus, só
que para a direita. Desenvolvendo a primeira equação chegamos a 𝑣 𝑖 = (2𝑦̂ − 3𝑥̂)𝑖.
Desenvolvendo a segunda equação: 𝒊𝒗 ⃗ = 𝒊(−𝟐𝒚 ̂ + 𝟑𝒙 ̂). A inversão dos sinais se deve
à anti-comutatividade do produto geométrico.

253
Agora, qual é o produto geométrico de i por i?

Partindo de 𝒊 = 𝑥̂𝑦̂, temos que:

𝒊2 = (𝑥̂𝑦̂)2 = (𝑥̂𝑦̂)(𝑥̂𝑦̂)

Rearranjando o lado direito e aplicando as equações PG3 e PG6:

𝒊2 = (𝑥̂𝑦̂)2 = (𝑥̂𝑦̂)(𝑥̂𝑦̂) = −𝑦̂𝑥̂𝑥̂𝑦̂ = −𝑦̂𝑦̂𝑥̂𝑥̂ = −1(1) = −1

O que isto lembra? Sim, o número imaginário i do conjunto dos números complexos.
A conclusão é que números imaginários são, na verdade, pseudo-escalares e i
representa o pseudo-escalar unitário. Também, números complexos são equivalentes
a multivetores de duas dimensões, que são a soma de um escalar com um bivetor: a +
bi. E o produto geométrico de dois desses tipos de multivetores é igual ao produto de
dois números complexos.

Igualmente, a multiplicação de um vetor por i, como mostrado na figura acima,


funciona como a multiplicação de um número complexo por i. Isso é uma regra geral:

Multiplicar um vetor por um número complexo funciona como a multiplicação


complexa, rotacionando e variando a magnitude do vetor.

Isso leva a uma maneira muito simples de executar rotações.

Suponha que queiramos rotacionar um vetor 𝑣 por um ângulo θ, conforme a figura


mostra:

Tudo o que temos que fazer é encontrar o número complexo que representa essa
rotação. Já sabemos, do volume 3, que o número complexo que procuramos é eiθ que,
claramente, de acordo com o que vimos até agora, é um bivetor!

Bivetores são números imaginários. Então, podemos elevar um número a um


bivetor da mesma maneira que eleva um número qualquer a um número
imaginário.

254
Multiplicando 𝑣 por eiθ causa a rotação que queremos 𝑣𝑒 𝑖𝜃 . Podemos, também,
tentar a multiplicação pelo outro lado: 𝑒 𝑖𝜃 𝑣. Isso causa a rotação contrária (para a
direita, de mesmo ângulo).

É como na multiplicação complexa: a multiplicação pelo conjugado causa a rotação


contrária, ou seja, multiplicar pelo complexo pelo lado direito é igual a multiplicar pelo
conjugado dele pelo lado esquerdo.

Voltemos ao produto geométrico de dois vetores:

𝑢
⃗𝑣=𝑢
⃗ ∙𝑣+𝑢
⃗ ∧𝑣

Note que isso é a adição de um escalar com um bivetor que, juntos, equivalem a um
número complexo. Que rotação este complexo específico representa?

Sabemos que 𝑢 ⃗ ∧ 𝑣 = |𝑢||𝑣|𝒊𝑆𝑒𝑛(𝜃). Note que nesta


⃗ ∙ 𝑣 = |𝑢||𝑣|𝐶𝑜𝑠(𝜃) e que 𝑢
última expressão o vetor unitário i está multiplicando todo o lado direito para garantir
que isso seja um vetor (um bivetor, no caso). Daí, temos que:

⃗ 𝑣 = |𝑢
𝑢 ⃗ ||𝑣| × [𝐶𝑜𝑠(𝜃) + 𝑖𝑆𝑒𝑛(𝜃)]

A expressão destacada em amarelo é, exatamente, a fórmula de Euler, que vimos lá no


volume 3, que é dada por:

𝑒 𝑖𝜃 = 𝐶𝑜𝑠(𝜃) + 𝑖𝑆𝑒𝑛(𝜃)

Sim, é o número complexo mencionado acima, que causa a rotação de um vetor.


Com isso, temos que o produto geométrico de 𝑢
⃗ e 𝑣 é dado por:

⃗𝒗
𝒖 ⃗ = |𝒖 ⃗ | × 𝒆𝒊𝜽
⃗ ||𝒗

Isso implica que a rotação especificada pelo produto geométrico de dois vetores é,
exatamente, igual ao ângulo entre os dois vetores e esse ângulo variará de acordo com
as magnitudes multiplicadas dos dois vetores.

Isto nos dá uma visão concreta do produto geométrico de dois vetores. O produto
representa a ação de rotação pelo ângulo entre eles e a variação dos comprimentos
pelas magnitudes dos vetores. Também nos dá uma nova maneira de calcularmos
rotações sem o envolvimento de exponenciações complexas, senos e cossenos.

255
Digamos que queiramos rotacionar um vetor 𝑤
⃗⃗ pelo ângulo formado por dois vetores,
𝑢
⃗ e 𝑣:

Sabemos que 𝑢 ⃗ ||𝑣| × 𝑒 𝑖𝜃 . Se normalizarmos 𝑢


⃗ 𝑣 = |𝑢 ⃗ e 𝑣 (transformá-los em vetores
𝑖𝜃
unitários), teremos 𝑢̂𝑣̂ = 𝑒 e o vetor 𝑤 ⃗⃗ rotacionado será, exatamente, 𝑤⃗⃗ 𝑢̂𝑣̂:

Note que se invertermos a ordem de 𝑢 ⃗𝑣=𝑢 ⃗ ∙𝑣+𝑢 ⃗ ∧ 𝑣 , teremos 𝑣𝑢


⃗ =𝑢
⃗ ∙𝑣−𝑢 ⃗ ∧ 𝑣.
É a mesma equação sem a ordem invertida, com a diferença que a parte imaginária
fica negativa. Isto é, exatamente, a forma do conjugado complexo. Então, invertendo a
ordem de multiplicação (produto geométrico) de dois vetores equivale a encontrar o
conjugado.

Sabemos também que multiplicar um número complexo pelo lado direito é a mesma
coisa que multiplicá-lo à esquerda pelo seu conjugado:

̅̅̅̅̅̅
[𝑢
⃗ 𝑣 ] = 𝑣𝑢

⃗⃗ 𝑍 = 𝑍̅𝑤
𝑤 ⃗⃗

Podemos combinar estas duas equações para determinar que revertendo a ordem do
produto geométrico de três vetores não altera o produto e que um produto e outro
executam a mesma rotação (no vetor 𝑤⃗⃗ ):

𝑤
⃗⃗ 𝑢
⃗ 𝑣 = 𝑣𝑢
⃗𝑤⃗⃗

256
Álgebra Geométrica em 3D

Em 2D temos um multivetor assim:

E são formados de quatro componentes:

Porém, em 3D, um multivetor é assim:

Este multivetor é formado por oito componentes:

Um trivetor comum é apresentado assim: 𝑎𝑥̂𝑦̂𝑧̂ . Como no caso do bivetor em 2D, um


trivetor assim se parece com um escalar. Também, como em 2D, por ser mais que um
escalar, o trivetor recebe o nome de pseudo-escalar, porém, um bivetor 𝑏𝑥̂𝑦̂ em 3D
não tem mais esse nome.

Em 3D, o pseudo-escalar unitário continua sendo representado por i., ou seja, onde
aparece 𝑎𝑥̂𝑦̂𝑧̂ , pode igualar a 𝑎𝑖. Igualmente a 2D, temos que i2 = –1 e, assim,
trivetores podem ser considerados como números imaginários. Porém, em 3D, esses
números imaginários não representam rotações, como em 2D.

Em 3D, se A é um multivetor, então Ai = iA, o que já é uma diferença para 2D, onde a
comutação não vale.

257
Um vetor em 3D multiplicado por i resulta em um bivetor. Por exemplo, dado o vetor
unitário 𝑥̂ em 3D, temos que 𝑥̂𝒊 é um bivetor:

𝑥̂𝒊 = 𝑥̂(𝑥̂𝑦̂𝑧̂ ) = 𝑥̂𝑥̂𝑦̂𝑧̂ ⟹ 𝑥̂𝒊 = 𝑦̂𝑧̂

O termo destacado em amarelo é igual a 1 e 𝑦̂𝑧̂ é um bivetor. E mais: o bivetor 𝑦̂𝑧̂ e


seu vetor gerador 𝑥̂ são perpendiculares entre si:

Veja como a regra da mão direita pode ser aplicada nesse caso, com os quatro dedos
externos seguindo a orientação do bivetor e o polegar apontando o sentido do vetor
(imagine os quatro dedos seguindo pelo vetor inferior, depois o que sobe pela direita,
o superior pela esquerda, etc., ao mesmo tempo fechando os dedos na mão).

⃗ , se esta equação for multiplicada por i (novamente), o bivetor B vira um


Dado 𝑣 𝑖 = 𝐵
vetor:
⃗ 𝑖 ⟹ −𝑣 = 𝐵
𝑣𝑖 × 𝑖 = 𝐵 ⃗𝑖

Com isso, a orientação do bivetor muda, o sentido do vetor muda, e passa a valer a
regra da mão esquerda:

Em 3D, bivetores podem ser representados pelo vetor que é normal a eles e que leva
alguns autores a escreverem um multivetor genérico assim:

⃗ + 𝑣𝑖 + 𝑏⃗𝑖
𝑎+𝑢

Simplesmente em termos de vetores e escalares. Fica estranho, pois, parece uma


adição de vetores que, normalmente, resulta em um vetor, mas, não em um
multivetor – vetores e bivetores são semelhantes em 3D, sendo chamados por alguns
de pseudo-vetores.

258
Vimos que o produto externo é um caso especial do produto exterior, o que implica
que as equações as duas equações a seguir são semelhantes:

⃗ = (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑧̂ +
⃗ ×𝒗
𝒖
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑥̂ +
+(𝑎1 𝑐2 − 𝑐1 𝑎2 )𝑦̂

⃗ = (𝑎1 𝑏2 − 𝑏1 𝑎2 )𝑥̂𝑦̂ +
⃗ ∧𝒗
𝒖
+(𝑏1 𝑐2 − 𝑐1 𝑏2 )𝑦̂𝑧̂ +
+(𝑎1 𝑐2 − 𝑐1 𝑎2 )𝑥̂𝑧̂

Com a única diferença que a primeira gera um vetor e a segunda gera um bivetor.

Sabemos que um vetor multiplicado por i se torna um bivetor. Isto nos mostra que:

𝑢
⃗ ∧ 𝑣 = 𝒊(𝑢
⃗ × 𝑣)

Ou seja, o produto exterior é o produto externo multiplicado por i. Então podemos


dispensar o produto exterior e usar só o produto externo para representarmos um
bivetor, não é? Não. Na verdade, trata-se do oposto: não precisamos do produto
externo porque, sempre que o produto externo aparece em uma equação, ele tem que
produzir um bivetor, não um vetor.

Um exemplo que podemos usar para demostrar isso é o torque. Vamos recuperar a
figura mostrada no estudo do produto vetorial:

259
Sabemos que o vetor F está causando uma rotação por causa da seta mostrando o
sentido do giro e, também, por nossa intuição. Nenhum dos três vetores dão uma
visualização de rotação. A fórmula do torque (T) é dada pelo produto vetorial de r com
F.

Veja agora, quando substituímos o produto externo (produto vetorial) pelo produto
exterior. Primeiro, a fórmula mudará para 𝑇 = 𝑟 ∧ 𝐹. Então, refazemos a figura:

Veja como fica bem mais visual a rotação. E mais: sabemos que bivetores representam
rotações. Veja como o bivetor está orientado no sentido correto da rotação gerada
pelo torque. Até a aplicação da regra da mão direita fica mais visual. E mais ainda: com
o produto vetorial o vetor resultante (o vetor torque) não está no plano de rotação,
como seria de esperar. O produto exterior garante isso, como se pode ver.

Números Complexos em 3D

Sabemos que, em 2D, um escalar adicionado a um bivetor corresponde a um número


complexo. Em 3D, um escalar adicionado a um bivetor não é um número complexo, e
um quaternion.

260
Introdução à Teoria dos Grafos
Um grafo é uma estrutura que mostra um conjunto de objetos em que pares desses
objetos possuem algum tipo de relacionamento.

Cada objeto corresponde a uma abstração matemática chamada nodo (ou vértice) e
cada ligação entre dois vértices é chamada de conexão (edge).

Grafo Direcionado

Uma conexão pode ser direcionada ou não direcionada. Por exemplo, se a relação é
de cumprimentar (shake hands), o grafo é não direcionado, pois, há uma mão dupla na
relação – um cumprimento exige ação dos dois lados, ida e volta. Por outro lado, se a
relação é “você me deve dinheiro”, o grafo é direcionado (mão única, só ida ou só
volta).

Se todos os edges são direcionados, o grafo é direcionado; se todos os edges são não
direcionados, o grafo é não direcionado.

Matematicamente, um grafo é um par G(V, E), onde V é um conjunto de elementos


chamados vértices (nodos) e E é um conjunto de pares de vértices (x, y), onde cada par
é chamado de edge. Os vértices x e y de um edge são chamados de pontos terminais
do edge.

Diz-se que o edge une x e y e é incidente sobre x e sobre y. Um vértice pode não
pertencer a um edge.

Multigrafo

Um multigrafo é uma generalização que permite que vários edges tenham o mesmo
ponto terminal.

Loops

Alguns grafos podem conter loops, que são linhas que saem de um vértice e entra nele
mesmo.

Ordem de um Grafo

A ordem de um grafo é dada pela quantidade de vértices que ele possui.

261
Exemplos de Grafos

Tamanho de um Grafo

O tamanho de um grafo é dado pela quantidade de edges que ele possui.

Grau de um Vértice

O grau de valência de um vértice é a quantidade de edges que incidem no vértice. Para


grafos com loop, o loop é contado duas vezes: uma que entra; uma que sai.

Em um grafo de ordem n, o grau máximo de cada vértice é n – 1 (ou n, se tiver loop) e


o número máximo de edges é n(n – 1)/2, ou n(n + 1)/2 se tiver loops.

262
Exemplo de um Grafo

𝑉 = {𝑉1, 𝑉2 , 𝑉3 , 𝑉4 , 𝑉5 , 𝑉6 , 𝑉7 , 𝑉8

𝐸 = {{𝑉1 , 𝑉2 }, {𝑉1 , 𝑉4 }, {𝑉1 , 𝑉5 }, {𝑉2 , 𝑉3 }, {𝑉3 , 𝑉8 }, … }

E assim se completa o conjunto E com todas as conexões válidas. Existe uma ordem
nos dois conjuntos quando o grafo é direcionado.

Relação de Adjacência

Os edges de um grafo definem uma relação simétrica nos vértices que é chamada de
relação de adjacência. Especificamente, dois vértices x e y são adjacentes se {x, y} é
um edge. Em outras palavras, vértices ligados diretamente um ao outro são
adjacentes.

263
Matriz de Adjacência

Uma matriz de adjacência é uma matriz quadrada onde se representa um grafo finito.
Os elementos da matriz indicam se cada par de vértices são adjacentes (são
conectados) ou não, no grafo. No caso especial de um grafo finito simples temos uma
matriz (0, 1), ou seja, uma matriz com zeros na diagonal principal e 1 nas posições
onde ocorrem relacionamentos entre os respectivos pares. Caso haja um loop em um
vértice, ele se relaciona consigo mesmo e é colocado o valor 2 no lugar do zero ali. Se o
grafo é não direcionado (as conexões são bidirecionais) temos uma matriz simétrica.
Uma matriz de adjacência é chamada também de matriz de conexões.

A figura a seguir mostra dois grafos e suas respectivas matrizes adjacentes (em
vermelho).

Um grafo pode ser completamente especificado por sua matriz de adjacência, com aij
especificando a natureza da conexão entre o vértice i e o vértice j.

Matriz de Incidência

É uma matriz cujos elementos representam a incidência ou não dos pares de vértices
de um grafo e representa, também, o grau de cada vértice.

Grafos e Outras Estruturas

Toda árvore é um grafo (com restrições e regras), mas, nem todo grafo é uma árvore.

264
Número de Ramsey

O número de Ramsey, R(m, n) dá a solução para o problema da festa, que deseja saber
a quantidade R(m, n) de pessoas que devem ser convidadas para uma festa de tal
modo que pelo menos m delas se conheçam (sejam amigos) ou que pelo menos n
delas não se conheçam.

Teorema: Dados os inteiros positivos m e n, qualquer festa suficientemente grande


conterá um grupo de m amigos mútuos e um grupo de n não amigos mútuos.

Na linguagem dos grafos, o número de Ramsey é a quantidade mínima de vértices v =


R(m, n) tal que todos os grafos não direcionados simples de ordem v contenha um
clique de ordem m ou um conjunto independente de ordem n.

Um grafo completo Kn é um grafo de n vértices onde cada par de vértices é


conectado por uma linha.

Um clique dentro de um grafo é um conjunto de vértices que são conectados par a


par, uns aos outros. Em outras palavras, um clique de tamanho n em um grafo é
uma cópia de Kn dentro do grafo.

265
O teorema pode ser reescrito assim: Dados os inteiros positivos m e n, qualquer grafo
completo com quantidade suficiente de vértices, com cada conexão colorida de azul
ou de vermelho, conterá um clique vermelho de m vértices ou um clique azul de n
vértices.

Propriedades

 R(m, 1) = R(1, m) = 1
 R(m, 2) = R(2, m) = m
 R(3, 3) = 6

Grafos na Vida Real

Facebook e LinkedIn são exemplos de grafos não direcionados (usuário A aceitar


usuário B implica usuário B aceitar usuário A). Já o Twitter é um exemplo de grafo
direcionado (usuário A segue usuário B, mas, usuário B não precisa seguir o usuário A
para a relação se estabelecer).

266
Grafos e Matrizes

Seja o seguinte grafo representando uma rede de relacionamento:

Podemos transforma este gráfico em uma tabela (ou matriz):

1 2 3 4 5 6
1 0 0 1 1 1
2 0 0
3 0
4 1 0
5 1 0
6 1 0

1 e 2 não se relacionam, então colocamos um zero na célula respectiva. Como não há


auto relacionamento, colocamos um zero em cada célula da diagonal principal. A
tabela completa fica:

1 2 3 4 5 6
1 0 0 0 1 1 1
2 0 0 0 1 1 0
3 0 0 0 0 0 1
4 1 1 0 0 0 0
5 1 1 0 0 0 0
6 1 0 1 0 0 0

Para saber se há relacionamento ou não entre duas pessoas na tabela, basta verificar
se há um 1 ou um 0, respectivamente.

Olhando essa tabela como uma matriz A, temos:

267
0 0 0 1 1 1
0 0 0 1 1 0
𝐴= 0 0 0 0 0 1
1 1 0 0 0 0
1 1 0 0 0 0
(1 0 1 0 0 0)

Essa matriz associada ao grafo é chamada de matriz de adjacência. Fica muito fácil
trabalhar com as matrizes do que com seus respectivos grafos:

Quantos caminhos de comprimento 1 existem entre dois vértices quaisquer?

Veja a coluna 6, linha 1. Ali é mostrado que há um relacionamento entre a pessoa 1 e a


pessoa 6. O 1 naquela posição mostra que só existe um caminho (1 edge) de
comprimento 1 entre elas.

Veja que existe zero caminho de comprimento 1 entre a pessoa 1 e a pessoa 2. Existem
caminhos entre 1 e 2, mas, não de comprimento 1. Existe um caminho de
comprimento 2 (dois edges) entre elas, dados por 1-4-2 e 1-5-2.

Uma maneira mais rápida de se descobrir isso é multiplicando a matriz por ela mesma:

3 2 1 0 0 0
2 2 0 0 0 0
𝐴 = 1
2 0 1 0 0 0
0 0 0 2 2 1
0 0 0 2 2 1
(0 0 0 1 1 2)

Na diagonal principal tem-se a quantidade de caminhos de comprimento 2 que uma


pessoa tem com ela mesma. No caso específico da pessoa 1, temos os seguintes
caminhos: 1-4-1, 1-5-1, 1-6-1, ou seja, 3 caminhos de comprimento 2.

Então, An gera a quantidade de caminhos de comprimento n que existe entre uma


pessoa e a outra na rede.

Para cada conexão nova no grafo, basta adicionar 1 na posição correspondente na


matriz.

268
Brincando com Números
Relembrando: Este capítulo, que aparece em todos os livros, está mais para um
exercício mental para escovar alguns neurônios e, possivelmente, acorda outros que
estejam dormindo, do que para um material de ensino no ramo da matemática.

Pensar fora da caixa da matemática é um excelente método para se tornar excelente


no campo da matemática.

Operando Com Formas

No livro 3 vimos a “multiplicação” de um círculo por um segmento gerar um cilindro.


Que tal estender isso com mais operações? Vamos ver o que podemos obter. Nas
figuras que se seguem, tente construir a operação em tua mente. Não se prenda aos
resultados que dei. Pode ser que não estejam corretos.

269
270
Sejam A e B duas figuras, como as acima. Então, a expressão A x B pode ser lida de
seguinte maneira: Uma figura no formato de A construída de A quantidades da figura
B.

271
Derivada ou Derivação?

Derivar é uma daquelas palavras que tem sentido múltiplo. Pode significar desviar,
mudar o curso, alterar o rumo ou ser originário de, vir de, ter uma procedência.
Certamente, a função 2x se origina, vem, procede da função x2. Porém, a maioria dos
autores mencionam numa palavra só (derivadas) a operação e o resultado quando, o
que importa mesmo é a operação e esta tem um nome: Derivação. O nome de
preferência, que faz mais sentido, no entanto, é Diferenciação, pois, a operação trata
da diferença que ocorre na saída da função quando se introduz uma diferença na
entrada.

Função Derivada ou Taxa de Variação?

Vimos que a derivada num ponto qualquer de uma função é equivalente a uma reta
tangente naquele ponto, conforme mostra a figura:

Se a derivada de x2 é 2x, por que temos tantas retas tangentes (mostrando duas) em
que nenhuma delas é a reta da função 2x? A reta correspondente é secante à curva x2.

Porque, apesar da derivada poder ser representada por uma função, a expressão 2x
mostra uma razão da variação de y para cada valor de x.

Primeiro, vamos ver isso analiticamente e, depois, de maneira numérica.

272
Seja f(x) = x2. Se acrescentarmos uma pequena variação em x, nomeada como ∆x,
temos um novo argumento para a função. Colocando esse novo argumento na função
f:

Veja que (x + ∆x)2 é um produto notável, cujo desenvolvimento é mostrado à direita


do sinal de igual (como você já sabe). Veja, também, que a saída original era x2 que,
agora, está acrescida de 2x∆x + (∆x)2.
O termo ∆x é um valor muito pequeno, próximo de zero, e você sabe que o quadrado
de qualquer número menor que 1 é menor do que o próprio número. Por ser um valor
extremamente pequeno, (∆x)2 é, praticamente, nulo, podendo, assim, ser retirado da
equação acima. Desse modo, temos que uma variação ∆x em x, causa uma variação
2x∆x em y = f(x). Como a derivada é a taxa de variação da saída em relação à entrada,
temos que:

∆𝑦 2𝑥∆𝑥
= = 2𝑥
∆𝑥 ∆𝑥

Ainda não satisfeito? Vamos ver numericamente.

x x2 x x2 x x2
2 4 3 9 4 16
2.01 4.04 3.01 9.06 4.01 16.08
2.001 4.004 3.001 9.006 4.001 16.008
2.0001 4.0004 3.0001 9.0006 4.0001 16.0008
∆x 4∆x ∆x 6∆x ∆x 8∆x
∆x 2x∆x ∆x 2x∆x ∆x 2x∆x

A tabela é auto-explicativa, principalmente a última linha dela. Por exemplo, para x =


2, ocorre uma variação 4 vezes maior, ou 2x vezes maior, ou 2 x 2 = 4 vezes maior.
Para x = 3 e x = 4, você pode ver que a variação é 2x vezes maior. Por isso que a taxa
de variação na saída da máquina x2 é igual a 2 vezes a variação causada na entrada.
Isto é o que se chama de derivada.

Vamos construir uma tabela como a de cima para a função 3x2:

273
x 3x2 x 3x2 x 3x2
2 12 3 27 4 48
2.01 12.12 3.01 27.18 4.01 48.24
2.001 12.012 3.001 27.018 4.001 48.024
2.0001 4.0012 3.0001 27.0018 4.0001 48.0024

Pela experiência adquirida na tabela anterior, você conclui que os multiplicadores das
variações ∆x são 12, 18 e 24, respectivamente. Da mesma experiência você pode
concluir que Ax = 12, Bx = 18 e Cx = 24. Como nos três casos os valores de x são 2, 3 e
4, respectivamente, temos que 2A = 12, 3B = 18 e 4C = 24. Facilmente, você conclui
que A = B = C = 6, o que implica que a variação causada na saída é igual a 6 vezes a
variação causada na entrada, o que implica que a derivada da função 3x2 é igual a 6x, o
que pode ser comprovado pela fórmula analítica.

274
Integração Numérica

Diferenciar por fórmulas é muito mais fácil do que integrar por fórmulas. Por outro
lado, integrar numericamente (fazer uma aproximação numérica) é muito mais fácil do
que diferenciação numérica. Claro que, no caso de integração, só podemos fazer
integração numérica com integrais definidas, pois, estas resultam em um número,
enquanto que a integral indefinida resulta em uma função.

Apesar da integração numérica ser mais fácil, é muito trabalhosa e, assim, usamos
computadores para realiza-las (computadores realizam integração numérica muito
mais facilmente do que diferenciação).

Para realizar uma integração numérica, usa-se os métodos já vistos em Métodos de


Integração, como a Regra do Trapézio, a Regra do Ponto Médio e a Regra de Simpson.
O valor obtido em uma integração numérica nunca será exato, pois, existe um erro a
ser considerado em cada regra.

O programa em Python a seguir calcula uma integral usando a Regra do Ponto Médio.

from math import *


N = int(input("Quantidade de adicoes:"))
a = float(input("Limite inferior da integral:"))
b = float(input("Limite superior da integral:"))

# Função de integração - Método do Ponto Mèdio


def Integrate(N, a, b):
def f(x):
# Coloque a função desejada como argumento do return:
return 2*x # a integral é x^2
#return x**2 # a integral é (x^3)/3
#return sin(x)
valor1 = 0
valor2 = 0
for n in range(1,N+1):
valor1 += f(a+((n - (1/2)) * ((b - a)/N)))
valor2 = ((b - a)/N) * valor1
return valor2

print("Valor aproximado da integral = ",Integrate(N, a, b))

Quando maior for a quantidade de adições, maior será a precisão do resultado.

275
O Pulo Complexo

Muitos autores parecem saltar um fosso ao introduzirem os números complexos. Fica


uma sensação de que há um intervalo não preenchido dos reais para os complexos. A
transição não pareceu suave. Não foi diferente com a explicação que dei aqui. Vamos
tentar fechar esse fosso.

A função y = f(x) mapeia cada x a um y. Tanto x quanto y estão na linha real. Então
podemos considerar o mapeamento de x em y como o mapeamento de x em x
(considerando apenas uma reta real). Por exemplo, f(x) = x2 leva x no eixo x para x2 no
mesmo eixo x. Claro que você não vai ver o gráfico de uma parábola, mas, ela está lá,
com certeza. A parábola só se tornará visível se o eixo x “imagem” for levantado em 90
graus relativamente o eixo x “domínio”. O par (x, y) corresponde a dois valores na
linha real.

Quando o eixo imagem é levantado, esse par vai para o plano (visualmente, quando x
diferente de zero e y diferente de zero) e os pontos onde as coordenadas x e y se
cruzam corresponde, cada um, a um vetor com a cauda na origem:

276
A função z = f(x, y) mapeia o par real (x, y) na linha real onde está z, e onde estão x e y
também. Qualquer gráfico traçado ficará escondido até que três eixos perpendiculares
entre si sejam levantados. O trio (x, y, z) corresponde a um ponto no espaço
tridimensional. E assim por diante: X = f(x1, x2, ..., xn), mapeia a tupla (x1, x2, ..., xn),
onde cada xi está na linha real, a um valor X que está na linha real. A (n+1)-tupla (x1, x2,
..., xn, X) corresponde a um ponto no espaço (n+1)-dimensional.

Então note: Para cada n-upla de números reais corresponde um ponto no espaço de
dimensão n.

Quando n = 2, temos um ponto no plano. Ora, se podemos ter X ≡ (x1, x2), com x1, x2 e
X na linha real, então podemos, também, pegar (x1, x2) no domínio do plano e mapear
esse par no valor X na linha real ou, até, em um valor Y no plano, fora da linha real (no
caso, a função de mapeamento é uma função vetorial). Y, então, é chamado de
número complexo. E, como ocorre com os reais, podemos ter complexos em todos os
espaços ≥ 2. Isso levanta uma pergunta bastante pertinente: Existe um conjunto acima
dos complexos em que seus elementos estejam em todos os espaços ≥ 3? Nossa
intuição nos diz que sim, pois, podemos ter um ponto em qualquer dimensão ≥ 0.
Podemos ter uma linha em qualquer dimensão ≥ 1. Podemos ter um plano em
qualquer dimensão ≥ 2. Podemos ter um sólido em qualquer dimensão ≥ 3 e assim por
diante. Porém, o oposto não é verdadeiro. Não podemos ter um sólido em qualquer
dimensão < 3... Veja como os conjuntos numéricos também seguem essa lógica:
podemos ter um inteiro em Z e em qualquer conjunto acima de Z, mas, não podemos
ter qualquer Z em N.

Fazendo C = (x, y), C não está na linha real, mas, no plano. Sendo C um ponto em um
plano, podemos considerar D e outro plano com uma função que mapeia C em D, ou
seja, D = f(C). Com C = (c1, c2) e D = (d1, d2), temos f(c1, c2) = (d1, d2).

277
Coordenadas e Rotações

O que está ficando claro? Está ficando claro que o espaço dos números complexos é
equivalente ao espaço R2, ou a um conjunto de pares reais (o produto cartesiano de R
com R, ou R x R).

Praticamente, dissemos que uma rotação de 90 graus gera um número complexo. Ora,
mas, a função que mapeia cada x em um y também faz uma rotação de 90 graus (se
considerarmos um eixo x horizontal e um eixo x vertical – considerando apenas uma
reta real, não haverá rotação, mas, a função ainda funciona) e os valores continuam
reais. A função f(x) = –x causa uma rotação de 180 graus (se considerarmos só um eixo
x), mas, ficou claro que, como os valores continuam na reta real, eles são reais. Veja
como neste último caso o valor x foi afetado. No primeiro caso, parece ter havido uma
rotação de eixo, mas, no segundo caso, ocorreu uma rotação numérica. Então, quando
se multiplica um número por –1, esse número é rotacionado de 180 graus e ele não
deixa a reta real. Isso nos faz pensar: Por que valor deveríamos multiplicar x para que
ele seja rotacionado de 90 graus (metade de 180), por exemplo? Alguma coisa nos diz:
Tem que ser pela metade de –1. Mas, aí, verificamos que qualquer múltiplo ou
submúltiplo de –1 só vai afetar a magnitude de x, sem que ele saia da parte negativa
da reta real. Em efeito, é isso que o –1 faz, mas, sem afetar a magnitude de x. É o que
o multiplicador que estamos procurando tem que fazer: rotacionar x em 90 graus sem
que a magnitude de x seja afetada (seu sentido – seu sinal – pode ser afetado). Agora
alguma coisa nos diz que não existe um número que vai nos permitir isso. Então,
vamos ter que inventar (i) um ou imaginar (i) um número que possa fazer isso: Se –1
leva a 180, i tem que levar a 90: –1x e ix. E mais: i multiplicado duas vezes tem que
levar a –1: iix = i2x = –1x, o que implica que i2 é igual a –1. Assim como –1 resolve a
equação x + 1 = 0, i resolve a equação x2 + 1 = 0, onde x = i.

Aí você pergunta: Então, para 45 graus, por exemplo, tenho que inventar outro
número k, onde k.k = k2 = i e i2 = k.k.k.k = k2.k2 = k4? Sabemos que i2 = –1. Isso implica
que 𝑖 = √−1. Como k2 = i, então 𝑘 2 = √−1, o que implica que 𝑘 = √√−1. Disso
temos que:
𝑘 = √𝑖
As duas raízes de i são:
1
± (1 + 𝑖)
√2

Assim, não é necessário inventar um novo número, pois, o i basta para efetuar
qualquer rotação.

278
Números Complexos e R2

Em Vetores – Parte 1, vimos que só é possível representar um vetor no plano, em R2


ou superior. Então, os argumentos que temos para justificarmos os números
complexos são que eles equivalem a R2 e admitem raiz quadrada de número negativo.

Se eles são R2, então o único estranho é √−𝑥.

O conjunto de vetores no plano também equivale a R2, e números complexos podem


ser representados por vetores. Será que os números complexos têm alguma
característica, além de √−𝑥, que podem diferenciá-los de R2 e vetores? Sim, eles têm:
existe divisão no conjunto dos números complexos, mas, não existe divisão em R2 e
nem entre vetores.

A propriedade mais importante que um conjunto pode ter se chama fechamento.


Fechamento é a propriedade em que, efetuada uma operação sobre os elementos do
conjunto, o resultado da operação pertence ao conjunto (fica fechada dentro do
conjunto). É essa propriedade que enseja a extensão de um conjunto. Por exemplo,
para resolver a equação x2 = 2 dentro do conjunto dos números racionais é preciso
que ele seja estendido para o conjunto dos números reais através da união do
conjunto dos racionais com o conjunto dos irracionais. Lá em cima não encontramos
um multiplicador que rotacionasse x em 90 graus. Então, tivemos que subir para um
suposto conjunto maior, que deixa de ser suposto e se torna o conjunto dos números
complexos.

Dito isto, veremos que até a multiplicação de vetores no plano pode apresentar
“problemas” de fechamento, o que não ocorre com o conjunto dos complexos,
tornando isso uma diferença importante entre eles e R2.

Sejam (x, y) e (u, v) dois pontos em R2 ou dois vetores.

O produto escalar, ou produto interno, é dado por (x, y) . (u, v) = x.u + y.v, ou seja, a
transformação leva o resultado de R2 para um número (escalar) em R1. A propriedade
de fechamento falha para este tipo de produto.

O produto vetorial, ou produto externo, de dois vetores em R2 não vai para R1, mas,
vai para R3, resultando não em um número escalar, mas, em um terceiro vetor, sendo
que o vetor resultante é sempre perpendicular ao plano em que estão os dois vetores
fatores. A expressão que dá a multiplicação de dois vetores é melhor visualizada em
R3, ou seja, com vetores de três componentes:

(x, y, z) x (u, v, w) = (y.w – z.v, z.u – x.w, x.v – y.u)

279
Podemos ir para R2 fazendo z = w = 0:

(x, y, 0) x (u, v, 0) = (y.0 – 0.v, 0.u – x.0, x.v – y.u) = (0, 0, x.v – y.u)

Que é um vetor perpendicular ao eixo xy paralelo e sobre o eixo z.


Então a transformação leva o resultado de R2 para R3, o que leva a uma falha na
propriedade de fechamento.

Por fim, temos o produto complexo, dado por (x, y)(u, v) = (x.u – y.v, x.v + y.u), que é
a operação que transforma o plano bidimensional usual no plano complexo, e a
propriedade de fechamento fica preservada. Só a multiplicação complexa de vetores
em R2 permanece em R2.

Conclusão

O conjunto dos números complexos puros (sem a parte real) pode ser definido assim:

{𝑥 | 𝑥 2 = −𝑐 ⟹ 𝑥 = √−𝑐 = √𝑐 × √−1 = 𝑐𝑖}

Considerando a parte real, um número complexo qualquer pode ser sempre reduzido à
forma a + ib, onde a é a parte real e ib é parte complexa, com b real. Para c, acima,
temos que: 0 + ic. Podemos dividir dois números complexos, mas, não podemos dividir
dois pontos de R2 ou dois vetores:
(4, 2)
=?
(2, 2)

Para um dado conjunto S e a,b ϵ S, sabemos que se ab = 0, então a = 0 ou b = 0. Isso


implica que S é um domínio integral. Se a ≠ 0 e b ≠ 0, mas, ab = 0, então S não é um
domínio integral. O conjunto dos números complexos (C) é um domínio integral. Já R2
não é um domínio integral. Sabemos que se um dado conjunto tem a unidade (1), com
1a = a1 e ab = ba, então o conjunto é um anel comutativo. C é mais que um anel, é um
campo, pois, C é fechado sob as quatro operações (adição, subtração, multiplicação,
divisão).
Enquanto C é um campo, R2 é um espaço vetorial.

Qualquer número real pode ser resolvido a um único fator, mas, nem todo número
complexo pode ser resolvido a um único fator. Isto porque não existe um valor real
para √−1. Por isso, qualquer complexo não real é da forma a + ib. Então o campo
complexo é coalhado de valores √−𝑥, onde x é um número real. Por isso C não é
ordenado.

280

Você também pode gostar