Escolar Documentos
Profissional Documentos
Cultura Documentos
Há alguns dias decidi fazer engenharia reversa da imagem do firmware do meu roteador com a ferramenta
binwalk.
Comprei um roteador doméstico da TP-Link modelo Archer C7. Não é um dos melhores, mas é bom o
suficiente para as minhas necessidades.
Algo que sempre faço quando compro um novo roteador é instalar o OpenWRT. Por quê? Diversos motivos.
A qualidade do firmware do fabricante geralmente é ruim, não é atualizada ao longo do tempo e muitas
vezes possui muitos bugs e problemas de segurança esperando para serem explorados. Prefiro confiar em um
projeto de software de livre bem mantido como o OpenWRT.
Ao instalar e configurar o OpenWRT, baixei também a última versão da imagem oficial do firmware do
Archer C7 fornecida pela TP-Link e decidi analisá-la. Por quê? Apenas por diversão, e para escrever um
pouco sobre o binwalk, uma das melhores ferramentas para este trabalho!
O que é o binwalk?
O Binwalk é uma ferramenta de código aberto para realizar análise, engenharia reversa e extração de
imagens de firmware.
Criada em 2010 por Craig Heffner, o binwalk é capaz de analisar uma imagem de firmware para identificar
e extrair do firmware imagens de sistemas de arquivo, código executável, arquivos compactados, imagens de
bootloader e kernel, arquivos em formatos específicos como JPEGs e PDFs, e muito mais!
Você pode usar o binwalk para fazer engenharia reversa de uma imagem de firmware e entender melhor
como ela funciona. Você pode fazer engenharia reversa de binários disponíveis na imagem e procurar por
vulnerabilidades. Você pode extrair arquivos da imagem e procurar por senhas ou certificados digitais. Você
pode identificar opcodes para uma variedade de arquiteturas de CPU.
Você pode descompactar imagens para ler arquivos do sistema operacional (passwd, shadow, etc) e tentar
quebrar hashes de senhas. Você pode fazer uma comparação binária entre dois ou mais arquivos. Você pode
fazer uma análise de entropia para identificar arquivos compactados ou mesmo chaves criptográficas
embutidas na imagem.
$ file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked,
interpreter /lib64/l, for GNU/Linux 3.2.0,
BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped
O comando file irá examinar o cabeçalho de um arquivo e procurar uma assinatura para identificar o tipo do
arquivo. Por exemplo, se o arquivo começar com a sequência de bytes 0x89 0x50 0x4E 0x47 0x0D 0x0A
0x1A 0x0A, saberá que é um arquivo do tipo PNG. Esta página da Wikipedia contém uma lista das
assinaturas mais comuns utilizadas em diferentes formatos de arquivos.
O binwalk funciona da mesma maneira. Mas, em vez de procurar assinaturas apenas no início do arquivo, o
binwalk verificará o arquivo inteiro. Além disso, o binwalk é capaz de extrair os arquivos encontrados na
imagem.
As ferramentas file e binwalk usam a biblioteca libmagic para identificar assinaturas de arquivo. Mas o
binwalk também suporta uma lista de assinaturas personalizadas para encontrar arquivos compactados,
imagens de bootloader e kernel, sistemas de arquivos como squashfs e jffs2, etc!
Instalando o binwalk
O binwalk é suportado em diversas plataformas, incluindo Linux, Mac OS X, FreeBSD e Windows.
Para instalar a versão mais recente do binwalk, você pode baixar o código-fonte e seguir os procedimentos
de instalação ou o Quick Start Guide disponível no site do projeto.
$ binwalk
Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk
Extraction Options:
-e, --extract Automatically extract known file types
-D, --dd=<type:ext:cmd> Extract <type> signatures, give the files an extension
of <ext>, and execute <cmd>
-M, --matryoshka Recursively scan extracted files
-d, --depth=<int> Limit matryoshka recursion depth (default: 8 levels
deep)
-C, --directory=<str> Extract files/folders to a custom directory (default:
current working directory)
-j, --size=<int> Limit the size of each extracted file
-n, --count=<int> Limit the number of extracted files
-r, --rm Delete carved files after extraction
-z, --carve Carve data from files, but don't execute extraction
utilities
-V, --subdirs Extract into sub-directories named by the offset
Entropy Options:
-E, --entropy Calculate file entropy
-F, --fast Use faster, but less detailed, entropy analysis
-J, --save Save plot as a PNG
-Q, --nlegend Omit the legend from the entropy plot graph
-N, --nplot Do not generate an entropy plot graph
-H, --high=<float> Set the rising edge entropy trigger threshold
(default: 0.95)
-L, --low=<float> Set the falling edge entropy trigger threshold
(default: 0.85)
General Options:
-l, --length=<int> Number of bytes to scan
-o, --offset=<int> Start scan at this file offset
-O, --base=<int> Add a base address to all printed offsets
-K, --block=<int> Set file block size
-g, --swap=<int> Reverse every n bytes before scanning
-f, --log=<file> Log results to file
-c, --csv Log results to file in CSV format
-t, --term Format output to fit the terminal window
-q, --quiet Suppress output to stdout
-v, --verbose Enable verbose output
-h, --help Show help output
-a, --finclude=<str> Only scan files whose names match this regex
-p, --fexclude=<str> Do not scan files whose names match this regex
-s, --status=<int> Enable the status server on the specified port
Vamos começar procurando assinaturas de arquivos dentro da imagem, executando o binwalk com o
parâmetro –signature:
O U-Boot é utilizado como bootloader (cabeçalho da imagem no endereço 0x5AC0 e a imagem compactada
do bootloader no endereço 0x5B00). Com base no cabeçalho do uImage no endereço 0x13270, sabemos que
a arquitetura da CPU é MIPS e a versão do kernel Linux é 3.3.8. E com base na imagem encontrada no
endereço 0x11CEA5, podemos ver que o rootfs é um sistema de arquivos do tipo squashfs.
$ unlzma u-boot.bin.lzma
$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev 5 08:48 u-boot.bin
Que tal uma busca pelo valor padrão da variável de ambiente bootargs?
A variável bootargs do U-Boot é utilizada para passar parâmetros para o kernel Linux. E pela saída do
comando acima, podemos ter uma melhor compreensão do layout de partições da memória flash do
dispositivo.
Podemos confirmar que o kernel foi extraído corretamente com o comando file:
$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-File Image
(lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point:
0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94
O formato de arquivo uImage é basicamente a imagem do kernel Linux com um cabeçalho adicional. Vamos
então remover esse cabeçalho e obter a imagem final do kernel:
$ unlzma Image.lzma
$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev 5 10:51 Image
O que podemos fazer com a imagem do kernel? Podemos por exemplo procurar por strings na imagem para
identificar a mensagem de versão do Linux e obter mais informações sobre o ambiente utilizado para
compilar o kernel:
Embora o firmware tenha sido lançado no ano passado (agosto de 2019), ele usa uma versão antiga do
kernel Linux (3.3.8) lançada em 2012 compilada com uma versão muito antiga do GCC (4.6) também
lançada em 2012!
Com a opção –opcodes, podemos utilizar o binwalk para procurar instruções de máquina na imagem e
identificar a arquitetura da CPU:
E o rootfs? Em vez de extrair manualmente a imagem, vamos usar a opção –extract do binwalk:
$ cd _archer-c7.bin.extracted/squashfs-root/
$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www
$ cat etc/banner
MM NM MMMMMMM M M
$MMMMM MMMMM MMMMMMMMMMM MMM MMM
MMMMMMMM MM MMMMM. MMMMM:MMMMMM: MMMM MMMMM
MMMM= MMMMMM MMM MMMM MMMMM MMMM MMMMMM MMMM MMMMM'
MMMM= MMMMM MMMM MM MMMMM MMMM MMMM MMMMNMMMMM
MMMM= MMMM MMMMM MMMMM MMMM MMMM MMMMMMMM
MMMM= MMMM MMMMMM MMMMM MMMM MMMM MMMMMMMMM
MMMM= MMMM MMMMM, NMMMMMMMM MMMM MMMM MMMMMMMMMMM
MMMM= MMMM MMMMMM MMMMMMMM MMMM MMMM MMMM MMMMMM
MMMM= MMMM MM MMMM MMMM MMMM MMMM MMMM MMMM
MMMM$ ,MMMMM MMMMM MMMM MMM MMMM MMMMM MMMM MMMM
MMMMMMM: MMMMMMM M MMMMMMMMMMMM MMMMMMM MMMMMMM
MMMMMM MMMMN M MMMMMMMMM MMMM MMMM
MMMM M MMMMMMM M M
M
---------------------------------------------------------------
For those about to rock... (%C, %R)
---------------------------------------------------------------
Com o rootfs extraído, o céu é o limite! Podemos procurar arquivos de configuração, hashes de senha,
chaves criptográficas e certificados digitais. Podemos analisar os binários para encontrar erros e
vulnerabilidades.
Com as ferramentas qemu e chroot, podemos até executar (emular) um executável da imagem extraída!
$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www
$ cp /usr/bin/qemu-mips-static .
Ou seja, a TP-Link
Link lançou uma imagem de firmware em 2019 utilizando
utilizando software (toolchain, kernel,
BusyBox, etc) de 2012!
Você entende agora por que eu sempre instalo o OpenWRT nos meus roteadores? :-)
:
Assinaturas personalizadas podem ser adicionadas ao binwalk por meio de um arquivo especificado na linha
de comando através da opção –magic
magic ou adicionando os arquivos no diretório
$HOME/.config/binwalk/magic.
Estendendo o binwalk
Existe uma API do binwalk implementada como um módulo Python que pode ser usada por qualquer script
Python para executar análises de imagens. Desta forma, a ferramenta binwalk pode ser reimplementada
quase que inteiramente com apenas duas linhas de código!
1 import binwalk
2 binwalk.scan()
Com a API Python, você também pode criar plugins para personalizar e estender o binwalk.
Há também um plug-in IDA disponível e uma versão do Binwalk Pro disponível na nuvem.
Então, por que você não baixa alguma imagem de firmware da Internet e testa o binwalk? Eu prometo que
você vai se divertir muito!
Um abraço,
Sergio Prado