Criptografia 101 (Anexo): RSA Explicado

•••

Este é parte de uma série de artigos sobre criptografia. Se este é o primeiro artigo que você encontra, eu recomendo começar do início da série.

A encriptação RSA é um dos algoritmos de encriptação mais amplamente utilizados — e ele se baseia exclusivamente no grupo aditivo dos inteiros módulo $n$ . É um ótimo exemplo de quanto pode ser feito sem a necessidade de curvas elípticas ou qualquer outra construção mais complexa.

Este artigo anexo é dedicado a explicar os princípios de funcionamento e nuances do algoritmo RSA.

•••

O Problema Subjacente

Muitos mecanismos criptográficos operam com base no princípio de que é realmente difícil realizar uma certa operação a menos que você conheça alguma chave secreta. Na encriptação, essa é exatamente a ideia: uma mensagem encriptada é indecifrável sem o conhecimento da referida chave secreta.

Como isso é alcançado, então? Criando um problema que é realmente difícil de resolver, a menos que você tenha alguma informação secreta adicional. O RSA depende de um desses problemas: a fatoração de números grandes em seus fatores primos. Isso é: dado um número (grande) $n$ , expressá-lo como:

n = p.q

Onde $p$ e $q$ são números primos grandes. Se você conhece $p$ e $q$ , calcular $n$ é trivial — e o mesmo vale para calcular $p$ se você conhece $n$ e $q$ .

Quão Grande é Grande o Suficiente?

Claro, tudo isso é inútil se o problema for fácil de resolver. Por exemplo, se $n = 7×11 = 77$ , então a fatoração realmente leva apenas um instante. No entanto, à medida que os números primos se tornam maiores, a fatoração começa a levar cada vez mais tempo.

O tamanho recomendado para os fatores primos $p$ e $q$ está entre $1024$ e $2048$ bits. Para referência, veja como um número primo de 1024 bits se vê:

170154366828665079503315635359566390626153860097410117673698414542663355444709893966571750073322692712277666971313348160841835991041384679700511912064982526249529596585220499141442747333138443745082395711957231040341599508490720584345044145678716964326909852653412051765274781142172235546768485104821112642811

Sim, é bem grande.

Estimar quanto tempo levaria para encontrar os fatores primos de um número grande, digamos, com 2048 bits, é difícil. Principalmente porque isso realmente não foi jamais feito!

Mas ainda assim, teoriza-se que levaria de centenas a milhares de anos, mesmo com hardware poderoso. A menos que a Computação Quântica se torne disponível — e essa é uma história para outro momento.

•••

Preliminares

Como usamos o problema anterior para encriptar dados? Fazer isso exigirá algumas definições. Em particular, precisaremos conhecer a função totiente de Euler e suas propriedades.

Função Totiente de Euler

Para qualquer número natural $n$ , esta função (denotada como $\varphi(n)$ ) conta quantos números naturais menores que $n$ (sem contar 0) são coprimos com ele.

Ser coprimo significa que os números não compartilham fatores primos. Outra maneira de dizer isso é que o máximo divisor comum de números coprimos é $1$ .

Por exemplo, $6$ e $25$ são coprimos.

Observe que para um número primo $p$ , cada número menor que ele é coprimo (porque como $p$ é primo, seu único fator primo é $p$ !). Então podemos escrever:

\varphi(p) = p {-} 1

E também, é verdade que para $n = p.q$ , se $p$ e $q$ são primos, então:

\varphi(n) = (p {-} 1)(q {-} 1)

Uma Propriedade Importante

Por que nos importamos com a função totiente? Principalmente por causa do teorema de Euler, que estabelece que se $a$ e $n$ são coprimos, então:

a^{\varphi(n)} \ \textrm{mod} \ n = 1

E se multiplicarmos ambos os lados por $a$ , isso é o que obtemos:

a^{\varphi(n) + 1} \ \textrm{mod} \ n = a

Aparentemente, existe um certo número mágico $\varphi(n) + 1$ que parece nos permitir recuperar o valor original $a$ !

Batman pensando — Acho que sei onde isso vai dar...

•••

O Algoritmo

Se substituirmos $a$ na equação anterior por nossa mensagem $m$ , então temos uma ótima base para um mecanismo de encriptação, porque temos uma operação em $m$ que nos permite recuperar $m$ !

O que precisamos fazer é dividir o processo em dois passos. E para fazer isso, simplesmente fatoramos $\varphi(n) + 1$ .

Esta não é sua fatoração usual, entretanto. O que realmente acontece é que escolhemos algum número aleatório grande $e$ , desde que $e < \varphi(n)$ , e que $e$ seja coprimo com $\varphi(n)$ . Então, calculamos outro número $d$ tal que:

e.d \ \textrm{mod} \ \varphi(n) = 1

Isso é realmente apenas o inverso multiplicativo modular de $e$ , módulo $\varphi(n)$ .

E calcular $d$ dessa maneira garante que o seguinte seja verdadeiro (o que é bastante simples de provar, então deixo essa tarefa para você):

m^{e.d} \ \textrm{mod} \ n = m

E a parte interessante é que, com o conhecimento de $e$ e $n$ , não é fácil calcular $\varphi(n)$ porque para isso, você precisaria dos fatores primos de $n$ ! O que é um problema realmente difícil! Por esse motivo, $e$ pode ser tornado público — e de fato será a chave pública no RSA.

Os Passos

Tudo o que resta é separar em dois passos. Usamos a chave pública $e$ para calcular um texto cifrado:

m^e \ \textrm{mod} \ n = c

Sem o conhecimento de $d$ , isso não pode ser convertido de volta em $m$ . Então, desde que $d$ seja mantido em segredo, apenas quem detém esse valor pode decriptar $c$ . E por causa disso, $d$ será nossa chave privada.

Para decriptar, simplesmente fazemos o seguinte:

c^d \textrm{mod} \ n = m^{e.d} \textrm{mod} \ n = m

E voilà! A mensagem está decriptada!

Note que você também pode assinar digitalmente com este esquema, usando $d$ para produzir uma assinatura, e $e$ para verificá-la. Legal, né?

•••

Resumo

E aí está! É assim que a encriptação RSA funciona.

Dumbledore aplaude lentamente — Dumbledore aprova

Não há muito mais a dizer sobre isso. Ainda assim, há alguns pontos que não abordamos — nomeadamente, como calcular inversos multiplicativos modulares, ou como gerar grandes números primos. Não vamos cobri-los aqui, mas, é claro, esses também são componentes-chave para a encriptação RSA.

No entanto, existem alguns pontos particularmente sensíveis no RSA que podem se tornar grandes armadilhas para todo o sistema criptográfico, como é fantasticamente explicado aqui. A teoria é realmente boa e bonita, mas implementar esse esquema aparentemente simples por conta própria pode torná-lo muito vulnerável.

Dumbledore levemente preocupado — Chocado

Esta é uma das razões pelas quais o RSA é considerado principalmente obsoleto, e tem sido substituído pela Criptografia de Curva Elíptica (ECC) para muitas aplicações.