Notícias

30 de setembro de 2013

O Manuscrito de Voynich

Pense num livro muito difícil de ser lido. Com certeza que na sua mente vieram títulos de obras de Nietzche, talvez Os Lusíadas de Camões ou, até mesmo, escritos de Machado de Assis. Agora, imagine um livro impossível de ser lido, impossível literalmente, numa língua desconhecida e numa escrita incompreensível até mesmo para o mais renomado criptógrafo.

Pois esse livro existe e, por seu mistério e sobretudo incompreensibilidade, já foi objeto de estudo de linguistas, decifradores, padres, matemáticos e até mesmo reis, há mais de cinco séculos. O Manuscrito de Voynich, como é conhecido, foi revelado ao mundo em 1912 e continua aguçando a curiosidade de pesquisadores de diversas áreas.

VoynichUm grupo de físicos brasileiros, incluindo os docentes do Instituto de Física de São Carlos (IFSC/USP), Osvaldo Novais de Oliveira Jr. e Luciano da Fontoura Costa, e o doutorando, também do IFSC/USP, Diego Amancio, aceitou o desafio de desvendar parte do mistério, num artigo publicado na revista PLOS One. Usando técnicas de física estatística, os físicos obtiveram uma nova informação sobre o livro: os textos do Voynich não são um conjunto de palavras aleatórias e sem significado e de signos sem sentido, mas um livro que pode trazer valiosas informações, ao que tudo indica sobre ervas e astrologia, uma vez que as ilustrações encontradas na obra são de imagens de plantas e corpos celestes. “Uma das suspeitas que se tinha a respeito do Voynich é que se tratava de um texto sem sentido, já que, durante todos esses anos, ninguém conseguiu interpretar seu conteúdo”, conta Osvaldo.

A contribuição da física veio com o uso de conceitos de redes complexas e séries temporais, além de estatísticas sobre as palavras no texto. “Com a análise de ‘séries temporais’ foi possível verificar a intermitência do uso de palavras no texto, ou seja, qual o padrão de repetição de uma mesma palavra ao longo do manuscrito”, explica o docente. “Em outras obras literárias, conseguir identificar esse padrão de intervalos pode dar dicas sobre um autor ou sobre o assunto de um texto”.

Para entender a aplicação de séries temporais na análise de textos, imagine que um livro tenha como tema ciências exatas e que seus primeiros capítulos versem sobre física e os últimos sobre matemática. No começo, é provável que a palavra “relatividade” apareça com frequência, o que não ocorrerá nos capítulos finais, nos quais a palavra “geometria analítica”, por exemplo, aparecerá mais vezes.

Para a análise de grande quantidade de dados, como num livro, emprega-se um computador, que tem a desvantagem de não fazer uma análise tão detalhada como um humano pode. “Por outro lado, num computador, a velocidade de processamento é muito mais rápida e a quantidade de dados que pode ser analisada é consideravelmente maior”, explica o docente.

Outra abordagem importante para investigar o manuscrito de Voynich foi a de redes complexas, em que um texto é representado por uma rede na qual os nós são as palavras e se estabelecem conexões quando duas palavras aparecerem juntas. Se houver muitas ocorrências dessas palavras, aumenta-se o peso da conexão. “Das características da rede, de sua topologia, pode-se extrair informações importantes. Dentre essas características, estão quais palavras são mais conectadas, se há formação de aglomerados de palavras em comunidades, e qual é a distribuição de conexões entre as palavras no texto”, elucida Osvaldo.

Uma nova informação

Para ter certeza de que o texto do Voynich não se tratava de um texto de palavras ao acaso, os físicos o compararam com textos reais em várias línguas, e identificaram parâmetros das redes que permitem distinguir um texto aleatório de um texto real. “Fizemos redes com textos reais de 15 idiomas e utilizamos mais de 20 métricas para verificar quais distinguiam um texto aleatório de um texto real. Dessa forma, conseguimos verificar que o Voynich não é um texto aleatório. Pretendíamos também identificar a qual idioma o Voynich é mais similar, mas a quantidade de dados de que dispúnhamos não foi suficiente para obter conclusões estatisticamente significativas. Infelizmente não há muitos textos traduzidos em diversas línguas que estejam disponíveis na internet”, explica o docente.

Para identificar as palavras-chave do Voynich, os físicos verificaram nas métricas de rede e séries temporais quais palavras se sobVoynich-5ressaiam. E para comprovar a razoabilidade da estratégia, foram utilizadas as mesmas táticas para textos de idiomas conhecidos. “Utilizamos estratégias de controle, para saber se aquela metodologia era eficiente. No nosso caso, comparamos textos do Novo Testamento em 15 idiomas para identificar palavras-chave. Como a estratégia deu certo, ela também foi utilizada para detectar as palavras-chave do Voynich”, conta Osvaldo.

Além do objetivo principal

Das análises no artigo e a partir de estudos recentes de outros pesquisadores, conclui-se que, por não se tratar de um texto aleatório, provavelmente o Voynich tenha sido escrito num idioma desconhecido, artificial. Mais importante ainda é que as estratégias utilizadas pelos pesquisadores funcionaram bem, o que poderá dar pistas importantes aos futuros (e corajosos) “decifradores” do manuscrito.

Osvaldo comenta que, embora a análise do misterioso Voynich tenha sido um dos alvos principais da pesquisa, as abordagens de física estatística e física computacional desenvolvidas podem ser úteis para muitas outras aplicações. O conhecimento gerado pode auxiliar na análise de grandes volumes de dados, inclusive de textos. “Sou otimista com relações a essas abordagens devido a diversos estudos exploratórios de várias áreas, sempre tentando transformar grandes volumes de informação em conhecimento”, conta Osvaldo.

Isso significa dizer que, num futuro muito próximo, grandes quantidades de informações, desorganizadas, como é o caso do Voynich, servirão para o aprendizado dos computadores. “Hoje, a maneira como uma máquina aprende é muito rudimentar, requerendo intensa participação de humanos. No futuro, será possível que o computador tome decisões de como aprender e fazer aquisições dessas informações, transformando-as em conhecimento, inclusive para ele próprio”, afirma o docente.

Esse novo cenário de convergência de tecnologias da física, estatística, computação e linguística, pode fazer com que exercícios de mera curiosidade humana, como no interesse em desvendar o manuscrito de Voynich, sirvam de instrumento para importantes descobertas. Abrem-se novas perspectivas para conhecer mais de história e do próprio homem, inclusive com uma máquina como protagonista das descobertas.

Assessoria de Comunicação

Imprimir artigo
Compartilhe!
Share On Facebook
Share On Twitter
Share On Google Plus
Fale conosco
Instituto de Física de São Carlos - IFSC Universidade de São Paulo - USP
Obrigado pela mensagem! Assim que possível entraremos em contato..