O dicionário online Webster define semântica como “o relacionamento entre os símbolos e o que estes representam”. Tim Berners-Lee, o homem que inventou a World Wide Web em 1989 no CERN, o laboratório europeu de física de partículas em Genebra, usou o termo para baptizar a Internet do futuro.
A Web Semântica é um conjunto de tecnologias que Berners-Lee tem vindo a desenvolver como director do World Wide Web Consortium sedeado em Cambridge no Massachusetts. Nascido em Londres em 1955, Berners-Lee foi feito cavaleiro pela rainha Isabel II em 2004. Nesta entrevista, explica a sua visão sobre o futuro da Web Semântica, a qual, afirma o cientista, vai ser muito mais poderosa que qualquer outra coisa vista antes.
Computerworld – Em primeiro lugar como o devo tratar, Sir Timothy, professor Timothy ou sr. Berners-Lee?
Berners-Lee – Pode chamar-me Tim.
CW – Bom Tim, a minha primeira pergunta é a mais óbvia. Pode explicar-me em termos simples o que é a Web Semântica?
Tim – Esta pergunta tem sido feita com frequência. E a forma mais simples de explicar é assim: no seu computador tem os seus ficheiro, documentos que pode ler, e tem ficheiros de dados, usados em aplicações, ficheiros de informação como calendários, sistemas de bancos e folhas de cálculo. Estes contêm informação usada em documentos instalados fora da Web. Não podem ser colocados na Internet. Assim, por exemplo, se está a olhar para uma página Web, descobre algo que quer tirar, um acontecimento onde quer ir. Esse acontecimento tem um local, uma hora marcada e tem pessoas associadas, mas precisou de ler a página Web e abrir separadamente a sua agenda para colocar aí a informação. E se quiser descobrir a página novamente terá de reescrever o endereço outra vez para a abrir. Se quiser detalhes empresariais sobre as pessoas, terá de ‘cortar’ e ‘colar’ essa informação da página Web para a sua lista de endereços, porque o ficheiro deste e os seus ficheiros com a informação original não estão integrados. E não estão integrados com a informação na Web. Desta forma, a Web Semântica trata da integração de informação. Quando usa uma aplicação, deve ser capaz de introduzir aí informação, de forma a configurar esses dados. Eu devo ser capaz de informar o meu computador: “Vou a este acontecimento”. E quando digo isso, o computador perceberá a informação. A Web Semântica trata de colocar ficheiros de dados na Web. Não é só uma Web de documentos, mas também de dados. A informação da Web Semântica terá muitas aplicações para a interligar. Pela primeira vez há um formato comum de dados para todas as aplicações, bases de dados e páginas da Internet.
CW – Foi o autor do termo “Web Semântica”? É esta a chamada Web 3.0? Qual é a diferença entre a Web 2.0 e a 3.0?
Tim – Sim fui eu. Apareceu em 1999 no meu livro Weaving the Web. O termo Web 2.0 foi usado para descrever como os ficheiros usavam a Web para trabalhar. Há conteúdos gerados pelo utilizador e as pessoas ligam-se a sites da Web e marcam coisas que as interessa, carregam fotografias e fazem sites comunitários. Assim, a Web 2.0 refere-se a sites da Web baseados na comunidade. Não fui eu que inventei este termo, mas foi sim Tim O’Reilly que o fez em 2003. A respeito da Web 3.0, algumas pessoas usam este termo para denominar uma arquitectura que estaria para vir. Outras pessoas usam-no para pensar na regulação da tecnologia Web. Todavia, eu penso no futuro da tecnologia Web. Um problema bem conhecido que era típico do ficheiro 2.0 é que a informação que aparece não está no site, mas sim na base de dados. Não está na Web. Desta maneira, as pessoas não podem reutilizar essa informação. Pode pegar num site da Web com informação sobre os seus colegas e as pessoas com quem trabalha, e outro site da Web com informação sobre os seus amigos, e outros sites da Web referentes a diferentes comunidades. Com a Web 2.0 não podia ter a imagem completa, ninguém via toda a imagem. Pelo que algumas pessoas disseram, bom, a Web 3.0 vai aparecer quando o seu site fornecer informação na qual pode navegar. Por exemplo, se um dos diversos sites que usam tecnologia Web descobre informação útil sobre os meus amigos no meu diário, então eu posso configurar um ícone para informar o computador “Recupera essa informação, vê-a e acrescenta-a aos dados que já tenho de outros sites e depois vê-a em conjunto com a restante informação”.
CW – Então qual é a diferença entre uma Web de documentos e uma Web de informação?
Tim – Há muitas diferenças entre documentos e dados. Tome por exemplo a sua informação bancária. Há duas formas de as ver. Se a olhar só como uma simples página da Web, então não passa de uma simples folha de papel. Tudo o que pode fazer é lê-la. Agora se olhar para ela num site da Web 3.0, talvez possa usar uma pesquisa Java para mudar a ordem da informação e pode melhorar o acesso e o uso dessa informação. Actualmente, antes de se preparar para fazer algo como pagar os seus impostos, precisa de usar software como o Quicken ou o Money da Microsoft, ou o seu programa financeiro favorito. Quando fizer isso, não o carrega como fosse uma página Web, carrega-o como um ficheiro de dados. Esta é a diferença entre dados e docuemntos. Quando olhar para a sua informação bancária à procura de documentos, pode lê-la simplesmente. Quando olhar a informação, pode descobrir quanto tem que pagar ao fisco, pode ver qual é o montante das suas despesas, há todo o tipo de coisas que pode fazer com a informação. Não temos a capacidade de fazer isto com a informação na Web. Se puder fazer isto com a informação, os dados tirados da informação bancária podem tornar-se num padrão que só funciona com os bancos. É um padrão financeiro para informação bancária. Haverá padrões completamente separados para agendas, por exemplo. O que pode fazer hoje é, digamos, perguntar ao computador: “Quando é que passei aquele cheque? Quando é que tive aquela reunião?” Não pode relacionar coisas em ficheiros de dados diferentes, a menos que use a Web Semântica. A Web Semântica é muito mais poderosa porque pode relacionar pessoas e informação, referentes à mesma pessoa, ao mesmo local, ao mesmo tempo.
CW – Com toda estas ligações entre dados pessoais, das empresas e do governo, não pensa que a primeira preocupação das pessoas será com a privacidade?
Tim – Sim. E eu partilho essa preocupação! Um aspecto importante da tecnologia da Web Semântica é chamado proveniência – de onde é que provém a informação e como poderá ser usada. O nosso grupo de investigação no MIT está a desenvolver sistemas para mostrar quais são os usos permitidos à informação, a fim de poder confirmar de onde esta vem, o que representa e para se certificar que não é usada de forma diferente. Chamamos a esta capacidade a “responsabilização da informação”.
CW – A fim de definir preferências sobre a forma como a informação pessoal pode ser usada, um indivíduo tem que ter alguns conhecimentos tecnológicos; só que este não é o caso da maior parte da população mundial, pois não?
Tim – Em primeiro lugar quando usa a Web Semântica para os seus dados pessoais, não os está a colocar na Web. Você tem uma Web pessoal para a informação sobre a sua vida no seu computador e usa-a para navegar localmente. Não a está a colocar na Internet aberta. Há imensas ferramentas como a Quicken ou o Money da Microsoft, onde os sistemas bancários aparecem pela Net num canal seguro e supõe-se que trabalhem localmente. Não está a usar tecnologia Web, está a usar a Internet. Você não põe os seus ficheiros pessoais na Internet. Estamos a falar de permitir ao utilizador combinar – no seu computador – a informação pessoal sobre a qual tem direito – a informação empresarial sobre a qual também tem direitos e a informação pública numa visão muito rica do mundo. Bom, disse que para as pessoas serem capazes de lidar com a informação tinham de ter muitos conhecimentos. Isto é verdade às vezes, mas, por exemplo, para usar uma agenda, você está a criar informação, certo? Quando cria uma lista de endereços, está a criar informação. Assim, estas coisas possuem interfaces de utilizador que lhe permitem fazer as coisas e nunca tem problemas com a informação, a menos que use um programa incompatível. Estamos a trabalhar neste momento para tornar esta tecnologia disponível àqueles que querem fazer documentos empresariais. Ainda não temos tecnologia de Web Semântica disponível capaz de ser facilmente usada por avôs e netos. Isso é verdade. Estamos a desenvolvê-la no MIT. Temos uma equipa a trabalhar exactamente nisso, na construção de programas que permitam à pessoas, às pessoas normais, ler, escrever e processar a sua informação.
CW – Quando a Web Semântica atingir todo o seu potencial, será que vai desencadear uma segunda explosão na Internet?
Tim – Bom, de certa forma isso já está a acontecer. Mas eu não penso que a Web atingiu ainda todo o seu potencial. Ela só existe há dezasseis anos. A Web Semântica vai descolar particularmente quando as pessoas a usarem para processar informação, quando as pessoas a usarem em cada vez mais coisas, acrescentando dados pessoais, acrescentando ficheiros à informação do governo. Mas eu penso que vai demorar muitos anos a acontecer, porque há tanto a fazer sobre esta.
CW – O que é a neutralidade da Net? Qual é a sua posição sobre isto?
Tim – A neutralidade da Net permite que quando eu pagar para me ligar à Internet e você dá dinheiro para se ligar à Internet, nós poderemos comunicar independentemente do sítio onde estejamos. O que é muito excitante neste momento é que a utilização do vídeo está a veulgarizar-se pela Web. O YouTube recebe muita atenção, porque está a fornecer vídeo na Web. Agora suponha que eu estou no Massachusetts e quero encontrar um filme brasileiro. Vou à Internet para procurar o meu filme e realizador independente. Só que a operadora de cabo no Massachusetts bloqueia a transmissão e diz “Não, não lhe permitimos fazer isto porque nós vendemos filmes. Assim, nós fornecemos a Internet e por outro lado impedimo-lo de ver filmes pela Internet. Queremos ser capazes de controlar quais são filmes que compra”. Vemos as fornecedoras do serviço tentar impedir a utilização da Internet para fazer chamadas de VoIP. Estou preocupado com isto e trabalho para que muitas outras pessoas empenhadas impeçam que isto aconteça. Penso que é muito importante manter uma Internet aberta para quem quer que seja. Isto chama-se neutralidade da Net. É muito importante preservar a neutralidade da Net para o futuro.
CW – Em 2003, houve vários governos que propuseram uma administração internacional para a Internet, espelhando a configuração das Nações Unidas ou da União Europeia. Acha que que o governo dos Estados Unidos vai deixar que isto seja feito alguma vez?
Tim – Penso que a Internet vai ficar mais burocrática pouco a pouco. Penso que é inevitável. É importante permitir às pessoas em países diferentes, países em desenvolvimento, que desenvolvam o uso da Internet o mais rapidamente possível. Mas a administração de algo tão grande nunca será controlado por apenas um máquina burocrática. Desconheço qual será a forma que vai ter, uma vez que há muitas linhas políticas envolvidas. Mas diria que é muito importante não haver interferência do governo e sem censurar as pessoas que a usam.
CW – Disse uma vez que a Web foi criada para resolver a frustração que sentia no CERN. Como foi isso e como aconteceu?
Tim – O CERN espelha uma maravilhosa diversidade de culturas porque as pessoas vêm das diferentes partes do mundo para fazer física. Em 1989, antes da Web, escrevi um memorando a explicar como seria se tivéssemos a Web. Mencionei o sistema do hipertexto, a World Wide Web se preferir, como um método para acrescentar e editar informação. A minha percepção era que eu queria que toda a informação da rede do CERN ficasse facilmente disponível. Queria desenvolver as ferramentas que permitissem às pessoas construir e usar a informação em colaboração. Queria que as pessoas fossem capazes de conceber software e experiências específicas ao usar conjuntamente algo em diversos aspectos. Assim, era suposto que a Web servisse originalmente para conceber coisas em conjunto. A primeira ferramenta foi um ‘browser’ da Web e um editor, que permitia às pessoas no CERN usarem um documento, editarem-no e depois enviá-lo, estabelecendo ligações entre as páginas Web e os documentos científicos. A frustração foi que eu queria ser capaz de trabalhar com as pessoas facilmente em diferentes países, onde usavam computadores diferentes, trabalhavam com sistemas de bases de dados diferentes e classificavam a informação em formatos diferentes.
CW – Muitos investigadores fizeram milhões com a Web, mas no seu caso preferiu desenvolver padrões. Não acha que desperdiçou a hipótese da sua vida ao não criar direitos proprietários sobre a Web?
Tim – Não, não desperdicei, porque se tivesse direitos proprietários as pessoas não a teriam usado, não teriam contribuído para ela. A Internet não teria descolado e não estariamos a falar dela agora.
CW – Algumas pessoas como Nova Spivak e o co-fundador da Microsoft Paul Allen assumem como prazo para a chegada da Web 3.0 o ano de 2010 e a futura Web 4.0 em 2020. Consegue imaginar o que será a Web 4.0?
Tim – (Riu-se) Não, não me dedico a isso. Eu penso em tecnologia real. Não inventei o termo “Web 3.0”. A Web está a desenvolver-se constantemente. Se quer saber pelo que me interesso agora, é pelas diversas tecnologias que se ligam entre si. Na Web 2.0 há algumas tecnologias como a JavaScript e outras que são padrões capazes de permitir às pessoas fazer coisas. A maioria dos padrões que aparece agora vão estar virados para as iniciativas da Web móvel, a utilização da Web por imensos dispositivos diferentes. De futuro, vamos ter a Web Semântica que nos permitirá toda uma quantidade de outras coisas. Uma das coisas mais poderosas sobre a tecnologia de redes como a Internet, ou a Web, ou a Web Semântica, uma das características de tal tecnologia é que as coisas que já fizemos com esta ultrapassa o imaginado pelas pessoas que a inventaram. Tome por exemplo os inventores do TCP/IP, os protocolos originais para comunicar entre computadores pela Internet, criados por Vinton Cerf e Robert Kahn em 1974. Quando inventei a Web, pensei nela como uma infra-estrutura, concebi a Web como o fundamento para muitas coisas. Com a Web 2.0, as redes sociais e todo os tipos de coisas que acontecem nela. Quando a Web Semântica chegar nos próximos anos, as coisas serão usadas de formas que nós ainda nem sequer conhecemos agora. Assim, de certa maneira, é estúpido tentar imaginar como será a Web 4.0 quando ainda não sabemos sequer como vai ser com a 3.0. Para a Web 3.0 ter êxito, as pessoas a estudá-la neste momento têm ideias capazes de tornar possível a nova tecnologia. Elas vão conceber coisas fantásticas, tal como o fizeram as pessoas que idealizaram coisas para a Web 2.0, usadas agora. As pessoas que trabalham com a Web Semântica farão coisas muito mais poderosas. Não conseguimos imaginar o que farão. Mas temos que construir a Web para ser uma infra-estrutura. Nunca será usada para fins particulares, mas será apenas uma base para desenvolvimentos futuros.