terça-feira, 18 de dezembro de 2012

Como a web semântica, com base em Big Data, pode transformar a web

"Web de dados” continua sendo um conceito intrigante em vez de o assunto da vez em informação digital. Mas big data pode ajudar a mudar isso

O termo “web semântica” – ou Linked Data Web, web de dados ou web 3.0 – existe há pouco mais de uma década. Sua origem pode ser rastreada em um artigo da Scientific American, de 2001, escrito por Tim Berners-Lee, mais conhecido como o inventor da World Wide Web, e coautores James Hendler e Ora Lassila. O texto projeta uma web futurística em que uma estrutura comum permite que aplicativos compartilhem e reutilizem dados.
O conceito parece um pouco confuso, mas tecnologias de web semântica poderiam permitir uma variedade de usos que não são possíveis com a web de hoje, centrada em documentos. O World Wide Web Consortium (W3C), a organização internacional de padrões liderando os esforços de web semântica, oferece cerca de 30 estudos de casos de como as empresas utilizam, hoje, tecnologias semânticas em diversas áreas. Um exemplo é na integração de dados, quando informações em locais e formatos diferentes são integradas em um aplicativo unificado.
As empresas têm abraçado, devagar, a web semântica, mas soluções e ferramentas de software baseadas nessas tecnologias são disponibilizadas por grandes fornecedores, incluindo a IBM e a Oracle. Empresas menores incluem a Cambridge Semantics, que oferece software corporativo de gerenciamento de dados semânticos.
O W3C vê a web semântica como uma extensão, e não como uma substituta da web atual – uma estrutura que expande os princípios da web de documentos para dados. Muitas especificações semânticas para a web já estão em vigor, e o W3C continua desenvolvendo mais especificações para padronizar a tecnologia.
Esses são os três principais padrões da web semântica:
  • Resource Description Framework (RDF), um método geral para troca de dados na web, que permite o compartilhamento e a mistura de dados estruturados e semiestruturados por diversos aplicativos.
  • SPARQL (Protocolo SPARQL e Linguagem de Consulta RDF), desenvolvido para consultar dados em diferentes sistemas.
  • OWL (Ontology Web Language), que permite que o usuário defina conceitos de forma que possam ser misturados e combinados com outros conceitos de variados usos e aplicativos, de acordo com o tutorial sobre tecnologias de web semântica da Cambridge Semantics.
  • Em entrevista por telefone para a InformationWeek EUA, Sean Martin, CTO da Cambridge Semantics, resumiu a web semântica em poucas palavras: “Basicamente, tudo o que você faz é marcar dados e dar uma descrição do que são”.
“Se puder adicionar informação – mais metadados – o software pode interrogar o dado para descobrir o que é e do que ele é capaz”, acrescentou Martin, que acredita que o surgimento do big data possa ajudar a incentivar a adoção de tecnologias de web semântica.
Eis o porquê: “em primeiro lugar, muitos dos esforços de big data ainda estão muito crus”, disse Martin se referindo ao Hadoop e tecnologias relacionadas. “As ferramentas são relativamente imaturas e temos pessoas especializadas utilizando elas.”
E, por mais benefícios que o HDFS (Hadoop Distributed File System) ofereça, incluindo excelentes capacidades de redundância para operações de big data, ele tem suas limitações. “Você pode criar oceanos de arquivos em HDFS. Mas quem sabe o que eles significam?”, disse Martin. “E como fazemos para que as pessoas possam usá-los?”
A semântica, acredita ele, oferece a oportunidade de preencher essa lacuna. “Você pode pôr uma camada de semântica em cima de qualquer sistema cru ou imaturo. E você passa a usar padrões de dados abertos, que são todos bem escritos e cada vez mais suportados universalmente”.
Isso não quer dizer que a aceitação universal da web semântica esteja logo ali. Na verdade, os mais devotos podem apenas espalhar a mensagem por mais alguns anos – sem nenhuma garantia de êxito. “Existe a possibilidade de tentar impor isso pro mundo – tentando fazer as pessoas entenderem para que serve, por que é importante e o que pode ser feito com isso. Todas essas questões levam tempo”, concluiu Martin.

Nenhum comentário:

Postar um comentário

Obrigado pelo comentário!