A Semantica da Web e as palavras de um texto digital

A idéia da Web semântica é tornar a Internet um grande repositório de informação,classificada e com significado. A interface semântica da Web é uma extensão da interface Web actual, que permitirá aos computadores e aos humanos trabalharem em cooperação, organizando a web para melhor uso.

A Web semântica interliga palavras e, neste âmbito, tem como possibilidade conseguir atribuir um significado aos conteúdos publicados na Internet de modo que, esta valorização, possa ser perceptível tanto pelo humano quanto pelo computador.

A web e' um grande estoque de palavras que representam um conjunto de conceitos dentro de domínios e os seus possíveis relacionamentos. A organização semântica seria uma forma de representação do conhecimento deste mundo ou parte dele através da compressão semântica dos conteúdos, sem contudo, substituir, a narrativa original, livre e completa por uma representação de seus enunciados.

Recentemente o Dr. John Markus Lervik, Ph.D. e principal executivo da Fast, famosa Cia. norueguesa, de tecnologia da informação, em visita Brasil declarou: [1]

"Não Creio na web semântica. A web semântica nunca vai acontecer. Não existe uma maneira de organizar tudo com uma estrutura fixa baseada nas palavras. Cada idioma tem seu contexto e seus significados. As pessoas podem classificar um termo de diversas formas"

"As tags não resolvem. Ao classificar a foto de um carro, uma pessoa que não entende nada de automóveis e um aficionado vão descrever a imagem de maneiras diferentes. Como obter resultados mais relevantes, então?

"Um exemplo é o serviço de TV a cabo da ComCast nos Estados Unidos. O sistema de busca é acessado no set-top box [2] e há um mecanismo que recomenda as atrações de acordo com as preferências dos assinantes."

Não concordamos com o Dr. Markus da Fast, existem sim condições teóricas e práticas de se adaptar um sistema de busca para funcionar trazendo resultados baseados na relevância e na prioridade de determinada informação para um usuário e sua necessidade. Este sistema é baseado no estudo automatizado da ocorrência das palavras nos textos digitais.

Os documentos digitais podem ser indexados por relevância e por níveis de prioridade [3], automaticamente, através de motores da análise computacional da linguagem natural.

A partir do estudo das palavras retiradas do texto e, da configuração das diferentes freqüências com que ocorrem,, é possivel estabelecer valores circunstanciais de uso para uma informação, isto é, o seu valor de uso e a prioridade deste uso , naquela circunstância, para um determinado receptor ou grupo de receptores.

Existem pesquisas sobre este assunto desenvolvidas e em andamento.
Ver em: http://www.canalciencia.ibict.br/pesquisas/pesquisa.php?ref_pesquisa=120

AAB


[1] pequena entrevista dada ao revista INFO,de novembro de 2007

[2] Mecanismo tipo, um adaptador digital, como um canal de comunicação paralelo, que permite interação com o receptor, contextualizando o seu interesse.

[3] Relevante : tudo aquilo que possui a condição de utilidade, isto é, a qualidade das coisas materiais e imateriais em satisfazer nossas necessidades. Valor de uso. Prioridade : qualidade do que está ou deve vir em primeiro lugar, em determinada circunstância; o que antecede aos outros em tempo, lugar, serie ou classe em uma circunstância específica. Valor circunstancial de uso

_______________________________________________
Bib_virtual mailing list
[email protected]
https://listas.ibict.br/mailman/listinfo/bib_virtual

Responder a