A Semantica da Web e as palavras de um texto digital
A idéia da Web semântica é tornar a Internet um
grande repositório de informação,classificada e
com significado. A interface semântica da Web é
uma extensão da interface Web actual, que
permitirá aos computadores e aos humanos
trabalharem em cooperação, organizando a web para melhor uso.
A Web semântica interliga palavras e, neste
âmbito, tem como possibilidade conseguir atribuir
um significado aos conteúdos publicados na
Internet de modo que, esta valorização, possa
ser perceptível tanto pelo humano quanto pelo computador.
A web e' um grande estoque de palavras que
representam um conjunto de conceitos dentro de
domínios e os seus possíveis relacionamentos. A
organização semântica seria uma forma de
representação do conhecimento deste mundo ou
parte dele através da compressão semântica dos
conteúdos, sem contudo, substituir, a narrativa
original, livre e completa por uma representação de seus enunciados.
Recentemente o Dr. John Markus Lervik, Ph.D.
e principal executivo da Fast, famosa Cia.
norueguesa, de tecnologia da informação, em visita Brasil declarou: [1]
"Não Creio na web semântica. A web semântica
nunca vai acontecer. Não existe uma maneira de
organizar tudo com uma estrutura fixa baseada nas
palavras. Cada idioma tem seu contexto e seus
significados. As pessoas podem classificar um termo de diversas formas"
"As tags não resolvem. Ao classificar a foto de
um carro, uma pessoa que não entende nada de
automóveis e um aficionado vão descrever a imagem
de maneiras diferentes. Como obter resultados mais relevantes, então?
"Um exemplo é o serviço de TV a cabo da ComCast
nos Estados Unidos. O sistema de busca é acessado no
set-top box [2] e há um mecanismo que recomenda
as atrações de acordo com as preferências dos assinantes."
Não concordamos com o Dr. Markus da
Fast, existem sim condições teóricas e práticas
de se adaptar um sistema de busca para funcionar
trazendo resultados baseados na relevância e na
prioridade de determinada informação para um
usuário e sua necessidade. Este sistema é baseado
no estudo automatizado da ocorrência das palavras nos textos digitais.
Os documentos digitais podem ser indexados por
relevância e por níveis de prioridade [3],
automaticamente, através de motores da análise
computacional da linguagem natural.
A partir do estudo das palavras retiradas do
texto e, da configuração das diferentes
freqüências com que ocorrem,, é possivel
estabelecer valores circunstanciais de uso para
uma informação, isto é, o seu valor de uso e a
prioridade deste uso , naquela circunstância,
para um determinado receptor ou grupo de receptores.
Existem pesquisas sobre este assunto desenvolvidas e em andamento.
Ver em:
http://www.canalciencia.ibict.br/pesquisas/pesquisa.php?ref_pesquisa=120
AAB
[1] pequena entrevista dada ao revista INFO,de novembro de 2007
[2] Mecanismo tipo, um adaptador digital,
como um canal de comunicação paralelo, que
permite interação com o receptor, contextualizando o seu interesse.
[3] Relevante : tudo aquilo que possui a condição
de utilidade, isto é, a qualidade das coisas
materiais e imateriais em satisfazer nossas necessidades. Valor de uso.
Prioridade : qualidade do que está ou deve vir em
primeiro lugar, em determinada circunstância; o
que antecede aos outros em tempo, lugar, serie ou
classe em uma circunstância específica. Valor circunstancial de uso
_______________________________________________
Bib_virtual mailing list
[email protected]
https://listas.ibict.br/mailman/listinfo/bib_virtual