Prezados,

Sinceramente, não sei se a inclusão de metadados em sistemas abertos como é
a Web é a resposta para o problema de recuperação da informação. O Google,
por exemplo, não leva em consideração os metadados devido ao fato que esses
podem ser usados para manipular os resultados de busca...
Quanto ao Ontoweb, concordo com o Flávio, acho que ficar procurando um
rival a altura do Google agora não é a melhor coisa a se fazer... esse
rival, caso apareça, vai aparecer naturalmente e vai se impor a medida que
for ganhando a simpatia dos usuários...
E ainda, confesso que não acho uma boa idéia aplicar ontologias em um
ambiente não estruturado como a Web e somando se a isso, a limitação do
Ontoweb que deve indexar poucas páginas, produz um resultado que acredito
estar longe de ser eficiente...

As alternativas para a organização da Web nos próximos anos estarão longe
de serem universais, e conforme a visão de futuro da W3C para a Web, ela
caminha para uma especialização de conteúdo e de sistemas, que
possibilitará a criação de confiança em seu conteúdo...(
http://www.w3.org/Consortium/technology )

Abraços

Tiago Murakami








                                                                           
             "Murilo Bastos da                                             
             Cunha"                                                        
             <[EMAIL PROTECTED]>                                          To 
             Sent by:                  Lista de Discussão e Divulgação     
             bib_virtual-bounc         sobre Bibliotecas e Informação      
             [EMAIL PROTECTED]               Digital na Internet                
 
                                       <[email protected]>              
                                                                        cc 
             02/02/2006 16:28                                              
                                                                   Subject 
                                       Re: [Bib_virtual] Ontoweb, a nova   
             Please respond to         era das ferramentas de busca        
                 Lista de                                                  
                Discussão e                                                
             Divulgação sobre                                              
               Bibliotecas e                                               
                Informação                                                 
                Digital na                                                 
                 Internet                                                  
             <[EMAIL PROTECTED]                                             
                   t.br>                                                   
                                                                           
                                                                           




Rosilei & demais colegas:
Creio que os resultados dos seus dois testes não poderiam ser diferentes. A
razão disso é que a atual Web ainda está com milhões (ou bilhões) de
páginas
com escasssos campos de indexação, i.e., poucas são as que já estão usando
campos específicos para inclusão de metadados. A tão sonhada Web semântica
ainda irá demorar uns 5 anos para alcançar o seu pleno sucesso. Até lá,
infelizmente, teremos que conviver com a "antiga" Web. Quando chegarmos a
esse patamar é que veremos em funcionamento as potencialidades das
ontologias, da pesquisa contextual e das outras formas de busca que serão
propiciadas por esse novo cenário.
Assim, para acelerar a chegada do novo cenário precisamos estimular o uso
dos metadados nas aplicações Web existentes em nossas instituições. "Cada
um
fazendo o seu tanto" certamente ajudará na melhoria da qualidade da
informação recuperada pelas ferramentas de busca. Examine, por exemplo, o
código-fonte da página principal de sua organização e veja quais campos de
indexação/recuperação da informação que foram incluídos na programação em
linguagem HTML. É provável que o único campo seja o do title (<title>), os
demais campos foram "esquecidos"! À título de exemplo fiz uma cópia (veja
abaixo), de parte do código fonte da página principal do Online Computer
Library Center (OCLC). Essa organização -- uma das difusoras do Dublin
Core -- listou uma série de campo. É claro que, com essas simples e baratas
(!!) inclusões, as informações sobre o OCLC coletadas pelos atuais
mecanismos de busca serão de melhor qualidade. Assim, mesmo na Web atual,
ainda é possível otimizar a qualidade da informação recuperada. Vamos
iniciar a CRUZADA DE MELHORIA DA INFORMAÇÃO inserindo metadados nos campos
de nossas páginas Web.
O que acham? Abraços. Murilo Cunha
PS: alguns campos usados pelo OCLC em sua páginia principal:
<meta name="keywords" content="">
<meta name="description" content="OCLC Online Computer Library Center is a
nonprofit, membership, computer library service and research organization
whose computer network and services link thousands of libraries
worldwide.">
<meta name="DC.Title" content="Home">
<meta name="DC.Title.Alternative" content="">
<meta name="DC.Identifier.URL" content="">
<meta name="DC.Identifier.PURL" content="">
<meta name="DC.Contributor" content="Lisa">
<meta name="DC.Coverage" content="2002-11-05 13:48:38.273-">
<meta name="DC.Creator.CorporateName" content="OCLC">
<meta name="DC.Date.Created" content="2002-11-05 13:48:38.273">
<meta name="DC.Date.NextReview" content="">
<meta name="DC.Date.Published" content="">
<meta name="DC.Date.Revised" content="2006-01-30 15:37:27.39">
<meta name="DC.Description.Audience" content="">
<meta name="DC.Description.Version" content="78">
<meta name="DC.Description.Summary" content="OCLC Online Computer Library
Center is a nonprofit, membership, computer library service and research
organization whose computer network and services link thousands of
libraries
worldwide.">
<meta name="DC.Language" content="">
<meta name="DC.Publisher" content="OCLC">
<meta name="DC.Relation.Note" content="">
<meta name="DC.Rights" content="/worldwide/copyright/">
<meta name="DC.Source.Relationship" content="">
<meta name="DC.Subject" scheme="Keyword" content="">
<meta name="DC.Type.OCLC" content="homepage">


----- Original Message -----
From: "Rosilei Vilas Boas" <[EMAIL PROTECTED]>
To: "Lista de Discussão e Divulgação sobre Bibliotecas e Informação Digital
na Internet" <[email protected]>
Sent: Thursday, February 02, 2006 9:27 AM
Subject: Re: [Bib_virtual] Ontoweb, a nova era das ferramentas de busca


> Olá,
> Fiz dois testes. nenhum deles me trouxeram o resultado esperado. Procurei
> informações sobre semântica e ontologia usando o texto que é apresentado
no
> próprio site OntoWeb. Nesse caso nenhum dos dois (Google e OntoWeb)
retornou
> algum resultado relevante.
> Em seguida peguei um texto de uma Notícia Comentada do JK, do Portal
> Educacional. Submeti fragmentos de texto em duas pesquisas - Google e
> Ontoweb.
> O Google trouxe o Educacional como resultado, o Ontoweb retorrnou mais de
8
> mil documentos, os primeiros da Wikipedia, que eu não considero fonte de
> pesquisa confiável.
> De qualquer forma ainda é muito cedo, não é possível fazer uma comparação
do
> Google com o OntoWeb pois o Google tem em seu banco de dados uma parte
> garnde das páginas existentes na web já o Ontoeb tem em seu banco de
dados
o
> conteúdo de apenas 20 sites/fontes de pesquisa, grande parte do governo
com
> a exceção das áreas de cultura e ciência do wikipedia.
> Abraço,
> Rosilei Vilas Boas
> Editoria de Conteúdo
> Produtora de Pesquisa
> Fone: (41) 3312-3633
> [EMAIL PROTECTED]
> http://www.educacional.com.br
>
> ----- Original Message -----
> From: "Jonathan Pereira" <[EMAIL PROTECTED]>
> To: "Lista de Discussão e Divulgação sobre Bibliotecas e Informação
Digital
> na Internet" <[email protected]>
> Sent: Wednesday, February 01, 2006 7:24 PM
> Subject: Re: [Bib_virtual] Ontoweb, a nova era das ferramentas de busca
>
>
> > Ontoweb: um titã mais poderoso que o Google!
> >
> > Por Jonathan Pereira
> >
> > Lendo uma das mensagens enviadas para o meu e-mail, por meio de um
grupo
> de
> > discussão especializado em disseminação e acesso à informação, pude
> > constatar que, por mais incrível que possa parecer, o Google já
caducou,
> > virou buscador de museu.
> >
> > Os motores de buscas, que surgiram juntamente com a Internet comercial
no
> > início da década de 90, já passou por 6 gerações ao longo desses mais
de
> 15
> > anos de existência. Os primitivos parentes do Google eram: os
diretórios,
> > primeira geração; os robôs; tecnologias automatizadas; metabuscadores;
> > resultados refinados e, a geração passada, utilizando o Page Rank, o
caso
> do
> > nosso ultrapassado e querido Google.
> >
> > Baseado na engenharia de ontologias, o Ontoweb é o primeiro buscador
> > existente nessa sétima geração. Acompanhado de tecnologias intelegentes
> > como: PCE, RC2D, mineração de textos e raciocínio baseado em casos,
> > permitindo assim, uma "pensamento" e "raciocínio" daquilo que está
sendo
> > procurado, oferecendo respostas contextualizadas, qualificadas e
precisas.
> >
> > E para finalizar, o Ontoweb é desenvolvido e hospedado aqui no Brasil,
é
> > gratuito e não traz banners e propagandas.
> >
> > Eu, que tenho o Google como um Deus Virtual, espero que nosso
queridinho
> da
> > Internet nos surpreenda novamente e siga o caminho do Ontoweb. Caso
> > contrário, deixará de ser sinônimo de buscador, passando a faixa para
novo
> > prodígio da Internet!
> > --
> > Jonathan Pereira
> > Bibliotecário / CRB-8° 091/2005
> > oteatrodavida.blogspot.com
> > [EMAIL PROTECTED]
> >
> >
> >
> >
> > Em 01/02/06, Sigrid Karin Weiss Dutra <[EMAIL PROTECTED]> escreveu:
> > >
> > > Tecnologia online
> > > Ontoweb: A nova era das ferramentas de busca
> > > http://conjur.estadao.com.br/static/text/41493,1
> > > por Hugo Cesar Hoeschl
> > >
> > > Internet e motores de busca são quase sinônimos. Segundo os
> > > especialistas, as ferramentas das próximas gerações serão capazes de
> > > "raciocinar" e "entender" aquilo que está sendo buscado, oferecendo
> > > respostas contextualizadas e com maior precisão e qualidade. Pois
bem,
> > > acaba de surgir no Brasil uma nova tecnologia, que promete antecipar
a
> > > chegada do futuro. Trata-se do Ontoweb .
> > >
> > > As ferramentas de busca nasceram praticamente junto com a interface
> > > www da internet. Na primeira geração, tivemos os diretórios (Yahoo! e
> > > similares). Logo em seguida, vieram os robôs (spiders) e as
> > > tecnologias automatizadas (Altavista). A terceira geração veio com os
> > > metabuscadores (Miner's). Logo em seguida, veio mais refinamento na
> > > organização dos resultados (All The Web). O Google, reunindo
> > > sofisticação e muita abrangência, trouxe o Page Rank para a web, e
> > > marca a quinta geração. Juntar vários tipos de arquivos diferentes em
> > > uma mesma busca (textos e imagens, por exemplo) é o foco da sexta
> > > geração (A9), que está se desenvolvendo.
> > >
> > > A sétima geração é marcada pela qualidade na seleção das informações,
> > > por meio das análises inteligentes de conteúdo, e ela já está na
> > > internet com o Ontoweb, um incrível e inteligente motor de busca,
> > > baseado em ontologias e técnicas de inteligência artificial, que é
> > > capaz de "pensar" durante a seleção das informações.
> > >
> > > O Ontoweb é o primeiro buscador do mundo a trabalhar com engenharia
de
> > > ontologias, e é fruto de um projeto de desenvolvimento científico,
> > > utilizando semânticas e estruturas valorativas para contextualizar as
> > > buscas e refinar os resultados. O uso das ontologias é um dos
> > > principais segredos da nova ferramenta (daí o nome Ontoweb), e é
> > > também um dos principais fatores responsáveis pela alta qualidade dos
> > > seus resultados.
> > >
> > > Junto com as ontologias, ele utiliza tecnologias inteligentes como
PCE
> > > — Pesquisa Contextual Estruturada, RC2D — Representação do
> > > Conhecimento Contextualizado Dinamicamente, Mineração de Textos e
> > > Raciocínio Baseado em Casos. O novo motor de busca também faz
> > > hierarquização de conteúdos com base em métricas de similaridade e
> > > engenharia do conhecimento, e permite a visualização gráfica de
séries
> > > históricas de informações.
> > >
> > > Experimente, por exemplo, realizar buscas com as expressões "lavagem
> > > de dinheiro", "governo eletrônico" ou "drogas", para ver como
> > > funcionam as buscas por aproximação conceitual.
> > >
> > > Além disso, ele também é a primeira ferramenta de busca do mundo
> > > especialmente focada em governo eletrônico, pois tem como fontes de
> > > informação órgãos governamentais de mídia eletrônica, somados a
fontes
> > > digitais comunitárias e livres, gerando alta capilaridade no contato
> > > informacional direto entre governo e cidadão.
> > >
> > > O modelo inovador de desenvolvimento tecnológico do Ontoweb também
> > > permite que sejam feitas comparações entre textos. Experimente
> > > utilizar uma notícia inteira como texto de busca. A versão atual
> > > comporta entradas com até 7.000 caracteres, sendo que já foram
> > > realizados testes positivos com mais de 30 mil palavras (praticamente
> > > um capítulo de um livro). Vale lembrar que o Google, líder mundial do
> > > mercado, aceita somente 256 caracteres em sua versão padrão. Essa
> > > inovação tecnológica projeta a tendência de, no futuro, o Ontoweb
> > > atuar com um buscador para todos os tipos de assunto.
> > >
> > > Essa maneabilidade é possível graças à forte qualificação cientifica
> > > da equipe que desenvolve o projeto, com um histórico de mais de 10
> > > anos de pesquisas de ponta nas áreas de Gestão do Conhecimento,
> > > Inteligência Artificial, Governo Eletrônico e Sociedade da
Informação,
> > > os quais geraram mais de 200 trabalhos publicados em países como
> > > França, Estados Unidos, China, Índia, Escócia, Espanha, Itália,
> > > Alemanha, Noruega, México, Chile, Inglaterra, Argentina, Portugal e
> > > Grécia, entre outros, além de 17 produtos tecnológicos já
patenteados.
> > >
> > > No último Congresso Mundial de Computação, por exemplo, realizado em
> > > Toulouse, na França, o grupo de pesquisadores que desenvolve o
Ontoweb
> > > superou instituições como a Nasa, a IBM e a Siemens em volume de
> > > trabalhos selecionados para publicação. E em pelo menos outras três
> > > ocasiões o mesmo grupo de cientistas ficou em primeiro lugar mundial
> > > em renomados fóruns científicos internacionais, em Edimburgo (2003),
> > > Madri (2004) e Lisboa (2005), superando as universidades e centros de
> > > pesquisas mais desenvolvidos do planeta.
> > >
> > > Além de ser desenvolvido e hospedado no Brasil, o Ontoweb é livre e
> > > gratuito, não apresenta banners e não requer cadastro para sua
> > > utilização. Como ele não adota a prática de comercializar o ranking
> > > dos resultados, as buscas são mais fieis aos conceitos procurados, ou
> > > seja, o único fator que influencia na seleção dos documentos é o mapa
> > > conceitual da pesquisa solicitada.
> > >
> > > Será o fim do império do Google? Ainda não se sabe, mas, com certeza,
> > > é o início de uma nova era na gestão do conhecimento.
> > >
> > > Revista Consultor Jurídico, 1 de fevereiro de 2006
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > > ----------------------------------------------------------------
> > > This message was sent using IMP, the Internet Messaging Program.
> > >
> > > _______________________________________________
> > > Bib_virtual mailing list
> > > [email protected]
> > > https://listas.ibict.br/mailman/listinfo/bib_virtual
> > >
> >
> >
> >
> > --
> > Jonathan Pereira
> > Bibliotecário / CRB-8° 091/2005
> > oteatrodavida.blogspot.com
> > [EMAIL PROTECTED]
> >
>
>
>
--------------------------------------------------------------------------
--
> ----
>
>
> _______________________________________________
> Bib_virtual mailing list
> [email protected]
> https://listas.ibict.br/mailman/listinfo/bib_virtual
>
>


----------------------------------------------------------------------------

----


_______________________________________________
Bib_virtual mailing list
[email protected]
https://listas.ibict.br/mailman/listinfo/bib_virtual

_______________________________________________
Bib_virtual mailing list
[email protected]
https://listas.ibict.br/mailman/listinfo/bib_virtual

Esta mensagem e uma correspondencia reservada. Se voce a recebeu por engano, 
por favor desconsidere-a. 
O sistema de mensagens da Internet nao e considerado seguro ou livre de erros. 
Esta instituicao nao se
responsabiliza por opinioes ou declaracoes veiculadas atraves de e-mails.
_______________________________________________
Bib_virtual mailing list
[email protected]
https://listas.ibict.br/mailman/listinfo/bib_virtual

Responder a