Prezados, Sinceramente, não sei se a inclusão de metadados em sistemas abertos como é a Web é a resposta para o problema de recuperação da informação. O Google, por exemplo, não leva em consideração os metadados devido ao fato que esses podem ser usados para manipular os resultados de busca... Quanto ao Ontoweb, concordo com o Flávio, acho que ficar procurando um rival a altura do Google agora não é a melhor coisa a se fazer... esse rival, caso apareça, vai aparecer naturalmente e vai se impor a medida que for ganhando a simpatia dos usuários... E ainda, confesso que não acho uma boa idéia aplicar ontologias em um ambiente não estruturado como a Web e somando se a isso, a limitação do Ontoweb que deve indexar poucas páginas, produz um resultado que acredito estar longe de ser eficiente...
As alternativas para a organização da Web nos próximos anos estarão longe de serem universais, e conforme a visão de futuro da W3C para a Web, ela caminha para uma especialização de conteúdo e de sistemas, que possibilitará a criação de confiança em seu conteúdo...( http://www.w3.org/Consortium/technology ) Abraços Tiago Murakami "Murilo Bastos da Cunha" <[EMAIL PROTECTED]> To Sent by: Lista de Discussão e Divulgação bib_virtual-bounc sobre Bibliotecas e Informação [EMAIL PROTECTED] Digital na Internet <[email protected]> cc 02/02/2006 16:28 Subject Re: [Bib_virtual] Ontoweb, a nova Please respond to era das ferramentas de busca Lista de Discussão e Divulgação sobre Bibliotecas e Informação Digital na Internet <[EMAIL PROTECTED] t.br> Rosilei & demais colegas: Creio que os resultados dos seus dois testes não poderiam ser diferentes. A razão disso é que a atual Web ainda está com milhões (ou bilhões) de páginas com escasssos campos de indexação, i.e., poucas são as que já estão usando campos específicos para inclusão de metadados. A tão sonhada Web semântica ainda irá demorar uns 5 anos para alcançar o seu pleno sucesso. Até lá, infelizmente, teremos que conviver com a "antiga" Web. Quando chegarmos a esse patamar é que veremos em funcionamento as potencialidades das ontologias, da pesquisa contextual e das outras formas de busca que serão propiciadas por esse novo cenário. Assim, para acelerar a chegada do novo cenário precisamos estimular o uso dos metadados nas aplicações Web existentes em nossas instituições. "Cada um fazendo o seu tanto" certamente ajudará na melhoria da qualidade da informação recuperada pelas ferramentas de busca. Examine, por exemplo, o código-fonte da página principal de sua organização e veja quais campos de indexação/recuperação da informação que foram incluídos na programação em linguagem HTML. É provável que o único campo seja o do title (<title>), os demais campos foram "esquecidos"! À título de exemplo fiz uma cópia (veja abaixo), de parte do código fonte da página principal do Online Computer Library Center (OCLC). Essa organização -- uma das difusoras do Dublin Core -- listou uma série de campo. É claro que, com essas simples e baratas (!!) inclusões, as informações sobre o OCLC coletadas pelos atuais mecanismos de busca serão de melhor qualidade. Assim, mesmo na Web atual, ainda é possível otimizar a qualidade da informação recuperada. Vamos iniciar a CRUZADA DE MELHORIA DA INFORMAÇÃO inserindo metadados nos campos de nossas páginas Web. O que acham? Abraços. Murilo Cunha PS: alguns campos usados pelo OCLC em sua páginia principal: <meta name="keywords" content=""> <meta name="description" content="OCLC Online Computer Library Center is a nonprofit, membership, computer library service and research organization whose computer network and services link thousands of libraries worldwide."> <meta name="DC.Title" content="Home"> <meta name="DC.Title.Alternative" content=""> <meta name="DC.Identifier.URL" content=""> <meta name="DC.Identifier.PURL" content=""> <meta name="DC.Contributor" content="Lisa"> <meta name="DC.Coverage" content="2002-11-05 13:48:38.273-"> <meta name="DC.Creator.CorporateName" content="OCLC"> <meta name="DC.Date.Created" content="2002-11-05 13:48:38.273"> <meta name="DC.Date.NextReview" content=""> <meta name="DC.Date.Published" content=""> <meta name="DC.Date.Revised" content="2006-01-30 15:37:27.39"> <meta name="DC.Description.Audience" content=""> <meta name="DC.Description.Version" content="78"> <meta name="DC.Description.Summary" content="OCLC Online Computer Library Center is a nonprofit, membership, computer library service and research organization whose computer network and services link thousands of libraries worldwide."> <meta name="DC.Language" content=""> <meta name="DC.Publisher" content="OCLC"> <meta name="DC.Relation.Note" content=""> <meta name="DC.Rights" content="/worldwide/copyright/"> <meta name="DC.Source.Relationship" content=""> <meta name="DC.Subject" scheme="Keyword" content=""> <meta name="DC.Type.OCLC" content="homepage"> ----- Original Message ----- From: "Rosilei Vilas Boas" <[EMAIL PROTECTED]> To: "Lista de Discussão e Divulgação sobre Bibliotecas e Informação Digital na Internet" <[email protected]> Sent: Thursday, February 02, 2006 9:27 AM Subject: Re: [Bib_virtual] Ontoweb, a nova era das ferramentas de busca > Olá, > Fiz dois testes. nenhum deles me trouxeram o resultado esperado. Procurei > informações sobre semântica e ontologia usando o texto que é apresentado no > próprio site OntoWeb. Nesse caso nenhum dos dois (Google e OntoWeb) retornou > algum resultado relevante. > Em seguida peguei um texto de uma Notícia Comentada do JK, do Portal > Educacional. Submeti fragmentos de texto em duas pesquisas - Google e > Ontoweb. > O Google trouxe o Educacional como resultado, o Ontoweb retorrnou mais de 8 > mil documentos, os primeiros da Wikipedia, que eu não considero fonte de > pesquisa confiável. > De qualquer forma ainda é muito cedo, não é possível fazer uma comparação do > Google com o OntoWeb pois o Google tem em seu banco de dados uma parte > garnde das páginas existentes na web já o Ontoeb tem em seu banco de dados o > conteúdo de apenas 20 sites/fontes de pesquisa, grande parte do governo com > a exceção das áreas de cultura e ciência do wikipedia. > Abraço, > Rosilei Vilas Boas > Editoria de Conteúdo > Produtora de Pesquisa > Fone: (41) 3312-3633 > [EMAIL PROTECTED] > http://www.educacional.com.br > > ----- Original Message ----- > From: "Jonathan Pereira" <[EMAIL PROTECTED]> > To: "Lista de Discussão e Divulgação sobre Bibliotecas e Informação Digital > na Internet" <[email protected]> > Sent: Wednesday, February 01, 2006 7:24 PM > Subject: Re: [Bib_virtual] Ontoweb, a nova era das ferramentas de busca > > > > Ontoweb: um titã mais poderoso que o Google! > > > > Por Jonathan Pereira > > > > Lendo uma das mensagens enviadas para o meu e-mail, por meio de um grupo > de > > discussão especializado em disseminação e acesso à informação, pude > > constatar que, por mais incrível que possa parecer, o Google já caducou, > > virou buscador de museu. > > > > Os motores de buscas, que surgiram juntamente com a Internet comercial no > > início da década de 90, já passou por 6 gerações ao longo desses mais de > 15 > > anos de existência. Os primitivos parentes do Google eram: os diretórios, > > primeira geração; os robôs; tecnologias automatizadas; metabuscadores; > > resultados refinados e, a geração passada, utilizando o Page Rank, o caso > do > > nosso ultrapassado e querido Google. > > > > Baseado na engenharia de ontologias, o Ontoweb é o primeiro buscador > > existente nessa sétima geração. Acompanhado de tecnologias intelegentes > > como: PCE, RC2D, mineração de textos e raciocínio baseado em casos, > > permitindo assim, uma "pensamento" e "raciocínio" daquilo que está sendo > > procurado, oferecendo respostas contextualizadas, qualificadas e precisas. > > > > E para finalizar, o Ontoweb é desenvolvido e hospedado aqui no Brasil, é > > gratuito e não traz banners e propagandas. > > > > Eu, que tenho o Google como um Deus Virtual, espero que nosso queridinho > da > > Internet nos surpreenda novamente e siga o caminho do Ontoweb. Caso > > contrário, deixará de ser sinônimo de buscador, passando a faixa para novo > > prodígio da Internet! > > -- > > Jonathan Pereira > > Bibliotecário / CRB-8° 091/2005 > > oteatrodavida.blogspot.com > > [EMAIL PROTECTED] > > > > > > > > > > Em 01/02/06, Sigrid Karin Weiss Dutra <[EMAIL PROTECTED]> escreveu: > > > > > > Tecnologia online > > > Ontoweb: A nova era das ferramentas de busca > > > http://conjur.estadao.com.br/static/text/41493,1 > > > por Hugo Cesar Hoeschl > > > > > > Internet e motores de busca são quase sinônimos. Segundo os > > > especialistas, as ferramentas das próximas gerações serão capazes de > > > "raciocinar" e "entender" aquilo que está sendo buscado, oferecendo > > > respostas contextualizadas e com maior precisão e qualidade. Pois bem, > > > acaba de surgir no Brasil uma nova tecnologia, que promete antecipar a > > > chegada do futuro. Trata-se do Ontoweb . > > > > > > As ferramentas de busca nasceram praticamente junto com a interface > > > www da internet. Na primeira geração, tivemos os diretórios (Yahoo! e > > > similares). Logo em seguida, vieram os robôs (spiders) e as > > > tecnologias automatizadas (Altavista). A terceira geração veio com os > > > metabuscadores (Miner's). Logo em seguida, veio mais refinamento na > > > organização dos resultados (All The Web). O Google, reunindo > > > sofisticação e muita abrangência, trouxe o Page Rank para a web, e > > > marca a quinta geração. Juntar vários tipos de arquivos diferentes em > > > uma mesma busca (textos e imagens, por exemplo) é o foco da sexta > > > geração (A9), que está se desenvolvendo. > > > > > > A sétima geração é marcada pela qualidade na seleção das informações, > > > por meio das análises inteligentes de conteúdo, e ela já está na > > > internet com o Ontoweb, um incrível e inteligente motor de busca, > > > baseado em ontologias e técnicas de inteligência artificial, que é > > > capaz de "pensar" durante a seleção das informações. > > > > > > O Ontoweb é o primeiro buscador do mundo a trabalhar com engenharia de > > > ontologias, e é fruto de um projeto de desenvolvimento científico, > > > utilizando semânticas e estruturas valorativas para contextualizar as > > > buscas e refinar os resultados. O uso das ontologias é um dos > > > principais segredos da nova ferramenta (daí o nome Ontoweb), e é > > > também um dos principais fatores responsáveis pela alta qualidade dos > > > seus resultados. > > > > > > Junto com as ontologias, ele utiliza tecnologias inteligentes como PCE > > > — Pesquisa Contextual Estruturada, RC2D — Representação do > > > Conhecimento Contextualizado Dinamicamente, Mineração de Textos e > > > Raciocínio Baseado em Casos. O novo motor de busca também faz > > > hierarquização de conteúdos com base em métricas de similaridade e > > > engenharia do conhecimento, e permite a visualização gráfica de séries > > > históricas de informações. > > > > > > Experimente, por exemplo, realizar buscas com as expressões "lavagem > > > de dinheiro", "governo eletrônico" ou "drogas", para ver como > > > funcionam as buscas por aproximação conceitual. > > > > > > Além disso, ele também é a primeira ferramenta de busca do mundo > > > especialmente focada em governo eletrônico, pois tem como fontes de > > > informação órgãos governamentais de mídia eletrônica, somados a fontes > > > digitais comunitárias e livres, gerando alta capilaridade no contato > > > informacional direto entre governo e cidadão. > > > > > > O modelo inovador de desenvolvimento tecnológico do Ontoweb também > > > permite que sejam feitas comparações entre textos. Experimente > > > utilizar uma notícia inteira como texto de busca. A versão atual > > > comporta entradas com até 7.000 caracteres, sendo que já foram > > > realizados testes positivos com mais de 30 mil palavras (praticamente > > > um capítulo de um livro). Vale lembrar que o Google, líder mundial do > > > mercado, aceita somente 256 caracteres em sua versão padrão. Essa > > > inovação tecnológica projeta a tendência de, no futuro, o Ontoweb > > > atuar com um buscador para todos os tipos de assunto. > > > > > > Essa maneabilidade é possível graças à forte qualificação cientifica > > > da equipe que desenvolve o projeto, com um histórico de mais de 10 > > > anos de pesquisas de ponta nas áreas de Gestão do Conhecimento, > > > Inteligência Artificial, Governo Eletrônico e Sociedade da Informação, > > > os quais geraram mais de 200 trabalhos publicados em países como > > > França, Estados Unidos, China, Índia, Escócia, Espanha, Itália, > > > Alemanha, Noruega, México, Chile, Inglaterra, Argentina, Portugal e > > > Grécia, entre outros, além de 17 produtos tecnológicos já patenteados. > > > > > > No último Congresso Mundial de Computação, por exemplo, realizado em > > > Toulouse, na França, o grupo de pesquisadores que desenvolve o Ontoweb > > > superou instituições como a Nasa, a IBM e a Siemens em volume de > > > trabalhos selecionados para publicação. E em pelo menos outras três > > > ocasiões o mesmo grupo de cientistas ficou em primeiro lugar mundial > > > em renomados fóruns científicos internacionais, em Edimburgo (2003), > > > Madri (2004) e Lisboa (2005), superando as universidades e centros de > > > pesquisas mais desenvolvidos do planeta. > > > > > > Além de ser desenvolvido e hospedado no Brasil, o Ontoweb é livre e > > > gratuito, não apresenta banners e não requer cadastro para sua > > > utilização. Como ele não adota a prática de comercializar o ranking > > > dos resultados, as buscas são mais fieis aos conceitos procurados, ou > > > seja, o único fator que influencia na seleção dos documentos é o mapa > > > conceitual da pesquisa solicitada. > > > > > > Será o fim do império do Google? Ainda não se sabe, mas, com certeza, > > > é o início de uma nova era na gestão do conhecimento. > > > > > > Revista Consultor Jurídico, 1 de fevereiro de 2006 > > > > > > > > > > > > > > > > > > > > > > > > > > > ---------------------------------------------------------------- > > > This message was sent using IMP, the Internet Messaging Program. > > > > > > _______________________________________________ > > > Bib_virtual mailing list > > > [email protected] > > > https://listas.ibict.br/mailman/listinfo/bib_virtual > > > > > > > > > > > -- > > Jonathan Pereira > > Bibliotecário / CRB-8° 091/2005 > > oteatrodavida.blogspot.com > > [EMAIL PROTECTED] > > > > > -------------------------------------------------------------------------- -- > ---- > > > _______________________________________________ > Bib_virtual mailing list > [email protected] > https://listas.ibict.br/mailman/listinfo/bib_virtual > > ---------------------------------------------------------------------------- ---- _______________________________________________ Bib_virtual mailing list [email protected] https://listas.ibict.br/mailman/listinfo/bib_virtual _______________________________________________ Bib_virtual mailing list [email protected] https://listas.ibict.br/mailman/listinfo/bib_virtual Esta mensagem e uma correspondencia reservada. Se voce a recebeu por engano, por favor desconsidere-a. O sistema de mensagens da Internet nao e considerado seguro ou livre de erros. Esta instituicao nao se responsabiliza por opinioes ou declaracoes veiculadas atraves de e-mails.
_______________________________________________ Bib_virtual mailing list [email protected] https://listas.ibict.br/mailman/listinfo/bib_virtual

