El día 19 de mayo de 2009 7:08, BhEaN <lis...@bhean.com> escribió: > Antes de nada, muchísimas gracias a todos por vuestras respuestas.... > > Os contesto debajo de cada parrafo: >> >> rtree ya no existe. Fue reemplazado por GiST ("generalized search >> tree"), el cual es un sistema de indexamiento para tipos complicados -- >> por ej. se usa para indexar tipos geométricos y también para los índices >> de búsqueda en texto, entre muchas otras cosas. >> > > Eso es lo que necesito, un índice de búsqueda en texto... >> >> El otro sistema de indexamiento extravagante es GIN; es un índice >> invertido. También se usa para búsqueda en texto (es más rápido en >> búsquedas que GiST, pero mucho más lento para agregar nuevos valores). >> Se puede usar para otras cosas también obviamente. >> > > Eso suena mejor que GiST, puesto que la relación de inserciones/lecturas > será muy baja... se haran muchísimas más consultas que inserciones, por lo > que quizás me interese más éste tipo de indice... >> >> Hash es un tipo de índice que en Postgres no es recomendable por el >> momento, así que no lo uses porque tiene varios problemas. >> >> Así que tu única alternativa es el btree. Dado que no puedes almacenar >> más de 2000 y pico caracteres, vas a tener que buscar mecanismos >> alternativos. Si quieres indexar campos grandes de texto, ¿quizás lo que >> necesitas en realidad es usar el sistema de búsqueda en texto? Te >> podemos dar consejos más específicos si nos dices exactamente de qué >> naturaleza son los datos y cómo serán las consultas. >> >> > > Ok... siento no haber sido más explícito... lo que tengo exactamente es una > tabla con muchos anuncios clasificados (los típicos anuncios de "vendo > blablabla", o "compro blablablablabla"... hay varios millones de éstos > anuncios.... y lo que necesito es optimizar todo lo posible las búsquedas en > ella, ya que debo permitir búsquedas de palabras en el texto y título de > dichos anuncios... es decir, búsquedas del tipo LIKE '%blablabla%' (lo cual > tiene pinta de que va a ser horrible para la BBDD, pero es lo que hay, > jejejee...). No dispongo aún de los datos "reales", por lo que no puedo > hacer pruebas de rendimiento con un índice u otro, sino... simplemente > "probaría" a hacer búsquedas con un tipo de índice... luego con otro... y > así hasta dar con el más optimo, pero no los tengo aún, así que tengo que > preparar el tema un poco "a ciegas".
Like '%blablabla%' no va a usar un índice tradicional. Revisá la documentación acerca de "full text search" (http://www.postgresql.org/docs/8.3/static/textsearch.html) que te va a servir de ayuda. Saludos! Silvio -- Silvio Quadri -- TIP 8: explain analyze es tu amigo