Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-04-02 Par sujet Vladimir Vyskocil

On 31 mars 2010, at 20:02, Emilie Laffray wrote:

 On 31/03/2010 18:11, Steven Le Roux wrote:
 Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le
 format osm vers une base nosql genre cassandra/HBase ?
 
 Je ne suis pas sure que ca soit utile. Après tout, je ne crois pas que
 les bases nosql aient un support spatial a la base.

J'ai lu récemment que mongoDB venait d'ajouter le support du geospatial 
indexing : 

http://www.mongodb.org/display/DOCS/Geospatial+Indexing

Vlad.___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-04-02 Par sujet François Van Der Biest
Il y a aussi un plugin GeoCouch pour CouchDB, présenté au FOSS4G l'an dernier...
http://vmx.cx/cgi-bin/blog/index.cgi/category/CouchDB

F.

2010/4/2 Vladimir Vyskocil vladimir.vysko...@gmail.com:

 On 31 mars 2010, at 20:02, Emilie Laffray wrote:

 On 31/03/2010 18:11, Steven Le Roux wrote:

 Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le

 format osm vers une base nosql genre cassandra/HBase ?

 Je ne suis pas sure que ca soit utile. Après tout, je ne crois pas que
 les bases nosql aient un support spatial a la base.

 J'ai lu récemment que mongoDB venait d'ajouter le support du geospatial
 indexing :
 http://www.mongodb.org/display/DOCS/Geospatial+Indexing
 Vlad.
 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet Emilie Laffray
2010/3/31 Marc Sibert m...@sibert.fr

 Emilie Laffray a écrit :
  Quelqu'un a fait des essais sur SQLLite3, et ce n'était pas concluant
  du tout. Ça souffrait de sérieux ralentissement rien que sur un pays
  (l'Allemagne).
 
  Emilie Laffray
 Ben sur la France (prise à geofabrik.de) ça marche pas mal. Comme je
 l'écrivais, je fais les inserts sans index avec un mode de Sqlite3 qui
 ne garantit pas l'intégrité de la base en cas de shutdown violent, mais
 là qu'importe. Je rajoute donc les index (classiques et géographiques)
 après puis je finis par un analyse (calculs de statistiques sur les
 données pour optimiser les plans d'exécutions). Avec un AMD 1800, 1 Go
 de RAM (quasiment pas utilisée), et un disque local 250 Go : un PC de
 bureau quoi.

 Comme, en plus, il s'agit pas seulement de Sqlite3, mais de l'extension
 Spatialite, j'hérite de plein de fonctions spatiales et de conversions
 pubSpatialite inclut les librairies PROJ.4 latest version (4.6.1),
 GEOS latest version (3.1.1), SQLite's latest version (3.6.16))/pub

 Merci pour vos retours,


Interessant. Je serais curieuse de savoir quel type de performance tu
obtiens.

Emilie Laffray
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet Steven Le Roux
Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le format
osm vers une base nosql genre cassandra/HBase ?

2010/3/31 Marc Sibert m...@sibert.fr

 Emilie Laffray a écrit :
  Quelqu'un a fait des essais sur SQLLite3, et ce n'était pas concluant
  du tout. Ça souffrait de sérieux ralentissement rien que sur un pays
  (l'Allemagne).
 
  Emilie Laffray
 Ben sur la France (prise à geofabrik.de) ça marche pas mal. Comme je
 l'écrivais, je fais les inserts sans index avec un mode de Sqlite3 qui
 ne garantit pas l'intégrité de la base en cas de shutdown violent, mais
 là qu'importe. Je rajoute donc les index (classiques et géographiques)
 après puis je finis par un analyse (calculs de statistiques sur les
 données pour optimiser les plans d'exécutions). Avec un AMD 1800, 1 Go
 de RAM (quasiment pas utilisée), et un disque local 250 Go : un PC de
 bureau quoi.

 Comme, en plus, il s'agit pas seulement de Sqlite3, mais de l'extension
 Spatialite, j'hérite de plein de fonctions spatiales et de conversions
 pubSpatialite inclut les librairies PROJ.4 latest version (4.6.1),
 GEOS latest version (3.1.1), SQLite's latest version (3.6.16))/pub

 Merci pour vos retours,

 --
 Marc



 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Steven Le Roux
Jabber-ID : ste...@jabber.fr
0x39494CCB ste...@le-roux.info
2FF7 226B 552E 4709 03F0  6281 72D7 A010 3949 4CCB
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet Emilie Laffray
On 31/03/2010 18:11, Steven Le Roux wrote:
 Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le
 format osm vers une base nosql genre cassandra/HBase ?

Je ne suis pas sure que ca soit utile. Après tout, je ne crois pas que
les bases nosql aient un support spatial a la base. Je ne suis pas
convaincue par l'utilisation d'une base nosql car la logique derrière
tout ca n'est pas aussi simple et pour utiliser cela de manière utile,
il faut bien maitriser.
Je ne sais pas si ca aurait un quelconque avantage a moins d'avoir cela
sur le serveur principal (et la serie de clusters associes). Il faut
voir. Je serais curieuse de voir le résultat et surtout de savoir si ca
apporte vraiment quelque chose.

Emilie Laffray



signature.asc
Description: OpenPGP digital signature
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet julien balas
Emilie Laffray wrote:
 On 31/03/2010 18:11, Steven Le Roux wrote:
 Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le
 format osm vers une base nosql genre cassandra/HBase ?
 
 Je ne suis pas sure que ca soit utile. Après tout, je ne crois pas que
 les bases nosql aient un support spatial a la base. Je ne suis pas
 convaincue par l'utilisation d'une base nosql car la logique derrière
 tout ca n'est pas aussi simple et pour utiliser cela de manière utile,
 il faut bien maitriser.
 Je ne sais pas si ca aurait un quelconque avantage a moins d'avoir cela
 sur le serveur principal (et la serie de clusters associes). Il faut
 voir. Je serais curieuse de voir le résultat et surtout de savoir si ca
 apporte vraiment quelque chose.

d'apres ce que j'ai compris ca s'adapte bien aux structure de données 
dont le contenu est variable.
Du coup j'imagine que ca pourrait coller avec les donnes OSM dans la 
mesure ou la plupart des attributs d'un node ou d'une way sont 
optionnels (et qu'on peut même rajouter un nouvel attribut a tout moment)

Pour les clusters, apparement les base noSQL sont plutot performante des 
qu'il y a pas mal de serveurs, donc ca pourrait coller aussi. Surtout 
qu'a priori il n'y a pas (ou il y a moins) de goulet d'etranglement sur 
les ecritures en base. Qui sont traditionnelement un peut le facteur 
limitant.

Enfin tout ca c'est de la theorie.
J'espere essayer la pratique ce WE.
-- 
JB

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet Steven Le Roux
là où je m'interroge c'est sur les performances d'un postgis par exemple.
Quelle est sa limite ?

Imaginons que je doive concevoir un service faisant de la recherche
géographique... jusqu'où monte postgis ? idem en indexation...

Donc si qq'un a déjà benché, je suis prenneur :)


2010/3/31 julien balas jul...@krilin.org

 Emilie Laffray wrote:
  On 31/03/2010 18:11, Steven Le Roux wrote:
  Puisqu'on parle de performance, quelqu'un aurait essayé d'importer le
  format osm vers une base nosql genre cassandra/HBase ?
 
  Je ne suis pas sure que ca soit utile. Après tout, je ne crois pas que
  les bases nosql aient un support spatial a la base. Je ne suis pas
  convaincue par l'utilisation d'une base nosql car la logique derrière
  tout ca n'est pas aussi simple et pour utiliser cela de manière utile,
  il faut bien maitriser.
  Je ne sais pas si ca aurait un quelconque avantage a moins d'avoir cela
  sur le serveur principal (et la serie de clusters associes). Il faut
  voir. Je serais curieuse de voir le résultat et surtout de savoir si ca
  apporte vraiment quelque chose.

 d'apres ce que j'ai compris ca s'adapte bien aux structure de données
 dont le contenu est variable.
 Du coup j'imagine que ca pourrait coller avec les donnes OSM dans la
 mesure ou la plupart des attributs d'un node ou d'une way sont
 optionnels (et qu'on peut même rajouter un nouvel attribut a tout moment)

 Pour les clusters, apparement les base noSQL sont plutot performante des
 qu'il y a pas mal de serveurs, donc ca pourrait coller aussi. Surtout
 qu'a priori il n'y a pas (ou il y a moins) de goulet d'etranglement sur
 les ecritures en base. Qui sont traditionnelement un peut le facteur
 limitant.

 Enfin tout ca c'est de la theorie.
 J'espere essayer la pratique ce WE.
 --
 JB

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Steven Le Roux
Jabber-ID : ste...@jabber.fr
0x39494CCB ste...@le-roux.info
2FF7 226B 552E 4709 03F0  6281 72D7 A010 3949 4CCB
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Benchmark d'import osm - Etait beta est de retour...

2010-03-31 Par sujet Emilie Laffray
On 31/03/2010 22:48, Steven Le Roux wrote:
 là où je m'interroge c'est sur les performances d'un postgis par
 exemple. Quelle est sa limite ?

 Imaginons que je doive concevoir un service faisant de la recherche
 géographique... jusqu'où monte postgis ? idem en indexation...

 Donc si qq'un a déjà benché, je suis prenneur :)

Une requête de reverse geocoding sur le serveur du boulot prend environ
50ms. Dans la table des routes, il y a 28M de lignes. Les autres tables
comme les POI sont beaucoup plus petites.
La relative lenteur de la requête s'explique par l'utilisation autre que
des polygones. Quand tu utilises des polygones partout, tu descend très
vite. Avec la configuration serveur que l'on a au bureau, on a estime
être capable de prendre environ 800 requêtes seconde.
Postgis tient bien la route et après il y a toujours moyen d'optimiser
avec des index partiels selon ce que tu recherches et des partitions de
table (très très efficace).
De plus, manipuler des polygones est très performant (a condition qu'ils
fassent une taille raisonnable) du fait de la mise en mémoire des
géométries. C'est vraiment une question de configuration de Postgres sur
pas mal de points pour avoir de bonnes performances. Des choses comme un
index clustering peut sérieusement aider les performances en IO.
Postgis 1.5 a pas mal d'optimisations supplémentaires sur des choses
comme ST_intersects, ST_Union (1.4+) etc...  Apres c'est sur tu peux
tuer le serveur avec certaines requêtes :)

Emilie Laffray



signature.asc
Description: OpenPGP digital signature
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr