Hola, jo podria col.laborar amb el tema dels scripts, analitzar l'arxiu d'origen i si cal fer neteja de les dades, uniformitzar camps, etc. Conec python i pandas que pot anar be per sengons quin tipus d'analisis.
On 7/27/19, [email protected] <[email protected]> wrote: > Send Talk-cat mailing list submissions to > > Bon dia, gent! > > Tot aprofitant que tenim el personal docent fent vacances, he pensat en > començar a preparar la importació dels centres docents que tenim a > Catalunya, a partir del dataset que hi ha a les dades obertes de la > Generalitat. > > Per poder fer la importació cal seguir una sèrie de passes i anar prenent > decisions. Per fer-ho més fàcil, transparent i participatiu, ho comento per > aquí. Tota ajuda serà benvinguda, no tan sols a fer la importació en sí, > sinó en la presa de decisions, programació d’script, redactat de > documentació i correus... Per què us feu una idea, el dataset està compost > per gairebé 22.000 files, que no he mirat encara si són a centre per fila o > n’hi ha de repetits, i 60 camps. > > Fases de treball (ordre aproximat): > > 1 - analitzar quins camps de dades hi ha (columnes) al dataset i què > contenen. (FASE FETA, adjunto fitxer). > > 2 - determinar quins camps són importables i quins no > > 3 - obrir el dataset i analitzar què hi ha: duplicitat de centres? Com > apareixen els que ofereixen més d’un cicle formatiu? Caldrà afegir > etiquetat nou (edats mínimes i màximes, per exemple)? Hi ha diferenciació > entre privat i concertat? Com indiquem estudis públics amb taxa (escola > idiomes, alguns cicles superiors, escola adults...)? Com han tractat els > ZAR o escoles rurals? Cal afegir algun codi per identificar qui hi forma > part? > > 4 - definir l’etiquetat tant dels camps importables com el que haguem > definit abans per tractar les diferents casuístiques > > 5 - crear un script que converteixi el csv o xml origen en el fitxer osm o > csv base per a la importació > > 6 - determinar com farem la importació (més aviat serà tot coflació de > dades): gestor de tasques per municipi, àrea, quantitat de centres? > > 7 - documentar tot a la wiki: llicència, estudi dels camps, script per a la > conversió, com es farà la importació... Decidir llengua/llengües de la > wiki: català, castellà i anglès? > > 8 - escriure a la comunitat espanyola > > 9 - escriure a imports, afegir la proposta a la wiki corresponent, > gestionar respostes... > > 10 - importació! > > Us convido a que dieu la vostra i comenteu on i com podríeu ajudar, per > muntar un equip de treball i anar organitzant-nos. O què us semblaria > compartir les tasques de preparació amb la llista espanyola per tenir més > mans i opinions abans de fer-la oficial. > > Afegeixo una sèrie d’enllaços a diferents pàgines de la wiki on he trobat > informació relativa als centres docents: > > Codi ISCED, utilitzat per identificar el grau formatiu: > https://wiki.openstreetmap.org/wiki/Key:isced:level > > Etiqueta school amb les etiquetes addicionals proposades: > https://wiki.openstreetmap.org/wiki/Tag:amenity%3Dschool > > Estudi sobre les etiquetes disponibles per al sector educatiu (la versió en > castellà podria ser un xic diferent a l’anglesa): > https://wiki.openstreetmap.org/wiki/Education_features > > Última importació de centres escolars que he trobat, feta a Perú: > https://wiki.openstreetmap.org/wiki/ES:Importando_instituciones_educativas_en_Per%C3%BA > > Exemple de wiki d’importació, feta a Madrid: > https://wiki.openstreetmap.org/wiki/Madrid_Drinking_Water_Import > Salut! > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > <http://lists.openstreetmap.org/pipermail/talk-cat/attachments/20190726/d2806e52/attachment-0001.html> > -------------- next part -------------- > A non-text attachment was scrubbed... > Name: OSM_centres_docents.csv > Type: application/vnd.ms-excel > Size: 2775 bytes > Desc: not available > URL: > <http://lists.openstreetmap.org/pipermail/talk-cat/attachments/20190726/d2806e52/attachment-0001.xlb> > > ------------------------------ > > Subject: Digest Footer > > _______________________________________________ > Talk-cat mailing list > [email protected] > https://lists.openstreetmap.org/listinfo/talk-cat > > > ------------------------------ > > End of Talk-cat Digest, Vol 69, Issue 1 > *************************************** > _______________________________________________ Talk-cat mailing list [email protected] https://lists.openstreetmap.org/listinfo/talk-cat
