Beste mensen,

Hierbij mijn eerste vraag in de PUN wereld. Ik ben beginnend met python, vanuit 
een achtergrond met vooral Fortran / Pascal. Waar ik tegenaan loop is de 
visualisatie (lijnen, histogrammen) van vrije grote databases (10^5 - 10^6 
records) van de uitvoer van een bos-groei model waar ik we 
gevoeligheidsanalyses mee hebben uitgevoerd.

In ipython heb ik de volgende stappen gemaakt:

import pandas as pd
import numpy as np
import matplotlib.pylab as plt

data = pd.read_csv(VolInc.csv')

grouped = data.groupby(['Spec','Precip','Temp','CO2'])

ter toelichting op de data structuur:

-      De gegroepeerde factoren zijn in een aantal levels gevarieerd (bv vier 
boomsoorten, 3 neerslag niveaus, etc).

-      Alle combinaties van de factoren zijn door het model langsgelopen. Een 
unieke combinatie van factoren wordt 1 scenario genoemd.

-      alle scenario's zijn meerdere keren herhaald omdat er stochastische 
componenten in het model zitten.

-      Een model run bestaat uit meerdere jaren. Een unieke index bestaat dus 
uit de combinatie van scenario-replica-jaar.

-      De uitkomsten van het model staan in 1 of meerdere value kolommen (bv 
volume toename van de stam)

Een paar tips om de data op verschillende manieren te visualiseren om op gang 
te komen zouden erg handig zijn. Mn:

-      Value-kolom op y-as, en tijd (year) weergeven op x-as,

-      filteren op factor-values (waarden van 2 factoren vastzetten, en van 
derde factor weergeven op x-as)

-      species en / of factoren weergeven in legenda

-      factoren over verschillende figuren verdelen

-      titles van plots, x-as en legenda uit factor waarden halen

-      replica's in error bars weergeven

Ik hoop dat iemand die ervaring heeft met python om vergelijkbare data te 
visualiseren me wat werkende code aan de hand kan doen waarop ik kan 
voortborduren

Groet,

Koen


_______________________________________________
Python-nl mailing list
[email protected]
http://mail.python.org/mailman/listinfo/python-nl

Antwoord per e-mail aan