Pokud si CSV převedeš do JSONL, což je podle mě vhodnější formát pro data,
tak potom doporučuji utilitu jq, je to něco jako XPath pro JSON:
https://stedolan.github.io/jq/ A díky streamování můžeš i zpracovávat data,
která se ti nevejdou ani do paměti, a paralelizovat přes všechna CPU (nebo
si CPU vypůjčit z cloudu), kdyby náhodou někdy bylo potřeba.

Dne 5. března 2018 16:02 Petr Messner <petr.mess...@gmail.com> napsal(a):

> No, je na to jeden takový super jazyk - Python :)
>
> I když teda existuje jazyk, ve kterém se nějaké adhoc datové transformační
> pipelines dělají ještě lépe - Javascript. Škoda, že Python list nemá metodu
> map, musí se to dělat minimálně přes list comprehensions, což je sice
> obecnější, ale o něco pomaleji se to píše.
>
> Pro old-schoolery potom grep, sed a awk.
>
>
> Dne 5. března 2018 14:31 Vláďa Macek <ma...@sandbox.cz> napsal(a):
>
> Zdar,
>>
>> mějme tabulková data načtená třeba z CSV nebo Google Tabulku. Víte o
>> elegantním nástroji (modulu) pro Python implementujícím jednoduchý
>> dotazovací jazyk?
>>
>> Jako "dej mi všechny řádky, které mají ve sloupci B hodnotu V (příp.
>> regexp), ve sloupci C nemají hodnoty V1 ani V2" atd.
>>
>> Jde mi o etablovanou věc. Ne něco spíchnutého pro vlastní potřebu a hrdě
>> zveřejněného, aby si autor otestoval psaní setup.py. :-)
>>
>> Díky,
>>
>> V.
>>
>>
>> _______________________________________________
>> Python mailing list
>> python@py.cz
>> http://www.py.cz/mailman/listinfo/python
>>
>> Visit: http://www.py.cz
>>
>
>
_______________________________________________
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Odpovedet emailem