Em  4 de maio de 2017, as 13:54 BRT, Artur Zanini <[email protected]> 
escreveu:
> Alguém pode indicar exemplos e material como o postgres trabalha Regressão
> linear.
> Funções matemáticas para Data Mining.


Se a intenção é para trabalhar com PLs e funções "dentro" do banco, para
regressão linear eu costumo utilizar as funções regr_* [1] nativas do 
PostgreSQL mesmo utilizando o próprio SQL em primeiro lugar, e quando
necessário algo com pl/Python [2] onde uso numpy [3] e as vezes
pandas [4].

Um exemplo em que uso é na analise estatística das coletas de dados sobre
os objetos do banco, em que armazeno os dados em tabelas para
consultá-las depois, de modo que consigo observar alguns comportamentos
sem mesmo ter que criar um gráfico para isto.

A vantagem é o gerenciamento da memória durante o processamento, que no
banco ocorre no lado, erh... do banco :D, ou seja, na memória dele,
permitindo processar algumas dezenas de gigas, coisa que num PC ou
Laptop pode não ser viável já que é padrão você ter que carregar todos
os dados para a memoria antes de processar, levando você a ter que
trabalhar com DataFrames complexos e libs especificas da linguagem
escolhida para compensar.


[1] 
https://www.postgresql.org/docs/current/static/functions-aggregate.html#FUNCTIONS-AGGREGATE-STATISTICS-TABLE
[2] https://www.postgresql.org/docs/current/static/plpython.html
[3] http://www.numpy.org
[4] http://pandas.pydata.org


Att.
-- 
Dickson S. Guedes
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a