Re: Puede pg_basebackup afectar performace?

Horacio Miranda Sun, 13 Oct 2019 22:24:37 -0700


On 13/10/2019 1:19 PM, Carlos T. Groero Carmona wrote:

Hola Lista,

Hola

Dejenme introducir un porquito lo que esta pasando, en estos momentosestamos usando un DC, pero estamos estamos dando algunos pasos firmespara movernos para Azure, por lo que tengo 4 servidores en productiony 3 mas en hold.
Que significa esto:
serv1 es mi servidor primario (location 1)
serv2 es mi HA (location 1)
serv3 va a ser mi servidor primario en Azure (Location 2)
serv4 es mi DR (location3)

Estoy replicando (SR) desde :
* serv1->serv2
Estoy Cascading replication:
* serv2->serv3
* serv2->serv4
Pero cuando teniamos graves incidentes (P1) hace unos meses, sedecidio rentar servidores nuevos con mayor capacidad, y por otrasrasones se exagero en la capidad, los nuevos servidores tienen:
CPU: 114 (74 cores, 2 Thread per Core)
RAM: 790 Gb
Disk 10 TB (RAID 10)
OS: CentOS 7.x

Mi actual servidor primario tiene:
CPU: 48 (24 Cores * 2 thread)
RAM: 790 GB
Disk 5TB (RAID 10)
OS: CentOS 7.x

En todos los casos uso PostgreSQL 9.6
En estos momentos estamos estables gracias a la correcta configurationde pgBouncer y solo en los momentos picos alcanzamos un 60% del usodel CPU, nuestro average es un 45%, asi que no se necesita utilizarlos nuevos servidores, PERO, se ha decido ponerlos en hot standby porsi se llega a necesitar en un futuro cercano, ya que como quiera seesta pagando por ellos.
Asi que intente poner uno de estos nuevos servidores detrás de serv2 yse vio affectado el tiempo de respuesta del sistema, trate de ponerlodetras de serv1 y fue peor la affectation, en todo momento apenas quepg_basebackup empezo a copiar los datos se disparo el % de utilizaiconde l disco en serv1 o serv2 asi que detuve el pg_basebackup.

( estas usando compresion en los respaldos ? ), estas usando un arreglodistindo al arreglo de discos de los datos vs los respaldos ?

Que te dice la cola de procesos y la los IO waits ? del S.O. ? estasusando XFS como filesystem ?

En un escenario pues lo deje correr detras de serv2 porque se affectoel tiempo de respuesta de postgres serca de 3 veces mas pero noimpacto mucho el tiempo de respuesta del sistema, una vez que terminoel pg_basebackup todo funciono correctamente y el tiempo de respuestadel sistema regreso a su normalidad.

A que te refieres con que afecto el tiempo de respuetsa de postgresql a3 veces pero al mismo tiempo no impacto el tiempo de respuesta delsistema ? ( me tinca que tienes una cola en algun lado que estalimitando el postgresql ), como estan tus parametros de open files ?cuanta RAM tienes asignada al postgrsql ? y cuantos procesos alpostrgesql ?

Mi hypotesis es que el monstrou de servidor nuevo esta chupandose todoel I/O a traves de pg_basebackup. Tienen ustedes alguna otra idea?

Que te dice el top ? lo mejor es correr un sysreport o sosreport parasaber que esta pasando justo en el momento de la falla o durante tuproblema para saber que esta pasando en la maquina.

Si tienen alguna pregunta dejenme saber, tengo ulgunas imagenes de miherramienta de monitoreo..
Lo curioso es que las TPS no se vieron afectadas ni las queries porsegundo.

Esto no lo entiendo, si el postrgresql esta mas lento tus TPS se veranafectadas, esto esta raro.


Como siempre cualquier sugerencia o explicacion sera apreciada.

En mi experiencia con bases de datos grandes, lo importante son loscanales entre las maquinas y el cypher que uses para conectarte entrelas bases de datos. Ejemplo sí usas un tunel SSH debes usar un tunel conun cypher que no sea costoso, uncluso un NFS ( ahora los NFS sonpeligrosos por que cuando se te pegan a nivel de kernel debes reiniciarlas maquinas no hay otra forma de recuperarse, NFSv4 soporta multipath.

yo revisaría los cuellos de botellas que tengas y los arreglaría uno poruno, no hay otra forma, optimiza y estreza para saber donde esta tucuello de botella.


Saludos,
Carlos

Re: Puede pg_basebackup afectar performace?

Reply via email to