hi:
 你可以尝试下 prometheus-pushgateway-cleaner,支持 docker 运行

 https://github.com/jorinvo/prometheus-pushgateway-cleaner

 可以定时清理指定时间未更新的 pushgateway metric,希望可以帮到你




--

Best, yuchuan





在 2020-09-02 11:25:25,"Jim Chen" <chenshuai19950...@gmail.com> 写道:
>能不能过restful api拿到pushgateway中metric上报的时间?通过这个时间动态判断删除group
>
>xiao cai <flin...@163.com> 于2020年9月1日周二 下午8:52写道:
>
>> Hi shizk233:
>> 我这边也复现了你说的情况,一模一样。
>>
>>  
>> 可以尝试使用定时调度任务检查flink任务的执行情况,当不再处于运行状态时,主动调用pushgateway的delete方法来删除pushgetway的metrics。
>>
>>
>>
>>
>>  原始邮件
>> 发件人: shizk233<wangwangdaxian...@gmail.com>
>> 收件人: user-zh@flink.apache.org<user-zh@flink.apache.org>
>> 发送时间: 2020年9月1日(周二) 19:10
>> 主题: Re: 回复:flink1.9.1采用Prometheus Pushgateway监控,当任务被kill掉,但grafana还是可以监控到数据
>>
>>
>> Hi Xiao, 我这边实践过程中发现,该参数只能删除jobmanager对应的metrics group,不能删除tm的。
>> 我们开启了randomJobNameSuffix,该参数会让JM和TM的metrics信息分属不同metrics group。
>> 感觉这可能是一个bug? xiao cai <flin...@163.com> 于2020年9月1日周二 下午4:57写道: > Hi: >
>> 可以试试在flink-conf.yaml中添加: > metrics.reporter.promgateway.deleteOnShutdown:
>> true > > > Best, > Xiao > 原始邮件 > 发件人: bradyMk<zhbm...@126.com> > 收件人:
>> user-zh<user-zh@flink.apache.org> > 发送时间: 2020年9月1日(周二) 16:50 > 主题: Re:
>> 回复:flink1.9.1采用Prometheus Pushgateway监控,当任务被kill掉,但grafana还是可以监控到数据 > > >
>> 您好,我不是很懂您的意思,例如我这边有一个这样的指标:flink_jobmanager_job_uptime 监控一个任务的运行时长; >
>> 如果该任务被kill掉,那么这个指标的数值会变成一个不变的量,一直显示在grafana中。我不太会promeQL,我尝试这样: >
>> flink_jobmanager_job_uptime[1m],这样是个非法查询命令,按照您的意思,应该怎么改呢? ----- Best Wishes
>> > -- Sent from: http://apache-flink.147419.n8.nabble.com/

回复