sched: Embed run queue singleton into the scheduler

Tvrtko Ursulin Wed, 08 Oct 2025 01:54:42 -0700

Now that the run queue to scheduler relationship is always 1:1 we can
embed it (the run queue) directly in the scheduler struct and save on
some allocation error handling code and such.


Signed-off-by: Tvrtko Ursulin <[email protected]>
Cc: Christian König <[email protected]>
Cc: Danilo Krummrich <[email protected]>
Cc: Matthew Brost <[email protected]>
Cc: Philipp Stanner <[email protected]>
---
 drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c      |  6 ++--
 drivers/gpu/drm/amd/amdgpu/amdgpu_job.c     |  6 ++--
 drivers/gpu/drm/amd/amdgpu/amdgpu_job.h     |  5 +++-
 drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h   |  8 ++++--
 drivers/gpu/drm/amd/amdgpu/amdgpu_vm_sdma.c |  8 +++---
 drivers/gpu/drm/amd/amdgpu/amdgpu_xcp.c     |  8 +++---
 drivers/gpu/drm/scheduler/sched_entity.c    | 32 +++++++++------------
 drivers/gpu/drm/scheduler/sched_fence.c     |  2 +-
 drivers/gpu/drm/scheduler/sched_internal.h  |  3 +-
 drivers/gpu/drm/scheduler/sched_main.c      | 29 +++----------------
 drivers/gpu/drm/scheduler/sched_rq.c        | 16 +++++------
 include/drm/gpu_scheduler.h                 |  5 +---
 12 files changed, 55 insertions(+), 73 deletions(-)

diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
index 9cd7741d2254..63f8e4787dfa 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
@@ -1099,7 +1099,8 @@ static int amdgpu_cs_vm_handling(struct amdgpu_cs_parser 
*p)
        if (p->gang_size > 1 && !adev->vm_manager.concurrent_flush) {
                for (i = 0; i < p->gang_size; ++i) {
                        struct drm_sched_entity *entity = p->entities[i];
-                       struct drm_gpu_scheduler *sched = entity->rq->sched;
+                       struct drm_gpu_scheduler *sched =
+                               container_of(entity->rq, typeof(*sched), rq);
                        struct amdgpu_ring *ring = to_amdgpu_ring(sched);
 
                        if (amdgpu_vmid_uses_reserved(vm, ring->vm_hub))
@@ -1230,7 +1231,8 @@ static int amdgpu_cs_sync_rings(struct amdgpu_cs_parser 
*p)
                        return r;
        }
 
-       sched = p->gang_leader->base.entity->rq->sched;
+       sched = container_of(p->gang_leader->base.entity->rq, typeof(*sched),
+                            rq);
        while ((fence = amdgpu_sync_get_fence(&p->sync))) {
                struct drm_sched_fence *s_fence = to_drm_sched_fence(fence);
 
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
index bc07fd57310c..cdfaf3eb736d 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
@@ -341,7 +341,9 @@ static struct dma_fence *
 amdgpu_job_prepare_job(struct drm_sched_job *sched_job,
                      struct drm_sched_entity *s_entity)
 {
-       struct amdgpu_ring *ring = to_amdgpu_ring(s_entity->rq->sched);
+       struct drm_gpu_scheduler *sched =
+               container_of(s_entity->rq, typeof(*sched), rq);
+       struct amdgpu_ring *ring = to_amdgpu_ring(sched);
        struct amdgpu_job *job = to_amdgpu_job(sched_job);
        struct dma_fence *fence;
        int r;
@@ -434,7 +436,7 @@ drm_sched_entity_queue_pop(struct drm_sched_entity *entity)
 
 void amdgpu_job_stop_all_jobs_on_sched(struct drm_gpu_scheduler *sched)
 {
-       struct drm_sched_rq *rq = sched->rq;
+       struct drm_sched_rq *rq = &sched->rq;
        struct drm_sched_entity *s_entity;
        struct drm_sched_job *s_job;
 
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.h 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.h
index 4a6487eb6cb5..9530b5da3adc 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.h
@@ -102,7 +102,10 @@ struct amdgpu_job {
 
 static inline struct amdgpu_ring *amdgpu_job_ring(struct amdgpu_job *job)
 {
-       return to_amdgpu_ring(job->base.entity->rq->sched);
+       struct drm_gpu_scheduler *sched =
+               container_of(job->base.entity->rq, typeof(*sched), rq);
+
+       return to_amdgpu_ring(sched);
 }
 
 int amdgpu_job_alloc(struct amdgpu_device *adev, struct amdgpu_vm *vm,
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h
index d13e64a69e25..85724ec6aaf8 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h
@@ -145,6 +145,7 @@ TRACE_EVENT(amdgpu_cs,
                     struct amdgpu_ib *ib),
            TP_ARGS(p, job, ib),
            TP_STRUCT__entry(
+                            __field(struct drm_gpu_scheduler *, sched)
                             __field(struct amdgpu_bo_list *, bo_list)
                             __field(u32, ring)
                             __field(u32, dw)
@@ -152,11 +153,14 @@ TRACE_EVENT(amdgpu_cs,
                             ),
 
            TP_fast_assign(
+                          __entry->sched = container_of(job->base.entity->rq,
+                                                        
typeof(*__entry->sched),
+                                                        rq);
                           __entry->bo_list = p->bo_list;
-                          __entry->ring = 
to_amdgpu_ring(job->base.entity->rq->sched)->idx;
+                          __entry->ring = to_amdgpu_ring(__entry->sched)->idx;
                           __entry->dw = ib->length_dw;
                           __entry->fences = amdgpu_fence_count_emitted(
-                               to_amdgpu_ring(job->base.entity->rq->sched));
+                               to_amdgpu_ring(__entry->sched));
                           ),
            TP_printk("bo_list=%p, ring=%u, dw=%u, fences=%u",
                      __entry->bo_list, __entry->ring, __entry->dw,
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_sdma.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_sdma.c
index 36805dcfa159..4ccd2e769799 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_sdma.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_sdma.c
@@ -106,13 +106,13 @@ static int amdgpu_vm_sdma_prepare(struct 
amdgpu_vm_update_params *p,
 static int amdgpu_vm_sdma_commit(struct amdgpu_vm_update_params *p,
                                 struct dma_fence **fence)
 {
+       struct drm_gpu_scheduler *sched =
+               container_of(p->vm->delayed.rq, typeof(*sched), rq);
+       struct amdgpu_ring *ring =
+               container_of(sched, struct amdgpu_ring, sched);
        struct amdgpu_ib *ib = p->job->ibs;
-       struct amdgpu_ring *ring;
        struct dma_fence *f;
 
-       ring = container_of(p->vm->delayed.rq->sched, struct amdgpu_ring,
-                           sched);
-
        WARN_ON(ib->length_dw == 0);
        amdgpu_ring_pad_ib(ring, ib);
 
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_xcp.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_xcp.c
index 1083db8cea2e..be17635ac039 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_xcp.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_xcp.c
@@ -465,15 +465,15 @@ int amdgpu_xcp_open_device(struct amdgpu_device *adev,
 void amdgpu_xcp_release_sched(struct amdgpu_device *adev,
                                  struct amdgpu_ctx_entity *entity)
 {
-       struct drm_gpu_scheduler *sched;
-       struct amdgpu_ring *ring;
+       struct drm_gpu_scheduler *sched =
+               container_of(entity->entity.rq, typeof(*sched), rq);
 
        if (!adev->xcp_mgr)
                return;
 
-       sched = entity->entity.rq->sched;
        if (drm_sched_wqueue_ready(sched)) {
-               ring = to_amdgpu_ring(entity->entity.rq->sched);
+               struct amdgpu_ring *ring = to_amdgpu_ring(sched);
+
                atomic_dec(&adev->xcp_mgr->xcp[ring->xcp_id].ref_cnt);
        }
 }
diff --git a/drivers/gpu/drm/scheduler/sched_entity.c 
b/drivers/gpu/drm/scheduler/sched_entity.c
index 2b03ca7c835a..187538448669 100644
--- a/drivers/gpu/drm/scheduler/sched_entity.c
+++ b/drivers/gpu/drm/scheduler/sched_entity.c
@@ -115,19 +115,12 @@ int drm_sched_entity_init(struct drm_sched_entity *entity,
         * is initialized itself.
         */
        entity->sched_list = num_sched_list > 1 ? sched_list : NULL;
+       if (num_sched_list) {
+               entity->sched_list = num_sched_list > 1 ? sched_list : NULL;
+               entity->rq = &sched_list[0]->rq;
+       }
        RCU_INIT_POINTER(entity->last_scheduled, NULL);
        RB_CLEAR_NODE(&entity->rb_tree_node);
-
-       if (num_sched_list && !sched_list[0]->rq) {
-               /* Since every entry covered by num_sched_list
-                * should be non-NULL and therefore we warn drivers
-                * not to do this and to fix their DRM calling order.
-                */
-               pr_warn("%s: called with uninitialized scheduler\n", __func__);
-       } else if (num_sched_list) {
-               entity->rq = sched_list[0]->rq;
-       }
-
        init_completion(&entity->entity_idle);
 
        /* We start in an idle state. */
@@ -313,7 +306,7 @@ long drm_sched_entity_flush(struct drm_sched_entity 
*entity, long timeout)
        if (!entity->rq)
                return 0;
 
-       sched = entity->rq->sched;
+       sched = container_of(entity->rq, typeof(*sched), rq);
        /*
         * The client will not queue more jobs during this fini - consume
         * existing queued ones, or discard them on SIGKILL.
@@ -394,10 +387,12 @@ static void drm_sched_entity_wakeup(struct dma_fence *f,
 {
        struct drm_sched_entity *entity =
                container_of(cb, struct drm_sched_entity, cb);
+       struct drm_gpu_scheduler *sched =
+               container_of(entity->rq, typeof(*sched), rq);
 
        entity->dependency = NULL;
        dma_fence_put(f);
-       drm_sched_wakeup(entity->rq->sched);
+       drm_sched_wakeup(sched);
 }
 
 /**
@@ -424,7 +419,8 @@ EXPORT_SYMBOL(drm_sched_entity_set_priority);
 static bool drm_sched_entity_add_dependency_cb(struct drm_sched_entity *entity,
                                               struct drm_sched_job *sched_job)
 {
-       struct drm_gpu_scheduler *sched = entity->rq->sched;
+       struct drm_gpu_scheduler *sched =
+               container_of(entity->rq, typeof(*sched), rq);
        struct dma_fence *fence = entity->dependency;
        struct drm_sched_fence *s_fence;
 
@@ -558,7 +554,7 @@ void drm_sched_entity_select_rq(struct drm_sched_entity 
*entity)
 
        spin_lock(&entity->lock);
        sched = drm_sched_pick_best(entity->sched_list, entity->num_sched_list);
-       rq = sched ? sched->rq : NULL;
+       rq = sched ? &sched->rq : NULL;
        if (rq != entity->rq) {
                drm_sched_rq_remove_entity(entity->rq, entity);
                entity->rq = rq;
@@ -581,6 +577,8 @@ void drm_sched_entity_select_rq(struct drm_sched_entity 
*entity)
 void drm_sched_entity_push_job(struct drm_sched_job *sched_job)
 {
        struct drm_sched_entity *entity = sched_job->entity;
+       struct drm_gpu_scheduler *sched =
+               container_of(entity->rq, typeof(*sched), rq);
        bool first;
 
        trace_drm_sched_job_queue(sched_job, entity);
@@ -592,7 +590,7 @@ void drm_sched_entity_push_job(struct drm_sched_job 
*sched_job)
                xa_for_each(&sched_job->dependencies, index, entry)
                        trace_drm_sched_job_add_dep(sched_job, entry);
        }
-       atomic_inc(entity->rq->sched->score);
+       atomic_inc(sched->score);
        WRITE_ONCE(entity->last_user, current->group_leader);
 
        /*
@@ -603,8 +601,6 @@ void drm_sched_entity_push_job(struct drm_sched_job 
*sched_job)
 
        /* first job wakes up scheduler */
        if (first) {
-               struct drm_gpu_scheduler *sched;
-
                sched = drm_sched_rq_add_entity(entity);
                if (sched)
                        drm_sched_wakeup(sched);
diff --git a/drivers/gpu/drm/scheduler/sched_fence.c 
b/drivers/gpu/drm/scheduler/sched_fence.c
index 9391d6f0dc01..da4f53a9ca35 100644
--- a/drivers/gpu/drm/scheduler/sched_fence.c
+++ b/drivers/gpu/drm/scheduler/sched_fence.c
@@ -227,7 +227,7 @@ void drm_sched_fence_init(struct drm_sched_fence *fence,
 {
        unsigned seq;
 
-       fence->sched = entity->rq->sched;
+       fence->sched = container_of(entity->rq, typeof(*fence->sched), rq);
        seq = atomic_inc_return(&entity->fence_seq);
        dma_fence_init(&fence->scheduled, &drm_sched_fence_ops_scheduled,
                       &fence->lock, entity->fence_context, seq);
diff --git a/drivers/gpu/drm/scheduler/sched_internal.h 
b/drivers/gpu/drm/scheduler/sched_internal.h
index 0a5b7bf2cb93..6e92cb15b3f5 100644
--- a/drivers/gpu/drm/scheduler/sched_internal.h
+++ b/drivers/gpu/drm/scheduler/sched_internal.h
@@ -36,8 +36,7 @@ bool drm_sched_can_queue(struct drm_gpu_scheduler *sched,
                         struct drm_sched_entity *entity);
 void drm_sched_wakeup(struct drm_gpu_scheduler *sched);
 
-void drm_sched_rq_init(struct drm_sched_rq *rq,
-                      struct drm_gpu_scheduler *sched);
+void drm_sched_rq_init(struct drm_sched_rq *rq);
 struct drm_sched_entity *
 drm_sched_select_entity(struct drm_gpu_scheduler *sched);
 struct drm_gpu_scheduler *
diff --git a/drivers/gpu/drm/scheduler/sched_main.c 
b/drivers/gpu/drm/scheduler/sched_main.c
index 518ce87f844a..7de16e06a2df 100644
--- a/drivers/gpu/drm/scheduler/sched_main.c
+++ b/drivers/gpu/drm/scheduler/sched_main.c
@@ -645,7 +645,7 @@ void drm_sched_job_arm(struct drm_sched_job *job)
 
        BUG_ON(!entity);
        drm_sched_entity_select_rq(entity);
-       sched = entity->rq->sched;
+       sched = container_of(entity->rq, typeof(*sched), rq);
 
        job->sched = sched;
        job->s_priority = entity->priority;
@@ -1072,15 +1072,6 @@ int drm_sched_init(struct drm_gpu_scheduler *sched, 
const struct drm_sched_init_
        sched->score = args->score ? args->score : &sched->_score;
        sched->dev = args->dev;
 
-       if (sched->rq) {
-               /* Not an error, but warn anyway so drivers can
-                * fine-tune their DRM calling order, and return all
-                * is good.
-                */
-               dev_warn(sched->dev, "%s: scheduler already initialized!\n", 
__func__);
-               return 0;
-       }
-
        if (args->submit_wq) {
                sched->submit_wq = args->submit_wq;
                sched->own_submit_wq = false;
@@ -1092,11 +1083,7 @@ int drm_sched_init(struct drm_gpu_scheduler *sched, 
const struct drm_sched_init_
                sched->own_submit_wq = true;
        }
 
-       sched->rq = kmalloc(sizeof(*sched->rq), GFP_KERNEL | __GFP_ZERO);
-       if (!sched->rq)
-               goto Out_check_own;
-
-       drm_sched_rq_init(sched->rq, sched);
+       drm_sched_rq_init(&sched->rq);
 
        init_waitqueue_head(&sched->job_scheduled);
        INIT_LIST_HEAD(&sched->pending_list);
@@ -1112,12 +1099,6 @@ int drm_sched_init(struct drm_gpu_scheduler *sched, 
const struct drm_sched_init_
 
        sched->ready = true;
        return 0;
-
-Out_check_own:
-       if (sched->own_submit_wq)
-               destroy_workqueue(sched->submit_wq);
-       dev_err(sched->dev, "%s: Failed to setup GPU scheduler--out of 
memory\n", __func__);
-       return -ENOMEM;
 }
 EXPORT_SYMBOL(drm_sched_init);
 
@@ -1149,7 +1130,7 @@ static void drm_sched_cancel_remaining_jobs(struct 
drm_gpu_scheduler *sched)
 void drm_sched_fini(struct drm_gpu_scheduler *sched)
 {
 
-       struct drm_sched_rq *rq = sched->rq;
+       struct drm_sched_rq *rq = &sched->rq;
        struct drm_sched_entity *s_entity;
 
        drm_sched_wqueue_stop(sched);
@@ -1191,8 +1172,6 @@ void drm_sched_fini(struct drm_gpu_scheduler *sched)
        if (sched->own_submit_wq)
                destroy_workqueue(sched->submit_wq);
        sched->ready = false;
-       kfree(sched->rq);
-       sched->rq = NULL;
 
        if (!list_empty(&sched->pending_list))
                dev_warn(sched->dev, "Tearing down scheduler while jobs are 
pending!\n");
@@ -1212,7 +1191,7 @@ void drm_sched_increase_karma(struct drm_sched_job *bad)
 {
        struct drm_gpu_scheduler *sched = bad->sched;
        struct drm_sched_entity *entity, *tmp;
-       struct drm_sched_rq *rq = sched->rq;
+       struct drm_sched_rq *rq = &sched->rq;
 
        /* don't change @bad's karma if it's from KERNEL RQ,
         * because sometimes GPU hang would cause kernel jobs (like VM updating 
jobs)
diff --git a/drivers/gpu/drm/scheduler/sched_rq.c 
b/drivers/gpu/drm/scheduler/sched_rq.c
index f9c899a9629c..8b593e19b66c 100644
--- a/drivers/gpu/drm/scheduler/sched_rq.c
+++ b/drivers/gpu/drm/scheduler/sched_rq.c
@@ -72,17 +72,14 @@ static void drm_sched_rq_update_tree_locked(struct 
drm_sched_entity *entity,
  * drm_sched_rq_init - initialize a given run queue struct
  *
  * @rq: scheduler run queue
- * @sched: scheduler instance to associate with this run queue
  *
  * Initializes a scheduler runqueue.
  */
-void drm_sched_rq_init(struct drm_sched_rq *rq,
-                      struct drm_gpu_scheduler *sched)
+void drm_sched_rq_init(struct drm_sched_rq *rq)
 {
        spin_lock_init(&rq->lock);
        INIT_LIST_HEAD(&rq->entities);
        rq->rb_tree_root = RB_ROOT_CACHED;
-       rq->sched = sched;
        rq->head_prio = -1;
 }
 
@@ -151,7 +148,8 @@ drm_sched_entity_restore_vruntime(struct drm_sched_entity 
*entity,
                         */
                        vruntime = -us_to_ktime(rq_prio - prio);
                } else {
-                       struct drm_gpu_scheduler *sched = entity->rq->sched;
+                       struct drm_gpu_scheduler *sched =
+                               container_of(entity->rq, typeof(*sched), rq);
 
                        /*
                         * Favour entity with shorter jobs (interactivity).
@@ -233,8 +231,8 @@ drm_sched_rq_add_entity(struct drm_sched_entity *entity)
        }
 
        rq = entity->rq;
+       sched = container_of(rq, typeof(*sched), rq);
        spin_lock(&rq->lock);
-       sched = rq->sched;
 
        if (list_empty(&entity->list)) {
                atomic_inc(sched->score);
@@ -262,6 +260,8 @@ drm_sched_rq_add_entity(struct drm_sched_entity *entity)
 void drm_sched_rq_remove_entity(struct drm_sched_rq *rq,
                                struct drm_sched_entity *entity)
 {
+       struct drm_gpu_scheduler *sched = container_of(rq, typeof(*sched), rq);
+
        lockdep_assert_held(&entity->lock);
 
        if (list_empty(&entity->list))
@@ -269,7 +269,7 @@ void drm_sched_rq_remove_entity(struct drm_sched_rq *rq,
 
        spin_lock(&rq->lock);
 
-       atomic_dec(rq->sched->score);
+       atomic_dec(sched->score);
        list_del_init(&entity->list);
 
        drm_sched_rq_remove_tree_locked(entity, rq);
@@ -327,7 +327,7 @@ void drm_sched_rq_pop_entity(struct drm_sched_entity 
*entity)
 struct drm_sched_entity *
 drm_sched_select_entity(struct drm_gpu_scheduler *sched)
 {
-       struct drm_sched_rq *rq = sched->rq;
+       struct drm_sched_rq *rq = &sched->rq;
        struct rb_node *rb;
 
        spin_lock(&rq->lock);
diff --git a/include/drm/gpu_scheduler.h b/include/drm/gpu_scheduler.h
index d4dc4b8b770a..21129c98ce56 100644
--- a/include/drm/gpu_scheduler.h
+++ b/include/drm/gpu_scheduler.h
@@ -248,7 +248,6 @@ struct drm_sched_entity {
 /**
  * struct drm_sched_rq - queue of entities to be scheduled.
  *
- * @sched: the scheduler to which this rq belongs to.
  * @lock: protects @entities, @rb_tree_root and @head_prio.
  * @entities: list of the entities to be scheduled.
  * @rb_tree_root: root of time based priority queue of entities for FIFO 
scheduling
@@ -259,8 +258,6 @@ struct drm_sched_entity {
  * the next entity to emit commands from.
  */
 struct drm_sched_rq {
-       struct drm_gpu_scheduler        *sched;
-
        spinlock_t                      lock;
        /* Following members are protected by the @lock: */
        struct list_head                entities;
@@ -583,7 +580,7 @@ struct drm_gpu_scheduler {
        atomic_t                        credit_count;
        long                            timeout;
        const char                      *name;
-       struct drm_sched_rq             *rq;
+       struct drm_sched_rq             rq;
        wait_queue_head_t               job_scheduled;
        atomic64_t                      job_id_count;
        struct workqueue_struct         *submit_wq;
-- 
2.48.0

[PATCH 14/28] drm/sched: Embed run queue singleton into the scheduler

Reply via email to