amdgpu: require a job to schedule an IB

Alex Deucher Mon, 16 Feb 2026 13:14:08 -0800

Remove the old direct submit path.  This simplifies
the code.

v2: remove more local variables


Reviewed-by: Jesse Zhang <[email protected]>
Signed-off-by: Alex Deucher <[email protected]>
---
 drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c |   2 +-
 drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c     | 113 ++++++++-------------
 drivers/gpu/drm/amd/amdgpu/amdgpu_job.c    |   5 +-
 drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h   |   3 +-
 4 files changed, 45 insertions(+), 78 deletions(-)

diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
index 823b92005689a..4ec1058b7cdfa 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
@@ -685,7 +685,7 @@ int amdgpu_amdkfd_submit_ib(struct amdgpu_device *adev,
        job->vmid = vmid;
        job->num_ibs = 1;
 
-       ret = amdgpu_ib_schedule(ring, 1, ib, job, &f);
+       ret = amdgpu_ib_schedule(ring, job, &f);
 
        if (ret) {
                drm_err(adev_to_drm(adev), "failed to schedule IB.\n");
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c
index 80565c4a31bdf..55a9670f1dd90 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c
@@ -103,8 +103,6 @@ void amdgpu_ib_free(struct amdgpu_ib *ib, struct dma_fence 
*f)
  * amdgpu_ib_schedule - schedule an IB (Indirect Buffer) on the ring
  *
  * @ring: ring index the IB is associated with
- * @num_ibs: number of IBs to schedule
- * @ibs: IB objects to schedule
  * @job: job to schedule
  * @f: fence created during this submission
  *
@@ -121,90 +119,70 @@ void amdgpu_ib_free(struct amdgpu_ib *ib, struct 
dma_fence *f)
  * a CONST_IB), it will be put on the ring prior to the DE IB.  Prior
  * to SI there was just a DE IB.
  */
-int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned int num_ibs,
-                      struct amdgpu_ib *ibs, struct amdgpu_job *job,
+int amdgpu_ib_schedule(struct amdgpu_ring *ring, struct amdgpu_job *job,
                       struct dma_fence **f)
 {
        struct amdgpu_device *adev = ring->adev;
-       struct amdgpu_ib *ib = &ibs[0];
+       struct amdgpu_ib *ib;
        struct dma_fence *tmp = NULL;
        struct amdgpu_fence *af;
        struct amdgpu_fence *vm_af;
        bool need_ctx_switch;
-       struct amdgpu_vm *vm;
        uint64_t fence_ctx;
        uint32_t status = 0, alloc_size;
        unsigned int fence_flags = 0;
-       bool secure, init_shadow;
-       u64 shadow_va, csa_va, gds_va;
+       bool secure;
        int vmid = AMDGPU_JOB_GET_VMID(job);
        bool need_pipe_sync = false;
        unsigned int cond_exec;
        unsigned int i;
        int r = 0;
 
-       if (num_ibs == 0)
+       if (!job)
+               return -EINVAL;
+       if (job->num_ibs == 0)
                return -EINVAL;
 
-       /* ring tests don't use a job */
-       if (job) {
-               vm = job->vm;
-               fence_ctx = job->base.s_fence ?
-                       job->base.s_fence->finished.context : 0;
-               shadow_va = job->shadow_va;
-               csa_va = job->csa_va;
-               gds_va = job->gds_va;
-               init_shadow = job->init_shadow;
-               af = job->hw_fence;
-               /* Save the context of the job for reset handling.
-                * The driver needs this so it can skip the ring
-                * contents for guilty contexts.
-                */
-               af->context = fence_ctx;
-               /* the vm fence is also part of the job's context */
-               job->hw_vm_fence->context = fence_ctx;
-       } else {
-               vm = NULL;
-               fence_ctx = 0;
-               shadow_va = 0;
-               csa_va = 0;
-               gds_va = 0;
-               init_shadow = false;
-               af = kzalloc(sizeof(*af), GFP_ATOMIC);
-               if (!af)
-                       return -ENOMEM;
-       }
+       ib = &job->ibs[0];
+       fence_ctx = job->base.s_fence ?
+               job->base.s_fence->finished.context : 0;
+       af = job->hw_fence;
+       vm_af = job->hw_vm_fence;
+       /* Save the context of the job for reset handling.
+        * The driver needs this so it can skip the ring
+        * contents for guilty contexts.
+        */
+       af->context = fence_ctx;
+       /* the vm fence is also part of the job's context */
+       vm_af->context = fence_ctx;
 
        if (!ring->sched.ready) {
                dev_err(adev->dev, "couldn't schedule ib on ring <%s>\n", 
ring->name);
-               r = -EINVAL;
-               goto free_fence;
+               return -EINVAL;
        }
 
-       if (vm && !job->vmid) {
+       if (job->vm && !job->vmid) {
                dev_err(adev->dev, "VM IB without ID\n");
-               r = -EINVAL;
-               goto free_fence;
+               return -EINVAL;
        }
 
        if ((ib->flags & AMDGPU_IB_FLAGS_SECURE) &&
            (!ring->funcs->secure_submission_supported)) {
                dev_err(adev->dev, "secure submissions not supported on ring 
<%s>\n", ring->name);
-               r = -EINVAL;
-               goto free_fence;
+               return -EINVAL;
        }
 
-       alloc_size = ring->funcs->emit_frame_size + num_ibs *
+       alloc_size = ring->funcs->emit_frame_size + job->num_ibs *
                ring->funcs->emit_ib_size;
 
        r = amdgpu_ring_alloc(ring, alloc_size);
        if (r) {
                dev_err(adev->dev, "scheduling IB failed (%d).\n", r);
-               goto free_fence;
+               return r;
        }
 
        need_ctx_switch = ring->current_ctx != fence_ctx;
-       if (ring->funcs->emit_pipeline_sync && job &&
+       if (ring->funcs->emit_pipeline_sync &&
            ((tmp = amdgpu_sync_get_fence(&job->explicit_sync)) ||
             need_ctx_switch || amdgpu_vm_need_pipeline_sync(ring, job))) {
 
@@ -216,14 +194,11 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
                dma_fence_put(tmp);
        }
 
-       if (job) {
-               vm_af = job->hw_vm_fence;
-               /* VM sequence */
-               vm_af->ib_wptr = ring->wptr;
-               amdgpu_vm_flush(ring, job, need_pipe_sync);
-               vm_af->ib_dw_size =
-                       amdgpu_ring_get_dw_distance(ring, vm_af->ib_wptr, 
ring->wptr);
-       }
+       /* VM sequence */
+       vm_af->ib_wptr = ring->wptr;
+       amdgpu_vm_flush(ring, job, need_pipe_sync);
+       vm_af->ib_dw_size =
+               amdgpu_ring_get_dw_distance(ring, vm_af->ib_wptr, ring->wptr);
 
        /* IB sequence */
        af->ib_wptr = ring->wptr;
@@ -240,8 +215,8 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
                ring->funcs->emit_wave_limit(ring, true);
 
        if (ring->funcs->emit_gfx_shadow && adev->gfx.cp_gfx_shadow)
-               amdgpu_ring_emit_gfx_shadow(ring, shadow_va, csa_va, gds_va,
-                                           init_shadow, vmid);
+               amdgpu_ring_emit_gfx_shadow(ring, job->shadow_va, job->csa_va, 
job->gds_va,
+                                           job->init_shadow, vmid);
 
        if (ring->funcs->init_cond_exec)
                cond_exec = amdgpu_ring_init_cond_exec(ring,
@@ -255,7 +230,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
        if (need_ctx_switch)
                status |= AMDGPU_HAVE_CTX_SWITCH;
 
-       if (job && ring->funcs->emit_cntxcntl) {
+       if (ring->funcs->emit_cntxcntl) {
                status |= job->preamble_status;
                status |= job->preemption_status;
                amdgpu_ring_emit_cntxcntl(ring, status);
@@ -264,15 +239,15 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
        /* Setup initial TMZiness and send it off.
         */
        secure = false;
-       if (job && ring->funcs->emit_frame_cntl) {
+       if (ring->funcs->emit_frame_cntl) {
                secure = ib->flags & AMDGPU_IB_FLAGS_SECURE;
                amdgpu_ring_emit_frame_cntl(ring, true, secure);
        }
 
-       for (i = 0; i < num_ibs; ++i) {
-               ib = &ibs[i];
+       for (i = 0; i < job->num_ibs; ++i) {
+               ib = &job->ibs[i];
 
-               if (job && ring->funcs->emit_frame_cntl) {
+               if (ring->funcs->emit_frame_cntl) {
                        if (secure != !!(ib->flags & AMDGPU_IB_FLAGS_SECURE)) {
                                amdgpu_ring_emit_frame_cntl(ring, false, 
secure);
                                secure = !secure;
@@ -284,7 +259,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
                status &= ~AMDGPU_HAVE_CTX_SWITCH;
        }
 
-       if (job && ring->funcs->emit_frame_cntl)
+       if (ring->funcs->emit_frame_cntl)
                amdgpu_ring_emit_frame_cntl(ring, false, secure);
 
        amdgpu_device_invalidate_hdp(adev, ring);
@@ -296,7 +271,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
                fence_flags |= AMDGPU_FENCE_FLAG_TC_WB_ONLY;
 
        /* wrap the last IB with fence */
-       if (job && job->uf_addr) {
+       if (job->uf_addr) {
                amdgpu_ring_emit_fence(ring, job->uf_addr, job->uf_sequence,
                                       fence_flags | AMDGPU_FENCE_FLAG_64BIT);
        }
@@ -310,8 +285,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
        amdgpu_fence_emit(ring, af, fence_flags);
        *f = &af->base;
        /* get a ref for the job */
-       if (job)
-               dma_fence_get(*f);
+       dma_fence_get(*f);
 
        if (ring->funcs->insert_end)
                ring->funcs->insert_end(ring);
@@ -319,7 +293,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
        amdgpu_ring_patch_cond_exec(ring, cond_exec);
 
        ring->current_ctx = fence_ctx;
-       if (job && ring->funcs->emit_switch_buffer)
+       if (ring->funcs->emit_switch_buffer)
                amdgpu_ring_emit_switch_buffer(ring);
 
        if (ring->funcs->emit_wave_limit &&
@@ -333,11 +307,6 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned 
int num_ibs,
        amdgpu_ring_commit(ring);
 
        return 0;
-
-free_fence:
-       if (!job)
-               kfree(af);
-       return r;
 }
 
 /**
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
index 95aa87b4406eb..cd0707737a29b 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
@@ -377,7 +377,7 @@ int amdgpu_job_submit_direct(struct amdgpu_job *job, struct 
amdgpu_ring *ring,
        int r;
 
        job->base.sched = &ring->sched;
-       r = amdgpu_ib_schedule(ring, job->num_ibs, job->ibs, job, fence);
+       r = amdgpu_ib_schedule(ring, job, fence);
 
        if (r)
                return r;
@@ -447,8 +447,7 @@ static struct dma_fence *amdgpu_job_run(struct 
drm_sched_job *sched_job)
                dev_dbg(adev->dev, "Skip scheduling IBs in ring(%s)",
                        ring->name);
        } else {
-               r = amdgpu_ib_schedule(ring, job->num_ibs, job->ibs, job,
-                                      &fence);
+               r = amdgpu_ib_schedule(ring, job, &fence);
                if (r)
                        dev_err(adev->dev,
                                "Error scheduling IBs (%d) in ring(%s)", r,
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h 
b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
index ce5af137ee400..fafb876d73da1 100644
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
@@ -575,8 +575,7 @@ int amdgpu_ib_get(struct amdgpu_device *adev, struct 
amdgpu_vm *vm,
                  enum amdgpu_ib_pool_type pool,
                  struct amdgpu_ib *ib);
 void amdgpu_ib_free(struct amdgpu_ib *ib, struct dma_fence *f);
-int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
-                      struct amdgpu_ib *ibs, struct amdgpu_job *job,
+int amdgpu_ib_schedule(struct amdgpu_ring *ring, struct amdgpu_job *job,
                       struct dma_fence **f);
 int amdgpu_ib_pool_init(struct amdgpu_device *adev);
 void amdgpu_ib_pool_fini(struct amdgpu_device *adev);
-- 
2.53.0

[PATCH 4/8] drm/amdgpu: require a job to schedule an IB

Reply via email to