[I] Fix `Number of sorting keys must be greater than zero` [incubator-gluten]

via GitHub Mon, 02 Sep 2024 20:27:06 -0700


dcoliversun opened a new issue, #7090:
URL: https://github.com/apache/incubator-gluten/issues/7090


   ### Backend
   
   VL (Velox)
   
   ### Bug description
   
   A query with row_number() window function using same partitioning and 
sorting keys and a limit on row number values used to fail.
   
   More info: https://github.com/apache/incubator-gluten/pull/7089
   
   ### Spark version
   
   None
   
   ### Spark configurations
   
   _No response_
   
   ### System information
   
   _No response_
   
   ### Relevant logs
   
   ```bash
   org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in 
stage 47.0 failed 1 times, most recent failure: Lost task 0.0 in stage 47.0 
(TID 34) (c0d827938b80 executor driver): 
org.apache.gluten.exception.GlutenException: Exception: VeloxUserError
   Error Source: USER
   Error Code: INVALID_ARGUMENT
   Reason: (0 vs. 0) Number of sorting keys must be greater than zero
   Retriable: False
   Expression: sortingKeys_.size() > 0
   Function: TopNRowNumberNode
   File: 
/__w/incubator-gluten/incubator-gluten/ep/build-velox/build/velox_ep/velox/core/PlanNode.cpp
   Line: 1741
   Stack trace:
   # 0  _ZN8facebook5velox7process10StackTraceC1Ei
   # 1  
_ZN8facebook5velox14VeloxExceptionC1EPKcmS3_St17basic_string_viewIcSt11char_traitsIcEES7_S7_S7_bNS1_4TypeES7_
   # 2  
_ZN8facebook5velox6detail14veloxCheckFailINS0_14VeloxUserErrorERKSsEEvRKNS1_18VeloxCheckFailArgsET0_
   # 3  
_ZN8facebook5velox4core17TopNRowNumberNodeC2ESsSt6vectorISt10shared_ptrIKNS1_20FieldAccessTypedExprEESaIS7_EES9_S3_INS1_9SortOrderESaISA_EERKSt8optionalISsEiS4_IKNS1_8PlanNodeEE
   # 4  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait19WindowGroupLimitRelE
   # 5  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait3RelE
   # 6  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait10ProjectRelE
   # 7  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait3RelE
   # 8  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait7RelRootE
   # 9  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait4PlanE
   # 10 
_ZN6gluten18VeloxPlanConverter11toVeloxPlanERKN9substrait4PlanESt6vectorINS1_18ReadRel_LocalFilesESaIS6_EE
   # 11 
_ZN6gluten12VeloxRuntime20createResultIteratorERKSsRKSt6vectorISt10shared_ptrINS_14ResultIteratorEESaIS6_EERKSt13unordered_mapISsSsSt4hashISsESt8equal_toISsESaISt4pairIS1_SsEEE
   # 12 
Java_org_apache_gluten_vectorized_PlanEvaluatorJniWrapper_nativeCreateKernelWithIterator
   # 13 0x00007f2471017de7
   
   at 
org.apache.gluten.vectorized.PlanEvaluatorJniWrapper.nativeCreateKernelWithIterator(Native
 Method)
   at 
org.apache.gluten.vectorized.NativePlanEvaluator.createKernelWithBatchIterator(NativePlanEvaluator.java:70)
   at 
org.apache.gluten.backendsapi.velox.VeloxIteratorApi.genFirstStageIterator(VeloxIteratorApi.scala:199)
   at 
org.apache.gluten.execution.GlutenWholeStageColumnarRDD.$anonfun$compute$1(GlutenWholeStageColumnarRDD.scala:88)
   at org.apache.gluten.utils.Arm$.withResource(Arm.scala:25)
   at 
org.apache.gluten.metrics.GlutenTimeMetric$.millis(GlutenTimeMetric.scala:37)
   at 
org.apache.gluten.execution.GlutenWholeStageColumnarRDD.compute(GlutenWholeStageColumnarRDD.scala:77)
   at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
   at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
   at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
   at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
   at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
   at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
   at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
   at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
   at 
org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
   at 
org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:104)
   at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:54)
   at org.apache.spark.TaskContext.runTaskWithListeners(TaskContext.scala:166)
   at org.apache.spark.scheduler.Task.run(Task.scala:141)
   at 
org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$4(Executor.scala:620)
   at 
org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally(SparkErrorUtils.scala:64)
   at 
org.apache.spark.util.SparkErrorUtils.tryWithSafeFinally$(SparkErrorUtils.scala:61)
   at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:94)
   at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:623)
   at 
java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
   at 
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
   at java.lang.Thread.run(Thread.java:750)
     
   Driver stacktrace:
    at 
org.apache.spark.scheduler.DAGScheduler.failJobAndIndependentStages(DAGScheduler.scala:2856)
    at 
org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2(DAGScheduler.scala:2792)
    at 
org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2$adapted(DAGScheduler.scala:2791)
    at scala.collection.immutable.List.foreach(List.scala:333)
    at 
org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:2791)
    at 
org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1(DAGScheduler.scala:1247)
    at 
org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1$adapted(DAGScheduler.scala:1247)
    at scala.Option.foreach(Option.scala:437)
    at 
org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:1247)
    at 
org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:3060)
    ...
    Cause: org.apache.gluten.exception.GlutenException: Exception: 
VeloxUserError
    Error Source: USER
    Error Code: INVALID_ARGUMENT
    Reason: (0 vs. 0) Number of sorting keys must be greater than zero
    Retriable: False
    Expression: sortingKeys_.size() > 0
    Function: TopNRowNumberNode
    File: 
/__w/incubator-gluten/incubator-gluten/ep/build-velox/build/velox_ep/velox/core/PlanNode.cpp
    Line: 1741
    Stack trace:
     # 0  _ZN8facebook5velox7process10StackTraceC1Ei
     # 1  
_ZN8facebook5velox14VeloxExceptionC1EPKcmS3_St17basic_string_viewIcSt11char_traitsIcEES7_S7_S7_bNS1_4TypeES7_
     # 2  
_ZN8facebook5velox6detail14veloxCheckFailINS0_14VeloxUserErrorERKSsEEvRKNS1_18VeloxCheckFailArgsET0_
     # 3  
_ZN8facebook5velox4core17TopNRowNumberNodeC2ESsSt6vectorISt10shared_ptrIKNS1_20FieldAccessTypedExprEESaIS7_EES9_S3_INS1_9SortOrderESaISA_EERKSt8optionalISsEiS4_IKNS1_8PlanNodeEE
     # 4  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait19WindowGroupLimitRelE
     # 5  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait3RelE
     # 6  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait10ProjectRelE
     # 7  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait3RelE
     # 8  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait7RelRootE
     # 9  
_ZN6gluten29SubstraitToVeloxPlanConverter11toVeloxPlanERKN9substrait4PlanE
     # 10 
_ZN6gluten18VeloxPlanConverter11toVeloxPlanERKN9substrait4PlanESt6vectorINS1_18ReadRel_LocalFilesESaIS6_EE
     # 11 
_ZN6gluten12VeloxRuntime20createResultIteratorERKSsRKSt6vectorISt10shared_ptrINS_14ResultIteratorEESaIS6_EERKSt13unordered_mapISsSsSt4hashISsESt8equal_toISsESaISt4pairIS1_SsEEE
     # 12 
Java_org_apache_gluten_vectorized_PlanEvaluatorJniWrapper_nativeCreateKernelWithIterator
     # 13 0x00007f2471017de7
      at 
org.apache.gluten.vectorized.PlanEvaluatorJniWrapper.nativeCreateKernelWithIterator(Native
 Method)
      at 
org.apache.gluten.vectorized.NativePlanEvaluator.createKernelWithBatchIterator(NativePlanEvaluator.java:70)
      at 
org.apache.gluten.backendsapi.velox.VeloxIteratorApi.genFirstStageIterator(VeloxIteratorApi.scala:199)
      at 
org.apache.gluten.execution.GlutenWholeStageColumnarRDD.$anonfun$compute$1(GlutenWholeStageColumnarRDD.scala:88)
      at org.apache.gluten.utils.Arm$.withResource(Arm.scala:25)
      at 
org.apache.gluten.metrics.GlutenTimeMetric$.millis(GlutenTimeMetric.scala:37)
      at 
org.apache.gluten.execution.GlutenWholeStageColumnarRDD.compute(GlutenWholeStageColumnarRDD.scala:77)
      at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:367)
      at org.apache.spark.rdd.RDD.iterator(RDD.scala:331)
      at 
org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
      ...
   ```
   


-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: [email protected]

For queries about this service, please contact Infrastructure at:
[email protected]


---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

[I] Fix `Number of sorting keys must be greater than zero` [incubator-gluten]

Reply via email to