(incubator-gluten) branch main updated: [GLUTEN-7600][VL] Remove EmptySchemaWorkaround (#7620)

hongze Tue, 22 Oct 2024 01:16:38 -0700

This is an automated email from the ASF dual-hosted git repository.

hongze pushed a commit to branch main
in repository https://gitbox.apache.org/repos/asf/incubator-gluten.git



The following commit(s) were added to refs/heads/main by this push:
     new 53e8161e1e [GLUTEN-7600][VL] Remove EmptySchemaWorkaround (#7620)
53e8161e1e is described below

commit 53e8161e1e866031cb9e8d0980d4601037e4b9bf
Author: Hongze Zhang <[email protected]>
AuthorDate: Tue Oct 22 16:16:27 2024 +0800

    [GLUTEN-7600][VL] Remove EmptySchemaWorkaround (#7620)
---
 .../clickhouse/CHSparkPlanExecApi.scala            |   4 +-
 .../gluten/columnarbatch/VeloxColumnarBatches.java |  24 +++-
 .../gluten/backendsapi/velox/VeloxBackend.scala    |   7 +-
 .../gluten/backendsapi/velox/VeloxRuleApi.scala    |   5 -
 .../backendsapi/velox/VeloxValidatorApi.scala      |   4 +
 .../gluten/execution/VeloxColumnarToRowExec.scala  |   2 +-
 .../gluten/extension/EmptySchemaWorkaround.scala   | 131 ---------------------
 .../spark/shuffle/ColumnarShuffleWriter.scala      |  32 +++--
 .../velox/VeloxFormatWriterInjects.scala           |  11 +-
 .../gluten/columnarbatch/ColumnarBatchTest.java    |  44 ++++++-
 .../gluten/execution/MiscOperatorSuite.scala       |   2 +-
 .../execution/ScalarFunctionsValidateSuite.scala   |  21 +++-
 cpp/velox/compute/VeloxRuntime.cc                  |   4 +-
 cpp/velox/compute/VeloxRuntime.h                   |   2 +-
 .../substrait/SubstraitToVeloxPlanValidator.cc     |   6 +
 .../gluten/columnarbatch/ColumnarBatches.java      |  52 ++++++--
 .../gluten/vectorized/ColumnarBatchInIterator.java |   7 --
 .../BasicPhysicalOperatorTransformer.scala         |   8 --
 .../gluten/expression/ExpressionMappings.scala     |   1 -
 .../extension/columnar/MiscColumnarRules.scala     |   1 -
 .../extension/columnar/OffloadSingleNode.scala     |  53 +--------
 .../columnar/rewrite/PullOutPostProject.scala      |  12 +-
 .../gluten/utils/velox/VeloxTestSettings.scala     |   6 +-
 .../gluten/utils/velox/VeloxTestSettings.scala     |   6 +-
 .../gluten/utils/velox/VeloxTestSettings.scala     |   8 +-
 .../gluten/utils/velox/VeloxTestSettings.scala     |   6 +-
 26 files changed, 206 insertions(+), 253 deletions(-)

diff --git 
a/backends-clickhouse/src/main/scala/org/apache/gluten/backendsapi/clickhouse/CHSparkPlanExecApi.scala
 
b/backends-clickhouse/src/main/scala/org/apache/gluten/backendsapi/clickhouse/CHSparkPlanExecApi.scala
index 903523791a..ba165d936e 100644
--- 
a/backends-clickhouse/src/main/scala/org/apache/gluten/backendsapi/clickhouse/CHSparkPlanExecApi.scala
+++ 
b/backends-clickhouse/src/main/scala/org/apache/gluten/backendsapi/clickhouse/CHSparkPlanExecApi.scala
@@ -21,6 +21,7 @@ import org.apache.gluten.backendsapi.{BackendsApiManager, 
SparkPlanExecApi}
 import org.apache.gluten.exception.{GlutenException, GlutenNotSupportException}
 import org.apache.gluten.execution._
 import org.apache.gluten.expression._
+import org.apache.gluten.expression.ExpressionNames.MONOTONICALLY_INCREASING_ID
 import org.apache.gluten.extension.ExpressionExtensionTrait
 import org.apache.gluten.extension.columnar.AddFallbackTagRule
 import 
org.apache.gluten.extension.columnar.MiscColumnarRules.TransformPreOverrides
@@ -579,7 +580,8 @@ class CHSparkPlanExecApi extends SparkPlanExecApi with 
Logging {
   override def extraExpressionMappings: Seq[Sig] = {
     List(
       Sig[CollectList](ExpressionNames.COLLECT_LIST),
-      Sig[CollectSet](ExpressionNames.COLLECT_SET)
+      Sig[CollectSet](ExpressionNames.COLLECT_SET),
+      Sig[MonotonicallyIncreasingID](MONOTONICALLY_INCREASING_ID)
     ) ++
       
ExpressionExtensionTrait.expressionExtensionTransformer.expressionSigList ++
       SparkShimLoader.getSparkShims.bloomFilterExpressionMappings()
diff --git 
a/backends-velox/src/main/java/org/apache/gluten/columnarbatch/VeloxColumnarBatches.java
 
b/backends-velox/src/main/java/org/apache/gluten/columnarbatch/VeloxColumnarBatches.java
index 36d5a360d0..e2035455fd 100644
--- 
a/backends-velox/src/main/java/org/apache/gluten/columnarbatch/VeloxColumnarBatches.java
+++ 
b/backends-velox/src/main/java/org/apache/gluten/columnarbatch/VeloxColumnarBatches.java
@@ -29,24 +29,36 @@ import java.util.Objects;
 public final class VeloxColumnarBatches {
   public static final String COMPREHENSIVE_TYPE_VELOX = "velox";
 
-  public static void checkVeloxBatch(ColumnarBatch batch) {
+  private static boolean isVeloxBatch(ColumnarBatch batch) {
     final String comprehensiveType = 
ColumnarBatches.getComprehensiveLightBatchType(batch);
+    return Objects.equals(comprehensiveType, COMPREHENSIVE_TYPE_VELOX);
+  }
+
+  public static void checkVeloxBatch(ColumnarBatch batch) {
+    if (ColumnarBatches.isZeroColumnBatch(batch)) {
+      return;
+    }
     Preconditions.checkArgument(
-        Objects.equals(comprehensiveType, COMPREHENSIVE_TYPE_VELOX),
+        isVeloxBatch(batch),
         String.format(
             "Expected comprehensive batch type %s, but got %s",
-            COMPREHENSIVE_TYPE_VELOX, comprehensiveType));
+            COMPREHENSIVE_TYPE_VELOX, 
ColumnarBatches.getComprehensiveLightBatchType(batch)));
   }
 
   public static void checkNonVeloxBatch(ColumnarBatch batch) {
-    final String comprehensiveType = 
ColumnarBatches.getComprehensiveLightBatchType(batch);
+    if (ColumnarBatches.isZeroColumnBatch(batch)) {
+      return;
+    }
     Preconditions.checkArgument(
-        !Objects.equals(comprehensiveType, COMPREHENSIVE_TYPE_VELOX),
+        !isVeloxBatch(batch),
         String.format("Comprehensive batch type is already %s", 
COMPREHENSIVE_TYPE_VELOX));
   }
 
   public static ColumnarBatch toVeloxBatch(ColumnarBatch input) {
-    checkNonVeloxBatch(input);
+    if (ColumnarBatches.isZeroColumnBatch(input)) {
+      return input;
+    }
+    Preconditions.checkArgument(!isVeloxBatch(input));
     final Runtime runtime = 
Runtimes.contextInstance("VeloxColumnarBatches#toVeloxBatch");
     final long handle = ColumnarBatches.getNativeHandle(input);
     final long outHandle = 
VeloxColumnarBatchJniWrapper.create(runtime).from(handle);
diff --git 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxBackend.scala
 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxBackend.scala
index 939fc7f04f..b9d9abf88e 100644
--- 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxBackend.scala
+++ 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxBackend.scala
@@ -319,7 +319,12 @@ object VeloxBackendSettings extends BackendSettingsApi {
       windowFunctions.foreach(
         func => {
           val windowExpression = func match {
-            case alias: Alias => 
WindowFunctionsBuilder.extractWindowExpression(alias.child)
+            case alias: Alias =>
+              val we = 
WindowFunctionsBuilder.extractWindowExpression(alias.child)
+              if (we == null) {
+                throw new GlutenNotSupportException(s"$func is not supported.")
+              }
+              we
             case _ => throw new GlutenNotSupportException(s"$func is not 
supported.")
           }
 
diff --git 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxRuleApi.scala
 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxRuleApi.scala
index 84257ed3f7..7cddba157d 100644
--- 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxRuleApi.scala
+++ 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxRuleApi.scala
@@ -19,7 +19,6 @@ package org.apache.gluten.backendsapi.velox
 import org.apache.gluten.backendsapi.RuleApi
 import org.apache.gluten.datasource.ArrowConvertorRule
 import org.apache.gluten.extension._
-import 
org.apache.gluten.extension.EmptySchemaWorkaround.{FallbackEmptySchemaRelation, 
PlanOneRowRelation}
 import org.apache.gluten.extension.columnar._
 import 
org.apache.gluten.extension.columnar.MiscColumnarRules.{RemoveGlutenTableCacheColumnarToRow,
 RemoveTopmostColumnarToRow, RewriteSubqueryBroadcast, TransformPreOverrides}
 import org.apache.gluten.extension.columnar.enumerated.EnumeratedTransform
@@ -58,11 +57,9 @@ private object VeloxRuleApi {
     injector.injectTransform(_ => PushDownInputFileExpression.PreOffload)
     injector.injectTransform(c => FallbackOnANSIMode.apply(c.session))
     injector.injectTransform(c => FallbackMultiCodegens.apply(c.session))
-    injector.injectTransform(c => PlanOneRowRelation.apply(c.session))
     injector.injectTransform(_ => RewriteSubqueryBroadcast())
     injector.injectTransform(c => 
BloomFilterMightContainJointRewriteRule.apply(c.session))
     injector.injectTransform(c => ArrowScanReplaceRule.apply(c.session))
-    injector.injectTransform(_ => FallbackEmptySchemaRelation())
     injector.injectTransform(_ => RewriteSparkPlanRulesManager())
     injector.injectTransform(_ => AddFallbackTagRule())
     injector.injectTransform(_ => TransformPreOverrides())
@@ -99,8 +96,6 @@ private object VeloxRuleApi {
     injector.inject(_ => RemoveTransitions)
     injector.inject(_ => PushDownInputFileExpression.PreOffload)
     injector.inject(c => FallbackOnANSIMode.apply(c.session))
-    injector.inject(c => PlanOneRowRelation.apply(c.session))
-    injector.inject(_ => FallbackEmptySchemaRelation())
     injector.inject(_ => RewriteSubqueryBroadcast())
     injector.inject(c => 
BloomFilterMightContainJointRewriteRule.apply(c.session))
     injector.inject(c => ArrowScanReplaceRule.apply(c.session))
diff --git 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxValidatorApi.scala
 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxValidatorApi.scala
index c3d3e55671..7d681d5c6a 100644
--- 
a/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxValidatorApi.scala
+++ 
b/backends-velox/src/main/scala/org/apache/gluten/backendsapi/velox/VeloxValidatorApi.scala
@@ -91,6 +91,10 @@ class VeloxValidatorApi extends ValidatorApi {
   override def doColumnarShuffleExchangeExecValidate(
       outputPartitioning: Partitioning,
       child: SparkPlan): Option[String] = {
+    if (child.output.isEmpty) {
+      // See: https://github.com/apache/incubator-gluten/issues/7600.
+      return Some("Shuffle with empty schema is not supported")
+    }
     doSchemaValidate(child.schema)
   }
 }
diff --git 
a/backends-velox/src/main/scala/org/apache/gluten/execution/VeloxColumnarToRowExec.scala
 
b/backends-velox/src/main/scala/org/apache/gluten/execution/VeloxColumnarToRowExec.scala
index 0df66da833..8aedeb87cb 100644
--- 
a/backends-velox/src/main/scala/org/apache/gluten/execution/VeloxColumnarToRowExec.scala
+++ 
b/backends-velox/src/main/scala/org/apache/gluten/execution/VeloxColumnarToRowExec.scala
@@ -123,7 +123,7 @@ object VeloxColumnarToRowExec {
     }
 
     val runtime = Runtimes.contextInstance("ColumnarToRow")
-    // TODO:: pass the jni jniWrapper and arrowSchema  and serializeSchema 
method by broadcast
+    // TODO: Pass the jni jniWrapper and arrowSchema and serializeSchema 
method by broadcast.
     val jniWrapper = NativeColumnarToRowJniWrapper.create(runtime)
     val c2rId = jniWrapper.nativeColumnarToRowInit()
 
diff --git 
a/backends-velox/src/main/scala/org/apache/gluten/extension/EmptySchemaWorkaround.scala
 
b/backends-velox/src/main/scala/org/apache/gluten/extension/EmptySchemaWorkaround.scala
deleted file mode 100644
index f7d74e378f..0000000000
--- 
a/backends-velox/src/main/scala/org/apache/gluten/extension/EmptySchemaWorkaround.scala
+++ /dev/null
@@ -1,131 +0,0 @@
-/*
- * Licensed to the Apache Software Foundation (ASF) under one or more
- * contributor license agreements.  See the NOTICE file distributed with
- * this work for additional information regarding copyright ownership.
- * The ASF licenses this file to You under the Apache License, Version 2.0
- * (the "License"); you may not use this file except in compliance with
- * the License.  You may obtain a copy of the License at
- *
- *    http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-package org.apache.gluten.extension
-
-import org.apache.gluten.GlutenConfig
-import org.apache.gluten.extension.columnar.FallbackTags
-
-import org.apache.spark.sql.SparkSession
-import org.apache.spark.sql.catalyst.InternalRow
-import org.apache.spark.sql.catalyst.expressions.{Alias, AttributeReference, 
EulerNumber, Expression, Literal, MakeYMInterval, Pi, Rand, SparkPartitionID, 
SparkVersion, Uuid}
-import org.apache.spark.sql.catalyst.expressions.aggregate.{Count, Sum}
-import org.apache.spark.sql.catalyst.rules.Rule
-import org.apache.spark.sql.execution.{ProjectExec, RDDScanExec, SparkPlan, 
UnaryExecNode}
-import org.apache.spark.sql.execution.aggregate.HashAggregateExec
-import org.apache.spark.sql.execution.datasources.WriteFilesExec
-import org.apache.spark.sql.types.StringType
-
-/** Rules to make Velox backend work correctly with query plans that have 
empty output schemas. */
-object EmptySchemaWorkaround {
-
-  /**
-   * This rule plans [[RDDScanExec]] with a fake schema to make gluten work, 
because gluten does not
-   * support empty output relation, see [[FallbackEmptySchemaRelation]].
-   */
-  case class PlanOneRowRelation(spark: SparkSession) extends Rule[SparkPlan] {
-    override def apply(plan: SparkPlan): SparkPlan = {
-      if (!GlutenConfig.getConf.enableOneRowRelationColumnar) {
-        return plan
-      }
-
-      plan.transform {
-        // We should make sure the output does not change, e.g.
-        // Window
-        //   OneRowRelation
-        case u: UnaryExecNode
-            if u.child.isInstanceOf[RDDScanExec] &&
-              u.child.asInstanceOf[RDDScanExec].name == "OneRowRelation" &&
-              u.outputSet != u.child.outputSet =>
-          val rdd = spark.sparkContext.parallelize(InternalRow(null) :: Nil, 1)
-          val attr = AttributeReference("fake_column", StringType)()
-          u.withNewChildren(RDDScanExec(attr :: Nil, rdd, "OneRowRelation") :: 
Nil)
-      }
-    }
-  }
-
-  /**
-   * FIXME To be removed: Since Velox backend is the only one to use the 
strategy, and we already
-   * support offloading zero-column batch in ColumnarBatchInIterator via PR 
#3309.
-   *
-   * We'd make sure all Velox operators be able to handle zero-column input 
correctly then remove
-   * the rule together with [[PlanOneRowRelation]].
-   */
-  case class FallbackEmptySchemaRelation() extends Rule[SparkPlan] {
-    override def apply(plan: SparkPlan): SparkPlan = plan.transformDown {
-      case p =>
-        if (fallbackOnEmptySchema(p)) {
-          if (p.children.exists(_.output.isEmpty)) {
-            // Some backends are not capable to offload plan with zero-column 
input.
-            // If any child has empty output, mark the plan and that child as 
UNSUPPORTED.
-            FallbackTags.add(p, "at least one of its children has empty 
output")
-            p.children.foreach {
-              child =>
-                if (child.output.isEmpty && 
!child.isInstanceOf[WriteFilesExec]) {
-                  FallbackTags.add(child, "at least one of its children has 
empty output")
-                }
-            }
-          }
-        }
-        p
-    }
-
-    private def fallbackOnEmptySchema(plan: SparkPlan): Boolean = {
-      // Count(1) and Sum(1) are special cases that Velox backend can handle.
-      // Do not fallback it and its children in the first place.
-      !mayNeedOffload(plan)
-    }
-
-    /**
-     * Check whether a plan needs to be offloaded even though they have empty 
input schema, e.g,
-     * Sum(1), Count(1), rand(), etc.
-     * @param plan:
-     *   The Spark plan to check.
-     *
-     * Since https://github.com/apache/incubator-gluten/pull/2749.
-     */
-    private def mayNeedOffload(plan: SparkPlan): Boolean = {
-      def checkExpr(expr: Expression): Boolean = {
-        expr match {
-          // Block directly falling back the below functions by 
FallbackEmptySchemaRelation.
-          case alias: Alias => checkExpr(alias.child)
-          case _: Rand | _: Uuid | _: MakeYMInterval | _: SparkPartitionID | 
_: EulerNumber |
-              _: Pi | _: SparkVersion =>
-            true
-          case _ => false
-        }
-      }
-
-      plan match {
-        case exec: HashAggregateExec if exec.aggregateExpressions.nonEmpty =>
-          // Check Sum(Literal) or Count(Literal).
-          exec.aggregateExpressions.forall(
-            expression => {
-              val aggFunction = expression.aggregateFunction
-              aggFunction match {
-                case Sum(Literal(_, _), _) => true
-                case Count(Seq(Literal(_, _))) => true
-                case _ => false
-              }
-            })
-        case p: ProjectExec if p.projectList.nonEmpty =>
-          p.projectList.forall(checkExpr(_))
-        case _ =>
-          false
-      }
-    }
-  }
-}
diff --git 
a/backends-velox/src/main/scala/org/apache/spark/shuffle/ColumnarShuffleWriter.scala
 
b/backends-velox/src/main/scala/org/apache/spark/shuffle/ColumnarShuffleWriter.scala
index 6a6d1c57a3..eaf9d99a9e 100644
--- 
a/backends-velox/src/main/scala/org/apache/spark/shuffle/ColumnarShuffleWriter.scala
+++ 
b/backends-velox/src/main/scala/org/apache/spark/shuffle/ColumnarShuffleWriter.scala
@@ -123,14 +123,7 @@ class ColumnarShuffleWriter[K, V](
   @throws[IOException]
   def internalWrite(records: Iterator[Product2[K, V]]): Unit = {
     if (!records.hasNext) {
-      partitionLengths = new Array[Long](dep.partitioner.numPartitions)
-      shuffleBlockResolver.writeMetadataFileAndCommit(
-        dep.shuffleId,
-        mapId,
-        partitionLengths,
-        Array[Long](),
-        null)
-      mapStatus = MapStatus(blockManager.shuffleServerId, partitionLengths, 
mapId)
+      handleEmptyInput()
       return
     }
 
@@ -194,6 +187,11 @@ class ColumnarShuffleWriter[K, V](
       cb.close()
     }
 
+    if (nativeShuffleWriter == -1L) {
+      handleEmptyInput()
+      return
+    }
+
     val startTime = System.nanoTime()
     assert(nativeShuffleWriter != -1L)
     splitResult = jniWrapper.stop(nativeShuffleWriter)
@@ -241,16 +239,28 @@ class ColumnarShuffleWriter[K, V](
     mapStatus = MapStatus(blockManager.shuffleServerId, partitionLengths, 
mapId)
   }
 
+  private def handleEmptyInput(): Unit = {
+    partitionLengths = new Array[Long](dep.partitioner.numPartitions)
+    shuffleBlockResolver.writeMetadataFileAndCommit(
+      dep.shuffleId,
+      mapId,
+      partitionLengths,
+      Array[Long](),
+      null)
+    mapStatus = MapStatus(blockManager.shuffleServerId, partitionLengths, 
mapId)
+  }
+
   @throws[IOException]
   override def write(records: Iterator[Product2[K, V]]): Unit = {
     internalWrite(records)
   }
 
   private def closeShuffleWriter(): Unit = {
-    if (nativeShuffleWriter != -1L) {
-      jniWrapper.close(nativeShuffleWriter)
-      nativeShuffleWriter = -1L
+    if (nativeShuffleWriter == -1L) {
+      return
     }
+    jniWrapper.close(nativeShuffleWriter)
+    nativeShuffleWriter = -1L
   }
 
   override def stop(success: Boolean): Option[MapStatus] = {
diff --git 
a/backends-velox/src/main/scala/org/apache/spark/sql/execution/datasources/velox/VeloxFormatWriterInjects.scala
 
b/backends-velox/src/main/scala/org/apache/spark/sql/execution/datasources/velox/VeloxFormatWriterInjects.scala
index 08b458ad18..cd5f442bc7 100644
--- 
a/backends-velox/src/main/scala/org/apache/spark/sql/execution/datasources/velox/VeloxFormatWriterInjects.scala
+++ 
b/backends-velox/src/main/scala/org/apache/spark/sql/execution/datasources/velox/VeloxFormatWriterInjects.scala
@@ -16,7 +16,7 @@
  */
 package org.apache.spark.sql.execution.datasources.velox
 
-import org.apache.gluten.columnarbatch.{ColumnarBatches, 
ColumnarBatchJniWrapper}
+import org.apache.gluten.columnarbatch.ColumnarBatches
 import org.apache.gluten.datasource.{VeloxDataSourceJniWrapper, 
VeloxDataSourceUtil}
 import org.apache.gluten.exception.GlutenException
 import org.apache.gluten.execution.datasource.GlutenRowSplitter
@@ -76,13 +76,8 @@ trait VeloxFormatWriterInjects extends 
GlutenFormatWriterInjectsBase {
         ColumnarBatches.checkOffloaded(batch)
         ColumnarBatches.retain(batch)
         val batchHandle = {
-          if (batch.numCols == 0) {
-            // the operation will find a zero column batch from a task-local 
pool
-            
ColumnarBatchJniWrapper.create(runtime).getForEmptySchema(batch.numRows)
-          } else {
-            ColumnarBatches.checkOffloaded(batch)
-            ColumnarBatches.getNativeHandle(batch)
-          }
+          ColumnarBatches.checkOffloaded(batch)
+          ColumnarBatches.getNativeHandle(batch)
         }
         datasourceJniWrapper.writeBatch(dsHandle, batchHandle)
         batch.close()
diff --git 
a/backends-velox/src/test/java/org/apache/gluten/columnarbatch/ColumnarBatchTest.java
 
b/backends-velox/src/test/java/org/apache/gluten/columnarbatch/ColumnarBatchTest.java
index 04221ec3ad..54803aa193 100644
--- 
a/backends-velox/src/test/java/org/apache/gluten/columnarbatch/ColumnarBatchTest.java
+++ 
b/backends-velox/src/test/java/org/apache/gluten/columnarbatch/ColumnarBatchTest.java
@@ -24,6 +24,7 @@ import org.apache.gluten.vectorized.ArrowWritableColumnVector;
 import org.apache.spark.sql.catalyst.InternalRow;
 import org.apache.spark.sql.types.DataTypes;
 import org.apache.spark.sql.types.StructType;
+import org.apache.spark.sql.vectorized.ColumnVector;
 import org.apache.spark.sql.vectorized.ColumnarBatch;
 import org.apache.spark.task.TaskResources$;
 import org.junit.Assert;
@@ -44,12 +45,53 @@ public class ColumnarBatchTest extends VeloxBackendTestBase 
{
           final int numRows = 100;
           final ColumnarBatch batch = newArrowBatch("a boolean, b int", 
numRows);
           Assert.assertTrue(ColumnarBatches.isHeavyBatch(batch));
+          ColumnarBatches.checkLoaded(batch);
+          Assert.assertThrows(
+              IllegalArgumentException.class, () -> 
ColumnarBatches.checkOffloaded(batch));
           final ColumnarBatch offloaded =
               ColumnarBatches.offload(ArrowBufferAllocators.contextInstance(), 
batch);
           Assert.assertTrue(ColumnarBatches.isLightBatch(offloaded));
+          ColumnarBatches.checkOffloaded(offloaded);
+          Assert.assertThrows(
+              IllegalArgumentException.class, () -> 
ColumnarBatches.checkLoaded(offloaded));
           final ColumnarBatch loaded =
               ColumnarBatches.load(ArrowBufferAllocators.contextInstance(), 
offloaded);
           Assert.assertTrue(ColumnarBatches.isHeavyBatch(loaded));
+          ColumnarBatches.checkLoaded(loaded);
+          Assert.assertThrows(
+              IllegalArgumentException.class, () -> 
ColumnarBatches.checkOffloaded(loaded));
+          long cnt =
+              StreamSupport.stream(
+                      Spliterators.spliteratorUnknownSize(
+                          loaded.rowIterator(), Spliterator.ORDERED),
+                      false)
+                  .count();
+          Assert.assertEquals(numRows, cnt);
+          loaded.close();
+          return null;
+        });
+  }
+
+  @Test
+  public void testZeroColumnBatch() {
+    TaskResources$.MODULE$.runUnsafe(
+        () -> {
+          final int numRows = 100;
+          final ColumnarBatch batch = new ColumnarBatch(new ColumnVector[0]);
+          batch.setNumRows(numRows);
+          Assert.assertTrue(ColumnarBatches.isZeroColumnBatch(batch));
+          ColumnarBatches.checkLoaded(batch);
+          ColumnarBatches.checkOffloaded(batch);
+          final ColumnarBatch offloaded =
+              ColumnarBatches.offload(ArrowBufferAllocators.contextInstance(), 
batch);
+          Assert.assertTrue(ColumnarBatches.isZeroColumnBatch(offloaded));
+          ColumnarBatches.checkLoaded(offloaded);
+          ColumnarBatches.checkOffloaded(offloaded);
+          final ColumnarBatch loaded =
+              ColumnarBatches.load(ArrowBufferAllocators.contextInstance(), 
offloaded);
+          Assert.assertTrue(ColumnarBatches.isZeroColumnBatch(loaded));
+          ColumnarBatches.checkLoaded(loaded);
+          ColumnarBatches.checkOffloaded(loaded);
           long cnt =
               StreamSupport.stream(
                       Spliterators.spliteratorUnknownSize(
@@ -97,7 +139,7 @@ public class ColumnarBatchTest extends VeloxBackendTestBase {
   }
 
   @Test
-  public void testOffloadAndLoadReadRow() {
+  public void testReadRow() {
     TaskResources$.MODULE$.runUnsafe(
         () -> {
           final int numRows = 20;
diff --git 
a/backends-velox/src/test/scala/org/apache/gluten/execution/MiscOperatorSuite.scala
 
b/backends-velox/src/test/scala/org/apache/gluten/execution/MiscOperatorSuite.scala
index ed79db951d..76a46836a1 100644
--- 
a/backends-velox/src/test/scala/org/apache/gluten/execution/MiscOperatorSuite.scala
+++ 
b/backends-velox/src/test/scala/org/apache/gluten/execution/MiscOperatorSuite.scala
@@ -2095,7 +2095,7 @@ class MiscOperatorSuite extends 
VeloxWholeStageTransformerSuite with AdaptiveSpa
           )
           checkNullTypeRepartition(
             spark.table("lineitem").selectExpr("null as x", "null as 
y").repartition(),
-            1
+            0
           )
         }
     }
diff --git 
a/backends-velox/src/test/scala/org/apache/gluten/execution/ScalarFunctionsValidateSuite.scala
 
b/backends-velox/src/test/scala/org/apache/gluten/execution/ScalarFunctionsValidateSuite.scala
index 479139f7a9..46d6870b04 100644
--- 
a/backends-velox/src/test/scala/org/apache/gluten/execution/ScalarFunctionsValidateSuite.scala
+++ 
b/backends-velox/src/test/scala/org/apache/gluten/execution/ScalarFunctionsValidateSuite.scala
@@ -23,6 +23,9 @@ import org.apache.spark.sql.catalyst.optimizer.NullPropagation
 import org.apache.spark.sql.execution.ProjectExec
 import org.apache.spark.sql.types._
 
+import org.scalactic.source.Position
+import org.scalatest.Tag
+
 import java.sql.Timestamp
 
 class ScalarFunctionsValidateSuiteRasOff extends ScalarFunctionsValidateSuite {
@@ -37,6 +40,21 @@ class ScalarFunctionsValidateSuiteRasOn extends 
ScalarFunctionsValidateSuite {
     super.sparkConf
       .set("spark.gluten.ras.enabled", "true")
   }
+
+  // TODO: Fix the incompatibilities then remove this method. See GLUTEN-7600.
+  override protected def test(testName: String, testTags: Tag*)(testFun: => 
Any)(implicit
+      pos: Position): Unit = {
+    val exclusions = Set(
+      "isnull function",
+      "null input for array_size",
+      "Test make_ym_interval function"
+    )
+    if (exclusions.contains(testName)) {
+      super.ignore(testName, testTags: _*)(testFun)(pos)
+      return
+    }
+    super.test(testName, testTags: _*)(testFun)(pos)
+  }
 }
 
 abstract class ScalarFunctionsValidateSuite extends FunctionsValidateSuite {
@@ -675,7 +693,8 @@ abstract class ScalarFunctionsValidateSuite extends 
FunctionsValidateSuite {
     }
   }
 
-  test("Test monotonically_increasing_id function") {
+  // FIXME: Ignored: https://github.com/apache/incubator-gluten/issues/7600.
+  ignore("Test monotonically_increasintestg_id function") {
     runQueryAndCompare("""SELECT monotonically_increasing_id(), l_orderkey
                          | from lineitem limit 100""".stripMargin) {
       checkGlutenOperatorMatch[ProjectExecTransformer]
diff --git a/cpp/velox/compute/VeloxRuntime.cc 
b/cpp/velox/compute/VeloxRuntime.cc
index c01316cfb2..332c75dbd7 100644
--- a/cpp/velox/compute/VeloxRuntime.cc
+++ b/cpp/velox/compute/VeloxRuntime.cc
@@ -165,7 +165,9 @@ std::shared_ptr<ColumnarToRowConverter> 
VeloxRuntime::createColumnar2RowConverte
 std::shared_ptr<ColumnarBatch> 
VeloxRuntime::createOrGetEmptySchemaBatch(int32_t numRows) {
   auto& lookup = emptySchemaBatchLoopUp_;
   if (lookup.find(numRows) == lookup.end()) {
-    const std::shared_ptr<ColumnarBatch>& batch = 
gluten::createZeroColumnBatch(numRows);
+    auto veloxPool = memoryManager()->getLeafMemoryPool();
+    const std::shared_ptr<VeloxColumnarBatch>& batch =
+        VeloxColumnarBatch::from(veloxPool.get(), 
gluten::createZeroColumnBatch(numRows));
     lookup.emplace(numRows, batch); // the batch will be released after Spark 
task ends
   }
   return lookup.at(numRows);
diff --git a/cpp/velox/compute/VeloxRuntime.h b/cpp/velox/compute/VeloxRuntime.h
index 3511c3731f..846f740cb8 100644
--- a/cpp/velox/compute/VeloxRuntime.h
+++ b/cpp/velox/compute/VeloxRuntime.h
@@ -98,7 +98,7 @@ class VeloxRuntime final : public Runtime {
   std::shared_ptr<facebook::velox::config::ConfigBase> veloxCfg_;
   bool debugModeEnabled_{false};
 
-  std::unordered_map<int32_t, std::shared_ptr<ColumnarBatch>> 
emptySchemaBatchLoopUp_;
+  std::unordered_map<int32_t, std::shared_ptr<VeloxColumnarBatch>> 
emptySchemaBatchLoopUp_;
 };
 
 } // namespace gluten
diff --git a/cpp/velox/substrait/SubstraitToVeloxPlanValidator.cc 
b/cpp/velox/substrait/SubstraitToVeloxPlanValidator.cc
index 42d91bd48d..2709fcda1d 100644
--- a/cpp/velox/substrait/SubstraitToVeloxPlanValidator.cc
+++ b/cpp/velox/substrait/SubstraitToVeloxPlanValidator.cc
@@ -572,6 +572,12 @@ bool SubstraitToVeloxPlanValidator::validate(const 
::substrait::WindowRel& windo
     return false;
   }
 
+  if (types.empty()) {
+    // See: https://github.com/apache/incubator-gluten/issues/7600.
+    LOG_VALIDATION_MSG("Validation failed for empty input schema in 
WindowRel.");
+    return false;
+  }
+
   int32_t inputPlanNodeId = 0;
   std::vector<std::string> names;
   names.reserve(types.size());
diff --git 
a/gluten-arrow/src/main/java/org/apache/gluten/columnarbatch/ColumnarBatches.java
 
b/gluten-arrow/src/main/java/org/apache/gluten/columnarbatch/ColumnarBatches.java
index 1529e8f2b6..04236884a1 100644
--- 
a/gluten-arrow/src/main/java/org/apache/gluten/columnarbatch/ColumnarBatches.java
+++ 
b/gluten-arrow/src/main/java/org/apache/gluten/columnarbatch/ColumnarBatches.java
@@ -25,7 +25,6 @@ import org.apache.gluten.utils.InternalRowUtl;
 import org.apache.gluten.vectorized.ArrowWritableColumnVector;
 
 import com.google.common.annotations.VisibleForTesting;
-import com.google.common.base.Preconditions;
 import org.apache.arrow.c.ArrowArray;
 import org.apache.arrow.c.ArrowSchema;
 import org.apache.arrow.c.CDataDictionaryProvider;
@@ -51,13 +50,13 @@ public final class ColumnarBatches {
 
   private enum BatchType {
     LIGHT,
-    HEAVY
+    HEAVY,
+    ZERO_COLUMN
   }
 
   private static BatchType identifyBatchType(ColumnarBatch batch) {
     if (batch.numCols() == 0) {
-      // zero-column batch considered as heavy batch
-      return BatchType.HEAVY;
+      return BatchType.ZERO_COLUMN;
     }
 
     final ColumnVector col0 = batch.column(0);
@@ -99,6 +98,12 @@ public final class ColumnarBatches {
     return identifyBatchType(batch) == BatchType.LIGHT;
   }
 
+  /** Zero-column batch: The batch doesn't have columns. Though it could have 
a fixed row count. */
+  @VisibleForTesting
+  static boolean isZeroColumnBatch(ColumnarBatch batch) {
+    return identifyBatchType(batch) == BatchType.ZERO_COLUMN;
+  }
+
   /**
    * This method will always return a velox based ColumnarBatch. This method 
will close the input
    * column batch.
@@ -144,14 +149,31 @@ public final class ColumnarBatches {
   }
 
   public static void checkLoaded(ColumnarBatch batch) {
-    Preconditions.checkArgument(isHeavyBatch(batch), "Input batch is not 
loaded");
+    final BatchType type = identifyBatchType(batch);
+    switch (type) {
+      case HEAVY:
+      case ZERO_COLUMN:
+        break;
+      default:
+        throw new IllegalArgumentException("Input batch is not loaded");
+    }
   }
 
   public static void checkOffloaded(ColumnarBatch batch) {
-    Preconditions.checkArgument(isLightBatch(batch), "Input batch is not 
offloaded");
+    final BatchType type = identifyBatchType(batch);
+    switch (type) {
+      case LIGHT:
+      case ZERO_COLUMN:
+        break;
+      default:
+        throw new IllegalArgumentException("Input batch is not offloaded");
+    }
   }
 
   public static ColumnarBatch load(BufferAllocator allocator, ColumnarBatch 
input) {
+    if (isZeroColumnBatch(input)) {
+      return input;
+    }
     if (!ColumnarBatches.isLightBatch(input)) {
       throw new IllegalArgumentException(
           "Input is not light columnar batch. "
@@ -198,6 +220,9 @@ public final class ColumnarBatches {
   }
 
   public static ColumnarBatch offload(BufferAllocator allocator, ColumnarBatch 
input) {
+    if (isZeroColumnBatch(input)) {
+      return input;
+    }
     if (!isHeavyBatch(input)) {
       throw new IllegalArgumentException("batch is not Arrow columnar batch");
     }
@@ -300,6 +325,9 @@ public final class ColumnarBatches {
   }
 
   public static void forceClose(ColumnarBatch input) {
+    if (isZeroColumnBatch(input)) {
+      return;
+    }
     for (long i = 0; i < getRefCnt(input); i++) {
       input.close();
     }
@@ -330,13 +358,15 @@ public final class ColumnarBatches {
       case LIGHT:
         IndicatorVector iv = (IndicatorVector) b.column(0);
         iv.retain();
-        return;
+        break;
       case HEAVY:
         for (int i = 0; i < b.numCols(); i++) {
           ArrowWritableColumnVector col = ((ArrowWritableColumnVector) 
b.column(i));
           col.retain();
         }
-        return;
+        break;
+      case ZERO_COLUMN:
+        break;
       default:
         throw new IllegalStateException();
     }
@@ -354,6 +384,12 @@ public final class ColumnarBatches {
   }
 
   public static long getNativeHandle(ColumnarBatch batch) {
+    if (isZeroColumnBatch(batch)) {
+      final ColumnarBatchJniWrapper jniWrapper =
+          ColumnarBatchJniWrapper.create(
+              Runtimes.contextInstance("ColumnarBatches#getNativeHandle"));
+      return jniWrapper.getForEmptySchema(batch.numRows());
+    }
     return getIndicatorVector(batch).handle();
   }
 
diff --git 
a/gluten-arrow/src/main/java/org/apache/gluten/vectorized/ColumnarBatchInIterator.java
 
b/gluten-arrow/src/main/java/org/apache/gluten/vectorized/ColumnarBatchInIterator.java
index c69caf5f59..f95324fad9 100644
--- 
a/gluten-arrow/src/main/java/org/apache/gluten/vectorized/ColumnarBatchInIterator.java
+++ 
b/gluten-arrow/src/main/java/org/apache/gluten/vectorized/ColumnarBatchInIterator.java
@@ -16,9 +16,7 @@
  */
 package org.apache.gluten.vectorized;
 
-import org.apache.gluten.columnarbatch.ColumnarBatchJniWrapper;
 import org.apache.gluten.columnarbatch.ColumnarBatches;
-import org.apache.gluten.runtime.Runtimes;
 
 import org.apache.spark.sql.vectorized.ColumnarBatch;
 
@@ -39,11 +37,6 @@ public class ColumnarBatchInIterator {
   // For being called by native code.
   public long next() {
     final ColumnarBatch next = delegated.next();
-    if (next.numCols() == 0) {
-      // the operation will find a zero column batch from a task-local pool
-      return 
ColumnarBatchJniWrapper.create(Runtimes.contextInstance("ColumnarBatchInIterator"))
-          .getForEmptySchema(next.numRows());
-    }
     ColumnarBatches.checkOffloaded(next);
     return ColumnarBatches.getNativeHandle(next);
   }
diff --git 
a/gluten-substrait/src/main/scala/org/apache/gluten/execution/BasicPhysicalOperatorTransformer.scala
 
b/gluten-substrait/src/main/scala/org/apache/gluten/execution/BasicPhysicalOperatorTransformer.scala
index cc5c2325dc..684dd6ac9e 100644
--- 
a/gluten-substrait/src/main/scala/org/apache/gluten/execution/BasicPhysicalOperatorTransformer.scala
+++ 
b/gluten-substrait/src/main/scala/org/apache/gluten/execution/BasicPhysicalOperatorTransformer.scala
@@ -210,14 +210,6 @@ abstract class ProjectExecTransformerBase(val list: 
Seq[NamedExpression], val in
   override def doTransform(context: SubstraitContext): TransformContext = {
     val childCtx = child.asInstanceOf[TransformSupport].transform(context)
     val operatorId = context.nextOperatorId(this.nodeName)
-    if ((list == null || list.isEmpty) && childCtx != null) {
-      // The computing for this project is not needed.
-      // the child may be an input adapter and childCtx is null. In this case 
we want to
-      // make a read node with non-empty base_schema.
-      context.registerEmptyRelToOperator(operatorId)
-      return childCtx
-    }
-
     val currRel =
       getRelNode(context, list, child.output, operatorId, childCtx.root, 
validation = false)
     assert(currRel != null, "Project Rel should be valid")
diff --git 
a/gluten-substrait/src/main/scala/org/apache/gluten/expression/ExpressionMappings.scala
 
b/gluten-substrait/src/main/scala/org/apache/gluten/expression/ExpressionMappings.scala
index 176cf575c2..ea0259f3b0 100644
--- 
a/gluten-substrait/src/main/scala/org/apache/gluten/expression/ExpressionMappings.scala
+++ 
b/gluten-substrait/src/main/scala/org/apache/gluten/expression/ExpressionMappings.scala
@@ -285,7 +285,6 @@ object ExpressionMappings {
     Sig[CheckOverflow](CHECK_OVERFLOW),
     Sig[MakeDecimal](MAKE_DECIMAL),
     Sig[PromotePrecision](PROMOTE_PRECISION),
-    Sig[MonotonicallyIncreasingID](MONOTONICALLY_INCREASING_ID),
     Sig[SparkPartitionID](SPARK_PARTITION_ID),
     Sig[AtLeastNNonNulls](AT_LEAST_N_NON_NULLS),
     Sig[WidthBucket](WIDTH_BUCKET),
diff --git 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/MiscColumnarRules.scala
 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/MiscColumnarRules.scala
index b74eee3b86..11b4b86508 100644
--- 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/MiscColumnarRules.scala
+++ 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/MiscColumnarRules.scala
@@ -38,7 +38,6 @@ object MiscColumnarRules {
         List(),
         List(
           OffloadOthers(),
-          OffloadAggregate(),
           OffloadExchange(),
           OffloadJoin()
         )
diff --git 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/OffloadSingleNode.scala
 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/OffloadSingleNode.scala
index 2b61bfbc3d..b34e83af70 100644
--- 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/OffloadSingleNode.scala
+++ 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/OffloadSingleNode.scala
@@ -23,7 +23,6 @@ import org.apache.gluten.execution._
 import org.apache.gluten.extension.GlutenPlan
 import org.apache.gluten.logging.LogLevelUtil
 import org.apache.gluten.sql.shims.SparkShimLoader
-import org.apache.gluten.utils.PlanUtil
 
 import org.apache.spark.api.python.EvalPythonExecTransformer
 import org.apache.spark.internal.Logging
@@ -50,55 +49,6 @@ sealed trait OffloadSingleNode extends Logging {
   def offload(plan: SparkPlan): SparkPlan
 }
 
-// Aggregation transformation.
-case class OffloadAggregate() extends OffloadSingleNode with LogLevelUtil {
-  override def offload(plan: SparkPlan): SparkPlan = plan match {
-    case plan if FallbackTags.nonEmpty(plan) =>
-      plan
-    case agg: HashAggregateExec =>
-      genHashAggregateExec(agg)
-    case other => other
-  }
-
-  /**
-   * Generate a plan for hash aggregation.
-   *
-   * @param plan
-   *   : the original Spark plan.
-   * @return
-   *   the actually used plan for execution.
-   */
-  private def genHashAggregateExec(plan: HashAggregateExec): SparkPlan = {
-    if (FallbackTags.nonEmpty(plan)) {
-      return plan
-    }
-
-    val aggChild = plan.child
-
-    // If child's output is empty, fallback or offload both the child and 
aggregation.
-    if (
-      aggChild.output.isEmpty && BackendsApiManager.getSettings
-        .fallbackAggregateWithEmptyOutputChild()
-    ) {
-      aggChild match {
-        case _: TransformSupport =>
-          // If the child is transformable, transform aggregation as well.
-          logDebug(s"Columnar Processing for ${plan.getClass} is currently 
supported.")
-          HashAggregateExecBaseTransformer.from(plan)
-        case p: SparkPlan if PlanUtil.isGlutenTableCache(p) =>
-          HashAggregateExecBaseTransformer.from(plan)
-        case _ =>
-          // If the child is not transformable, do not transform the agg.
-          FallbackTags.add(plan, "child output schema is empty")
-          plan
-      }
-    } else {
-      logDebug(s"Columnar Processing for ${plan.getClass} is currently 
supported.")
-      HashAggregateExecBaseTransformer.from(plan)
-    }
-  }
-}
-
 // Exchange transformation.
 case class OffloadExchange() extends OffloadSingleNode with LogLevelUtil {
   override def offload(plan: SparkPlan): SparkPlan = plan match {
@@ -276,6 +226,9 @@ object OffloadOthers {
           val columnarChild = plan.child
           logDebug(s"Columnar Processing for ${plan.getClass} is currently 
supported.")
           ProjectExecTransformer(plan.projectList, columnarChild)
+        case plan: HashAggregateExec =>
+          logDebug(s"Columnar Processing for ${plan.getClass} is currently 
supported.")
+          HashAggregateExecBaseTransformer.from(plan)
         case plan: SortAggregateExec =>
           logDebug(s"Columnar Processing for ${plan.getClass} is currently 
supported.")
           HashAggregateExecBaseTransformer.from(plan)
diff --git 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/rewrite/PullOutPostProject.scala
 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/rewrite/PullOutPostProject.scala
index 1b54671444..6ede36446e 100644
--- 
a/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/rewrite/PullOutPostProject.scala
+++ 
b/gluten-substrait/src/main/scala/org/apache/gluten/extension/columnar/rewrite/PullOutPostProject.scala
@@ -87,16 +87,20 @@ object PullOutPostProject extends RewriteSingleNode with 
PullOutProjectHelper {
         case alias @ Alias(_: WindowExpression, _) =>
           postWindowExpressions += alias.toAttribute
           alias
-        case other =>
+        case expr if hasWindowExpression(expr) =>
           // Directly use the output of WindowExpression, and move expression 
evaluation to
           // post-project for computation.
-          assert(hasWindowExpression(other))
-          val we = other.collectFirst { case w: WindowExpression => w }.get
+          val we = expr.collectFirst { case w: WindowExpression => w }.get
           val alias = Alias(we, generatePostAliasName)()
-          postWindowExpressions += other
+          postWindowExpressions += expr
             .transform { case _: WindowExpression => alias.toAttribute }
             .asInstanceOf[NamedExpression]
           alias
+        case other: Alias =>
+          // The expression doesn't actually have a Spark WindowExpression in 
it. It's possibly
+          // a trivial literal.
+          postWindowExpressions += other.toAttribute
+          other
       }
       val newWindow =
         window.copy(windowExpression = 
newWindowExpressions.asInstanceOf[Seq[NamedExpression]])
diff --git 
a/gluten-ut/spark32/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
 
b/gluten-ut/spark32/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
index 337aa5025f..55fb4ae16d 100644
--- 
a/gluten-ut/spark32/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
+++ 
b/gluten-ut/spark32/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
@@ -316,7 +316,11 @@ class VeloxTestSettings extends BackendTestSettings {
   enableSuite[GlutenSameResultSuite]
   enableSuite[GlutenSQLAggregateFunctionSuite]
   // spill not supported yet.
-  enableSuite[GlutenSQLWindowFunctionSuite].exclude("test with low buffer 
spill threshold")
+  enableSuite[GlutenSQLWindowFunctionSuite]
+    .exclude("test with low buffer spill threshold")
+    // https://github.com/apache/incubator-gluten/issues/7631
+    .exclude(
+      "SPARK-16633: lead/lag should return the default value if the offset row 
does not exist")
   enableSuite[GlutenSortSuite]
     // Sort spill is not supported.
     .exclude("sorting does not crash for large inputs")
diff --git 
a/gluten-ut/spark33/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
 
b/gluten-ut/spark33/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
index caa91891cf..8b56f63f65 100644
--- 
a/gluten-ut/spark33/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
+++ 
b/gluten-ut/spark33/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
@@ -897,7 +897,11 @@ class VeloxTestSettings extends BackendTestSettings {
   enableSuite[GlutenSortSuite]
   enableSuite[GlutenSQLAggregateFunctionSuite]
   // spill not supported yet.
-  enableSuite[GlutenSQLWindowFunctionSuite].exclude("test with low buffer 
spill threshold")
+  enableSuite[GlutenSQLWindowFunctionSuite]
+    .exclude("test with low buffer spill threshold")
+    // https://github.com/apache/incubator-gluten/issues/7631
+    .exclude(
+      "SPARK-16633: lead/lag should return the default value if the offset row 
does not exist")
   enableSuite[GlutenTakeOrderedAndProjectSuite]
   enableSuite[GlutenSessionExtensionSuite]
   enableSuite[TestFileSourceScanExecTransformer]
diff --git 
a/gluten-ut/spark34/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
 
b/gluten-ut/spark34/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
index 963fb79a35..22a9e62c09 100644
--- 
a/gluten-ut/spark34/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
+++ 
b/gluten-ut/spark34/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
@@ -896,8 +896,12 @@ class VeloxTestSettings extends BackendTestSettings {
   enableSuite[GlutenSameResultSuite]
   enableSuite[GlutenSortSuite]
   enableSuite[GlutenSQLAggregateFunctionSuite]
-  // spill not supported yet.
-  enableSuite[GlutenSQLWindowFunctionSuite].exclude("test with low buffer 
spill threshold")
+  // spill not supported yet.enableSuite[GlutenSQLWindowFunctionSuite]
+  enableSuite[GlutenSQLWindowFunctionSuite]
+    .exclude("test with low buffer spill threshold")
+    // https://github.com/apache/incubator-gluten/issues/7631
+    .exclude(
+      "SPARK-16633: lead/lag should return the default value if the offset row 
does not exist")
   enableSuite[GlutenTakeOrderedAndProjectSuite]
   enableSuite[GlutenSessionExtensionSuite]
   enableSuite[TestFileSourceScanExecTransformer]
diff --git 
a/gluten-ut/spark35/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
 
b/gluten-ut/spark35/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
index 03f56b4601..3f6bea5dd1 100644
--- 
a/gluten-ut/spark35/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
+++ 
b/gluten-ut/spark35/src/test/scala/org/apache/gluten/utils/velox/VeloxTestSettings.scala
@@ -911,7 +911,11 @@ class VeloxTestSettings extends BackendTestSettings {
   enableSuite[GlutenSortSuite]
   enableSuite[GlutenSQLAggregateFunctionSuite]
   // spill not supported yet.
-  enableSuite[GlutenSQLWindowFunctionSuite].exclude("test with low buffer 
spill threshold")
+  enableSuite[GlutenSQLWindowFunctionSuite]
+    .exclude("test with low buffer spill threshold")
+    // https://github.com/apache/incubator-gluten/issues/7631
+    .exclude(
+      "SPARK-16633: lead/lag should return the default value if the offset row 
does not exist")
   enableSuite[GlutenTakeOrderedAndProjectSuite]
   enableSuite[GlutenSessionExtensionSuite]
   enableSuite[TestFileSourceScanExecTransformer]


---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

(incubator-gluten) branch main updated: [GLUTEN-7600][VL] Remove EmptySchemaWorkaround (#7620)

Reply via email to