From 08aed024a095b36aaaa57cba9e1291e0e9621b20 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 3 Jul 2025 14:24:41 -0700
Subject: [PATCH 01/27] fix: [iceberg] Enable CometShuffleManager in Iceberg
 Spark tests

---
 dev/diffs/iceberg/1.8.1.diff | 470 +++++++++++++++++++++++++++++++++++
 1 file changed, 470 insertions(+)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 7c6fa0ad15..9686edc36f 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -195,6 +195,100 @@ index e2d2c7a..d23acef 100644
      relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
      relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
      relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
+diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
+index 578845e..9476f19 100644
+--- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
++++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
+@@ -57,6 +57,8 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
+             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
+             .config(
+                 SQLConf.ADAPTIVE_EXECUTION_ENABLED().key(), String.valueOf(RANDOM.nextBoolean()))
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
+index ade19de..2e681b0 100644
+--- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
++++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
+@@ -56,6 +56,8 @@ public class TestCallStatementParser {
+             .master("local[2]")
+             .config("spark.sql.extensions", IcebergSparkSessionExtensions.class.getName())
+             .config("spark.extra.prop", "value")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+     TestCallStatementParser.parser = spark.sessionState().sqlParser();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
+index 64edb10..c3de1bf 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
+@@ -179,6 +179,8 @@ public class DeleteOrphanFilesBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", catalogWarehouse())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local");
+     spark = builder.getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
+index a5d0456..fc90ea3 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
+@@ -392,6 +392,8 @@ public class IcebergSortCompactionBenchmark {
+                 "spark.sql.catalog.spark_catalog", "org.apache.iceberg.spark.SparkSessionCatalog")
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", getCatalogWarehouse())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]");
+     spark = builder.getOrCreate();
+     Configuration sparkHadoopConf = spark.sessionState().newHadoopConf();
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
+index c6794e4..a48af31 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
+@@ -239,6 +239,8 @@ public class DVReaderBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]")
+             .getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
+index ac74fb5..cb437da 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
+@@ -223,6 +223,8 @@ public class DVWriterBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]")
+             .getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
+index 68c537e..89cf5fa 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
+@@ -94,7 +94,10 @@ public abstract class IcebergSourceBenchmark {
+   }
+ 
+   protected void setupSpark(boolean enableDictionaryEncoding) {
+-    SparkSession.Builder builder = SparkSession.builder().config("spark.ui.enabled", false);
++    SparkSession.Builder builder = SparkSession.builder()
++            .config("spark.ui.enabled", false)
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager");
+     if (!enableDictionaryEncoding) {
+       builder
+           .config("parquet.dictionary.page.size", "1")
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
 index d6c16bb..123a300 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
@@ -265,6 +359,122 @@ index a361a7f..9021cd5 100644
 +    return true;
 +  }
  }
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
+index 404ba72..743a11e 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
+@@ -90,6 +90,8 @@ public abstract class SparkDistributedDataScanTestBase
+         .master("local[2]")
+         .config("spark.serializer", serializer)
+         .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++        .config("spark.plugins", "org.apache.spark.CometPlugin")
++        .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+         .getOrCreate();
+   }
+ }
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
+index 659507e..ed9c4cc 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
+@@ -73,6 +73,8 @@ public class TestSparkDistributedDataScanDeletes
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
+index a218f96..919eb5c 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
+@@ -62,6 +62,8 @@ public class TestSparkDistributedDataScanFilterFiles
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
+index 2665d7b..c863caf 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
+@@ -63,6 +63,8 @@ public class TestSparkDistributedDataScanReporting
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
+index de68351..63a281b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
+@@ -77,6 +77,8 @@ public abstract class TestBase extends SparkTestHelperBase {
+             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
+             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
+index bc4e722..8650c79 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
+@@ -59,7 +59,11 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    spark = SparkSession.builder().master("local[2]").getOrCreate();
++    spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
+index 3a26974..ab8a08c 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
+@@ -54,7 +54,11 @@ public abstract class ScanTestBase extends AvroDataTest {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    ScanTestBase.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    ScanTestBase.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     ScanTestBase.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
+index f411920..9d09edd 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
+@@ -144,7 +144,11 @@ public class TestCompressionSettings extends CatalogTestBase {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestCompressionSettings.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestCompressionSettings.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @BeforeEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
 index 7404b18..6ce9485 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
@@ -295,3 +505,263 @@ index 7404b18..6ce9485 100644
    public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
      removeTables();
      sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
+index c4ba96e..2021ea2 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
+@@ -75,7 +75,11 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestDataSourceOptions.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestDataSourceOptions.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
+index 3481735..1744488 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
+@@ -110,7 +110,11 @@ public class TestFilteredScan {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestFilteredScan.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestFilteredScan.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
+index 84c99a5..2d04fc4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
+@@ -93,7 +93,11 @@ public class TestForwardCompatibility {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestForwardCompatibility.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestForwardCompatibility.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
+index 7eff93d..d0ab653 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
+@@ -46,7 +46,11 @@ public class TestIcebergSpark {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestIcebergSpark.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestIcebergSpark.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
+index 9464f68..5edccc9 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
+@@ -112,7 +112,11 @@ public class TestPartitionPruning {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestPartitionPruning.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestPartitionPruning.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestPartitionPruning.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
+ 
+     String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
+index 5c218f2..96f167a 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
+@@ -107,7 +107,11 @@ public class TestPartitionValues {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestPartitionValues.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestPartitionValues.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
+index a7334a5..c23fb08 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
+@@ -87,7 +87,11 @@ public class TestSnapshotSelection {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSnapshotSelection.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSnapshotSelection.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
+index 182b1ef..79587f4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
+@@ -120,7 +120,11 @@ public class TestSparkDataFile {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkDataFile.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkDataFile.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestSparkDataFile.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
+index fb2b312..fa3d6bb 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
+@@ -96,7 +96,11 @@ public class TestSparkDataWrite {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkDataWrite.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkDataWrite.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterEach
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
+index becf6a0..a03e9aa 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
+@@ -83,7 +83,11 @@ public class TestSparkReadProjection extends TestReadProjection {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkReadProjection.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkReadProjection.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     ImmutableMap<String, String> config =
+         ImmutableMap.of(
+             "type", "hive",
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
+index 4f1cef5..bcab37b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
+@@ -136,6 +136,8 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
+             .config("spark.ui.liveUpdate.period", 0)
+             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
+index baf7fa8..c0d52bc 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
+@@ -182,7 +182,9 @@ public class TestSparkReaderWithBloomFilter {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
+-            .enableHiveSupport()
++                .config("spark.plugins", "org.apache.spark.CometPlugin")
++                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++                .enableHiveSupport()
+             .getOrCreate();
+ 
+     catalog =
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
+index 17db46b..6d124b4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
+@@ -65,7 +65,9 @@ public class TestStructuredStreaming {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.sql.shuffle.partitions", 4)
+-            .getOrCreate();
++                .config("spark.plugins", "org.apache.spark.CometPlugin")
++                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++                .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
+index 306444b..d960727 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
+@@ -75,7 +75,11 @@ public class TestTimestampWithoutZone extends TestBase {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestTimestampWithoutZone.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestTimestampWithoutZone.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
+index 841268a..89f30e9 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
+@@ -80,7 +80,11 @@ public class TestWriteMetricsConfig {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestWriteMetricsConfig.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestWriteMetricsConfig.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestWriteMetricsConfig.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
+index 6e09252..74e6c9b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
+@@ -60,6 +60,8 @@ public class TestAggregatePushDown extends CatalogTestBase {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.sql.iceberg.aggregate_pushdown", "true")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 

From fe31fcf509c68d2fd490f462015cd4754d46f88f Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 3 Jul 2025 15:08:10 -0700
Subject: [PATCH 02/27] Depends on OSS Spark

---
 .../actions/setup-spark-local-jar/action.yaml | 48 -------------------
 dev/diffs/iceberg/1.8.1.diff                  |  4 +-
 2 files changed, 2 insertions(+), 50 deletions(-)
 delete mode 100644 .github/actions/setup-spark-local-jar/action.yaml

diff --git a/.github/actions/setup-spark-local-jar/action.yaml b/.github/actions/setup-spark-local-jar/action.yaml
deleted file mode 100644
index 5334bf1ea6..0000000000
--- a/.github/actions/setup-spark-local-jar/action.yaml
+++ /dev/null
@@ -1,48 +0,0 @@
-# Licensed to the Apache Software Foundation (ASF) under one
-# or more contributor license agreements.  See the NOTICE file
-# distributed with this work for additional information
-# regarding copyright ownership.  The ASF licenses this file
-# to you under the Apache License, Version 2.0 (the
-# "License"); you may not use this file except in compliance
-# with the License.  You may obtain a copy of the License at
-#
-#   http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing,
-# software distributed under the License is distributed on an
-# "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
-# KIND, either express or implied.  See the License for the
-# specific language governing permissions and limitations
-# under the License.
-
-name: Setup Spark Local Jar
-description: 'Build comet-patched Apache Spark for Iceberg Spark tests'
-inputs:
-  spark-short-version:
-    description: 'The Apache Spark short version (e.g., 3.5) to build'
-    required: true
-  spark-version:
-    description: 'The Apache Spark version (e.g., 3.5.6) to build'
-    required: true
-  scala-version:
-    description: 'The Scala short version (e.g., 2.13) to build'
-    required: true
-runs:
-  using: "composite"
-  steps:
-    - name: Clone Spark repo
-      uses: actions/checkout@v4
-      with:
-        repository: apache/spark
-        path: apache-spark
-        ref: v${{inputs.spark-version}}
-        fetch-depth: 1
-
-    - name: Publish local Spark snapshot w/ Comet
-      shell: bash
-      run: |
-        cd apache-spark
-        git apply ../dev/diffs/${{inputs.spark-version}}.diff
-        ./dev/change-scala-version.sh ${{inputs.scala-version}}
-        ./build/mvn versions:set -DnewVersion=${{inputs.spark-version}}-SNAPSHOT
-        ./build/mvn -Pscala-${{inputs.scala-version}} -Phive -Phive-thriftserver -DskipTests -Denforcer.skip=true clean install
diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 9686edc36f..a5321b0cc5 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1,5 +1,5 @@
 diff --git a/gradle/libs.versions.toml b/gradle/libs.versions.toml
-index 04ffa8f..d4107be 100644
+index 04ffa8f..0d88648 100644
 --- a/gradle/libs.versions.toml
 +++ b/gradle/libs.versions.toml
 @@ -81,7 +81,7 @@ slf4j = "2.0.16"
@@ -7,7 +7,7 @@ index 04ffa8f..d4107be 100644
  spark-hive33 = "3.3.4"
  spark-hive34 = "3.4.4"
 -spark-hive35 = "3.5.4"
-+spark-hive35 = "3.5.6-SNAPSHOT"
++spark-hive35 = "3.5.6"
  sqlite-jdbc = "3.48.0.0"
  testcontainers = "1.20.4"
  tez010 = "0.10.4"

From c60fee28d60223dc23c9b194a76dc3976bd623bd Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 3 Jul 2025 15:08:18 -0700
Subject: [PATCH 03/27] Parallelize Iceberg Spark tests

---
 .github/workflows/iceberg_spark_test.yml | 88 ++++++++++++++++++++----
 1 file changed, 74 insertions(+), 14 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 33c7e30d16..3ee1c22026 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -40,17 +40,17 @@ env:
   RUST_VERSION: stable
 
 jobs:
-  iceberg-spark-sql:
+  prepare:
     if: contains(github.event.pull_request.title, '[iceberg]')
     strategy:
       matrix:
-        os: [ubuntu-24.04]
-        java-version: [11, 17]
-        iceberg-version: [{short: '1.8', full: '1.8.1'}]
-        spark-version: [{short: '3.5', full: '3.5.6'}]
-        scala-version: ['2.13']
+        os: [ ubuntu-24.04 ]
+        java-version: [ 11, 17 ]
+        iceberg-version: [ { short: '1.8', full: '1.8.1' } ]
+        spark-version: [ { short: '3.5', full: '3.5.6' } ]
+        scala-version: [ '2.13' ]
       fail-fast: false
-    name: iceberg-spark-sql/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
+    name: Build native and patched Iceberg
     runs-on: ${{ matrix.os }}
     container:
       image: amd64/rust
@@ -69,18 +69,78 @@ jobs:
           iceberg-version: ${{ matrix.iceberg-version.full }}
           scala-version: ${{ matrix.scala-version }}
           spark-short-version: ${{ matrix.spark-version.short }}
-      - name: Build local Spark jar with comet patch
-        uses: ./.github/actions/setup-spark-local-jar
-        with:
-          spark-short-version: ${{ matrix.spark-version.short }}
-          spark-version: ${{ matrix.spark-version.full }}
-          scala-version: ${{ matrix.scala-version }}
+
+  iceberg-spark:
+    needs: [prepare]
+    strategy:
+      matrix:
+        os: [ubuntu-24.04]
+        java-version: [11, 17]
+        iceberg-version: [{short: '1.8', full: '1.8.1'}]
+        spark-version: [{short: '3.5', full: '3.5.6'}]
+        scala-version: ['2.13']
+      fail-fast: false
+    name: iceberg-spark/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
+    runs-on: ${{ matrix.os }}
+    container:
+      image: amd64/rust
+    env:
+      SPARK_LOCAL_IP: localhost
+    steps:
       - name: Run Iceberg Spark tests
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
+            -Pquick=true -x javadoc
+
+  iceberg-spark-extensions:
+    needs: [prepare]
+    strategy:
+      matrix:
+        os: [ubuntu-24.04]
+        java-version: [11, 17]
+        iceberg-version: [{short: '1.8', full: '1.8.1'}]
+        spark-version: [{short: '3.5', full: '3.5.6'}]
+        scala-version: ['2.13']
+      fail-fast: false
+    name: iceberg-spark-extensions/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
+    runs-on: ${{ matrix.os }}
+    container:
+      image: amd64/rust
+    env:
+      SPARK_LOCAL_IP: localhost
+    steps:
+      - name: Run Iceberg Spark tests
+        run: |
+          cd apache-iceberg
+          rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
+          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
-            :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
             -Pquick=true -x javadoc
+
+  iceberg-spark-runtime:
+    needs: [prepare]
+    strategy:
+      matrix:
+        os: [ubuntu-24.04]
+        java-version: [11, 17]
+        iceberg-version: [{short: '1.8', full: '1.8.1'}]
+        spark-version: [{short: '3.5', full: '3.5.6'}]
+        scala-version: ['2.13']
+      fail-fast: false
+    name: iceberg-spark-runtime/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
+    runs-on: ${{ matrix.os }}
+    container:
+      image: amd64/rust
+    env:
+      SPARK_LOCAL_IP: localhost
+    steps:
+      - name: Run Iceberg Spark tests
+        run: |
+          cd apache-iceberg
+          rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
+          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+            :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
+            -Pquick=true -x javadoc
\ No newline at end of file

From f13384b3335ef1c1f89745c2caa0d84d81aa37f4 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 3 Jul 2025 15:46:55 -0700
Subject: [PATCH 04/27] fix: no need to change directory

---
 .github/workflows/iceberg_spark_test.yml | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 3ee1c22026..ee3c6db90c 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -89,7 +89,6 @@ jobs:
     steps:
       - name: Run Iceberg Spark tests
         run: |
-          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
@@ -114,7 +113,6 @@ jobs:
     steps:
       - name: Run Iceberg Spark tests
         run: |
-          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
@@ -139,7 +137,6 @@ jobs:
     steps:
       - name: Run Iceberg Spark tests
         run: |
-          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \

From 921da99893600bc8ceb1bc637ec4c9b4fbd65486 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Fri, 4 Jul 2025 11:40:35 -0700
Subject: [PATCH 05/27] Change build order

---
 .github/actions/setup-iceberg-builder/action.yaml | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/.github/actions/setup-iceberg-builder/action.yaml b/.github/actions/setup-iceberg-builder/action.yaml
index eb8bc0e32c..0bc32f245e 100644
--- a/.github/actions/setup-iceberg-builder/action.yaml
+++ b/.github/actions/setup-iceberg-builder/action.yaml
@@ -30,6 +30,11 @@ inputs:
 runs:
   using: "composite"
   steps:
+    - name: Build Comet
+      shell: bash
+      run: |
+        PROFILES="-Pspark-${{inputs.spark-short-version}} -Pscala-${{inputs.scala-version}}" make release
+
     - name: Clone Iceberg repo
       uses: actions/checkout@v4
       with:
@@ -43,8 +48,3 @@ runs:
       run: |
         cd apache-iceberg
         git apply ../dev/diffs/iceberg/${{inputs.iceberg-version}}.diff
-
-    - name: Build Comet
-      shell: bash
-      run: |
-        PROFILES="-Pspark-${{inputs.spark-short-version}} -Pscala-${{inputs.scala-version}}" make release

From d531a88cdf5e7ca1bc377d4bc117e495bff0fe60 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 7 Jul 2025 09:59:28 -0700
Subject: [PATCH 06/27] Checkout action doesn't persist across jobs  - See
 https://github.com/actions/checkout/issues/19

---
 .github/workflows/iceberg_spark_test.yml | 33 +++++++++++++++++-------
 1 file changed, 23 insertions(+), 10 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index ee3c6db90c..0ae5f1664b 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -54,8 +54,6 @@ jobs:
     runs-on: ${{ matrix.os }}
     container:
       image: amd64/rust
-    env:
-      SPARK_LOCAL_IP: localhost
     steps:
       - uses: actions/checkout@v4
       - name: Setup Rust & Java toolchain
@@ -63,12 +61,6 @@ jobs:
         with:
           rust-version: ${{env.RUST_VERSION}}
           jdk-version: ${{ matrix.java-version }}
-      - name: Setup Iceberg
-        uses: ./.github/actions/setup-iceberg-builder
-        with:
-          iceberg-version: ${{ matrix.iceberg-version.full }}
-          scala-version: ${{ matrix.scala-version }}
-          spark-short-version: ${{ matrix.spark-version.short }}
 
   iceberg-spark:
     needs: [prepare]
@@ -87,8 +79,15 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
+      - name: Setup Iceberg
+        uses: ./.github/actions/setup-iceberg-builder
+        with:
+          iceberg-version: ${{ matrix.iceberg-version.full }}
+          scala-version: ${{ matrix.scala-version }}
+          spark-short-version: ${{ matrix.spark-version.short }}
       - name: Run Iceberg Spark tests
         run: |
+          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
@@ -111,8 +110,15 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
-      - name: Run Iceberg Spark tests
+      - name: Setup Iceberg
+        uses: ./.github/actions/setup-iceberg-builder
+        with:
+          iceberg-version: ${{ matrix.iceberg-version.full }}
+          scala-version: ${{ matrix.scala-version }}
+          spark-short-version: ${{ matrix.spark-version.short }}
+      - name: Run Iceberg Spark extensions tests
         run: |
+          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
@@ -135,8 +141,15 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
-      - name: Run Iceberg Spark tests
+      - name: Setup Iceberg
+        uses: ./.github/actions/setup-iceberg-builder
+        with:
+          iceberg-version: ${{ matrix.iceberg-version.full }}
+          scala-version: ${{ matrix.scala-version }}
+          spark-short-version: ${{ matrix.spark-version.short }}
+      - name: Run Iceberg Spark runtime tests
         run: |
+          cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \

From c104d2c041b798c7accfe1e1233e321bee4ebbad Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 7 Jul 2025 10:37:48 -0700
Subject: [PATCH 07/27] Need to checkout first

---
 .github/workflows/iceberg_spark_test.yml | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 0ae5f1664b..17a8ceb058 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -79,6 +79,7 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
+      - uses: actions/checkout@v4
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:
@@ -110,6 +111,7 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
+      - uses: actions/checkout@v4
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:
@@ -141,6 +143,7 @@ jobs:
     env:
       SPARK_LOCAL_IP: localhost
     steps:
+      - uses: actions/checkout@v4
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:

From 39ac3f7114ec891ccbe9517cc4a0a0ea70e49f4d Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 7 Jul 2025 12:13:10 -0700
Subject: [PATCH 08/27] Move Comet build to prepare stage

---
 .github/actions/setup-iceberg-builder/action.yaml | 11 -----------
 .github/workflows/iceberg_spark_test.yml          | 12 +++++-------
 2 files changed, 5 insertions(+), 18 deletions(-)

diff --git a/.github/actions/setup-iceberg-builder/action.yaml b/.github/actions/setup-iceberg-builder/action.yaml
index 0bc32f245e..5b9f2d59b5 100644
--- a/.github/actions/setup-iceberg-builder/action.yaml
+++ b/.github/actions/setup-iceberg-builder/action.yaml
@@ -21,20 +21,9 @@ inputs:
   iceberg-version:
     description: 'The Apache Iceberg version (e.g., 1.8.1) to build'
     required: true
-  scala-version:
-    description: 'The Scala short version (e.g., 2.13) to build'
-    required: true
-  spark-short-version:
-    description: 'The Apache Spark short version (e.g., 3.5) to build'
-    required: true
 runs:
   using: "composite"
   steps:
-    - name: Build Comet
-      shell: bash
-      run: |
-        PROFILES="-Pspark-${{inputs.spark-short-version}} -Pscala-${{inputs.scala-version}}" make release
-
     - name: Clone Iceberg repo
       uses: actions/checkout@v4
       with:
diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 17a8ceb058..405ef99437 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -50,7 +50,7 @@ jobs:
         spark-version: [ { short: '3.5', full: '3.5.6' } ]
         scala-version: [ '2.13' ]
       fail-fast: false
-    name: Build native and patched Iceberg
+    name: Build native
     runs-on: ${{ matrix.os }}
     container:
       image: amd64/rust
@@ -61,6 +61,10 @@ jobs:
         with:
           rust-version: ${{env.RUST_VERSION}}
           jdk-version: ${{ matrix.java-version }}
+      - name: Build Comet
+        shell: bash
+        run: |
+          PROFILES="-Pspark-${{matrix.spark-version.short}} -Pscala-${{matrix.scala-version}}" make release
 
   iceberg-spark:
     needs: [prepare]
@@ -84,8 +88,6 @@ jobs:
         uses: ./.github/actions/setup-iceberg-builder
         with:
           iceberg-version: ${{ matrix.iceberg-version.full }}
-          scala-version: ${{ matrix.scala-version }}
-          spark-short-version: ${{ matrix.spark-version.short }}
       - name: Run Iceberg Spark tests
         run: |
           cd apache-iceberg
@@ -116,8 +118,6 @@ jobs:
         uses: ./.github/actions/setup-iceberg-builder
         with:
           iceberg-version: ${{ matrix.iceberg-version.full }}
-          scala-version: ${{ matrix.scala-version }}
-          spark-short-version: ${{ matrix.spark-version.short }}
       - name: Run Iceberg Spark extensions tests
         run: |
           cd apache-iceberg
@@ -148,8 +148,6 @@ jobs:
         uses: ./.github/actions/setup-iceberg-builder
         with:
           iceberg-version: ${{ matrix.iceberg-version.full }}
-          scala-version: ${{ matrix.scala-version }}
-          spark-short-version: ${{ matrix.spark-version.short }}
       - name: Run Iceberg Spark runtime tests
         run: |
           cd apache-iceberg

From 0311879f3afa7d9b2b8dffab9813efa3c6bd5065 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 7 Jul 2025 14:12:36 -0700
Subject: [PATCH 09/27] Replicate setup 3 times

---
 .github/workflows/iceberg_spark_test.yml | 57 ++++++++++++------------
 1 file changed, 29 insertions(+), 28 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 405ef99437..5ed00015c3 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -40,20 +40,22 @@ env:
   RUST_VERSION: stable
 
 jobs:
-  prepare:
+  iceberg-spark:
     if: contains(github.event.pull_request.title, '[iceberg]')
     strategy:
       matrix:
-        os: [ ubuntu-24.04 ]
-        java-version: [ 11, 17 ]
-        iceberg-version: [ { short: '1.8', full: '1.8.1' } ]
-        spark-version: [ { short: '3.5', full: '3.5.6' } ]
-        scala-version: [ '2.13' ]
+        os: [ubuntu-24.04]
+        java-version: [11, 17]
+        iceberg-version: [{short: '1.8', full: '1.8.1'}]
+        spark-version: [{short: '3.5', full: '3.5.6'}]
+        scala-version: ['2.13']
       fail-fast: false
-    name: Build native
+    name: iceberg-spark/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
     runs-on: ${{ matrix.os }}
     container:
       image: amd64/rust
+    env:
+      SPARK_LOCAL_IP: localhost
     steps:
       - uses: actions/checkout@v4
       - name: Setup Rust & Java toolchain
@@ -65,25 +67,6 @@ jobs:
         shell: bash
         run: |
           PROFILES="-Pspark-${{matrix.spark-version.short}} -Pscala-${{matrix.scala-version}}" make release
-
-  iceberg-spark:
-    needs: [prepare]
-    strategy:
-      matrix:
-        os: [ubuntu-24.04]
-        java-version: [11, 17]
-        iceberg-version: [{short: '1.8', full: '1.8.1'}]
-        spark-version: [{short: '3.5', full: '3.5.6'}]
-        scala-version: ['2.13']
-      fail-fast: false
-    name: iceberg-spark/${{ matrix.os }}/iceberg-${{ matrix.iceberg-version.full }}/spark-${{ matrix.spark-version.full }}/scala-${{ matrix.scala-version }}/java-${{ matrix.java-version }}
-    runs-on: ${{ matrix.os }}
-    container:
-      image: amd64/rust
-    env:
-      SPARK_LOCAL_IP: localhost
-    steps:
-      - uses: actions/checkout@v4
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:
@@ -97,7 +80,7 @@ jobs:
             -Pquick=true -x javadoc
 
   iceberg-spark-extensions:
-    needs: [prepare]
+    if: contains(github.event.pull_request.title, '[iceberg]')
     strategy:
       matrix:
         os: [ubuntu-24.04]
@@ -114,6 +97,15 @@ jobs:
       SPARK_LOCAL_IP: localhost
     steps:
       - uses: actions/checkout@v4
+      - name: Setup Rust & Java toolchain
+        uses: ./.github/actions/setup-builder
+        with:
+          rust-version: ${{env.RUST_VERSION}}
+          jdk-version: ${{ matrix.java-version }}
+      - name: Build Comet
+        shell: bash
+        run: |
+          PROFILES="-Pspark-${{matrix.spark-version.short}} -Pscala-${{matrix.scala-version}}" make release
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:
@@ -127,7 +119,7 @@ jobs:
             -Pquick=true -x javadoc
 
   iceberg-spark-runtime:
-    needs: [prepare]
+    if: contains(github.event.pull_request.title, '[iceberg]')
     strategy:
       matrix:
         os: [ubuntu-24.04]
@@ -144,6 +136,15 @@ jobs:
       SPARK_LOCAL_IP: localhost
     steps:
       - uses: actions/checkout@v4
+      - name: Setup Rust & Java toolchain
+        uses: ./.github/actions/setup-builder
+        with:
+          rust-version: ${{env.RUST_VERSION}}
+          jdk-version: ${{ matrix.java-version }}
+      - name: Build Comet
+        shell: bash
+        run: |
+          PROFILES="-Pspark-${{matrix.spark-version.short}} -Pscala-${{matrix.scala-version}}" make release
       - name: Setup Iceberg
         uses: ./.github/actions/setup-iceberg-builder
         with:

From c3d6d24e7d57357c44b16fbe2dfd36ceb1271cba Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 7 Jul 2025 14:43:49 -0700
Subject: [PATCH 10/27] Apply spotless

---
 .github/workflows/iceberg_spark_test.yml | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 5ed00015c3..24899ecb35 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -75,6 +75,7 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
+          ./gradlew spotlessApply
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
             -Pquick=true -x javadoc
@@ -114,6 +115,7 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
+          ./gradlew spotlessApply
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
             -Pquick=true -x javadoc
@@ -153,6 +155,7 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
+          ./gradlew spotlessApply
           ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
             -Pquick=true -x javadoc
\ No newline at end of file

From a62c7ee493d35c3bbe9548cd9c23977f4c489819 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Mon, 21 Jul 2025 15:35:29 -0700
Subject: [PATCH 11/27] Fix tasks

---
 .github/workflows/iceberg_spark_test.yml | 15 ++++++---------
 1 file changed, 6 insertions(+), 9 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index 24899ecb35..ea821d61d0 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -75,9 +75,8 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ./gradlew spotlessApply
-          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
-            :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
+          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+            :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:test \
             -Pquick=true -x javadoc
 
   iceberg-spark-extensions:
@@ -115,9 +114,8 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ./gradlew spotlessApply
-          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
-            :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
+          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+            :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:test \
             -Pquick=true -x javadoc
 
   iceberg-spark-runtime:
@@ -155,7 +153,6 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ./gradlew spotlessApply
-          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
-            :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:check \
+          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+            :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:integrationTest \
             -Pquick=true -x javadoc
\ No newline at end of file

From 885642486ae0200508cc958ee809612eefc0dfc2 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Fri, 1 Aug 2025 15:54:58 -0700
Subject: [PATCH 12/27] Fall back to Spark when the relations are one of
 Iceberg metadata tables

---
 .../apache/comet/rules/CometScanRule.scala    | 26 ++++++++++++++++++-
 1 file changed, 25 insertions(+), 1 deletion(-)

diff --git a/spark/src/main/scala/org/apache/comet/rules/CometScanRule.scala b/spark/src/main/scala/org/apache/comet/rules/CometScanRule.scala
index 592069fcc6..09c909ad4f 100644
--- a/spark/src/main/scala/org/apache/comet/rules/CometScanRule.scala
+++ b/spark/src/main/scala/org/apache/comet/rules/CometScanRule.scala
@@ -72,6 +72,26 @@ case class CometScanRule(session: SparkSession) extends Rule[SparkPlan] {
         })
       }
 
+      def isIcebergMetadataTable(scanExec: BatchScanExec): Boolean = {
+        // List of Iceberg metadata tables:
+        // https://iceberg.apache.org/docs/latest/spark-queries/#inspecting-tables
+        val metadataTableSuffix = Set(
+          "history",
+          "metadata_log_entries",
+          "snapshots",
+          "entries",
+          "files",
+          "manifests",
+          "partitions",
+          "position_deletes",
+          "all_data_files",
+          "all_delete_files",
+          "all_entries",
+          "all_manifests")
+
+        metadataTableSuffix.exists(suffix => scanExec.table.name().endsWith(suffix))
+      }
+
       plan.transform {
         case scan if hasMetadataCol(scan) =>
           withInfo(scan, "Metadata column is not supported")
@@ -82,7 +102,11 @@ case class CometScanRule(session: SparkSession) extends Rule[SparkPlan] {
 
         // data source V2
         case scanExec: BatchScanExec =>
-          transformV2Scan(scanExec)
+          if (isIcebergMetadataTable(scanExec)) {
+            withInfo(scanExec, "Iceberg Metadata tables are not supported")
+          } else {
+            transformV2Scan(scanExec)
+          }
       }
     }
   }

From 7a86e5c696e62bd139771f5f0500878cb0543572 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Wed, 6 Aug 2025 14:48:01 -0700
Subject: [PATCH 13/27] Conditionally enable Comet

---
 dev/diffs/iceberg/1.8.1.diff | 128 ++++++++++++++++++++++++-----------
 1 file changed, 90 insertions(+), 38 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index a5321b0cc5..56a63e060b 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -92,35 +92,61 @@ index 4794863..0be31c1 100644
      this.initialized = true;
    }
  
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-index a361a7f..9021cd5 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-@@ -24,6 +24,7 @@ import java.util.Objects;
- import java.util.Set;
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+index 11f054b..108de81 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
+   // - Parquet vectorization is enabled
+   // - only primitives or metadata columns are projected
+   // - all tasks are of FileScanTask type and read only Parquet files
+-  private boolean useParquetBatchReads() {
++  protected boolean useParquetBatchReads() {
+     return readConf.parquetVectorizationEnabled()
+         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
+         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+index 019f391..298c25f 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+@@ -23,6 +23,7 @@ import java.util.List;
+ import java.util.Map;
  import java.util.function.Supplier;
  import java.util.stream.Collectors;
 +import org.apache.comet.parquet.SupportsComet;
- import org.apache.iceberg.DeleteFile;
- import org.apache.iceberg.FileContent;
- import org.apache.iceberg.FileScanTask;
-@@ -63,7 +64,7 @@ import org.slf4j.Logger;
+ import org.apache.iceberg.BlobMetadata;
+ import org.apache.iceberg.ScanTask;
+ import org.apache.iceberg.ScanTaskGroup;
+@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
+ import org.apache.iceberg.relocated.com.google.common.base.Strings;
+ import org.apache.iceberg.relocated.com.google.common.collect.Lists;
+ import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.iceberg.spark.ParquetReaderType;
+ import org.apache.iceberg.spark.Spark3Util;
+ import org.apache.iceberg.spark.SparkReadConf;
+ import org.apache.iceberg.spark.SparkSchemaUtil;
+@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
+ import org.slf4j.Logger;
  import org.slf4j.LoggerFactory;
  
- class SparkBatchQueryScan extends SparkPartitioningAwareScan<PartitionScanTask>
--    implements SupportsRuntimeV2Filtering {
-+    implements SupportsRuntimeV2Filtering, SupportsComet {
- 
-   private static final Logger LOG = LoggerFactory.getLogger(SparkBatchQueryScan.class);
+-abstract class SparkScan implements Scan, SupportsReportStatistics {
++abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
+   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
+   private static final String NDV_KEY = "ndv";
  
-@@ -290,4 +291,9 @@ class SparkBatchQueryScan extends SparkPartitioningAwareScan<PartitionScanTask>
-         runtimeFilterExpressions,
-         caseSensitive());
+@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+       return splitSize;
+     }
    }
 +
 +  @Override
 +  public boolean isCometEnabled() {
-+    return true;
++    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
++      SparkBatch batch = (SparkBatch) this.toBatch();
++      return batch.useParquetBatchReads();
++    }
++
++    return false;
 +  }
  }
 diff --git a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
@@ -328,35 +354,61 @@ index 4794863..0be31c1 100644
      this.initialized = true;
    }
  
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-index a361a7f..9021cd5 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatchQueryScan.java
-@@ -24,6 +24,7 @@ import java.util.Objects;
- import java.util.Set;
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+index 11f054b..a646d86 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
+   // - Parquet vectorization is enabled
+   // - only primitives or metadata columns are projected
+   // - all tasks are of FileScanTask type and read only Parquet files
+-  private boolean useParquetBatchReads() {
++  boolean useParquetBatchReads() {
+     return readConf.parquetVectorizationEnabled()
+         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
+         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+index 019f391..298c25f 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+@@ -23,6 +23,7 @@ import java.util.List;
+ import java.util.Map;
  import java.util.function.Supplier;
  import java.util.stream.Collectors;
 +import org.apache.comet.parquet.SupportsComet;
- import org.apache.iceberg.DeleteFile;
- import org.apache.iceberg.FileContent;
- import org.apache.iceberg.FileScanTask;
-@@ -63,7 +64,7 @@ import org.slf4j.Logger;
+ import org.apache.iceberg.BlobMetadata;
+ import org.apache.iceberg.ScanTask;
+ import org.apache.iceberg.ScanTaskGroup;
+@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
+ import org.apache.iceberg.relocated.com.google.common.base.Strings;
+ import org.apache.iceberg.relocated.com.google.common.collect.Lists;
+ import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.iceberg.spark.ParquetReaderType;
+ import org.apache.iceberg.spark.Spark3Util;
+ import org.apache.iceberg.spark.SparkReadConf;
+ import org.apache.iceberg.spark.SparkSchemaUtil;
+@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
+ import org.slf4j.Logger;
  import org.slf4j.LoggerFactory;
  
- class SparkBatchQueryScan extends SparkPartitioningAwareScan<PartitionScanTask>
--    implements SupportsRuntimeV2Filtering {
-+    implements SupportsRuntimeV2Filtering, SupportsComet {
- 
-   private static final Logger LOG = LoggerFactory.getLogger(SparkBatchQueryScan.class);
+-abstract class SparkScan implements Scan, SupportsReportStatistics {
++abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
+   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
+   private static final String NDV_KEY = "ndv";
  
-@@ -290,4 +291,9 @@ class SparkBatchQueryScan extends SparkPartitioningAwareScan<PartitionScanTask>
-         runtimeFilterExpressions,
-         caseSensitive());
+@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+       return splitSize;
+     }
    }
 +
 +  @Override
 +  public boolean isCometEnabled() {
-+    return true;
++    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
++      SparkBatch batch = (SparkBatch) this.toBatch();
++      return batch.useParquetBatchReads();
++    }
++
++    return false;
 +  }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java

From 5ae2f69647091f410a19a36ef67869ff35019dd1 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Wed, 6 Aug 2025 14:55:03 -0700
Subject: [PATCH 14/27] Remove diff

---
 dev/diffs/iceberg/1.8.1.diff | 819 -----------------------------------
 1 file changed, 819 deletions(-)
 delete mode 100644 dev/diffs/iceberg/1.8.1.diff

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
deleted file mode 100644
index 56a63e060b..0000000000
--- a/dev/diffs/iceberg/1.8.1.diff
+++ /dev/null
@@ -1,819 +0,0 @@
-diff --git a/gradle/libs.versions.toml b/gradle/libs.versions.toml
-index 04ffa8f..0d88648 100644
---- a/gradle/libs.versions.toml
-+++ b/gradle/libs.versions.toml
-@@ -81,7 +81,7 @@ slf4j = "2.0.16"
- snowflake-jdbc = "3.22.0"
- spark-hive33 = "3.3.4"
- spark-hive34 = "3.4.4"
--spark-hive35 = "3.5.4"
-+spark-hive35 = "3.5.6"
- sqlite-jdbc = "3.48.0.0"
- testcontainers = "1.20.4"
- tez010 = "0.10.4"
-diff --git a/spark/v3.4/build.gradle b/spark/v3.4/build.gradle
-index 6eb26e8..50cefce 100644
---- a/spark/v3.4/build.gradle
-+++ b/spark/v3.4/build.gradle
-@@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
-       exclude group: 'org.roaringbitmap'
-     }
- 
--    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     implementation libs.parquet.column
-     implementation libs.parquet.hadoop
-@@ -185,7 +185,7 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
-     testImplementation libs.avro.avro
-     testImplementation libs.parquet.hadoop
-     testImplementation libs.junit.vintage.engine
--    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     // Required because we remove antlr plugin dependencies from the compile configuration, see note above
-     runtimeOnly libs.antlr.runtime
-@@ -260,6 +260,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-+    integrationImplementation project(path: ':iceberg-parquet')
-+    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     // runtime dependencies for running Hive Catalog based integration test
-     integrationRuntimeOnly project(':iceberg-hive-metastore')
-@@ -297,8 +299,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     relocate 'org.apache.avro', 'org.apache.iceberg.shaded.org.apache.avro'
-     relocate 'avro.shaded', 'org.apache.iceberg.shaded.org.apache.avro.shaded'
-     relocate 'com.thoughtworks.paranamer', 'org.apache.iceberg.shaded.com.thoughtworks.paranamer'
--    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
--    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-+//    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
-+//    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-     relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
-     relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
-     relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-index 0ca1236..87daef4 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-@@ -29,7 +29,7 @@ public class SparkSQLProperties {
- 
-   // Controls which Parquet reader implementation to use
-   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
--  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
-+  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
- 
-   // Controls whether reading/writing timestamps without timezones is allowed
-   @Deprecated
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-index 4794863..0be31c1 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
- 
- import java.io.IOException;
- import java.util.Map;
-+import org.apache.comet.CometSchemaImporter;
- import org.apache.comet.parquet.AbstractColumnReader;
- import org.apache.comet.parquet.ColumnReader;
- import org.apache.comet.parquet.TypeUtil;
- import org.apache.comet.parquet.Utils;
--import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
- import org.apache.comet.shaded.arrow.memory.RootAllocator;
- import org.apache.iceberg.parquet.VectorizedReader;
- import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
-@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
-     }
- 
-     this.importer = new CometSchemaImporter(new RootAllocator());
--    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
-+    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
-     this.initialized = true;
-   }
- 
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..108de81 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
-   // - Parquet vectorization is enabled
-   // - only primitives or metadata columns are projected
-   // - all tasks are of FileScanTask type and read only Parquet files
--  private boolean useParquetBatchReads() {
-+  protected boolean useParquetBatchReads() {
-     return readConf.parquetVectorizationEnabled()
-         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
-         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-index 019f391..298c25f 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-@@ -23,6 +23,7 @@ import java.util.List;
- import java.util.Map;
- import java.util.function.Supplier;
- import java.util.stream.Collectors;
-+import org.apache.comet.parquet.SupportsComet;
- import org.apache.iceberg.BlobMetadata;
- import org.apache.iceberg.ScanTask;
- import org.apache.iceberg.ScanTaskGroup;
-@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
- import org.apache.iceberg.relocated.com.google.common.base.Strings;
- import org.apache.iceberg.relocated.com.google.common.collect.Lists;
- import org.apache.iceberg.relocated.com.google.common.collect.Maps;
-+import org.apache.iceberg.spark.ParquetReaderType;
- import org.apache.iceberg.spark.Spark3Util;
- import org.apache.iceberg.spark.SparkReadConf;
- import org.apache.iceberg.spark.SparkSchemaUtil;
-@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
- import org.slf4j.Logger;
- import org.slf4j.LoggerFactory;
- 
--abstract class SparkScan implements Scan, SupportsReportStatistics {
-+abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
-   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
-   private static final String NDV_KEY = "ndv";
- 
-@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
-       return splitSize;
-     }
-   }
-+
-+  @Override
-+  public boolean isCometEnabled() {
-+    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
-+      SparkBatch batch = (SparkBatch) this.toBatch();
-+      return batch.useParquetBatchReads();
-+    }
-+
-+    return false;
-+  }
- }
-diff --git a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-index 47a0e87..531b7ce 100644
---- a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-+++ b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-@@ -41,6 +41,7 @@ import org.apache.spark.sql.internal.SQLConf;
- import org.junit.After;
- import org.junit.Assert;
- import org.junit.Before;
-+import org.junit.Ignore;
- import org.junit.Test;
- 
- public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-@@ -214,7 +215,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-     Assert.assertEquals(4, fields.size());
-   }
- 
--  @Test
-+  @Ignore
-   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
-     sql(
-         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
-@@ -254,7 +255,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
-   }
- 
--  @Test
-+  @Ignore
-   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
-     removeTables();
-     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
-diff --git a/spark/v3.5/build.gradle b/spark/v3.5/build.gradle
-index e2d2c7a..d23acef 100644
---- a/spark/v3.5/build.gradle
-+++ b/spark/v3.5/build.gradle
-@@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
-       exclude group: 'org.roaringbitmap'
-     }
- 
--    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     implementation libs.parquet.column
-     implementation libs.parquet.hadoop
-@@ -182,8 +182,8 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
- 
-     testImplementation libs.avro.avro
-     testImplementation libs.parquet.hadoop
-+    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
-     testImplementation libs.awaitility
--    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
- 
-     // Required because we remove antlr plugin dependencies from the compile configuration, see note above
-     runtimeOnly libs.antlr.runtime
-@@ -263,6 +263,7 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-+    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     // runtime dependencies for running Hive Catalog based integration test
-     integrationRuntimeOnly project(':iceberg-hive-metastore')
-@@ -300,8 +301,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     relocate 'org.apache.avro', 'org.apache.iceberg.shaded.org.apache.avro'
-     relocate 'avro.shaded', 'org.apache.iceberg.shaded.org.apache.avro.shaded'
-     relocate 'com.thoughtworks.paranamer', 'org.apache.iceberg.shaded.com.thoughtworks.paranamer'
--    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
--    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-+//    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
-+//    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-     relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
-     relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
-     relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
-diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-index 578845e..9476f19 100644
---- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-+++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-@@ -57,6 +57,8 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
-             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
-             .config(
-                 SQLConf.ADAPTIVE_EXECUTION_ENABLED().key(), String.valueOf(RANDOM.nextBoolean()))
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .enableHiveSupport()
-             .getOrCreate();
- 
-diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-index ade19de..2e681b0 100644
---- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-+++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-@@ -56,6 +56,8 @@ public class TestCallStatementParser {
-             .master("local[2]")
-             .config("spark.sql.extensions", IcebergSparkSessionExtensions.class.getName())
-             .config("spark.extra.prop", "value")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .getOrCreate();
-     TestCallStatementParser.parser = spark.sessionState().sqlParser();
-   }
-diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-index 64edb10..c3de1bf 100644
---- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-+++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-@@ -179,6 +179,8 @@ public class DeleteOrphanFilesBenchmark {
-             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
-             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
-             .config("spark.sql.catalog.spark_catalog.warehouse", catalogWarehouse())
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .master("local");
-     spark = builder.getOrCreate();
-   }
-diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-index a5d0456..fc90ea3 100644
---- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-+++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-@@ -392,6 +392,8 @@ public class IcebergSortCompactionBenchmark {
-                 "spark.sql.catalog.spark_catalog", "org.apache.iceberg.spark.SparkSessionCatalog")
-             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
-             .config("spark.sql.catalog.spark_catalog.warehouse", getCatalogWarehouse())
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .master("local[*]");
-     spark = builder.getOrCreate();
-     Configuration sparkHadoopConf = spark.sessionState().newHadoopConf();
-diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-index c6794e4..a48af31 100644
---- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-+++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-@@ -239,6 +239,8 @@ public class DVReaderBenchmark {
-             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
-             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
-             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .master("local[*]")
-             .getOrCreate();
-   }
-diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-index ac74fb5..cb437da 100644
---- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-+++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-@@ -223,6 +223,8 @@ public class DVWriterBenchmark {
-             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
-             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
-             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .master("local[*]")
-             .getOrCreate();
-   }
-diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-index 68c537e..89cf5fa 100644
---- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-+++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-@@ -94,7 +94,10 @@ public abstract class IcebergSourceBenchmark {
-   }
- 
-   protected void setupSpark(boolean enableDictionaryEncoding) {
--    SparkSession.Builder builder = SparkSession.builder().config("spark.ui.enabled", false);
-+    SparkSession.Builder builder = SparkSession.builder()
-+            .config("spark.ui.enabled", false)
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager");
-     if (!enableDictionaryEncoding) {
-       builder
-           .config("parquet.dictionary.page.size", "1")
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-index d6c16bb..123a300 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-@@ -29,7 +29,7 @@ public class SparkSQLProperties {
- 
-   // Controls which Parquet reader implementation to use
-   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
--  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
-+  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
-   // Controls whether to perform the nullability check during writes
-   public static final String CHECK_NULLABILITY = "spark.sql.iceberg.check-nullability";
-   public static final boolean CHECK_NULLABILITY_DEFAULT = true;
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-index 4794863..0be31c1 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
- 
- import java.io.IOException;
- import java.util.Map;
-+import org.apache.comet.CometSchemaImporter;
- import org.apache.comet.parquet.AbstractColumnReader;
- import org.apache.comet.parquet.ColumnReader;
- import org.apache.comet.parquet.TypeUtil;
- import org.apache.comet.parquet.Utils;
--import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
- import org.apache.comet.shaded.arrow.memory.RootAllocator;
- import org.apache.iceberg.parquet.VectorizedReader;
- import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
-@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
-     }
- 
-     this.importer = new CometSchemaImporter(new RootAllocator());
--    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
-+    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
-     this.initialized = true;
-   }
- 
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..a646d86 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
-   // - Parquet vectorization is enabled
-   // - only primitives or metadata columns are projected
-   // - all tasks are of FileScanTask type and read only Parquet files
--  private boolean useParquetBatchReads() {
-+  boolean useParquetBatchReads() {
-     return readConf.parquetVectorizationEnabled()
-         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
-         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-index 019f391..298c25f 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-@@ -23,6 +23,7 @@ import java.util.List;
- import java.util.Map;
- import java.util.function.Supplier;
- import java.util.stream.Collectors;
-+import org.apache.comet.parquet.SupportsComet;
- import org.apache.iceberg.BlobMetadata;
- import org.apache.iceberg.ScanTask;
- import org.apache.iceberg.ScanTaskGroup;
-@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
- import org.apache.iceberg.relocated.com.google.common.base.Strings;
- import org.apache.iceberg.relocated.com.google.common.collect.Lists;
- import org.apache.iceberg.relocated.com.google.common.collect.Maps;
-+import org.apache.iceberg.spark.ParquetReaderType;
- import org.apache.iceberg.spark.Spark3Util;
- import org.apache.iceberg.spark.SparkReadConf;
- import org.apache.iceberg.spark.SparkSchemaUtil;
-@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
- import org.slf4j.Logger;
- import org.slf4j.LoggerFactory;
- 
--abstract class SparkScan implements Scan, SupportsReportStatistics {
-+abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
-   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
-   private static final String NDV_KEY = "ndv";
- 
-@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
-       return splitSize;
-     }
-   }
-+
-+  @Override
-+  public boolean isCometEnabled() {
-+    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
-+      SparkBatch batch = (SparkBatch) this.toBatch();
-+      return batch.useParquetBatchReads();
-+    }
-+
-+    return false;
-+  }
- }
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-index 404ba72..743a11e 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-@@ -90,6 +90,8 @@ public abstract class SparkDistributedDataScanTestBase
-         .master("local[2]")
-         .config("spark.serializer", serializer)
-         .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
-+        .config("spark.plugins", "org.apache.spark.CometPlugin")
-+        .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-         .getOrCreate();
-   }
- }
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-index 659507e..ed9c4cc 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-@@ -73,6 +73,8 @@ public class TestSparkDistributedDataScanDeletes
-             .master("local[2]")
-             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
-             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .getOrCreate();
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-index a218f96..919eb5c 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-@@ -62,6 +62,8 @@ public class TestSparkDistributedDataScanFilterFiles
-             .master("local[2]")
-             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
-             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .getOrCreate();
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-index 2665d7b..c863caf 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-@@ -63,6 +63,8 @@ public class TestSparkDistributedDataScanReporting
-             .master("local[2]")
-             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
-             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .getOrCreate();
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-index de68351..63a281b 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-@@ -77,6 +77,8 @@ public abstract class TestBase extends SparkTestHelperBase {
-             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
-             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
-             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .enableHiveSupport()
-             .getOrCreate();
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-index bc4e722..8650c79 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-@@ -59,7 +59,11 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
- 
-   @BeforeAll
-   public static void startSpark() {
--    spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-index 3a26974..ab8a08c 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-@@ -54,7 +54,11 @@ public abstract class ScanTestBase extends AvroDataTest {
- 
-   @BeforeAll
-   public static void startSpark() {
--    ScanTestBase.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    ScanTestBase.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-     ScanTestBase.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-index f411920..9d09edd 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-@@ -144,7 +144,11 @@ public class TestCompressionSettings extends CatalogTestBase {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestCompressionSettings.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestCompressionSettings.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @BeforeEach
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-index 7404b18..6ce9485 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-@@ -40,6 +40,7 @@ import org.apache.spark.sql.catalyst.parser.ParseException;
- import org.apache.spark.sql.internal.SQLConf;
- import org.junit.jupiter.api.AfterEach;
- import org.junit.jupiter.api.BeforeEach;
-+import org.junit.jupiter.api.Disabled;
- import org.junit.jupiter.api.TestTemplate;
- 
- public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-@@ -248,7 +249,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-         sql("select * from %s order by id", tableName));
-   }
- 
--  @TestTemplate
-+  @Disabled
-   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
-     sql(
-         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
-@@ -288,7 +289,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
-   }
- 
--  @TestTemplate
-+  @Disabled
-   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
-     removeTables();
-     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-index c4ba96e..2021ea2 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-@@ -75,7 +75,11 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestDataSourceOptions.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestDataSourceOptions.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-index 3481735..1744488 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-@@ -110,7 +110,11 @@ public class TestFilteredScan {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestFilteredScan.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestFilteredScan.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-index 84c99a5..2d04fc4 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-@@ -93,7 +93,11 @@ public class TestForwardCompatibility {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestForwardCompatibility.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestForwardCompatibility.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-index 7eff93d..d0ab653 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-@@ -46,7 +46,11 @@ public class TestIcebergSpark {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestIcebergSpark.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestIcebergSpark.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-index 9464f68..5edccc9 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-@@ -112,7 +112,11 @@ public class TestPartitionPruning {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestPartitionPruning.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestPartitionPruning.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-     TestPartitionPruning.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
- 
-     String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-index 5c218f2..96f167a 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-@@ -107,7 +107,11 @@ public class TestPartitionValues {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestPartitionValues.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestPartitionValues.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-index a7334a5..c23fb08 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-@@ -87,7 +87,11 @@ public class TestSnapshotSelection {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestSnapshotSelection.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSnapshotSelection.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-index 182b1ef..79587f4 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-@@ -120,7 +120,11 @@ public class TestSparkDataFile {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestSparkDataFile.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkDataFile.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-     TestSparkDataFile.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-index fb2b312..fa3d6bb 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-@@ -96,7 +96,11 @@ public class TestSparkDataWrite {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestSparkDataWrite.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkDataWrite.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterEach
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-index becf6a0..a03e9aa 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-@@ -83,7 +83,11 @@ public class TestSparkReadProjection extends TestReadProjection {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestSparkReadProjection.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkReadProjection.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-     ImmutableMap<String, String> config =
-         ImmutableMap.of(
-             "type", "hive",
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-index 4f1cef5..bcab37b 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-@@ -136,6 +136,8 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
-             .config("spark.ui.liveUpdate.period", 0)
-             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
-             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .enableHiveSupport()
-             .getOrCreate();
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-index baf7fa8..c0d52bc 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-@@ -182,7 +182,9 @@ public class TestSparkReaderWithBloomFilter {
-         SparkSession.builder()
-             .master("local[2]")
-             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
--            .enableHiveSupport()
-+                .config("spark.plugins", "org.apache.spark.CometPlugin")
-+                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+                .enableHiveSupport()
-             .getOrCreate();
- 
-     catalog =
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-index 17db46b..6d124b4 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-@@ -65,7 +65,9 @@ public class TestStructuredStreaming {
-         SparkSession.builder()
-             .master("local[2]")
-             .config("spark.sql.shuffle.partitions", 4)
--            .getOrCreate();
-+                .config("spark.plugins", "org.apache.spark.CometPlugin")
-+                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+                .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-index 306444b..d960727 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-@@ -75,7 +75,11 @@ public class TestTimestampWithoutZone extends TestBase {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestTimestampWithoutZone.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestTimestampWithoutZone.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-   }
- 
-   @AfterAll
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-index 841268a..89f30e9 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-@@ -80,7 +80,11 @@ public class TestWriteMetricsConfig {
- 
-   @BeforeAll
-   public static void startSpark() {
--    TestWriteMetricsConfig.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestWriteMetricsConfig.spark = SparkSession.builder()
-+            .master("local[2]")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+            .getOrCreate();
-     TestWriteMetricsConfig.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
-   }
- 
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-index 6e09252..74e6c9b 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-@@ -60,6 +60,8 @@ public class TestAggregatePushDown extends CatalogTestBase {
-         SparkSession.builder()
-             .master("local[2]")
-             .config("spark.sql.iceberg.aggregate_pushdown", "true")
-+            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-             .enableHiveSupport()
-             .getOrCreate();
- 

From fe257b3b3deb65b5fd93fb14fb9ca919e8150822 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Wed, 6 Aug 2025 14:56:01 -0700
Subject: [PATCH 15/27] Rebuild diff

---
 dev/diffs/iceberg/1.8.1.diff | 819 +++++++++++++++++++++++++++++++++++
 1 file changed, 819 insertions(+)
 create mode 100644 dev/diffs/iceberg/1.8.1.diff

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
new file mode 100644
index 0000000000..56a63e060b
--- /dev/null
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -0,0 +1,819 @@
+diff --git a/gradle/libs.versions.toml b/gradle/libs.versions.toml
+index 04ffa8f..0d88648 100644
+--- a/gradle/libs.versions.toml
++++ b/gradle/libs.versions.toml
+@@ -81,7 +81,7 @@ slf4j = "2.0.16"
+ snowflake-jdbc = "3.22.0"
+ spark-hive33 = "3.3.4"
+ spark-hive34 = "3.4.4"
+-spark-hive35 = "3.5.4"
++spark-hive35 = "3.5.6"
+ sqlite-jdbc = "3.48.0.0"
+ testcontainers = "1.20.4"
+ tez010 = "0.10.4"
+diff --git a/spark/v3.4/build.gradle b/spark/v3.4/build.gradle
+index 6eb26e8..50cefce 100644
+--- a/spark/v3.4/build.gradle
++++ b/spark/v3.4/build.gradle
+@@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
+       exclude group: 'org.roaringbitmap'
+     }
+ 
+-    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
++    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+ 
+     implementation libs.parquet.column
+     implementation libs.parquet.hadoop
+@@ -185,7 +185,7 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
+     testImplementation libs.avro.avro
+     testImplementation libs.parquet.hadoop
+     testImplementation libs.junit.vintage.engine
+-    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
++    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+ 
+     // Required because we remove antlr plugin dependencies from the compile configuration, see note above
+     runtimeOnly libs.antlr.runtime
+@@ -260,6 +260,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
+     integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
+     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
+     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
++    integrationImplementation project(path: ':iceberg-parquet')
++    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+ 
+     // runtime dependencies for running Hive Catalog based integration test
+     integrationRuntimeOnly project(':iceberg-hive-metastore')
+@@ -297,8 +299,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
+     relocate 'org.apache.avro', 'org.apache.iceberg.shaded.org.apache.avro'
+     relocate 'avro.shaded', 'org.apache.iceberg.shaded.org.apache.avro.shaded'
+     relocate 'com.thoughtworks.paranamer', 'org.apache.iceberg.shaded.com.thoughtworks.paranamer'
+-    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
+-    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
++//    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
++//    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
+     relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
+     relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
+     relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
+index 0ca1236..87daef4 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
+@@ -29,7 +29,7 @@ public class SparkSQLProperties {
+ 
+   // Controls which Parquet reader implementation to use
+   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
+-  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
++  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
+ 
+   // Controls whether reading/writing timestamps without timezones is allowed
+   @Deprecated
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
+index 4794863..0be31c1 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
+@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
+ 
+ import java.io.IOException;
+ import java.util.Map;
++import org.apache.comet.CometSchemaImporter;
+ import org.apache.comet.parquet.AbstractColumnReader;
+ import org.apache.comet.parquet.ColumnReader;
+ import org.apache.comet.parquet.TypeUtil;
+ import org.apache.comet.parquet.Utils;
+-import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
+ import org.apache.comet.shaded.arrow.memory.RootAllocator;
+ import org.apache.iceberg.parquet.VectorizedReader;
+ import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
+@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
+     }
+ 
+     this.importer = new CometSchemaImporter(new RootAllocator());
+-    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
++    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
+     this.initialized = true;
+   }
+ 
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+index 11f054b..108de81 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
+   // - Parquet vectorization is enabled
+   // - only primitives or metadata columns are projected
+   // - all tasks are of FileScanTask type and read only Parquet files
+-  private boolean useParquetBatchReads() {
++  protected boolean useParquetBatchReads() {
+     return readConf.parquetVectorizationEnabled()
+         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
+         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
+diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+index 019f391..298c25f 100644
+--- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
++++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+@@ -23,6 +23,7 @@ import java.util.List;
+ import java.util.Map;
+ import java.util.function.Supplier;
+ import java.util.stream.Collectors;
++import org.apache.comet.parquet.SupportsComet;
+ import org.apache.iceberg.BlobMetadata;
+ import org.apache.iceberg.ScanTask;
+ import org.apache.iceberg.ScanTaskGroup;
+@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
+ import org.apache.iceberg.relocated.com.google.common.base.Strings;
+ import org.apache.iceberg.relocated.com.google.common.collect.Lists;
+ import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.iceberg.spark.ParquetReaderType;
+ import org.apache.iceberg.spark.Spark3Util;
+ import org.apache.iceberg.spark.SparkReadConf;
+ import org.apache.iceberg.spark.SparkSchemaUtil;
+@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
+ import org.slf4j.Logger;
+ import org.slf4j.LoggerFactory;
+ 
+-abstract class SparkScan implements Scan, SupportsReportStatistics {
++abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
+   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
+   private static final String NDV_KEY = "ndv";
+ 
+@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+       return splitSize;
+     }
+   }
++
++  @Override
++  public boolean isCometEnabled() {
++    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
++      SparkBatch batch = (SparkBatch) this.toBatch();
++      return batch.useParquetBatchReads();
++    }
++
++    return false;
++  }
+ }
+diff --git a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
+index 47a0e87..531b7ce 100644
+--- a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
++++ b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
+@@ -41,6 +41,7 @@ import org.apache.spark.sql.internal.SQLConf;
+ import org.junit.After;
+ import org.junit.Assert;
+ import org.junit.Before;
++import org.junit.Ignore;
+ import org.junit.Test;
+ 
+ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
+@@ -214,7 +215,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
+     Assert.assertEquals(4, fields.size());
+   }
+ 
+-  @Test
++  @Ignore
+   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
+     sql(
+         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
+@@ -254,7 +255,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
+     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
+   }
+ 
+-  @Test
++  @Ignore
+   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
+     removeTables();
+     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
+diff --git a/spark/v3.5/build.gradle b/spark/v3.5/build.gradle
+index e2d2c7a..d23acef 100644
+--- a/spark/v3.5/build.gradle
++++ b/spark/v3.5/build.gradle
+@@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
+       exclude group: 'org.roaringbitmap'
+     }
+ 
+-    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
++    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+ 
+     implementation libs.parquet.column
+     implementation libs.parquet.hadoop
+@@ -182,8 +182,8 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
+ 
+     testImplementation libs.avro.avro
+     testImplementation libs.parquet.hadoop
++    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+     testImplementation libs.awaitility
+-    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
+ 
+     // Required because we remove antlr plugin dependencies from the compile configuration, see note above
+     runtimeOnly libs.antlr.runtime
+@@ -263,6 +263,7 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
+     integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
+     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
+     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
++    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
+ 
+     // runtime dependencies for running Hive Catalog based integration test
+     integrationRuntimeOnly project(':iceberg-hive-metastore')
+@@ -300,8 +301,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
+     relocate 'org.apache.avro', 'org.apache.iceberg.shaded.org.apache.avro'
+     relocate 'avro.shaded', 'org.apache.iceberg.shaded.org.apache.avro.shaded'
+     relocate 'com.thoughtworks.paranamer', 'org.apache.iceberg.shaded.com.thoughtworks.paranamer'
+-    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
+-    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
++//    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
++//    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
+     relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
+     relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
+     relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
+diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
+index 578845e..9476f19 100644
+--- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
++++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
+@@ -57,6 +57,8 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
+             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
+             .config(
+                 SQLConf.ADAPTIVE_EXECUTION_ENABLED().key(), String.valueOf(RANDOM.nextBoolean()))
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
+index ade19de..2e681b0 100644
+--- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
++++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
+@@ -56,6 +56,8 @@ public class TestCallStatementParser {
+             .master("local[2]")
+             .config("spark.sql.extensions", IcebergSparkSessionExtensions.class.getName())
+             .config("spark.extra.prop", "value")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+     TestCallStatementParser.parser = spark.sessionState().sqlParser();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
+index 64edb10..c3de1bf 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
+@@ -179,6 +179,8 @@ public class DeleteOrphanFilesBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", catalogWarehouse())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local");
+     spark = builder.getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
+index a5d0456..fc90ea3 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
+@@ -392,6 +392,8 @@ public class IcebergSortCompactionBenchmark {
+                 "spark.sql.catalog.spark_catalog", "org.apache.iceberg.spark.SparkSessionCatalog")
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", getCatalogWarehouse())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]");
+     spark = builder.getOrCreate();
+     Configuration sparkHadoopConf = spark.sessionState().newHadoopConf();
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
+index c6794e4..a48af31 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
+@@ -239,6 +239,8 @@ public class DVReaderBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]")
+             .getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
+index ac74fb5..cb437da 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
+@@ -223,6 +223,8 @@ public class DVWriterBenchmark {
+             .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
+             .config("spark.sql.catalog.spark_catalog.type", "hadoop")
+             .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .master("local[*]")
+             .getOrCreate();
+   }
+diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
+index 68c537e..89cf5fa 100644
+--- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
++++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
+@@ -94,7 +94,10 @@ public abstract class IcebergSourceBenchmark {
+   }
+ 
+   protected void setupSpark(boolean enableDictionaryEncoding) {
+-    SparkSession.Builder builder = SparkSession.builder().config("spark.ui.enabled", false);
++    SparkSession.Builder builder = SparkSession.builder()
++            .config("spark.ui.enabled", false)
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager");
+     if (!enableDictionaryEncoding) {
+       builder
+           .config("parquet.dictionary.page.size", "1")
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
+index d6c16bb..123a300 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
+@@ -29,7 +29,7 @@ public class SparkSQLProperties {
+ 
+   // Controls which Parquet reader implementation to use
+   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
+-  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
++  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
+   // Controls whether to perform the nullability check during writes
+   public static final String CHECK_NULLABILITY = "spark.sql.iceberg.check-nullability";
+   public static final boolean CHECK_NULLABILITY_DEFAULT = true;
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
+index 4794863..0be31c1 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
+@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
+ 
+ import java.io.IOException;
+ import java.util.Map;
++import org.apache.comet.CometSchemaImporter;
+ import org.apache.comet.parquet.AbstractColumnReader;
+ import org.apache.comet.parquet.ColumnReader;
+ import org.apache.comet.parquet.TypeUtil;
+ import org.apache.comet.parquet.Utils;
+-import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
+ import org.apache.comet.shaded.arrow.memory.RootAllocator;
+ import org.apache.iceberg.parquet.VectorizedReader;
+ import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
+@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
+     }
+ 
+     this.importer = new CometSchemaImporter(new RootAllocator());
+-    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
++    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
+     this.initialized = true;
+   }
+ 
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+index 11f054b..a646d86 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
+@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
+   // - Parquet vectorization is enabled
+   // - only primitives or metadata columns are projected
+   // - all tasks are of FileScanTask type and read only Parquet files
+-  private boolean useParquetBatchReads() {
++  boolean useParquetBatchReads() {
+     return readConf.parquetVectorizationEnabled()
+         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
+         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+index 019f391..298c25f 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
+@@ -23,6 +23,7 @@ import java.util.List;
+ import java.util.Map;
+ import java.util.function.Supplier;
+ import java.util.stream.Collectors;
++import org.apache.comet.parquet.SupportsComet;
+ import org.apache.iceberg.BlobMetadata;
+ import org.apache.iceberg.ScanTask;
+ import org.apache.iceberg.ScanTaskGroup;
+@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
+ import org.apache.iceberg.relocated.com.google.common.base.Strings;
+ import org.apache.iceberg.relocated.com.google.common.collect.Lists;
+ import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.iceberg.spark.ParquetReaderType;
+ import org.apache.iceberg.spark.Spark3Util;
+ import org.apache.iceberg.spark.SparkReadConf;
+ import org.apache.iceberg.spark.SparkSchemaUtil;
+@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
+ import org.slf4j.Logger;
+ import org.slf4j.LoggerFactory;
+ 
+-abstract class SparkScan implements Scan, SupportsReportStatistics {
++abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
+   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
+   private static final String NDV_KEY = "ndv";
+ 
+@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+       return splitSize;
+     }
+   }
++
++  @Override
++  public boolean isCometEnabled() {
++    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
++      SparkBatch batch = (SparkBatch) this.toBatch();
++      return batch.useParquetBatchReads();
++    }
++
++    return false;
++  }
+ }
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
+index 404ba72..743a11e 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
+@@ -90,6 +90,8 @@ public abstract class SparkDistributedDataScanTestBase
+         .master("local[2]")
+         .config("spark.serializer", serializer)
+         .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++        .config("spark.plugins", "org.apache.spark.CometPlugin")
++        .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+         .getOrCreate();
+   }
+ }
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
+index 659507e..ed9c4cc 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
+@@ -73,6 +73,8 @@ public class TestSparkDistributedDataScanDeletes
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
+index a218f96..919eb5c 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
+@@ -62,6 +62,8 @@ public class TestSparkDistributedDataScanFilterFiles
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
+index 2665d7b..c863caf 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
+@@ -63,6 +63,8 @@ public class TestSparkDistributedDataScanReporting
+             .master("local[2]")
+             .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
+             .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .getOrCreate();
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
+index de68351..63a281b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
+@@ -77,6 +77,8 @@ public abstract class TestBase extends SparkTestHelperBase {
+             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
+             .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
+index bc4e722..8650c79 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
+@@ -59,7 +59,11 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    spark = SparkSession.builder().master("local[2]").getOrCreate();
++    spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
+index 3a26974..ab8a08c 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
+@@ -54,7 +54,11 @@ public abstract class ScanTestBase extends AvroDataTest {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    ScanTestBase.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    ScanTestBase.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     ScanTestBase.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
+index f411920..9d09edd 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
+@@ -144,7 +144,11 @@ public class TestCompressionSettings extends CatalogTestBase {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestCompressionSettings.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestCompressionSettings.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @BeforeEach
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
+index 7404b18..6ce9485 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
+@@ -40,6 +40,7 @@ import org.apache.spark.sql.catalyst.parser.ParseException;
+ import org.apache.spark.sql.internal.SQLConf;
+ import org.junit.jupiter.api.AfterEach;
+ import org.junit.jupiter.api.BeforeEach;
++import org.junit.jupiter.api.Disabled;
+ import org.junit.jupiter.api.TestTemplate;
+ 
+ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
+@@ -248,7 +249,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
+         sql("select * from %s order by id", tableName));
+   }
+ 
+-  @TestTemplate
++  @Disabled
+   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
+     sql(
+         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
+@@ -288,7 +289,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
+     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
+   }
+ 
+-  @TestTemplate
++  @Disabled
+   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
+     removeTables();
+     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
+index c4ba96e..2021ea2 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
+@@ -75,7 +75,11 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestDataSourceOptions.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestDataSourceOptions.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
+index 3481735..1744488 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
+@@ -110,7 +110,11 @@ public class TestFilteredScan {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestFilteredScan.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestFilteredScan.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
+index 84c99a5..2d04fc4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
+@@ -93,7 +93,11 @@ public class TestForwardCompatibility {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestForwardCompatibility.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestForwardCompatibility.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
+index 7eff93d..d0ab653 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
+@@ -46,7 +46,11 @@ public class TestIcebergSpark {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestIcebergSpark.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestIcebergSpark.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
+index 9464f68..5edccc9 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
+@@ -112,7 +112,11 @@ public class TestPartitionPruning {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestPartitionPruning.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestPartitionPruning.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestPartitionPruning.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
+ 
+     String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
+index 5c218f2..96f167a 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
+@@ -107,7 +107,11 @@ public class TestPartitionValues {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestPartitionValues.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestPartitionValues.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
+index a7334a5..c23fb08 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
+@@ -87,7 +87,11 @@ public class TestSnapshotSelection {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSnapshotSelection.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSnapshotSelection.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
+index 182b1ef..79587f4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
+@@ -120,7 +120,11 @@ public class TestSparkDataFile {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkDataFile.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkDataFile.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestSparkDataFile.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
+index fb2b312..fa3d6bb 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
+@@ -96,7 +96,11 @@ public class TestSparkDataWrite {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkDataWrite.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkDataWrite.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterEach
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
+index becf6a0..a03e9aa 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
+@@ -83,7 +83,11 @@ public class TestSparkReadProjection extends TestReadProjection {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestSparkReadProjection.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestSparkReadProjection.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     ImmutableMap<String, String> config =
+         ImmutableMap.of(
+             "type", "hive",
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
+index 4f1cef5..bcab37b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
+@@ -136,6 +136,8 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
+             .config("spark.ui.liveUpdate.period", 0)
+             .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
+index baf7fa8..c0d52bc 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
+@@ -182,7 +182,9 @@ public class TestSparkReaderWithBloomFilter {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
+-            .enableHiveSupport()
++                .config("spark.plugins", "org.apache.spark.CometPlugin")
++                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++                .enableHiveSupport()
+             .getOrCreate();
+ 
+     catalog =
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
+index 17db46b..6d124b4 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
+@@ -65,7 +65,9 @@ public class TestStructuredStreaming {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.sql.shuffle.partitions", 4)
+-            .getOrCreate();
++                .config("spark.plugins", "org.apache.spark.CometPlugin")
++                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++                .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
+index 306444b..d960727 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
+@@ -75,7 +75,11 @@ public class TestTimestampWithoutZone extends TestBase {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestTimestampWithoutZone.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestTimestampWithoutZone.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+   }
+ 
+   @AfterAll
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
+index 841268a..89f30e9 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
+@@ -80,7 +80,11 @@ public class TestWriteMetricsConfig {
+ 
+   @BeforeAll
+   public static void startSpark() {
+-    TestWriteMetricsConfig.spark = SparkSession.builder().master("local[2]").getOrCreate();
++    TestWriteMetricsConfig.spark = SparkSession.builder()
++            .master("local[2]")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .getOrCreate();
+     TestWriteMetricsConfig.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
+   }
+ 
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
+index 6e09252..74e6c9b 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
+@@ -60,6 +60,8 @@ public class TestAggregatePushDown extends CatalogTestBase {
+         SparkSession.builder()
+             .master("local[2]")
+             .config("spark.sql.iceberg.aggregate_pushdown", "true")
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
+             .enableHiveSupport()
+             .getOrCreate();
+ 

From ee1a13659eb5f00441a7ff041f2abf0b27dbf66e Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 7 Aug 2025 17:26:45 -0700
Subject: [PATCH 16/27] Remove COMET_PARQUET_SCAN_IMPL=native_iceberg_compat

---
 .github/workflows/iceberg_spark_test.yml | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/.github/workflows/iceberg_spark_test.yml b/.github/workflows/iceberg_spark_test.yml
index ea821d61d0..ee76136685 100644
--- a/.github/workflows/iceberg_spark_test.yml
+++ b/.github/workflows/iceberg_spark_test.yml
@@ -75,7 +75,7 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:test \
             -Pquick=true -x javadoc
 
@@ -114,7 +114,7 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-extensions-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:test \
             -Pquick=true -x javadoc
 
@@ -153,6 +153,6 @@ jobs:
         run: |
           cd apache-iceberg
           rm -rf /root/.m2/repository/org/apache/parquet # somehow parquet cache requires cleanups
-          ENABLE_COMET=true COMET_PARQUET_SCAN_IMPL=native_iceberg_compat ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
+          ENABLE_COMET=true ./gradlew -DsparkVersions=${{ matrix.spark-version.short }} -DscalaVersion=${{ matrix.scala-version }} -DflinkVersions= -DkafkaVersions= \
             :iceberg-spark:iceberg-spark-runtime-${{ matrix.spark-version.short }}_${{ matrix.scala-version }}:integrationTest \
             -Pquick=true -x javadoc
\ No newline at end of file

From eb19d382615987ab8be89b822b74f6d523d0fd7e Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 7 Aug 2025 17:27:10 -0700
Subject: [PATCH 17/27] Update diff

---
 dev/diffs/iceberg/1.8.1.diff | 585 ++++++++++++++++++-----------------
 1 file changed, 297 insertions(+), 288 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 56a63e060b..6c646fe6d1 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -11,176 +11,8 @@ index 04ffa8f..0d88648 100644
  sqlite-jdbc = "3.48.0.0"
  testcontainers = "1.20.4"
  tez010 = "0.10.4"
-diff --git a/spark/v3.4/build.gradle b/spark/v3.4/build.gradle
-index 6eb26e8..50cefce 100644
---- a/spark/v3.4/build.gradle
-+++ b/spark/v3.4/build.gradle
-@@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
-       exclude group: 'org.roaringbitmap'
-     }
- 
--    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     implementation libs.parquet.column
-     implementation libs.parquet.hadoop
-@@ -185,7 +185,7 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
-     testImplementation libs.avro.avro
-     testImplementation libs.parquet.hadoop
-     testImplementation libs.junit.vintage.engine
--    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     // Required because we remove antlr plugin dependencies from the compile configuration, see note above
-     runtimeOnly libs.antlr.runtime
-@@ -260,6 +260,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-     integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-+    integrationImplementation project(path: ':iceberg-parquet')
-+    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
- 
-     // runtime dependencies for running Hive Catalog based integration test
-     integrationRuntimeOnly project(':iceberg-hive-metastore')
-@@ -297,8 +299,8 @@ project(":iceberg-spark:iceberg-spark-runtime-${sparkMajorVersion}_${scalaVersio
-     relocate 'org.apache.avro', 'org.apache.iceberg.shaded.org.apache.avro'
-     relocate 'avro.shaded', 'org.apache.iceberg.shaded.org.apache.avro.shaded'
-     relocate 'com.thoughtworks.paranamer', 'org.apache.iceberg.shaded.com.thoughtworks.paranamer'
--    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
--    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-+//    relocate 'org.apache.parquet', 'org.apache.iceberg.shaded.org.apache.parquet'
-+//    relocate 'shaded.parquet', 'org.apache.iceberg.shaded.org.apache.parquet.shaded'
-     relocate 'org.apache.orc', 'org.apache.iceberg.shaded.org.apache.orc'
-     relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
-     relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-index 0ca1236..87daef4 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-@@ -29,7 +29,7 @@ public class SparkSQLProperties {
- 
-   // Controls which Parquet reader implementation to use
-   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
--  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
-+  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
- 
-   // Controls whether reading/writing timestamps without timezones is allowed
-   @Deprecated
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-index 4794863..0be31c1 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
- 
- import java.io.IOException;
- import java.util.Map;
-+import org.apache.comet.CometSchemaImporter;
- import org.apache.comet.parquet.AbstractColumnReader;
- import org.apache.comet.parquet.ColumnReader;
- import org.apache.comet.parquet.TypeUtil;
- import org.apache.comet.parquet.Utils;
--import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
- import org.apache.comet.shaded.arrow.memory.RootAllocator;
- import org.apache.iceberg.parquet.VectorizedReader;
- import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
-@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
-     }
- 
-     this.importer = new CometSchemaImporter(new RootAllocator());
--    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
-+    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
-     this.initialized = true;
-   }
- 
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..108de81 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
-   // - Parquet vectorization is enabled
-   // - only primitives or metadata columns are projected
-   // - all tasks are of FileScanTask type and read only Parquet files
--  private boolean useParquetBatchReads() {
-+  protected boolean useParquetBatchReads() {
-     return readConf.parquetVectorizationEnabled()
-         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
-         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
-diff --git a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-index 019f391..298c25f 100644
---- a/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-+++ b/spark/v3.4/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-@@ -23,6 +23,7 @@ import java.util.List;
- import java.util.Map;
- import java.util.function.Supplier;
- import java.util.stream.Collectors;
-+import org.apache.comet.parquet.SupportsComet;
- import org.apache.iceberg.BlobMetadata;
- import org.apache.iceberg.ScanTask;
- import org.apache.iceberg.ScanTaskGroup;
-@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
- import org.apache.iceberg.relocated.com.google.common.base.Strings;
- import org.apache.iceberg.relocated.com.google.common.collect.Lists;
- import org.apache.iceberg.relocated.com.google.common.collect.Maps;
-+import org.apache.iceberg.spark.ParquetReaderType;
- import org.apache.iceberg.spark.Spark3Util;
- import org.apache.iceberg.spark.SparkReadConf;
- import org.apache.iceberg.spark.SparkSchemaUtil;
-@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
- import org.slf4j.Logger;
- import org.slf4j.LoggerFactory;
- 
--abstract class SparkScan implements Scan, SupportsReportStatistics {
-+abstract class SparkScan implements Scan, SupportsReportStatistics, SupportsComet {
-   private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
-   private static final String NDV_KEY = "ndv";
- 
-@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
-       return splitSize;
-     }
-   }
-+
-+  @Override
-+  public boolean isCometEnabled() {
-+    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
-+      SparkBatch batch = (SparkBatch) this.toBatch();
-+      return batch.useParquetBatchReads();
-+    }
-+
-+    return false;
-+  }
- }
-diff --git a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-index 47a0e87..531b7ce 100644
---- a/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-+++ b/spark/v3.4/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-@@ -41,6 +41,7 @@ import org.apache.spark.sql.internal.SQLConf;
- import org.junit.After;
- import org.junit.Assert;
- import org.junit.Before;
-+import org.junit.Ignore;
- import org.junit.Test;
- 
- public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-@@ -214,7 +215,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-     Assert.assertEquals(4, fields.size());
-   }
- 
--  @Test
-+  @Ignore
-   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
-     sql(
-         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
-@@ -254,7 +255,7 @@ public class TestDataFrameWriterV2 extends SparkTestBaseWithCatalog {
-     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
-   }
- 
--  @Test
-+  @Ignore
-   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
-     removeTables();
-     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
 diff --git a/spark/v3.5/build.gradle b/spark/v3.5/build.gradle
-index e2d2c7a..d23acef 100644
+index e2d2c7a..8735bf8 100644
 --- a/spark/v3.5/build.gradle
 +++ b/spark/v3.5/build.gradle
 @@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
@@ -192,13 +24,12 @@ index e2d2c7a..d23acef 100644
  
      implementation libs.parquet.column
      implementation libs.parquet.hadoop
-@@ -182,8 +182,8 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
- 
+@@ -183,7 +183,7 @@ project(":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVer
      testImplementation libs.avro.avro
      testImplementation libs.parquet.hadoop
-+    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
      testImplementation libs.awaitility
 -    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
++    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
  
      // Required because we remove antlr plugin dependencies from the compile configuration, see note above
      runtimeOnly libs.antlr.runtime
@@ -222,88 +53,124 @@ index e2d2c7a..d23acef 100644
      relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
      relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
 diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-index 578845e..9476f19 100644
+index 578845e..1d8ebc1 100644
 --- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
 +++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-@@ -57,6 +57,8 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
+@@ -57,6 +57,14 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
              .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
              .config(
                  SQLConf.ADAPTIVE_EXECUTION_ENABLED().key(), String.valueOf(RANDOM.nextBoolean()))
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .enableHiveSupport()
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-index ade19de..2e681b0 100644
+index ade19de..f4a36e5 100644
 --- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
 +++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-@@ -56,6 +56,8 @@ public class TestCallStatementParser {
+@@ -56,6 +56,14 @@ public class TestCallStatementParser {
              .master("local[2]")
              .config("spark.sql.extensions", IcebergSparkSessionExtensions.class.getName())
              .config("spark.extra.prop", "value")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .getOrCreate();
      TestCallStatementParser.parser = spark.sessionState().sqlParser();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-index 64edb10..c3de1bf 100644
+index 64edb10..d6ada97 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-@@ -179,6 +179,8 @@ public class DeleteOrphanFilesBenchmark {
+@@ -179,6 +179,14 @@ public class DeleteOrphanFilesBenchmark {
              .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", catalogWarehouse())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .master("local");
      spark = builder.getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-index a5d0456..fc90ea3 100644
+index a5d0456..4cacacb 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-@@ -392,6 +392,8 @@ public class IcebergSortCompactionBenchmark {
+@@ -392,6 +392,14 @@ public class IcebergSortCompactionBenchmark {
                  "spark.sql.catalog.spark_catalog", "org.apache.iceberg.spark.SparkSessionCatalog")
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", getCatalogWarehouse())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .master("local[*]");
      spark = builder.getOrCreate();
      Configuration sparkHadoopConf = spark.sessionState().newHadoopConf();
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-index c6794e4..a48af31 100644
+index c6794e4..91c3940 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-@@ -239,6 +239,8 @@ public class DVReaderBenchmark {
+@@ -239,6 +239,14 @@ public class DVReaderBenchmark {
              .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .master("local[*]")
              .getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-index ac74fb5..cb437da 100644
+index ac74fb5..b106e1f 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-@@ -223,6 +223,8 @@ public class DVWriterBenchmark {
+@@ -223,6 +223,14 @@ public class DVWriterBenchmark {
              .config("spark.sql.catalog.spark_catalog", SparkSessionCatalog.class.getName())
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .master("local[*]")
              .getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-index 68c537e..89cf5fa 100644
+index 68c537e..f35f539 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-@@ -94,7 +94,10 @@ public abstract class IcebergSourceBenchmark {
+@@ -94,7 +94,16 @@ public abstract class IcebergSourceBenchmark {
    }
  
    protected void setupSpark(boolean enableDictionaryEncoding) {
@@ -311,23 +178,16 @@ index 68c537e..89cf5fa 100644
 +    SparkSession.Builder builder = SparkSession.builder()
 +            .config("spark.ui.enabled", false)
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager");
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true");
      if (!enableDictionaryEncoding) {
        builder
            .config("parquet.dictionary.page.size", "1")
-diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-index d6c16bb..123a300 100644
---- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-+++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/SparkSQLProperties.java
-@@ -29,7 +29,7 @@ public class SparkSQLProperties {
- 
-   // Controls which Parquet reader implementation to use
-   public static final String PARQUET_READER_TYPE = "spark.sql.iceberg.parquet.reader-type";
--  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.ICEBERG;
-+  public static final ParquetReaderType PARQUET_READER_TYPE_DEFAULT = ParquetReaderType.COMET;
-   // Controls whether to perform the nullability check during writes
-   public static final String CHECK_NULLABILITY = "spark.sql.iceberg.check-nullability";
-   public static final boolean CHECK_NULLABILITY_DEFAULT = true;
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
 index 4794863..0be31c1 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
@@ -354,6 +214,45 @@ index 4794863..0be31c1 100644
      this.initialized = true;
    }
  
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
+index 047c963..d84ce62 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
+@@ -34,7 +34,7 @@ class CometConstantColumnReader<T> extends CometColumnReader {
+     super(field);
+     // use delegate to set constant value on the native side to be consumed by native execution.
+     setDelegate(
+-        new ConstantColumnReader(sparkType(), descriptor(), convertToSparkValue(value), false));
++        new ConstantColumnReader(sparkType(), descriptor(), convertToSparkValue(value), true));
+   }
+ 
+   @Override
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
+index 6235bfe..34f579f 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
+@@ -53,7 +53,7 @@ class CometDeleteColumnReader<T> extends CometColumnReader {
+           DataTypes.BooleanType,
+           TypeUtil.convertToParquet(
+               new StructField("_deleted", DataTypes.BooleanType, false, Metadata.empty())),
+-          false /* useDecimal128 = false */,
++          true /* useDecimal128 = true */,
+           false /* isConstant = false */);
+       this.isDeleted = new boolean[0];
+     }
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
+index bcc0e51..a779bed 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
+@@ -45,7 +45,7 @@ class CometPositionColumnReader extends CometColumnReader {
+       super(
+           DataTypes.LongType,
+           descriptor,
+-          false /* useDecimal128 = false */,
++          true /* useDecimal128 = true */,
+           false /* isConstant = false */);
+     }
+ 
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 index 11f054b..a646d86 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
@@ -412,75 +311,105 @@ index 019f391..298c25f 100644
 +  }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-index 404ba72..743a11e 100644
+index 404ba72..afcd813 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-@@ -90,6 +90,8 @@ public abstract class SparkDistributedDataScanTestBase
+@@ -90,6 +90,14 @@ public abstract class SparkDistributedDataScanTestBase
          .master("local[2]")
          .config("spark.serializer", serializer)
          .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +        .config("spark.plugins", "org.apache.spark.CometPlugin")
 +        .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++        .config("spark.comet.explainFallback.enabled", "true")
++        .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++        .config("spark.memory.offHeap.enabled", "true")
++        .config("spark.memory.offHeap.size", "10g")
++        .config("spark.comet.use.lazyMaterialization", "false")
++        .config("spark.comet.schemaEvolution.enabled", "true")
          .getOrCreate();
    }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-index 659507e..ed9c4cc 100644
+index 659507e..f796faa 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-@@ -73,6 +73,8 @@ public class TestSparkDistributedDataScanDeletes
+@@ -73,6 +73,14 @@ public class TestSparkDistributedDataScanDeletes
              .master("local[2]")
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .getOrCreate();
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-index a218f96..919eb5c 100644
+index a218f96..9ce5afa 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-@@ -62,6 +62,8 @@ public class TestSparkDistributedDataScanFilterFiles
+@@ -62,6 +62,14 @@ public class TestSparkDistributedDataScanFilterFiles
              .master("local[2]")
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .getOrCreate();
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-index 2665d7b..c863caf 100644
+index 2665d7b..bc46074 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-@@ -63,6 +63,8 @@ public class TestSparkDistributedDataScanReporting
+@@ -63,6 +63,14 @@ public class TestSparkDistributedDataScanReporting
              .master("local[2]")
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .getOrCreate();
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-index de68351..63a281b 100644
+index de68351..75d3b1a 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-@@ -77,6 +77,8 @@ public abstract class TestBase extends SparkTestHelperBase {
+@@ -77,6 +77,14 @@ public abstract class TestBase extends SparkTestHelperBase {
              .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
              .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .enableHiveSupport()
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-index bc4e722..8650c79 100644
+index bc4e722..629439f 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-@@ -59,7 +59,11 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
+@@ -59,7 +59,17 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
  
    @BeforeAll
    public static void startSpark() {
@@ -489,15 +418,21 @@ index bc4e722..8650c79 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-index 3a26974..ab8a08c 100644
+index 3a26974..4482b22 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-@@ -54,7 +54,11 @@ public abstract class ScanTestBase extends AvroDataTest {
+@@ -54,7 +54,17 @@ public abstract class ScanTestBase extends AvroDataTest {
  
    @BeforeAll
    public static void startSpark() {
@@ -506,15 +441,21 @@ index 3a26974..ab8a08c 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
      ScanTestBase.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-index f411920..9d09edd 100644
+index f411920..722688f 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-@@ -144,7 +144,11 @@ public class TestCompressionSettings extends CatalogTestBase {
+@@ -144,7 +144,17 @@ public class TestCompressionSettings extends CatalogTestBase {
  
    @BeforeAll
    public static void startSpark() {
@@ -523,45 +464,21 @@ index f411920..9d09edd 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @BeforeEach
-diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-index 7404b18..6ce9485 100644
---- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-+++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataFrameWriterV2.java
-@@ -40,6 +40,7 @@ import org.apache.spark.sql.catalyst.parser.ParseException;
- import org.apache.spark.sql.internal.SQLConf;
- import org.junit.jupiter.api.AfterEach;
- import org.junit.jupiter.api.BeforeEach;
-+import org.junit.jupiter.api.Disabled;
- import org.junit.jupiter.api.TestTemplate;
- 
- public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-@@ -248,7 +249,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-         sql("select * from %s order by id", tableName));
-   }
- 
--  @TestTemplate
-+  @Disabled
-   public void testMergeSchemaIgnoreCastingLongToInt() throws Exception {
-     sql(
-         "ALTER TABLE %s SET TBLPROPERTIES ('%s'='true')",
-@@ -288,7 +289,7 @@ public class TestDataFrameWriterV2 extends TestBaseWithCatalog {
-     assertThat(idField.type().typeId()).isEqualTo(Type.TypeID.LONG);
-   }
- 
--  @TestTemplate
-+  @Disabled
-   public void testMergeSchemaIgnoreCastingDoubleToFloat() throws Exception {
-     removeTables();
-     sql("CREATE TABLE %s (id double, data string) USING iceberg", tableName);
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-index c4ba96e..2021ea2 100644
+index c4ba96e..1481315 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-@@ -75,7 +75,11 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
+@@ -75,7 +75,17 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
  
    @BeforeAll
    public static void startSpark() {
@@ -570,15 +487,21 @@ index c4ba96e..2021ea2 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-index 3481735..1744488 100644
+index 3481735..80a2491 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-@@ -110,7 +110,11 @@ public class TestFilteredScan {
+@@ -110,7 +110,17 @@ public class TestFilteredScan {
  
    @BeforeAll
    public static void startSpark() {
@@ -587,15 +510,21 @@ index 3481735..1744488 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-index 84c99a5..2d04fc4 100644
+index 84c99a5..db4e2f9 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-@@ -93,7 +93,11 @@ public class TestForwardCompatibility {
+@@ -93,7 +93,17 @@ public class TestForwardCompatibility {
  
    @BeforeAll
    public static void startSpark() {
@@ -604,15 +533,21 @@ index 84c99a5..2d04fc4 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-index 7eff93d..d0ab653 100644
+index 7eff93d..b15819e 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-@@ -46,7 +46,11 @@ public class TestIcebergSpark {
+@@ -46,7 +46,17 @@ public class TestIcebergSpark {
  
    @BeforeAll
    public static void startSpark() {
@@ -621,15 +556,21 @@ index 7eff93d..d0ab653 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-index 9464f68..5edccc9 100644
+index 9464f68..66c3e96 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-@@ -112,7 +112,11 @@ public class TestPartitionPruning {
+@@ -112,7 +112,17 @@ public class TestPartitionPruning {
  
    @BeforeAll
    public static void startSpark() {
@@ -638,15 +579,21 @@ index 9464f68..5edccc9 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
      TestPartitionPruning.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
  
      String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-index 5c218f2..96f167a 100644
+index 5c218f2..728c3bf 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-@@ -107,7 +107,11 @@ public class TestPartitionValues {
+@@ -107,7 +107,17 @@ public class TestPartitionValues {
  
    @BeforeAll
    public static void startSpark() {
@@ -655,15 +602,21 @@ index 5c218f2..96f167a 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-index a7334a5..c23fb08 100644
+index a7334a5..31cedb2 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-@@ -87,7 +87,11 @@ public class TestSnapshotSelection {
+@@ -87,7 +87,17 @@ public class TestSnapshotSelection {
  
    @BeforeAll
    public static void startSpark() {
@@ -672,15 +625,21 @@ index a7334a5..c23fb08 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-index 182b1ef..79587f4 100644
+index 182b1ef..e59e632 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-@@ -120,7 +120,11 @@ public class TestSparkDataFile {
+@@ -120,7 +120,17 @@ public class TestSparkDataFile {
  
    @BeforeAll
    public static void startSpark() {
@@ -689,15 +648,21 @@ index 182b1ef..79587f4 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
      TestSparkDataFile.sparkContext = JavaSparkContext.fromSparkContext(spark.sparkContext());
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-index fb2b312..fa3d6bb 100644
+index fb2b312..a3a6502 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-@@ -96,7 +96,11 @@ public class TestSparkDataWrite {
+@@ -96,7 +96,17 @@ public class TestSparkDataWrite {
  
    @BeforeAll
    public static void startSpark() {
@@ -706,15 +671,21 @@ index fb2b312..fa3d6bb 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-index becf6a0..a03e9aa 100644
+index becf6a0..a4f1629 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-@@ -83,7 +83,11 @@ public class TestSparkReadProjection extends TestReadProjection {
+@@ -83,7 +83,17 @@ public class TestSparkReadProjection extends TestReadProjection {
  
    @BeforeAll
    public static void startSpark() {
@@ -723,58 +694,78 @@ index becf6a0..a03e9aa 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
      ImmutableMap<String, String> config =
          ImmutableMap.of(
              "type", "hive",
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-index 4f1cef5..bcab37b 100644
+index 4f1cef5..6e64607 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-@@ -136,6 +136,8 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
+@@ -136,6 +136,14 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
              .config("spark.ui.liveUpdate.period", 0)
              .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .enableHiveSupport()
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-index baf7fa8..c0d52bc 100644
+index baf7fa8..fb07e3a 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-@@ -182,7 +182,9 @@ public class TestSparkReaderWithBloomFilter {
+@@ -182,6 +182,14 @@ public class TestSparkReaderWithBloomFilter {
          SparkSession.builder()
              .master("local[2]")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
--            .enableHiveSupport()
-+                .config("spark.plugins", "org.apache.spark.CometPlugin")
-+                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+                .enableHiveSupport()
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
+             .enableHiveSupport()
              .getOrCreate();
  
-     catalog =
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-index 17db46b..6d124b4 100644
+index 17db46b..625ae17 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-@@ -65,7 +65,9 @@ public class TestStructuredStreaming {
+@@ -65,6 +65,14 @@ public class TestStructuredStreaming {
          SparkSession.builder()
              .master("local[2]")
              .config("spark.sql.shuffle.partitions", 4)
--            .getOrCreate();
-+                .config("spark.plugins", "org.apache.spark.CometPlugin")
-+                .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
-+                .getOrCreate();
++            .config("spark.plugins", "org.apache.spark.CometPlugin")
++            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
+             .getOrCreate();
    }
  
-   @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-index 306444b..d960727 100644
+index 306444b..af431e3 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-@@ -75,7 +75,11 @@ public class TestTimestampWithoutZone extends TestBase {
+@@ -75,7 +75,17 @@ public class TestTimestampWithoutZone extends TestBase {
  
    @BeforeAll
    public static void startSpark() {
@@ -783,15 +774,21 @@ index 306444b..d960727 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
    }
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-index 841268a..89f30e9 100644
+index 841268a..9cffd45 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-@@ -80,7 +80,11 @@ public class TestWriteMetricsConfig {
+@@ -80,7 +80,17 @@ public class TestWriteMetricsConfig {
  
    @BeforeAll
    public static void startSpark() {
@@ -800,20 +797,32 @@ index 841268a..89f30e9 100644
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
 +            .getOrCreate();
      TestWriteMetricsConfig.sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-index 6e09252..74e6c9b 100644
+index 6e09252..30026e9 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-@@ -60,6 +60,8 @@ public class TestAggregatePushDown extends CatalogTestBase {
+@@ -60,6 +60,14 @@ public class TestAggregatePushDown extends CatalogTestBase {
          SparkSession.builder()
              .master("local[2]")
              .config("spark.sql.iceberg.aggregate_pushdown", "true")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.explainFallback.enabled", "true")
++            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
++            .config("spark.memory.offHeap.enabled", "true")
++            .config("spark.memory.offHeap.size", "10g")
++            .config("spark.comet.use.lazyMaterialization", "false")
++            .config("spark.comet.schemaEvolution.enabled", "true")
              .enableHiveSupport()
              .getOrCreate();
  

From 20560437b5b53557993434dcfd02a3e70540bd37 Mon Sep 17 00:00:00 2001
From: Andy Grove <agrove@apache.org>
Date: Tue, 12 Aug 2025 13:14:59 -0600
Subject: [PATCH 18/27] quick fix

---
 native/core/src/execution/planner.rs | 10 ++++++++--
 1 file changed, 8 insertions(+), 2 deletions(-)

diff --git a/native/core/src/execution/planner.rs b/native/core/src/execution/planner.rs
index 7fa7bfe905..1d568aa19c 100644
--- a/native/core/src/execution/planner.rs
+++ b/native/core/src/execution/planner.rs
@@ -1279,10 +1279,16 @@ impl PhysicalPlanner {
                 // SortExec fails in some cases if we do not unpack dictionary-encoded arrays, and
                 // it would be more efficient if we could avoid that.
                 // https://github.com/apache/datafusion-comet/issues/963
-                let child_copied = Self::wrap_in_copy_exec(Arc::clone(&child.native_plan));
+
+                // TODO optimize this so that we only add the CopyExec if needed
+                // https://github.com/apache/datafusion-comet/issues/2131
+                let child_copied = Arc::new(CopyExec::new(
+                    Arc::clone(&child.native_plan),
+                    CopyMode::UnpackOrDeepCopy,
+                ));
 
                 let sort = Arc::new(
-                    SortExec::new(LexOrdering::new(exprs?).unwrap(), Arc::clone(&child_copied))
+                    SortExec::new(LexOrdering::new(exprs?).unwrap(), child_copied)
                         .with_fetch(fetch),
                 );
 

From 589124974e9a3e90ae81449ec31941af54f310c1 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 12 Aug 2025 14:47:53 -0700
Subject: [PATCH 19/27] Port https://github.com/apache/iceberg/pull/13786

---
 dev/diffs/iceberg/1.8.1.diff | 884 +++++++++++++++++++++++++++++++++--
 1 file changed, 858 insertions(+), 26 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 6c646fe6d1..9c97f66dae 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1,8 +1,34 @@
+diff --git a/build.gradle b/build.gradle
+index 7327b38..7967109 100644
+--- a/build.gradle
++++ b/build.gradle
+@@ -780,6 +780,13 @@ project(':iceberg-parquet') {
+     implementation project(':iceberg-core')
+     implementation project(':iceberg-common')
+ 
++    implementation("org.apache.datafusion:comet-spark-spark${sparkVersionsString}_${scalaVersion}:${libs.versions.comet.get()}") {
++      exclude group: 'org.apache.arrow'
++      exclude group: 'org.apache.parquet'
++      exclude group: 'org.apache.spark'
++      exclude group: 'org.apache.iceberg'
++    }
++
+     implementation(libs.parquet.avro) {
+       exclude group: 'org.apache.avro', module: 'avro'
+       // already shaded by Parquet
 diff --git a/gradle/libs.versions.toml b/gradle/libs.versions.toml
-index 04ffa8f..0d88648 100644
+index 04ffa8f..cc0099c 100644
 --- a/gradle/libs.versions.toml
 +++ b/gradle/libs.versions.toml
-@@ -81,7 +81,7 @@ slf4j = "2.0.16"
+@@ -34,6 +34,7 @@ azuresdk-bom = "1.2.31"
+ awssdk-s3accessgrants = "2.3.0"
+ caffeine = "2.9.3"
+ calcite = "1.10.0"
++comet = "0.10.0-SNAPSHOT"
+ datasketches = "6.2.0"
+ delta-standalone = "3.3.0"
+ delta-spark = "3.3.0"
+@@ -81,7 +82,7 @@ slf4j = "2.0.16"
  snowflake-jdbc = "3.22.0"
  spark-hive33 = "3.3.4"
  spark-hive34 = "3.4.4"
@@ -11,8 +37,628 @@ index 04ffa8f..0d88648 100644
  sqlite-jdbc = "3.48.0.0"
  testcontainers = "1.20.4"
  tez010 = "0.10.4"
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
+new file mode 100644
+index 0000000..ddf6c7d
+--- /dev/null
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
+@@ -0,0 +1,255 @@
++/*
++ * Licensed to the Apache Software Foundation (ASF) under one
++ * or more contributor license agreements.  See the NOTICE file
++ * distributed with this work for additional information
++ * regarding copyright ownership.  The ASF licenses this file
++ * to you under the Apache License, Version 2.0 (the
++ * "License"); you may not use this file except in compliance
++ * with the License.  You may obtain a copy of the License at
++ *
++ *   http://www.apache.org/licenses/LICENSE-2.0
++ *
++ * Unless required by applicable law or agreed to in writing,
++ * software distributed under the License is distributed on an
++ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
++ * KIND, either express or implied.  See the License for the
++ * specific language governing permissions and limitations
++ * under the License.
++ */
++package org.apache.iceberg.parquet;
++
++import java.util.Map;
++import org.apache.comet.parquet.ParquetColumnSpec;
++import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.parquet.column.ColumnDescriptor;
++import org.apache.parquet.schema.LogicalTypeAnnotation;
++import org.apache.parquet.schema.PrimitiveType;
++import org.apache.parquet.schema.Type;
++import org.apache.parquet.schema.Types;
++
++public class CometTypeUtils {
++
++  private CometTypeUtils() {}
++
++  public static ParquetColumnSpec descriptorToParquetColumnSpec(ColumnDescriptor descriptor) {
++
++    String[] path = descriptor.getPath();
++    PrimitiveType primitiveType = descriptor.getPrimitiveType();
++    String physicalType = primitiveType.getPrimitiveTypeName().name();
++
++    int typeLength =
++        primitiveType.getPrimitiveTypeName() == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY
++            ? primitiveType.getTypeLength()
++            : 0;
++
++    boolean isRepeated = primitiveType.getRepetition() == Type.Repetition.REPEATED;
++
++    // ToDo: extract this into a Util method
++    String logicalTypeName = null;
++    Map<String, String> logicalTypeParams = Maps.newHashMap();
++    LogicalTypeAnnotation logicalType = primitiveType.getLogicalTypeAnnotation();
++
++    if (logicalType != null) {
++      logicalTypeName = logicalType.getClass().getSimpleName();
++
++      // Handle specific logical types
++      if (logicalType instanceof LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.DecimalLogicalTypeAnnotation decimal =
++            (LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("precision", String.valueOf(decimal.getPrecision()));
++        logicalTypeParams.put("scale", String.valueOf(decimal.getScale()));
++      } else if (logicalType instanceof LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.TimestampLogicalTypeAnnotation timestamp =
++            (LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(timestamp.isAdjustedToUTC()));
++        logicalTypeParams.put("unit", timestamp.getUnit().name());
++      } else if (logicalType instanceof LogicalTypeAnnotation.TimeLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.TimeLogicalTypeAnnotation time =
++            (LogicalTypeAnnotation.TimeLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(time.isAdjustedToUTC()));
++        logicalTypeParams.put("unit", time.getUnit().name());
++      } else if (logicalType instanceof LogicalTypeAnnotation.IntLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.IntLogicalTypeAnnotation intType =
++            (LogicalTypeAnnotation.IntLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isSigned", String.valueOf(intType.isSigned()));
++        logicalTypeParams.put("bitWidth", String.valueOf(intType.getBitWidth()));
++      }
++    }
++
++    return new ParquetColumnSpec(
++        1, // ToDo: pass in the correct id
++        path,
++        physicalType,
++        typeLength,
++        isRepeated,
++        descriptor.getMaxDefinitionLevel(),
++        descriptor.getMaxRepetitionLevel(),
++        logicalTypeName,
++        logicalTypeParams);
++  }
++
++  public static ColumnDescriptor buildColumnDescriptor(ParquetColumnSpec columnSpec) {
++    PrimitiveType.PrimitiveTypeName primType =
++        PrimitiveType.PrimitiveTypeName.valueOf(columnSpec.getPhysicalType());
++
++    Type.Repetition repetition;
++    if (columnSpec.getMaxRepetitionLevel() > 0) {
++      repetition = Type.Repetition.REPEATED;
++    } else if (columnSpec.getMaxDefinitionLevel() > 0) {
++      repetition = Type.Repetition.OPTIONAL;
++    } else {
++      repetition = Type.Repetition.REQUIRED;
++    }
++
++    String name = columnSpec.getPath()[columnSpec.getPath().length - 1];
++    // Reconstruct the logical type from parameters
++    LogicalTypeAnnotation logicalType = null;
++    if (columnSpec.getLogicalTypeName() != null) {
++      logicalType =
++          reconstructLogicalType(
++              columnSpec.getLogicalTypeName(), columnSpec.getLogicalTypeParams());
++    }
++
++    PrimitiveType primitiveType;
++    if (primType == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY) {
++      primitiveType =
++          org.apache.parquet.schema.Types.primitive(primType, repetition)
++              .length(columnSpec.getTypeLength())
++              .as(logicalType)
++              .id(columnSpec.getFieldId())
++              .named(name);
++    } else {
++      primitiveType =
++          Types.primitive(primType, repetition)
++              .as(logicalType)
++              .id(columnSpec.getFieldId())
++              .named(name);
++    }
++
++    return new ColumnDescriptor(
++        columnSpec.getPath(),
++        primitiveType,
++        columnSpec.getMaxRepetitionLevel(),
++        columnSpec.getMaxDefinitionLevel());
++  }
++
++  private static LogicalTypeAnnotation reconstructLogicalType(
++      String logicalTypeName, java.util.Map<String, String> params) {
++
++    switch (logicalTypeName) {
++        // MAP
++      case "MapLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.mapType();
++
++        // LIST
++      case "ListLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.listType();
++
++        // STRING
++      case "StringLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.stringType();
++
++        // MAP_KEY_VALUE
++      case "MapKeyValueLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.MapKeyValueTypeAnnotation.getInstance();
++
++        // ENUM
++      case "EnumLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.enumType();
++
++        // DECIMAL
++      case "DecimalLogicalTypeAnnotation":
++        if (!params.containsKey("scale") || !params.containsKey("precision")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for DecimalLogicalTypeAnnotation: " + params);
++        }
++        int scale = Integer.parseInt(params.get("scale"));
++        int precision = Integer.parseInt(params.get("precision"));
++        return LogicalTypeAnnotation.decimalType(scale, precision);
++
++        // DATE
++      case "DateLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.dateType();
++
++        // TIME
++      case "TimeLogicalTypeAnnotation":
++        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for TimeLogicalTypeAnnotation: " + params);
++        }
++
++        boolean isUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
++        String timeUnitStr = params.get("unit");
++
++        LogicalTypeAnnotation.TimeUnit timeUnit;
++        switch (timeUnitStr) {
++          case "MILLIS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.MILLIS;
++            break;
++          case "MICROS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.MICROS;
++            break;
++          case "NANOS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.NANOS;
++            break;
++          default:
++            throw new IllegalArgumentException("Unknown time unit: " + timeUnitStr);
++        }
++        return LogicalTypeAnnotation.timeType(isUTC, timeUnit);
++
++        // TIMESTAMP
++      case "TimestampLogicalTypeAnnotation":
++        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for TimestampLogicalTypeAnnotation: " + params);
++        }
++        boolean isAdjustedToUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
++        String unitStr = params.get("unit");
++
++        LogicalTypeAnnotation.TimeUnit unit;
++        switch (unitStr) {
++          case "MILLIS":
++            unit = LogicalTypeAnnotation.TimeUnit.MILLIS;
++            break;
++          case "MICROS":
++            unit = LogicalTypeAnnotation.TimeUnit.MICROS;
++            break;
++          case "NANOS":
++            unit = LogicalTypeAnnotation.TimeUnit.NANOS;
++            break;
++          default:
++            throw new IllegalArgumentException("Unknown timestamp unit: " + unitStr);
++        }
++        return LogicalTypeAnnotation.timestampType(isAdjustedToUTC, unit);
++
++        // INTEGER
++      case "IntLogicalTypeAnnotation":
++        if (!params.containsKey("isSigned") || !params.containsKey("bitWidth")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for IntLogicalTypeAnnotation: " + params);
++        }
++        boolean isSigned = Boolean.parseBoolean(params.get("isSigned"));
++        int bitWidth = Integer.parseInt(params.get("bitWidth"));
++        return LogicalTypeAnnotation.intType(bitWidth, isSigned);
++
++        // JSON
++      case "JsonLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.jsonType();
++
++        // BSON
++      case "BsonLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.bsonType();
++
++        // UUID
++      case "UUIDLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.uuidType();
++
++        // INTERVAL
++      case "IntervalLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.IntervalLogicalTypeAnnotation.getInstance();
++
++      default:
++        throw new IllegalArgumentException("Unknown logical type: " + logicalTypeName);
++    }
++  }
++}
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
+new file mode 100644
+index 0000000..88b195b
+--- /dev/null
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
+@@ -0,0 +1,255 @@
++/*
++ * Licensed to the Apache Software Foundation (ASF) under one
++ * or more contributor license agreements.  See the NOTICE file
++ * distributed with this work for additional information
++ * regarding copyright ownership.  The ASF licenses this file
++ * to you under the Apache License, Version 2.0 (the
++ * "License"); you may not use this file except in compliance
++ * with the License.  You may obtain a copy of the License at
++ *
++ *   http://www.apache.org/licenses/LICENSE-2.0
++ *
++ * Unless required by applicable law or agreed to in writing,
++ * software distributed under the License is distributed on an
++ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
++ * KIND, either express or implied.  See the License for the
++ * specific language governing permissions and limitations
++ * under the License.
++ */
++package org.apache.iceberg.parquet;
++
++import java.io.IOException;
++import java.io.UncheckedIOException;
++import java.nio.ByteBuffer;
++import java.util.List;
++import java.util.Map;
++import java.util.NoSuchElementException;
++import java.util.function.Function;
++import org.apache.comet.parquet.FileReader;
++import org.apache.comet.parquet.ParquetColumnSpec;
++import org.apache.comet.parquet.ReadOptions;
++import org.apache.comet.parquet.RowGroupReader;
++import org.apache.comet.parquet.WrappedInputFile;
++import org.apache.hadoop.conf.Configuration;
++import org.apache.iceberg.Schema;
++import org.apache.iceberg.exceptions.RuntimeIOException;
++import org.apache.iceberg.expressions.Expression;
++import org.apache.iceberg.expressions.Expressions;
++import org.apache.iceberg.io.CloseableGroup;
++import org.apache.iceberg.io.CloseableIterable;
++import org.apache.iceberg.io.CloseableIterator;
++import org.apache.iceberg.io.InputFile;
++import org.apache.iceberg.mapping.NameMapping;
++import org.apache.iceberg.relocated.com.google.common.collect.Lists;
++import org.apache.iceberg.util.ByteBuffers;
++import org.apache.parquet.ParquetReadOptions;
++import org.apache.parquet.column.ColumnDescriptor;
++import org.apache.parquet.hadoop.metadata.ColumnChunkMetaData;
++import org.apache.parquet.hadoop.metadata.ColumnPath;
++import org.apache.parquet.schema.MessageType;
++
++public class CometVectorizedParquetReader<T> extends CloseableGroup
++    implements CloseableIterable<T> {
++  private final InputFile input;
++  private final ParquetReadOptions options;
++  private final Schema expectedSchema;
++  private final Function<MessageType, VectorizedReader<?>> batchReaderFunc;
++  private final Expression filter;
++  private final boolean reuseContainers;
++  private final boolean caseSensitive;
++  private final int batchSize;
++  private final NameMapping nameMapping;
++  private final Map<String, String> properties;
++  private Long start = null;
++  private Long length = null;
++  private ByteBuffer fileEncryptionKey = null;
++  private ByteBuffer fileAADPrefix = null;
++
++  public CometVectorizedParquetReader(
++      InputFile input,
++      Schema expectedSchema,
++      ParquetReadOptions options,
++      Function<MessageType, VectorizedReader<?>> readerFunc,
++      NameMapping nameMapping,
++      Expression filter,
++      boolean reuseContainers,
++      boolean caseSensitive,
++      int maxRecordsPerBatch,
++      Map<String, String> properties,
++      Long start,
++      Long length,
++      ByteBuffer fileEncryptionKey,
++      ByteBuffer fileAADPrefix) {
++    this.input = input;
++    this.expectedSchema = expectedSchema;
++    this.options = options;
++    this.batchReaderFunc = readerFunc;
++    // replace alwaysTrue with null to avoid extra work evaluating a trivial filter
++    this.filter = filter == Expressions.alwaysTrue() ? null : filter;
++    this.reuseContainers = reuseContainers;
++    this.caseSensitive = caseSensitive;
++    this.batchSize = maxRecordsPerBatch;
++    this.nameMapping = nameMapping;
++    this.properties = properties;
++    this.start = start;
++    this.length = length;
++    this.fileEncryptionKey = fileEncryptionKey;
++    this.fileAADPrefix = fileAADPrefix;
++  }
++
++  private ReadConf conf = null;
++
++  private ReadConf init() {
++    if (conf == null) {
++      ReadConf readConf =
++          new ReadConf(
++              input,
++              options,
++              expectedSchema,
++              filter,
++              null,
++              batchReaderFunc,
++              nameMapping,
++              reuseContainers,
++              caseSensitive,
++              batchSize);
++      this.conf = readConf.copy();
++      return readConf;
++    }
++    return conf;
++  }
++
++  @Override
++  public CloseableIterator<T> iterator() {
++    FileIterator<T> iter =
++        new FileIterator<>(init(), properties, start, length, fileEncryptionKey, fileAADPrefix);
++    addCloseable(iter);
++    return iter;
++  }
++
++  private static class FileIterator<T> implements CloseableIterator<T> {
++    // private final ParquetFileReader reader;
++    private final boolean[] shouldSkip;
++    private final VectorizedReader<T> model;
++    private final long totalValues;
++    private final int batchSize;
++    private final List<Map<ColumnPath, ColumnChunkMetaData>> columnChunkMetadata;
++    private final boolean reuseContainers;
++    private int nextRowGroup = 0;
++    private long nextRowGroupStart = 0;
++    private long valuesRead = 0;
++    private T last = null;
++    private final FileReader cometReader;
++
++    FileIterator(
++        ReadConf conf,
++        Map<String, String> properties,
++        Long start,
++        Long length,
++        ByteBuffer fileEncryptionKey,
++        ByteBuffer fileAADPrefix) {
++      this.shouldSkip = conf.shouldSkip();
++      this.totalValues = conf.totalValues();
++      this.reuseContainers = conf.reuseContainers();
++      this.model = conf.vectorizedModel();
++      this.batchSize = conf.batchSize();
++      this.model.setBatchSize(this.batchSize);
++      this.columnChunkMetadata = conf.columnChunkMetadataForRowGroups();
++      this.cometReader =
++          newCometReader(
++              conf.file(),
++              conf.projection(),
++              properties,
++              start,
++              length,
++              fileEncryptionKey,
++              fileAADPrefix);
++    }
++
++    private FileReader newCometReader(
++        InputFile file,
++        MessageType projection,
++        Map<String, String> properties,
++        Long start,
++        Long length,
++        ByteBuffer fileEncryptionKey,
++        ByteBuffer fileAADPrefix) {
++      try {
++        ReadOptions cometOptions = ReadOptions.builder(new Configuration()).build();
++
++        FileReader fileReader =
++            new FileReader(
++                new WrappedInputFile(file),
++                cometOptions,
++                properties,
++                start,
++                length,
++                ByteBuffers.toByteArray(fileEncryptionKey),
++                ByteBuffers.toByteArray(fileAADPrefix));
++
++        List<ColumnDescriptor> columnDescriptors = projection.getColumns();
++
++        List<ParquetColumnSpec> specs = Lists.newArrayList();
++
++        for (ColumnDescriptor descriptor : columnDescriptors) {
++          ParquetColumnSpec spec = CometTypeUtils.descriptorToParquetColumnSpec(descriptor);
++          specs.add(spec);
++        }
++
++        fileReader.setRequestedSchemaFromSpecs(specs);
++        return fileReader;
++      } catch (IOException e) {
++        throw new UncheckedIOException("Failed to open Parquet file: " + file.location(), e);
++      }
++    }
++
++    @Override
++    public boolean hasNext() {
++      return valuesRead < totalValues;
++    }
++
++    @Override
++    public T next() {
++      if (!hasNext()) {
++        throw new NoSuchElementException();
++      }
++      if (valuesRead >= nextRowGroupStart) {
++        advance();
++      }
++
++      // batchSize is an integer, so casting to integer is safe
++      int numValuesToRead = (int) Math.min(nextRowGroupStart - valuesRead, batchSize);
++      if (reuseContainers) {
++        this.last = model.read(last, numValuesToRead);
++      } else {
++        this.last = model.read(null, numValuesToRead);
++      }
++      valuesRead += numValuesToRead;
++
++      return last;
++    }
++
++    private void advance() {
++      while (shouldSkip[nextRowGroup]) {
++        nextRowGroup += 1;
++        cometReader.skipNextRowGroup();
++      }
++      RowGroupReader pages;
++      try {
++        pages = cometReader.readNextRowGroup();
++      } catch (IOException e) {
++        throw new RuntimeIOException(e);
++      }
++
++      model.setRowGroupInfo(pages, columnChunkMetadata.get(nextRowGroup));
++      nextRowGroupStart += pages.getRowCount();
++      nextRowGroup += 1;
++    }
++
++    @Override
++    public void close() throws IOException {
++      model.close();
++      cometReader.close();
++    }
++  }
++}
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java b/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
+index 2c37a52..503dbd6 100644
+--- a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
+@@ -1075,6 +1075,7 @@ public class Parquet {
+     private NameMapping nameMapping = null;
+     private ByteBuffer fileEncryptionKey = null;
+     private ByteBuffer fileAADPrefix = null;
++    private boolean isComet;
+ 
+     private ReadBuilder(InputFile file) {
+       this.file = file;
+@@ -1172,6 +1173,11 @@ public class Parquet {
+       return this;
+     }
+ 
++    public ReadBuilder enableComet(boolean enableComet) {
++      this.isComet = enableComet;
++      return this;
++    }
++
+     public ReadBuilder withFileEncryptionKey(ByteBuffer encryptionKey) {
+       this.fileEncryptionKey = encryptionKey;
+       return this;
+@@ -1182,7 +1188,7 @@ public class Parquet {
+       return this;
+     }
+ 
+-    @SuppressWarnings({"unchecked", "checkstyle:CyclomaticComplexity"})
++    @SuppressWarnings({"unchecked", "checkstyle:CyclomaticComplexity", "MethodLength"})
+     public <D> CloseableIterable<D> build() {
+       FileDecryptionProperties fileDecryptionProperties = null;
+       if (fileEncryptionKey != null) {
+@@ -1234,16 +1240,35 @@ public class Parquet {
+         }
+ 
+         if (batchedReaderFunc != null) {
+-          return new VectorizedParquetReader<>(
+-              file,
+-              schema,
+-              options,
+-              batchedReaderFunc,
+-              mapping,
+-              filter,
+-              reuseContainers,
+-              caseSensitive,
+-              maxRecordsPerBatch);
++          if (isComet) {
++            LOG.info("Comet enabled");
++            return new CometVectorizedParquetReader<>(
++                    file,
++                    schema,
++                    options,
++                    batchedReaderFunc,
++                    mapping,
++                    filter,
++                    reuseContainers,
++                    caseSensitive,
++                    maxRecordsPerBatch,
++                    properties,
++                    start,
++                    length,
++                    fileEncryptionKey,
++                    fileAADPrefix);
++          } else {
++            return new VectorizedParquetReader<>(
++                    file,
++                    schema,
++                    options,
++                    batchedReaderFunc,
++                    mapping,
++                    filter,
++                    reuseContainers,
++                    caseSensitive,
++                    maxRecordsPerBatch);
++          }
+         } else {
+           return new org.apache.iceberg.parquet.ParquetReader<>(
+               file, schema, options, readerFunc, mapping, filter, reuseContainers, caseSensitive);
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/ReadConf.java b/parquet/src/main/java/org/apache/iceberg/parquet/ReadConf.java
+index 1fb2372..142e5fb 100644
+--- a/parquet/src/main/java/org/apache/iceberg/parquet/ReadConf.java
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/ReadConf.java
+@@ -157,6 +157,14 @@ class ReadConf<T> {
+     return newReader;
+   }
+ 
++  InputFile file() {
++    return file;
++  }
++
++  MessageType projection() {
++    return projection;
++  }
++
+   ParquetValueReader<T> model() {
+     return model;
+   }
 diff --git a/spark/v3.5/build.gradle b/spark/v3.5/build.gradle
-index e2d2c7a..8735bf8 100644
+index e2d2c7a..f64232d 100644
 --- a/spark/v3.5/build.gradle
 +++ b/spark/v3.5/build.gradle
 @@ -75,7 +75,7 @@ project(":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}") {
@@ -20,7 +666,7 @@ index e2d2c7a..8735bf8 100644
      }
  
 -    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
++    compileOnly "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:${libs.versions.comet.get()}"
  
      implementation libs.parquet.column
      implementation libs.parquet.hadoop
@@ -29,7 +675,7 @@ index e2d2c7a..8735bf8 100644
      testImplementation libs.parquet.hadoop
      testImplementation libs.awaitility
 -    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.5.0"
-+    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
++    testImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:${libs.versions.comet.get()}"
  
      // Required because we remove antlr plugin dependencies from the compile configuration, see note above
      runtimeOnly libs.antlr.runtime
@@ -37,7 +683,7 @@ index e2d2c7a..8735bf8 100644
      integrationImplementation project(path: ':iceberg-hive-metastore', configuration: 'testArtifacts')
      integrationImplementation project(path: ":iceberg-spark:iceberg-spark-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
      integrationImplementation project(path: ":iceberg-spark:iceberg-spark-extensions-${sparkMajorVersion}_${scalaVersion}", configuration: 'testArtifacts')
-+    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:0.10.0-SNAPSHOT"
++    integrationImplementation "org.apache.datafusion:comet-spark-spark${sparkMajorVersion}_${scalaVersion}:${libs.versions.comet.get()}"
  
      // runtime dependencies for running Hive Catalog based integration test
      integrationRuntimeOnly project(':iceberg-hive-metastore')
@@ -189,72 +835,258 @@ index 68c537e..f35f539 100644
        builder
            .config("parquet.dictionary.page.size", "1")
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-index 4794863..0be31c1 100644
+index 4794863..8bb508f 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnReader.java
-@@ -20,11 +20,11 @@ package org.apache.iceberg.spark.data.vectorized;
+@@ -20,21 +20,25 @@ package org.apache.iceberg.spark.data.vectorized;
  
  import java.io.IOException;
  import java.util.Map;
++import org.apache.comet.CometConf;
 +import org.apache.comet.CometSchemaImporter;
  import org.apache.comet.parquet.AbstractColumnReader;
  import org.apache.comet.parquet.ColumnReader;
++import org.apache.comet.parquet.ParquetColumnSpec;
++import org.apache.comet.parquet.RowGroupReader;
  import org.apache.comet.parquet.TypeUtil;
  import org.apache.comet.parquet.Utils;
 -import org.apache.comet.shaded.arrow.c.CometSchemaImporter;
  import org.apache.comet.shaded.arrow.memory.RootAllocator;
++import org.apache.iceberg.parquet.CometTypeUtils;
  import org.apache.iceberg.parquet.VectorizedReader;
  import org.apache.iceberg.relocated.com.google.common.base.Preconditions;
-@@ -96,7 +96,7 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
+ import org.apache.iceberg.spark.SparkSchemaUtil;
+ import org.apache.iceberg.types.Types;
+ import org.apache.parquet.column.ColumnDescriptor;
+ import org.apache.parquet.column.page.PageReadStore;
+-import org.apache.parquet.column.page.PageReader;
+ import org.apache.parquet.hadoop.metadata.ColumnChunkMetaData;
+ import org.apache.parquet.hadoop.metadata.ColumnPath;
++import org.apache.spark.sql.internal.SQLConf;
+ import org.apache.spark.sql.types.DataType;
+ import org.apache.spark.sql.types.Metadata;
+ import org.apache.spark.sql.types.StructField;
+@@ -46,23 +50,28 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
+ 
+   private final ColumnDescriptor descriptor;
+   private final DataType sparkType;
++  private final int fieldId;
+ 
+   // The delegated ColumnReader from Comet side
+   private AbstractColumnReader delegate;
+   private boolean initialized = false;
+   private int batchSize = DEFAULT_BATCH_SIZE;
+   private CometSchemaImporter importer;
++  private ParquetColumnSpec spec;
+ 
+-  CometColumnReader(DataType sparkType, ColumnDescriptor descriptor) {
++  CometColumnReader(DataType sparkType, ColumnDescriptor descriptor, int fieldId) {
+     this.sparkType = sparkType;
+     this.descriptor = descriptor;
++    this.fieldId = fieldId;
+   }
+ 
+   CometColumnReader(Types.NestedField field) {
+     DataType dataType = SparkSchemaUtil.convert(field.type());
+     StructField structField = new StructField(field.name(), dataType, false, Metadata.empty());
+     this.sparkType = dataType;
+-    this.descriptor = TypeUtil.convertToParquet(structField);
++    this.descriptor =
++        CometTypeUtils.buildColumnDescriptor(TypeUtil.convertToParquetSpec(structField));
++    this.fieldId = field.fieldId();
+   }
+ 
+   public AbstractColumnReader delegate() {
+@@ -96,7 +105,26 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
      }
  
      this.importer = new CometSchemaImporter(new RootAllocator());
 -    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, false, false);
-+    this.delegate = Utils.getColumnReader(sparkType, descriptor, importer, batchSize, true, false);
++
++    spec = CometTypeUtils.descriptorToParquetColumnSpec(descriptor);
++
++    boolean useLegacyTime =
++        Boolean.parseBoolean(
++            SQLConf.get()
++                .getConfString(
++                    CometConf.COMET_EXCEPTION_ON_LEGACY_DATE_TIMESTAMP().key(), "false"));
++    boolean useLazyMaterialization =
++        Boolean.parseBoolean(
++            SQLConf.get().getConfString(CometConf.COMET_USE_LAZY_MATERIALIZATION().key(), "false"));
++    this.delegate =
++        Utils.getColumnReader(
++            sparkType,
++            spec,
++            importer,
++            batchSize,
++            true, // Comet sets this to true for native execution
++            useLazyMaterialization,
++            useLegacyTime);
      this.initialized = true;
    }
  
+@@ -115,9 +143,9 @@ class CometColumnReader implements VectorizedReader<ColumnVector> {
+    * <p>NOTE: this should be called before reading a new Parquet column chunk, and after {@link
+    * CometColumnReader#reset} is called.
+    */
+-  public void setPageReader(PageReader pageReader) throws IOException {
++  public void setPageReader(RowGroupReader pageStore) throws IOException {
+     Preconditions.checkState(initialized, "Invalid state: 'reset' should be called first");
+-    ((ColumnReader) delegate).setPageReader(pageReader);
++    ((ColumnReader) delegate).setRowGroupReader(pageStore, spec);
+   }
+ 
+   @Override
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnarBatchReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnarBatchReader.java
+index 1440e5d..fc6b283 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnarBatchReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometColumnarBatchReader.java
+@@ -23,7 +23,8 @@ import java.io.UncheckedIOException;
+ import java.util.List;
+ import java.util.Map;
+ import org.apache.comet.parquet.AbstractColumnReader;
+-import org.apache.comet.parquet.BatchReader;
++import org.apache.comet.parquet.IcebergCometBatchReader;
++import org.apache.comet.parquet.RowGroupReader;
+ import org.apache.iceberg.Schema;
+ import org.apache.iceberg.data.DeleteFilter;
+ import org.apache.iceberg.parquet.VectorizedReader;
+@@ -55,7 +56,7 @@ class CometColumnarBatchReader implements VectorizedReader<ColumnarBatch> {
+   // calling BatchReader.nextBatch, the isDeleted value is not yet available, so
+   // DeleteColumnReader.readBatch must be called explicitly later, after the isDeleted value is
+   // available.
+-  private final BatchReader delegate;
++  private final IcebergCometBatchReader delegate;
+   private DeleteFilter<InternalRow> deletes = null;
+   private long rowStartPosInBatch = 0;
+ 
+@@ -65,9 +66,7 @@ class CometColumnarBatchReader implements VectorizedReader<ColumnarBatch> {
+     this.hasIsDeletedColumn =
+         readers.stream().anyMatch(reader -> reader instanceof CometDeleteColumnReader);
+ 
+-    AbstractColumnReader[] abstractColumnReaders = new AbstractColumnReader[readers.size()];
+-    this.delegate = new BatchReader(abstractColumnReaders);
+-    delegate.setSparkSchema(SparkSchemaUtil.convert(schema));
++    this.delegate = new IcebergCometBatchReader(readers.size(), SparkSchemaUtil.convert(schema));
+   }
+ 
+   @Override
+@@ -85,19 +84,22 @@ class CometColumnarBatchReader implements VectorizedReader<ColumnarBatch> {
+             && !(readers[i] instanceof CometPositionColumnReader)
+             && !(readers[i] instanceof CometDeleteColumnReader)) {
+           readers[i].reset();
+-          readers[i].setPageReader(pageStore.getPageReader(readers[i].descriptor()));
++          readers[i].setPageReader((RowGroupReader) pageStore);
+         }
+       } catch (IOException e) {
+         throw new UncheckedIOException("Failed to setRowGroupInfo for Comet vectorization", e);
+       }
+     }
+ 
++    AbstractColumnReader[] delegateReaders = new AbstractColumnReader[readers.length];
+     for (int i = 0; i < readers.length; i++) {
+-      delegate.getColumnReaders()[i] = this.readers[i].delegate();
++      delegateReaders[i] = readers[i].delegate();
+     }
+ 
++    delegate.init(delegateReaders);
++
+     this.rowStartPosInBatch =
+-        pageStore
++        ((RowGroupReader) pageStore)
+             .getRowIndexOffset()
+             .orElseThrow(
+                 () ->
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
-index 047c963..d84ce62 100644
+index 047c963..88d691a 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometConstantColumnReader.java
-@@ -34,7 +34,7 @@ class CometConstantColumnReader<T> extends CometColumnReader {
+@@ -21,6 +21,7 @@ package org.apache.iceberg.spark.data.vectorized;
+ import java.math.BigDecimal;
+ import java.nio.ByteBuffer;
+ import org.apache.comet.parquet.ConstantColumnReader;
++import org.apache.iceberg.parquet.CometTypeUtils;
+ import org.apache.iceberg.types.Types;
+ import org.apache.spark.sql.types.DataType;
+ import org.apache.spark.sql.types.DataTypes;
+@@ -34,7 +35,11 @@ class CometConstantColumnReader<T> extends CometColumnReader {
      super(field);
      // use delegate to set constant value on the native side to be consumed by native execution.
      setDelegate(
 -        new ConstantColumnReader(sparkType(), descriptor(), convertToSparkValue(value), false));
-+        new ConstantColumnReader(sparkType(), descriptor(), convertToSparkValue(value), true));
++        new ConstantColumnReader(
++            sparkType(),
++            CometTypeUtils.descriptorToParquetColumnSpec(descriptor()),
++            convertToSparkValue(value),
++            false));
    }
  
    @Override
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
-index 6235bfe..34f579f 100644
+index 6235bfe..cba108e 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometDeleteColumnReader.java
-@@ -53,7 +53,7 @@ class CometDeleteColumnReader<T> extends CometColumnReader {
+@@ -51,10 +51,10 @@ class CometDeleteColumnReader<T> extends CometColumnReader {
+     DeleteColumnReader() {
+       super(
            DataTypes.BooleanType,
-           TypeUtil.convertToParquet(
+-          TypeUtil.convertToParquet(
++          TypeUtil.convertToParquetSpec(
                new StructField("_deleted", DataTypes.BooleanType, false, Metadata.empty())),
--          false /* useDecimal128 = false */,
-+          true /* useDecimal128 = true */,
-           false /* isConstant = false */);
+           false /* useDecimal128 = false */,
+-          false /* isConstant = false */);
++          false /* isConstant */);
        this.isDeleted = new boolean[0];
      }
+ 
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
-index bcc0e51..a779bed 100644
+index bcc0e51..98e8006 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometPositionColumnReader.java
-@@ -45,7 +45,7 @@ class CometPositionColumnReader extends CometColumnReader {
+@@ -20,6 +20,7 @@ package org.apache.iceberg.spark.data.vectorized;
+ 
+ import org.apache.comet.parquet.MetadataColumnReader;
+ import org.apache.comet.parquet.Native;
++import org.apache.iceberg.parquet.CometTypeUtils;
+ import org.apache.iceberg.types.Types;
+ import org.apache.parquet.column.ColumnDescriptor;
+ import org.apache.spark.sql.types.DataTypes;
+@@ -44,7 +45,7 @@ class CometPositionColumnReader extends CometColumnReader {
+     PositionColumnReader(ColumnDescriptor descriptor) {
        super(
            DataTypes.LongType,
-           descriptor,
--          false /* useDecimal128 = false */,
-+          true /* useDecimal128 = true */,
+-          descriptor,
++          CometTypeUtils.descriptorToParquetColumnSpec(descriptor),
+           false /* useDecimal128 = false */,
            false /* isConstant = false */);
      }
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometVectorizedReaderBuilder.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometVectorizedReaderBuilder.java
+index d36f1a7..56f8c9b 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometVectorizedReaderBuilder.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/data/vectorized/CometVectorizedReaderBuilder.java
+@@ -142,6 +142,7 @@ class CometVectorizedReaderBuilder extends TypeWithSchemaVisitor<VectorizedReade
+       return null;
+     }
+ 
+-    return new CometColumnReader(SparkSchemaUtil.convert(icebergField.type()), desc);
++    return new CometColumnReader(
++        SparkSchemaUtil.convert(icebergField.type()), desc, parquetFieldId);
+   }
+ }
+diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/BaseBatchReader.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/BaseBatchReader.java
+index 780e175..57892ac 100644
+--- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/BaseBatchReader.java
++++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/BaseBatchReader.java
+@@ -109,6 +109,7 @@ abstract class BaseBatchReader<T extends ScanTask> extends BaseReader<ColumnarBa
+         // read performance as every batch read doesn't have to pay the cost of allocating memory.
+         .reuseContainers()
+         .withNameMapping(nameMapping())
++        .enableComet(parquetConf.readerType() == ParquetReaderType.COMET)
+         .build();
+   }
  
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..a646d86 100644
+index 11f054b..108de81 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 @@ -148,7 +148,7 @@ class SparkBatch implements Batch {
@@ -262,7 +1094,7 @@ index 11f054b..a646d86 100644
    // - only primitives or metadata columns are projected
    // - all tasks are of FileScanTask type and read only Parquet files
 -  private boolean useParquetBatchReads() {
-+  boolean useParquetBatchReads() {
++  protected boolean useParquetBatchReads() {
      return readConf.parquetVectorizationEnabled()
          && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
          && taskGroups.stream().allMatch(this::supportsParquetBatchReads);

From b39824f36704ae8f5c0860536a7a1b038dd60920 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 12 Aug 2025 15:19:41 -0700
Subject: [PATCH 20/27] Turn off shuffle for 0.10.0 release  -
 https://github.com/apache/datafusion-comet/issues/2092

---
 dev/diffs/iceberg/1.8.1.diff | 124 +++++++++++++++++------------------
 1 file changed, 62 insertions(+), 62 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 9c97f66dae..d417fe78bd 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -699,7 +699,7 @@ index e2d2c7a..f64232d 100644
      relocate 'io.airlift', 'org.apache.iceberg.shaded.io.airlift'
      relocate 'org.apache.hc.client5', 'org.apache.iceberg.shaded.org.apache.hc.client5'
 diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
-index 578845e..1d8ebc1 100644
+index 578845e..2b16f8e 100644
 --- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
 +++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/ExtensionsTestBase.java
 @@ -57,6 +57,14 @@ public abstract class ExtensionsTestBase extends CatalogTestBase {
@@ -707,7 +707,7 @@ index 578845e..1d8ebc1 100644
              .config(
                  SQLConf.ADAPTIVE_EXECUTION_ENABLED().key(), String.valueOf(RANDOM.nextBoolean()))
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -718,7 +718,7 @@ index 578845e..1d8ebc1 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
-index ade19de..f4a36e5 100644
+index ade19de..255c416 100644
 --- a/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
 +++ b/spark/v3.5/spark-extensions/src/test/java/org/apache/iceberg/spark/extensions/TestCallStatementParser.java
 @@ -56,6 +56,14 @@ public class TestCallStatementParser {
@@ -726,7 +726,7 @@ index ade19de..f4a36e5 100644
              .config("spark.sql.extensions", IcebergSparkSessionExtensions.class.getName())
              .config("spark.extra.prop", "value")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -737,7 +737,7 @@ index ade19de..f4a36e5 100644
      TestCallStatementParser.parser = spark.sessionState().sqlParser();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
-index 64edb10..d6ada97 100644
+index 64edb10..ea4d76f 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/DeleteOrphanFilesBenchmark.java
 @@ -179,6 +179,14 @@ public class DeleteOrphanFilesBenchmark {
@@ -745,7 +745,7 @@ index 64edb10..d6ada97 100644
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", catalogWarehouse())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -756,7 +756,7 @@ index 64edb10..d6ada97 100644
      spark = builder.getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
-index a5d0456..4cacacb 100644
+index a5d0456..5aec87e 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/action/IcebergSortCompactionBenchmark.java
 @@ -392,6 +392,14 @@ public class IcebergSortCompactionBenchmark {
@@ -764,7 +764,7 @@ index a5d0456..4cacacb 100644
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", getCatalogWarehouse())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -775,7 +775,7 @@ index a5d0456..4cacacb 100644
      spark = builder.getOrCreate();
      Configuration sparkHadoopConf = spark.sessionState().newHadoopConf();
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
-index c6794e4..91c3940 100644
+index c6794e4..60bf66c 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVReaderBenchmark.java
 @@ -239,6 +239,14 @@ public class DVReaderBenchmark {
@@ -783,7 +783,7 @@ index c6794e4..91c3940 100644
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -794,7 +794,7 @@ index c6794e4..91c3940 100644
              .getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
-index ac74fb5..b106e1f 100644
+index ac74fb5..3fca3bd 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/DVWriterBenchmark.java
 @@ -223,6 +223,14 @@ public class DVWriterBenchmark {
@@ -802,7 +802,7 @@ index ac74fb5..b106e1f 100644
              .config("spark.sql.catalog.spark_catalog.type", "hadoop")
              .config("spark.sql.catalog.spark_catalog.warehouse", newWarehouseDir())
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -813,7 +813,7 @@ index ac74fb5..b106e1f 100644
              .getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-index 68c537e..f35f539 100644
+index 68c537e..7b1be8a 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
 @@ -94,7 +94,16 @@ public abstract class IcebergSourceBenchmark {
@@ -824,7 +824,7 @@ index 68c537e..f35f539 100644
 +    SparkSession.Builder builder = SparkSession.builder()
 +            .config("spark.ui.enabled", false)
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1143,7 +1143,7 @@ index 019f391..298c25f 100644
 +  }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
-index 404ba72..afcd813 100644
+index 404ba72..64c5e51 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java
 @@ -90,6 +90,14 @@ public abstract class SparkDistributedDataScanTestBase
@@ -1151,7 +1151,7 @@ index 404ba72..afcd813 100644
          .config("spark.serializer", serializer)
          .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +        .config("spark.plugins", "org.apache.spark.CometPlugin")
-+        .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++        .config("spark.comet.exec.shuffle.enabled", "false")
 +        .config("spark.comet.explainFallback.enabled", "true")
 +        .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +        .config("spark.memory.offHeap.enabled", "true")
@@ -1162,7 +1162,7 @@ index 404ba72..afcd813 100644
    }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
-index 659507e..f796faa 100644
+index 659507e..ead2de6 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanDeletes.java
 @@ -73,6 +73,14 @@ public class TestSparkDistributedDataScanDeletes
@@ -1170,7 +1170,7 @@ index 659507e..f796faa 100644
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1181,7 +1181,7 @@ index 659507e..f796faa 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
-index a218f96..9ce5afa 100644
+index a218f96..a11f574 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanFilterFiles.java
 @@ -62,6 +62,14 @@ public class TestSparkDistributedDataScanFilterFiles
@@ -1189,7 +1189,7 @@ index a218f96..9ce5afa 100644
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1200,7 +1200,7 @@ index a218f96..9ce5afa 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
-index 2665d7b..bc46074 100644
+index 2665d7b..95647d7 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/TestSparkDistributedDataScanReporting.java
 @@ -63,6 +63,14 @@ public class TestSparkDistributedDataScanReporting
@@ -1208,7 +1208,7 @@ index 2665d7b..bc46074 100644
              .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
              .config(SQLConf.SHUFFLE_PARTITIONS().key(), "4")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1219,7 +1219,7 @@ index 2665d7b..bc46074 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-index de68351..75d3b1a 100644
+index de68351..0e39a32 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
 @@ -77,6 +77,14 @@ public abstract class TestBase extends SparkTestHelperBase {
@@ -1227,7 +1227,7 @@ index de68351..75d3b1a 100644
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
              .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1238,7 +1238,7 @@ index de68351..75d3b1a 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-index bc4e722..629439f 100644
+index bc4e722..4cc1a1b 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
 @@ -59,7 +59,17 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
@@ -1249,7 +1249,7 @@ index bc4e722..629439f 100644
 +    spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1261,7 +1261,7 @@ index bc4e722..629439f 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-index 3a26974..4482b22 100644
+index 3a26974..9415538 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
 @@ -54,7 +54,17 @@ public abstract class ScanTestBase extends AvroDataTest {
@@ -1272,7 +1272,7 @@ index 3a26974..4482b22 100644
 +    ScanTestBase.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1284,7 +1284,7 @@ index 3a26974..4482b22 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-index f411920..722688f 100644
+index f411920..bcad9f3 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
 @@ -144,7 +144,17 @@ public class TestCompressionSettings extends CatalogTestBase {
@@ -1295,7 +1295,7 @@ index f411920..722688f 100644
 +    TestCompressionSettings.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1307,7 +1307,7 @@ index f411920..722688f 100644
  
    @BeforeEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-index c4ba96e..1481315 100644
+index c4ba96e..9865133 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
 @@ -75,7 +75,17 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
@@ -1318,7 +1318,7 @@ index c4ba96e..1481315 100644
 +    TestDataSourceOptions.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1330,7 +1330,7 @@ index c4ba96e..1481315 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-index 3481735..80a2491 100644
+index 3481735..0468aaa 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
 @@ -110,7 +110,17 @@ public class TestFilteredScan {
@@ -1341,7 +1341,7 @@ index 3481735..80a2491 100644
 +    TestFilteredScan.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1353,7 +1353,7 @@ index 3481735..80a2491 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-index 84c99a5..db4e2f9 100644
+index 84c99a5..545276c 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
 @@ -93,7 +93,17 @@ public class TestForwardCompatibility {
@@ -1364,7 +1364,7 @@ index 84c99a5..db4e2f9 100644
 +    TestForwardCompatibility.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1376,7 +1376,7 @@ index 84c99a5..db4e2f9 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-index 7eff93d..b15819e 100644
+index 7eff93d..640f614 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
 @@ -46,7 +46,17 @@ public class TestIcebergSpark {
@@ -1387,7 +1387,7 @@ index 7eff93d..b15819e 100644
 +    TestIcebergSpark.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1399,7 +1399,7 @@ index 7eff93d..b15819e 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-index 9464f68..66c3e96 100644
+index 9464f68..88d4263 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
 @@ -112,7 +112,17 @@ public class TestPartitionPruning {
@@ -1410,7 +1410,7 @@ index 9464f68..66c3e96 100644
 +    TestPartitionPruning.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1422,7 +1422,7 @@ index 9464f68..66c3e96 100644
  
      String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-index 5c218f2..728c3bf 100644
+index 5c218f2..05f69db 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
 @@ -107,7 +107,17 @@ public class TestPartitionValues {
@@ -1433,7 +1433,7 @@ index 5c218f2..728c3bf 100644
 +    TestPartitionValues.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1445,7 +1445,7 @@ index 5c218f2..728c3bf 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-index a7334a5..31cedb2 100644
+index a7334a5..8f267ce 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
 @@ -87,7 +87,17 @@ public class TestSnapshotSelection {
@@ -1456,7 +1456,7 @@ index a7334a5..31cedb2 100644
 +    TestSnapshotSelection.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1468,7 +1468,7 @@ index a7334a5..31cedb2 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-index 182b1ef..e59e632 100644
+index 182b1ef..1409633 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
 @@ -120,7 +120,17 @@ public class TestSparkDataFile {
@@ -1479,7 +1479,7 @@ index 182b1ef..e59e632 100644
 +    TestSparkDataFile.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1491,7 +1491,7 @@ index 182b1ef..e59e632 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-index fb2b312..a3a6502 100644
+index fb2b312..f42dce5 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
 @@ -96,7 +96,17 @@ public class TestSparkDataWrite {
@@ -1502,7 +1502,7 @@ index fb2b312..a3a6502 100644
 +    TestSparkDataWrite.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1514,7 +1514,7 @@ index fb2b312..a3a6502 100644
  
    @AfterEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-index becf6a0..a4f1629 100644
+index becf6a0..73d3ed9 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
 @@ -83,7 +83,17 @@ public class TestSparkReadProjection extends TestReadProjection {
@@ -1525,7 +1525,7 @@ index becf6a0..a4f1629 100644
 +    TestSparkReadProjection.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1537,7 +1537,7 @@ index becf6a0..a4f1629 100644
          ImmutableMap.of(
              "type", "hive",
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
-index 4f1cef5..6e64607 100644
+index 4f1cef5..f31c9b1 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderDeletes.java
 @@ -136,6 +136,14 @@ public class TestSparkReaderDeletes extends DeleteReadTests {
@@ -1545,7 +1545,7 @@ index 4f1cef5..6e64607 100644
              .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1556,7 +1556,7 @@ index 4f1cef5..6e64607 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
-index baf7fa8..fb07e3a 100644
+index baf7fa8..02cf1c8 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReaderWithBloomFilter.java
 @@ -182,6 +182,14 @@ public class TestSparkReaderWithBloomFilter {
@@ -1564,7 +1564,7 @@ index baf7fa8..fb07e3a 100644
              .master("local[2]")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1575,7 +1575,7 @@ index baf7fa8..fb07e3a 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
-index 17db46b..625ae17 100644
+index 17db46b..e6afced 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestStructuredStreaming.java
 @@ -65,6 +65,14 @@ public class TestStructuredStreaming {
@@ -1583,7 +1583,7 @@ index 17db46b..625ae17 100644
              .master("local[2]")
              .config("spark.sql.shuffle.partitions", 4)
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1594,7 +1594,7 @@ index 17db46b..625ae17 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-index 306444b..af431e3 100644
+index 306444b..974356b 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
 @@ -75,7 +75,17 @@ public class TestTimestampWithoutZone extends TestBase {
@@ -1605,7 +1605,7 @@ index 306444b..af431e3 100644
 +    TestTimestampWithoutZone.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1617,7 +1617,7 @@ index 306444b..af431e3 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-index 841268a..9cffd45 100644
+index 841268a..7743957 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
 @@ -80,7 +80,17 @@ public class TestWriteMetricsConfig {
@@ -1628,7 +1628,7 @@ index 841268a..9cffd45 100644
 +    TestWriteMetricsConfig.spark = SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")
@@ -1640,7 +1640,7 @@ index 841268a..9cffd45 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
-index 6e09252..30026e9 100644
+index 6e09252..f92dad4 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestAggregatePushDown.java
 @@ -60,6 +60,14 @@ public class TestAggregatePushDown extends CatalogTestBase {
@@ -1648,7 +1648,7 @@ index 6e09252..30026e9 100644
              .master("local[2]")
              .config("spark.sql.iceberg.aggregate_pushdown", "true")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
-+            .config("spark.shuffle.manager", "org.apache.spark.sql.comet.execution.shuffle.CometShuffleManager")
++            .config("spark.comet.exec.shuffle.enabled", "false")
 +            .config("spark.comet.explainFallback.enabled", "true")
 +            .config("spark.sql.iceberg.parquet.reader-type", "COMET")
 +            .config("spark.memory.offHeap.enabled", "true")

From 719914e9232b9de546edd6ba3916b2f30ef84565 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 12 Aug 2025 15:32:04 -0700
Subject: [PATCH 21/27] Fallback to Spark whenever there are delete files

---
 dev/diffs/iceberg/1.8.1.diff | 11 ++++++++++-
 1 file changed, 10 insertions(+), 1 deletion(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index d417fe78bd..d83bf05155 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1086,7 +1086,7 @@ index 780e175..57892ac 100644
    }
  
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..108de81 100644
+index 11f054b..324d201 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 @@ -148,7 +148,7 @@ class SparkBatch implements Batch {
@@ -1098,6 +1098,15 @@ index 11f054b..108de81 100644
      return readConf.parquetVectorizationEnabled()
          && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
          && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
+@@ -161,7 +161,7 @@ class SparkBatch implements Batch {
+ 
+     } else if (task.isFileScanTask() && !task.isDataTask()) {
+       FileScanTask fileScanTask = task.asFileScanTask();
+-      return fileScanTask.file().format() == FileFormat.PARQUET;
++      return fileScanTask.file().format() == FileFormat.PARQUET && fileScanTask.deletes().isEmpty();
+ 
+     } else {
+       return false;
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
 index 019f391..298c25f 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java

From b52401ef7fd41ff7adc9579f7908a0b90c05f30f Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 12 Aug 2025 17:12:15 -0700
Subject: [PATCH 22/27] hack: recognize CometFilter

---
 dev/diffs/iceberg/1.8.1.diff | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index d83bf05155..6d28d7c373 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1667,3 +1667,16 @@ index 6e09252..f92dad4 100644
              .enableHiveSupport()
              .getOrCreate();
  
+diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
+index 9d2ce2b..9b7b486 100644
+--- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
++++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
+@@ -600,7 +600,7 @@ public class TestFilterPushDown extends TestBaseWithCatalog {
+     if (sparkFilter != null) {
+       assertThat(planAsString)
+           .as("Post scan filter should match")
+-          .contains("Filter (" + sparkFilter + ")");
++          .contains("CometFilter");
+     } else {
+       assertThat(planAsString).as("Should be no post scan filter").doesNotContain("Filter (");
+     }

From 721543c1a10e647b8ca3a47791c0711d0576dc77 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 12 Aug 2025 22:18:55 -0700
Subject: [PATCH 23/27] Check CometFilter; Use useCometBatchReads

---
 dev/diffs/iceberg/1.8.1.diff | 61 ++++++++++++++++++++++--------------
 1 file changed, 37 insertions(+), 24 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 6d28d7c373..50850cc3eb 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1086,29 +1086,46 @@ index 780e175..57892ac 100644
    }
  
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-index 11f054b..324d201 100644
+index 11f054b..b37dd33 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkBatch.java
-@@ -148,7 +148,7 @@ class SparkBatch implements Batch {
-   // - Parquet vectorization is enabled
-   // - only primitives or metadata columns are projected
-   // - all tasks are of FileScanTask type and read only Parquet files
--  private boolean useParquetBatchReads() {
-+  protected boolean useParquetBatchReads() {
+@@ -172,17 +172,32 @@ class SparkBatch implements Batch {
+     return field.type().isPrimitiveType() || MetadataColumns.isMetadataColumn(field.fieldId());
+   }
+ 
+-  private boolean useCometBatchReads() {
++  protected boolean useCometBatchReads() {
      return readConf.parquetVectorizationEnabled()
-         && expectedSchema.columns().stream().allMatch(this::supportsParquetBatchReads)
-         && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
-@@ -161,7 +161,7 @@ class SparkBatch implements Batch {
+         && readConf.parquetReaderType() == ParquetReaderType.COMET
+         && expectedSchema.columns().stream().allMatch(this::supportsCometBatchReads)
+-        && taskGroups.stream().allMatch(this::supportsParquetBatchReads);
++        && taskGroups.stream().allMatch(this::supportsCometBatchReads);
+   }
  
-     } else if (task.isFileScanTask() && !task.isDataTask()) {
-       FileScanTask fileScanTask = task.asFileScanTask();
--      return fileScanTask.file().format() == FileFormat.PARQUET;
-+      return fileScanTask.file().format() == FileFormat.PARQUET && fileScanTask.deletes().isEmpty();
+   private boolean supportsCometBatchReads(Types.NestedField field) {
+     return field.type().isPrimitiveType() && !field.type().typeId().equals(Type.TypeID.UUID);
+   }
  
-     } else {
-       return false;
++  private boolean supportsCometBatchReads(ScanTask task) {
++    if (task instanceof ScanTaskGroup) {
++      ScanTaskGroup<?> taskGroup = (ScanTaskGroup<?>) task;
++      return taskGroup.tasks().stream().allMatch(this::supportsCometBatchReads);
++
++    } else if (task.isFileScanTask() && !task.isDataTask()) {
++      FileScanTask fileScanTask = task.asFileScanTask();
++      // Comet can't handle delete files for now
++      return fileScanTask.file().format() == FileFormat.PARQUET && fileScanTask.deletes().isEmpty();
++
++    } else {
++      return false;
++    }
++  }
++
+   // conditions for using ORC batch reads:
+   // - ORC vectorization is enabled
+   // - all tasks are of type FileScanTask and read only ORC files with no delete files
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-index 019f391..298c25f 100644
+index 019f391..1736631 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
 @@ -23,6 +23,7 @@ import java.util.List;
@@ -1136,19 +1153,15 @@ index 019f391..298c25f 100644
    private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
    private static final String NDV_KEY = "ndv";
  
-@@ -348,4 +350,14 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+@@ -348,4 +350,10 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
        return splitSize;
      }
    }
 +
 +  @Override
 +  public boolean isCometEnabled() {
-+    if (readConf.parquetReaderType() == ParquetReaderType.COMET) {
-+      SparkBatch batch = (SparkBatch) this.toBatch();
-+      return batch.useParquetBatchReads();
-+    }
-+
-+    return false;
++    SparkBatch batch = (SparkBatch) this.toBatch();
++    return batch.useCometBatchReads();
 +  }
  }
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/SparkDistributedDataScanTestBase.java

From b6b1a4b3ca85a4eedb75b40b24424282152cb353 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Thu, 14 Aug 2025 22:52:15 -0700
Subject: [PATCH 24/27] Sync w/ main branch

---
 native/core/src/execution/planner.rs | 8 +-------
 1 file changed, 1 insertion(+), 7 deletions(-)

diff --git a/native/core/src/execution/planner.rs b/native/core/src/execution/planner.rs
index a401ec1d18..0b0b7668f4 100644
--- a/native/core/src/execution/planner.rs
+++ b/native/core/src/execution/planner.rs
@@ -1328,13 +1328,7 @@ impl PhysicalPlanner {
                 // SortExec fails in some cases if we do not unpack dictionary-encoded arrays, and
                 // it would be more efficient if we could avoid that.
                 // https://github.com/apache/datafusion-comet/issues/963
-
-                // TODO optimize this so that we only add the CopyExec if needed
-                // https://github.com/apache/datafusion-comet/issues/2131
-                let child_copied = Arc::new(CopyExec::new(
-                    Arc::clone(&child.native_plan),
-                    CopyMode::UnpackOrDeepCopy,
-                ));
+                let child_copied = Self::wrap_in_copy_exec(Arc::clone(&child.native_plan));
 
                 let mut sort_exec: Arc<dyn ExecutionPlan> = Arc::new(
                     SortExec::new(LexOrdering::new(exprs?).unwrap(), Arc::clone(&child_copied))

From ae916f4b96629f68683ec4a20ee14f413ce62944 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Fri, 15 Aug 2025 16:41:04 -0700
Subject: [PATCH 25/27] Disable CometBroadcastExchange

---
 dev/diffs/iceberg/1.8.1.diff | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 50850cc3eb..f5945ee64e 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -1241,10 +1241,10 @@ index 2665d7b..95647d7 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-index de68351..0e39a32 100644
+index de68351..248f927 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/TestBase.java
-@@ -77,6 +77,14 @@ public abstract class TestBase extends SparkTestHelperBase {
+@@ -77,6 +77,15 @@ public abstract class TestBase extends SparkTestHelperBase {
              .config(SQLConf.PARTITION_OVERWRITE_MODE().key(), "dynamic")
              .config("spark.hadoop." + METASTOREURIS.varname, hiveConf.get(METASTOREURIS.varname))
              .config("spark.sql.legacy.respectNullabilityInTextDatasetConversion", "true")
@@ -1256,6 +1256,7 @@ index de68351..0e39a32 100644
 +            .config("spark.memory.offHeap.size", "10g")
 +            .config("spark.comet.use.lazyMaterialization", "false")
 +            .config("spark.comet.schemaEvolution.enabled", "true")
++            .config("spark.comet.exec.broadcastExchange.enabled", "false")
              .enableHiveSupport()
              .getOrCreate();
  

From 2a13941fa905438271f144d28eea987a942518c6 Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 19 Aug 2025 09:29:19 -0700
Subject: [PATCH 26/27] Fix diff

---
 dev/diffs/iceberg/1.8.1.diff | 708 +++++------------------------------
 1 file changed, 98 insertions(+), 610 deletions(-)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index f5945ee64e..5ca5e51966 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -37,530 +37,8 @@ index 04ffa8f..cc0099c 100644
  sqlite-jdbc = "3.48.0.0"
  testcontainers = "1.20.4"
  tez010 = "0.10.4"
-diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
-new file mode 100644
-index 0000000..ddf6c7d
---- /dev/null
-+++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
-@@ -0,0 +1,255 @@
-+/*
-+ * Licensed to the Apache Software Foundation (ASF) under one
-+ * or more contributor license agreements.  See the NOTICE file
-+ * distributed with this work for additional information
-+ * regarding copyright ownership.  The ASF licenses this file
-+ * to you under the Apache License, Version 2.0 (the
-+ * "License"); you may not use this file except in compliance
-+ * with the License.  You may obtain a copy of the License at
-+ *
-+ *   http://www.apache.org/licenses/LICENSE-2.0
-+ *
-+ * Unless required by applicable law or agreed to in writing,
-+ * software distributed under the License is distributed on an
-+ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
-+ * KIND, either express or implied.  See the License for the
-+ * specific language governing permissions and limitations
-+ * under the License.
-+ */
-+package org.apache.iceberg.parquet;
-+
-+import java.util.Map;
-+import org.apache.comet.parquet.ParquetColumnSpec;
-+import org.apache.iceberg.relocated.com.google.common.collect.Maps;
-+import org.apache.parquet.column.ColumnDescriptor;
-+import org.apache.parquet.schema.LogicalTypeAnnotation;
-+import org.apache.parquet.schema.PrimitiveType;
-+import org.apache.parquet.schema.Type;
-+import org.apache.parquet.schema.Types;
-+
-+public class CometTypeUtils {
-+
-+  private CometTypeUtils() {}
-+
-+  public static ParquetColumnSpec descriptorToParquetColumnSpec(ColumnDescriptor descriptor) {
-+
-+    String[] path = descriptor.getPath();
-+    PrimitiveType primitiveType = descriptor.getPrimitiveType();
-+    String physicalType = primitiveType.getPrimitiveTypeName().name();
-+
-+    int typeLength =
-+        primitiveType.getPrimitiveTypeName() == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY
-+            ? primitiveType.getTypeLength()
-+            : 0;
-+
-+    boolean isRepeated = primitiveType.getRepetition() == Type.Repetition.REPEATED;
-+
-+    // ToDo: extract this into a Util method
-+    String logicalTypeName = null;
-+    Map<String, String> logicalTypeParams = Maps.newHashMap();
-+    LogicalTypeAnnotation logicalType = primitiveType.getLogicalTypeAnnotation();
-+
-+    if (logicalType != null) {
-+      logicalTypeName = logicalType.getClass().getSimpleName();
-+
-+      // Handle specific logical types
-+      if (logicalType instanceof LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) {
-+        LogicalTypeAnnotation.DecimalLogicalTypeAnnotation decimal =
-+            (LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) logicalType;
-+        logicalTypeParams.put("precision", String.valueOf(decimal.getPrecision()));
-+        logicalTypeParams.put("scale", String.valueOf(decimal.getScale()));
-+      } else if (logicalType instanceof LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) {
-+        LogicalTypeAnnotation.TimestampLogicalTypeAnnotation timestamp =
-+            (LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) logicalType;
-+        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(timestamp.isAdjustedToUTC()));
-+        logicalTypeParams.put("unit", timestamp.getUnit().name());
-+      } else if (logicalType instanceof LogicalTypeAnnotation.TimeLogicalTypeAnnotation) {
-+        LogicalTypeAnnotation.TimeLogicalTypeAnnotation time =
-+            (LogicalTypeAnnotation.TimeLogicalTypeAnnotation) logicalType;
-+        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(time.isAdjustedToUTC()));
-+        logicalTypeParams.put("unit", time.getUnit().name());
-+      } else if (logicalType instanceof LogicalTypeAnnotation.IntLogicalTypeAnnotation) {
-+        LogicalTypeAnnotation.IntLogicalTypeAnnotation intType =
-+            (LogicalTypeAnnotation.IntLogicalTypeAnnotation) logicalType;
-+        logicalTypeParams.put("isSigned", String.valueOf(intType.isSigned()));
-+        logicalTypeParams.put("bitWidth", String.valueOf(intType.getBitWidth()));
-+      }
-+    }
-+
-+    return new ParquetColumnSpec(
-+        1, // ToDo: pass in the correct id
-+        path,
-+        physicalType,
-+        typeLength,
-+        isRepeated,
-+        descriptor.getMaxDefinitionLevel(),
-+        descriptor.getMaxRepetitionLevel(),
-+        logicalTypeName,
-+        logicalTypeParams);
-+  }
-+
-+  public static ColumnDescriptor buildColumnDescriptor(ParquetColumnSpec columnSpec) {
-+    PrimitiveType.PrimitiveTypeName primType =
-+        PrimitiveType.PrimitiveTypeName.valueOf(columnSpec.getPhysicalType());
-+
-+    Type.Repetition repetition;
-+    if (columnSpec.getMaxRepetitionLevel() > 0) {
-+      repetition = Type.Repetition.REPEATED;
-+    } else if (columnSpec.getMaxDefinitionLevel() > 0) {
-+      repetition = Type.Repetition.OPTIONAL;
-+    } else {
-+      repetition = Type.Repetition.REQUIRED;
-+    }
-+
-+    String name = columnSpec.getPath()[columnSpec.getPath().length - 1];
-+    // Reconstruct the logical type from parameters
-+    LogicalTypeAnnotation logicalType = null;
-+    if (columnSpec.getLogicalTypeName() != null) {
-+      logicalType =
-+          reconstructLogicalType(
-+              columnSpec.getLogicalTypeName(), columnSpec.getLogicalTypeParams());
-+    }
-+
-+    PrimitiveType primitiveType;
-+    if (primType == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY) {
-+      primitiveType =
-+          org.apache.parquet.schema.Types.primitive(primType, repetition)
-+              .length(columnSpec.getTypeLength())
-+              .as(logicalType)
-+              .id(columnSpec.getFieldId())
-+              .named(name);
-+    } else {
-+      primitiveType =
-+          Types.primitive(primType, repetition)
-+              .as(logicalType)
-+              .id(columnSpec.getFieldId())
-+              .named(name);
-+    }
-+
-+    return new ColumnDescriptor(
-+        columnSpec.getPath(),
-+        primitiveType,
-+        columnSpec.getMaxRepetitionLevel(),
-+        columnSpec.getMaxDefinitionLevel());
-+  }
-+
-+  private static LogicalTypeAnnotation reconstructLogicalType(
-+      String logicalTypeName, java.util.Map<String, String> params) {
-+
-+    switch (logicalTypeName) {
-+        // MAP
-+      case "MapLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.mapType();
-+
-+        // LIST
-+      case "ListLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.listType();
-+
-+        // STRING
-+      case "StringLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.stringType();
-+
-+        // MAP_KEY_VALUE
-+      case "MapKeyValueLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.MapKeyValueTypeAnnotation.getInstance();
-+
-+        // ENUM
-+      case "EnumLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.enumType();
-+
-+        // DECIMAL
-+      case "DecimalLogicalTypeAnnotation":
-+        if (!params.containsKey("scale") || !params.containsKey("precision")) {
-+          throw new IllegalArgumentException(
-+              "Missing required parameters for DecimalLogicalTypeAnnotation: " + params);
-+        }
-+        int scale = Integer.parseInt(params.get("scale"));
-+        int precision = Integer.parseInt(params.get("precision"));
-+        return LogicalTypeAnnotation.decimalType(scale, precision);
-+
-+        // DATE
-+      case "DateLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.dateType();
-+
-+        // TIME
-+      case "TimeLogicalTypeAnnotation":
-+        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
-+          throw new IllegalArgumentException(
-+              "Missing required parameters for TimeLogicalTypeAnnotation: " + params);
-+        }
-+
-+        boolean isUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
-+        String timeUnitStr = params.get("unit");
-+
-+        LogicalTypeAnnotation.TimeUnit timeUnit;
-+        switch (timeUnitStr) {
-+          case "MILLIS":
-+            timeUnit = LogicalTypeAnnotation.TimeUnit.MILLIS;
-+            break;
-+          case "MICROS":
-+            timeUnit = LogicalTypeAnnotation.TimeUnit.MICROS;
-+            break;
-+          case "NANOS":
-+            timeUnit = LogicalTypeAnnotation.TimeUnit.NANOS;
-+            break;
-+          default:
-+            throw new IllegalArgumentException("Unknown time unit: " + timeUnitStr);
-+        }
-+        return LogicalTypeAnnotation.timeType(isUTC, timeUnit);
-+
-+        // TIMESTAMP
-+      case "TimestampLogicalTypeAnnotation":
-+        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
-+          throw new IllegalArgumentException(
-+              "Missing required parameters for TimestampLogicalTypeAnnotation: " + params);
-+        }
-+        boolean isAdjustedToUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
-+        String unitStr = params.get("unit");
-+
-+        LogicalTypeAnnotation.TimeUnit unit;
-+        switch (unitStr) {
-+          case "MILLIS":
-+            unit = LogicalTypeAnnotation.TimeUnit.MILLIS;
-+            break;
-+          case "MICROS":
-+            unit = LogicalTypeAnnotation.TimeUnit.MICROS;
-+            break;
-+          case "NANOS":
-+            unit = LogicalTypeAnnotation.TimeUnit.NANOS;
-+            break;
-+          default:
-+            throw new IllegalArgumentException("Unknown timestamp unit: " + unitStr);
-+        }
-+        return LogicalTypeAnnotation.timestampType(isAdjustedToUTC, unit);
-+
-+        // INTEGER
-+      case "IntLogicalTypeAnnotation":
-+        if (!params.containsKey("isSigned") || !params.containsKey("bitWidth")) {
-+          throw new IllegalArgumentException(
-+              "Missing required parameters for IntLogicalTypeAnnotation: " + params);
-+        }
-+        boolean isSigned = Boolean.parseBoolean(params.get("isSigned"));
-+        int bitWidth = Integer.parseInt(params.get("bitWidth"));
-+        return LogicalTypeAnnotation.intType(bitWidth, isSigned);
-+
-+        // JSON
-+      case "JsonLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.jsonType();
-+
-+        // BSON
-+      case "BsonLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.bsonType();
-+
-+        // UUID
-+      case "UUIDLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.uuidType();
-+
-+        // INTERVAL
-+      case "IntervalLogicalTypeAnnotation":
-+        return LogicalTypeAnnotation.IntervalLogicalTypeAnnotation.getInstance();
-+
-+      default:
-+        throw new IllegalArgumentException("Unknown logical type: " + logicalTypeName);
-+    }
-+  }
-+}
-diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
-new file mode 100644
-index 0000000..88b195b
---- /dev/null
-+++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
-@@ -0,0 +1,255 @@
-+/*
-+ * Licensed to the Apache Software Foundation (ASF) under one
-+ * or more contributor license agreements.  See the NOTICE file
-+ * distributed with this work for additional information
-+ * regarding copyright ownership.  The ASF licenses this file
-+ * to you under the Apache License, Version 2.0 (the
-+ * "License"); you may not use this file except in compliance
-+ * with the License.  You may obtain a copy of the License at
-+ *
-+ *   http://www.apache.org/licenses/LICENSE-2.0
-+ *
-+ * Unless required by applicable law or agreed to in writing,
-+ * software distributed under the License is distributed on an
-+ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
-+ * KIND, either express or implied.  See the License for the
-+ * specific language governing permissions and limitations
-+ * under the License.
-+ */
-+package org.apache.iceberg.parquet;
-+
-+import java.io.IOException;
-+import java.io.UncheckedIOException;
-+import java.nio.ByteBuffer;
-+import java.util.List;
-+import java.util.Map;
-+import java.util.NoSuchElementException;
-+import java.util.function.Function;
-+import org.apache.comet.parquet.FileReader;
-+import org.apache.comet.parquet.ParquetColumnSpec;
-+import org.apache.comet.parquet.ReadOptions;
-+import org.apache.comet.parquet.RowGroupReader;
-+import org.apache.comet.parquet.WrappedInputFile;
-+import org.apache.hadoop.conf.Configuration;
-+import org.apache.iceberg.Schema;
-+import org.apache.iceberg.exceptions.RuntimeIOException;
-+import org.apache.iceberg.expressions.Expression;
-+import org.apache.iceberg.expressions.Expressions;
-+import org.apache.iceberg.io.CloseableGroup;
-+import org.apache.iceberg.io.CloseableIterable;
-+import org.apache.iceberg.io.CloseableIterator;
-+import org.apache.iceberg.io.InputFile;
-+import org.apache.iceberg.mapping.NameMapping;
-+import org.apache.iceberg.relocated.com.google.common.collect.Lists;
-+import org.apache.iceberg.util.ByteBuffers;
-+import org.apache.parquet.ParquetReadOptions;
-+import org.apache.parquet.column.ColumnDescriptor;
-+import org.apache.parquet.hadoop.metadata.ColumnChunkMetaData;
-+import org.apache.parquet.hadoop.metadata.ColumnPath;
-+import org.apache.parquet.schema.MessageType;
-+
-+public class CometVectorizedParquetReader<T> extends CloseableGroup
-+    implements CloseableIterable<T> {
-+  private final InputFile input;
-+  private final ParquetReadOptions options;
-+  private final Schema expectedSchema;
-+  private final Function<MessageType, VectorizedReader<?>> batchReaderFunc;
-+  private final Expression filter;
-+  private final boolean reuseContainers;
-+  private final boolean caseSensitive;
-+  private final int batchSize;
-+  private final NameMapping nameMapping;
-+  private final Map<String, String> properties;
-+  private Long start = null;
-+  private Long length = null;
-+  private ByteBuffer fileEncryptionKey = null;
-+  private ByteBuffer fileAADPrefix = null;
-+
-+  public CometVectorizedParquetReader(
-+      InputFile input,
-+      Schema expectedSchema,
-+      ParquetReadOptions options,
-+      Function<MessageType, VectorizedReader<?>> readerFunc,
-+      NameMapping nameMapping,
-+      Expression filter,
-+      boolean reuseContainers,
-+      boolean caseSensitive,
-+      int maxRecordsPerBatch,
-+      Map<String, String> properties,
-+      Long start,
-+      Long length,
-+      ByteBuffer fileEncryptionKey,
-+      ByteBuffer fileAADPrefix) {
-+    this.input = input;
-+    this.expectedSchema = expectedSchema;
-+    this.options = options;
-+    this.batchReaderFunc = readerFunc;
-+    // replace alwaysTrue with null to avoid extra work evaluating a trivial filter
-+    this.filter = filter == Expressions.alwaysTrue() ? null : filter;
-+    this.reuseContainers = reuseContainers;
-+    this.caseSensitive = caseSensitive;
-+    this.batchSize = maxRecordsPerBatch;
-+    this.nameMapping = nameMapping;
-+    this.properties = properties;
-+    this.start = start;
-+    this.length = length;
-+    this.fileEncryptionKey = fileEncryptionKey;
-+    this.fileAADPrefix = fileAADPrefix;
-+  }
-+
-+  private ReadConf conf = null;
-+
-+  private ReadConf init() {
-+    if (conf == null) {
-+      ReadConf readConf =
-+          new ReadConf(
-+              input,
-+              options,
-+              expectedSchema,
-+              filter,
-+              null,
-+              batchReaderFunc,
-+              nameMapping,
-+              reuseContainers,
-+              caseSensitive,
-+              batchSize);
-+      this.conf = readConf.copy();
-+      return readConf;
-+    }
-+    return conf;
-+  }
-+
-+  @Override
-+  public CloseableIterator<T> iterator() {
-+    FileIterator<T> iter =
-+        new FileIterator<>(init(), properties, start, length, fileEncryptionKey, fileAADPrefix);
-+    addCloseable(iter);
-+    return iter;
-+  }
-+
-+  private static class FileIterator<T> implements CloseableIterator<T> {
-+    // private final ParquetFileReader reader;
-+    private final boolean[] shouldSkip;
-+    private final VectorizedReader<T> model;
-+    private final long totalValues;
-+    private final int batchSize;
-+    private final List<Map<ColumnPath, ColumnChunkMetaData>> columnChunkMetadata;
-+    private final boolean reuseContainers;
-+    private int nextRowGroup = 0;
-+    private long nextRowGroupStart = 0;
-+    private long valuesRead = 0;
-+    private T last = null;
-+    private final FileReader cometReader;
-+
-+    FileIterator(
-+        ReadConf conf,
-+        Map<String, String> properties,
-+        Long start,
-+        Long length,
-+        ByteBuffer fileEncryptionKey,
-+        ByteBuffer fileAADPrefix) {
-+      this.shouldSkip = conf.shouldSkip();
-+      this.totalValues = conf.totalValues();
-+      this.reuseContainers = conf.reuseContainers();
-+      this.model = conf.vectorizedModel();
-+      this.batchSize = conf.batchSize();
-+      this.model.setBatchSize(this.batchSize);
-+      this.columnChunkMetadata = conf.columnChunkMetadataForRowGroups();
-+      this.cometReader =
-+          newCometReader(
-+              conf.file(),
-+              conf.projection(),
-+              properties,
-+              start,
-+              length,
-+              fileEncryptionKey,
-+              fileAADPrefix);
-+    }
-+
-+    private FileReader newCometReader(
-+        InputFile file,
-+        MessageType projection,
-+        Map<String, String> properties,
-+        Long start,
-+        Long length,
-+        ByteBuffer fileEncryptionKey,
-+        ByteBuffer fileAADPrefix) {
-+      try {
-+        ReadOptions cometOptions = ReadOptions.builder(new Configuration()).build();
-+
-+        FileReader fileReader =
-+            new FileReader(
-+                new WrappedInputFile(file),
-+                cometOptions,
-+                properties,
-+                start,
-+                length,
-+                ByteBuffers.toByteArray(fileEncryptionKey),
-+                ByteBuffers.toByteArray(fileAADPrefix));
-+
-+        List<ColumnDescriptor> columnDescriptors = projection.getColumns();
-+
-+        List<ParquetColumnSpec> specs = Lists.newArrayList();
-+
-+        for (ColumnDescriptor descriptor : columnDescriptors) {
-+          ParquetColumnSpec spec = CometTypeUtils.descriptorToParquetColumnSpec(descriptor);
-+          specs.add(spec);
-+        }
-+
-+        fileReader.setRequestedSchemaFromSpecs(specs);
-+        return fileReader;
-+      } catch (IOException e) {
-+        throw new UncheckedIOException("Failed to open Parquet file: " + file.location(), e);
-+      }
-+    }
-+
-+    @Override
-+    public boolean hasNext() {
-+      return valuesRead < totalValues;
-+    }
-+
-+    @Override
-+    public T next() {
-+      if (!hasNext()) {
-+        throw new NoSuchElementException();
-+      }
-+      if (valuesRead >= nextRowGroupStart) {
-+        advance();
-+      }
-+
-+      // batchSize is an integer, so casting to integer is safe
-+      int numValuesToRead = (int) Math.min(nextRowGroupStart - valuesRead, batchSize);
-+      if (reuseContainers) {
-+        this.last = model.read(last, numValuesToRead);
-+      } else {
-+        this.last = model.read(null, numValuesToRead);
-+      }
-+      valuesRead += numValuesToRead;
-+
-+      return last;
-+    }
-+
-+    private void advance() {
-+      while (shouldSkip[nextRowGroup]) {
-+        nextRowGroup += 1;
-+        cometReader.skipNextRowGroup();
-+      }
-+      RowGroupReader pages;
-+      try {
-+        pages = cometReader.readNextRowGroup();
-+      } catch (IOException e) {
-+        throw new RuntimeIOException(e);
-+      }
-+
-+      model.setRowGroupInfo(pages, columnChunkMetadata.get(nextRowGroup));
-+      nextRowGroupStart += pages.getRowCount();
-+      nextRowGroup += 1;
-+    }
-+
-+    @Override
-+    public void close() throws IOException {
-+      model.close();
-+      cometReader.close();
-+    }
-+  }
-+}
 diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java b/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
-index 2c37a52..503dbd6 100644
+index 2c37a52..3442cfc 100644
 --- a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
 +++ b/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
 @@ -1075,6 +1075,7 @@ public class Parquet {
@@ -609,31 +87,31 @@ index 2c37a52..503dbd6 100644
 +          if (isComet) {
 +            LOG.info("Comet enabled");
 +            return new CometVectorizedParquetReader<>(
-+                    file,
-+                    schema,
-+                    options,
-+                    batchedReaderFunc,
-+                    mapping,
-+                    filter,
-+                    reuseContainers,
-+                    caseSensitive,
-+                    maxRecordsPerBatch,
-+                    properties,
-+                    start,
-+                    length,
-+                    fileEncryptionKey,
-+                    fileAADPrefix);
++                file,
++                schema,
++                options,
++                batchedReaderFunc,
++                mapping,
++                filter,
++                reuseContainers,
++                caseSensitive,
++                maxRecordsPerBatch,
++                properties,
++                start,
++                length,
++                fileEncryptionKey,
++                fileAADPrefix);
 +          } else {
 +            return new VectorizedParquetReader<>(
-+                    file,
-+                    schema,
-+                    options,
-+                    batchedReaderFunc,
-+                    mapping,
-+                    filter,
-+                    reuseContainers,
-+                    caseSensitive,
-+                    maxRecordsPerBatch);
++                file,
++                schema,
++                options,
++                batchedReaderFunc,
++                mapping,
++                filter,
++                reuseContainers,
++                caseSensitive,
++                maxRecordsPerBatch);
 +          }
          } else {
            return new org.apache.iceberg.parquet.ParquetReader<>(
@@ -813,15 +291,16 @@ index ac74fb5..3fca3bd 100644
              .getOrCreate();
    }
 diff --git a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-index 68c537e..7b1be8a 100644
+index 68c537e..2b821f8 100644
 --- a/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
 +++ b/spark/v3.5/spark/src/jmh/java/org/apache/iceberg/spark/source/IcebergSourceBenchmark.java
-@@ -94,7 +94,16 @@ public abstract class IcebergSourceBenchmark {
+@@ -94,7 +94,17 @@ public abstract class IcebergSourceBenchmark {
    }
  
    protected void setupSpark(boolean enableDictionaryEncoding) {
 -    SparkSession.Builder builder = SparkSession.builder().config("spark.ui.enabled", false);
-+    SparkSession.Builder builder = SparkSession.builder()
++    SparkSession.Builder builder =
++        SparkSession.builder()
 +            .config("spark.ui.enabled", false)
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1125,7 +604,7 @@ index 11f054b..b37dd33 100644
    // - ORC vectorization is enabled
    // - all tasks are of type FileScanTask and read only ORC files with no delete files
 diff --git a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
-index 019f391..1736631 100644
+index 019f391..656e060 100644
 --- a/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
 +++ b/spark/v3.5/spark/src/main/java/org/apache/iceberg/spark/source/SparkScan.java
 @@ -23,6 +23,7 @@ import java.util.List;
@@ -1136,15 +615,7 @@ index 019f391..1736631 100644
  import org.apache.iceberg.BlobMetadata;
  import org.apache.iceberg.ScanTask;
  import org.apache.iceberg.ScanTaskGroup;
-@@ -36,6 +37,7 @@ import org.apache.iceberg.metrics.ScanReport;
- import org.apache.iceberg.relocated.com.google.common.base.Strings;
- import org.apache.iceberg.relocated.com.google.common.collect.Lists;
- import org.apache.iceberg.relocated.com.google.common.collect.Maps;
-+import org.apache.iceberg.spark.ParquetReaderType;
- import org.apache.iceberg.spark.Spark3Util;
- import org.apache.iceberg.spark.SparkReadConf;
- import org.apache.iceberg.spark.SparkSchemaUtil;
-@@ -94,7 +96,7 @@ import org.apache.spark.sql.types.StructType;
+@@ -94,7 +95,7 @@ import org.apache.spark.sql.types.StructType;
  import org.slf4j.Logger;
  import org.slf4j.LoggerFactory;
  
@@ -1153,7 +624,7 @@ index 019f391..1736631 100644
    private static final Logger LOG = LoggerFactory.getLogger(SparkScan.class);
    private static final String NDV_KEY = "ndv";
  
-@@ -348,4 +350,10 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
+@@ -348,4 +349,10 @@ abstract class SparkScan implements Scan, SupportsReportStatistics {
        return splitSize;
      }
    }
@@ -1261,15 +732,16 @@ index de68351..248f927 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-index bc4e722..4cc1a1b 100644
+index bc4e722..a2d8346 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/data/parquet/vectorized/TestParquetDictionaryEncodedVectorizedReads.java
-@@ -59,7 +59,17 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
+@@ -59,7 +59,18 @@ public class TestParquetDictionaryEncodedVectorizedReads extends TestParquetVect
  
    @BeforeAll
    public static void startSpark() {
 -    spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    spark = SparkSession.builder()
++    spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1284,15 +756,16 @@ index bc4e722..4cc1a1b 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-index 3a26974..9415538 100644
+index 3a26974..9be02b9 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/ScanTestBase.java
-@@ -54,7 +54,17 @@ public abstract class ScanTestBase extends AvroDataTest {
+@@ -54,7 +54,18 @@ public abstract class ScanTestBase extends AvroDataTest {
  
    @BeforeAll
    public static void startSpark() {
 -    ScanTestBase.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    ScanTestBase.spark = SparkSession.builder()
++    ScanTestBase.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1307,15 +780,16 @@ index 3a26974..9415538 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-index f411920..bcad9f3 100644
+index f411920..f2a9593 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestCompressionSettings.java
-@@ -144,7 +144,17 @@ public class TestCompressionSettings extends CatalogTestBase {
+@@ -144,7 +144,18 @@ public class TestCompressionSettings extends CatalogTestBase {
  
    @BeforeAll
    public static void startSpark() {
 -    TestCompressionSettings.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestCompressionSettings.spark = SparkSession.builder()
++    TestCompressionSettings.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1330,15 +804,16 @@ index f411920..bcad9f3 100644
  
    @BeforeEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-index c4ba96e..9865133 100644
+index c4ba96e..5a1073d 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestDataSourceOptions.java
-@@ -75,7 +75,17 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
+@@ -75,7 +75,18 @@ public class TestDataSourceOptions extends TestBaseWithCatalog {
  
    @BeforeAll
    public static void startSpark() {
 -    TestDataSourceOptions.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestDataSourceOptions.spark = SparkSession.builder()
++    TestDataSourceOptions.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1353,15 +828,16 @@ index c4ba96e..9865133 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-index 3481735..0468aaa 100644
+index 3481735..688daba 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestFilteredScan.java
-@@ -110,7 +110,17 @@ public class TestFilteredScan {
+@@ -110,7 +110,18 @@ public class TestFilteredScan {
  
    @BeforeAll
    public static void startSpark() {
 -    TestFilteredScan.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestFilteredScan.spark = SparkSession.builder()
++    TestFilteredScan.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1376,15 +852,16 @@ index 3481735..0468aaa 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-index 84c99a5..545276c 100644
+index 84c99a5..58a414b 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestForwardCompatibility.java
-@@ -93,7 +93,17 @@ public class TestForwardCompatibility {
+@@ -93,7 +93,18 @@ public class TestForwardCompatibility {
  
    @BeforeAll
    public static void startSpark() {
 -    TestForwardCompatibility.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestForwardCompatibility.spark = SparkSession.builder()
++    TestForwardCompatibility.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1399,15 +876,16 @@ index 84c99a5..545276c 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-index 7eff93d..640f614 100644
+index 7eff93d..990f386 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestIcebergSpark.java
-@@ -46,7 +46,17 @@ public class TestIcebergSpark {
+@@ -46,7 +46,18 @@ public class TestIcebergSpark {
  
    @BeforeAll
    public static void startSpark() {
 -    TestIcebergSpark.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestIcebergSpark.spark = SparkSession.builder()
++    TestIcebergSpark.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1422,15 +900,16 @@ index 7eff93d..640f614 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-index 9464f68..88d4263 100644
+index 9464f68..e8d08ec 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionPruning.java
-@@ -112,7 +112,17 @@ public class TestPartitionPruning {
+@@ -112,7 +112,18 @@ public class TestPartitionPruning {
  
    @BeforeAll
    public static void startSpark() {
 -    TestPartitionPruning.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestPartitionPruning.spark = SparkSession.builder()
++    TestPartitionPruning.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1445,15 +924,16 @@ index 9464f68..88d4263 100644
  
      String optionKey = String.format("fs.%s.impl", CountOpenLocalFileSystem.scheme);
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-index 5c218f2..05f69db 100644
+index 5c218f2..829b67b 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestPartitionValues.java
-@@ -107,7 +107,17 @@ public class TestPartitionValues {
+@@ -107,7 +107,18 @@ public class TestPartitionValues {
  
    @BeforeAll
    public static void startSpark() {
 -    TestPartitionValues.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestPartitionValues.spark = SparkSession.builder()
++    TestPartitionValues.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1468,15 +948,16 @@ index 5c218f2..05f69db 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-index a7334a5..8f267ce 100644
+index a7334a5..abe55f2 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSnapshotSelection.java
-@@ -87,7 +87,17 @@ public class TestSnapshotSelection {
+@@ -87,7 +87,18 @@ public class TestSnapshotSelection {
  
    @BeforeAll
    public static void startSpark() {
 -    TestSnapshotSelection.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSnapshotSelection.spark = SparkSession.builder()
++    TestSnapshotSelection.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1491,15 +972,16 @@ index a7334a5..8f267ce 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-index 182b1ef..1409633 100644
+index 182b1ef..ffceac5 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataFile.java
-@@ -120,7 +120,17 @@ public class TestSparkDataFile {
+@@ -120,7 +120,18 @@ public class TestSparkDataFile {
  
    @BeforeAll
    public static void startSpark() {
 -    TestSparkDataFile.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkDataFile.spark = SparkSession.builder()
++    TestSparkDataFile.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1514,15 +996,16 @@ index 182b1ef..1409633 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-index fb2b312..f42dce5 100644
+index fb2b312..58911fc 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkDataWrite.java
-@@ -96,7 +96,17 @@ public class TestSparkDataWrite {
+@@ -96,7 +96,18 @@ public class TestSparkDataWrite {
  
    @BeforeAll
    public static void startSpark() {
 -    TestSparkDataWrite.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkDataWrite.spark = SparkSession.builder()
++    TestSparkDataWrite.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1537,15 +1020,16 @@ index fb2b312..f42dce5 100644
  
    @AfterEach
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-index becf6a0..73d3ed9 100644
+index becf6a0..b98c2f6 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestSparkReadProjection.java
-@@ -83,7 +83,17 @@ public class TestSparkReadProjection extends TestReadProjection {
+@@ -83,7 +83,18 @@ public class TestSparkReadProjection extends TestReadProjection {
  
    @BeforeAll
    public static void startSpark() {
 -    TestSparkReadProjection.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestSparkReadProjection.spark = SparkSession.builder()
++    TestSparkReadProjection.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1617,15 +1101,16 @@ index 17db46b..e6afced 100644
    }
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-index 306444b..974356b 100644
+index 306444b..525ddb0 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestTimestampWithoutZone.java
-@@ -75,7 +75,17 @@ public class TestTimestampWithoutZone extends TestBase {
+@@ -75,7 +75,18 @@ public class TestTimestampWithoutZone extends TestBase {
  
    @BeforeAll
    public static void startSpark() {
 -    TestTimestampWithoutZone.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestTimestampWithoutZone.spark = SparkSession.builder()
++    TestTimestampWithoutZone.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1640,15 +1125,16 @@ index 306444b..974356b 100644
  
    @AfterAll
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-index 841268a..7743957 100644
+index 841268a..8da9ea2 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/source/TestWriteMetricsConfig.java
-@@ -80,7 +80,17 @@ public class TestWriteMetricsConfig {
+@@ -80,7 +80,18 @@ public class TestWriteMetricsConfig {
  
    @BeforeAll
    public static void startSpark() {
 -    TestWriteMetricsConfig.spark = SparkSession.builder().master("local[2]").getOrCreate();
-+    TestWriteMetricsConfig.spark = SparkSession.builder()
++    TestWriteMetricsConfig.spark =
++        SparkSession.builder()
 +            .master("local[2]")
 +            .config("spark.plugins", "org.apache.spark.CometPlugin")
 +            .config("spark.comet.exec.shuffle.enabled", "false")
@@ -1682,15 +1168,17 @@ index 6e09252..f92dad4 100644
              .getOrCreate();
  
 diff --git a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
-index 9d2ce2b..9b7b486 100644
+index 9d2ce2b..5e23368 100644
 --- a/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
 +++ b/spark/v3.5/spark/src/test/java/org/apache/iceberg/spark/sql/TestFilterPushDown.java
-@@ -600,7 +600,7 @@ public class TestFilterPushDown extends TestBaseWithCatalog {
+@@ -598,9 +598,7 @@ public class TestFilterPushDown extends TestBaseWithCatalog {
+     String planAsString = sparkPlan.toString().replaceAll("#(\\d+L?)", "");
+ 
      if (sparkFilter != null) {
-       assertThat(planAsString)
-           .as("Post scan filter should match")
+-      assertThat(planAsString)
+-          .as("Post scan filter should match")
 -          .contains("Filter (" + sparkFilter + ")");
-+          .contains("CometFilter");
++      assertThat(planAsString).as("Post scan filter should match").contains("CometFilter");
      } else {
        assertThat(planAsString).as("Should be no post scan filter").doesNotContain("Filter (");
      }

From 468da8aa67bf0ed75295c17a8f39ee547bdee42a Mon Sep 17 00:00:00 2001
From: hsiang-c <huangc@apple.com>
Date: Tue, 19 Aug 2025 10:32:56 -0700
Subject: [PATCH 27/27] Added missing files to diff

---
 dev/diffs/iceberg/1.8.1.diff | 522 +++++++++++++++++++++++++++++++++++
 1 file changed, 522 insertions(+)

diff --git a/dev/diffs/iceberg/1.8.1.diff b/dev/diffs/iceberg/1.8.1.diff
index 5ca5e51966..3b9dab9aec 100644
--- a/dev/diffs/iceberg/1.8.1.diff
+++ b/dev/diffs/iceberg/1.8.1.diff
@@ -37,6 +37,528 @@ index 04ffa8f..cc0099c 100644
  sqlite-jdbc = "3.48.0.0"
  testcontainers = "1.20.4"
  tez010 = "0.10.4"
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
+new file mode 100644
+index 0000000..ddf6c7d
+--- /dev/null
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometTypeUtils.java
+@@ -0,0 +1,255 @@
++/*
++ * Licensed to the Apache Software Foundation (ASF) under one
++ * or more contributor license agreements.  See the NOTICE file
++ * distributed with this work for additional information
++ * regarding copyright ownership.  The ASF licenses this file
++ * to you under the Apache License, Version 2.0 (the
++ * "License"); you may not use this file except in compliance
++ * with the License.  You may obtain a copy of the License at
++ *
++ *   http://www.apache.org/licenses/LICENSE-2.0
++ *
++ * Unless required by applicable law or agreed to in writing,
++ * software distributed under the License is distributed on an
++ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
++ * KIND, either express or implied.  See the License for the
++ * specific language governing permissions and limitations
++ * under the License.
++ */
++package org.apache.iceberg.parquet;
++
++import java.util.Map;
++import org.apache.comet.parquet.ParquetColumnSpec;
++import org.apache.iceberg.relocated.com.google.common.collect.Maps;
++import org.apache.parquet.column.ColumnDescriptor;
++import org.apache.parquet.schema.LogicalTypeAnnotation;
++import org.apache.parquet.schema.PrimitiveType;
++import org.apache.parquet.schema.Type;
++import org.apache.parquet.schema.Types;
++
++public class CometTypeUtils {
++
++  private CometTypeUtils() {}
++
++  public static ParquetColumnSpec descriptorToParquetColumnSpec(ColumnDescriptor descriptor) {
++
++    String[] path = descriptor.getPath();
++    PrimitiveType primitiveType = descriptor.getPrimitiveType();
++    String physicalType = primitiveType.getPrimitiveTypeName().name();
++
++    int typeLength =
++        primitiveType.getPrimitiveTypeName() == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY
++            ? primitiveType.getTypeLength()
++            : 0;
++
++    boolean isRepeated = primitiveType.getRepetition() == Type.Repetition.REPEATED;
++
++    // ToDo: extract this into a Util method
++    String logicalTypeName = null;
++    Map<String, String> logicalTypeParams = Maps.newHashMap();
++    LogicalTypeAnnotation logicalType = primitiveType.getLogicalTypeAnnotation();
++
++    if (logicalType != null) {
++      logicalTypeName = logicalType.getClass().getSimpleName();
++
++      // Handle specific logical types
++      if (logicalType instanceof LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.DecimalLogicalTypeAnnotation decimal =
++            (LogicalTypeAnnotation.DecimalLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("precision", String.valueOf(decimal.getPrecision()));
++        logicalTypeParams.put("scale", String.valueOf(decimal.getScale()));
++      } else if (logicalType instanceof LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.TimestampLogicalTypeAnnotation timestamp =
++            (LogicalTypeAnnotation.TimestampLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(timestamp.isAdjustedToUTC()));
++        logicalTypeParams.put("unit", timestamp.getUnit().name());
++      } else if (logicalType instanceof LogicalTypeAnnotation.TimeLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.TimeLogicalTypeAnnotation time =
++            (LogicalTypeAnnotation.TimeLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isAdjustedToUTC", String.valueOf(time.isAdjustedToUTC()));
++        logicalTypeParams.put("unit", time.getUnit().name());
++      } else if (logicalType instanceof LogicalTypeAnnotation.IntLogicalTypeAnnotation) {
++        LogicalTypeAnnotation.IntLogicalTypeAnnotation intType =
++            (LogicalTypeAnnotation.IntLogicalTypeAnnotation) logicalType;
++        logicalTypeParams.put("isSigned", String.valueOf(intType.isSigned()));
++        logicalTypeParams.put("bitWidth", String.valueOf(intType.getBitWidth()));
++      }
++    }
++
++    return new ParquetColumnSpec(
++        1, // ToDo: pass in the correct id
++        path,
++        physicalType,
++        typeLength,
++        isRepeated,
++        descriptor.getMaxDefinitionLevel(),
++        descriptor.getMaxRepetitionLevel(),
++        logicalTypeName,
++        logicalTypeParams);
++  }
++
++  public static ColumnDescriptor buildColumnDescriptor(ParquetColumnSpec columnSpec) {
++    PrimitiveType.PrimitiveTypeName primType =
++        PrimitiveType.PrimitiveTypeName.valueOf(columnSpec.getPhysicalType());
++
++    Type.Repetition repetition;
++    if (columnSpec.getMaxRepetitionLevel() > 0) {
++      repetition = Type.Repetition.REPEATED;
++    } else if (columnSpec.getMaxDefinitionLevel() > 0) {
++      repetition = Type.Repetition.OPTIONAL;
++    } else {
++      repetition = Type.Repetition.REQUIRED;
++    }
++
++    String name = columnSpec.getPath()[columnSpec.getPath().length - 1];
++    // Reconstruct the logical type from parameters
++    LogicalTypeAnnotation logicalType = null;
++    if (columnSpec.getLogicalTypeName() != null) {
++      logicalType =
++          reconstructLogicalType(
++              columnSpec.getLogicalTypeName(), columnSpec.getLogicalTypeParams());
++    }
++
++    PrimitiveType primitiveType;
++    if (primType == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY) {
++      primitiveType =
++          org.apache.parquet.schema.Types.primitive(primType, repetition)
++              .length(columnSpec.getTypeLength())
++              .as(logicalType)
++              .id(columnSpec.getFieldId())
++              .named(name);
++    } else {
++      primitiveType =
++          Types.primitive(primType, repetition)
++              .as(logicalType)
++              .id(columnSpec.getFieldId())
++              .named(name);
++    }
++
++    return new ColumnDescriptor(
++        columnSpec.getPath(),
++        primitiveType,
++        columnSpec.getMaxRepetitionLevel(),
++        columnSpec.getMaxDefinitionLevel());
++  }
++
++  private static LogicalTypeAnnotation reconstructLogicalType(
++      String logicalTypeName, java.util.Map<String, String> params) {
++
++    switch (logicalTypeName) {
++        // MAP
++      case "MapLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.mapType();
++
++        // LIST
++      case "ListLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.listType();
++
++        // STRING
++      case "StringLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.stringType();
++
++        // MAP_KEY_VALUE
++      case "MapKeyValueLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.MapKeyValueTypeAnnotation.getInstance();
++
++        // ENUM
++      case "EnumLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.enumType();
++
++        // DECIMAL
++      case "DecimalLogicalTypeAnnotation":
++        if (!params.containsKey("scale") || !params.containsKey("precision")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for DecimalLogicalTypeAnnotation: " + params);
++        }
++        int scale = Integer.parseInt(params.get("scale"));
++        int precision = Integer.parseInt(params.get("precision"));
++        return LogicalTypeAnnotation.decimalType(scale, precision);
++
++        // DATE
++      case "DateLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.dateType();
++
++        // TIME
++      case "TimeLogicalTypeAnnotation":
++        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for TimeLogicalTypeAnnotation: " + params);
++        }
++
++        boolean isUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
++        String timeUnitStr = params.get("unit");
++
++        LogicalTypeAnnotation.TimeUnit timeUnit;
++        switch (timeUnitStr) {
++          case "MILLIS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.MILLIS;
++            break;
++          case "MICROS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.MICROS;
++            break;
++          case "NANOS":
++            timeUnit = LogicalTypeAnnotation.TimeUnit.NANOS;
++            break;
++          default:
++            throw new IllegalArgumentException("Unknown time unit: " + timeUnitStr);
++        }
++        return LogicalTypeAnnotation.timeType(isUTC, timeUnit);
++
++        // TIMESTAMP
++      case "TimestampLogicalTypeAnnotation":
++        if (!params.containsKey("isAdjustedToUTC") || !params.containsKey("unit")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for TimestampLogicalTypeAnnotation: " + params);
++        }
++        boolean isAdjustedToUTC = Boolean.parseBoolean(params.get("isAdjustedToUTC"));
++        String unitStr = params.get("unit");
++
++        LogicalTypeAnnotation.TimeUnit unit;
++        switch (unitStr) {
++          case "MILLIS":
++            unit = LogicalTypeAnnotation.TimeUnit.MILLIS;
++            break;
++          case "MICROS":
++            unit = LogicalTypeAnnotation.TimeUnit.MICROS;
++            break;
++          case "NANOS":
++            unit = LogicalTypeAnnotation.TimeUnit.NANOS;
++            break;
++          default:
++            throw new IllegalArgumentException("Unknown timestamp unit: " + unitStr);
++        }
++        return LogicalTypeAnnotation.timestampType(isAdjustedToUTC, unit);
++
++        // INTEGER
++      case "IntLogicalTypeAnnotation":
++        if (!params.containsKey("isSigned") || !params.containsKey("bitWidth")) {
++          throw new IllegalArgumentException(
++              "Missing required parameters for IntLogicalTypeAnnotation: " + params);
++        }
++        boolean isSigned = Boolean.parseBoolean(params.get("isSigned"));
++        int bitWidth = Integer.parseInt(params.get("bitWidth"));
++        return LogicalTypeAnnotation.intType(bitWidth, isSigned);
++
++        // JSON
++      case "JsonLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.jsonType();
++
++        // BSON
++      case "BsonLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.bsonType();
++
++        // UUID
++      case "UUIDLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.uuidType();
++
++        // INTERVAL
++      case "IntervalLogicalTypeAnnotation":
++        return LogicalTypeAnnotation.IntervalLogicalTypeAnnotation.getInstance();
++
++      default:
++        throw new IllegalArgumentException("Unknown logical type: " + logicalTypeName);
++    }
++  }
++}
+diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
+new file mode 100644
+index 0000000..88b195b
+--- /dev/null
++++ b/parquet/src/main/java/org/apache/iceberg/parquet/CometVectorizedParquetReader.java
+@@ -0,0 +1,255 @@
++/*
++ * Licensed to the Apache Software Foundation (ASF) under one
++ * or more contributor license agreements.  See the NOTICE file
++ * distributed with this work for additional information
++ * regarding copyright ownership.  The ASF licenses this file
++ * to you under the Apache License, Version 2.0 (the
++ * "License"); you may not use this file except in compliance
++ * with the License.  You may obtain a copy of the License at
++ *
++ *   http://www.apache.org/licenses/LICENSE-2.0
++ *
++ * Unless required by applicable law or agreed to in writing,
++ * software distributed under the License is distributed on an
++ * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
++ * KIND, either express or implied.  See the License for the
++ * specific language governing permissions and limitations
++ * under the License.
++ */
++package org.apache.iceberg.parquet;
++
++import java.io.IOException;
++import java.io.UncheckedIOException;
++import java.nio.ByteBuffer;
++import java.util.List;
++import java.util.Map;
++import java.util.NoSuchElementException;
++import java.util.function.Function;
++import org.apache.comet.parquet.FileReader;
++import org.apache.comet.parquet.ParquetColumnSpec;
++import org.apache.comet.parquet.ReadOptions;
++import org.apache.comet.parquet.RowGroupReader;
++import org.apache.comet.parquet.WrappedInputFile;
++import org.apache.hadoop.conf.Configuration;
++import org.apache.iceberg.Schema;
++import org.apache.iceberg.exceptions.RuntimeIOException;
++import org.apache.iceberg.expressions.Expression;
++import org.apache.iceberg.expressions.Expressions;
++import org.apache.iceberg.io.CloseableGroup;
++import org.apache.iceberg.io.CloseableIterable;
++import org.apache.iceberg.io.CloseableIterator;
++import org.apache.iceberg.io.InputFile;
++import org.apache.iceberg.mapping.NameMapping;
++import org.apache.iceberg.relocated.com.google.common.collect.Lists;
++import org.apache.iceberg.util.ByteBuffers;
++import org.apache.parquet.ParquetReadOptions;
++import org.apache.parquet.column.ColumnDescriptor;
++import org.apache.parquet.hadoop.metadata.ColumnChunkMetaData;
++import org.apache.parquet.hadoop.metadata.ColumnPath;
++import org.apache.parquet.schema.MessageType;
++
++public class CometVectorizedParquetReader<T> extends CloseableGroup
++    implements CloseableIterable<T> {
++  private final InputFile input;
++  private final ParquetReadOptions options;
++  private final Schema expectedSchema;
++  private final Function<MessageType, VectorizedReader<?>> batchReaderFunc;
++  private final Expression filter;
++  private final boolean reuseContainers;
++  private final boolean caseSensitive;
++  private final int batchSize;
++  private final NameMapping nameMapping;
++  private final Map<String, String> properties;
++  private Long start = null;
++  private Long length = null;
++  private ByteBuffer fileEncryptionKey = null;
++  private ByteBuffer fileAADPrefix = null;
++
++  public CometVectorizedParquetReader(
++      InputFile input,
++      Schema expectedSchema,
++      ParquetReadOptions options,
++      Function<MessageType, VectorizedReader<?>> readerFunc,
++      NameMapping nameMapping,
++      Expression filter,
++      boolean reuseContainers,
++      boolean caseSensitive,
++      int maxRecordsPerBatch,
++      Map<String, String> properties,
++      Long start,
++      Long length,
++      ByteBuffer fileEncryptionKey,
++      ByteBuffer fileAADPrefix) {
++    this.input = input;
++    this.expectedSchema = expectedSchema;
++    this.options = options;
++    this.batchReaderFunc = readerFunc;
++    // replace alwaysTrue with null to avoid extra work evaluating a trivial filter
++    this.filter = filter == Expressions.alwaysTrue() ? null : filter;
++    this.reuseContainers = reuseContainers;
++    this.caseSensitive = caseSensitive;
++    this.batchSize = maxRecordsPerBatch;
++    this.nameMapping = nameMapping;
++    this.properties = properties;
++    this.start = start;
++    this.length = length;
++    this.fileEncryptionKey = fileEncryptionKey;
++    this.fileAADPrefix = fileAADPrefix;
++  }
++
++  private ReadConf conf = null;
++
++  private ReadConf init() {
++    if (conf == null) {
++      ReadConf readConf =
++          new ReadConf(
++              input,
++              options,
++              expectedSchema,
++              filter,
++              null,
++              batchReaderFunc,
++              nameMapping,
++              reuseContainers,
++              caseSensitive,
++              batchSize);
++      this.conf = readConf.copy();
++      return readConf;
++    }
++    return conf;
++  }
++
++  @Override
++  public CloseableIterator<T> iterator() {
++    FileIterator<T> iter =
++        new FileIterator<>(init(), properties, start, length, fileEncryptionKey, fileAADPrefix);
++    addCloseable(iter);
++    return iter;
++  }
++
++  private static class FileIterator<T> implements CloseableIterator<T> {
++    // private final ParquetFileReader reader;
++    private final boolean[] shouldSkip;
++    private final VectorizedReader<T> model;
++    private final long totalValues;
++    private final int batchSize;
++    private final List<Map<ColumnPath, ColumnChunkMetaData>> columnChunkMetadata;
++    private final boolean reuseContainers;
++    private int nextRowGroup = 0;
++    private long nextRowGroupStart = 0;
++    private long valuesRead = 0;
++    private T last = null;
++    private final FileReader cometReader;
++
++    FileIterator(
++        ReadConf conf,
++        Map<String, String> properties,
++        Long start,
++        Long length,
++        ByteBuffer fileEncryptionKey,
++        ByteBuffer fileAADPrefix) {
++      this.shouldSkip = conf.shouldSkip();
++      this.totalValues = conf.totalValues();
++      this.reuseContainers = conf.reuseContainers();
++      this.model = conf.vectorizedModel();
++      this.batchSize = conf.batchSize();
++      this.model.setBatchSize(this.batchSize);
++      this.columnChunkMetadata = conf.columnChunkMetadataForRowGroups();
++      this.cometReader =
++          newCometReader(
++              conf.file(),
++              conf.projection(),
++              properties,
++              start,
++              length,
++              fileEncryptionKey,
++              fileAADPrefix);
++    }
++
++    private FileReader newCometReader(
++        InputFile file,
++        MessageType projection,
++        Map<String, String> properties,
++        Long start,
++        Long length,
++        ByteBuffer fileEncryptionKey,
++        ByteBuffer fileAADPrefix) {
++      try {
++        ReadOptions cometOptions = ReadOptions.builder(new Configuration()).build();
++
++        FileReader fileReader =
++            new FileReader(
++                new WrappedInputFile(file),
++                cometOptions,
++                properties,
++                start,
++                length,
++                ByteBuffers.toByteArray(fileEncryptionKey),
++                ByteBuffers.toByteArray(fileAADPrefix));
++
++        List<ColumnDescriptor> columnDescriptors = projection.getColumns();
++
++        List<ParquetColumnSpec> specs = Lists.newArrayList();
++
++        for (ColumnDescriptor descriptor : columnDescriptors) {
++          ParquetColumnSpec spec = CometTypeUtils.descriptorToParquetColumnSpec(descriptor);
++          specs.add(spec);
++        }
++
++        fileReader.setRequestedSchemaFromSpecs(specs);
++        return fileReader;
++      } catch (IOException e) {
++        throw new UncheckedIOException("Failed to open Parquet file: " + file.location(), e);
++      }
++    }
++
++    @Override
++    public boolean hasNext() {
++      return valuesRead < totalValues;
++    }
++
++    @Override
++    public T next() {
++      if (!hasNext()) {
++        throw new NoSuchElementException();
++      }
++      if (valuesRead >= nextRowGroupStart) {
++        advance();
++      }
++
++      // batchSize is an integer, so casting to integer is safe
++      int numValuesToRead = (int) Math.min(nextRowGroupStart - valuesRead, batchSize);
++      if (reuseContainers) {
++        this.last = model.read(last, numValuesToRead);
++      } else {
++        this.last = model.read(null, numValuesToRead);
++      }
++      valuesRead += numValuesToRead;
++
++      return last;
++    }
++
++    private void advance() {
++      while (shouldSkip[nextRowGroup]) {
++        nextRowGroup += 1;
++        cometReader.skipNextRowGroup();
++      }
++      RowGroupReader pages;
++      try {
++        pages = cometReader.readNextRowGroup();
++      } catch (IOException e) {
++        throw new RuntimeIOException(e);
++      }
++
++      model.setRowGroupInfo(pages, columnChunkMetadata.get(nextRowGroup));
++      nextRowGroupStart += pages.getRowCount();
++      nextRowGroup += 1;
++    }
++
++    @Override
++    public void close() throws IOException {
++      model.close();
++      cometReader.close();
++    }
++  }
++}
 diff --git a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java b/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java
 index 2c37a52..3442cfc 100644
 --- a/parquet/src/main/java/org/apache/iceberg/parquet/Parquet.java