github

Messages by Thread

[PR] fix: NOT IN with NULL subquery returns wrong results under SortMergeJoin [datafusion] via GitHub
[PR] build(deps): bump github/codeql-action from 4.35.4 to 4.36.2 [datafusion-python] via GitHub
Re: [PR] build(deps): bump github/codeql-action from 4.35.4 to 4.36.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump github/codeql-action from 4.35.4 to 4.36.0 [datafusion-python] via GitHub
[PR] build(deps): bump astral-sh/setup-uv from 8.1.0 to 8.2.0 [datafusion-python] via GitHub
[PR] Add example for PartitionedFile schema [datafusion] via GitHub
[I] For `NestedLoopJoinExec`: split probe-completion into a `ProbeEnd` state [datafusion] via GitHub
- Re: [I] For `NestedLoopJoinExec`: split probe-completion into a `ProbeEnd` state [datafusion] via GitHub
[PR] add clickbench sorted SQL benchmark [datafusion] via GitHub
Re: [PR] feat: extend interval arithmetic to support scalar functions (UDFs) [datafusion] via GitHub
- Re: [PR] feat: extend interval arithmetic to support scalar functions (UDFs) [datafusion] via GitHub
[I] Align `DataFrame::fill_null` column argument with `fill_nan` [datafusion] via GitHub
- Re: [I] Align `DataFrame::fill_null` column argument with `fill_nan` [datafusion] via GitHub
[PR] Add nlj SQL benchmark [datafusion] via GitHub
[PR] Add clickbench extended SQL benchmark [datafusion] via GitHub
[PR] Feat/delta kernel read [datafusion-comet] via GitHub
- Re: [PR] Feat/delta kernel read [datafusion-comet] via GitHub
- Re: [PR] Feat/delta kernel read [datafusion-comet] via GitHub
[PR] Add smj SQL benchmark [datafusion] via GitHub
[PR] Add hj Sql benchmark [datafusion] via GitHub
[PR] Add tpcds SQL benchmark [datafusion] via GitHub
Re: [PR] fix: address escape literal issue #21516 [datafusion] via GitHub
Re: [I] bug: datafusion-spark format_string %t timestamp specifiers do not match Spark behavior [datafusion] via GitHub
Re: [I] Improve aggregation across entire dataframe [datafusion-python] via GitHub
[I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
- Re: [I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
- Re: [I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
- Re: [I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
- Re: [I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
- Re: [I] Add support for `DataFrame.cache()` to Ballista [datafusion-ballista] via GitHub
[PR] feat(TUI): enable different plan rendering format for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
- Re: [PR] feat(TUI): enable various plan rendering formats for stages [datafusion-ballista] via GitHub
[PR] minor: More comments to `AggregateMode::PartialReduce` [datafusion] via GitHub
[I] Add `any_value` aggregate function [datafusion] via GitHub
- Re: [I] Add `any_value` aggregate function [datafusion] via GitHub
[I] Improve shuffle (column) statistics [datafusion-ballista] via GitHub
[I] TPCDS Q72 Fails with `OffsetOverflowError(2147731589)` [datafusion-ballista] via GitHub
- Re: [I] TPCDS Q72 Fails with `OffsetOverflowError(2147731589)` (AQE) [datafusion-ballista] via GitHub
- Re: [I] TPCDS Q72 Fails with `OffsetOverflowError(2147731589)` (AQE) [datafusion-ballista] via GitHub
- Re: [I] TPCDS Q72 Fails with `OffsetOverflowError(2147731589)` (AQE) [datafusion-ballista] via GitHub
[PR] draft: Extra transient mem [datafusion] via GitHub
- Re: [PR] draft: Extra transient mem [datafusion] via GitHub
[PR] feat(tui): Add configuration popup for jobs [datafusion-ballista] via GitHub
[PR] FFI: plumb with_updated_config for FFI_ScalarUDF [datafusion] via GitHub
- Re: [PR] FFI: plumb with_updated_config for FFI_ScalarUDF [datafusion] via GitHub
[I] `approx_distinct` over-counts `Utf8View` because the hash strategy is chosen per batch instead of per value [datafusion] via GitHub
- Re: [I] `approx_distinct` over-counts `Utf8View` because the hash strategy is chosen per batch instead of per value [datafusion] via GitHub
Re: [I] Write a wikipedia article for Apache DataFusion [datafusion] via GitHub
Re: [PR] [vibebench] feat: implement GroupJoin optimization (Moerkotte & Neumann, VLDB 2011) [datafusion] via GitHub
Re: [PR] bench: add benchmark for map_extract function [datafusion] via GitHub
Re: [PR] perf: optimize `map_extract` function lookup for common key types [datafusion] via GitHub
Re: [PR] feat: transitive predicate propagation across multi-table join chains [datafusion] via GitHub
Re: [PR] fix(spark): preserve raw number text in `json_tuple` to match Spark [datafusion] via GitHub
[PR] build(deps): bump chrono from 0.4.44 to 0.4.45 [datafusion-python] via GitHub
[PR] build(deps): bump log from 0.4.30 to 0.4.32 [datafusion-python] via GitHub
[I] Skip loading the Parquet page index when row-group statistics already prove it cannot prune [datafusion] via GitHub
- Re: [I] Skip loading the Parquet page index when row-group statistics already prove it cannot prune [datafusion] via GitHub
[PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
Re: [PR] Adding support for PostgreSQL's XML functions [datafusion-sqlparser-rs] via GitHub
[PR] Support aliased function arguments (expr AS name) [datafusion-sqlparser-rs] via GitHub
[I] Optimize semi, anti join index alignment [datafusion] via GitHub
- Re: [I] Optimize semi, anti join index alignment [datafusion] via GitHub
- Re: [I] Optimize semi, anti join index alignment [datafusion] via GitHub
[PR] feat: Add From<Option<T>> trait for Precision enum [datafusion] via GitHub
[PR] fix: NestedLoopJoinExec emits spurious unmatched-left rows with multiple probe partitions [datafusion] via GitHub
- Re: [PR] fix: NestedLoopJoinExec emits spurious unmatched-left rows with multiple probe partitions [datafusion] via GitHub
- Re: [PR] fix: NestedLoopJoinExec emits spurious unmatched-left rows with multiple probe partitions [datafusion] via GitHub
[PR] feat: route Map → Map casts to native cast_map_to_map [datafusion-comet] via GitHub
[PR] feat(cli): use local time in tracing subscriber logging for ballista-cli [datafusion-ballista] via GitHub
[I] logging file of ballista-cli doesn't use local time [datafusion-ballista] via GitHub
[PR] minor: handle NULL array input in array_remove and array_replace [datafusion] via GitHub
[PR] test: make ensure_requirements tests deterministic [datafusion] via GitHub
- Re: [PR] test: make ensure_requirements tests deterministic [datafusion] via GitHub
- Re: [PR] test: make ensure_requirements tests deterministic [datafusion] via GitHub
Re: [PR] fix: Optimize projections in recursive CTEs [datafusion] via GitHub
- Re: [PR] fix: Optimize projections in recursive CTEs [datafusion] via GitHub
[I] Support Substrait exchange output for range repartitioning [datafusion] via GitHub
[I] Support planning logical range repartitioning [datafusion] via GitHub
[I] Support logical protobuf serialization for range repartitioning [datafusion] via GitHub
Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
- Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
- Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
- Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
[PR] Add blog post: The Arrow C Data Interface: Zero-Copy Between Rust and the JVM in DataFusion Comet [datafusion-site] via GitHub
Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
Re: [I] Release DataFusion `54.1.0` (minor/patch) Release [datafusion] via GitHub
[PR] [branch-54] fix: preserve null_aware on logical JoinNode proto round-trip (backport #22104) [datafusion] via GitHub
Re: [PR] Parser: fix exponential parse time on compound keyword chains [datafusion-sqlparser-rs] via GitHub
[PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
- Re: [PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
- Re: [PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
- Re: [PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
[PR] fix: map() fails when keys are literals and values are column expressions [datafusion] via GitHub
- Re: [PR] fix: map() fails when keys are literals and values are column expressions [datafusion] via GitHub
Re: [PR] feat: add scoped physical expression traversal [datafusion] via GitHub
Re: [PR] feat: BufferExec waits for hash join dynamic filters before buffering [datafusion] via GitHub
Re: [PR] feat: Attach Diagnostic to duplicate table name error [datafusion] via GitHub
[PR] Make LogicalPlan::Unnest expression/rebuild contracts consistent [datafusion] via GitHub
- Re: [PR] Make LogicalPlan::Unnest expression/rebuild contracts consistent [datafusion] via GitHub
- Re: [PR] Make LogicalPlan::Unnest expression/rebuild contracts consistent [datafusion] via GitHub
Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
- Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
- Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
[PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
[PR] build(deps-dev): bump pyarrow from 22.0.0 to 23.0.1 [datafusion-python] via GitHub
[I] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [I] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
[PR] PostgreSQL: accept CREATE SEQUENCE options in any clause order [datafusion-sqlparser-rs] via GitHub
[PR] PostgreSQL: support INCLUDE on PRIMARY KEY / UNIQUE table constraints [datafusion-sqlparser-rs] via GitHub
Re: [PR] chore: run CI on forks [datafusion-comet] via GitHub
[PR] Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
- Re: [PR] Microsoft sql server: Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
- Re: [PR] Microsoft sql server: Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
[PR] docs: convert reStructuredText sources to MyST markdown [datafusion-python] via GitHub
Re: [I] Add support for Spark SQL dialect [datafusion] via GitHub
Re: [I] Track parse_url Spark compatibility work [datafusion-comet] via GitHub
- Re: [I] Track parse_url Spark compatibility work [datafusion-comet] via GitHub
[I] CI failing on main: test_filter_over_multi_partition_sort_limit is CPU-count dependent (RepartitionExec(32) vs 16 partitions) [datafusion] via GitHub
- Re: [I] CI failing on main: test_filter_over_multi_partition_sort_limit is CPU-count dependent (RepartitionExec(32) vs 16 partitions) [datafusion] via GitHub
Re: [I] [iceberg] Deprecate methods used for Iceberg support that break Parquet encapsulation [datafusion-comet] via GitHub
- Re: [I] [iceberg] Deprecate methods used for Iceberg support that break Parquet encapsulation [datafusion-comet] via GitHub
Re: [I] Clean up metrics parameter in NativeBatchReader [datafusion-comet] via GitHub
- Re: [I] Clean up metrics parameter in NativeBatchReader [datafusion-comet] via GitHub
[I] map() fails with 'key and value lists must have the same length' when keys are literals and values are column expressions [datafusion] via GitHub
[PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
[I] Stats for no-grouping agg are wrong for partial output mode [datafusion] via GitHub
- Re: [I] Stats for no-grouping agg are wrong for partial output mode [datafusion] via GitHub
[I] Support logical range repartitioning end to end [datafusion] via GitHub
[PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] [WIP] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
Re: [I] chore: DataFusion 54.0.0 [datafusion-comet] via GitHub
- Re: [I] chore: DataFusion 54.0.0 [datafusion-comet] via GitHub
Re: [I] Avoid inlining non deterministic CTE [datafusion] via GitHub
Re: [PR] refactor(context): deduplicate register/read option-building logic [datafusion-python] via GitHub
Re: [PR] Add StatisticsContext parameter to partition_statistics [datafusion] via GitHub
[PR] feat(sqllogictest): SLT-opt-in memory overdraft factor + actionable error [datafusion] via GitHub
[PR] docs: refresh theme — pydata-sphinx-theme 0.16, top navbar, dark mode [datafusion-python] via GitHub
- Re: [PR] Improve documentation site layout [datafusion-python] via GitHub
- Re: [PR] Improve documentation site layout [datafusion-python] via GitHub
- Re: [PR] Improve documentation site layout [datafusion-python] via GitHub
Re: [I] Simplified filter expression has a Null type instead of Int64 type across the FFI layer [datafusion-python] via GitHub
[I] update merge_batch's docs for opt_filter in GroupsAccumulator [datafusion] via GitHub

Earlier messages