github

Messages by Thread

Re: [PR] [vibebench] feat: implement GroupJoin optimization (Moerkotte & Neumann, VLDB 2011) [datafusion] via GitHub
Re: [PR] bench: add benchmark for map_extract function [datafusion] via GitHub
Re: [PR] perf: optimize `map_extract` function lookup for common key types [datafusion] via GitHub
Re: [PR] feat: transitive predicate propagation across multi-table join chains [datafusion] via GitHub
Re: [PR] fix(spark): preserve raw number text in `json_tuple` to match Spark [datafusion] via GitHub
[PR] build(deps): bump chrono from 0.4.44 to 0.4.45 [datafusion-python] via GitHub
[PR] build(deps): bump log from 0.4.30 to 0.4.32 [datafusion-python] via GitHub
[I] Skip loading the Parquet page index when row-group statistics already prove it cannot prune [datafusion] via GitHub
[PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
- Re: [PR] perf: Optimize semi-, anti-join index alignment [datafusion] via GitHub
Re: [PR] Adding support for PostgreSQL's XML functions [datafusion-sqlparser-rs] via GitHub
[PR] Support aliased function arguments (expr AS name) [datafusion-sqlparser-rs] via GitHub
[I] Optimize semi, anti join index alignment [datafusion] via GitHub
- Re: [I] Optimize semi, anti join index alignment [datafusion] via GitHub
[PR] feat: Add From<Option<T>> trait for Precision enum [datafusion] via GitHub
[PR] fix: NestedLoopJoinExec emits spurious unmatched-left rows with multiple probe partitions [datafusion] via GitHub
- Re: [PR] fix: NestedLoopJoinExec emits spurious unmatched-left rows with multiple probe partitions [datafusion] via GitHub
[PR] feat: route Map → Map casts to native cast_map_to_map [datafusion-comet] via GitHub
[PR] feat(cli): use local time in tracing subscriber logging for ballista-cli [datafusion-ballista] via GitHub
[I] logging file of ballista-cli doesn't use local time [datafusion-ballista] via GitHub
[PR] minor: handle NULL array input in array_remove and array_replace [datafusion] via GitHub
[PR] test: make ensure_requirements tests deterministic [datafusion] via GitHub
Re: [PR] fix: Optimize projections in recursive CTEs [datafusion] via GitHub
[I] Support Substrait exchange output for range repartitioning [datafusion] via GitHub
[I] Support planning logical range repartitioning [datafusion] via GitHub
[I] Support logical protobuf serialization for range repartitioning [datafusion] via GitHub
Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
- Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
- Re: [PR] feat: add Spark-compatible arrays_zip function [datafusion] via GitHub
[PR] Add blog post: The Arrow C Data Interface: Zero-Copy Between Rust and the JVM in DataFusion Comet [datafusion-site] via GitHub
Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
- Re: [PR] feat(spark): add `concat_ws` with array support [datafusion] via GitHub
Re: [I] Release DataFusion `54.1.0` (minor/patch) Release [datafusion] via GitHub
[PR] [branch-54] fix: preserve null_aware on logical JoinNode proto round-trip (backport #22104) [datafusion] via GitHub
Re: [PR] Parser: fix exponential parse time on compound keyword chains [datafusion-sqlparser-rs] via GitHub
[PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
- Re: [PR] Allow `DataFrame.aggregate` to accept `None` for no grouping [datafusion-python] via GitHub
[PR] fix: map() fails when keys are literals and values are column expressions [datafusion] via GitHub
- Re: [PR] fix: map() fails when keys are literals and values are column expressions [datafusion] via GitHub
Re: [PR] feat: add scoped physical expression traversal [datafusion] via GitHub
Re: [PR] feat: BufferExec waits for hash join dynamic filters before buffering [datafusion] via GitHub
Re: [PR] feat: Attach Diagnostic to duplicate table name error [datafusion] via GitHub
[PR] Make LogicalPlan::Unnest expression/rebuild contracts consistent [datafusion] via GitHub
- Re: [PR] Make LogicalPlan::Unnest expression/rebuild contracts consistent [datafusion] via GitHub
Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
- Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
- Re: [PR] perf : experiment roaring bitmap for int32 anti and semi joins [datafusion] via GitHub
[PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [PR] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
[PR] build(deps-dev): bump pyarrow from 22.0.0 to 23.0.1 [datafusion-python] via GitHub
[I] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
- Re: [I] feat(session): add tableExists and deregisterTable to SessionContext [datafusion-java] via GitHub
[PR] PostgreSQL: accept CREATE SEQUENCE options in any clause order [datafusion-sqlparser-rs] via GitHub
[PR] PostgreSQL: support INCLUDE on PRIMARY KEY / UNIQUE table constraints [datafusion-sqlparser-rs] via GitHub
Re: [PR] chore: run CI on forks [datafusion-comet] via GitHub
[PR] Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
- Re: [PR] Microsoft sql server: Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
- Re: [PR] Microsoft sql server: Escape quotes in national string display [datafusion-sqlparser-rs] via GitHub
[PR] docs: convert reStructuredText sources to MyST markdown [datafusion-python] via GitHub
Re: [I] Add support for Spark SQL dialect [datafusion] via GitHub
Re: [I] Track parse_url Spark compatibility work [datafusion-comet] via GitHub
- Re: [I] Track parse_url Spark compatibility work [datafusion-comet] via GitHub
[I] CI failing on main: test_filter_over_multi_partition_sort_limit is CPU-count dependent (RepartitionExec(32) vs 16 partitions) [datafusion] via GitHub
Re: [I] [iceberg] Deprecate methods used for Iceberg support that break Parquet encapsulation [datafusion-comet] via GitHub
- Re: [I] [iceberg] Deprecate methods used for Iceberg support that break Parquet encapsulation [datafusion-comet] via GitHub
Re: [I] Clean up metrics parameter in NativeBatchReader [datafusion-comet] via GitHub
- Re: [I] Clean up metrics parameter in NativeBatchReader [datafusion-comet] via GitHub
[I] map() fails with 'key and value lists must have the same length' when keys are literals and values are column expressions [datafusion] via GitHub
[PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
- Re: [PR] fix: Correct output-count stats for partitioned partial aggs [datafusion] via GitHub
[I] Stats for no-grouping agg are wrong for partial output mode [datafusion] via GitHub
- Re: [I] Stats for no-grouping agg are wrong for partial output mode [datafusion] via GitHub
[I] Support logical range repartitioning end to end [datafusion] via GitHub
[PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] [WIP] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
- Re: [PR] Add logical range partitioning representation [datafusion] via GitHub
Re: [I] chore: DataFusion 54.0.0 [datafusion-comet] via GitHub
- Re: [I] chore: DataFusion 54.0.0 [datafusion-comet] via GitHub
Re: [I] Avoid inlining non deterministic CTE [datafusion] via GitHub
Re: [PR] refactor(context): deduplicate register/read option-building logic [datafusion-python] via GitHub
Re: [PR] Add StatisticsContext parameter to partition_statistics [datafusion] via GitHub
[PR] feat(sqllogictest): SLT-opt-in memory overdraft factor + actionable error [datafusion] via GitHub
[PR] docs: refresh theme — pydata-sphinx-theme 0.16, top navbar, dark mode [datafusion-python] via GitHub
- Re: [PR] Improve documentation site layout [datafusion-python] via GitHub
Re: [I] Simplified filter expression has a Null type instead of Int64 type across the FFI layer [datafusion-python] via GitHub
[I] update merge_batch's docs for opt_filter in GroupsAccumulator [datafusion] via GitHub
Re: [PR] fix: gc StringView/BinaryView arrays before spilling to prevent write amplification [datafusion] via GitHub
Re: [PR] fix: gc string view arrays in RepartitionExec [datafusion] via GitHub
- Re: [PR] fix: gc string view arrays in RepartitionExec [datafusion] via GitHub
Re: [I] Over-counting of memory in aggregation + repartition over `Utf8View`/`StringViewArray` [datafusion] via GitHub
- Re: [I] Over-counting of memory in aggregation + repartition over `Utf8View`/`StringViewArray` [datafusion] via GitHub
[PR] fix: Coerce aggregate FILTER predicates to boolean [datafusion] via GitHub
- Re: [PR] fix: Coerce aggregate FILTER predicates to boolean [datafusion] via GitHub
- Re: [PR] fix: Coerce aggregate FILTER predicates to boolean [datafusion] via GitHub
- Re: [PR] fix: Coerce aggregate FILTER predicates to boolean [datafusion] via GitHub
[I] Aggregate FILTER fails on NULL predicate [datafusion] via GitHub
- Re: [I] Aggregate FILTER fails on NULL predicate [datafusion] via GitHub
- Re: [I] Aggregate FILTER fails on NULL predicate [datafusion] via GitHub
Re: [I] Incorrect canonicalization of NATURAL JOIN with INNER JOIN in Snowflake dialect produces non-equivalent query [datafusion-sqlparser-rs] via GitHub
[I] Centralize dynamic-filter expression policy outside shared accumulator finalization [datafusion] via GitHub
[PR] chore(deps): bump object_store_opendal from 0.56.0 to 0.57.0 in /native [datafusion-comet] via GitHub
[PR] chore(deps): bump opendal from 0.56.0 to 0.57.0 in /native [datafusion-comet] via GitHub
[PR] chore(deps): bump assertables from 9.9.0 to 10.1.0 in /native [datafusion-comet] via GitHub
[PR] chore(deps): bump the all-other-cargo-deps group in /native with 5 updates [datafusion-comet] via GitHub
[PR] chore(deps): bump github/codeql-action from 4.36.0 to 4.36.2 [datafusion-comet] via GitHub
- Re: [PR] chore(deps): bump github/codeql-action from 4.36.0 to 4.36.2 [datafusion-comet] via GitHub
[PR] chore(deps): bump coursier/setup-action from 1 to 3 [datafusion-comet] via GitHub
- Re: [PR] chore(deps): bump coursier/setup-action from 1 to 3 [datafusion-comet] via GitHub
[PR] chore(shuffle): add interleave_time metric and specify buffer size for output_data buffer writer [datafusion-comet] via GitHub
- Re: [PR] chore(shuffle): add interleave_time metric and specify buffer size for output_data buffer writer [datafusion-comet] via GitHub
- Re: [PR] chore(shuffle): add interleave_time metric and specify buffer size for output_data buffer writer [datafusion-comet] via GitHub
[PR] Refactor projection scalar subquery rewrites to use slot-owned state [datafusion] via GitHub
[PR] chore: Add join benchmarks [datafusion-comet] via GitHub
- Re: [PR] chore: Add join benchmarks [datafusion-comet] via GitHub
- Re: [PR] chore: Add join benchmarks [datafusion-comet] via GitHub
- Re: [PR] chore: Add join benchmarks [datafusion-comet] via GitHub
[PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
- Re: [PR] Refactor `regexp_count_inner` into a unified row-processing pipeline while preserving behavior [datafusion] via GitHub
[PR] chore(deps): bump chrono from 0.4.44 to 0.4.45 [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump chrono from 0.4.44 to 0.4.45 [datafusion-ballista] via GitHub
[PR] chore(deps): bump log from 0.4.31 to 0.4.32 [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump log from 0.4.31 to 0.4.32 [datafusion-ballista] via GitHub
[PR] chore(deps): bump github/codeql-action from 4.36.1 to 4.36.2 [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump github/codeql-action from 4.36.1 to 4.36.2 [datafusion-ballista] via GitHub
[PR] chore(deps): bump taiki-e/install-action from 2.81.3 to 2.81.5 [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump taiki-e/install-action from 2.81.3 to 2.81.5 [datafusion-ballista] via GitHub
[PR] feat: add SessionContextBuilder.withSparkFunctions for Spark-compatible functions [datafusion-java] via GitHub
- Re: [PR] feat: add SessionContextBuilder.withSparkFunctions for Spark-compatible functions [datafusion-java] via GitHub
[I] Make `LogicalPlan::Unnest` expression/rebuild contracts explicit [datafusion] via GitHub
- Re: [I] Make `LogicalPlan::Unnest` expression/rebuild contracts explicit [datafusion] via GitHub
Re: [I] logical JoinNode proto missing null_aware field (follow-up to #19635) [datafusion] via GitHub
- Re: [I] logical JoinNode proto missing null_aware field (follow-up to #19635) [datafusion] via GitHub
- Re: [I] logical JoinNode proto missing null_aware field (follow-up to #19635) [datafusion] via GitHub
- Re: [I] logical JoinNode proto missing null_aware field (follow-up to #19635) [datafusion] via GitHub
Re: [PR] Optimize character_length UDF performance [datafusion] via GitHub
[PR] improve approx_distinct for small value [datafusion] via GitHub
- Re: [PR] improve approx_distinct for small value [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
- Re: [PR] perf: improve approx_distinct performance 100x when there are fewer distinct values with many groups [datafusion] via GitHub
Re: [I] FFI: `FFI_PhysicalOptimizerRule` missing `optimize_with_context` [datafusion] via GitHub
[I] improve perforance for `apporx_distinct` when each group do no have many distinct value [datafusion] via GitHub
- Re: [I] improve perforance for `apporx_distinct` when each group do no have many distinct value [datafusion] via GitHub
Re: [PR] feat: Add 100% Spark-compatible regex support via codegen dispatcher [datafusion-comet] via GitHub
[PR] chore: document programmatic access to Comet fallback reasons [datafusion-comet] via GitHub

Earlier messages