(arrow-datafusion) branch asf-site updated: Publish built docs triggered by afb169cd069e0227fb0ef6d39f44d5eabbdc21a2

github-bot Sat, 10 Feb 2024 13:29:01 -0800

This is an automated email from the ASF dual-hosted git repository.

github-bot pushed a commit to branch asf-site
in repository https://gitbox.apache.org/repos/asf/arrow-datafusion.git



The following commit(s) were added to refs/heads/asf-site by this push:
     new bd20a0fd54 Publish built docs triggered by 
afb169cd069e0227fb0ef6d39f44d5eabbdc21a2
bd20a0fd54 is described below

commit bd20a0fd54903df4ec1fe3a3650badae3a282423
Author: github-actions[bot] <github-actions[bot]@users.noreply.github.com>
AuthorDate: Sat Feb 10 21:28:52 2024 +0000

    Publish built docs triggered by afb169cd069e0227fb0ef6d39f44d5eabbdc21a2
---
 _sources/library-user-guide/adding-udfs.md.txt |  87 ++++++++++++++++--
 library-user-guide/adding-udfs.html            | 118 +++++++++++++++++++++++--
 searchindex.js                                 |   2 +-
 3 files changed, 194 insertions(+), 13 deletions(-)

diff --git a/_sources/library-user-guide/adding-udfs.md.txt 
b/_sources/library-user-guide/adding-udfs.md.txt
index 037e99f87f..f433e026e0 100644
--- a/_sources/library-user-guide/adding-udfs.md.txt
+++ b/_sources/library-user-guide/adding-udfs.md.txt
@@ -34,7 +34,87 @@ First we'll talk about adding an Scalar UDF end-to-end, then 
we'll talk about th
 
 ## Adding a Scalar UDF
 
-A Scalar UDF is a function that takes a row of data and returns a single 
value. For example, this function takes a single i64 and returns a single i64 
with 1 added to it:
+A Scalar UDF is a function that takes a row of data and returns a single 
value. In order for good performance
+such functions are "vectorized" in DataFusion, meaning they get one or more 
Arrow Arrays as input and produce
+an Arrow Array with the same number of rows as output.
+
+To create a Scalar UDF, you
+
+1.  Implement the `ScalarUDFImpl` trait to tell DataFusion about your function 
such as what types of arguments it takes and how to calculate the results.
+2.  Create a `ScalarUDF` and register it with `SessionContext::register_udf` 
so it can be invoked by name.
+
+In the following example, we will add a function takes a single i64 and 
returns a single i64 with 1 added to it:
+
+For brevity, we'll skipped some error handling, but e.g. you may want to check 
that `args.len()` is the expected number of arguments.
+
+### Adding by `impl ScalarUDFImpl`
+
+This a lower level API with more functionality but is more complex, also 
documented in [`advanced_udf.rs`].
+
+```rust
+use std::any::Any;
+use arrow::datatypes::DataType;
+use datafusion_common::{DataFusionError, plan_err, Result};
+use datafusion_expr::{col, ColumnarValue, Signature, Volatility};
+use datafusion_expr::{ScalarUDFImpl, ScalarUDF};
+
+#[derive(Debug)]
+struct AddOne {
+    signature: Signature
+};
+
+impl AddOne {
+    fn new() -> Self {
+        Self {
+            signature: Signature::uniform(1, vec![DataType::Int32], 
Volatility::Immutable)
+        }
+    }
+}
+
+/// Implement the ScalarUDFImpl trait for AddOne
+impl ScalarUDFImpl for AddOne {
+    fn as_any(&self) -> &dyn Any { self }
+    fn name(&self) -> &str { "add_one" }
+    fn signature(&self) -> &Signature { &self.signature }
+    fn return_type(&self, args: &[DataType]) -> Result<DataType> {
+      if !matches!(args.get(0), Some(&DataType::Int32)) {
+        return plan_err!("add_one only accepts Int32 arguments");
+      }
+      Ok(DataType::Int32)
+    }
+    // The actual implementation would add one to the argument
+    fn invoke(&self, args: &[ColumnarValue]) -> Result<ColumnarValue> {
+        let args = columnar_values_to_array(args)?;
+        let i64s = as_int64_array(&args[0])?;
+
+        let new_array = i64s
+        .iter()
+        .map(|array_elem| array_elem.map(|value| value + 1))
+        .collect::<Int64Array>();
+        Ok(Arc::new(new_array))
+    }
+}
+```
+
+We now need to register the function with DataFusion so that it can be used in 
the context of a query.
+
+```rust
+// Create a new ScalarUDF from the implementation
+let add_one = ScalarUDF::from(AddOne::new());
+
+// register the UDF with the context so it can be invoked by name and from SQL
+let mut ctx = SessionContext::new();
+ctx.register_udf(add_one.clone());
+
+// Call the function `add_one(col)`
+let expr = add_one.call(vec![col("a")]);
+```
+
+### Adding a Scalar UDF by [`create_udf`]
+
+There is a an older, more concise, but also more limited API [`create_udf`] 
available as well
+
+#### Adding a Scalar UDF
 
 ```rust
 use std::sync::Arc;
@@ -58,8 +138,6 @@ pub fn add_one(args: &[ColumnarValue]) -> Result<ArrayRef> {
 }
 ```
 
-For brevity, we'll skipped some error handling, but e.g. you may want to check 
that `args.len()` is the expected number of arguments.
-
 This "works" in isolation, i.e. if you have a slice of `ArrayRef`s, you can 
call `add_one` and it will return a new `ArrayRef` with 1 added to each value.
 
 ```rust
@@ -74,11 +152,10 @@ assert_eq!(result, &Int64Array::from(vec![Some(2), None, 
Some(4)]));
 
 The challenge however is that DataFusion doesn't know about this function. We 
need to register it with DataFusion so that it can be used in the context of a 
query.
 
-### Registering a Scalar UDF
+#### Registering a Scalar UDF
 
 To register a Scalar UDF, you need to wrap the function implementation in a 
[`ScalarUDF`] struct and then register it with the `SessionContext`.
 DataFusion provides the [`create_udf`] and helper functions to make this 
easier.
-There is a lower level API with more functionality but is more complex, that 
is documented in [`advanced_udf.rs`].
 
 ```rust
 use datafusion::logical_expr::{Volatility, create_udf};
diff --git a/library-user-guide/adding-udfs.html 
b/library-user-guide/adding-udfs.html
index 018180287b..52d5420bf1 100644
--- a/library-user-guide/adding-udfs.html
+++ b/library-user-guide/adding-udfs.html
@@ -358,10 +358,40 @@
   </a>
   <ul class="nav section-nav flex-column">
    <li class="toc-h3 nav-item toc-entry">
-    <a class="reference internal nav-link" href="#registering-a-scalar-udf">
-     Registering a Scalar UDF
+    <a class="reference internal nav-link" 
href="#adding-by-impl-scalarudfimpl">
+     Adding by
+     <code class="docutils literal notranslate">
+      <span class="pre">
+       impl
+      </span>
+      <span class="pre">
+       ScalarUDFImpl
+      </span>
+     </code>
     </a>
    </li>
+   <li class="toc-h3 nav-item toc-entry">
+    <a class="reference internal nav-link" 
href="#adding-a-scalar-udf-by-create-udf">
+     Adding a Scalar UDF by
+     <code class="docutils literal notranslate">
+      <span class="pre">
+       create_udf
+      </span>
+     </code>
+    </a>
+    <ul class="nav section-nav flex-column">
+     <li class="toc-h4 nav-item toc-entry">
+      <a class="reference internal nav-link" href="#id1">
+       Adding a Scalar UDF
+      </a>
+     </li>
+     <li class="toc-h4 nav-item toc-entry">
+      <a class="reference internal nav-link" href="#registering-a-scalar-udf">
+       Registering a Scalar UDF
+      </a>
+     </li>
+    </ul>
+   </li>
   </ul>
  </li>
  <li class="toc-h2 nav-item toc-entry">
@@ -484,7 +514,81 @@
 <p>First we’ll talk about adding an Scalar UDF end-to-end, then we’ll talk 
about the differences between the different types of UDFs.</p>
 <section id="adding-a-scalar-udf">
 <h2>Adding a Scalar UDF<a class="headerlink" href="#adding-a-scalar-udf" 
title="Link to this heading">¶</a></h2>
-<p>A Scalar UDF is a function that takes a row of data and returns a single 
value. For example, this function takes a single i64 and returns a single i64 
with 1 added to it:</p>
+<p>A Scalar UDF is a function that takes a row of data and returns a single 
value. In order for good performance
+such functions are “vectorized” in DataFusion, meaning they get one or more 
Arrow Arrays as input and produce
+an Arrow Array with the same number of rows as output.</p>
+<p>To create a Scalar UDF, you</p>
+<ol class="arabic simple">
+<li><p>Implement the <code class="docutils literal notranslate"><span 
class="pre">ScalarUDFImpl</span></code> trait to tell DataFusion about your 
function such as what types of arguments it takes and how to calculate the 
results.</p></li>
+<li><p>Create a <code class="docutils literal notranslate"><span 
class="pre">ScalarUDF</span></code> and register it with <code class="docutils 
literal notranslate"><span 
class="pre">SessionContext::register_udf</span></code> so it can be invoked by 
name.</p></li>
+</ol>
+<p>In the following example, we will add a function takes a single i64 and 
returns a single i64 with 1 added to it:</p>
+<p>For brevity, we’ll skipped some error handling, but e.g. you may want to 
check that <code class="docutils literal notranslate"><span 
class="pre">args.len()</span></code> is the expected number of arguments.</p>
+<section id="adding-by-impl-scalarudfimpl">
+<h3>Adding by <code class="docutils literal notranslate"><span 
class="pre">impl</span> <span class="pre">ScalarUDFImpl</span></code><a 
class="headerlink" href="#adding-by-impl-scalarudfimpl" title="Link to this 
heading">¶</a></h3>
+<p>This a lower level API with more functionality but is more complex, also 
documented in <a class="reference external" 
href="https://github.com/apache/arrow-datafusion/blob/main/datafusion-examples/examples/advanced_udf.rs";><code
 class="docutils literal notranslate"><span 
class="pre">advanced_udf.rs</span></code></a>.</p>
+<div class="highlight-rust notranslate"><div 
class="highlight"><pre><span></span><span class="k">use</span><span class="w"> 
</span><span class="n">std</span>::<span class="n">any</span>::<span 
class="n">Any</span><span class="p">;</span>
+<span class="k">use</span><span class="w"> </span><span 
class="n">arrow</span>::<span class="n">datatypes</span>::<span 
class="n">DataType</span><span class="p">;</span>
+<span class="k">use</span><span class="w"> </span><span 
class="n">datafusion_common</span>::<span class="p">{</span><span 
class="n">DataFusionError</span><span class="p">,</span><span class="w"> 
</span><span class="n">plan_err</span><span class="p">,</span><span class="w"> 
</span><span class="nb">Result</span><span class="p">};</span>
+<span class="k">use</span><span class="w"> </span><span 
class="n">datafusion_expr</span>::<span class="p">{</span><span 
class="n">col</span><span class="p">,</span><span class="w"> </span><span 
class="n">ColumnarValue</span><span class="p">,</span><span class="w"> 
</span><span class="n">Signature</span><span class="p">,</span><span class="w"> 
</span><span class="n">Volatility</span><span class="p">};</span>
+<span class="k">use</span><span class="w"> </span><span 
class="n">datafusion_expr</span>::<span class="p">{</span><span 
class="n">ScalarUDFImpl</span><span class="p">,</span><span class="w"> 
</span><span class="n">ScalarUDF</span><span class="p">};</span>
+
+<span class="cp">#[derive(Debug)]</span>
+<span class="k">struct</span> <span class="nc">AddOne</span><span class="w"> 
</span><span class="p">{</span>
+<span class="w">    </span><span class="n">signature</span>: <span 
class="nc">Signature</span>
+<span class="p">};</span>
+
+<span class="k">impl</span><span class="w"> </span><span 
class="n">AddOne</span><span class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">new</span><span class="p">()</span><span class="w"> </span>-&gt; 
<span class="nc">Self</span><span class="w"> </span><span class="p">{</span>
+<span class="w">        </span><span class="bp">Self</span><span class="w"> 
</span><span class="p">{</span>
+<span class="w">            </span><span class="n">signature</span>: <span 
class="nc">Signature</span>::<span class="n">uniform</span><span 
class="p">(</span><span class="mi">1</span><span class="p">,</span><span 
class="w"> </span><span class="fm">vec!</span><span class="p">[</span><span 
class="n">DataType</span>::<span class="n">Int32</span><span 
class="p">],</span><span class="w"> </span><span 
class="n">Volatility</span>::<span class="n">Immutable</span><span 
class="p">)</span>
+<span class="w">        </span><span class="p">}</span>
+<span class="w">    </span><span class="p">}</span>
+<span class="p">}</span>
+
+<span class="sd">/// Implement the ScalarUDFImpl trait for AddOne</span>
+<span class="k">impl</span><span class="w"> </span><span 
class="n">ScalarUDFImpl</span><span class="w"> </span><span 
class="k">for</span><span class="w"> </span><span class="n">AddOne</span><span 
class="w"> </span><span class="p">{</span>
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">as_any</span><span class="p">(</span><span 
class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span 
class="w"> </span>-&gt; <span class="kp">&amp;</span><span 
class="nc">dyn</span><span class="w"> </span><span class="n">Any</span><span 
class="w"> </span><span class="p">{</span><span class="w"> </span><span 
class="bp">self</span><span class="w"> </span><span class="p">}</span>
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">name</span><span class="p">(</span><span class="o">&amp;</span><span 
class="bp">self</span><span class="p">)</span><span class="w"> </span>-&gt; 
<span class="kp">&amp;</span><span class="kt">str</span> <span 
class="p">{</span><span class="w"> </span><span 
class="s">&quot;add_one&quot;</span><span class="w"> </span><span 
class="p">}</span>
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">signature</span><span class="p">(</span><span 
class="o">&amp;</span><span class="bp">self</span><span class="p">)</span><span 
class="w"> </span>-&gt; <span class="kp">&amp;</span><span 
class="nc">Signature</span><span class="w"> </span><span 
class="p">{</span><span class="w"> </span><span class="o">&amp;</span><span 
class="bp">self</span><span class="p">.</span><span 
class="n">signature</span><span class="w"> </span><s [...]
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">return_type</span><span class="p">(</span><span 
class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span 
class="w"> </span><span class="n">args</span>: <span 
class="kp">&amp;</span><span class="p">[</span><span 
class="n">DataType</span><span class="p">])</span><span class="w"> </span>-&gt; 
<span class="nb">Result</span><span class="o">&lt;</span><span 
class="n">DataType</span><span class="o">&gt; [...]
+<span class="w">      </span><span class="k">if</span><span class="w"> 
</span><span class="o">!</span><span class="fm">matches!</span><span 
class="p">(</span><span class="n">args</span><span class="p">.</span><span 
class="n">get</span><span class="p">(</span><span class="mi">0</span><span 
class="p">),</span><span class="w"> </span><span class="nb">Some</span><span 
class="p">(</span><span class="o">&amp;</span><span 
class="n">DataType</span>::<span class="n">Int32</span><span class="p">)) [...]
+<span class="w">        </span><span class="k">return</span><span class="w"> 
</span><span class="n">plan_err</span><span class="o">!</span><span 
class="p">(</span><span class="s">&quot;add_one only accepts Int32 
arguments&quot;</span><span class="p">);</span>
+<span class="w">      </span><span class="p">}</span>
+<span class="w">      </span><span class="nb">Ok</span><span 
class="p">(</span><span class="n">DataType</span>::<span 
class="n">Int32</span><span class="p">)</span>
+<span class="w">    </span><span class="p">}</span>
+<span class="w">    </span><span class="c1">// The actual implementation would 
add one to the argument</span>
+<span class="w">    </span><span class="k">fn</span> <span 
class="nf">invoke</span><span class="p">(</span><span 
class="o">&amp;</span><span class="bp">self</span><span class="p">,</span><span 
class="w"> </span><span class="n">args</span>: <span 
class="kp">&amp;</span><span class="p">[</span><span 
class="n">ColumnarValue</span><span class="p">])</span><span class="w"> 
</span>-&gt; <span class="nb">Result</span><span class="o">&lt;</span><span 
class="n">ColumnarValue</span><span class="o" [...]
+<span class="w">        </span><span class="kd">let</span><span class="w"> 
</span><span class="n">args</span><span class="w"> </span><span 
class="o">=</span><span class="w"> </span><span 
class="n">columnar_values_to_array</span><span class="p">(</span><span 
class="n">args</span><span class="p">)</span><span class="o">?</span><span 
class="p">;</span>
+<span class="w">        </span><span class="kd">let</span><span class="w"> 
</span><span class="n">i64s</span><span class="w"> </span><span 
class="o">=</span><span class="w"> </span><span 
class="n">as_int64_array</span><span class="p">(</span><span 
class="o">&amp;</span><span class="n">args</span><span class="p">[</span><span 
class="mi">0</span><span class="p">])</span><span class="o">?</span><span 
class="p">;</span>
+
+<span class="w">        </span><span class="kd">let</span><span class="w"> 
</span><span class="n">new_array</span><span class="w"> </span><span 
class="o">=</span><span class="w"> </span><span class="n">i64s</span>
+<span class="w">        </span><span class="p">.</span><span 
class="n">iter</span><span class="p">()</span>
+<span class="w">        </span><span class="p">.</span><span 
class="n">map</span><span class="p">(</span><span class="o">|</span><span 
class="n">array_elem</span><span class="o">|</span><span class="w"> 
</span><span class="n">array_elem</span><span class="p">.</span><span 
class="n">map</span><span class="p">(</span><span class="o">|</span><span 
class="n">value</span><span class="o">|</span><span class="w"> </span><span 
class="n">value</span><span class="w"> </span><span class="o">+</span [...]
+<span class="w">        </span><span class="p">.</span><span 
class="n">collect</span>::<span class="o">&lt;</span><span 
class="n">Int64Array</span><span class="o">&gt;</span><span class="p">();</span>
+<span class="w">        </span><span class="nb">Ok</span><span 
class="p">(</span><span class="n">Arc</span>::<span class="n">new</span><span 
class="p">(</span><span class="n">new_array</span><span class="p">))</span>
+<span class="w">    </span><span class="p">}</span>
+<span class="p">}</span>
+</pre></div>
+</div>
+<p>We now need to register the function with DataFusion so that it can be used 
in the context of a query.</p>
+<div class="highlight-rust notranslate"><div 
class="highlight"><pre><span></span><span class="c1">// Create a new ScalarUDF 
from the implementation</span>
+<span class="kd">let</span><span class="w"> </span><span 
class="n">add_one</span><span class="w"> </span><span class="o">=</span><span 
class="w"> </span><span class="n">ScalarUDF</span>::<span 
class="n">from</span><span class="p">(</span><span 
class="n">AddOne</span>::<span class="n">new</span><span class="p">());</span>
+
+<span class="c1">// register the UDF with the context so it can be invoked by 
name and from SQL</span>
+<span class="kd">let</span><span class="w"> </span><span 
class="k">mut</span><span class="w"> </span><span class="n">ctx</span><span 
class="w"> </span><span class="o">=</span><span class="w"> </span><span 
class="n">SessionContext</span>::<span class="n">new</span><span 
class="p">();</span>
+<span class="n">ctx</span><span class="p">.</span><span 
class="n">register_udf</span><span class="p">(</span><span 
class="n">add_one</span><span class="p">.</span><span 
class="n">clone</span><span class="p">());</span>
+
+<span class="c1">// Call the function `add_one(col)`</span>
+<span class="kd">let</span><span class="w"> </span><span 
class="n">expr</span><span class="w"> </span><span class="o">=</span><span 
class="w"> </span><span class="n">add_one</span><span class="p">.</span><span 
class="n">call</span><span class="p">(</span><span class="fm">vec!</span><span 
class="p">[</span><span class="n">col</span><span class="p">(</span><span 
class="s">&quot;a&quot;</span><span class="p">)]);</span>
+</pre></div>
+</div>
+</section>
+<section id="adding-a-scalar-udf-by-create-udf">
+<h3>Adding a Scalar UDF by <a class="reference external" 
href="https://docs.rs/datafusion/latest/datafusion/logical_expr/fn.create_udf.html";><code
 class="docutils literal notranslate"><span 
class="pre">create_udf</span></code></a><a class="headerlink" 
href="#adding-a-scalar-udf-by-create-udf" title="Link to this 
heading">¶</a></h3>
+<p>There is a an older, more concise, but also more limited API <a 
class="reference external" 
href="https://docs.rs/datafusion/latest/datafusion/logical_expr/fn.create_udf.html";><code
 class="docutils literal notranslate"><span 
class="pre">create_udf</span></code></a> available as well</p>
+<section id="id1">
+<h4>Adding a Scalar UDF<a class="headerlink" href="#id1" title="Link to this 
heading">¶</a></h4>
 <div class="highlight-rust notranslate"><div 
class="highlight"><pre><span></span><span class="k">use</span><span class="w"> 
</span><span class="n">std</span>::<span class="n">sync</span>::<span 
class="n">Arc</span><span class="p">;</span>
 
 <span class="k">use</span><span class="w"> </span><span 
class="n">datafusion</span>::<span class="n">arrow</span>::<span 
class="n">array</span>::<span class="p">{</span><span 
class="n">ArrayRef</span><span class="p">,</span><span class="w"> </span><span 
class="n">Int64Array</span><span class="p">};</span>
@@ -506,7 +610,6 @@
 <span class="p">}</span>
 </pre></div>
 </div>
-<p>For brevity, we’ll skipped some error handling, but e.g. you may want to 
check that <code class="docutils literal notranslate"><span 
class="pre">args.len()</span></code> is the expected number of arguments.</p>
 <p>This “works” in isolation, i.e. if you have a slice of <code 
class="docutils literal notranslate"><span class="pre">ArrayRef</span></code>s, 
you can call <code class="docutils literal notranslate"><span 
class="pre">add_one</span></code> and it will return a new <code 
class="docutils literal notranslate"><span class="pre">ArrayRef</span></code> 
with 1 added to each value.</p>
 <div class="highlight-rust notranslate"><div 
class="highlight"><pre><span></span><span class="kd">let</span><span class="w"> 
</span><span class="n">input</span><span class="w"> </span><span 
class="o">=</span><span class="w"> </span><span class="fm">vec!</span><span 
class="p">[</span><span class="nb">Some</span><span class="p">(</span><span 
class="mi">1</span><span class="p">),</span><span class="w"> </span><span 
class="nb">None</span><span class="p">,</span><span class="w"> </span><span  
[...]
 <span class="kd">let</span><span class="w"> </span><span 
class="n">input</span><span class="w"> </span><span class="o">=</span><span 
class="w"> </span><span class="n">Arc</span>::<span class="n">new</span><span 
class="p">(</span><span class="n">Int64Array</span>::<span 
class="n">from</span><span class="p">(</span><span class="n">input</span><span 
class="p">))</span><span class="w"> </span><span class="k">as</span><span 
class="w"> </span><span class="n">ArrayRef</span><span class="p">;</span>
@@ -518,11 +621,11 @@
 </pre></div>
 </div>
 <p>The challenge however is that DataFusion doesn’t know about this function. 
We need to register it with DataFusion so that it can be used in the context of 
a query.</p>
+</section>
 <section id="registering-a-scalar-udf">
-<h3>Registering a Scalar UDF<a class="headerlink" 
href="#registering-a-scalar-udf" title="Link to this heading">¶</a></h3>
+<h4>Registering a Scalar UDF<a class="headerlink" 
href="#registering-a-scalar-udf" title="Link to this heading">¶</a></h4>
 <p>To register a Scalar UDF, you need to wrap the function implementation in a 
<a class="reference external" 
href="https://docs.rs/datafusion/latest/datafusion/logical_expr/struct.ScalarUDF.html";><code
 class="docutils literal notranslate"><span 
class="pre">ScalarUDF</span></code></a> struct and then register it with the 
<code class="docutils literal notranslate"><span 
class="pre">SessionContext</span></code>.
-DataFusion provides the <a class="reference external" 
href="https://docs.rs/datafusion/latest/datafusion/logical_expr/fn.create_udf.html";><code
 class="docutils literal notranslate"><span 
class="pre">create_udf</span></code></a> and helper functions to make this 
easier.
-There is a lower level API with more functionality but is more complex, that 
is documented in <a class="reference external" 
href="https://github.com/apache/arrow-datafusion/blob/main/datafusion-examples/examples/advanced_udf.rs";><code
 class="docutils literal notranslate"><span 
class="pre">advanced_udf.rs</span></code></a>.</p>
+DataFusion provides the <a class="reference external" 
href="https://docs.rs/datafusion/latest/datafusion/logical_expr/fn.create_udf.html";><code
 class="docutils literal notranslate"><span 
class="pre">create_udf</span></code></a> and helper functions to make this 
easier.</p>
 <div class="highlight-rust notranslate"><div 
class="highlight"><pre><span></span><span class="k">use</span><span class="w"> 
</span><span class="n">datafusion</span>::<span 
class="n">logical_expr</span>::<span class="p">{</span><span 
class="n">Volatility</span><span class="p">,</span><span class="w"> 
</span><span class="n">create_udf</span><span class="p">};</span>
 <span class="k">use</span><span class="w"> </span><span 
class="n">datafusion</span>::<span class="n">arrow</span>::<span 
class="n">datatypes</span>::<span class="n">DataType</span><span 
class="p">;</span>
 <span class="k">use</span><span class="w"> </span><span 
class="n">std</span>::<span class="n">sync</span>::<span 
class="n">Arc</span><span class="p">;</span>
@@ -560,6 +663,7 @@ There is a lower level API with more functionality but is 
more complex, that is
 </div>
 </section>
 </section>
+</section>
 <section id="adding-a-window-udf">
 <h2>Adding a Window UDF<a class="headerlink" href="#adding-a-window-udf" 
title="Link to this heading">¶</a></h2>
 <p>Scalar UDFs are functions that take a row of data and return a single 
value. Window UDFs are similar, but they also have access to the rows around 
them. Access to the the proximal rows is helpful, but adds some complexity to 
the implementation.</p>
diff --git a/searchindex.js b/searchindex.js
index c453ca7cc6..792942b52f 100644
--- a/searchindex.js
+++ b/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["contributor-guide/architecture", 
"contributor-guide/communication", "contributor-guide/index", 
"contributor-guide/quarterly_roadmap", "contributor-guide/roadmap", 
"contributor-guide/specification/index", 
"contributor-guide/specification/invariants", 
"contributor-guide/specification/output-field-name-semantic", "index", 
"library-user-guide/adding-udfs", "library-user-guide/building-logical-plans", 
"library-user-guide/catalogs", "library-user-guide/custom-tab [...]
\ No newline at end of file
+Search.setIndex({"docnames": ["contributor-guide/architecture", 
"contributor-guide/communication", "contributor-guide/index", 
"contributor-guide/quarterly_roadmap", "contributor-guide/roadmap", 
"contributor-guide/specification/index", 
"contributor-guide/specification/invariants", 
"contributor-guide/specification/output-field-name-semantic", "index", 
"library-user-guide/adding-udfs", "library-user-guide/building-logical-plans", 
"library-user-guide/catalogs", "library-user-guide/custom-tab [...]
\ No newline at end of file

(arrow-datafusion) branch asf-site updated: Publish built docs triggered by afb169cd069e0227fb0ef6d39f44d5eabbdc21a2

Reply via email to