[jira] [Commented] (HUDI-1126) code implementation to support structured streaming

linshan-ma (Jira) Thu, 06 Aug 2020 00:49:05 -0700


    [ 
https://issues.apache.org/jira/browse/HUDI-1126?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=17172097#comment-17172097
 ]


linshan-ma commented on HUDI-1126:
----------------------------------

After a few days of thinking, trial and error, I have no idea.My implementation 
is as follows
{code:java}
// code placeholder
override def getBatch(start: Option[Offset], end: Offset): DataFrame = {
  val rdd:RDD[Row] = new IncrementalRelation(sqlContext, path.get, parameters, 
schema).buildScan()
  val rddInternalRow:RDD[InternalRow]  = rdd.map(i=>InternalRow(i))
  sqlContext.internalCreateDataFrame(
    rddInternalRow, schema,  true)
}{code}
but it is error.
{code:java}
// code placeholder
[ERROR] 2020-08-06 15:39:52,495(9152) --> [Executor task launch worker for task 
3] org.apache.spark.internal.Logging$class.logError(Logging.scala:91): 
Exception in task 3.0 in stage 0.0 (TID 3)  [ERROR] 2020-08-06 
15:39:52,495(9152) --> [Executor task launch worker for task 3] 
org.apache.spark.internal.Logging$class.logError(Logging.scala:91): Exception 
in task 3.0 in stage 0.0 (TID 3)  java.lang.ClassCastException: 
org.apache.spark.sql.catalyst.expressions.GenericRowWithSchema cannot be cast 
to org.apache.spark.unsafe.types.UTF8String at 
org.apache.spark.sql.catalyst.expressions.BaseGenericInternalRow$class.getUTF8String(rows.scala:46)
 at 
org.apache.spark.sql.catalyst.expressions.GenericInternalRow.getUTF8String(rows.scala:195)
 at 
org.apache.spark.sql.catalyst.expressions.GeneratedClass$SpecificUnsafeProjection.writeFields_0_0$(generated.java:91)
 at 
org.apache.spark.sql.catalyst.expressions.GeneratedClass$SpecificUnsafeProjection.apply(generated.java:30)
 at 
org.apache.spark.sql.execution.RDDScanExec$$anonfun$doExecute$2$$anonfun$apply$5.apply(ExistingRDD.scala:194)
 at 
org.apache.spark.sql.execution.RDDScanExec$$anonfun$doExecute$2$$anonfun$apply$5.apply(ExistingRDD.scala:192)
 at scala.collection.Iterator$$anon$11.next(Iterator.scala:410) at 
org.apache.spark.sql.execution.datasources.v2.DataWritingSparkTask$$anonfun$run$3.apply(WriteToDataSourceV2Exec.scala:118)
 at 
org.apache.spark.sql.execution.datasources.v2.DataWritingSparkTask$$anonfun$run$3.apply(WriteToDataSourceV2Exec.scala:116)
 at 
org.apache.spark.util.Utils$.tryWithSafeFinallyAndFailureCallbacks(Utils.scala:1394)
 at 
org.apache.spark.sql.execution.datasources.v2.DataWritingSparkTask$.run(WriteToDataSourceV2Exec.scala:146)
 at 
org.apache.spark.sql.execution.datasources.v2.WriteToDataSourceV2Exec$$anonfun$doExecute$2.apply(WriteToDataSourceV2Exec.scala:67)
 at 
org.apache.spark.sql.execution.datasources.v2.WriteToDataSourceV2Exec$$anonfun$doExecute$2.apply(WriteToDataSourceV2Exec.scala:66)
 at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:90) at 
org.apache.spark.scheduler.Task.run(Task.scala:121) at 
org.apache.spark.executor.Executor$TaskRunner$$anonfun$10.apply(Executor.scala:408)
 at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1360) at 
org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:414) at 
java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) 
at 
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) 
at java.lang.Thread.run(Thread.java:748)
{code}
I need help. thank you

Other relevant links are below

https://issues.apache.org/jira/browse/HUDI-1109

https://issues.apache.org/jira/browse/HUDI-1125

the pr 

[https://github.com/apache/hudi/pull/1880]

> code implementation  to support  structured streaming
> -----------------------------------------------------
>
>                 Key: HUDI-1126
>                 URL: https://issues.apache.org/jira/browse/HUDI-1126
>             Project: Apache Hudi
>          Issue Type: Sub-task
>            Reporter: linshan-ma
>            Assignee: linshan-ma
>            Priority: Major
>
> code implementation to support structured streaming



--
This message was sent by Atlassian Jira
(v8.3.4#803005)

[jira] [Commented] (HUDI-1126) code implementation to support structured streaming

Reply via email to