Re: Cannot cast to Tuple when running in cluster mode

Akhil Das Mon, 17 Aug 2015 02:12:16 -0700

That looks like scala version mismatch.

Thanks
Best Regards


On Fri, Aug 14, 2015 at 9:04 PM, <saif.a.ell...@wellsfargo.com> wrote:

> Hi All,
>
> I have a working program, in which I create two big tuples2 out of the
> data. This seems to work in local but when I switch over cluster standalone
> mode, I get this error at the very beggining:
>
> 15/08/14 10:22:25 WARN TaskSetManager: Lost task 4.0 in stage 1.0 (TID 10,
> 162.101.194.44): java.lang.ClassCastException:
> scala.collection.Iterator$$anon$13 cannot be cast to scala.Tuple2
>         at
> org.apache.spark.sql.DataFrame$$anonfun$33.apply(DataFrame.scala:1189)
>         at
> org.apache.spark.rdd.RDD$$anonfun$mapPartitions$1$$anonfun$apply$17.apply(RDD.scala:686)
>         at
> org.apache.spark.rdd.RDD$$anonfun$mapPartitions$1$$anonfun$apply$17.apply(RDD.scala:686)
>         at
> org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:35)
>         at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:277)
>         at org.apache.spark.rdd.RDD.iterator(RDD.scala:244)
>         at
> org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:35)
>         at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:277)
>         at org.apache.spark.rdd.RDD.iterator(RDD.scala:244)
>         at
> org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:35)
>         at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:277)
>         at org.apache.spark.rdd.RDD.iterator(RDD.scala:244)
>         at
> org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:70)
>         at
> org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:41)
>         at org.apache.spark.scheduler.Task.run(Task.scala:70)
>         at
> org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:213)
>         at
> java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
>         at
> java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
>         at java.lang.Thread.run(Thread.java:745)
>
> The data comes from JDBC, but I also tried persisting it into memory to
> turn it into a collection, in case JDBC was the problem.
>
> Any advice?
> Saif
>
>

Re: Cannot cast to Tuple when running in cluster mode

Reply via email to