Re: java.io.NotSerializableException on RDD count() in Java

Yadid Ayzenberg Sun, 03 Nov 2013 17:14:25 -0800

Im running in local[4] mode - so there are no slave machines. Full stacktrace:

(run-main) org.apache.spark.SparkException: Job failed:java.io.NotSerializableException: edu.mit.bsense.AnalyticsEngineorg.apache.spark.SparkException: Job failed:java.io.NotSerializableException: edu.mit.bsense.AnalyticsEngineatorg.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:760)atorg.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:758)atscala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:60)

    at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:47)

atorg.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:758)atorg.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$submitMissingTasks(DAGScheduler.scala:556)atorg.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$submitStage(DAGScheduler.scala:503)atorg.apache.spark.scheduler.DAGScheduler.processEvent(DAGScheduler.scala:361)atorg.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$run(DAGScheduler.scala:441)atorg.apache.spark.scheduler.DAGScheduler$$anon$1.run(DAGScheduler.scala:149)

[debug]     Thread run-main exited.
[debug] Interrupting remaining threads (should be all daemons).
[debug] Sandboxed run complete..
java.lang.RuntimeException: Nonzero exit code: 1
    at scala.sys.package$.error(package.scala:27)
    at sbt.BuildCommon$$anonfun$toError$1.apply(Defaults.scala:1628)
    at sbt.BuildCommon$$anonfun$toError$1.apply(Defaults.scala:1628)
    at scala.Option.foreach(Option.scala:236)
    at sbt.BuildCommon$class.toError(Defaults.scala:1628)
    at sbt.Defaults$.toError(Defaults.scala:34)

atsbt.Defaults$$anonfun$runTask$1$$anonfun$apply$36$$anonfun$apply$37.apply(Defaults.scala:647)atsbt.Defaults$$anonfun$runTask$1$$anonfun$apply$36$$anonfun$apply$37.apply(Defaults.scala:645)

    at scala.Function1$$anonfun$compose$1.apply(Function1.scala:47)
    at sbt.$tilde$greater$$anonfun$$u2219$1.apply(TypeFunctions.scala:42)
    at sbt.std.Transform$$anon$4.work(System.scala:64)

atsbt.Execute$$anonfun$submit$1$$anonfun$apply$1.apply(Execute.scala:237)atsbt.Execute$$anonfun$submit$1$$anonfun$apply$1.apply(Execute.scala:237)

    at sbt.ErrorHandling$.wideConvert(ErrorHandling.scala:18)
    at sbt.Execute.work(Execute.scala:244)
    at sbt.Execute$$anonfun$submit$1.apply(Execute.scala:237)
    at sbt.Execute$$anonfun$submit$1.apply(Execute.scala:237)

atsbt.ConcurrentRestrictions$$anon$4$$anonfun$1.apply(ConcurrentRestrictions.scala:160)

    at sbt.CompletionService$$anon$2.call(CompletionService.scala:30)
    at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:303)
    at java.util.concurrent.FutureTask.run(FutureTask.java:138)

atjava.util.concurrent.Executors$RunnableAdapter.call(Executors.java:439)

    at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:303)
    at java.util.concurrent.FutureTask.run(FutureTask.java:138)

atjava.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:895)atjava.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:918)

    at java.lang.Thread.run(Thread.java:695)

when I add implements Serializable to my class, I get the followingstack trace:

error] (run-main) org.apache.spark.SparkException: Job failed:java.io.NotSerializableException: org.apache.spark.api.java.JavaSparkContextorg.apache.spark.SparkException: Job failed:java.io.NotSerializableException: org.apache.spark.api.java.JavaSparkContextatorg.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:760)atorg.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:758)atscala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:60)

    at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:47)

[debug]     Thread run-main exited.
[debug] Interrupting remaining threads (should be all daemons).
[debug] Sandboxed run complete..
java.lang.RuntimeException: Nonzero exit code: 1
    at scala.sys.package$.error(package.scala:27)
    at sbt.BuildCommon$$anonfun$toError$1.apply(Defaults.scala:1628)
    at sbt.BuildCommon$$anonfun$toError$1.apply(Defaults.scala:1628)
    at scala.Option.foreach(Option.scala:236)
    at sbt.BuildCommon$class.toError(Defaults.scala:1628)
    at sbt.Defaults$.toError(Defaults.scala:34)