Re: spark job failed with oozie

Liping Zhang Wed, 10 Feb 2016 11:28:34 -0800

Hi Serega, oozie users and devs,

According to
http://stackoverflow.com/questions/24262896/oozie-shell-action-memory-limit,
 I added following lines in workflow.xml, but still got OOM PermGem issue.
I guess I set the oozie launcher memory in a wrong way, what should be the
right way to set oozie launcher's memory? Thanks very much for your answers!


            <configuration>
*                <property>*
*
<name>oozie.launcher.mapreduce.map.memory.mb</name>*
*                        <value>6144</value> *
*                </property>*
            </configuration>

On Tue, Feb 9, 2016 at 12:45 PM, Liping Zhang <[email protected]> wrote:

> Thanks Serega for your answers!
>
> I increazed memory for oozie launcher itself in workflow.xml as following,
> but I'm not sure whether I increase memory in the right way. Please correct
> me if I'm wrong.
>
>     <action name="spark-17c0">
>         <spark xmlns="uri:oozie:spark-action:0.1">
>             <job-tracker>${jobTracker}</job-tracker>
>             <name-node>${nameNode}</name-node>
>             <configuration>
> *                <property>*
> *
> <name>oozie.launcher.mapreduce.map.memory.mb</name>*
> *                        <value>6144</value> *
> *                </property>*
>             </configuration>
>
> <master>spark://ip-10-0-4-248.us-west-1.compute.internal:7077</master>
>             <name>MeterReadingLoader</name>
>               <class>com.gridx.spark.MeterReadingLoader</class>
>             <jar>/user/root/workspaces/lib/spark-all.jar</jar>
>               <spark-opts>--conf
> spark.driver.extraJavaOptions="-XX:MaxPermSize=10g" --conf
> spark.executor.extraJavaOptions="-XX:MaxPermSize=4g"  --driver-memory 8g
>  --executor-memory 2g --num-executors 3 --executor-cores 8
> --driver-class-path
> /opt/cloudera/parcels/CDH/jars/guava-16.0.1.jar:/opt/cloudera/parcels/CDH/jars/spark-assembly-1.5.0-cdh5.5.0-hadoop2.6.0-cdh5.5.0.jar:/opt/cloudera/parcels/CDH-5.5.0-1.cdh5.5.0.p0.8/jars/jets3t-0.9.0.jar
> --conf
> spark.executor.extraClassPath=/opt/cloudera/parcels/CDH/jars/jets3t-0.9.0.jar</spark-opts>
>               <arg>${i}</arg>
>               <arg>${path}</arg>
>               <arg>${k}</arg>
>               <arg>${keyspace}</arg>
>               <arg>${h}</arg>
>               <arg>${cassandrahost}</arg>
>               <arg>${t}</arg>
>               <arg>${interval}</arg>
>               <arg>${z}</arg>
>               <arg>${timezone}</arg>
>               <arg>${l}</arg>
>               <arg>${listname}</arg>
>               <arg>${g}</arg>
>               <arg>${company}</arg>
>         </spark>
>         <ok to="End"/>
>         <error to="Kill"/>
>     </action>
>
>
> But it still has the Permian space issue.
>
> 2016-02-09 20:35:44,853 INFO [sparkDriver-akka.actor.default-dispatcher-18] 
> org.apache.spark.storage.BlockManagerInfo: Removed broadcast_3_piece0 on 
> 10.0.4.249:47565 in memory (size: 1884.0 B, free: 1060.2 MB)
> 2016-02-09 20:35:45,457 ERROR [sparkDriver-akka.actor.default-dispatcher-6] 
> org.apache.spark.rpc.akka.ErrorMonitor: Uncaught fatal error from thread 
> [sparkDriver-akka.actor.default-dispatcher-17] shutting down ActorSystem 
> [sparkDriver]
> java.lang.OutOfMemoryError: PermGen space
>       at java.lang.Class.getDeclaredConstructors0(Native Method)
>       at java.lang.Class.privateGetDeclaredConstructors(Class.java:2532)
>       at java.lang.Class.getConstructor0(Class.java:2842)
>       at java.lang.Class.newInstance(Class.java:345)
>       at 
> sun.reflect.MethodAccessorGenerator$1.run(MethodAccessorGenerator.java:399)
>       at 
> sun.reflect.MethodAccessorGenerator$1.run(MethodAccessorGenerator.java:396)
>       at java.security.AccessController.doPrivileged(Native Method)
>       at 
> sun.reflect.MethodAccessorGenerator.generate(MethodAccessorGenerator.java:395)
>       at 
> sun.reflect.MethodAccessorGenerator.generateSerializationConstructor(MethodAccessorGenerator.java:113)
>       at 
> sun.reflect.ReflectionFactory.newConstructorForSerialization(ReflectionFactory.java:331)
>       at 
> java.io.ObjectStreamClass.getSerializableConstructor(ObjectStreamClass.java:1376)
>       at java.io.ObjectStreamClass.access$1500(ObjectStreamClass.java:72)
>       at java.io.ObjectStreamClass$2.run(ObjectStreamClass.java:493)
>       at java.io.ObjectStreamClass$2.run(ObjectStreamClass.java:468)
>       at java.security.AccessController.doPrivileged(Native Method)
>       at java.io.ObjectStreamClass.<init>(ObjectStreamClass.java:468)
>       at java.io.ObjectStreamClass.lookup(ObjectStreamClass.java:365)
>       at java.io.ObjectStreamClass.initNonProxy(ObjectStreamClass.java:602)
>       at 
> java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:1622)
>       at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1517)
>       at 
> java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:1622)
>       at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1517)
>       at 
> java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:1771)
>       at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1350)
>       at 
> java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:1990)
>       at java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:1915)
>       at 
> java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:1798)
>       at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1350)
>       at java.io.ObjectInputStream.readObject(ObjectInputStream.java:370)
>       at 
> akka.serialization.JavaSerializer$$anonfun$1.apply(Serializer.scala:136)
>       at scala.util.DynamicVariable.withValue(DynamicVariable.scala:57)
>       at akka.serialization.JavaSerializer.fromBinary(Serializer.scala:136)
>
>
>
>
>
> On Thu, Feb 4, 2016 at 11:10 PM, Serega Sheypak <[email protected]>
> wrote:
>
>> probably you need to increase mem for oozie launcher itself?
>>
>> 2016-02-04 20:57 GMT+01:00 Liping Zhang <[email protected]>:
>>
>>> Dear Oozie user and dev,
>>>
>>> We have a our spark job need to be run as a workflow in oozie.
>>>
>>>
>>> 1.Now the spark job can be run successfully in submmit command line as
>>> below:
>>>
>>> spark-submit --master
>>> spark://ip-10-0-4-248.us-west-1.compute.internal:7077 --class
>>> com.gridx.spark.MeterReadingLoader --name 'smud_test1' --driver-class-path
>>> /opt/cloudera/parcels/CDH/jars/guava-16.0.1.jar:/opt/cloudera/parcels/CDH-5.5.0-1.cdh5.5.0.p0.8/jars/jets3t-0.9.0.jar
>>>   --conf
>>> spark.executor.extraClassPath=/opt/cloudera/parcels/CDH-5.5.0-1.cdh5.5.0.p0.8/jars/jets3t-0.9.0.jar
>>> ~/spark-all.jar -i s3n://meter-data/batch_data_phase1/smud_phase1_10.csv -k
>>> smud_stage -h 10.0.4.243 -t 60 -z America/Los_Angeles -l smud_test1 -g SMUD
>>>
>>>
>>> 2.However, when we use oozie REST API or Hue-OOzie in CDH to submit the
>>> same spark job with following REST API, it will launch an oozie launcher
>>> job"
>>> oozie:launcher:T=spark:W=meter_reading_loader:A=spark-17c0:ID=0000027-160202081901924-oozie-oozi-W",
>>> and  be failed with  OOM and PermGen exception.
>>>
>>> BTW, Our gridx jar "spark-all.jar" has 88M size.
>>>
>>> Here is the screenshot, and attached is the workflow for oozie.
>>>
>>> curl -X POST -H "Content-Type: application/xml" -d @config.xml
>>> http://localhost:11000/oozie/v2/jobs?action=start
>>>
>>>
>>> oozie parameters:
>>>
>>> [image: Inline image 4]
>>>
>>>
>>> oozie job in job CDH resource manager UI(port 8088):
>>>
>>> [image: Inline image 2]
>>>
>>>
>>>
>>> Exceptions and logs:
>>>
>>> [image: Inline image 1]
>>>
>>> [image: Inline image 3]
>>>
>>>
>>>
>>> I also tried to enlarge the MaxPermGen  and memory, still got no luck. Can
>>> you help out? Thanks very much!
>>>
>>>
>>>
>>> --
>>> Cheers,
>>> -----
>>> Big Data - Big Wisdom - Big Value
>>> --------------
>>> Michelle Zhang (张莉苹)
>>>
>>
>>
>
>
> --
> Cheers,
> -----
> Big Data - Big Wisdom - Big Value
> --------------
> Michelle Zhang (张莉苹)
>



-- 
Cheers,
-----
Big Data - Big Wisdom - Big Value
--------------
Michelle Zhang (张莉苹)

Re: spark job failed with oozie

Reply via email to