Hi Guys,

I did some changes in JavaNetworkWordCount for my researches in streaming 
process and I have added to the code the following lines in red:

ssc1.checkpoint("hdfs://computer22:54310/user/root/INPUT");
 JavaDStream<String> lines1 = ssc1.socketTextStream("localhost", 
Integer.parseInt("12345"));
 JavaDStream<String> lines2 = ssc1.socketTextStream("localhost", 
Integer.parseInt("12345"));
 JavaDStream<String> union2 = lines1.union(lines2);
     JavaDStream<String> words = union2.flatMap(new FlatMapFunction<String, 
String>() {
     @Override
       public Iterable<String> call(String x) {
          return Lists.newArrayList(SPACE.split(x));
        }
     });
     JavaPairDStream<String, Integer> wordCounts = words.map(
new PairFunction<String, String, Integer>() {
          @Override
          public Tuple2<String, Integer> call(String s) {
           return new Tuple2<String, Integer>(s, 1);
         }
        }).reduceByKey(new Function2<Integer, Integer, Integer>() {
          @Override
         public Integer call(Integer i1, Integer i2) {
           return i1 + i2;
          }
        });
  
      JavaPairDStream<String, Integer> counts = wordCounts.reduceByKeyAndWindow(
        new Function2<Integer, Integer, Integer>() {
          public Integer call(Integer i1, Integer i2) { return i1 + i2; }
        },
        new Function2<Integer, Integer, Integer>() {
          public Integer call(Integer i1, Integer i2) { return i1 - i2; }
        },
        new Duration(60 * 5 * 1000),
     new Duration(1 * 1000)
         
         counts.print();
   ssc1.start();
 
   }
 }


- We did a code in C that send words to workers.

- Result From Master terminal:

Time: 1389794084000 ms
-------------------------------------------
(,14294)
(impertinences,2)
(protracted.,3)
(burlesque.,3)
(Dorothea,,85)
(grant,,5)
(temples,,2)
(discord,17)
(conscience,48)
(singed,,2)
...

-------------------------------------------
Time: 1389794085000 ms
-------------------------------------------
(,38580)
(impertinences,5)
(protracted.,7)
(burlesque.,7)
(Dorothea,,259)
(grant,,12)
(temples,,7)
(discord,47)
(conscience,130)
(singed,,5)
...

My question is, where does it happening the union()? between in the nodes or in 
the master?  I am using three machines( 1 Master + 2 Nodes).
How could I get a total count of the words and show in the terminal?

Thanks all  




-- 
---
INFORMATIVA SUL TRATTAMENTO DEI DATI PERSONALI

I dati utilizzati per l'invio del presente messaggio sono trattati 
dall'Università degli Studi di Brescia esclusivamente per finalità 
istituzionali. Informazioni più dettagliate anche in ordine ai diritti 
dell'interessato sono riposte nell'informativa generale e nelle notizie 
pubblicate sul sito web dell'Ateneo nella sezione "Privacy".

Il contenuto di questo messaggio è rivolto unicamente alle persona cui 
è indirizzato e può contenere informazioni la cui riservatezza è 
tutelata legalmente. Ne sono vietati la riproduzione, la diffusione e l'uso 
in mancanza di autorizzazione del destinatario. Qualora il messaggio 
fosse pervenuto per errore, preghiamo di eliminarlo.

Reply via email to