welcome~
  • Profile
  • Links
  • Tab 2
  • Tab 3
  • Tab 4

1. Download DataSets file

 

2. hadoop/hadoop/DataSets/ (100 files puts here)

** unzip file

** upload to hdfs

 

3. the main code to map/reduce (from marcellodesales)

- WordFrequenceInDocument.java

- WordCountsInDocuments.java

- WordsInCorpusTFIDF.java

 

4. upload 3 (java)files to ~/hadoop/HW

 

5. get result: HW/tfidf-result/part-r-00000

make sure that tfidf-reslut exists get file from hdfs

創作者介紹

Mi-t'ao

Yixue 發表在 痞客邦 PIXNET 留言(1) 人氣()


留言列表 (1)

發表留言
  • y7kom
  • 2011年終.瘋☉狂♂無○限〇大﹎-﹌贈﹉送﹂9SOnbA站□長瘋了

    577UP.com
找更多相關文章與討論