welcome~
  • Profile
  • Links
  • Tab 2
  • Tab 3
  • Tab 4

1. Download DataSets file

 

2. hadoop/hadoop/DataSets/ (100 files puts here)

** unzip file

** upload to hdfs

 

3. the main code to map/reduce (from marcellodesales)

- WordFrequenceInDocument.java

- WordCountsInDocuments.java

- WordsInCorpusTFIDF.java

 

4. upload 3 (java)files to ~/hadoop/HW

 

5. get result: HW/tfidf-result/part-r-00000

make sure that tfidf-reslut exists get file from hdfs

創作者介紹
創作者 Yixue 的頭像
Yixue

Mi-t'ao

Yixue 發表在 痞客邦 留言(2) 人氣()


留言列表 (2)

發表留言
  • y7kom
  • 2011年終.瘋☉狂♂無○限〇大﹎-﹌贈﹉送﹂9SOnbA站□長瘋了

    577UP.com
  • e336924
  • e05dG奢侈品仿牌原單品質良心賣家,誠信做生意,保固說到做到簡約時尚,秉承著低調的華麗風格。全部商品貨到付款,詳情請加賴 ID: kk2023 黑貓配送 感恩
    j2k