Standalone Operation
http://hadoop.apache.org/common/docs/r0.20.2/quickstart.html#Installing+Software
Standalone Operation
$ mkdir data/input $ cp hadoop/conf/*.xml data/input/ $ hadoop/bin/hadoop jar hadoop/hadoop-*-examples.jar grep data/input data/output 'dfs[a-z.]+' $ ls -l data/output 合計 4 -rwxrwxrwx 1 hadoop hadoop 0 2011-11-10 22:59 _SUCCESS -rwxrwxrwx 1 hadoop hadoop 11 2011-11-10 22:59 part-r-00000 $ cat data/output/* 1 dfsadmin
で、これってどういう意味なん?
The following example copies the unpacked conf directory to use as input and then finds and displays every match of the given regular expression. Output is written to the given output directory.
ってあるから、conf配下のファイルをinputにコピーして、それらを入力として正規表現でgrepして結果を出力するということですかね。
outputの中にファイルはなんでしょう・・・