已经详细介绍了如何搭建Hadoop环境,今天介绍如何运行Hadoop环境下的第一个实例WordCount。 在伪分布模式下运行一下hadoop自带的例子WordCount来感受以下MapReduce过程:这时注意程序是在文件系统dfs运行的,创建的文件也都基于文件系统: 1、准备需要进行wordcount的文件 2、在HDFS上创建输入文件夹input
3、将准备的测试文件上传到dfs文件系统中的input目录下,
4、运行wordcount 说明:hadoop-0.20.2-examples.jar是Hadoop中自带的实例,Hadoop版本不一样,实例名称可能有区别,大家在目录中自行查看。
5、查看结果
6、进入bin目录停止stop-all.sh。 |