Hadoop配置与启动Hadoop
Hadoop三种模式:
StandaloneOperation:只有一个Java虚拟机在跑,完全没有分布式的成分。
Pseudo-DistributedOperation:在同一台机器上启动独立数个JVM进程,进行“分布式”操作。
Fully-DistributedOperation:真正的可以运行于多台机器上的分布式模式。(我们按这种方式进行配置)
环境:
第一台:win7+cygwin
第二台:虚拟机CentOS.5.3
实现目标:
cygwin作为master,部署上NameNode+JobTracker,IP:192.168.220.1
CentOS作为slaver,部��上DataNode+TaskTracker,IP:192.168.14.128
Hadoop配置准备工作:
1.免密码SSH登录,cygwin=》CentOS,见:http://efeil.blog.163.com/blog/static/1189022972010210544494/
2.两个系统Hosts配置相同,为:192.168.220.1hadoop-master
192.168.14.128hadoophadoop-slave01
3.Hadoop配置中conf/core-site.xml配置
<configuration>
<!---globalproperties-->
<property>
<name>hadoop.tmp.dir</name>
<!--这是Cygwin下配置,CentOS下为/tmp/hdfs-gaoyanfei-->
<value>e:/tmp/hdfs-gaoyanfei</value>
<description>Abaseforothertemporarydirectories.</description>
</property>
<!--filesystemproperties-->
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop-master:9000</value>
</property>
</configuration>
4.Hadoop配置中conf/hdfs-site.xml配置:
<?xmlversion="1.0"?>
<?xml-stylesheettype="text/xsl"href="configuration.xsl"?>
<!--Putsite-specificpropertyoverridesinthisfile.-->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>