[转帖]eclipse 下 hadoop debug 笔记_Hadoop，ERP及大数据讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3354 | 回复: 0

主题： [转帖]eclipse 下 hadoop debug 笔记

周逸涵

注册用户

等级：少校
经验：871
发帖：83
精华：0
注册：2013-7-8
状态：离线
发送短消息息给周逸涵

加好友发送短消息息给周逸涵

发消息

发表于：

2013-7-9 10:36:49 | [全部帖] [楼主帖]

楼主

1. 搭建hadoop 伪分布式集群

http://hadoop.apache.org/docs/stable/single_node_setup.html
core-site.xml
[html]view plaincopy

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/user/data/temp</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/user/data/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/user/data/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

注意: 在conf/hadoop-env.sh 中修改JDK路径 export JAVA_HOME=/usr/lib/jvm/java-6-sun-1.6.0.26

2. 开启远端监听端口

在bin/hadoop 或 conf/hadoop-env.sh 加入以下内容，一次只能开启一个，这里ip为10.13.249.132

[plain]view plaincopy

HADOOP_NAMENODE_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8788,server=y,suspend=y"
#HADOOP_SECONDARYNAMENODE_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8789,server=y,suspend=y"
#HADOOP_DATANODE_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8790,server=y,suspend=y"
#HADOOP_BALANCER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8791,server=y,suspend=y"
#HADOOP_JOBTRACKER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8792,server=y,suspend=y"
#HADOOP_TASKTRACKER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8793,server=y,suspend=y"

在conf/mapred-site.xml中添加以下配置项, 限制能启动task 的child数为1：

[html]view plaincopy

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
<property>
<name>mapred.child.java.opts</name>
<value>-agentlib:jdwp=transport=dt_socket,address=8883,server=y,suspend=y</value>
</property>
</configuration>

此时开启hadoop，能看到namenode开启监听端口，如图：

北京联动北方科技有限公司

3. eclipse java远程调试

装 eclipse 和 hadoop plugin

hadoop plugin 可以从源码编译出来 Hadoop 1.0.3/src/contrib/eclipse-plugin, 或使用聂永哥打包好的下载地址

可用版本 eclipse3.7 + hadoop-eclipse-plugin-1.0.2 + Hadoop 1.0.3 ,

1) 配置hadoop插件

eclipse perspective -> Map/Reduce
General
Map/Reduce Master Host: localhost , Post: 9001
DFS Master Host: localhost, Post: 9000
User name: user
Advanced

dfs.data.dir, dfs.name.dir, dfs.tmp.dir 等填入 core-site.xml 中的值

mapred.child.java.opts = -Xmx200m -Xdebug -Xrunjdwp:transport=dt_socket,address=8883,server=y,suspend=y

2) eclipse开启远程调试功能，连接到运行hadoop的Ip与端口。如下图所示：

北京联动北方科技有限公司