`
Lewis·Lee
  • 浏览: 65216 次
  • 性别: Icon_minigender_1
  • 来自: 台州
社区版块
存档分类
最新评论

两台 Ubuntu 机器实现 Hadoop 集群

阅读更多

实验环境:一台是 Ubuntu 10.04 机器,另一台是安装在 Windows XP 下通过 Vmware Server 的虚拟机,该系统也是 Ubuntu 10.04。可以利用 LVM 的“快照”功能实现数据备份

 

1.  实现 Hadoop 集群时,用到以下这些软件:

  • Ubuntu Linux 10.04 LTS, 8.10, 8.04 LTS, 7.10, 7.04 (9.10 and 9.04 should work as well)
  • Hadoop 0.20.2, released February 2010 (also works with 0.13.x - 0.19.x)
  • Sun JDK 6 6u21 (1.6.21), 安装 JDK 详细步骤 (该页面的 PDF 文件已上传到附件)。如在服务器上,我们只需安装 Sun JRE 6u21 即可。 注意,jdk-6u21-linux-i586.bin 需通过 VPN 才能下载;
  • OpenSSH Server,在 Ubuntu 中输入 sudo apt-get install openssh-server 即可安装
  • Rsync

使用 PuTTy 的 scp 功能实现文件传输

C:\Documents and Settings\Huagang Li>pscp -i E:\key\doug_lee_id_rsa.ppk -P 2323
-scp "E:\Software\Linux Server\JDK\jdk-6u21-linux-i586.bin" lewis@192.168.1.198:
/home/lewis/
jdk-6u21-linux-i586.bin   | 81889 kB | 3899.5 kB/s | ETA: 00:00:00 | 100%

pscp -i E:\key\doug_lee_id_rsa.ppk -P 2323 -scp "H:\Search Engine\Open Source\hadoop-0.21.0.tar.gz" lewis@192.168.1.199:/home/lewis/

 

注意 :利用 Vmware Server 在 Windows XP 上安装 Ubuntu 10.04 完成后,记得执行以下命令,不然安装软件时出现 LC_ALL = (unset) 错误:

# 前提是 /etc/default/locale 文件的内容为(不包括 # 号):
# LANG="en_US.UTF-8"
# LANGUAGE="en_US:en"
sudo locale-gen en_US.UTF-8
 

 

2.  配置 Hadoop 信息请浏览参考资料一

 

 

参考资料

  1. Running Hadoop On Ubuntu Linux (Multi-Node Cluster)

  2. Running Hadoop On Ubuntu Linux (Single-Node Cluster)

  3. 用 Hadoop 进行分布式数据处理

  4. 使用 Linux 和 Hadoop 进行分布式计算

分享到:
评论
2 楼 Lewis·Lee 2012-12-15  
不清楚  那时还在学校读研,对这个感兴趣
1 楼 shmwei 2012-11-05  
台州也有搞这个的吗  我以前在路桥区

相关推荐

    Hadoop在两台Ubuntu的VM虚拟机的集群配置

    在宿主机上创建了两台VM的虚拟机,宿主机系统为XP,两台虚拟机系统为Ubuntu,进行了Hadoop的集群配置。亲自做的实验。

    Ubuntu10.04下Hadoop-0.20.2集群配置手册.doc

    我先交待一下我自己的环境: 两台机器,每台机器上面两个虚机(vmware 均以桥接方式,也就是说4个虚机都有各自独立的内网IP)都是ubuntu10.04,宿主机都是windowsxp,用SecureCRT(严重推荐,好使)连接各个副机。...

    实验一Hadoop大数据集群搭建

    【实验一】Ubuntu/Centos通用的hadoop集群搭建实验(来自OUC) 具体内容和步骤: 1. 成功创建Linux的虚拟机操作系统(Ubuntu或Centos)作为namenode,并设置好虚拟网卡、使用net方式使虚拟机可以访问互联网。 2. 完成...

    Hadoop集群配置(最全面总结)

    操作系统:Ubuntu部署:Vmvare在vmvare安装好一台Ubuntu虚拟机后,可以导出或者克隆出另外两台虚拟机。说明:保证虚拟机的ip和主机的ip在同一个ip段,这样几个虚拟机和主机之间可以相互通信。为了保证虚拟机的ip和...

    Cloudera Hadoop 集群安装(三台机器)

    简述:Hadoop的安装对环境有比较高的要求,需要比较大的内存,一般的机器很难满足,一个人也很难有两三台独立的主机,所以只能选择使用安装虚拟机的方式安装,但是主机的内存需要在8G以上。如果小于8G可以扩展内存后...

    hadoop完全分布式

    hadoop完全分布式的集群搭建 硬件环境 两台虚拟机 linux的Ubuntu10.10的系统 hadoop0.20.2

    搭建Hadoop集群

    VMnet0:用于虚拟桥接网络下的虚拟交换机,在这种模式下,虚拟出来的操作系统就像是局域网中的一台独立的主机,它可以访问网内任何一台机器。所以需要手动为虚拟系统配置IP地址、子网掩码,而且还要和宿主

Global site tag (gtag.js) - Google Analytics