网管联盟 | 网管论坛 | 网管u家 | 网管博客 | 网管软件 | 网管求职 | 小游戏 | 网管搜索 | 网管原创 | 网管聚合 | 网管读摘 | 网管焦点 | 世界素材 | 会员投稿 | 会员中心 
中国网管联盟
Windows Linux Cisco 网络技术 数据库 黑客攻防 DotNet Java PHP 认证 新闻资讯 服务器 存储资讯 网络设备 网管学堂 技术专题 焦点 网吧频道
 当前位置: > bitsCN.com > linux > 网络管理 > 网络管理 > Linux操作系统关于集群的安装与并行计算  

Linux操作系统关于集群的安装与并行计算

2008-04-25  作者:bitsCN整理  来源:中国网管联盟  点评 投稿 收藏

    1.linux安装 网管bitscn_com

    安装过程就不多说了。需要注意的是安装时,如果机群不与外界联网则可以不考虑安全 网管u家u.bitscn@com

    方面的因素而把rsh选为可信赖的服务,注意安装相应的软件包;如果还要与外界保持联

网管网www_bitscn_com

    网,出于安全需要应把ssh选为可信赖的服务。安装以后,应该保证各节点之间能够用s 网管u家u.bitscn@com

    sh相互登录。每个节点的sshd都应该能正常提供服务。主机名:node1...noden (我所构

网管u家u.bitsCN.com

    建的系统n=2)

网管bitscn_com

    2.创建NFS服务

中国网管论坛bbs.bitsCN.com

    在服务器节点public目录下建立mpi目录,并将其配置成NFS服务器,在/etc/exports文 网管下载dl.bitscn.com

    件中加入一行: 中国网管论坛bbs.bitsCN.com

    /public/mpi node1(rw) node2(rw) 网管u家u.bitscn@com

    在客户端节点的/etc/fstab文件中增加一行:

网管网www.bitscn.com

    sever :/pubilc/mpi nfs rw , bg , soft 0 0 网管u家u.bitsCN.com

    将/public/mpi这个目录从服务器节点输出,并装载在各客户端,从而便于在各节点间分 中国网管联盟bitsCN.com

    发任务

网管u家u.bitscn@com

    3.修改/etc/hosts文件,将所有节点名称极其ip地址填入。例如: 网管u家u.bitscn@com

    127.0.0.1 localhost.localdomain localhost 网管u家u.bitscn@com

    192.168.1.1 node1 网管网www.bitscn.com

    192.168.1.2 node2 网管bitscn_com

    …………………….

网管论坛bbs_bitsCN_com

    每个节点都进行类似的配置。这样做的目的是使节点之间能够通过node1 ... noden的名 网管网www_bitscn_com

    称相互访问。你可以通过ping noden 或 ssh noden进行测试。

网管bitscn_com

    4.修改(或创建)/etc/hosts.equiv文件

网管u家u.bitscn@com

    将所有你允许访问本机进行mpi计算的机器名填入,一行一个机器名。这一步是为了使节 网管网www.bitscn.com

    点对其它的节点放权。

中国网管论坛bbs.bitsCN.com

    例如,我的node1是我用于启动mpi集群计算的机器,其他的节点是参与计算者,在node 网管u家u.bitsCN.com

    1的/etc/hosts.equiv文件是这样的:

网管u家u.bitsCN.com

    node1 #给自己放权,这样在只有一台机器时也可以模拟并行计算环境 网管下载dl.bitscn.com

    node2 网管论坛bbs_bitsCN_com

    .....

网管u家u.bitsCN.com

    noden 网管网www.bitscn.com

    在node2...noden的/etc/hosts.equiv文件: 网管u家u.bitscn@com

    node1 #对node1放权

网管论坛bbs_bitsCN_com

    node2 网管下载dl.bitscn.com

    ......

网管网www_bitscn_com

    noden 中国网管联盟bitsCN.com

    5.修改~/.bash_profile文件 网管网www_bitscn_com

    首先决定一个用于启动集群计算的用户名,不提倡使用root进行集群计算。这里在每个 网管u家u.bitsCN.com

    节点上建立新用户chief,他们的主目录都是/home/chief,必须采用同样的密码,将来

网管联盟bitsCN@com

    的计算程序必须放在相同的路径上。譬如你的程序为:fpi.f和a.out,则必须把a.out放

网管u家u.bitsCN.com

    在同样的路境内,比如~/mpirun/a.out,每个节点都是如此。 修改~/.bash_profile文

网管联盟bitsCN_com

    件,主要是加入下列几行脚本:

网管u家u.bitsCN.com

    export PATH=$PATH:/usr/local/mpich/bin 中国网管联盟bitsCN.com

    export MPI_USEP4SSPORT=yes

中国网管论坛bbs.bitsCN.com

    export MPI_P4SSPORT=22

网管联盟bitsCN@com

    export P4_RSHCOMMAND=rsh 或ssh 网管u家u.bitsCN.com

    这里我们预定了将来mpich的运行环境安装在目录/usr/local/mpich下面。其余的三个变 网管联盟bitsCN_com

    量是用来通知mpi运行环境采用rsh(或ssh)来作为远程shell。linux的运行环境到此就配 网管下载dl.bitscn.com

    置完毕了。 网管bitscn_com

    6.配置rsh 或ssh

网管u家u.bitsCN.com

    对于采用rsh来作为远程shell运行MPI的用户只要保证在各个节点上都具有相同的用户,

网管联盟bitsCN_com

    并把这一用户的密码设为空密码就可以运行了。

网管网www_bitscn_com

    若采用ssh作为远程shell则按如下配置:以你设定的用于启动mpi计算的用户登录,运行

网管网www_bitscn_com

    ssh-keygen,这将生成一个私有/公开密钥对,分别存放在~/.ssh/identity和~/.ssh/i

网管下载dl.bitscn.com

    dentity.pub文件内。然后进行访问授权,运行:

中国网管联盟bitsCN.com

    cp ~/.ssh/identity.pub ~/.ssh/authorized_keys

网管联盟bitsCN_com

    chmod go-rwx ~/.ssh/authorized_keys

中国网管论坛bbs.bitsCN.com

    ssh-agent $SHELL 网管bitscn_com

    ssh-add 网管下载dl.bitscn.com

    在每个节点重复一遍。试着在某一节点上登录其它节点,ssh noden,则在.ssh/下生成 网管下载dl.bitscn.com

    一个known_hosts2文件,里面放着访问该主机的密钥,把所有密钥收集起来,在各个节 网管下载dl.bitscn.com

    点上作同样的拷贝。这样做的目的是使各节点相互之间访问无需输入密码。

网管bitscn_com

网管网www_bitscn_com


TAGs   计算   安装   操作系统   关于       节点   运行   rsh   服务   选择      
 上一篇:Debian Linux下配置heartbeat高可用集群   下一篇:新手学堂:Linux系统下网卡网络配置基础
Linux操作系统关于集群的安装与并行计算 评论:
loading.. 评论加载中…
评论:请自觉遵守互联网相关政策法规,评论不得超过250字。

验证码: 注册用户
本类热门排行:
最新推荐文章:
网管论坛交流: