先决条件
为了建立一个集群的分布式工人作为一个学术用户,您必须获得许可证的分布式优化(在启用用户门户为您的特定许可限制标签应该包含“分布式限制:100”)。如果你的许可没有这个属性,那么请提交一个请求。
或者,你可能有一个学术机构浮动网站许可证由Gurobi令牌管理服务器(请联系你的机构的IT管理员附加信息)。
创建集群
在下面,我们两个单独的机器上创建两个工人,将它们连接到形成一个集群。一个客户机请求许可令牌(可选从Gurobi令牌服务器在使用网站许可证)可以提交一个分布式优化工作两个工人的机器:
我们强烈建议使用一台机器人均时形成一个集群的分布式工人。如果你想开始多个工人在同一台机器上出于测试目的,每个实例Gurobi远程服务(grb_rs)必须开始在不同的端口使用不同的数据目录。命令”grb_rs init”将有助于通过默认的配置和数据目录复制到当前目录。请参考连接节点的文档manbet体育手机客户端为更多的细节。
1。开始第一个工人
在这个例子中,我们开始远程服务工人流程。而不是启动工人服务,请参考安装一个集群节点文档manbet体育手机客户端。
我们开始第一个工人machine1上从命令行通过
grb_rs——工人——端口= 12345
这开始grb_rs在端口12345上工作进程(你可以选择任何端口号所允许您的IT管理员,通常为< 1024端口需要root权限)。而不是提供参数”——工人——端口= 12345”通过命令行,您可以另外添加以下行来grb_rs.cnf的配置文件,位于本远程服务安装的子目录:
工人= TRUE
端口= 12345
执行上述grb_rs命令应该提供输出类似如下:
信息:Gurobi远程服务开始……
信息:linux平台
信息:版本10.0.0(构建v10.0.0rc2)
信息:工作模式是有限的工作,没有队列
信息:变量GRB_LICENSE_FILE没有设置
地址是machine1:12345信息:节点
信息:节点FQN是machine1.domain.com
信息:有4个核心节点
信息:使用数据目录< path_to_gurobi > / gurobi_server952 / linux64 / bin /数据
信息:节点ID是bd9e74d1 ce8d - 472 f - 8069 - 06 - d152940033
信息:可用的运行时:[10.0.0 9.0.0 9.0.1 9.0.2 9.0.3 9.1.0 9.1.1 9.1.2 9.5.0 9.5.1 9.5.2]
信息:接受职工登记在端口42443上……
信息:公共根< path_to_gurobi > / gurobi_server912 / linux64 /资源/ grb_r狗万app足彩s /公共
信息:开始API服务器(HTTP)在端口12345上……
2。开始新员工
我们继续开始第二个工人的例子machine2并连接到第一个工人machine1上。注意,两台机器和客户端必须能够通过他们的主机名进行沟通。如果这是不可能的,你需要使用IP地址,而不是名字。
在machine2,我们执行
grb_rs——工人= 12346,加入= machine1:12345港
这开始grb_rs在端口12346上工作进程,加入已经运行grb_rs过程machine1上,创建一个集群。或者,我们可以添加工人,港口,加入设置的grb_rs.cnf配置文件如下:
工人= TRUE
端口= 12346
加入= machine1:12345
启动远程服务machine2以这种方式产生的输出如下:
信息:Gurobi远程服务开始……
信息:linux平台
信息:版本10.0.0(构建v10.0.0rc2)
信息:工作模式是有限的工作,没有队列
信息:变量GRB_LICENSE_FILE没有设置
地址是machine2:12346信息:节点
信息:节点FQN是machine2.domain.com
信息:有4个核心节点
信息:使用数据目录< path_to_gurobi > / gurobi_server952 / linux64 / bin /数据
信息:节点ID是bd9e74d1 ce8d - 472 f - 8069 - 06 - d152940033
信息:可用的运行时:[10.0.0 9.0.0 9.0.1 9.0.2 9.0.3 9.1.0 9.1.1 9.1.2 9.5.0 9.5.1 9.5.2]
信息:接受职工登记在端口42443上……
信息:公共根< path_to_gurobi > / gurobi_server912 / linux64 /资源/ grb_r狗万app足彩s /公共
信息:开始API服务器(HTTP)在端口12346上……
信息:节点machine1:12345,添加到集群中
在machine1上,我们可以看到一个额外的日志记录新集群行:
信息:节点machine2:12346,添加到集群中
这样,我们已经成功地创建了两个工人的集群节点。
检查集群的状态
检查集群的现状,使用grbcluster命令登录到第一个工人机:
= machine1:12345 grbcluster登录——服务器
当提示输入密码,紧迫输入不输入密码将使用默认密码。
一旦你已经登录到集群,命令”grbcluster节点”生成一个表与集群节点的状态:
ID地址状态类型授权处理#问# R JL闲置% MEM % CPU
08年e7e51b machine1:12345活着工人N /接受0 0 1 < 1米1.06 - 0.00
bb5942d0 machine2:12346活着工人N /接受0 0 1 1米1.22 - 0.24
提交一份工作的集群
可用的许可证文件需要,例如,在其中的一个默认的位置。如果使用一个学术网站许可,创建一个令牌服务器客户端许可证文件包含机器的地址和端口运行Gurobi令牌服务器。
提交作业的集群中,设置DistributedMIPJobs参数一起断线参数。例如,我们可以使用Gurobi命令行工具提交一个分布式集群优化工作,使用下面的命令:
gurobi_cl DistributedMIPJobs = 2断线= machine1.domain.com: 12345 glass4.mps
由此产生的控制台输出应该说明分布式工作已提交并显示机器正在使用:
分布式工人开始工作……
分布式工人开始在machine1.domain.com: 12345
分布式工人开始在machine2.domain.com: 12346
分布式MIP工作数:2
请注意,它足以提供只有一个工人机当指定地址断线参数。这可以是任何机器在分布式集群工人。
常见的错误和警告
1。这个错误
错误:错误创建存储服务,grb_rs已经开始了吗?:错误打开数据存储:超时
发生在两个grb_rs进程试图访问相同的数据目录。这可能发生在前一个grb_rs服务没有停止正常。在这种情况下,请杀死所有grb_rs流程的机器上,再试一次。如果你正试图运行两个grb_rs流程在同一台机器上和/或数据文件系统,请参考连接节点的文档manbet体育手机客户端为更多的细节。
2。这个错误
无法开始工作,不能连接到服务器(代码7,指挥所http://machine1.domain.com/api/v1/cluster/jobs)
时提供的地址断线参数是错误的(例如,machine1.domain.com而不是machine1.domain.com: 12345)。
3所示。的警告
无法开始工作,工作被拒绝,因为没有能力在集群中
分布式MIP工作数:2
机器工作数量有限的可用性
时的值DistributedMIPJobs参数的数量超过可用的工人集群中的节点。
评论
0评论
文章是关闭了评论。