<div dir="ltr"><div><div><div><div><div><div><div><div>Hi,<br><br>I added the node named "sheepdog001" to my prouction cluster.<br>It was able to show the other node by 'do node list'.<br><br>root@sheepdog001:~# dog node list<br>
  Id   Host:Port         V-Nodes       Zone<br>   0   <a href="http://192.168.6.41:7000">192.168.6.41:7000</a>        126  688302272<br>   1   <a href="http://192.168.6.42:7000">192.168.6.42:7000</a>        124  705079488<br>
   2   <a href="http://192.168.6.43:7000">192.168.6.43:7000</a>        147  721856704<br>   3   <a href="http://192.168.6.44:7000">192.168.6.44:7000</a>        115  738633920<br><br>I also get the right messages in sheep.log<br>
<br>dog node recovery was showing <br>Dec 06 14:45:47   INFO [main] md_add_disk(310) /mnt/sheep/dsk01, vdisk nr 216, total disk 1<br>Dec 06 14:45:47   INFO [main] md_add_disk(310) /mnt/sheep/dsk02, vdisk nr 466, total disk 2<br>
Dec 06 14:45:47   INFO [main] md_add_disk(310) /mnt/sheep/dsk03, vdisk nr 1863, total disk 3<br>Dec 06 14:45:48   INFO [main] send_join_request(778) IPv4 ip:192.168.6.41 port:7000<br>Dec 06 14:45:48   INFO [main] check_host_env(420) Allowed open files 1024000, suggested 6144000<br>
Dec 06 14:45:48   INFO [main] main(821) sheepdog daemon (version 0.7.0_131_g88f0024) started<br><br></div>But if I run 'dog node list' or any other sub command on the other node, it hangs up, so I have to press ctrl + c.<br>
<br></div>On sheep.log of node sheepdog002 I get this: <br><br>Dec 06 14:45:48  EMERG [main] crash_handler(250) sheep exits unexpectedly (Aborted).<br><br></div>but sheep process is still alive<br><br><br></div>sheepdog003 and sheepdog004 log file is empty.<br>
</div>Not strange message in /var/log/syslog.<br><br></div>The guests are alive but unable to write anything to disks.<br></div>The cluster has crashed.<br><br>Sheepdog daemon version 0.7.0_131_g88f0024<br><br></div>Any hint?<br>
</div>