卡桑德拉集群管理——节点异常重启

  

卡桑德拉集群管理——节点异常重启

  

登陆一台集群节点,直接重启服务器(172.20.101.166),设置了卡桑德拉开机启动。

  

注意:

  

本文档只是体系文档中的一部分,前面文档信息详见:
测试准备+下线正常节点:https://blog.51cto.com/michaelkang/2419518
节点异常重启:https://blog.51cto.com/michaelkang/2419524
添加新节点:https://blog.51cto.com/michaelkang/2419521
删除异常节点:https://blog.51cto.com/michaelkang/2419525

  

场景:

  

节点被异常重启,对集群引发的反应。

  

卡桑德拉。日志基本没有输出

  
 <代码> tailf/var/log/cassandra/cassandra.log
   
  

system.log

  

有明显日志报172.20.101.166下来! ! !

  
 <代码> 172.20.101.165节点:
  
  (root@kubm-03 lib) # tailf/var/log/cassandra/system.log
  信息(GossipStage: 1) 2019-07-11 18:19:23,372搬弄是非者。java: 1026 - InetAddress/172.20.101.166现在 
  

查看异常节点

  
 <代码> [root@kubm-01 ~] # nodetool describecluster
  集群信息:
  名称:pt
  金色飞贼:org.apache.cassandra.locator.GossipingPropertyFileSnitch
  DynamicEndPointSnitch:启用
  瓜分者:org.apache.cassandra.dht.Murmur3Partitioner
  模式版本:
  cfce5a85 - 19 - c8 - 327 a - ab19 e1faae2358f7: [172.20.101.164、172.20.101.165 172.20.101.167, 172.20.101.160, 172.20.101.157]
  
  遥不可及的(172.20.101.166): 
  

debug.log

  

大量报无法连接172.20.101.166

  
 <代码> 172.20.101.164节点:
  
  tailf/var/log/cassandra/debug.log
  
  调试(GossipStage: 1) 2019-07-11 18:19:23,374 OutboundTcpConnection。java: 205 -排队套接字关闭/172.20.101.166
  调试(MessagingService-Outgoing/172.20.101.166-Small] 2019-07-11 18:19:23,374 OutboundTcpConnection。java: 411 - 172.20.101.166关闭套接字
  调试(GossipStage: 1) 2019-07-11 18:19:23,374 OutboundTcpConnection。java: 205 -排队套接字关闭/172.20.101.166
  调试(MessagingService-Outgoing/172.20.101.166-Gossip] 2019-07-11 18:19:23,374 OutboundTcpConnection。java: 411 - 172.20.101.166关闭套接字
  调试(GossipStage: 1) 2019-07-11 18:19:23,374 FailureDetector。java: 313 -/172.20.101.166迫使定罪
  调试(MessagingService-Outgoing/172.20.101.166-Gossip] 2019-07-11 18:19:24,740 OutboundTcpConnection。java: 425 - 172.20.101.166试图连接
  信息[握手——/172.20.101.166]2019-07-11 18:19:24,741 OutboundTcpConnection。java: 561 -握手/172.20.101.166版本
  调试(MessagingService-Outgoing/172.20.101.166-Gossip] 2019-07-11 18:19:24,742 OutboundTcpConnection。java: 533 -连接/172.20.101.166完成
   
  

验证查询

  

系统启动后,服务自然启动,能正常加入集群。

  
 <代码> cassandra@cqlsh>从kevin_test.t_users SELECT *;
  
  user_id | | first_name | last_name邮件
  - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - - - - - - - - -
  6 | {“k6-6@gmail.com”、“k6@pt.com”} | kevin6 |康
  7 | {“k7-7@gmail.com”、“k7@pt.com”} | kevin7 |康
  9 | {“k9-9@gmail.com”、“k9@pt.com”} | kevin9 |康
  4 | {“k4-4@gmail.com”、“k4@pt.com”} | kevin4 |康
  3 | {“k3-3@gmail.com”、“k3@pt.com”} | kevin3 |康
  5 | {“k5-5@gmail.com”、“k5@pt.com”} | kevin5 |康
  0 | {“k0-0@gmail.com”、“k0@pt.com”} | kevin0 |康
  8 | {“k8-8@gmail.com”、“k8@pt.com”} | kevin8 |康
  2 | {“k2-2@gmail.com”、“k2@pt.com”} | kevin2 |康
  1 | {“k1-1@gmail.com”、“k1@pt.com”} | kevin1 |康
   
  

测试结果:

  

反复重启节点,查询表内容正常。

卡桑德拉集群管理——节点异常重启