活动公告

系统通知
05-18 21:22
系统通知
通知:本站资源由网友上传分享,如有违规等问题请到版务模块进行投诉,资源失效请在帖子内回复要求补档,会尽快处理!
10-23 09:31

Redis分布式锁释放问题全面剖析从锁机制原理到常见陷阱及解决方案助你轻松应对分布式系统中的锁管理挑战

SunJu_FaceMall

3万

主题

2860

科技点

3万

积分

白金月票

碾压王

积分
32872

塔罗立华奏

<font color=白金月票" /> 发表于 2025-9-27 13:30:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
引言

在分布式系统中,数据一致性和并发控制是至关重要的挑战。随着系统规模的扩大和微服务架构的普及,多个进程或线程同时访问共享资源的情况变得日益普遍。为了确保数据的一致性和防止并发冲突,分布式锁应运而生。Redis作为一种高性能的内存数据库,因其快速、简单的特性,成为了实现分布式锁的热门选择。然而,Redis分布式锁的正确实现和使用并非易事,特别是锁的释放环节,常常隐藏着各种陷阱。本文将深入剖析Redis分布式锁的释放问题,从锁机制原理到常见陷阱,再到解决方案,帮助读者全面理解并正确应对分布式系统中的锁管理挑战。

Redis分布式锁的基本原理

什么是分布式锁

分布式锁是一种在分布式环境下,控制多个进程或线程对共享资源访问的同步机制。与单机环境下的锁不同,分布式锁需要跨越网络和进程边界,确保在分布式系统中同一时间只有一个客户端能够持有锁并访问共享资源。

Redis分布式锁的基本实现

Redis分布式锁的基本实现通常利用Redis的SETNX命令(SET if Not eXists)。这个命令在指定的键不存在时,为键设置值,并返回1;如果键已经存在,则不做任何操作,返回0。这种特性使得SETNX非常适合用于实现锁机制。

基本的Redis分布式锁获取过程如下:
  1. SETNX lock_key unique_value
复制代码

其中,lock_key是锁的名称,unique_value是一个唯一标识符,通常可以使用UUID或客户端标识符,用于区分不同的锁持有者。

为了防止锁被无限期持有(例如,客户端获取锁后崩溃),通常会为锁设置一个过期时间:
  1. EXPIRE lock_key 30  # 设置锁30秒后自动过期
复制代码

在Redis 2.6.12及以上版本,可以使用SET命令的扩展选项,将获取锁和设置过期时间合并为一个原子操作:
  1. SET lock_key unique_value NX PX 30000  # NX表示不存在时才设置,PX表示过期时间单位为毫秒
复制代码

锁的释放机制

锁的释放通常通过DEL命令完成:
  1. DEL lock_key
复制代码

然而,简单的DEL命令可能导致问题:如果一个客户端的锁已经过期,而另一个客户端已经获取了相同的锁,那么第一个客户端执行DEL命令可能会错误地释放第二个客户端的锁。

为了避免这种情况,正确的锁释放应该是一个两步操作:

1. 检查锁的值是否与当前客户端的唯一标识符匹配
2. 如果匹配,则删除锁

这个过程需要是原子的,以避免竞态条件。在Redis中,可以使用Lua脚本来实现原子操作:
  1. if redis.call("get", KEYS[1]) == ARGV[1] then
  2.     return redis.call("del", KEYS[1])
  3. else
  4.     return 0
  5. end
复制代码

Redis分布式锁的释放机制详解

锁释放的正确流程

Redis分布式锁的正确释放流程应该包含以下步骤:

1. 客户端生成唯一标识符(如UUID)
2. 使用SET命令获取锁,并设置过期时间
3. 执行需要同步的代码
4. 释放锁前,先验证锁的值是否与自己的唯一标识符匹配
5. 如果匹配,则释放锁;如果不匹配,说明锁已经过期或被其他客户端获取,不应该释放

为什么需要验证锁的所有者

验证锁的所有者是防止误删其他客户端持有的锁的关键。考虑以下场景:

1. 客户端A获取锁,设置过期时间为30秒
2. 客户端A执行的操作耗时超过30秒
3. 锁自动过期
4. 客户端B获取了同一个锁
5. 客户端A完成操作,尝试释放锁

如果客户端A不验证锁的所有者就直接释放锁,它会错误地释放客户端B持有的锁,导致数据不一致或其他并发问题。

锁的自动过期与手动释放

锁的自动过期是一种保护机制,防止客户端崩溃后锁永远不被释放。然而,自动过期也带来了新的挑战:

1. 过期时间设置:过期时间太短可能导致操作未完成锁就过期;过期时间太长可能导致客户端崩溃后锁长时间不被释放。
2. 锁续期:对于长时间运行的操作,可能需要在锁过期前主动续期。

Redis分布式锁的原子性要求

Redis分布式锁的获取和释放都需要保证原子性:

• 获取锁的原子性:使用SET命令的NX和EX/PX选项,确保获取锁和设置过期时间是原子操作。
• 释放锁的原子性:使用Lua脚本确保检查锁所有者和释放锁是原子操作,避免竞态条件。

常见的锁释放陷阱

陷阱一:误删其他客户端的锁

这是最常见的陷阱之一。当客户端不验证锁的所有者就直接释放锁时,可能会误删其他客户端的锁。

问题示例:
  1. // 错误的锁释放示例
  2. public void releaseLock(String lockKey) {
  3.     jedis.del(lockKey); // 直接删除锁,不验证所有者
  4. }
复制代码

解决方案:

使用Lua脚本确保只有锁的持有者才能释放锁:
  1. // 正确的锁释放示例
  2. public boolean releaseLock(String lockKey, String uniqueValue) {
  3.     String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  4.                        "return redis.call('del', KEYS[1]) " +
  5.                        "else " +
  6.                        "return 0 " +
  7.                        "end";
  8.     Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  9.     return result == 1;
  10. }
复制代码

陷阱二:锁过期导致业务未完成

锁的过期时间设置不当可能导致业务操作未完成锁就过期,从而引发并发问题。

问题示例:
  1. // 锁过期时间设置过短
  2. public void doBusiness() {
  3.     String lockKey = "resource_lock";
  4.     String uniqueValue = UUID.randomUUID().toString();
  5.    
  6.     // 获取锁,设置过期时间为1秒
  7.     boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", 1000) != null;
  8.    
  9.     if (locked) {
  10.         try {
  11.             // 模拟耗时操作,超过1秒
  12.             Thread.sleep(1500);
  13.             // 业务逻辑
  14.             businessLogic();
  15.         } catch (InterruptedException e) {
  16.             e.printStackTrace();
  17.         } finally {
  18.             releaseLock(lockKey, uniqueValue);
  19.         }
  20.     }
  21. }
复制代码

解决方案:

1. 合理设置过期时间:根据业务操作的预估耗时设置合适的过期时间,并留有一定的缓冲。
2. 锁续期机制:实现锁的自动续期,确保在业务操作完成前锁不会过期。
  1. // 锁续期示例
  2. public void doBusinessWithLockRenewal() {
  3.     String lockKey = "resource_lock";
  4.     String uniqueValue = UUID.randomUUID().toString();
  5.    
  6.     // 获取锁,设置过期时间为10秒
  7.     boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", 10000) != null;
  8.    
  9.     if (locked) {
  10.         // 启动一个后台线程定期续期
  11.         ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor();
  12.         ScheduledFuture<?> renewalFuture = scheduler.scheduleAtFixedRate(() -> {
  13.             // 续期锁,将过期时间重新设置为10秒
  14.             jedis.pexpire(lockKey, 10000);
  15.         }, 3, 3, TimeUnit.SECONDS); // 每3秒续期一次
  16.         
  17.         try {
  18.             // 业务逻辑
  19.             businessLogic();
  20.         } finally {
  21.             // 停止续期
  22.             renewalFuture.cancel(true);
  23.             scheduler.shutdown();
  24.             // 释放锁
  25.             releaseLock(lockKey, uniqueValue);
  26.         }
  27.     }
  28. }
复制代码

陷阱三:Redis单点故障导致锁信息丢失

使用单个Redis实例作为分布式锁服务存在单点故障风险。如果Redis实例宕机,所有锁信息将丢失,可能导致多个客户端同时获取到同一把锁。

解决方案:

使用Redis集群或Redis Sentinel实现高可用,或者采用Redlock算法(Redis分布式锁算法)来增强可靠性。

Redlock算法的基本思想是:

1. 获取当前时间戳
2. 按顺序依次向N个Redis实例请求获取锁
3. 计算获取锁所花费的时间
4. 如果客户端能够在大多数Redis实例上获取锁,并且获取锁的总时间小于锁的有效时间,则认为锁获取成功
5. 如果获取锁失败,则尝试释放所有已获取的锁
  1. // Redlock算法示例实现
  2. public class RedLock {
  3.     private final List<Jedis> jedisInstances;
  4.    
  5.     public RedLock(List<Jedis> jedisInstances) {
  6.         this.jedisInstances = jedisInstances;
  7.     }
  8.    
  9.     public boolean lock(String lockKey, String uniqueValue, long expireTime) {
  10.         int N = jedisInstances.size();
  11.         long startTime = System.currentTimeMillis();
  12.         int acquiredCount = 0;
  13.         
  14.         // 尝试在所有Redis实例上获取锁
  15.         for (Jedis jedis : jedisInstances) {
  16.             String result = jedis.set(lockKey, uniqueValue, "NX", "PX", expireTime);
  17.             if ("OK".equals(result)) {
  18.                 acquiredCount++;
  19.             }
  20.         }
  21.         
  22.         // 计算获取锁所花费的时间
  23.         long elapsedTime = System.currentTimeMillis() - startTime;
  24.         
  25.         // 如果在大多数实例上获取锁成功,并且获取锁的时间小于锁的有效时间
  26.         if (acquiredCount > N/2 && elapsedTime < expireTime) {
  27.             return true;
  28.         } else {
  29.             // 获取锁失败,释放所有已获取的锁
  30.             unlock(lockKey, uniqueValue);
  31.             return false;
  32.         }
  33.     }
  34.    
  35.     public void unlock(String lockKey, String uniqueValue) {
  36.         String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  37.                           "return redis.call('del', KEYS[1]) " +
  38.                           "else " +
  39.                           "return 0 " +
  40.                           "end";
  41.         
  42.         for (Jedis jedis : jedisInstances) {
  43.             try {
  44.                 jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  45.             } catch (Exception e) {
  46.                 // 忽略异常,继续尝试释放其他实例上的锁
  47.             }
  48.         }
  49.     }
  50. }
复制代码

陷阱四:网络分区导致的脑裂问题

在分布式系统中,网络分区可能导致Redis集群出现脑裂(Split-Brain)问题,即多个分区都认为自己是主节点,从而可能导致多个客户端同时获取到同一把锁。

解决方案:

1. 使用Redis集群的自动故障转移机制,确保在网络分区后只有一个主节点。
2. 使用Redlock算法,即使出现网络分区,也能保证锁的安全性。
3. 实现 fencing token 机制,为每个锁请求分配一个递增的令牌,服务端在处理请求时验证令牌的有效性和顺序。

陷阱五:GC暂停导致的锁过期

在Java应用中,长时间的垃圾回收(GC)暂停可能导致线程暂停执行,从而使得锁过期,而客户端并不知情。

解决方案:

1. 优化GC:调整JVM参数,减少长时间GC暂停的可能性。
2. 锁续期:实现锁的自动续期机制,确保在GC暂停期间锁不会过期。
3. 使用更安全的锁实现:如Zookeeper分布式锁,它通过临时节点和会话机制提供了更可靠的锁管理。
  1. // 使用Zookeeper实现分布式锁示例
  2. public class ZookeeperDistributedLock {
  3.     private final ZooKeeper zk;
  4.     private final String lockPath;
  5.     private String currentLockPath;
  6.    
  7.     public ZookeeperDistributedLock(ZooKeeper zk, String lockPath) {
  8.         this.zk = zk;
  9.         this.lockPath = lockPath;
  10.     }
  11.    
  12.     public boolean lock(long timeout, TimeUnit unit) throws InterruptedException, KeeperException {
  13.         long startTime = System.currentTimeMillis();
  14.         long timeoutMillis = unit.toMillis(timeout);
  15.         
  16.         // 创建临时顺序节点
  17.         currentLockPath = zk.create(lockPath + "/lock-", new byte[0],
  18.                                    ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
  19.         
  20.         // 获取所有子节点并排序
  21.         List<String> children = zk.getChildren(lockPath, false);
  22.         Collections.sort(children);
  23.         
  24.         // 检查当前节点是否是最小的节点
  25.         String currentNode = currentLockPath.substring(lockPath.length() + 1);
  26.         int currentIndex = children.indexOf(currentNode);
  27.         
  28.         if (currentIndex == 0) {
  29.             // 当前节点是最小的,获取锁成功
  30.             return true;
  31.         } else {
  32.             // 监听前一个节点
  33.             String previousNodePath = lockPath + "/" + children.get(currentIndex - 1);
  34.             final CountDownLatch latch = new CountDownLatch(1);
  35.             Stat stat = zk.exists(previousNodePath, new Watcher() {
  36.                 @Override
  37.                 public void process(WatchedEvent event) {
  38.                     if (event.getType() == Event.EventType.NodeDeleted) {
  39.                         latch.countDown();
  40.                     }
  41.                 }
  42.             });
  43.             
  44.             if (stat == null) {
  45.                 // 前一个节点已经不存在,重新尝试获取锁
  46.                 return lock(timeoutMillis - (System.currentTimeMillis() - startTime), TimeUnit.MILLISECONDS);
  47.             }
  48.             
  49.             // 等待前一个节点被删除或超时
  50.             latch.await(timeoutMillis - (System.currentTimeMillis() - startTime), TimeUnit.MILLISECONDS);
  51.             
  52.             // 重新检查当前节点是否是最小的节点
  53.             children = zk.getChildren(lockPath, false);
  54.             Collections.sort(children);
  55.             currentIndex = children.indexOf(currentNode);
  56.             
  57.             return currentIndex == 0;
  58.         }
  59.     }
  60.    
  61.     public void unlock() throws KeeperException, InterruptedException {
  62.         if (currentLockPath != null) {
  63.             zk.delete(currentLockPath, -1);
  64.             currentLockPath = null;
  65.         }
  66.     }
  67. }
复制代码

解决方案与最佳实践

1. 使用Redisson实现可靠的分布式锁

Redisson是一个Redis的Java客户端,提供了许多分布式数据结构和服务,包括分布式锁。Redisson实现的分布式锁解决了上述许多问题,如锁续期、锁释放的安全性等。
  1. // 使用Redisson实现分布式锁
  2. public class RedissonLockExample {
  3.     public void doBusiness() {
  4.         Config config = new Config();
  5.         config.useSingleServer().setAddress("redis://127.0.0.1:6379");
  6.         RedissonClient redisson = Redisson.create(config);
  7.         
  8.         RLock lock = redisson.getLock("myLock");
  9.         
  10.         try {
  11.             // 获取锁,设置锁的自动续期时间为30秒
  12.             lock.lock(30, TimeUnit.SECONDS);
  13.             
  14.             // 执行业务逻辑
  15.             businessLogic();
  16.             
  17.         } finally {
  18.             // 释放锁
  19.             lock.unlock();
  20.         }
  21.     }
  22.    
  23.     private void businessLogic() {
  24.         // 业务逻辑实现
  25.     }
  26. }
复制代码

Redisson的分布式锁具有以下特性:

1. 自动续期:Redisson会自动为锁续期,防止业务未完成锁就过期。
2. 可重入:同一个线程可以多次获取同一把锁。
3. 锁等待:支持在获取锁失败时等待一段时间。
4. 锁释放的安全性:确保只有锁的持有者才能释放锁。

2. 实现锁续期机制

如果不使用Redisson,也可以自己实现锁续期机制:
  1. public class LockRenewalExample {
  2.     private final Jedis jedis;
  3.     private final ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor();
  4.    
  5.     public LockRenewalExample(Jedis jedis) {
  6.         this.jedis = jedis;
  7.     }
  8.    
  9.     public void doBusinessWithLockRenewal() {
  10.         String lockKey = "resource_lock";
  11.         String uniqueValue = UUID.randomUUID().toString();
  12.         long expireTime = 10000; // 10秒
  13.         
  14.         // 获取锁
  15.         boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", expireTime) != null;
  16.         
  17.         if (locked) {
  18.             ScheduledFuture<?> renewalFuture = null;
  19.             try {
  20.                 // 启动锁续期任务,每3秒续期一次
  21.                 renewalFuture = scheduler.scheduleAtFixedRate(() -> {
  22.                     jedis.pexpire(lockKey, expireTime);
  23.                 }, expireTime / 3, expireTime / 3, TimeUnit.MILLISECONDS);
  24.                
  25.                 // 执行业务逻辑
  26.                 businessLogic();
  27.                
  28.             } finally {
  29.                 // 停止锁续期
  30.                 if (renewalFuture != null) {
  31.                     renewalFuture.cancel(true);
  32.                 }
  33.                
  34.                 // 释放锁
  35.                 releaseLock(lockKey, uniqueValue);
  36.             }
  37.         }
  38.     }
  39.    
  40.     private boolean releaseLock(String lockKey, String uniqueValue) {
  41.         String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  42.                           "return redis.call('del', KEYS[1]) " +
  43.                           "else " +
  44.                           "return 0 " +
  45.                           "end";
  46.         Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  47.         return result == 1;
  48.     }
  49.    
  50.     private void businessLogic() {
  51.         // 业务逻辑实现
  52.     }
  53. }
复制代码

3. 使用Redlock算法提高可靠性

对于对锁安全性要求极高的场景,可以使用Redlock算法:
  1. public class RedLockExample {
  2.     private final List<Jedis> jedisInstances;
  3.    
  4.     public RedLockExample(List<Jedis> jedisInstances) {
  5.         this.jedisInstances = jedisInstances;
  6.     }
  7.    
  8.     public void doBusinessWithRedLock() {
  9.         String lockKey = "resource_lock";
  10.         String uniqueValue = UUID.randomUUID().toString();
  11.         long expireTime = 10000; // 10秒
  12.         
  13.         RedLock redLock = new RedLock(jedisInstances);
  14.         boolean locked = redLock.lock(lockKey, uniqueValue, expireTime);
  15.         
  16.         if (locked) {
  17.             try {
  18.                 // 执行业务逻辑
  19.                 businessLogic();
  20.             } finally {
  21.                 // 释放锁
  22.                 redLock.unlock(lockKey, uniqueValue);
  23.             }
  24.         } else {
  25.             // 获取锁失败的处理
  26.             System.out.println("Failed to acquire lock");
  27.         }
  28.     }
  29.    
  30.     private void businessLogic() {
  31.         // 业务逻辑实现
  32.     }
  33. }
复制代码

4. 实现锁的容错机制

在分布式系统中,网络故障和节点故障是常态,因此需要实现锁的容错机制:
  1. public class FaultTolerantLockExample {
  2.     private final Jedis jedis;
  3.     private final int maxRetryTimes;
  4.     private final long retryInterval;
  5.    
  6.     public FaultTolerantLockExample(Jedis jedis, int maxRetryTimes, long retryInterval) {
  7.         this.jedis = jedis;
  8.         this.maxRetryTimes = maxRetryTimes;
  9.         this.retryInterval = retryInterval;
  10.     }
  11.    
  12.     public void doBusinessWithFaultTolerantLock() {
  13.         String lockKey = "resource_lock";
  14.         String uniqueValue = UUID.randomUUID().toString();
  15.         long expireTime = 10000; // 10秒
  16.         
  17.         int retryTimes = 0;
  18.         boolean locked = false;
  19.         
  20.         // 重试机制
  21.         while (retryTimes < maxRetryTimes && !locked) {
  22.             try {
  23.                 locked = jedis.set(lockKey, uniqueValue, "NX", "PX", expireTime) != null;
  24.                
  25.                 if (locked) {
  26.                     try {
  27.                         // 执行业务逻辑
  28.                         businessLogic();
  29.                     } finally {
  30.                         // 释放锁
  31.                         releaseLock(lockKey, uniqueValue);
  32.                     }
  33.                 } else {
  34.                     retryTimes++;
  35.                     if (retryTimes < maxRetryTimes) {
  36.                         Thread.sleep(retryInterval);
  37.                     }
  38.                 }
  39.             } catch (Exception e) {
  40.                 retryTimes++;
  41.                 if (retryTimes < maxRetryTimes) {
  42.                     try {
  43.                         Thread.sleep(retryInterval);
  44.                     } catch (InterruptedException ie) {
  45.                         Thread.currentThread().interrupt();
  46.                         break;
  47.                     }
  48.                 }
  49.             }
  50.         }
  51.         
  52.         if (!locked) {
  53.             // 获取锁失败的处理
  54.             System.out.println("Failed to acquire lock after " + maxRetryTimes + " retries");
  55.         }
  56.     }
  57.    
  58.     private boolean releaseLock(String lockKey, String uniqueValue) {
  59.         try {
  60.             String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  61.                               "return redis.call('del', KEYS[1]) " +
  62.                               "else " +
  63.                               "return 0 " +
  64.                               "end";
  65.             Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  66.             return result == 1;
  67.         } catch (Exception e) {
  68.             // 释放锁失败的处理
  69.             System.err.println("Failed to release lock: " + e.getMessage());
  70.             return false;
  71.         }
  72.     }
  73.    
  74.     private void businessLogic() {
  75.         // 业务逻辑实现
  76.     }
  77. }
复制代码

5. 监控和告警机制

实现分布式锁的监控和告警机制,及时发现和处理锁相关的问题:
  1. public class LockMonitorExample {
  2.     private final Jedis jedis;
  3.     private final ScheduledExecutorService scheduler = Executors.newScheduledThreadPool(2);
  4.     private final Map<String, Long> lockAcquisitionTimes = new ConcurrentHashMap<>();
  5.     private final long lockHoldTimeThreshold;
  6.    
  7.     public LockMonitorExample(Jedis jedis, long lockHoldTimeThreshold) {
  8.         this.jedis = jedis;
  9.         this.lockHoldTimeThreshold = lockHoldTimeThreshold;
  10.     }
  11.    
  12.     public void startMonitoring() {
  13.         // 定期检查锁的持有时间
  14.         scheduler.scheduleAtFixedRate(() -> {
  15.             long currentTime = System.currentTimeMillis();
  16.             lockAcquisitionTimes.forEach((lockKey, acquisitionTime) -> {
  17.                 long holdTime = currentTime - acquisitionTime;
  18.                 if (holdTime > lockHoldTimeThreshold) {
  19.                     // 锁持有时间超过阈值,发出告警
  20.                     System.out.println("Warning: Lock " + lockKey + " has been held for " + holdTime + "ms");
  21.                 }
  22.             });
  23.         }, 1, 1, TimeUnit.MINUTES);
  24.         
  25.         // 定期检查Redis中的锁
  26.         scheduler.scheduleAtFixedRate(() -> {
  27.             try {
  28.                 Set<String> keys = jedis.keys("*lock*");
  29.                 for (String key : keys) {
  30.                     String value = jedis.get(key);
  31.                     if (value != null && !lockAcquisitionTimes.containsKey(key)) {
  32.                         // 发现未记录的锁,可能是由于应用重启导致的
  33.                         System.out.println("Warning: Found untracked lock: " + key);
  34.                     }
  35.                 }
  36.             } catch (Exception e) {
  37.                 System.err.println("Failed to check locks in Redis: " + e.getMessage());
  38.             }
  39.         }, 5, 5, TimeUnit.MINUTES);
  40.     }
  41.    
  42.     public void recordLockAcquisition(String lockKey) {
  43.         lockAcquisitionTimes.put(lockKey, System.currentTimeMillis());
  44.     }
  45.    
  46.     public void recordLockRelease(String lockKey) {
  47.         lockAcquisitionTimes.remove(lockKey);
  48.     }
  49.    
  50.     public void stopMonitoring() {
  51.         scheduler.shutdown();
  52.         try {
  53.             if (!scheduler.awaitTermination(5, TimeUnit.SECONDS)) {
  54.                 scheduler.shutdownNow();
  55.             }
  56.         } catch (InterruptedException e) {
  57.             scheduler.shutdownNow();
  58.             Thread.currentThread().interrupt();
  59.         }
  60.     }
  61. }
复制代码

实际应用场景与案例分析

场景一:电商秒杀系统

在电商秒杀系统中,多个用户同时抢购有限数量的商品,需要使用分布式锁来控制库存的扣减,防止超卖。
  1. public class SecKillExample {
  2.     private final Jedis jedis;
  3.     private final String productKey = "product:1001:stock";
  4.    
  5.     public SecKillExample(Jedis jedis) {
  6.         this.jedis = jedis;
  7.     }
  8.    
  9.     public boolean secKill(String userId) {
  10.         String lockKey = "secKill:lock:product:1001";
  11.         String uniqueValue = UUID.randomUUID().toString();
  12.         long expireTime = 10000; // 10秒
  13.         
  14.         // 获取锁
  15.         boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", expireTime) != null;
  16.         
  17.         if (!locked) {
  18.             System.out.println("User " + userId + " failed to acquire lock");
  19.             return false;
  20.         }
  21.         
  22.         try {
  23.             // 检查库存
  24.             String stockStr = jedis.get(productKey);
  25.             int stock = stockStr == null ? 0 : Integer.parseInt(stockStr);
  26.             
  27.             if (stock <= 0) {
  28.                 System.out.println("User " + userId + " failed: out of stock");
  29.                 return false;
  30.             }
  31.             
  32.             // 扣减库存
  33.             jedis.decr(productKey);
  34.             
  35.             // 创建订单
  36.             createOrder(userId);
  37.             
  38.             System.out.println("User " + userId + " successfully purchased");
  39.             return true;
  40.             
  41.         } finally {
  42.             // 释放锁
  43.             releaseLock(lockKey, uniqueValue);
  44.         }
  45.     }
  46.    
  47.     private boolean releaseLock(String lockKey, String uniqueValue) {
  48.         String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  49.                           "return redis.call('del', KEYS[1]) " +
  50.                           "else " +
  51.                           "return 0 " +
  52.                           "end";
  53.         Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  54.         return result == 1;
  55.     }
  56.    
  57.     private void createOrder(String userId) {
  58.         // 创建订单的逻辑
  59.         System.out.println("Creating order for user " + userId);
  60.     }
  61. }
复制代码

场景二:定时任务分布式执行

在分布式系统中,定时任务需要确保只有一个节点执行,避免重复执行。
  1. public class DistributedSchedulerExample {
  2.     private final Jedis jedis;
  3.     private final String taskId;
  4.     private final long lockExpireTime;
  5.    
  6.     public DistributedSchedulerExample(Jedis jedis, String taskId, long lockExpireTime) {
  7.         this.jedis = jedis;
  8.         this.taskId = taskId;
  9.         this.lockExpireTime = lockExpireTime;
  10.     }
  11.    
  12.     public void executeTask(Runnable task) {
  13.         String lockKey = "scheduler:lock:" + taskId;
  14.         String uniqueValue = UUID.randomUUID().toString();
  15.         
  16.         // 获取锁
  17.         boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", lockExpireTime) != null;
  18.         
  19.         if (!locked) {
  20.             System.out.println("Task " + taskId + " is already running on another node");
  21.             return;
  22.         }
  23.         
  24.         try {
  25.             System.out.println("Starting task " + taskId);
  26.             
  27.             // 执行任务
  28.             task.run();
  29.             
  30.             System.out.println("Completed task " + taskId);
  31.             
  32.         } finally {
  33.             // 释放锁
  34.             releaseLock(lockKey, uniqueValue);
  35.         }
  36.     }
  37.    
  38.     private boolean releaseLock(String lockKey, String uniqueValue) {
  39.         String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  40.                           "return redis.call('del', KEYS[1]) " +
  41.                           "else " +
  42.                           "return 0 " +
  43.                           "end";
  44.         Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  45.         return result == 1;
  46.     }
  47. }
复制代码

场景三:分布式事务中的数据一致性

在分布式事务中,需要使用分布式锁来确保多个操作之间的数据一致性。
  1. public class DistributedTransactionExample {
  2.     private final Jedis jedis;
  3.     private final DataSource dataSource1;
  4.     private final DataSource dataSource2;
  5.    
  6.     public DistributedTransactionExample(Jedis jedis, DataSource dataSource1, DataSource dataSource2) {
  7.         this.jedis = jedis;
  8.         this.dataSource1 = dataSource1;
  9.         this.dataSource2 = dataSource2;
  10.     }
  11.    
  12.     public boolean executeTransaction(String accountId, BigDecimal amount) {
  13.         String lockKey = "transaction:lock:" + accountId;
  14.         String uniqueValue = UUID.randomUUID().toString();
  15.         long expireTime = 30000; // 30秒
  16.         
  17.         // 获取锁
  18.         boolean locked = jedis.set(lockKey, uniqueValue, "NX", "PX", expireTime) != null;
  19.         
  20.         if (!locked) {
  21.             System.out.println("Failed to acquire lock for account " + accountId);
  22.             return false;
  23.         }
  24.         
  25.         Connection conn1 = null;
  26.         Connection conn2 = null;
  27.         
  28.         try {
  29.             // 获取数据库连接
  30.             conn1 = dataSource1.getConnection();
  31.             conn2 = dataSource2.getConnection();
  32.             
  33.             // 开始事务
  34.             conn1.setAutoCommit(false);
  35.             conn2.setAutoCommit(false);
  36.             
  37.             // 执行操作1
  38.             PreparedStatement stmt1 = conn1.prepareStatement("UPDATE accounts SET balance = balance - ? WHERE id = ?");
  39.             stmt1.setBigDecimal(1, amount);
  40.             stmt1.setString(2, accountId);
  41.             int result1 = stmt1.executeUpdate();
  42.             
  43.             // 执行操作2
  44.             PreparedStatement stmt2 = conn2.prepareStatement("UPDATE transaction_log SET amount = amount + ? WHERE account_id = ?");
  45.             stmt2.setBigDecimal(1, amount);
  46.             stmt2.setString(2, accountId);
  47.             int result2 = stmt2.executeUpdate();
  48.             
  49.             // 检查操作结果
  50.             if (result1 > 0 && result2 > 0) {
  51.                 // 提交事务
  52.                 conn1.commit();
  53.                 conn2.commit();
  54.                 System.out.println("Transaction completed successfully for account " + accountId);
  55.                 return true;
  56.             } else {
  57.                 // 回滚事务
  58.                 conn1.rollback();
  59.                 conn2.rollback();
  60.                 System.out.println("Transaction failed for account " + accountId);
  61.                 return false;
  62.             }
  63.             
  64.         } catch (SQLException e) {
  65.             // 发生异常,回滚事务
  66.             try {
  67.                 if (conn1 != null) conn1.rollback();
  68.                 if (conn2 != null) conn2.rollback();
  69.             } catch (SQLException ex) {
  70.                 System.err.println("Failed to rollback transaction: " + ex.getMessage());
  71.             }
  72.             System.err.println("Transaction error: " + e.getMessage());
  73.             return false;
  74.             
  75.         } finally {
  76.             // 释放资源
  77.             try {
  78.                 if (conn1 != null) conn1.close();
  79.                 if (conn2 != null) conn2.close();
  80.             } catch (SQLException e) {
  81.                 System.err.println("Failed to close connections: " + e.getMessage());
  82.             }
  83.             
  84.             // 释放锁
  85.             releaseLock(lockKey, uniqueValue);
  86.         }
  87.     }
  88.    
  89.     private boolean releaseLock(String lockKey, String uniqueValue) {
  90.         String luaScript = "if redis.call('get', KEYS[1]) == ARGV[1] then " +
  91.                           "return redis.call('del', KEYS[1]) " +
  92.                           "else " +
  93.                           "return 0 " +
  94.                           "end";
  95.         Long result = (Long) jedis.eval(luaScript, Collections.singletonList(lockKey), Collections.singletonList(uniqueValue));
  96.         return result == 1;
  97.     }
  98. }
复制代码

总结

Redis分布式锁是分布式系统中控制并发访问的重要工具,但正确实现和使用分布式锁并非易事。本文从Redis分布式锁的基本原理出发,详细剖析了锁释放机制,并揭示了常见的锁释放陷阱,包括误删其他客户端的锁、锁过期导致业务未完成、Redis单点故障、网络分区导致的脑裂问题以及GC暂停导致的锁过期等。

针对这些陷阱,本文提供了多种解决方案和最佳实践,包括使用Redisson实现可靠的分布式锁、实现锁续期机制、使用Redlock算法提高可靠性、实现锁的容错机制以及建立监控和告警机制等。通过实际应用场景的案例分析,展示了如何在不同场景下正确使用Redis分布式锁。

在实际应用中,选择合适的分布式锁实现方案需要综合考虑业务场景、性能要求、可靠性需求以及系统复杂度等因素。无论选择哪种方案,都需要确保锁的获取和释放是安全的,避免因锁问题导致数据不一致或系统故障。

通过深入理解Redis分布式锁的原理和陷阱,并采用适当的解决方案和最佳实践,我们可以更好地应对分布式系统中的锁管理挑战,构建更加可靠、高效的分布式系统。
「七転び八起き(ななころびやおき)」
回复

使用道具 举报

0

主题

1304

科技点

654

积分

候风辨气

积分
654
候风辨气 发表于 2025-9-27 14:39:58 | 显示全部楼层
感謝分享
温馨提示:看帖回帖是一种美德,您的每一次发帖、回帖都是对论坛最大的支持,谢谢! [这是默认签名,点我更换签名]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则