PostgreSQL与Redis协同工作实现数据持久化与高速缓存的完美结合

威震华夏关云长 · 发表于 2025-9-11 12:40:00

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

在现代应用架构中，数据存储和访问是系统设计的核心环节。PostgreSQL作为强大的关系型数据库，提供了可靠的数据持久化解决方案；而Redis作为高性能的内存数据存储，则提供了卓越的缓存能力。将两者协同工作，可以实现数据持久化与高速缓存的完美结合，为应用提供高性能、高可靠性的数据服务。本文将详细介绍PostgreSQL与Redis协同工作的原理、实现方式以及最佳实践。

1. PostgreSQL与Redis各自的优势与局限性

1.1 PostgreSQL的优势与局限性

优势：

• 数据完整性：PostgreSQL提供ACID（原子性、一致性、隔离性、持久性）事务支持，确保数据的完整性和一致性。
• 复杂查询支持：支持复杂的SQL查询、窗口函数、公共表表达式（CTE）等高级功能。
• 扩展性：支持丰富的数据类型、索引类型和扩展功能，如PostGIS用于地理空间数据。
• 并发控制：采用多版本并发控制（MVCC）机制，提供高并发访问能力。
• 标准化：完全符合SQL标准，便于移植和集成。

局限性：

• 性能瓶颈：对于高频率的简单查询，磁盘I/O可能成为性能瓶颈。
• 水平扩展复杂：相比NoSQL数据库，PostgreSQL的水平扩展相对复杂。
• 资源消耗：作为功能完备的关系型数据库，PostgreSQL对系统资源的要求较高。

1.2 Redis的优势与局限性

优势：

• 极高的性能：由于数据主要存储在内存中，Redis能够提供极高的读写速度，通常可以达到每秒数十万次的操作。
• 丰富的数据结构：支持多种数据结构，适用于不同的应用场景。
• 持久化选项：提供RDB（快照）和AOF（追加日志）两种持久化方式，可以在性能和数据安全之间取得平衡。
• 原子操作：所有操作都是原子性的，确保数据一致性。
• 功能丰富：支持发布/订阅、事务、Lua脚本等高级功能。

局限性：

• 内存限制：由于数据主要存储在内存中，受限于可用内存大小，不适合存储大量数据。
• 数据结构复杂性：对于复杂的关系型数据操作，不如关系型数据库方便。
• 持久化可靠性：虽然提供持久化选项，但与专门的关系型数据库相比，数据安全性仍有差距。

2. 协同工作的架构设计

PostgreSQL与Redis协同工作的基本架构设计通常采用”缓存-数据库”模式，其中Redis作为缓存层，PostgreSQL作为持久化存储层。以下是几种常见的架构设计：

2.1 基本缓存模式

这是最简单的架构模式，应用首先查询Redis缓存，如果缓存中不存在所需数据，则查询PostgreSQL数据库，并将结果存入Redis缓存以备后续使用。

应用程序
|
v
Redis缓存层 ---- 未命中 ----> PostgreSQL数据库层
^ |
| |
+-------- 返回数据 ------+

复制代码

2.2 读写分离模式

在这种模式中，写操作直接作用于PostgreSQL，并同时更新或使Redis中的缓存失效；读操作则优先从Redis获取数据，只有在缓存未命中时才查询PostgreSQL。

写操作：应用程序 -> PostgreSQL -> 更新/失效Redis缓存
读操作：应用程序 -> Redis缓存 -> (未命中) -> PostgreSQL -> 更新Redis缓存

复制代码

2.3 多级缓存模式

对于大型应用，可以采用多级缓存架构，结合本地缓存（如应用内存中的缓存）和Redis分布式缓存，进一步减轻数据库压力。

应用程序
|
v
本地缓存 ---- 未命中 ----> Redis缓存 ---- 未命中 ----> PostgreSQL数据库
^ |
| |
+---------------- 返回数据 ---------------+

复制代码

2.4 发布/订阅模式

利用Redis的发布/订阅功能，可以在数据变更时通知相关应用更新缓存，实现缓存的一致性。

PostgreSQL -> 触发器/应用逻辑 -> Redis发布消息
|
v
应用程序订阅Redis频道 -> 接收消息 -> 更新本地缓存

复制代码

3. 实现数据持久化与高速缓存的具体方案

3.1 缓存策略选择

这是最常用的缓存策略，应用程序代码直接维护缓存和数据库：

• 读操作：首先从Redis缓存中读取数据如果缓存命中，则直接返回数据如果缓存未命中，则从PostgreSQL读取数据将从PostgreSQL读取的数据写入Redis缓存返回数据
• 首先从Redis缓存中读取数据
• 如果缓存命中，则直接返回数据
• 如果缓存未命中，则从PostgreSQL读取数据
• 将从PostgreSQL读取的数据写入Redis缓存
• 返回数据
• 写操作：首先更新PostgreSQL中的数据然后删除或更新Redis中的缓存
• 首先更新PostgreSQL中的数据
• 然后删除或更新Redis中的缓存

读操作：

1. 首先从Redis缓存中读取数据
2. 如果缓存命中，则直接返回数据
3. 如果缓存未命中，则从PostgreSQL读取数据
4. 将从PostgreSQL读取的数据写入Redis缓存
5. 返回数据

写操作：

1. 首先更新PostgreSQL中的数据
2. 然后删除或更新Redis中的缓存

在这种策略中，应用程序只与缓存交互，缓存负责在未命中时从数据库加载数据：

• 读操作：应用程序从Redis请求数据如果缓存命中，则直接返回数据如果缓存未命中，Redis自动从PostgreSQL加载数据Redis将数据存储在缓存中并返回给应用程序
• 应用程序从Redis请求数据
• 如果缓存命中，则直接返回数据
• 如果缓存未命中，Redis自动从PostgreSQL加载数据
• Redis将数据存储在缓存中并返回给应用程序
• 写操作：应用程序更新Redis中的数据Redis自动将更新同步到PostgreSQL
• 应用程序更新Redis中的数据
• Redis自动将更新同步到PostgreSQL

读操作：

1. 应用程序从Redis请求数据
2. 如果缓存命中，则直接返回数据
3. 如果缓存未命中，Redis自动从PostgreSQL加载数据
4. Redis将数据存储在缓存中并返回给应用程序

写操作：

1. 应用程序更新Redis中的数据
2. Redis自动将更新同步到PostgreSQL

在这种策略中，写操作同时更新缓存和数据库：

• 写操作：应用程序更新Redis中的数据Redis同时更新PostgreSQL中的数据确保两者都更新成功后返回
• 应用程序更新Redis中的数据
• Redis同时更新PostgreSQL中的数据
• 确保两者都更新成功后返回
• 读操作：应用程序从Redis读取数据如果缓存命中，则直接返回如果缓存未命中，则从PostgreSQL加载数据到缓存并返回
• 应用程序从Redis读取数据
• 如果缓存命中，则直接返回
• 如果缓存未命中，则从PostgreSQL加载数据到缓存并返回

写操作：

1. 应用程序更新Redis中的数据
2. Redis同时更新PostgreSQL中的数据
3. 确保两者都更新成功后返回

读操作：

1. 应用程序从Redis读取数据
2. 如果缓存命中，则直接返回
3. 如果缓存未命中，则从PostgreSQL加载数据到缓存并返回

在这种策略中，写操作首先更新缓存，然后异步更新数据库：

• 写操作：应用程序更新Redis中的数据Redis立即确认写操作Redis在后台异步将更新写入PostgreSQL
• 应用程序更新Redis中的数据
• Redis立即确认写操作
• Redis在后台异步将更新写入PostgreSQL
• 读操作：应用程序从Redis读取数据如果缓存命中，则直接返回如果缓存未命中，则从PostgreSQL加载数据到缓存并返回
• 应用程序从Redis读取数据
• 如果缓存命中，则直接返回
• 如果缓存未命中，则从PostgreSQL加载数据到缓存并返回

写操作：

1. 应用程序更新Redis中的数据
2. Redis立即确认写操作
3. Redis在后台异步将更新写入PostgreSQL

读操作：

1. 应用程序从Redis读取数据
2. 如果缓存命中，则直接返回
3. 如果缓存未命中，则从PostgreSQL加载数据到缓存并返回

3.2 缓存更新策略

设置缓存的过期时间（TTL），定期自动刷新缓存。适用于数据更新不频繁的场景。

在数据变更时，主动更新或使缓存失效。可以通过以下方式实现：

• 应用层逻辑：在更新PostgreSQL后，同时更新Redis缓存
• 数据库触发器：在PostgreSQL中设置触发器，在数据变更时通知Redis更新缓存
• 变更数据捕获（CDC）：监听PostgreSQL的WAL（Write-Ahead Logging）日志，捕获数据变更并更新Redis缓存

3.3 数据一致性方案

通过事务或两阶段提交等机制，确保缓存和数据库的数据完全一致。这通常会影响性能，适用于对一致性要求极高的场景。

允许缓存和数据库在短时间内存在不一致，但通过一定的机制保证最终达到一致。这是分布式系统中常用的一致性模型，能够在性能和一致性之间取得平衡。

实现最终一致性的常见方法：

• 设置合理的缓存过期时间
• 采用异步更新机制
• 实现版本控制或时间戳比对
• 使用消息队列确保变更的顺序处理

4. 代码示例：如何实现PostgreSQL与Redis的集成

4.1 环境准备

首先，确保已安装PostgreSQL和Redis，并安装必要的Python库：

pip install psycopg2-binary redis

复制代码

4.2 基本连接设置

import psycopg2
import redis
import json
from datetime import timedelta
# PostgreSQL连接设置
pg_conn = psycopg2.connect(
host="localhost",
database="mydatabase",
user="myuser",
password="mypassword"
)
pg_cursor = pg_conn.cursor()
# Redis连接设置
redis_client = redis.Redis(
host='localhost',
port=6379,
db=0,
decode_responses=True # 自动解码返回的字节为字符串
)

复制代码

4.3 Cache-Aside模式实现

def get_user_with_cache(user_id):
# 首先尝试从Redis缓存获取用户数据
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user:
print("数据从Redis缓存获取")
return json.loads(cached_user)
# 如果缓存未命中，从PostgreSQL获取数据
print("数据从PostgreSQL获取")
pg_cursor.execute("SELECT id, name, email FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
# 将数据转换为字典
user = {
'id': user_data[0],
'name': user_data[1],
'email': user_data[2]
}
# 将数据存入Redis缓存，设置过期时间为1小时
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return user
return None
def update_user(user_id, name, email):
# 更新PostgreSQL中的数据
pg_cursor.execute(
"UPDATE users SET name = %s, email = %s WHERE id = %s",
(name, email, user_id)
)
pg_conn.commit()
# 使Redis中的缓存失效
cache_key = f"user:{user_id}"
redis_client.delete(cache_key)
return True

复制代码

4.4 批量操作优化

def get_multiple_users_with_cache(user_ids):
# 构建所有用户的缓存键
cache_keys = [f"user:{user_id}" for user_id in user_ids]
# 尝试从Redis批量获取用户数据
cached_users = redis_client.mget(cache_keys)
# 确定哪些用户在缓存中未命中
result = {}
missing_user_ids = []
for i, cached_user in enumerate(cached_users):
user_id = user_ids[i]
if cached_user:
result[user_id] = json.loads(cached_user)
else:
missing_user_ids.append(user_id)
# 如果有未命中的用户，从PostgreSQL批量获取
if missing_user_ids:
print(f"以下用户ID未在缓存中找到: {missing_user_ids}")
# 构建IN查询语句
placeholders = ', '.join(['%s'] * len(missing_user_ids))
query = f"SELECT id, name, email FROM users WHERE id IN ({placeholders})"
pg_cursor.execute(query, missing_user_ids)
db_users = pg_cursor.fetchall()
# 处理从数据库获取的用户数据
for user_data in db_users:
user_id = user_data[0]
user = {
'id': user_data[0],
'name': user_data[1],
'email': user_data[2]
}
# 添加到结果
result[user_id] = user
# 更新Redis缓存
cache_key = f"user:{user_id}"
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return result

复制代码

4.5 使用Redis管道提高性能

def update_multiple_users_cache(user_ids):
# 创建Redis管道
pipe = redis_client.pipeline()
# 批量获取用户数据
placeholders = ', '.join(['%s'] * len(user_ids))
query = f"SELECT id, name, email FROM users WHERE id IN ({placeholders})"
pg_cursor.execute(query, user_ids)
db_users = pg_cursor.fetchall()
# 使用管道批量更新Redis缓存
for user_data in db_users:
user_id = user_data[0]
user = {
'id': user_data[0],
'name': user_data[1],
'email': user_data[2]
}
cache_key = f"user:{user_id}"
pipe.setex(cache_key, timedelta(hours=1), json.dumps(user))
# 执行管道中的所有命令
pipe.execute()
return len(db_users)

复制代码

4.6 使用Redis事务确保数据一致性

def transfer_user_data(source_user_id, target_user_id, data_field):
# 使用Redis事务确保操作的原子性
with redis_client.pipeline() as pipe:
while True:
try:
# 监视源用户和目标用户的缓存键
source_key = f"user:{source_user_id}"
target_key = f"user:{target_user_id}"
pipe.watch(source_key, target_key)
# 获取源用户数据
source_user_data = pipe.get(source_key)
if not source_user_data:
pipe.unwatch()
return False, "源用户数据不存在"
source_user = json.loads(source_user_data)
if data_field not in source_user:
pipe.unwatch()
return False, "指定的数据字段不存在"
# 获取目标用户数据
target_user_data = pipe.get(target_key)
target_user = json.loads(target_user_data) if target_user_data else {}
# 开始事务
pipe.multi()
# 更新源用户和目标用户数据
field_value = source_user.pop(data_field)
target_user[data_field] = field_value
# 更新Redis缓存
pipe.set(source_key, json.dumps(source_user))
pipe.set(target_key, json.dumps(target_user))
# 执行事务
pipe.execute()
# 更新PostgreSQL数据库
pg_cursor.execute(
"UPDATE users SET %s = NULL WHERE id = %s",
(data_field, source_user_id)
)
pg_cursor.execute(
"UPDATE users SET %s = %s WHERE id = %s",
(data_field, field_value, target_user_id)
)
pg_conn.commit()
return True, "数据转移成功"
except redis.WatchError:
# 如果在监视期间键被修改，重试操作
continue

复制代码

4.7 使用PostgreSQL触发器自动更新Redis缓存

首先，在PostgreSQL中创建一个触发器函数：

CREATE OR REPLACE FUNCTION notify_user_change()
RETURNS TRIGGER AS $$
DECLARE
payload TEXT;
BEGIN
-- 构建包含变更数据的JSON负载
payload = json_build_object(
'table', TG_TABLE_NAME,
'operation', TG_OP,
'old_data', CASE WHEN TG_OP IN ('UPDATE', 'DELETE') THEN row_to_json(OLD) ELSE NULL END,
'new_data', CASE WHEN TG_OP IN ('INSERT', 'UPDATE') THEN row_to_json(NEW) ELSE NULL END
)::text;
-- 发送通知到Redis频道
-- 注意：这里需要使用pg_redis扩展或其他方式实现PostgreSQL到Redis的通信
-- 以下是一个示例，实际实现可能有所不同
PERFORM pg_redis.publish('user_changes', payload);
-- 对于INSERT和UPDATE操作，返回NEW行
-- 对于DELETE操作，返回OLD行
RETURN CASE WHEN TG_OP IN ('INSERT', 'UPDATE') THEN NEW ELSE OLD END;
END;
$$ LANGUAGE plpgsql;

复制代码

然后，在users表上创建触发器：

CREATE TRIGGER user_change_trigger
AFTER INSERT OR UPDATE OR DELETE ON users
FOR EACH ROW EXECUTE FUNCTION notify_user_change();

复制代码

在Python应用中，订阅Redis频道并处理变更通知：

import threading
def listen_for_user_changes():
pubsub = redis_client.pubsub()
pubsub.subscribe('user_changes')
for message in pubsub.listen():
if message['type'] == 'message':
try:
data = json.loads(message['data'])
table = data.get('table')
operation = data.get('operation')
if table == 'users':
if operation == 'UPDATE':
new_data = data.get('new_data')
if new_data:
user_id = new_data.get('id')
cache_key = f"user:{user_id}"
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(new_data))
print(f"更新用户 {user_id} 的缓存")
elif operation == 'DELETE':
old_data = data.get('old_data')
if old_data:
user_id = old_data.get('id')
cache_key = f"user:{user_id}"
redis_client.delete(cache_key)
print(f"删除用户 {user_id} 的缓存")
elif operation == 'INSERT':
new_data = data.get('new_data')
if new_data:
user_id = new_data.get('id')
cache_key = f"user:{user_id}"
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(new_data))
print(f"添加用户 {user_id} 的缓存")
except Exception as e:
print(f"处理变更通知时出错: {e}")
# 启动监听线程
listener_thread = threading.Thread(target=listen_for_user_changes)
listener_thread.daemon = True
listener_thread.start()

复制代码

5. 实际应用场景与案例分析

5.1 电子商务平台

在电子商务平台中，商品信息、用户数据、订单记录等需要频繁访问。使用PostgreSQL存储所有数据，同时使用Redis缓存热点数据，可以显著提高系统性能。

案例：商品详情页优化

商品详情页是电商平台的高频访问页面，包含商品基本信息、价格、库存、评价等数据。这些数据存储在PostgreSQL中，但通过Redis缓存可以大幅提升访问速度。

def get_product_details(product_id):
cache_key = f"product:{product_id}"
cached_product = redis_client.get(cache_key)
if cached_product:
print("从Redis缓存获取商品详情")
return json.loads(cached_product)
print("从PostgreSQL获取商品详情")
# 查询商品基本信息
pg_cursor.execute("""
SELECT p.id, p.name, p.description, p.price, p.category_id,
c.name as category_name, p.stock_quantity
FROM products p
LEFT JOIN categories c ON p.category_id = c.id
WHERE p.id = %s
""", (product_id,))
product_data = pg_cursor.fetchone()
if not product_data:
return None
# 构建商品详情字典
product = {
'id': product_data[0],
'name': product_data[1],
'description': product_data[2],
'price': float(product_data[3]),
'category_id': product_data[4],
'category_name': product_data[5],
'stock_quantity': product_data[6]
}
# 查询商品评价统计
pg_cursor.execute("""
SELECT
COUNT(*) as total_reviews,
AVG(rating) as average_rating
FROM reviews
WHERE product_id = %s
""", (product_id,))
review_stats = pg_cursor.fetchone()
product['total_reviews'] = review_stats[0]
product['average_rating'] = float(review_stats[1]) if review_stats[1] else 0
# 将商品详情存入Redis缓存，设置过期时间为30分钟
redis_client.setex(cache_key, timedelta(minutes=30), json.dumps(product))
return product
def update_product_stock(product_id, quantity_change):
# 更新PostgreSQL中的库存
pg_cursor.execute("""
UPDATE products
SET stock_quantity = stock_quantity + %s
WHERE id = %s
RETURNING stock_quantity
""", (quantity_change, product_id))
new_stock = pg_cursor.fetchone()[0]
pg_conn.commit()
# 更新Redis缓存中的库存信息
cache_key = f"product:{product_id}"
cached_product = redis_client.get(cache_key)
if cached_product:
product = json.loads(cached_product)
product['stock_quantity'] = new_stock
redis_client.setex(cache_key, timedelta(minutes=30), json.dumps(product))
return new_stock

复制代码

5.2 社交媒体应用

社交媒体应用需要处理大量的用户动态、关注关系、点赞等数据。PostgreSQL适合存储用户资料、帖子内容等结构化数据，而Redis适合存储社交关系、实时计数等需要快速访问的数据。

案例：用户动态流优化

def get_user_timeline(user_id, page=1, page_size=20):
# 首先检查用户动态是否在缓存中
cache_key = f"timeline:{user_id}"
cached_timeline = redis_client.get(cache_key)
if cached_timeline:
print("从Redis缓存获取用户动态")
timeline = json.loads(cached_timeline)
# 实现分页
start = (page - 1) * page_size
end = start + page_size
return timeline[start:end]
print("从PostgreSQL获取用户动态")
# 查询用户关注的人
pg_cursor.execute("""
SELECT followed_id FROM follows
WHERE follower_id = %s
""", (user_id,))
followed_ids = [row[0] for row in pg_cursor.fetchall()]
if not followed_ids:
return []
# 查询这些用户的最新动态
placeholders = ', '.join(['%s'] * len(followed_ids))
query = f"""
SELECT p.id, p.user_id, u.username, p.content, p.created_at,
(SELECT COUNT(*) FROM likes WHERE post_id = p.id) as likes_count,
(SELECT COUNT(*) FROM comments WHERE post_id = p.id) as comments_count
FROM posts p
JOIN users u ON p.user_id = u.id
WHERE p.user_id IN ({placeholders})
ORDER BY p.created_at DESC
LIMIT 100
"""
pg_cursor.execute(query, followed_ids)
posts_data = pg_cursor.fetchall()
# 构建动态列表
timeline = []
for post_data in posts_data:
post = {
'id': post_data[0],
'user_id': post_data[1],
'username': post_data[2],
'content': post_data[3],
'created_at': post_data[4].isoformat(),
'likes_count': post_data[5],
'comments_count': post_data[6]
}
timeline.append(post)
# 将动态存入Redis缓存，设置过期时间为5分钟
redis_client.setex(cache_key, timedelta(minutes=5), json.dumps(timeline))
# 实现分页
start = (page - 1) * page_size
end = start + page_size
return timeline[start:end]
def add_post(user_id, content):
# 向PostgreSQL插入新动态
pg_cursor.execute("""
INSERT INTO posts (user_id, content, created_at)
VALUES (%s, %s, NOW())
RETURNING id
""", (user_id, content))
post_id = pg_cursor.fetchone()[0]
pg_conn.commit()
# 获取用户的粉丝
pg_cursor.execute("""
SELECT follower_id FROM follows
WHERE followed_id = %s
""", (user_id,))
follower_ids = [row[0] for row in pg_cursor.fetchall()]
# 使所有粉丝的动态缓存失效
pipe = redis_client.pipeline()
for follower_id in follower_ids:
cache_key = f"timeline:{follower_id}"
pipe.delete(cache_key)
pipe.execute()
return post_id

复制代码

5.3 内容管理系统

内容管理系统需要处理大量的文章、页面、媒体文件等。PostgreSQL适合存储内容结构、元数据等，而Redis适合存储全文搜索索引、热门内容排行等。

案例：热门文章排行

def get_popular_articles(days=7, limit=10):
cache_key = f"popular_articles:{days}:{limit}"
cached_articles = redis_client.get(cache_key)
if cached_articles:
print("从Redis缓存获取热门文章")
return json.loads(cached_articles)
print("从PostgreSQL获取热门文章")
# 查询指定天数内的热门文章（按浏览量排序）
pg_cursor.execute("""
SELECT a.id, a.title, a.slug, a.summary, a.published_at,
COUNT(v.id) as view_count
FROM articles a
LEFT JOIN article_views v ON a.id = v.article_id
WHERE a.published = TRUE
AND a.published_at >= NOW() - INTERVAL '%s days'
AND (v.viewed_at >= NOW() - INTERVAL '%s days' OR v.id IS NULL)
GROUP BY a.id
ORDER BY view_count DESC, a.published_at DESC
LIMIT %s
""", (days, days, limit))
articles_data = pg_cursor.fetchall()
# 构建文章列表
articles = []
for article_data in articles_data:
article = {
'id': article_data[0],
'title': article_data[1],
'slug': article_data[2],
'summary': article_data[3],
'published_at': article_data[4].isoformat(),
'view_count': article_data[5]
}
articles.append(article)
# 将热门文章存入Redis缓存，设置过期时间为1小时
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(articles))
return articles
def record_article_view(article_id, user_id=None, ip_address=None):
# 记录文章浏览到PostgreSQL
pg_cursor.execute("""
INSERT INTO article_views (article_id, user_id, ip_address, viewed_at)
VALUES (%s, %s, %s, NOW())
""", (article_id, user_id, ip_address))
pg_conn.commit()
# 使用Redis的有序集合记录文章浏览量
today = datetime.now().strftime('%Y-%m-%d')
redis_client.zincrby(f"daily_views:{today}", 1, article_id)
# 使热门文章缓存失效
pipe = redis_client.pipeline()
for days in [1, 7, 30]:
for limit in [5, 10, 20]:
cache_key = f"popular_articles:{days}:{limit}"
pipe.delete(cache_key)
pipe.execute()
return True

复制代码

6. 性能优化与最佳实践

6.1 缓存策略优化

缓存粒度是指缓存中存储的数据单元大小。选择合适的缓存粒度对性能至关重要：

• 粗粒度缓存：缓存较大的数据对象或整个数据集。优点是减少缓存访问次数，缺点是可能导致不必要的数据传输和内存浪费。
• 细粒度缓存：缓存较小的数据单元。优点是减少内存使用和提高缓存命中率，缺点是增加缓存访问次数。

示例：用户数据缓存粒度选择

# 粗粒度缓存：缓存整个用户对象
def get_user_coarse_grained(user_id):
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user:
return json.loads(cached_user)
# 从数据库获取完整用户数据
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
# 将完整用户数据存入缓存
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return user
return None
# 细粒度缓存：分别缓存用户的不同属性
def get_user_attribute(user_id, attribute):
cache_key = f"user:{user_id}:{attribute}"
cached_value = redis_client.get(cache_key)
if cached_value:
return json.loads(cached_value)
# 从数据库获取特定属性
pg_cursor.execute(f"SELECT {attribute} FROM users WHERE id = %s", (user_id,))
value = pg_cursor.fetchone()
if value:
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(value[0]))
return value[0]
return None

复制代码

实现多级缓存可以进一步优化性能，减少对后端数据库的访问：

# 本地内存缓存（使用Python的functools.lru_cache）
from functools import lru_cache
import time
@lru_cache(maxsize=1000)
def get_user_from_local_cache(user_id):
# 这个函数会自动缓存最近1000次调用的结果
# 实际实现中，这里会调用Redis缓存
return get_user_from_redis(user_id)
def get_user_from_redis(user_id):
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user:
return json.loads(cached_user)
# 从数据库获取用户数据
user = get_user_from_db(user_id)
if user:
# 将用户数据存入Redis缓存，设置过期时间
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return user
return None
def get_user_from_db(user_id):
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
return dict(zip([column[0] for column in pg_cursor.description], user_data))
return None
def get_user_with_multi_level_cache(user_id):
# 首先尝试从本地缓存获取
user = get_user_from_local_cache(user_id)
if user:
print("数据从本地缓存获取")
return user
# 如果本地缓存未命中，流程会自动通过get_user_from_redis尝试从Redis获取
# 如果Redis也未命中，流程会自动通过get_user_from_db从数据库获取
return user

复制代码

6.2 数据一致性策略

延迟双删是一种确保缓存一致性的策略，特别适用于写操作频繁的场景：

import time
def update_user_with_delayed_double_delete(user_id, update_data):
# 第一次删除缓存
cache_key = f"user:{user_id}"
redis_client.delete(cache_key)
# 更新数据库
set_clause = ", ".join([f"{key} = %s" for key in update_data.keys()])
values = list(update_data.values())
values.append(user_id)
pg_cursor.execute(f"""
UPDATE users
SET {set_clause}
WHERE id = %s
""", values)
pg_conn.commit()
# 延迟一段时间后再次删除缓存
# 这可以防止在数据库更新期间有其他请求将旧数据重新加载到缓存
def delayed_delete():
time.sleep(1) # 延迟1秒
redis_client.delete(cache_key)
# 启动一个线程执行延迟删除
import threading
thread = threading.Thread(target=delayed_delete)
thread.daemon = True
thread.start()
return True

复制代码

使用版本号或时间戳来确保缓存和数据库的一致性：

def get_user_with_version(user_id):
cache_key = f"user:{user_id}"
version_key = f"user_version:{user_id}"
# 获取缓存版本
cached_version = redis_client.get(version_key)
cached_user = redis_client.get(cache_key)
# 获取数据库版本
pg_cursor.execute("SELECT version FROM users WHERE id = %s", (user_id,))
db_version = pg_cursor.fetchone()
if not db_version:
return None
db_version = db_version[0]
# 如果缓存不存在或版本不匹配，从数据库获取数据
if not cached_user or cached_version != str(db_version):
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
# 更新缓存和版本
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
redis_client.setex(version_key, timedelta(hours=1), str(db_version))
return user
return json.loads(cached_user)
def update_user_with_version(user_id, update_data):
# 更新数据库（假设users表有一个version字段，每次更新会自动递增）
set_clause = ", ".join([f"{key} = %s" for key in update_data.keys()])
values = list(update_data.values())
values.append(user_id)
pg_cursor.execute(f"""
UPDATE users
SET {set_clause}, version = version + 1
WHERE id = %s
RETURNING version
""", values)
new_version = pg_cursor.fetchone()[0]
pg_conn.commit()
# 更新缓存版本
version_key = f"user_version:{user_id}"
redis_client.setex(version_key, timedelta(hours=1), str(new_version))
return True

复制代码

6.3 缓存预热策略

缓存预热是指在系统启动或低峰期预先加载热点数据到缓存中，减少用户请求时的缓存未命中率：

def preload_hot_products():
"""预热热门商品数据到缓存"""
# 获取热门商品ID列表
pg_cursor.execute("""
SELECT product_id FROM order_items
GROUP BY product_id
ORDER BY COUNT(*) DESC
LIMIT 100
""")
hot_product_ids = [row[0] for row in pg_cursor.fetchall()]
# 使用管道批量预热商品数据
pipe = redis_client.pipeline()
for product_id in hot_product_ids:
# 获取商品详情
product = get_product_details(product_id)
if product:
cache_key = f"product:{product_id}"
pipe.setex(cache_key, timedelta(hours=1), json.dumps(product))
# 执行管道中的所有命令
pipe.execute()
return len(hot_product_ids)
def schedule_cache_preload():
"""定时执行缓存预热"""
import schedule
import time
# 每天凌晨3点执行缓存预热
schedule.every().day.at("03:00").do(preload_hot_products)
while True:
schedule.run_pending()
time.sleep(60)

复制代码

6.4 缓存监控与调优

def get_cache_hit_rate():
"""获取缓存命中率"""
info = redis_client.info()
stats = info['stats']
keyspace_hits = stats.get('keyspace_hits', 0)
keyspace_misses = stats.get('keyspace_misses', 0)
total_requests = keyspace_hits + keyspace_misses
if total_requests == 0:
return 0
hit_rate = (keyspace_hits / total_requests) * 100
return hit_rate
def log_cache_performance():
"""记录缓存性能指标"""
hit_rate = get_cache_hit_rate()
used_memory = redis_client.info()['memory']['used_memory_human']
print(f"缓存命中率: {hit_rate:.2f}%")
print(f"已用内存: {used_memory}")
# 可以将指标记录到监控系统，如Prometheus、InfluxDB等
# record_metrics(hit_rate, used_memory)

复制代码

def analyze_cache_keys(pattern="*"):
"""分析缓存键的使用情况"""
keys = redis_client.keys(pattern)
key_analysis = {
'total_keys': len(keys),
'key_types': {},
'key_memory': {},
'key_ttl': {}
}
pipe = redis_client.pipeline()
for key in keys:
pipe.type(key)
pipe.memory_usage(key)
pipe.ttl(key)
results = pipe.execute()
for i, key in enumerate(keys):
key_type = results[i*3]
memory_usage = results[i*3+1]
ttl = results[i*3+2]
# 统计键类型
if key_type not in key_analysis['key_types']:
key_analysis['key_types'][key_type] = 0
key_analysis['key_types'][key_type] += 1
# 统计内存使用
if key_type not in key_analysis['key_memory']:
key_analysis['key_memory'][key_type] = 0
key_analysis['key_memory'][key_type] += memory_usage
# 统计TTL分布
ttl_category = "persistent" if ttl == -1 else ("no_expire" if ttl == -2 else "temporary")
if ttl_category not in key_analysis['key_ttl']:
key_analysis['key_ttl'][ttl_category] = 0
key_analysis['key_ttl'][ttl_category] += 1
return key_analysis

复制代码

7. 常见问题与解决方案

7.1 缓存穿透问题

缓存穿透是指查询不存在的数据，导致请求直接穿透到数据库。

def get_user_with_null_cache(user_id):
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user is not None:
if cached_user == "NULL":
return None
return json.loads(cached_user)
# 从数据库查询用户
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return user
else:
# 缓存空对象，设置较短的过期时间
redis_client.setex(cache_key, timedelta(minutes=5), "NULL")
return None

复制代码

from pybloom_live import ScalableBloomFilter
# 初始化布隆过滤器
user_exists_bloom = ScalableBloomFilter(initial_capacity=100000, error_rate=0.001)
def preload_user_ids_to_bloom():
"""预加载所有用户ID到布隆过滤器"""
pg_cursor.execute("SELECT id FROM users")
user_ids = [row[0] for row in pg_cursor.fetchall()]
for user_id in user_ids:
user_exists_bloom.add(user_id)
return len(user_ids)
def get_user_with_bloom_filter(user_id):
# 首先检查布隆过滤器
if user_id not in user_exists_bloom:
return None
# 如果布隆过滤器认为用户可能存在，继续正常流程
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user:
return json.loads(cached_user)
# 从数据库查询用户
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(user))
return user
# 如果数据库中也不存在，更新布隆过滤器
user_exists_bloom.add(user_id)
return None

复制代码

7.2 缓存击穿问题

缓存击穿是指某个热点key在失效的瞬间，大量并发请求直接穿透到数据库。

import time
import uuid
def get_product_with_lock(product_id):
cache_key = f"product:{product_id}"
lock_key = f"lock:{product_id}"
lock_value = str(uuid.uuid4())
# 尝试从缓存获取数据
cached_product = redis_client.get(cache_key)
if cached_product:
return json.loads(cached_product)
# 尝试获取分布式锁
lock_acquired = redis_client.set(lock_key, lock_value, nx=True, ex=10)
if lock_acquired:
try:
# 获取锁成功，从数据库加载数据
pg_cursor.execute("SELECT * FROM products WHERE id = %s", (product_id,))
product_data = pg_cursor.fetchone()
if product_data:
product = dict(zip([column[0] for column in pg_cursor.description], product_data))
redis_client.setex(cache_key, timedelta(hours=1), json.dumps(product))
return product
return None
finally:
# 确保释放锁
# 使用Lua脚本确保只有锁的持有者才能释放锁
lua_script = """
if redis.call("get", KEYS[1]) == ARGV[1] then
return redis.call("del", KEYS[1])
else
return 0
end
"""
redis_client.eval(lua_script, 1, lock_key, lock_value)
else:
# 获取锁失败，等待并重试
time.sleep(0.1)
return get_product_with_lock(product_id)

复制代码

7.3 缓存雪崩问题

缓存雪崩是指大量缓存在同一时间失效，导致大量请求直接访问数据库。

import random
def get_user_with_random_expiry(user_id):
cache_key = f"user:{user_id}"
cached_user = redis_client.get(cache_key)
if cached_user:
return json.loads(cached_user)
# 从数据库查询用户
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
# 使用随机过期时间，基础时间为1小时，随机增加0-30分钟
base_expiry = timedelta(hours=1)
random_extra = timedelta(minutes=random.randint(0, 30))
redis_client.setex(cache_key, base_expiry + random_extra, json.dumps(user))
return user
return None

复制代码

from redis.sentinel import Sentinel
# 配置Redis Sentinel
sentinel = Sentinel([
('redis-sentinel-1', 26379),
('redis-sentinel-2', 26379),
('redis-sentinel-3', 26379)
], socket_timeout=0.1)
# 获取主从连接
master = sentinel.master_for('mymaster', socket_timeout=0.1)
slave = sentinel.slave_for('mymaster', socket_timeout=0.1)
def get_user_with_ha(user_id):
cache_key = f"user:{user_id}"
# 首先尝试从从节点读取
try:
cached_user = slave.get(cache_key)
if cached_user:
return json.loads(cached_user)
except:
# 从节点不可用，尝试主节点
pass
# 尝试从主节点读取
try:
cached_user = master.get(cache_key)
if cached_user:
return json.loads(cached_user)
except:
# 主节点也不可用，直接查询数据库
pass
# 从数据库查询用户
pg_cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
user_data = pg_cursor.fetchone()
if user_data:
user = dict(zip([column[0] for column in pg_cursor.description], user_data))
# 尝试更新缓存
try:
master.setex(cache_key, timedelta(hours=1), json.dumps(user))
except:
pass # 缓存更新失败，但不影响主流程
return user
return None

复制代码

7.4 数据一致性问题

在分布式系统中，确保缓存和数据库之间的数据一致性是一个挑战。

import json
import threading
import queue
# 创建消息队列
cache_update_queue = queue.Queue()
def cache_update_worker():
"""缓存更新工作线程"""
while True:
try:
# 从队列获取更新任务
update_task = cache_update_queue.get()
if update_task is None: # 终止信号
break
operation = update_task.get('operation')
key = update_task.get('key')
value = update_task.get('value')
expiry = update_task.get('expiry')
if operation == 'set':
redis_client.setex(key, expiry, json.dumps(value))
elif operation == 'delete':
redis_client.delete(key)
cache_update_queue.task_done()
except Exception as e:
print(f"缓存更新出错: {e}")
# 启动工作线程
worker_thread = threading.Thread(target=cache_update_worker)
worker_thread.daemon = True
worker_thread.start()
def update_user_with_mq(user_id, update_data):
"""使用消息队列确保最终一致性"""
# 首先更新数据库
set_clause = ", ".join([f"{key} = %s" for key in update_data.keys()])
values = list(update_data.values())
values.append(user_id)
pg_cursor.execute(f"""
UPDATE users
SET {set_clause}
WHERE id = %s
""", values)
pg_conn.commit()
# 将缓存更新任务放入队列
cache_key = f"user:{user_id}"
update_task = {
'operation': 'delete',
'key': cache_key
}
cache_update_queue.put(update_task)
return True

复制代码

8. 总结与展望

PostgreSQL与Redis的协同工作，为现代应用提供了数据持久化与高速缓存的完美结合。通过本文的介绍，我们了解了：

1. 基本概念：PostgreSQL作为关系型数据库提供了强大的数据持久化能力，而Redis作为内存数据存储提供了极高的访问速度。
2. 架构设计：通过多种架构模式（如基本缓存模式、读写分离模式、多级缓存模式等），可以根据应用需求选择合适的协同工作方式。
3. 实现方案：通过不同的缓存策略（如Cache-Aside、Read-Through、Write-Through、Write-Behind）和数据一致性方案（如强一致性、最终一致性），可以灵活地实现数据持久化与高速缓存的结合。
4. 代码示例：通过详细的代码示例，展示了如何在实际应用中实现PostgreSQL与Redis的集成，包括基本操作、批量操作、事务处理等。
5. 应用场景：通过电子商务平台、社交媒体应用、内容管理系统等实际案例，展示了PostgreSQL与Redis协同工作的具体应用。
6. 性能优化：通过缓存策略优化、数据一致性策略、缓存预热策略、缓存监控与调优等最佳实践，可以进一步提升系统性能。
7. 问题解决：针对缓存穿透、缓存击穿、缓存雪崩、数据一致性等常见问题，提供了实用的解决方案。

基本概念：PostgreSQL作为关系型数据库提供了强大的数据持久化能力，而Redis作为内存数据存储提供了极高的访问速度。

架构设计：通过多种架构模式（如基本缓存模式、读写分离模式、多级缓存模式等），可以根据应用需求选择合适的协同工作方式。

实现方案：通过不同的缓存策略（如Cache-Aside、Read-Through、Write-Through、Write-Behind）和数据一致性方案（如强一致性、最终一致性），可以灵活地实现数据持久化与高速缓存的结合。

代码示例：通过详细的代码示例，展示了如何在实际应用中实现PostgreSQL与Redis的集成，包括基本操作、批量操作、事务处理等。

应用场景：通过电子商务平台、社交媒体应用、内容管理系统等实际案例，展示了PostgreSQL与Redis协同工作的具体应用。

性能优化：通过缓存策略优化、数据一致性策略、缓存预热策略、缓存监控与调优等最佳实践，可以进一步提升系统性能。

问题解决：针对缓存穿透、缓存击穿、缓存雪崩、数据一致性等常见问题，提供了实用的解决方案。

未来，随着数据量的持续增长和应用场景的不断扩展，PostgreSQL与Redis的协同工作将面临新的挑战和机遇：

1. 云原生集成：随着云计算的普及，PostgreSQL与Redis在云环境中的集成将更加紧密，提供更好的弹性伸缩和自动化管理能力。
2. 智能化缓存：通过机器学习和人工智能技术，实现更智能的缓存策略，如预测热点数据、动态调整缓存策略等。
3. 多模数据库融合：PostgreSQL正在向多模数据库发展，支持JSON、地理空间、图等多种数据模型，与Redis的结合将更加灵活多样。
4. 边缘计算支持：随着边缘计算的兴起，PostgreSQL与Redis的协同工作将扩展到边缘节点，提供更低延迟的数据访问。
5. 更强的数据一致性保障：通过分布式事务、新型一致性协议等技术，提供更强的一致性保障，同时保持高性能。

云原生集成：随着云计算的普及，PostgreSQL与Redis在云环境中的集成将更加紧密，提供更好的弹性伸缩和自动化管理能力。

智能化缓存：通过机器学习和人工智能技术，实现更智能的缓存策略，如预测热点数据、动态调整缓存策略等。

多模数据库融合：PostgreSQL正在向多模数据库发展，支持JSON、地理空间、图等多种数据模型，与Redis的结合将更加灵活多样。

边缘计算支持：随着边缘计算的兴起，PostgreSQL与Redis的协同工作将扩展到边缘节点，提供更低延迟的数据访问。

更强的数据一致性保障：通过分布式事务、新型一致性协议等技术，提供更强的一致性保障，同时保持高性能。

总之，PostgreSQL与Redis的协同工作，为现代应用提供了强大的数据管理能力。通过合理的设计和优化，可以实现数据持久化与高速缓存的完美结合，满足各种复杂应用场景的需求。

	通知：关于部分勋章领取条件及购买价格调整的通知	05-18 21:22
	通知：本站资源由网友上传分享，如有违规等问题请到版务模块进行投诉，资源失效请在帖子内回复要求补档，会尽快处理！	10-23 09:31

活动公告

PostgreSQL与Redis协同工作实现数据持久化与高速缓存的完美结合

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块

塔罗

立华奏

站长推荐 /1

友情链接

Tencent QQ