Python pandas数据可视化教程如何将数据分析结果输出为精美图片

威震华夏关云长 · 发表于 2025-9-8 13:20:00

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

引言

在数据分析领域，可视化是不可或缺的一环。通过图表，我们可以更直观地展示数据中的模式、趋势和关系。Python的pandas库作为数据分析的强大工具，提供了丰富的数据可视化功能。本教程将详细介绍如何使用pandas进行数据可视化，并将分析结果输出为精美图片，使你的数据分析报告更加专业和吸引人。

准备工作

在开始之前，我们需要确保安装了必要的Python库。除了pandas，我们还需要matplotlib和seaborn这两个常用的可视化库。

# 安装必要的库
!pip install pandas matplotlib seaborn
# 导入库
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
# 设置中文字体显示
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号

复制代码

Pandas内置的可视化功能

Pandas内置了基于matplotlib的可视化功能，可以直接对Series和DataFrame对象调用plot()方法进行绘图。

基本绘图方法

# 创建示例数据
np.random.seed(0)
df = pd.DataFrame({
'A': np.random.randn(100).cumsum(),
'B': np.random.randn(100).cumsum(),
'C': np.random.randn(100).cumsum()
}, index=pd.date_range('2020-01-01', periods=100))
# 使用pandas内置的plot方法
df.plot(figsize=(10, 6))
plt.title('随机累积和趋势图')
plt.xlabel('日期')
plt.ylabel('值')
plt.grid(True)
plt.show()

复制代码

这段代码创建了一个包含三列随机累积和的DataFrame，并使用plot()方法绘制了折线图。figsize参数用于设置图表大小，title、xlabel和ylabel分别设置图表标题和坐标轴标签，grid(True)添加网格线。

不同类型的图表

Pandas支持多种类型的图表，通过kind参数指定：

# 创建示例数据
df_sales = pd.DataFrame({
'产品': ['A', 'B', 'C', 'D', 'E'],
'销量': [120, 150, 180, 200, 90],
'利润': [30, 45, 60, 70, 25]
})
# 柱状图
df_sales.plot(x='产品', y='销量', kind='bar', figsize=(10, 6))
plt.title('产品销量柱状图')
plt.xlabel('产品')
plt.ylabel('销量')
plt.xticks(rotation=0) # 旋转x轴标签
plt.show()
# 饼图
df_sales.set_index('产品')['销量'].plot(kind='pie', figsize=(8, 8), autopct='%1.1f%%')
plt.title('产品销量占比')
plt.ylabel('') # 移除y轴标签
plt.show()
# 散点图
df_sales.plot(x='销量', y='利润', kind='scatter', figsize=(8, 6))
plt.title('销量与利润关系')
plt.xlabel('销量')
plt.ylabel('利润')
for i, txt in enumerate(df_sales['产品']):
plt.annotate(txt, (df_sales['销量'][i], df_sales['利润'][i]))
plt.grid(True)
plt.show()

复制代码

这段代码展示了三种不同类型的图表：柱状图、饼图和散点图。柱状图适合比较不同类别的数值，饼图适合展示占比关系，散点图适合展示两个变量之间的关系。

使用Seaborn增强可视化效果

Seaborn是基于matplotlib的高级可视化库，提供了更美观的默认样式和更丰富的图表类型。

Seaborn基础用法

# 设置Seaborn样式
sns.set_style("whitegrid")
sns.set_context("notebook", font_scale=1.2)
# 创建示例数据
tips = sns.load_dataset("tips")
# 使用Seaborn绘制散点图
plt.figure(figsize=(10, 6))
sns.scatterplot(x="total_bill", y="tip", hue="sex", size="size", data=tips)
plt.title('账单金额与小费关系')
plt.xlabel('账单金额')
plt.ylabel('小费')
plt.show()

复制代码

这段代码使用Seaborn的scatterplot函数绘制了一个散点图，通过hue参数按性别着色，通过size参数按聚会人数调整点的大小，展示了账单金额与小费之间的关系。

Seaborn高级图表

# 箱线图
plt.figure(figsize=(10, 6))
sns.boxplot(x="day", y="total_bill", hue="smoker", data=tips)
plt.title('不同日期和吸烟状态的账单金额分布')
plt.xlabel('星期')
plt.ylabel('账单金额')
plt.show()
# 热力图
# 计算相关系数矩阵
corr = tips.corr()
plt.figure(figsize=(8, 6))
sns.heatmap(corr, annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('变量相关性热力图')
plt.show()
# 成对关系图
sns.pairplot(tips, hue="sex")
plt.suptitle('变量成对关系图', y=1.02)
plt.show()

复制代码

这段代码展示了三种Seaborn的高级图表：箱线图、热力图和成对关系图。箱线图展示了数据的分布情况，热力图展示了变量间的相关性，成对关系图则同时展示了多个变量两两之间的关系。

美化图表

要让图表更加精美，我们需要对图表的各个方面进行调整，包括颜色、字体、标签等。

调整颜色和样式

# 创建示例数据
df_colors = pd.DataFrame({
'类别': ['A', 'B', 'C', 'D', 'E'],
'值': [23, 45, 56, 78, 32]
})
# 自定义颜色
colors = ['#FF6B6B', '#4ECDC4', '#FFD166', '#6A0572', '#1A535C']
# 绘制带有自定义颜色的柱状图
plt.figure(figsize=(10, 6))
bars = plt.bar(df_colors['类别'], df_colors['值'], color=colors)
# 添加数据标签
for bar in bars:
height = bar.get_height()
plt.text(bar.get_x() + bar.get_width()/2., height,
f'{height}',
ha='center', va='bottom')
# 设置标题和标签
plt.title('自定义颜色的柱状图', fontsize=16, fontweight='bold')
plt.xlabel('类别', fontsize=12)
plt.ylabel('值', fontsize=12)
# 设置刻度标签大小
plt.xticks(fontsize=10)
plt.yticks(fontsize=10)
# 移除边框
for spine in plt.gca().spines.values():
spine.set_visible(False)
# 添加水平网格线
plt.grid(axis='y', alpha=0.3)
plt.show()

复制代码

这段代码展示了如何自定义柱状图的颜色、添加数据标签、调整字体大小、移除边框和添加网格线等美化操作。

创建子图

# 创建示例数据
np.random.seed(0)
df_subplots = pd.DataFrame({
'A': np.random.randn(100),
'B': np.random.randn(100),
'C': np.random.randn(100),
'D': np.random.randn(100)
})
# 创建2x2的子图
fig, axes = plt.subplots(2, 2, figsize=(12, 10))
fig.suptitle('多子图示例', fontsize=16, fontweight='bold')
# 绘制第一个子图：直方图
df_subplots['A'].plot(kind='hist', ax=axes[0, 0], bins=20, color='skyblue')
axes[0, 0].set_title('A列直方图')
axes[0, 0].set_xlabel('值')
axes[0, 0].set_ylabel('频数')
# 绘制第二个子图：箱线图
df_subplots[['B', 'C']].plot(kind='box', ax=axes[0, 1])
axes[0, 1].set_title('B和C列箱线图')
axes[0, 1].set_xlabel('列')
axes[0, 1].set_ylabel('值')
# 绘制第三个子图：散点图
df_subplots.plot(kind='scatter', x='A', y='B', ax=axes[1, 0], color='coral')
axes[1, 0].set_title('A和B列散点图')
axes[1, 0].set_xlabel('A列值')
axes[1, 0].set_ylabel('B列值')
# 绘制第四个子图：折线图
df_subplots['D'].cumsum().plot(kind='line', ax=axes[1, 1], color='green')
axes[1, 1].set_title('D列累积和折线图')
axes[1, 1].set_xlabel('索引')
axes[1, 1].set_ylabel('累积值')
# 调整子图间距
plt.tight_layout()
plt.subplots_adjust(top=0.9)
plt.show()

复制代码

这段代码展示了如何创建包含四个子图的图表，每个子图展示不同类型的可视化效果，并通过tight_layout()和subplots_adjust()调整子图间距，使整体布局更加美观。

将可视化结果保存为图片

完成数据可视化后，我们需要将结果保存为图片，以便在报告、演示文稿或网页中使用。

基本保存方法

# 创建示例图表
plt.figure(figsize=(10, 6))
x = np.linspace(0, 10, 100)
y = np.sin(x)
plt.plot(x, y, 'b-', linewidth=2, label='sin(x)')
plt.fill_between(x, y, alpha=0.2)
plt.title('正弦函数图像', fontsize=16)
plt.xlabel('x', fontsize=12)
plt.ylabel('sin(x)', fontsize=12)
plt.legend(fontsize=12)
plt.grid(True, alpha=0.3)
# 保存图表为PNG格式
plt.savefig('sine_function.png', dpi=300, bbox_inches='tight')
# 保存图表为PDF格式
plt.savefig('sine_function.pdf', bbox_inches='tight')
# 保存图表为SVG格式
plt.savefig('sine_function.svg', bbox_inches='tight')
plt.show()

复制代码

这段代码展示了如何将图表保存为不同的格式，包括PNG、PDF和SVG。dpi参数设置图片的分辨率（每英寸点数），bbox_inches='tight'参数确保保存的图片包含所有标签和标题。

高级保存选项

# 创建示例图表
fig, ax = plt.subplots(figsize=(10, 6))
categories = ['A', 'B', 'C', 'D', 'E']
values = [23, 45, 56, 78, 32]
bars = ax.bar(categories, values, color=plt.cm.viridis(np.linspace(0, 1, len(categories))))
# 添加数据标签
for bar in bars:
height = bar.get_height()
ax.text(bar.get_x() + bar.get_width()/2., height,
f'{height}',
ha='center', va='bottom', fontsize=12)
# 设置标题和标签
ax.set_title('高级保存选项示例', fontsize=16, fontweight='bold', pad=20)
ax.set_xlabel('类别', fontsize=12, labelpad=10)
ax.set_ylabel('值', fontsize=12, labelpad=10)
# 设置刻度标签
ax.tick_params(axis='both', which='major', labelsize=10)
# 设置边框
for spine in ax.spines.values():
spine.set_visible(False)
# 添加水平网格线
ax.grid(axis='y', alpha=0.3)
# 添加水印
fig.text(0.95, 0.05, 'Confidential',
fontsize=40, color='gray',
ha='right', va='bottom', alpha=0.3, rotation=15)
# 设置透明背景
fig.patch.set_alpha(0)
# 保存图表为PNG，设置透明背景和高质量
plt.savefig('advanced_save.png',
dpi=300,
bbox_inches='tight',
transparent=True,
quality=95)
plt.show()

复制代码

这段代码展示了更高级的保存选项，包括设置透明背景、添加水印、调整图片质量等。transparent=True参数使背景透明，quality参数设置JPEG格式图片的质量（0-100）。

批量保存图表

# 创建示例数据
np.random.seed(0)
data = {
f'系列{i}': np.random.randn(50).cumsum() for i in range(1, 6)
}
df_batch = pd.DataFrame(data)
# 为每个系列创建并保存图表
for column in df_batch.columns:
plt.figure(figsize=(8, 5))
plt.plot(df_batch.index, df_batch[column], linewidth=2)
plt.title(f'{column}趋势图', fontsize=14, fontweight='bold')
plt.xlabel('索引', fontsize=12)
plt.ylabel('值', fontsize=12)
plt.grid(True, alpha=0.3)
# 保存图表
filename = f'trend_{column.lower()}.png'
plt.savefig(filename, dpi=300, bbox_inches='tight')
plt.close() # 关闭当前图表，避免内存泄漏
# 创建组合图表并保存
fig, axes = plt.subplots(2, 3, figsize=(15, 10))
fig.suptitle('所有系列趋势组合图', fontsize=16, fontweight='bold')
axes = axes.flatten() # 将2D数组转换为1D数组以便迭代
for i, column in enumerate(df_batch.columns):
if i < len(axes): # 确保不超出子图数量
axes[i].plot(df_batch.index, df_batch[column], linewidth=2)
axes[i].set_title(f'{column}趋势')
axes[i].set_xlabel('索引')
axes[i].set_ylabel('值')
axes[i].grid(True, alpha=0.3)
# 移除多余的子图
for i in range(len(df_batch.columns), len(axes)):
fig.delaxes(axes[i])
plt.tight_layout()
plt.subplots_adjust(top=0.9)
plt.savefig('combined_trends.png', dpi=300, bbox_inches='tight')
plt.close()
print("所有图表已保存完成")

复制代码

这段代码展示了如何批量创建和保存图表，包括为每个数据系列单独创建图表并保存，以及创建包含所有系列的组合图表。使用plt.close()可以关闭当前图表，避免内存泄漏。

实际案例：销售数据可视化

让我们通过一个实际的销售数据可视化案例，综合运用前面介绍的各种技巧。

# 创建示例销售数据
np.random.seed(42)
dates = pd.date_range('2022-01-01', '2022-12-31')
products = ['产品A', '产品B', '产品C', '产品D']
regions = ['华北', '华东', '华南', '西部']
# 生成随机销售数据
sales_data = []
for date in dates:
for product in products:
for region in regions:
# 基础销量加上季节性和随机波动
base_sales = np.random.randint(50, 200)
seasonal_factor = 1 + 0.3 * np.sin(2 * np.pi * date.dayofyear / 365)
random_factor = np.random.normal(1, 0.1)
sales = int(base_sales * seasonal_factor * random_factor)
sales_data.append({
'日期': date,
'产品': product,
'地区': region,
'销量': sales,
'收入': sales * np.random.randint(100, 300)
})
df_sales = pd.DataFrame(sales_data)
# 添加月份和季度列
df_sales['月份'] = df_sales['日期'].dt.month
df_sales['季度'] = df_sales['日期'].dt.quarter
df_sales['星期几'] = df_sales['日期'].dt.day_name()
# 查看数据结构
print(df_sales.head())

复制代码

这段代码创建了一个包含日期、产品、地区、销量和收入等信息的销售数据集，并添加了月份、季度和星期几等辅助列。

月度销售趋势分析

# 按月份汇总销售数据
monthly_sales = df_sales.groupby(['月份', '产品'])['销量'].sum().unstack()
# 创建月度销售趋势图
plt.figure(figsize=(12, 8))
# 为每个产品绘制折线图
for i, product in enumerate(monthly_sales.columns):
plt.plot(monthly_sales.index, monthly_sales[product],
linewidth=2.5,
label=product,
marker='o',
markersize=6)
# 添加标题和标签
plt.title('2022年各产品月度销售趋势', fontsize=16, fontweight='bold', pad=20)
plt.xlabel('月份', fontsize=12, labelpad=10)
plt.ylabel('销量', fontsize=12, labelpad=10)
# 设置x轴刻度
plt.xticks(range(1, 13),
['1月', '2月', '3月', '4月', '5月', '6月',
'7月', '8月', '9月', '10月', '11月', '12月'],
fontsize=10)
# 添加图例
plt.legend(fontsize=12, frameon=True, fancybox=True, shadow=True)
# 添加网格线
plt.grid(True, linestyle='--', alpha=0.7)
# 突出显示销量最高的月份
max_month = monthly_sales.sum(axis=1).idxmax()
plt.axvline(x=max_month, color='r', linestyle='--', alpha=0.3)
plt.text(max_month, monthly_sales.sum(axis=1).max() * 0.95,
'销量最高月份',
ha='center', va='center',
bbox=dict(facecolor='white', alpha=0.7))
# 调整边距
plt.tight_layout()
# 保存图表
plt.savefig('monthly_sales_trend.png', dpi=300, bbox_inches='tight')
plt.show()

复制代码

这段代码创建了各产品月度销售趋势图，包括折线图、标记点、标题、标签、图例、网格线等元素，并突出显示了销量最高的月份。

地区销售分布分析

# 按地区和产品汇总销售数据
region_product_sales = df_sales.groupby(['地区', '产品'])['销量'].sum().unstack()
# 创建地区销售分布图
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 8))
# 第一个子图：堆叠柱状图
region_product_sales.plot(kind='bar', stacked=True, ax=ax1,
colormap='viridis', width=0.7)
ax1.set_title('各地区不同产品销量分布', fontsize=14, fontweight='bold')
ax1.set_xlabel('地区', fontsize=12)
ax1.set_ylabel('销量', fontsize=12)
ax1.legend(title='产品', fontsize=10)
ax1.grid(True, axis='y', linestyle='--', alpha=0.7)
# 添加数据标签
for i, total in enumerate(region_product_sales.sum(axis=1)):
ax1.text(i, total + 50, f'{total:,}',
ha='center', va='bottom', fontweight='bold')
# 第二个子图：饼图
region_total = region_product_sales.sum(axis=1)
explode = [0.05 if region == region_total.idxmax() else 0 for region in region_total.index]
wedges, texts, autotexts = ax2.pie(region_total,
labels=region_total.index,
autopct='%1.1f%%',
startangle=90,
explode=explode,
shadow=True,
colors=plt.cm.viridis(np.linspace(0, 1, len(region_total))))
ax2.set_title('各地区销量占比', fontsize=14, fontweight='bold')
# 美化饼图标签
for autotext in autotexts:
autotext.set_color('white')
autotext.set_fontweight('bold')
# 添加总销量标签
total_sales = region_total.sum()
ax2.text(0, -1.2, f'总销量: {total_sales:,}',
ha='center', va='center', fontsize=12, fontweight='bold')
plt.tight_layout()
plt.savefig('region_sales_distribution.png', dpi=300, bbox_inches='tight')
plt.show()

复制代码

这段代码创建了两个子图：堆叠柱状图和饼图，分别展示了各地区不同产品的销量分布和各地区销量占比。

产品相关性分析

# 计算产品之间的相关性
product_corr = df_sales.pivot_table(index='日期', columns='产品', values='销量').corr()
# 创建相关性热力图
plt.figure(figsize=(10, 8))
# 使用Seaborn绘制热力图
mask = np.triu(np.ones_like(product_corr, dtype=bool)) # 创建上三角掩码
sns.heatmap(product_corr,
mask=mask,
annot=True,
fmt='.2f',
cmap='coolwarm',
vmin=-1,
vmax=1,
linewidths=0.5,
cbar_kws={"shrink": 0.8})
plt.title('产品销量相关性热力图', fontsize=16, fontweight='bold', pad=20)
plt.tight_layout()
# 保存图表
plt.savefig('product_correlation_heatmap.png', dpi=300, bbox_inches='tight')
plt.show()
# 创建产品销量散点图矩阵
from pandas.plotting import scatter_matrix
# 准备数据
scatter_data = df_sales.pivot_table(index='日期', columns='产品', values='销量')
# 创建散点图矩阵
fig, axes = plt.subplots(4, 4, figsize=(16, 16))
fig.suptitle('产品销量散点图矩阵', fontsize=16, fontweight='bold')
# 使用Pandas的scatter_matrix函数
scatter_matrix(scatter_data, alpha=0.5, figsize=(16, 16),
diagonal='kde', ax=axes,
color='green', grid=True)
plt.tight_layout()
plt.subplots_adjust(top=0.95)
plt.savefig('product_scatter_matrix.png', dpi=300, bbox_inches='tight')
plt.show()

复制代码

这段代码创建了产品销量相关性热力图和散点图矩阵，用于分析不同产品销量之间的相关性。

销售数据仪表盘

最后，让我们创建一个综合的销售数据仪表盘，将多个可视化结果组合在一起：

# 创建销售数据仪表盘
fig = plt.figure(figsize=(20, 16))
gs = fig.add_gridspec(3, 3)
# 添加总标题
fig.suptitle('2022年销售数据仪表盘', fontsize=20, fontweight='bold')
# 1. 月度销售趋势 (左上)
ax1 = fig.add_subplot(gs[0, :2])
monthly_total = df_sales.groupby('月份')['销量'].sum()
ax1.plot(monthly_total.index, monthly_total.values,
linewidth=3, color='royalblue', marker='o', markersize=8)
ax1.fill_between(monthly_total.index, monthly_total.values, alpha=0.3, color='royalblue')
ax1.set_title('月度销售总趋势', fontsize=14, fontweight='bold')
ax1.set_xlabel('月份')
ax1.set_ylabel('销量')
ax1.set_xticks(range(1, 13))
ax1.grid(True, alpha=0.3)
# 添加最高和最低销量标注
max_month = monthly_total.idxmax()
min_month = monthly_total.idxmin()
ax1.annotate(f'最高: {monthly_total[max_month]:,}',
xy=(max_month, monthly_total[max_month]),
xytext=(max_month+1, monthly_total[max_month]*0.9),
arrowprops=dict(facecolor='green', shrink=0.05, width=1, headwidth=8))
ax1.annotate(f'最低: {monthly_total[min_month]:,}',
xy=(min_month, monthly_total[min_month]),
xytext=(min_month+1, monthly_total[min_month]*1.1),
arrowprops=dict(facecolor='red', shrink=0.05, width=1, headwidth=8))
# 2. 产品销量占比 (右上)
ax2 = fig.add_subplot(gs[0, 2])
product_total = df_sales.groupby('产品')['销量'].sum()
wedges, texts, autotexts = ax2.pie(product_total,
labels=product_total.index,
autopct='%1.1f%%',
startangle=90,
colors=plt.cm.Set3(np.linspace(0, 1, len(product_total))))
ax2.set_title('产品销量占比', fontsize=14, fontweight='bold')
for autotext in autotexts:
autotext.set_color('black')
autotext.set_fontweight('bold')
# 3. 地区销量分布 (中左)
ax3 = fig.add_subplot(gs[1, 0])
region_total = df_sales.groupby('地区')['销量'].sum().sort_values(ascending=False)
bars = ax3.bar(region_total.index, region_total.values,
color=plt.cm.viridis(np.linspace(0, 1, len(region_total))))
ax3.set_title('地区销量分布', fontsize=14, fontweight='bold')
ax3.set_xlabel('地区')
ax3.set_ylabel('销量')
# 添加数据标签
for bar in bars:
height = bar.get_height()
ax3.text(bar.get_x() + bar.get_width()/2., height,
f'{height:,}',
ha='center', va='bottom')
# 4. 季度销售对比 (中中)
ax4 = fig.add_subplot(gs[1, 1])
quarter_product = df_sales.groupby(['季度', '产品'])['销量'].sum().unstack()
quarter_product.plot(kind='bar', ax=ax4, width=0.7)
ax4.set_title('季度产品销量对比', fontsize=14, fontweight='bold')
ax4.set_xlabel('季度')
ax4.set_ylabel('销量')
ax4.legend(title='产品')
ax4.grid(True, axis='y', alpha=0.3)
# 5. 星期销量分布 (中右)
ax5 = fig.add_subplot(gs[1, 2])
weekday_order = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
weekday_sales = df_sales.groupby('星期几')['销量'].mean().reindex(weekday_order)
ax5.plot(weekday_sales.index, weekday_sales.values,
linewidth=3, color='crimson', marker='o', markersize=8)
ax5.fill_between(weekday_sales.index, weekday_sales.values, alpha=0.3, color='crimson')
ax5.set_title('星期平均销量分布', fontsize=14, fontweight='bold')
ax5.set_xlabel('星期')
ax5.set_ylabel('平均销量')
ax5.tick_params(axis='x', rotation=45)
ax5.grid(True, alpha=0.3)
# 6. 产品相关性热力图 (下左)
ax6 = fig.add_subplot(gs[2, 0])
product_corr = df_sales.pivot_table(index='日期', columns='产品', values='销量').corr()
mask = np.triu(np.ones_like(product_corr, dtype=bool))
sns.heatmap(product_corr, mask=mask, annot=True, fmt='.2f',
cmap='coolwarm', vmin=-1, vmax=1, ax=ax6, cbar=False)
ax6.set_title('产品销量相关性', fontsize=14, fontweight='bold')
# 7. 销量与收入关系 (下中)
ax7 = fig.add_subplot(gs[2, 1])
# 聚合数据以减少点数
daily_sales = df_sales.groupby('日期').agg({'销量': 'sum', '收入': 'sum'})
ax7.scatter(daily_sales['销量'], daily_sales['收入'], alpha=0.6, color='green')
# 添加趋势线
z = np.polyfit(daily_sales['销量'], daily_sales['收入'], 1)
p = np.poly1d(z)
ax7.plot(daily_sales['销量'], p(daily_sales['销量']), "r--", linewidth=2)
ax7.set_title('日销量与收入关系', fontsize=14, fontweight='bold')
ax7.set_xlabel('销量')
ax7.set_ylabel('收入')
ax7.grid(True, alpha=0.3)
# 8. 关键指标卡片 (下右)
ax8 = fig.add_subplot(gs[2, 2])
ax8.axis('off')
# 计算关键指标
total_sales = df_sales['销量'].sum()
total_revenue = df_sales['收入'].sum()
avg_daily_sales = df_sales.groupby('日期')['销量'].sum().mean()
best_product = df_sales.groupby('产品')['销量'].sum().idxmax()
best_region = df_sales.groupby('地区')['销量'].sum().idxmax()
# 创建指标卡片
metrics = [
f"总销量: {total_sales:,}",
f"总收入: ¥{total_revenue:,.0f}",
f"日均销量: {avg_daily_sales:,.0f}",
f"最佳产品: {best_product}",
f"最佳地区: {best_region}"
]
for i, metric in enumerate(metrics):
ax8.text(0.5, 0.9-i*0.15, metric,
ha='center', va='center', fontsize=12,
bbox=dict(facecolor='lightblue', alpha=0.5, boxstyle='round'))
ax8.set_title('关键指标', fontsize=14, fontweight='bold', pad=20)
# 调整布局
plt.tight_layout()
plt.subplots_adjust(top=0.95)
# 添加水印
fig.text(0.95, 0.05, '销售数据分析报告',
fontsize=30, color='gray',
ha='right', va='bottom', alpha=0.2, rotation=15)
# 保存仪表盘
plt.savefig('sales_dashboard.png', dpi=300, bbox_inches='tight')
plt.show()

复制代码

这段代码创建了一个综合的销售数据仪表盘，包含8个不同的子图，展示了月度销售趋势、产品销量占比、地区销量分布、季度产品销量对比、星期销量分布、产品销量相关性、销量与收入关系以及关键指标。

总结

本教程详细介绍了如何使用Python的pandas库进行数据可视化，并将分析结果输出为精美图片。我们学习了：

1. Pandas内置的可视化功能，包括基本绘图方法和不同类型的图表
2. 使用Seaborn增强可视化效果，创建更美观的图表
3. 美化图表的技巧，包括调整颜色、样式、创建子图等
4. 将可视化结果保存为图片的方法，包括基本保存、高级选项和批量保存
5. 通过实际销售数据可视化案例，综合运用各种技巧创建了完整的仪表盘

通过这些技术和方法，你可以将数据分析结果转化为精美、专业的图片，使你的报告和演示更加生动和有说服力。记住，好的数据可视化不仅要美观，更要准确地传达数据中的信息和洞察。

希望本教程对你在数据可视化方面的学习和实践有所帮助！

	通知：关于部分勋章领取条件及购买价格调整的通知	05-18 21:22
	通知：本站资源由网友上传分享，如有违规等问题请到版务模块进行投诉，资源失效请在帖子内回复要求补档，会尽快处理！	10-23 09:31

活动公告

Python pandas数据可视化教程如何将数据分析结果输出为精美图片

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块

塔罗

立华奏

站长推荐 /1

友情链接

Tencent QQ