[Python办公]轻松使用 pandas 将 4维表格转换为2维表

news/2024/9/19 20:03:09 标签: python, pandas, 开发语言

四维表数据如何转化2维表,假如第一列为z,第二列为x,表头为y,值为w

 

要从 Excel 文件中读取数据并将其整理成适合模型拟合的长格式(x, y, z, w),可以使用 pandas 库的 read_excel 函数来读入数据,并将宽表转换为长表。以下是具体步骤:

  1. 使用 pandas.read_excel 读取 Excel 文件
  2. 使用 melt 函数转换宽表为长表,整理出 x, y, z, w 四个字段。
  3. 确保所有列的数据类型正确,如 y 需要转换为数值型。

示例代码

假设你有一个 Excel 文件 data.xlsx,表格数据结构如你所描述:

python">import pandas as pd

# 读取Excel文件
file_path = 'data.xlsx'
data = pd.read_excel(file_path)

# 将宽表转换为长表,z 和 x 是 id_vars,列名 (0, 5, 10, 15) 作为 y 维度的值
long_data = pd.melt(data, id_vars=['z', 'x'], var_name='y', value_name='w')

# 确保 y 列是数值型
long_data['y'] = long_data['y'].astype(float)

# 查看整理后的数据
print(long_data)

# 你现在可以将数据作为 X (z, x, y) 和 y (w) 进行拟合
X = long_data[['x', 'y', 'z']]  # 特征矩阵
w = long_data['w']  # 目标变量

数据格式:

假设 Excel 文件中存储的表格如下:

z

x

0

5

10

15

0

-6

0

75.8706

118.59

132.493

0

-4

0

64.6623

116.059

139.528

0

-2

0

51.2084

108.693

142.587

0

0

0

44.0519

105.242

149.187

0

2

0

41.9517

104.581

151.369

0

4

0

36.8499

97.7238

148.838

long_data 格式(整理后的数据):

z

x

y

w

0

-6

0

0.0000

0

-6

5

75.8706

0

-6

10

118.590

0

-6

15

132.493

0

-4

0

0.0000

0

-4

5

64.6623

0

-4

10

116.059

0

-4

15

139.528

...

...

...

...

解释:

  • pandas.read_excel() 用于读取 Excel 文件中的数据。
  • melt() 函数将宽表格式的数据转换为长表格式,使 y 列的值(0, 5, 10, 15)变为单独的 y 列,表中的实际数值变为 w 列。
  • 将 y 列转换为 float 类型,以确保数值类型一致。

下一步:

现在,你已经成功将数据整理为 x, y, z, w 四维格式,可以进一步使用 scikit-learn 或其他工具进行模型拟合,例如线性回归或多项式拟合。


http://www.niftyadmin.cn/n/5664366.html

相关文章

JSON 数据 Excel 行转列

有如下JSON数据 [{id:1,name:小明,score:90}, {id:2,name:小李,score:89}, {id:3,name:小王,score:77}, {id:4,name:小刘,score:56}] 粘贴到 Excel 选中列-->数据tab-->分列 下一步 分隔符号-->其他【,】-->完成 CtrlF 替换-->全部替换 掉不要的字符为空 得…

53页PPT | 智慧产业园区解决方案

详细介绍了一个面向未来的智慧园区的规划和设计。文档内容涵盖了智慧产业园区面临的挑战、园区定位和理念、园区价值、总体设计框架以及各个支撑平台的详细介绍。 背景痛点 智慧产业园区在现代化发展过程中面临着多方面的挑战,包括如何提升园区服务水平以满足入驻企…

C++中矩阵的介绍及相关应用扩展详解

1. 矩阵概念 在数学中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。 矩阵是高等代数学中的常见工具,也常见于统计分析…

技术周总结 09.09~09.15周日(C# WinForm WPF 软件架构)

文章目录 一、09.09 周一1.1) 问题01: Windows桌面开发中,WPF和WinForm的区别和联系?联系:区别: 二、09.12 周四2.1)问题01:visual studio的相关快捷键有哪些?通用快捷键编辑导航调试窗口管理 2…

注册信息安全专业人员(CISP)和网络安全的联系与区别

一、注册信息安全专业人员(CISP) CISP是个认证,全称是“注册信息安全专业人员”,它是由信息安全测评中心颁发的。得了这个认证,就说明你在信息安全方面有一定的专业知识和能力。 二、网络安全 那网络安全呢&#xf…

八、TOGAF(架构治理Architecture Governance)

我们现在继续分步学习,进入TOGAF的**架构治理(Architecture Governance)**部分。 TOGAF架构治理(Architecture Governance) 架构治理是指对企业架构的开发和执行进行监督和控制的框架。它确保架构活动与业务战略保持…

本地不能訪問linux的kafka服務

1.本地使用kafka客戶端工具連接kafka服務,提示連接失敗 2. 本地使用telnet ip port命令也失敗 3.查看zookeeper和kafka服務是否正常 ps -ef | grep zookeeper ps -ef | grep kafka 3.關閉操作系統的防火墻(僅限于測試使用) 3.1.禁用防火墙 systemctl stop firew…

推荐|基于springBoot智能推荐的卫生健康系统设计与实现(源码+论文+数据库)

私信或留言即免费送开题报告和任务书(可指定任意题目) 目录 一、摘要 二、相关技 三、系统设计 四、数据库设计 五、核心代码 六、论文参考 七、源码获取: 一、摘要 随着信息技术在管理上越来越深入而广泛的应用,…