df数据按列提取为单个列表-程序员充电站

方法1：直接提取为单个列表

import pandas as pd # 单行DataFrame示例 df = pd.DataFrame({ 'a_1': [1], 'b_1': [10], 'a_2': [2], 'b_2': [20], 'a_3': [3], 'b_3': [30] }) # 筛选列名 a_cols = [col for col in df.columns if col.startswith('a_')] b_cols = [col for col in df.columns if col.startswith('b_')] # 提取第一行 a_list = df[a_cols].iloc[0].tolist() # 使用 iloc[0] 获取第一行 b_list = df[b_cols].iloc[0].tolist() print("a值列表:", a_list) # [1, 2, 3] print("b值列表:", b_list) # [10, 20, 30]

方法2：使用squeeze()方法

# squeeze()将单行/单列DataFrame转换为Series a_series = df.filter(regex='^a_').squeeze() # 筛选a列并压缩 b_series = df.filter(regex='^b_').squeeze() # 筛选b列并压缩 a_list = a_series.tolist() b_list = b_series.tolist() print("a值列表:", a_list) # [1, 2, 3] print("b值列表:", b_list) # [10, 20, 30]

方法3：使用values[0]

# 直接获取第一行的值 a_values = df.filter(regex='^a_').values[0] # array([1, 2, 3]) b_values = df.filter(regex='^b_').values[0] # array([10, 20, 30]) a_list = a_values.tolist() b_list = b_values.tolist() print("a值列表:", a_list) print("b值列表:", b_list)

方法4：处理可能的多行情况（通用方法）

def extract_ab_lists(df): """通用函数，处理单行或多行DataFrame""" a_cols = sorted([col for col in df.columns if col.startswith('a_')], key=lambda x: int(x.split('_')[1])) b_cols = sorted([col for col in df.columns if col.startswith('b_')], key=lambda x: int(x.split('_')[1])) if len(df) == 1: # 单行情况 a_list = df[a_cols].iloc[0].tolist() b_list = df[b_cols].iloc[0].tolist() return a_list, b_list else: # 多行情况 a_list = df[a_cols].values.tolist() b_list = df[b_cols].values.tolist() return a_list, b_list # 使用示例 a_list, b_list = extract_ab_lists(df) print("a值列表:", a_list) print("b值列表:", b_list)

方法5：按数字排序的完整示例

# 确保列按数字顺序排序 import re # 提取并按数字排序 def sort_columns(columns): """按a_1, a_2, a_3这样的数字顺序排序""" return sorted(columns, key=lambda x: int(re.search(r'\d+', x).group())) a_cols = sort_columns([col for col in df.columns if col.startswith('a_')]) b_cols = sort_columns([col for col in df.columns if col.startswith('b_')]) # 提取单行数据 row = df.iloc[0] a_list = [row[col] for col in a_cols] b_list = [row[col] for col in b_cols] print("排序后的a值列表:", a_list) # [1, 2, 3] print("排序后的b值列表:", b_list) # [10, 20, 30]

方法6：转换为字典格式

# 如果需要更结构化的结果 result = { 'a_values': df.filter(regex='^a_').squeeze().tolist(), 'b_values': df.filter(regex='^b_').squeeze().tolist() } print("字典格式:", result) # 输出: {'a_values': [1, 2, 3], 'b_values': [10, 20, 30]}

推荐使用的方法

对于单行DataFrame，最简洁的方法是：

# 简洁版 df_single_row = pd.DataFrame({ 'a_1': [1], 'b_1': [10], 'a_2': [2], 'b_2': [20], 'a_3': [3], 'b_3': [30] }) # 一行代码搞定 a_list = df_single_row.filter(regex='^a_').squeeze().tolist() b_list = df_single_row.filter(regex='^b_').squeeze().tolist() print("a:", a_list) # [1, 2, 3] print("b:", b_list) # [10, 20, 30]

关键点：

filter(regex='^a_')：筛选所有以'a_'开头的列
squeeze()：将单行DataFrame转换为Series
tolist()：将Series转换为列表

这样就能得到你想要的：所有a值在一个列表中，所有b值在另一个列表中。

Linux网络编程为什么需要基于epoll的Reactor封装

第一部分：为什么需要Reactor封装1.1 当前限制// 当前是同步/阻塞模型 while (running) {socket_t client sock_accept(server, NULL, 1000); // 阻塞或轮询if (client ! SOCKET_INVALID) {// 每个连接需要一个线程pthread_create(&thread, NULL, handle_clien…

李华

PlantUML在线编辑器：基于代码的UML建模解决方案深度解析

PlantUML在线编辑器：基于代码的UML建模解决方案深度解析【免费下载链接】plantuml-editor PlantUML online demo client 项目地址: https://gitcode.com/gh_mirrors/pl/plantuml-editor PlantUML在线编辑器提供了一种革命性的UML建模方式，通过简…

李华

《从零开始构建智能体》—— 实践与理论结合的智能体入门指南

《从零开始构建智能体》—— 实践与理论结合的智能体入门指南项目介绍在2024年，"百模大战"即将拉开序幕，而2025年则标志着"Agent 元年"的到来。随着技术的不断发展，构建更智能的智能体应用将成为新的焦点。然而&…

李华

FP8量化技术解析：Stable Diffusion 3.5为何能兼顾速度与画质

FP8量化技术解析：Stable Diffusion 3.5为何能兼顾速度与画质在生成式AI的浪潮中，Stable Diffusion系列模型已经从研究原型演变为工业级内容生成的核心引擎。然而，随着模型能力不断增强，其对显存和计算资源的需求也呈指数级增长—…

李华

PyTorch安装教程GPU加速篇：基于CUDA 12.1的最新实践

PyTorch安装教程GPU加速篇：基于CUDA 12.1的最新实践在深度学习领域，算力就是生产力。随着大模型时代的到来，动辄数十亿参数的神经网络让传统CPU训练变得遥不可及——一次完整训练可能需要数周甚至更久。而一块RTX 4090，在正确配…

李华

STL_unordered_map

它是现代C编程中使用最频繁、性能最高的容器之一，理解其工作原理至关重要。1. 核心概念：什么是 unordered_map？std::unordered_map 是一个无序的关联式容器，存储的是键值对。它的核心特性与 std::set 形成鲜明对比：键的…

李华