广告国内BGP机房32G内存299元网站收录排名问题解决【超牛】搜外友链平台站长在线扒站工具【免费】【免费】站长开发工具箱【推荐】站长自动外链工具广告位联系QQ：253000106 独立服务器100M/不限/免备 2核2G服务器新用户低至68元/年虚拟资源平台,轻松变现 10000来路IP只需8元站群系统程序-专注SEO站群黑帽SEO论坛_黑帽聚集地企业HTTP代理IP服务提供商软文推广，在线获客【定制】站群服务器99元起 SEO免费工具分享外推代发包收录【国内国际】短信推广，免费测试实力产品收量外链代发 5分一条快速排名 █一解决“收录、排名”问题一█ ●●●优质搜狗泛收录域名●●● AI数字人直播系统源码百度SEO排名7-15天上首页

删除 DF 中的重复项并在 python 中转换为 JSON obj

PHP中文网 • 2025年2月26日 05:04:36 • 编程技术 • 阅读 2

问题内容

我有一个类似于下面的 df

name         series=============================a             a1b             b1a             a2a             a1b             b2

登录后复制

我需要将系列转换为一个列表，该列表应分配给每个名称，例如字典或 json obj，如下所示

{   "a": ["a1", "a2"],   "b": ["b1", "b2"]}

登录后复制

到目前为止，我已经尝试使用 groupby，但它只是将所有内容分组为一个单独的字典

test = df.groupby("series")[["name"]].apply(lambda x: x)

登录后复制

上面的代码给出了一个类似 df 的输出

立即学习“Python免费学习笔记（深入）”；

SeriesNameA     0   A1      2   A2      3   A1B     1   B1      4   B2

登录后复制

非常感谢任何帮助

谢谢

正确答案

首先 drop_duplicates 确保有，然后 groupby.agg 作为列表：

out = df.drop_duplicates().groupby('name')['series'].agg(list).to_dict()

登录后复制

或者拨打unique：

out = df.groupby('name')['series'].agg(lambda x: x.unique().tolist()).to_dict()

登录后复制

输出：{‘a’: [‘a1’, ‘a2’], ‘b’: [‘b1’, ‘b2’]}

如果您还有其他列，请确保仅保留感兴趣的列：

out = (df[['name', 'series']].drop_duplicates()       .groupby('name')['series'].agg(list).to_dict()      )

登录后复制

对列表进行排序：

out = (df.groupby('name')['series']         .agg(lambda x: sorted(x.unique().tolist())).to_dict()      )

登录后复制

示例：

# input  Name Series0    A     Z11    B     B12    A     A23    A     Z14    B     B2# output{'A': ['A2', 'Z1'], 'B': ['B1', 'B2']}

登录后复制

以上就是删除 DF 中的重复项并在 python 中转换为 JSON obj的详细内容，更多请关注【创想鸟】其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至253000106@qq.com举报，一经查实，本站将立刻删除。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2211950.html

赞 (0)

0 0

关于作者

PHP中文网签约作者

253.4K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

如何安全地存储数据库连接详细信息

上一篇 2025年2月26日 05:04:27

php 开源cms有哪些

下一篇 2025年2月18日 06:54:03

编程技术

如何安全地存储数据库连接详细信息

问题内容在需要打开数据库连接的应用程序中，必须将用户名/密码详细信息发送到数据库。存储和使用这些数据最安全的方式是什么？正确答案确切的方法取决于环境，但一般来说，您将凭据存储在只有运行应用程序的用户可读的位置。例如，在 Windows…

PHP中文网
2025年2月26日
2000
编程技术

如何根据输入多次运行一行代码？

问题内容使用 python，我试图找到一种更快的方法来根据输入多次运行 randint，而不必写出每个输入的可能性。这是用于桌面游戏的骰子滚轮。代码如下 import randomfrom random import randinti1=…

PHP中文网
2025年2月26日
2000
编程技术

如何在Python中使用正则表达式进行模式匹配

正则表达式是一种强大的文本匹配工具，可以在python中使用re模块来进行模式匹配。以下是使用正则表达式进行模式匹配的一般步骤： 1. 导入re模块：首先，需要导入re模块，使用import re语句。 2. 创建正则表达式：使用re模块的…

PHP中文网
2025年2月26日
2000
编程技术

PyCharm打不开怎么办？快速解决方案大揭秘

PyCharm是一款功能强大的Python集成开发环境，但有时候会出现打不开的情况，可能是由于各种原因引起的。如果你遇到了PyCharm打不开的问题，不要慌张，本文将为你揭秘快速解决方案，并提供具体的代码示例帮助你解决问题。首先，如果Py…

PHP中文网
2025年2月26日
2000
编程技术

连接字符串导致问题

问题内容我在 python 中遇到了一些与连接字符串相关的奇怪问题。我们有一个需求，需要通过api连接到外部数据源并提取数据。通过 api 连接时，我们需要以字符串形式将各种凭据作为 raw_data 的一部分传递，如下例所示（这不是实际…

PHP中文网
2025年2月26日
2000
编程技术

如何创建一个新列，其中的值是根据现有列选择的？

问题内容如何将 color 列添加到以下数据帧，以便 color=’green’ 如果 set == ‘z’，否则 color=’red’ ？ Type Set1 A…

PHP中文网
2025年2月26日
2000
编程技术

more_itertools 无法在 Python 3.6 中从 functools 导入cached_property

问题内容我尝试使用以下命令从 visual studio 代码中的终端运行grade_analysis.py： ~/documents/school/ml4t_2023fall/assess_portfolio$ pythonpath=.…

PHP中文网
2025年2月26日
2000
编程技术

PyCharm技巧：替换功能全面解析

PyCharm技巧：替换功能全面解析 PyCharm是一款功能强大的集成开发环境，广泛用于Python开发。在编写代码过程中，经常需要进行替换操作来提高代码的质量和效率。PyCharm提供了丰富的替换功能，能够帮助开发者快速、准确地替换指定…

PHP中文网
2025年2月26日
2000
编程技术

索引多维 numpy 数组中的多个元素

问题内容我想使用另一个索引数组提取给定多维 numpy 数组的元素。但是它的行为并不符合我的预期。下面是一个简单的例子： import numpy as npa = np.random.random((3, 3, 3))idx = np.…

PHP中文网
2025年2月26日
2000
编程技术

如何将图例Matplotlib TKinter

问题内容我正在尝试在图形中创建图例，但当我使用 legend() 时它不起作用。我不知道还能有什么。我看到了很多关于它的信息，我也在做同样的事情，但它一直不起作用。你能帮我一下吗？在我的代码下面： import tkinter as t…

PHP中文网
2025年2月26日
2000

发表回复

登录后才能评论