python统计一个文本中重复行数的方法

PHP中文网 • 2025年2月28日 01:29:30 • 编程技术 • 阅读 1

本文实例讲述了python统计一个文本中重复行数的方法。分享给大家供大家参考。具体实现方法如下：

比如有下面一个文件
2
3
1
2
我们期望得到
2,2
3,1
1,1

解决问题的思路:

出现的文本作为key, 出现的数目作为value,然后按照value排除后输出
最好按照value从大到小输出出来,可以参照：

复制代码代码如下:in recent Python 2.7, we have new OrderedDict type, which remembers the order in which the items were added.
>>> d = {“third”: 3, “first”: 1, “fourth”: 4, “second”: 2}
>>> for k, v in d.items():
…     print “%s: %s” % (k, v)
…
second: 2
fourth: 4
third: 3
first: 1
>>> d
{‘second’: 2, ‘fourth’: 4, ‘third’: 3, ‘first’: 1}To make a new ordered dictionary from the original, sorting by the values:
>>> from collections import OrderedDict
>>> d_sorted_by_value = OrderedDict(sorted(d.items(), key=lambda x: x[1]))The OrderedDict behaves like a normal dict:
>>> for k, v in d_sorted_by_value.items():
…     print “%s: %s” % (k, v)
…
first: 1
second: 2
third: 3
fourth: 4
>>> d_sorted_by_value
OrderedDict([(‘first’: 1), (‘second’: 2), (‘third’: 3), (‘fourth’: 4)])
代码如下:
复制代码代码如下:#coding=utf-8
import operator
f = open(“f.txt”)
count_dict = {}
for line in f.readlines():
    line = line.strip()
    count = count_dict.setdefault(line, 0)
    count += 1
    count_dict[line] = count
sorted_count_dict = sorted(count_dict.iteritems(), key=operator.itemgetter(1), reverse=True)
for item in sorted_count_dict:
    print “%s,%d” % (item[0], item[1])

补充说明:
1. python的dict对象的两个方法:

items方法将所有的字典项以列表的方式返回, 这些列表项中每一项都来自于(键, 值)
iteritems方法与items的作用大致相同, 但是返回一个迭代器对象而不是列表

2. python的内建函数sorted

复制代码代码如下:>>> help(sorted)
Help on built-in function sorted in module __builtin__:
sorted(…)
sorted(iterable, cmp=None, key=None, reverse=False) –> new sorted list

希望本文所述对大家的Python程序设计有所帮助。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2292083.html

Python 文本统计重复行数

0 0

关于作者

PHP中文网签约作者

284.8K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Python多线程同步Lock、RLock、Semaphore、Event实例

上一篇 2025年2月28日 01:29:22

解剖长方法并进行提取的遗留代码重构 – 第10部分

下一篇 2025年2月19日 14:46:28

编程技术

Python多线程同步Lock、RLock、Semaphore、Event实例

一、多线程同步由于CPython的python解释器在单线程模式下执行，所以导致python的多线程在很多的时候并不能很好地发挥多核cpu的资源。大部分情况都推荐使用多进程。 python的多线程的同步与其他语言基本相同，主要包含： Lo…

PHP中文网
2025年2月28日
2000
python通过zlib实现压缩与解压字符串的方法

本文实例讲述了python通过zlib实现压缩与解压字符串的方法。分享给大家供大家参考。具体实现方法如下：使用zlib.compress可以压缩字符串。使用zlib.decompress可以解压字符串。如下复制代码代码如下:#codi…

PHP中文网
编程技术 2025年2月28日
2000
编程技术

Python多进程通信Queue、Pipe、Value、Array实例

queue和pipe的区别： pipe用来在两个进程间通信。queue用来在多个进程间实现通信。此两种方法为所有系统多进程通信的基本方法，几乎所有的语言都支持此两种方法。 1）Queue & JoinableQueue queue…

PHP中文网
2025年2月28日
2000
Python中列表、字典、元组、集合数据结构整理

本文详细归纳整理了python中列表、字典、元组、集合数据结构。分享给大家供大家参考。具体分析如下：列表：复制代码代码如下:shoplist = [‘apple’, ‘mango’, &…

PHP中文网
编程技术 2025年2月28日
2000
python使用any判断一个对象是否为空的方法

本文实例讲述了python使用any判断一个对象是否为空的方法。分享给大家供大家参考。具体实现代码如下：复制代码代码如下:>>> eth = {“eth0″:”192.168.1.1″}&gt…

PHP中文网
编程技术 2025年2月28日
2000
python编写暴力破解FTP密码小工具

python具体强大的库文件，很多功能都有相应的库文件，所以很有必要进行学习一下，其中有一个ftp相应的库文件ftplib，我们只需要其中的登录功能，然后利用多线程调用相应字典里面的字段进行登录，还能根据自己的需要，根据自身的情况编写需要的…

PHP中文网
编程技术 2025年2月28日
2000
Django1.7+python 2.78+pycharm配置mysql数据库教程

配置好virtualenv 和virtualenvwrapper后，使用pycharm创建新项目。之后要面临的问题就来了，之前一直使用的是sqlite作为开发数据库进行学习，按照之前看教程的原则，好像就是说开发环境要和生产环境尽量的一致，所…

PHP中文网
编程技术 2025年2月28日
2000
Python访问MySQL封装的常用类实例

本文实例讲述了python访问mysql封装的常用类。分享给大家供大家参考。具体如下： python访问mysql比较简单,下面整理的就是一个很简单的Python访问MySQL数据库类。自己平时也就用到两个mysql函数：查询和更新，下面…

PHP中文网
编程技术 2025年2月28日
2000
python实现ipsec开权限实例

本文实例讲述了python实现ipsec开权限的方法。分享给大家供大家参考。具体实现方法如下： windows自带的命令行工具netsh ipsec static add filter不支持批量添加，还会添加重复的规则进去。我用python…

PHP中文网
编程技术 2025年2月28日
2000
如何在Chrome和Edge的所有选项卡中搜索文本

本教程向您展示了如何在windows的chrome或edge中找到所有打开的标签页上的特定文本或短语。有没有办法在Chrome中所有打开的标签页上进行文本搜索？是的，您可以使用Chrome中的免费外部Web扩展在所有打开的标签上执行文本…

PHP中文网
2025年2月28日 • 互联网
2000

发表回复

登录后才能评论

python统计一个文本中重复行数的方法

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐