使用优化器来提升Python程序的执行效率的教程

PHP中文网 • 2025年2月28日 02:21:40 • 编程技术 • 阅读 2

如果不首先想想这句knuth的名言，就开始进行优化工作是不明智的。可是，你很快写出来加入一些特性的代码，可能会很丑陋，你需要注意了。这篇文章就是为这时候准备的。

那么接下来就是一些很有用的工具和模式来快速优化Python。它的主要目的很简单：尽快发现瓶颈，修复它们并且确认你修复了它们。
写一个测试

在你开始优化前，写一个高级测试来证明原来代码很慢。你可能需要采用一些最小值数据集来复现它足够慢。通常一两个显示运行时秒的程序就足够处理一些改进的地方了。

有一些基础测试来保证你的优化没有改变原有代码的行为也是很必要的。你也能够在很多次运行测试来优化代码的时候稍微修改这些测试的基准。

那么现在，我们来来看看优化工具把。
简单的计时器

计时器很简单，这是一个最灵活的记录执行时间的方法。你可以把它放到任何地方并且副作用很小。运行你自己的计时器非常简单，并且你可以将其定制，使它以你期望的方式工作。例如，你个简单的计时器如下：

import time def timefunc(f): def f_timer(*args, **kwargs):  start = time.time()  result = f(*args, **kwargs)  end = time.time()  print f.__name__, 'took', end - start, 'time'  return result return f_timer def get_number(): for x in xrange(5000000):  yield x @timefuncdef expensive_function(): for x in get_number():  i = x ^ x ^ x return 'some result!' # prints "expensive_function took 0.72583088875 seconds"result = expensive_function()

登录后复制

当然，你可以用上下文管理来让它功能更加强大，添加一些检查点或者一些其他的功能：

import time class timewith(): def __init__(self, name=''):  self.name = name  self.start = time.time()  @property def elapsed(self):  return time.time() - self.start  def checkpoint(self, name=''):  print '{timer} {checkpoint} took {elapsed} seconds'.format(   timer=self.name,   checkpoint=name,   elapsed=self.elapsed,  ).strip()  def __enter__(self):  return self  def __exit__(self, type, value, traceback):  self.checkpoint('finished')  pass def get_number(): for x in xrange(5000000):  yield x def expensive_function(): for x in get_number():  i = x ^ x ^ x return 'some result!' # prints something like:# fancy thing done with something took 0.582462072372 seconds# fancy thing done with something else took 1.75355315208 seconds# fancy thing finished took 1.7535982132 secondswith timewith('fancy thing') as timer: expensive_function() timer.checkpoint('done with something') expensive_function() expensive_function() timer.checkpoint('done with something else') # or directlytimer = timewith('fancy thing')expensive_function()timer.checkpoint('done with something')

登录后复制

计时器还需要你做一些挖掘。包装一些更高级的函数，并且确定瓶颈在哪，然后深入的函数里，能够不停的重现。当你发现一些不合适的代码，修复它，然后测试一遍以确认它被修复了。

立即学习“Python免费学习笔记（深入）”；

一些小技巧：不要忘了好用的timeit模块！它对小块代码做基准测试而不是实际调查更加有用。

Timer 优点：很容易理解和实现。也非常容易在修改后进行比较。对于很多语言都适用。 Timer 缺点：有时候对于非常复杂的代码有点过于简单，你可能会花更多时间放置或移动引用代码而不是修复问题！

内建优化器

启用内建的优化器就像是用一门大炮。它非常强大，但是有点不太好用，使用和解释起来比较复杂。

你可以了解更多关于profile模块的东西，但是它的基础是非常简单的：你能够启用和禁用优化器，而且它能打印所有的函数调用和执行时间。它能给你编译和打印出输出。一个简单的装饰器如下：

import cProfile def do_cprofile(func): def profiled_func(*args, **kwargs):  profile = cProfile.Profile()  try:   profile.enable()   result = func(*args, **kwargs)   profile.disable()   return result  finally:   profile.print_stats() return profiled_func def get_number(): for x in xrange(5000000):  yield x @do_cprofiledef expensive_function(): for x in get_number():  i = x ^ x ^ x return 'some result!' # perform profilingresult = expensive_function()

登录后复制

在上面代码的情况下，你应该看到有些东西在终端打印出来，打印的内容如下：

5000003 function calls in 1.626 seconds  Ordered by: standard name  ncalls tottime percall cumtime percall filename:lineno(function) 5000001 0.571 0.000 0.571 0.000 timers.py:92(get_number)  1 1.055 1.055 1.626 1.626 timers.py:96(expensive_function)  1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}

登录后复制

你可以看到，它给出了不同函数的调用次数，但它遗漏了一些关键的信息：是哪个函数让运行这么慢？

可是，这对于基础优化来说是个好的开始。有时候甚至能用更少的精力找到解决方案。我经常用它来在深入挖掘究竟是哪个函数慢或者调用次数过多之前来调试程序。

内建优点：没有额外的依赖并且非常快。对于快速的高等级检查非常有用。内建缺点：信息相对有限，需要进一步的调试；报告有点不太直接，尤其是对于复杂的代码。

Line Profiler

如果内建的优化器是一门大炮，那么line profiler可以看作是一门离子加农炮。它非常的重量级和强大。

在这个例子里，我们会用非常棒的line_profiler库。为了容易使用，我们会再次用装饰器包装一下，这种简单的方法也可以防止把它放在生产代码里。

try: from line_profiler import LineProfiler  def do_profile(follow=[]):  def inner(func):   def profiled_func(*args, **kwargs):    try:     profiler = LineProfiler()     profiler.add_function(func)     for f in follow:      profiler.add_function(f)     profiler.enable_by_count()     return func(*args, **kwargs)    finally:     profiler.print_stats()   return profiled_func  return inner except ImportError: def do_profile(follow=[]):  "Helpful if you accidentally leave in production!"  def inner(func):   def nothing(*args, **kwargs):    return func(*args, **kwargs)   return nothing  return inner def get_number(): for x in xrange(5000000):  yield x @do_profile(follow=[get_number])def expensive_function(): for x in get_number():  i = x ^ x ^ x return 'some result!' result = expensive_function()

登录后复制

如果你运行上面的代码，你就可以看到一下的报告：

Timer unit: 1e-06 s File: test.pyFunction: get_number at line 43Total time: 4.44195 s Line #  Hits   Time Per Hit % Time Line Contents============================================================== 43           def get_number(): 44 5000001  2223313  0.4  50.1  for x in xrange(5000000): 45 5000000  2218638  0.4  49.9   yield x File: test.pyFunction: expensive_function at line 47Total time: 16.828 s Line #  Hits   Time Per Hit % Time Line Contents============================================================== 47           def expensive_function(): 48 5000001  14090530  2.8  83.7  for x in get_number(): 49 5000000  2737480  0.5  16.3   i = x ^ x ^ x 50   1   0  0.0  0.0  return 'some result!'

登录后复制

你可以看到，有一个非常详细的报告，能让你完全洞悉代码运行的情况。不想内建的cProfiler，它能计算话在语言核心特性的时间，比如循环和导入并且给出在不同的行花费的时间。

这些细节能让我们更容易理解函数内部。如果你在研究某个第三方库，你可以直接将其导入并加上装饰器来分析它。

一些小技巧：只装饰你的测试函数并将问题函数作为接下来的参数。

Line Profiler 优点：有非常直接和详细的报告。能够追踪第三方库里的函数。 Line Profiler 缺点：因为它会让代码比真正运行时慢很多，所以不要用它来做基准测试。这是额外的需求。

总结和最佳实践

你应该用更简单的工具来对测试用例进行根本的检查，并且用更慢但能显示更多细节的line_profiler来深入到函数内部。

九成情况下，你可能会发现在一个函数里循环调用或一个错误的数据结构消耗了90%的时间。一些调整工具是非常适合你的。

如果你仍然觉得这太慢，而是用一些你自己的秘密武器，如比较属性访问技术或调整平衡检查技术。你也可以用如下的方法：

1．忍受缓慢或者缓存它们

2．重新思考整个实现

3．更多使用优化的数据结构

4．写一个C扩展

注意了，优化代码是种罪恶的快感！用合适的方法来为你的Python代码加速很有意思，但是注意不要破坏了本身的逻辑。可读的代码比运行速度更重要。先把它缓存起来再进行优化其实更好。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2293479.html

Python 优化

0 0

关于作者

PHP中文网签约作者

285.3K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

用Python编写分析Python程序性能的工具的教程

上一篇 2025年2月28日 02:21:30

怎样使用PHP创建视频播放列表？

下一篇 2025年2月22日 12:52:32

编程技术

用Python编写分析Python程序性能的工具的教程

虽然并非你编写的每个 python 程序都要求一个严格的性能分析，但是让人放心的是，当问题发生的时候，python 生态圈有各种各样的工具可以处理这类问题。分析程序的性能可以归结为回答四个基本问题：正运行的多快速度瓶颈…

PHP中文网
2025年2月28日
2000
python连接远程ftp服务器并列出目录下文件的方法

本文实例讲述了python连接远程ftp服务器并列出目录下文件的方法。分享给大家供大家参考。具体如下：这段python代码用到了pysftp模块，使用sftp协议，对数据进行加密传输 import pysftpsrv = pysftp.C…

PHP中文网
编程技术 2025年2月28日
2000
编程技术

用实例详解Python中的Django框架中prefetch_related()函数对数据库查询的优化

实例的背景说明假定一个个人信息系统，需要记录系统中各个人的故乡、居住地、以及到过的城市。数据库设计如下： Models.py 内容如下： from django.db import models class Province(model…

PHP中文网
2025年2月28日
2000
10种检测Python程序运行时间、CPU和内存占用的方法

在运行复杂的python程序时，执行时间会很长，这时也许想提高程序的执行效率。但该怎么做呢？首先，要有个工具能够检测代码中的瓶颈，例如，找到哪一部分执行时间比较长。接着，就针对这一部分进行优化。同时，还需要控制内存和CPU的使用，这样可…

PHP中文网
2025年2月28日 • 编程技术
2000
简单的Python2.7编程初学经验总结

如果你从来没有使用过Python，我强烈建议你阅读Python introduction，因为你需要知道基本的语法和类型。包管理 Python世界最棒的地方之一，就是大量的第三方程序包。同样，管理这些包也非常容易。按照惯例，会在 requi…

PHP中文网
2025年2月28日 • 编程技术
2000
Python中的defaultdict模块和namedtuple模块的简单入门指南

在Python中有一些内置的数据类型，比如int, str, list, tuple, dict等。Python的collections模块在这些内置数据类型的基础上，提供了几个额外的数据类型：namedtuple, defaultdict…

PHP中文网
编程技术 2025年2月28日
2000
用Python制作简单的朴素基数估计器的教程

假设你有一个很大的数据集，非常非常大，以至于不能全部存入内存。这个数据集中有重复的数据，你想找出有多少重复的数据，但数据并没有排序，由于数据量太大所以排序是不切实际的。你如何来估计数据集中含有多少无重复的数据呢？这在许多应用中是很有用的，比…

PHP中文网
编程技术 2025年2月28日
2000
用Python的pandas框架操作Excel文件中的数据教程

引言本文的目的，是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎，但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等重要。作为额外的福利，我将会进行一些模糊字符串匹配，以此来展示一些小花样，…

PHP中文网
2025年2月28日 • 编程技术
2000
Python实现国外赌场热门游戏Craps（双骰子）

运行方法： 1. 打开python2 IDLE； 2. 输入 from craps import * 3. 按提示输入运行命令。例如，玩游戏就输入play（）；查看余额就输入check_bankroll()； …

PHP中文网
编程技术 2025年2月28日
2000
Python的Flask框架中@app.route的用法教程

在我上一篇文章，我搭了一个框架，模拟了flask网站上“@app.route(‘/’)”第一条例子的行为。如果你错过了那篇“这不是魔法”，请点击这里。在这篇文章中，我们打算稍微调高点难度，为我们的URL加入可变参数的能力，在…

PHP中文网
编程技术 2025年2月28日
2000

发表回复

登录后才能评论

使用优化器来提升Python程序的执行效率的教程

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐