python写的一个squid访问日志分析的小程序

这两周组里面几位想学习python,于是我们就创建了一个这样的环境和氛围来给大家学习。

昨天在群里,贴了一个需求,就是统计squid访问日志中ip 访问数和url的访问数并排序,不少同学都大体实现了相应的功能,我把我简单实现的贴出来,欢迎拍砖:

日志格式如下:

复制代码 代码如下:

立即学习“Python免费学习笔记(深入)”;

%ts.%03tu %6tr %{X-Forwarded-For}>h %Ss/%03Hs %h” “%{User-Agent}>h” %{Cookie}>h

复制代码 代码如下:

立即学习“Python免费学习笔记(深入)”;

1372776321.285      0 100.64.19.225 TCP_HIT/200 8560 GET http://img1.jb51.net/games/0908/19/1549401_3_80x100.jpg  – NONE/- image/jpeg “http://www.jb51.net/” “Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; QQDownload 734; .NET4.0C; .NET CLR 2.0.50727)” pcsuv=0;%20pcuvdata=lastAccessTime=1372776317582;%20u4ad=33480hn;%20c=14arynt;%20uf=1372776310453

复制代码 代码如下:

立即学习“Python免费学习笔记(深入)”;

#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
from optparse import OptionParser
”’
    仅仅是一个关于日志文件的测试,统计处access.log 的ip数目
”’
try:
    f = open(‘/data/proclog/log/squid/access.log’)
except IOError,e:
    print “can’t open the file:%s” %(e)
 
def log_report(field):
    ”’
        return the field of the access log
    ”’
    if field == “ip”:
        return  [line.split()[2] for line in f]
    if field == “url”:
        return  [line.split()[6] for line in f]
def log_count(field):
    ”’
        return a dict of like {field:number}
    ”’
    fields2 = {}
    fields = log_report(field)
    for field_tmp in fields:
        if field_tmp in fields2:
            fields2[field_tmp] += 1
        else:
            fields2[field_tmp] = 1
    return fields2
def log_sort(field,number = 10 ,reverse = True):
    ”’
        print the sorted fields to output
    ”’
    for v in sorted(log_count(field).iteritems(),key = lambda x:x[1] , reverse = reverse )[0:int(number)]:
        print v[1],v[0]
if __name__ == “__main__”:
    parser =OptionParser(usage=”%prog [-i|-u] [-n num | -r]” ,version = “1.0”)
    parser.add_option(‘-n’,’–number’,dest=”number”,type=int,default=10,help=” print top line of the ouput”)
    parser.add_option(‘-i’,’–ip’,dest=”ip”,action = “store_true”,help=”print ip information of access log”)
    parser.add_option(‘-u’,’–url’,dest=”url”,action = “store_true”,help=”print url information of access log”)
    parser.add_option(‘-r’,’–reverse’,action = “store_true”,dest=”reverse”,help=”reverse output “)
    (options,args) = parser.parse_args()
 
    if len(sys.argv)         parser.print_help()
    if options.ip and options.url:
         parser.error(‘ -i and -u  can not be execute at the same time ‘)
    if options.ip :
        log_sort(“ip”, options.number , True and options.reverse  or False)
    if options.url:
        log_sort(“url”, options.number , True and  options.reverse or False)
 
    f.close()

效果如下:

python写的一个squid访问日志分析的小程序

python写的一个squid访问日志分析的小程序

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2291018.html

(0)
上一篇 2025年2月28日 00:43:28
下一篇 2025年2月28日 00:43:52

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • python里大整数相乘相关技巧指南

    问题 大整数相乘 思路说明 对于大整数计算,一般都要用某种方法转化,否则会溢出。但是python无此担忧了。 Python支持“无限精度”的整数,一般情况下不用考虑整数溢出的问题,而且Python Int类型与任意精度的Long整数类可以无…

    编程技术 2025年2月28日
    200
  • python里将list中元素依次向前移动一位

    问题 定义一个int型的一维数组,包含10个元素,分别赋值为1~10, 然后将数组中的元素都向前移一个位置, 即,a[0]=a[1],a[1]=a[2],…最后一个元素的值是原来第一个元素的值,然后输出这个数组。 解决(Python) #!…

    编程技术 2025年2月28日
    200
  • python time模块用法实例详解

    本文详细讲述了python的内嵌time模块的用法。分享给大家供大家参考之用。具体分析如下:  一、简介 time模块提供各种操作时间的函数 说明:一般有两种表示时间的方式: 第一种是时间戳的方式(相对于1970.1.1 00:00:00以…

    编程技术 2025年2月28日
    200
  • 用Python实现QQ游戏大家来找茬辅助工具

    好久没写技术相关的文章,这次写篇有意思的,关于一个有意思的游戏——QQ找茬,关于一种有意思的语言——Python,关于一个有意思的库——Qt。 这是一个用于qq大家来找茬(美女找茬)的辅助外挂,开发的原因是看到老爸天天在玩这个游戏,分数是惨…

    2025年2月28日
    200
  • 一个超级简单的python web程序

    在mac/linux环境下,执行vi hello.py命令,并输入以下代码 import webimport sys urls = (“/Service/hello”,”hello”)app = web.application(urls,g…

    编程技术 2025年2月28日
    200
  • python的Template使用指南

    template无疑是一个好东西,可以将字符串的格式固定下来,重复利用。同时template也可以让开发人员可以分别考虑字符串的格式和其内容了,无形中减轻了开发人员的压力。 Template属于string中的一个类,所以要使用的话可以用以…

    编程技术 2025年2月28日
    200
  • Python常用模块用法分析

    本文较为详细的讲述了python中常用的模块,分享给大家便于大家查阅参考之用。具体如下: 1.内置模块(不用import就可以直接使用) 常用内置函数: help(obj) 在线帮助, obj可是任何类型callable(obj) 查看一个…

    编程技术 2025年2月28日
    200
  • python之yield表达式学习

    python中有一个略微奇怪的表达式叫yield expression,本文就来探究一下这是个什么东西。一步一步来。 iterable 复制代码 代码如下:mylist = [1,2,3]for item in mylist:    pri…

    编程技术 2025年2月28日
    200
  • python实现斐波那契递归函数的方法

    本文以一个简单的实例讲述了python实现斐波那契数列数列递归函数的方法,代码精简易懂。分享给大家供大家参考之用。 主要函数代码如下: def fab(n): if n==1: return 1 if n==0: return 0 else…

    编程技术 2025年2月28日
    200
  • python多线程编程中的join函数使用心得

    今天去辛集买箱包,下午挺晚才回来,又是恶心又是头痛。恶心是因为早上吃坏东西+晕车+回来时看到车祸现场,头痛大概是烈日和空调混合刺激而成。没有时间没有精神没有力气学习了,这篇博客就说说python中一个小小函数。 由于坑爹的学校坑爷的专业,多…

    2025年2月28日
    200

发表回复

登录后才能评论