python分析nginx日志的ip(来源)
admin
2023-06-06 15:21:46
0
#!/usr/bin/env python
#_*_coding:utf-8 _*_
__author__ = 'gaogd'

import datetime,threading
import sys, os, urllib2, json
reload(sys)
sys.setdefaultencoding('utf8')

ips = {}  # ip作为字典的key,访问次数做value
iplist = []  # 遍历日志中的ip,相同的ip也会记录到列表,插入数据库
fh = open("./ip.txt", "r").readlines()  # 我的是把日志和代码在一个目录下面


for line in fh:
    ip = line.split(" ")[0]
    if 6 < len(ip) <= 15:
        ips[ip] = ips.get(ip, 0) + 1
        alist = iplist.append(ip)

def get_ip_area(ip,num):
    try:
        apiurl = "http://ip.taobao.com/service/getIpInfo.php?ip=%s" %ip
        content = urllib2.urlopen(apiurl).read()
        data = json.loads(content)['data']
        code = json.loads(content)['code']
        if code == 0: # success
            country=(data['country'])
            area = (data['area'])
            region = (data['region'])
            city = (data['city'])
            ip = (data['ip'])
            print(data['country']),(data['area']),(data['region']),(data['city']),(data['ip'])
            line = data['country'],data['area'],data['region'],data['city'],data['ip']
            data = "%s,%s,%s,%s,%s\n" % line
            file='./checkiparea%s.txt' %num
            with open(file, 'a+') as f:
                 f.write(data)
        else:
            print data
            # data = "%s,\n" % data
            # with open('./checkiparea.txt', 'a+') as f:
            #     f.write(data)

    except Exception as ex:
        print ex



def getip(num,num2):
    for ip in iplist[num:num2]:
        get_ip_area(ip,num)

if __name__ == '__main__':
    for i in range(300):
        number=i*10000
        t = threading.Thread(target=getip, args=(number,number*(1+i)))
        t.start()



Python 脚本如下:

#!/usr/bin/env python
#_*_coding:utf-8 _*_
__author__ = 'gaogd'


import MySQLdb as mysql
import datetime
import sys, os, urllib2, json

db = mysql.connect(user="root",passwd="xxxx@2015",db="intest",host="192.168.10.12") #数据库连接信息
db.autocommit(True)
cur = db.cursor()
cur.execute('set names utf8')
addtime = datetime.datetime.now()

ips = {}        #ip作为字典的key,访问次数做value
iplist = []     #遍历日志中的ip,相同的ip也会记录到列表,插入数据库
fh = open("./access_test.log", "r").readlines()                                                               #我的是把日志和代码在一个目录下面
for line in fh:
    ip = line.split(" ")[0]
    print ip
    if 6 < len(ip) <=15:
        ips[ip] = ips.get(ip, 0) + 1
        
        alist = iplist.append(ip)
for key,value in ips.items():
    listinfo = str(ips)
    sql = 'insert into ipinfo(ipaddress,countip) value ("%s","%s")' % (key,value)
    cur.execute(sql)

def get_ip_area(ip):
    try:
        apiurl = "http://ip.taobao.com/service/getIpInfo.php?ip=%s" %ip
        content = urllib2.urlopen(apiurl).read()
        data = json.loads(content)['data']
        code = json.loads(content)['code']
        if code == 0: # success
            country=(data['country'])
            area = (data['area'])
            region = (data['region'])
            city = (data['city'])
            ip = (data['ip'])
            print(data['country']),(data['area']),(data['region']),(data['city']),(data['ip'])
            sql = 'insert into whereip (country,area,region,city,ip,time) value ("%s","%s","%s","%s","%s","%s")' % (country.encode("utf-8"),area.encode("utf-8"),region.encode("utf-8"),city.encode("utf-8"),ip.encode("utf-8"),addtime)
            cur.execute(sql)
            print 'sql:',sql
        else:
            print data
    except Exception as ex:
        print ex

if __name__ == '__main__':
    for ip in iplist:
        get_ip_area(ip)
        
        
################################################
'''

  
radiansdict.get(key, default=None)
返回指定键的值,如果值不在字典中返回default值

'''

测试淘宝的ip库,拿到的数据内容如下:

http://ip.taobao.com/service/getIpInfo.php?ip=66.249.65.183

python分析nginx日志的ip(来源)

获取到的字典在http://tool.oschina.net/codeformat/json 进行格式化得到下面格式
{
    "code": 0, 
    "data": {
        "country": "中国", 
        "country_id": "CN", 
        "area": "华南", 
        "area_id": "800000", 
        "region": "广东省", 
        "region_id": "440000", 
        "city": "深圳市", 
        "city_id": "440300", 
        "county": "", 
        "county_id": "-1", 
        "isp": "电信", 
        "isp_id": "100017", 
        "ip": "113.97.193.87"
    }}


数据数据库语句

mysql> create database intest ;
Query OK, 1 row affected (0.00 sec)

mysql> use intest;
Database changed
mysql> create table ipinfo(id int auto_increment primary key,ipaddress varchar(200),countip int);
Query OK, 0 rows affected (0.22 sec)

mysql> create table whereip(id int primary key auto_increment,country varchar(100),area varchar(100),region varchar(100),city varchar(100),ip varchar(100),time datetime);
Query OK, 0 rows affected (0.20 sec)
mysql>

mysql> desc ipinfo;
+-----------+--------------+------+-----+---------+----------------+
| Field     | Type         | Null | Key | Default | Extra          |
+-----------+--------------+------+-----+---------+----------------+
| id        | int(11)      | NO   | PRI | NULL    | auto_increment |
| ipaddress | varchar(200) | YES  |     | NULL    |                |
| countip   | int(11)      | YES  |     | NULL    |                |
+-----------+--------------+------+-----+---------+----------------+
3 rows in set (0.00 sec)

mysql> desc whereip;
+---------+--------------+------+-----+---------+----------------+
| Field   | Type         | Null | Key | Default | Extra          |
+---------+--------------+------+-----+---------+----------------+
| id      | int(11)      | NO   | PRI | NULL    | auto_increment |
| country | varchar(100) | YES  |     | NULL    |                |
| area    | varchar(100) | YES  |     | NULL    |                |
| region  | varchar(100) | YES  |     | NULL    |                |
| city    | varchar(100) | YES  |     | NULL    |                |
| ip      | varchar(100) | YES  |     | NULL    |                |
| time    | datetime     | YES  |     | NULL    |                |
+---------+--------------+------+-----+---------+----------------+
7 rows in set (0.00 sec)

mysql>


分析完日志查看数据库的内容:

mysql> select * from whereip limit 10;
+----+---------+--------+-----------+-----------+-----------------+---------------------+
| id | country | area   | region    | city      | ip              | time                |
+----+---------+--------+-----------+-----------+-----------------+---------------------+
|  1 | 美国    |        |           |           | 66.249.65.133   | 2016-09-01 10:53:01 |
|  2 | 美国    |        |           |           | 23.251.63.45    | 2016-09-01 10:53:01 |
|  3 | 美国    |        |           |           | 23.251.63.45    | 2016-09-01 10:53:01 |
|  4 | 中国    | 华南   | 广东省    | 广州市    | 119.130.71.153  | 2016-09-01 10:53:01 |
|  5 | 美国    |        |           |           | 66.249.65.183   | 2016-09-01 10:53:01 |
|  6 | 美国    |        |           |           | 66.249.65.180   | 2016-09-01 10:53:01 |
|  7 | 美国    |        |           |           | 66.249.65.142   | 2016-09-01 10:53:01 |
|  8 | 美国    |        |           |           | 107.151.226.203 | 2016-09-01 10:53:01 |
|  9 | 美国    |        |           |           | 107.151.226.203 | 2016-09-01 10:53:01 |
| 10 | 美国    |        |           |           | 66.249.65.134   | 2016-09-01 10:53:01 |
+----+---------+--------+-----------+-----------+-----------------+---------------------+
10 rows in set (0.00 sec)

mysql>


相关内容

热门资讯

闭眼入不踩雷的日常实用手机推荐 在如今快节奏的生活中,选择一款日常使用方便的品牌手机显得尤为重要。它不仅需要满足工作、娱乐、社交等多...
在轨期间将新开展100余项科学... 图表来源:新华社 朱杨柱 张志远 黎家盈 5月23日上午,神舟二十三号载人飞行任务新闻发布会在...
白宫附近枪击嫌疑人身份曝光 新华社华盛顿5月23日电(记者黄强 颜亮)美国媒体23日披露当天在白宫附近向特勤局人员开枪的嫌疑人身...
凤凰专访首位香港航天员黎家盈:... 神舟二十三号载人飞行任务航天员乘组5月23日正式公布,来自香港的黎家盈名列其中。黎家盈在接受凤凰卫视...
神舟二十三号发射在即,发射窗口... 5月16日,神舟二十三号船箭组合体转运至发射区,飞船瞄准2026年5月24日23时08分发射。神舟二...
“青鸟”上街抗议蓝白挡军购?岛... 海峡导报综合报道 美对台140亿美元军售生变,美国代理海军部长曹洪(Hung cao)称,为了确保美...
詹江村赞郑丽文“大方向没有错”... 海峡导报综合报道 国民党主席郑丽文上任后的首次“大考”即2026年“九合一”选举临近,交出何等“成绩...
华为将于今年四季度上市两款智算... 2026年第四季度,华为将基于下一代AI芯片——昇腾950DT,分别推出采用液冷和风冷散热方案的两款...
红领巾薪火传 少年逐梦向阳行—... 大象新闻记者 龚丰硕 通讯员 李静图文 为传承红色精神,延续少先队优良传统,进一步增强少年儿童的荣誉...
斯凯孚申请确定两个链的伸长率的... 国家知识产权局信息显示,斯凯孚公司申请一项名为“确定两个链的伸长率的装置、相关联的双链输送机和方法”...