Python实现抓取网页API的机器信息并导入Excel表格
admin
2023-07-18 18:42:48
0

Python实现抓取网页API的机器信息并导入Excel表格

    之前在公司处理过18年的所有机器交付进度的信息,要将所有未交付的机器过滤出来并做统一处理,用Python爬下来并写入Excel表格确实是个好办法。

    首先介绍一个处理这个问题最笨的办法:用浏览器打开每个季度的剩余未交付的机器列表,挨行复制粘贴到Excel表格里。。然后每处理完一台就删掉记录。。。这种方法对于小学生确实比较好使,也仅限于小学生了。。当然得升级一下。

    然后升级版就是:直接request模块爬下来未交付的机器然后复制到表格里。复制这一步当然也能用python的xl*模块实现啊。要不想挨台处理完还要删记录的话就直接cron命令定时抓一下。。。这样是不是就很符合我的懒人气质了。。。

    老套路,先上代码吧。

   

#-*- coding: UTF-8 -*-

import os

import requests

import json

import xlrd

import xlutils

from xlutils.copy import copy

import sys

reload(sys)

sys.setdefaultencoding('utf8')

def get_device_spec(hostname):

    url = "http://abc.def.com/url/s"

    pa = "_type:server,hostname:"+ hostname

    param = {"q":pa}

    respone = requests.request("GET", url, params=param)

    res = json.loads(respone.text)

    server_detail = res["result"]

    return server_detail

def write_excel_data(file_name,sheet_num,row,col,value_data):

        rbook = xlrd.open_workbook(file_name)

        wbook = copy(rbook)

        w_sheet = wbook.get_sheet(sheet_num)

        w_sheet.write(row,col,value_data)

        wbook.save(file_name)

fileName = "8.25_Q3.xlsx"

data = xlrd.open_workbook(fileName)

sheet01 = data.sheets()[0]

sheet01_nrows = sheet01.nrows

sheet01_row = 1

for sheet01_row in range(1,sheet01_nrows):

    hostname = sheet01.cell(sheet01_row,0).value

    server = get_device_spec(hostname)

    try:

        write_excel_data(fileName,0,sheet01_row,1,server[0]["manufacturer"])

        write_excel_data(fileName,0,sheet01_row,2,server[0]["idc"])

        write_excel_data(fileName,0,sheet01_row,3,server[0]["sn"])

        write_excel_data(fileName,0,sheet01_row,4,server[0]["rack_location"])

        write_excel_data(fileName,0,sheet01_row,5,server[0]["flavor_disk"])

        write_excel_data(fileName,0,sheet01_row,6,server[0]["maintain_enddate"])

    except Exception as e:

        pass

    continue
def get_device_spec(hostname):

    url = "http://abc.def.com/url/s"

    pa = "_type:server,hostname:"+ hostname

    param = {"q":pa}

    respone = requests.request("GET", url, params=param)

    res = json.loads(respone.text)

    server_detail = res["result"]

    return server_detail

    首先先看get_device_spec函数。这个函数使用request模块通过传入的hostname字段去抓取我们公司的机器信息,并做json格式处理并返回server_detail的所有信息。

def write_excel_data(file_name,sheet_num,row,col,value_data):

        rbook = xlrd.open_workbook(file_name)

        wbook = copy(rbook)

        w_sheet = wbook.get_sheet(sheet_num)

        w_sheet.write(row,col,value_data)

        wbook.save(file_name)

    接下来看write_excel_data函数。这是一个将信息输入到Excel表格的函数。首先打开文件以及对应的sheet,然后将所需要的row,col和valuue_data字段填入表格内,然后保存该文件。

fileName = "8.25_Q3.xlsx"

data = xlrd.open_workbook(fileName)

sheet01 = data.sheets()[0]

sheet01_nrows = sheet01.nrows

sheet01_row = 1

for sheet01_row in range(1,sheet01_nrows):

    hostname = sheet01.cell(sheet01_row,0).value

    server = get_device_spec(hostname)

    try:

        write_excel_data(fileName,0,sheet01_row,1,server[0]["manufacturer"])

        write_excel_data(fileName,0,sheet01_row,2,server[0]["idc"])

        write_excel_data(fileName,0,sheet01_row,3,server[0]["sn"])

        write_excel_data(fileName,0,sheet01_row,4,server[0]["rack_location"])

        write_excel_data(fileName,0,sheet01_row,5,server[0]["flavor_disk"])

        write_excel_data(fileName,0,sheet01_row,6,server[0]["maintain_enddate"])

    except Exception as e:

        pass

    continue

    这段代码算是主函数了。主要实现的是定义文件名,然后读取文件内的hostname并将其作为实参传入并运行get_device_spce函数,这一步用来获取机器的所有信息;以及过滤出sn,idc等字段作为实参传入write_excel_data函数内,这一步用来将获得的机器参数过滤出自己需要的字段并填入Excel表格内。最后的except是简单做了一个错误判断退出。。防止自己电脑oom。。

    最后我是在自己电脑上配置了每天9点定时运行该文件并抓取机器信息保存。然后上班来处理剩余的机器。。


加一个我个人的公众号:运维开发Club。主要向大家分享Linux运维、Python、Go语言以及当下的云计算、容器等知识,欢迎关注!!!

                                                           Python实现抓取网页API的机器信息并导入Excel表格


    这段代码算是介绍完成了,其中个人任务也有好多未优化的代码。。。包括代码重用啦,还有获取的信息可用量也不是很多。。等等吧。有待大家帮忙指点。


相关内容

热门资讯

端起碗吃饭、放下碗砸锅:菲律宾... ·特奥多罗。(视觉中国)“名场面”让菲律宾丢尽了脸面。当地时间2026年5月31日,新加坡香格里拉酒...
中国球迷被墨西哥劫匪持枪顶头,... 6 月 14 日消息,本届美加墨世界杯开赛之后,墨西哥的治安乱象彻底被摆上台面,原本满怀期待出国看球...
中国顶级儿童医院,要造100万... 目前,AI儿科医生不是对真人医生的替代,更像是避免医生误诊、漏诊的辅助工具。倪鑫说,常有人问如果医生...
消息人士:乌军撤退期间遭伏击,... 据凤凰卫视报道,俄军13日进一步深入位于乌克兰顿涅茨克州的乌军重要防御枢纽康斯坦丁诺夫卡市。俄国防部...
《给阿嬷的情书》男主王彦桐签约... 6月14日,在热映影片《给阿嬷的情书》中饰演男主郑木生的演员王彦桐,发文宣布签约壹心娱乐:“新队友已...
马斯克,又一次创造了历史 太震撼了!马斯克,又一次创造了历史。北京时间6月12日晚,SpaceX正式登陆纳斯达克。没有红毯,没...
上海科技影都持续发力 多项影视... 上证报中国证券网讯(记者 杨翔菲)6月13日,为期两天的2026上海科技影都创制生态大会暨AltNe...
从App到Agent:Harm... 6月12日,华为开发者大会2026(HDC 2026)盛大开幕,HarmonyOS 7面向开发者正式...
高管花式退场,阿里AI不需要“... 一场漫长且诡异的高管离职传闻,正将阿里AI业务再度推至舆论中心。 6月13日据IT之家报道,阿里合伙...
苹果提交无人机集群网络优化专利... IT之家 6 月 14 日消息,苹果公司或许已经搁置了打造苹果汽车的宏大构想,但这家总部位于库比蒂诺...