python实现自动登录人人网并采集信息的源码
admin
2023-07-10 06:44:51
0

将写代码过程中经常用到的一些代码片段做个收藏,如下代码段是关于python实现自动登录人人网并采集信息的的代码,应该是对大家有用途。

#!/usr/bin/python

import sys
import re
import urllib2
import urllib
import cookielib

class Renren(object):

    def __init__(self):
        self.name = self.pwd = self.content = self.domain = self.origURL =  ''
        self.operate = ''#登录进去的操作对象
        self.cj = cookielib.LWPCookieJar()
        try: 
            self.cj.revert('./renren.coockie') 
        except Exception,e:
            print e

        self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj))
        urllib2.install_opener(self.opener)

    def setinfo(self,username,password,domain,origURL):
        '''设置用户登录信息'''
        self.name = username
        self.pwd = password
        self.domain = domain
        self.origURL = origURL

    def login(self):
        '''登录人人网'''
        params = {
            'domain':self.domain,
            'origURL':self.origURL,
            'email':self.name, 
            'password':self.pwd}
        print 'login.......'
        req = urllib2.Request( 
            urllib.urlencode(params)
        )

        self.file=urllib2.urlopen(req).read()        
        newsfeed = open('news.html','w')
        try:
            newsfeed.write(self.file)
        except Exception, e:
            newsfeed.close()
        self.operate = self.opener.open(req) 
        print type(self.operate)
        print self.operate.geturl()

        if self.operate.geturl(): 
            print 'Logged on successfully!'
            self.cj.save('./renren.coockie')
            self.__viewnewinfo()
        else:
            print 'Logged on error'

    def __viewnewinfo(self):
        '''查看好友的更新状态'''
        self.__caiinfo()

    def __caiinfo(self):
        '''采集信息'''       
        apatten = re.compile('(.+):')#匹配作者
        cpatten = re.compile('(.+)s')#匹配内容  
        content = h4patten.findall(self.file)
        print len(content)   
        infocontent = self.operate.readlines()
        print type(infocontent)
        print 'friend newinfo:' 
        for i in infocontent:
            content = h4patten.findall(i)
            if len(content) != 0:
                for m in content:
                    username = apatten.findall(m)
                    info = cpatten.findall(m)
                    if len(username) !=0:
                        print username[0],'说:',info[0]
                        print '----------------------------------------------'
                    else:
                        continue

ren = Renren()
username = 'username'#你的人人网的帐号
password = 'password'#你的人人网的密码
domain = 'www.renren.com'#人人网的地址
ren.setinfo(username,password,domain,origURL)
ren.login()

相关内容

热门资讯

美伊谈判濒临破裂之际,伊朗议长... 因为以色列持续对黎巴嫩进行军事打击,伊朗宣布暂停同美国的谈判。不过美国总统特朗普称,对话仍在继续。谈...
罕见!以军政策发生“重大转变” 新华社北京6月1日电 题:罕见纵深推进,以军对黎行动会否搅动美伊谈判新华社记者刘品然 阚静文 席玥以...
山西太原发现一处新石器遗址,出... 山西省太原市文物保护研究院协同相关科研机构,近期在太原市阳曲县西盘威村发现一处新石器时代重要遗址——...
伊媒发布穆杰塔巴罕见照片 伊朗塔斯尼姆通讯社6月1日发布了一张最高领袖穆杰塔巴的照片。照片中,穆杰塔巴面露笑容,抱着一个婴儿。...
福建“泡药杨梅”曝光后,浙江杨... 这两天,浙江本地杨梅少量进入市场。虽然受到此前福建 “泡药杨梅” 事件影响,市场整体销量相比去年同期...
尺素金声 | 前4月规上工业企... 5月27日,国家统计局发布最新数据显示,今年前4月,全国规上工业企业实现利润同比增长18.2%,增速...
郑丽文:台湾民众越来越了解“台... 针对台湾《联合报》民调显示,63%受访者民意希望维持现状,即将访美的中国国民党主席郑丽文1日表示,民...
美前副总统:共和党失去了方向,... 2026年是美国的中期选举年,共和党选情不利,可能在年底的选举中遭遇挫败。美国前副总统彭斯5月31日...
南枝原来去过中国?《给阿嬷的情... 《给阿嬷的情书》票房口碑双丰收,目前票房已突破13亿。凤凰卫视最新一期《问答神州》专访了该片导演蓝鸿...
法国海军扣押一艘俄“影子舰队”... 近日,法国海军在大西洋海域扣押了一艘据称从俄罗斯摩尔曼斯克出发的油轮,引发俄方强烈不满。俄新社6月1...