「docker实战篇」python的docker-打造多任务端app应用数据抓取系统(终结)(36)
admin
2023-04-02 17:41:35
0

通过前面35篇文章,完成了python和docker配合抓取移动端,一起总结下吧。

「docker实战篇」python的docker-打造多任务端app应用数据抓取系统(终结)(36)

总结

爬虫分为:web网页数据的抓取,app应用数据的抓取,软件应用数据的抓取,本「docker实战篇」主要是针对app应用数据的抓取的,爬虫的工程师抓取应用的时候的痛点有哪些呢?

  1. 不会抓包,不知道手机移动数据如何抓包


  2. 有些app为了防止破解做了加壳,强证书校验,导致无从下手


  3. 只知道appium移动自动化工具可以支持自动化,却不知道它还可以做爬虫


  4. 不知道爬虫系统是如何部署到服务器上的


  • 解决方案

  1. 针对没有安卓二手手机的问题,我们通过模拟器的方式来进行模拟安卓手机来进行爬取。用自己的手机确实很疼,没有没关系可以用模拟器。

  2. fiddler 和 mitmpoxy的使用,拦截过滤和Python脚本的交互都进行了实验。

  3. 强证书校验的时候,可以通过破解的方式来进行处理。

  4. web界面抖音的js的破解方式也做了说明。

  5. appium是自动化测试工程师手中的利器,会爬虫的老铁也可以拿来用的。

  6. python爬虫脚本准备好后,可以通过虚拟机挂载共享文件的方式,把本地文件映射到虚拟机,然后映射到docker容器中。

PS:最后docker的实践,关于爬虫这块高级docker的承诺,我也兑现了,其实很多时候就是缺少一个思路,工具真的是一大把,条条大路通罗马,多学多问,通过爬虫的实践,让老铁对docker越走越远,越用越专。谢谢各位老铁的支持了。

>>原创文章,欢迎转载。转载请注明:转载自IT人故事会,谢谢!
>>原文链接地址:「docker实战篇」python的docker-打造多任务端app应用数据抓取系统(终结)(36)


相关内容

热门资讯

17岁高中生写作业至凌晨,外出... 5月11日,据青海大通县融媒体中心消息:大通县公安局表示,5月8日6时15分,大通县公安局桥头派出所...
天猫“国货严选”纯棉一次性内裤... 淘宝天猫国货严选旗舰店内一次性内裤宣称“纯棉”,“假一赔十”,实际收到商品为“100%聚酯纤维”。近...
字节砍掉30%的AI项目?背后... 来源:市场资讯 (来源:钛媒体APP) 5月9日,一则关于字节跳动AI战略的消息,在社交媒体上迅速发...
戴尔电脑频繁出现蓝屏死机、重启... IT之家 5 月 11 日消息,Windows 11 更新时常出故障并引发各类问题,其中最让用户恼火...
分享PD氮化镓快充哪个品牌款式... 现在不少小伙伴选氮化镓快充头,尤其是苹果用户,找来找去都会纠结:PD氮化镓快充哪个品牌款式多,苹果氮...
激光近视手术和ICL晶体植入哪... 很多想摘镜的朋友都会纠结:选激光手术,还是ICL晶体植入?到底哪种更安全、更适合自己?广州英华眼科蔡...
原创 天... 备受科技圈关注的联发科技 MTK 天玑开发者大会即将启幕,# 天玑开发者大会# 话题提前霸占数码热搜...
量子力学如何开辟了人类认识和改... 量子力学是 20 世纪最具颠覆性、最具奠基性的基础科学革命成果,与相对论共同构筑起现代物理学两大支柱...
广西企业储存罐爆裂,大量棕褐色... 5月11日,贵港市港北区应急管理局发布情况通报:2026年5月11日14时许,广西对比生物科技有限公...
涉及文物归还,马克龙:这一进程... 据法新社报道,法国总统马克龙当地时间5月11日在肯尼亚内罗毕举行的经济峰会上表示,归还殖民时期掠夺的...