网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
12月16日漏签0天
python3吧 关注:28,594贴子:201,506
  • 看贴

  • 图片

  • 吧主推荐

  • 游戏

  • 1回复贴,共1页
<<返回python3吧
>0< 加载中...

高级爬虫面试题测试题 v1.3

  • 只看楼主
  • 收藏

  • 回复
  • 鸢公子
  • 优先队列
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
Python Web高级爬虫工程师测试题
(请本文件发送到: SpiderTestQuestion@163.com 并附带简历)
1、 用yield写一个斐波那契数列的生成器函数。
2、 放一段scrapy项目parse函数的代码(解析列表页,使用分组提取,解析字段)。
3、 遇到过哪些反爬策略,如果突破?
4、 scrapy各个模块启动顺序(Spider, Middleware, Pipeline的加载、实例化、Open、Close的顺序)。
5、 使用过哪些抓包工具,各有什么优点。
6、 有没有自己博客,贴一下网址。
7、 字体加密反爬机制及分类。
8、 遇到过那些验证码,怎么突破的,不使用打码平台有办法吗?
9、 简述了解的采集任务管理平台,有何不同,有修改过源码吗?
10、 遇到过哪些难度大的网站,卡在哪了,认为反爬的天花板网站/软件有哪些。
11、 selenium/splash/puppeteer(谷歌)/playwright(微软)/web scraper(插件) 优劣势。
12、 js/小程序/apk的Hook 原理。
13、 遇到过那些防御系统,极验验证码/易盾/观镜防御系统反爬策略优劣。
14、 简述绕过小程序动态调试中用户验证的方式。
15、 还有哪些问题是没问到的,又是自己的优势优点,可自行作答
附件:高级爬虫面试测试题 v1.3 --->> https://bbs.nightteam.cn/attach-download-1233.htm


  • 鸢公子
  • 优先队列
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
走过路过别错过,现在正在做汇总,有什么想法畅所欲言,每一个想法我都会回复的!
(点赞收藏评论后可以快速找到这里)


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 1回复贴,共1页
<<返回python3吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示