网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
11月29日漏签0天
python吧 关注:479,759贴子:1,980,490
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 4回复贴,共1页
<<返回python吧
>0< 加载中...

【求助】如何从响应中只提取我想要的Json文本,不想要html的文本

  • 只看楼主
  • 收藏

  • 回复
  • 520
  • 童生
    2
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

如上图所示,通过scrapy框架发送请求我可以获得这个的响应内容。
但是请求中有html的文本和javascript的内容,分析得window.__SEARCH_RESULT__变量对应的值是一个json格式的文本,可以通过json.loads转换成字典。但是有html文本的干扰,但是json.loads会转换失败,请问应该怎么提取出json的文本,谢谢!


星座王
点亮12星座印记,去领取
活动截止:2100-01-01
去徽章馆》
  • kyleyu79
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
学习过程中遇到问题可以来这里提问,大神在线免费解答。


2025-11-29 17:09:55
广告
不感兴趣
开通SVIP免广告
  • kyleyu79
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


  • Zswdhy
  • 探花
    11
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
将script中的文本内容整体提取,可以用正则匹配


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 4回复贴,共1页
<<返回python吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示