求助各位大佬关于xpath提取多个标签的所有text的问题【scrapy吧】

04月22日漏签0天

scrapy吧关注：365贴子：557

2回复贴，共1页

<返回scrapy吧

求助各位大佬关于xpath提取多个标签的所有text的问题

只看楼主收藏回复

这是我想爬取的网页的源代码，我想知道xpath如何取到这些p标签下的所有的文本

送TA礼物

1楼2019-07-11 08:50回复

考虑到你这个P标签下有个<img>标签所以用个List来暂时存储一下
ptextList = []
这是拿所有P标签下的文本内容
ps = xxx.xpath("//div[@class='xiangqnr']//p")
for p in ps:
text = p.xpath("./text()").get().strip()
# 下面的条件判断是为了抓取p标签下的 img
if text == None:
text = p.xpath(".//img/@src").get()
# 通过上面的抓取获得的text不为空则存进ptextList
if text:
ptextList.append(text)
这样ptextList里面的内容就是你想要的了

2楼2019-07-14 16:47

官渡区天互软件开发工作室

低代码:数字中台，让您的企业更具竞争力!数字化时代，选择低代码，快速开发，流程无忧，让企业更上一层楼!

2025-04-22 14:27广告

立即查看