考虑到你这个P标签下有个<img>标签所以用个List来暂时存储一下
ptextList = []
这是拿所有P标签下的文本内容
ps = xxx.xpath("//div[@class='xiangqnr']//p")
for p in ps:
text = p.xpath("./text()").get().strip()
# 下面的条件判断是为了抓取p标签下的 img
if text == None:
text = p.xpath(".//img/@src").get()
# 通过上面的抓取获得的text不为空则存进ptextList
if text:
ptextList.append(text)
这样ptextList里面的内容就是你想要的了
ptextList = []
这是拿所有P标签下的文本内容
ps = xxx.xpath("//div[@class='xiangqnr']//p")
for p in ps:
text = p.xpath("./text()").get().strip()
# 下面的条件判断是为了抓取p标签下的 img
if text == None:
text = p.xpath(".//img/@src").get()
# 通过上面的抓取获得的text不为空则存进ptextList
if text:
ptextList.append(text)
这样ptextList里面的内容就是你想要的了