scrapy吧 关注:365贴子:557
  • 2回复贴,共1

求助各位大佬关于xpath提取多个标签的所有text的问题

只看楼主收藏回复


这是我想爬取的网页的源代码,我想知道xpath如何取到这些p标签下的所有的文本


1楼2019-07-11 08:50回复
    考虑到你这个P标签下有个<img>标签所以用个List来暂时存储一下
    ptextList = []
    这是拿所有P标签下的文本内容
    ps = xxx.xpath("//div[@class='xiangqnr']//p")
    for p in ps:
    text = p.xpath("./text()").get().strip()
    # 下面的条件判断是为了抓取p标签下的 img
    if text == None:
    text = p.xpath(".//img/@src").get()
    # 通过上面的抓取获得的text不为空则存进ptextList
    if text:
    ptextList.append(text)
    这样ptextList里面的内容就是你想要的了


    2楼2019-07-14 16:47
    回复
      获取某个元素下面的所有文本: string("定位标签")


      IP属地:四川3楼2019-10-21 10:35
      回复