11.6. xpath

11.6. xpath
上一页	第 11 章 Scrapy - Python web scraping and crawling framework	下一页

				
>>> response.xpath('//span[@class="time" and @id="news-time"]/text()').extract()
['2017-10-09 09:46']

				
//*[@class='foo' or contains(@class,' foo ') or starts-with(@class,'foo ') or substring(@class,string-length(@class)-3)=' foo']

				
>>> response.xpath('//title/text()').extract_first()
'Netkiller ebook - Linux ebook'

contains() 匹配含有特定字符串的 class

				
//*[contains(@class,'foo')]

				
>>> response.xpath('//ul[contains(@class, "topnews_nlist")]/li/h2/a/@href|//ul[contains(@class, "topnews_nlist")]/li/a/@href').extract()

内容匹配

				
>>> response.xpath('//div[@id="epContentLeft"]/h1[contains(text(),"10")]/text()').extract()
['美联储10月起启动渐进式缩表 维持基准利率不变']

上一页	上一级	下一页
11.5. 下载图片	起始页	第 12 章 Pandas - Python Data Analysis Library