newechoes/scrapy操作.md at 0d48cc85918ba9a49210073cb7db16ea3ce2267c

lsy/newechoes

Template

lsy 0d48cc8591 统一组件使用astro,优化css样式，新增文章，优化文章格式

2025-04-19 16:19:39 +08:00

title

date

创建工程

scrapy startproject (projectname)

scrapy genspider (spidename) (url)

parse 中的 response 解析想要使用数据,必须使用 extract()提取数据 extract():返回列表 extract_first():返回一个数据
创建项目对象,将数据放入项目
用 yield 将项目传入管道

class 类名():
    def process_item(self, item, spider):
        item #数据
        spider #爬虫
        return item #如果不return下一个管道收不到数据

scrapy crawl (spidename)
默认会输出工程的默认信息

‍