Scrapy - 定义项目

描述

项目是用于收集从网站抓取的数据的容器。您必须通过定义项目来启动蜘蛛。要定义项目,请编辑目录 first_scrapy(自定义目录)下的 items.py 文件。items.py 如下所示 −

import scrapy

class First_scrapyItem(scrapy.Item):
    # 在此处定义项目的字段,例如:
    # name = scrapy.Field()

MyItem 类继承自 Item,其中包含 Scrapy 已为我们构建的多个预定义对象。例如,如果您想从网站中提取名称、URL 和描述,则需要为这三个属性中的每一个定义字段。

因此,让我们添加我们想要收集的那些项目−

from scrapy.item import Item, Field  

class First_scrapyItem(scrapy.Item): 
   name = scrapy.Field() 
   url = scrapy.Field() 
   desc = scrapy.Field()