gfonts/ger_gfonts/ger_gfonts/spiders/start_urls_spider.py

import scrapy
#import pandas
from scrapy.linkextractors import LinkExtractor
#from utility.countries import getEuTlds
from utility import countries

class firstSpider(scrapy.Spider):
    name = "start_urls"

    def __init__(self):
        eu_tlds = countries.getEuTlds()
        self.start_urls = map(lambda t: 'https://www.google.com/search?q=inurl%3A' + t, eu_tlds.keys())

    def parse(self, response):
        xlink = LinkExtractor()
        for link in xlink.extract_links(response):
            print(link)
Improve gfonts spider start working on start_urls from search result spider 2022-02-06 14:39:12 +01:00			`import scrapy`
			`#import pandas`
			`from scrapy.linkextractors import LinkExtractor`
			`#from utility.countries import getEuTlds`
			`from utility import countries`

			`class firstSpider(scrapy.Spider):`
			`name = "start_urls"`

			`def __init__(self):`
			`eu_tlds = countries.getEuTlds()`
			`self.start_urls = map(lambda t: 'https://www.google.com/search?q=inurl%3A' + t, eu_tlds.keys())`

			`def parse(self, response):`
			`xlink = LinkExtractor()`
			`for link in xlink.extract_links(response):`
			`print(link)`