Schraap websites voor waardevolle gegevens met de Scrapestack API

Er zijn tal van geweldige manieren om informatie op internet te vinden. Toch is er bepaalde informatie die moeilijker te vinden is, vooral als je naar heel specifieke dingen zoekt. Webscraping-services zijn hiervoor een geweldig hulpmiddel. Schraapstapel is een API waarmee u uw eigen webscraping kunt beheren.

Een webschraper is een tool die een website bezoekt en een kopie maakt van een specifiek type gegevens. In plaats van dat u alles handmatig doorloopt, geeft u gewoon de schrapergegevens op waarnaar u moet zoeken en deze zal al het werk doen. Scrapestack is krachtiger dan de gratis website-scrapers die er zijn. Het biedt betere beveiliging, betere betrouwbaarheid en een eersteklas server.

Aan de slag

Beginnen met Schraapstapel is heel gemakkelijk. Eerst moet u een account instellen. Zodra u een account heeft, ontvangt u een API-sleutel. Dit is wat u zult gebruiken om toegang te krijgen tot de API, niet verrassend. U kunt vervolgens de doel-URL gebruiken om gegevens van elke gewenste website te schrapen.

http://api.scrapestack.com/scrape? access_key=YOUR_ACCESS_KEY&url=https://microsoft.com

In het bovenstaande voorbeeld zou je de website van Microsoft schrapen. Het enige dat u hoeft te doen, is uw API-sleutel op de juiste plek plaatsen en aan het einde het domein wijzigen. U krijgt dan de inhoud van de pagina zonder JavaScrip- en CSS-stijlen.

Er zijn nog andere parameters die u aan die doel-URL kunt toevoegen om de zaken verder te verfijnen.

access_key

[Vereist] Geef uw unieke API-toegangssleutel op om te authenticeren met de API. Uw API-toegangssleutel vindt u in uw accountdashboard.

url

[Vereist] Geef de URL op van de webpagina die u wilt schrapen.

render_js

[optioneel] Instellen op 0 (uit, standaard) of 1 (aan) afhankelijk van het al dan niet weergeven van JavaScript op de doelwebpagina. JavaScript-weergave wordt gedaan met behulp van een headless browser van Google Chrome.

keep_headers

[optioneel] Instellen 0 (uit, standaard) of 1 (aan) afhankelijk van of u momenteel actieve HTTP-headers al dan niet met uw API-verzoek naar de doel-URL wilt sturen en de API deze headers samen met uw API-antwoord wilt laten retourneren.

proxy_location

[optioneel] Geef de tweeletterige code op van het land dat u ons wilt geven als proxy-geolocatie voor uw scraping-API-verzoek. Ondersteunde landen verschillen per proxytype. Raadpleeg de Proxylocaties sectie voor details.

premium_proxy

[optioneel] Instellen 0 (uit, standaard) of 1 (aan) afhankelijk van het al dan niet inschakelen van premium residentiële proxy's voor uw scrapingverzoek. Houd er rekening mee dat één premium proxy-API-verzoek wordt geteld als 25 API-verzoeken.

Prijzen

Er zijn verschillende prijsniveaus voor Schraapstapel. De gratis laag biedt 10.000 API-verzoeken, standaardproxy's en beperkte ondersteuning. De Basic-laag voegt 250.000 API-verzoeken, HTTPS-encryptie, gelijktijdige verzoeken en onbeperkte ondersteuning toe. Basis kost $ 19,99 per maand. Als u doorgaat naar het Professional-niveau, krijgt u 1.000.000 verzoeken, en vervolgens gaat het Business-niveau helemaal omhoog naar 3.000.000 verzoeken. Ze kosten respectievelijk $ 79,99 en $ 149,99 per maand.

Wij danken scrapestack voor het sponsoren van dit bericht en het leveren van de inhoud. Onze sponsors helpen ons bij het betalen van de vele ckosten die verband houden met het draaien van XDA, inclusief serverkosten, fulltime ontwikkelaars, nieuwsschrijvers en nog veel meer. Hoewel je mogelijk gesponsorde inhoud (die altijd als zodanig wordt gelabeld) naast Portal-inhoud ziet, is het Portal-team op geen enkele manier verantwoordelijk voor deze berichten. Gesponsorde inhoud, advertenties en XDA Depot worden volledig beheerd door een apart team. XDA zal nooit zijn journalistieke integriteit in gevaar brengen door geld te accepteren om positief over een bedrijf te schrijven, of onze meningen of standpunten op welke manier dan ook te veranderen. Onze mening is niet te koop.