Zbieraj strony internetowe w poszukiwaniu cennych danych za pomocą interfejsu API Scrapestack

Istnieje wiele świetnych sposobów wyszukiwania informacji w Internecie. Mimo to istnieją pewne informacje, które trudniej jest znaleźć, zwłaszcza jeśli szukasz bardzo konkretnych rzeczy. Usługi skrobania sieci są do tego doskonałym narzędziem. Złomowisko to interfejs API, który pozwala zarządzać własnym skrobaniem stron internetowych.

Skrobak sieciowy to narzędzie, które odwiedzi witrynę internetową i pobierze kopię określonego rodzaju danych. Zamiast przeglądać wszystko ręcznie, po prostu podaj dane skrobaka, którego ma szukać, a on wykona całą pracę. Scrapestack jest potężniejszy niż dostępne bezpłatne skrobaki do stron internetowych. Zapewnia większe bezpieczeństwo, większą niezawodność i najwyższej klasy serwer.

Pierwsze kroki

Pierwsze kroki Złomowisko jest bardzo łatwe. Najpierw musisz założyć konto. Po założeniu konta otrzymasz klucz API. To jest to, czego będziesz używać, aby uzyskać dostęp do API, co nie jest zaskakujące. Następnie możesz użyć docelowego adresu URL, aby pobrać dane z dowolnej witryny internetowej.

http://api.scrapestack.com/scrape? access_key=YOUR_ACCESS_KEY&url=https://microsoft.com

W powyższym przykładzie skrobałbyś witrynę Microsoftu. Wystarczy, że w odpowiednim miejscu umieścisz swój klucz API i na koniec zmienisz domenę. Otrzymasz wówczas zawartość strony bez stylów JavaScrip i CSS.

Istnieją inne parametry, które możesz dodać do docelowego adresu URL, aby jeszcze bardziej udoskonalić elementy.

access_key

[Wymagany] Określ swój unikalny klucz dostępu do interfejsu API, aby uwierzytelnić się w interfejsie API. Twój klucz dostępu do API znajdziesz w panelu swojego konta.

url

[Wymagany] Podaj adres URL strony internetowej, którą chcesz zeskrobać.

render_js

[opcjonalnie] Ustaw na 0 (wyłączone, domyślne) lub 1 (on) w zależności od tego, czy na docelowej stronie internetowej ma być renderowany JavaScript. Renderowanie JavaScript odbywa się za pomocą bezgłowej przeglądarki Google Chrome.

keep_headers

[opcjonalnie] Ustaw 0 (wyłączone, domyślne) lub 1 (on) w zależności od tego, czy wysłać aktualnie aktywne nagłówki HTTP do docelowego adresu URL z żądaniem API i czy interfejs API zwróci te nagłówki wraz z odpowiedzią API.

proxy_location

[opcjonalnie] Podaj 2-literowy kod kraju, który chcesz nam przekazać jako geolokalizację proxy dla Twojego żądania API skrobania. Obsługiwane kraje różnią się w zależności od typu serwera proxy, zapoznaj się z sekcją Lokalizacje proxy sekcję ze szczegółami.

premium_proxy

[opcjonalnie] Ustaw 0 (wyłączone, domyślne) lub 1 (wł.) w zależności od tego, czy włączyć serwery proxy premium dla Twojego żądania skrobania. Należy pamiętać, że pojedyncze żądanie API premium proxy jest liczone jako 25 żądań API.

cennik

Istnieje kilka poziomów cenowych Złomowisko. Warstwa bezpłatna oferuje 10 000 żądań API, standardowe serwery proxy i ograniczone wsparcie. Warstwa podstawowa dodaje 250 000 żądań API, szyfrowanie HTTPS, równoczesne żądania i nieograniczone wsparcie. Podstawowy kosztuje 19,99 dolarów miesięcznie. Przejście na poziom Professional zapewnia 1 000 000 żądań, a poziom Business osiąga aż do 3 000 000 żądań. Kosztują odpowiednio 79,99 dolarów i 149,99 dolarów miesięcznie.

Dziękujemy scrapestack za sponsorowanie tego postu i dostarczenie treści. Nasi sponsorzy pomagają nam płacić za wiele ckoszty związane z prowadzeniem XDA, w tym koszty serwera, pełnoetatowi programiści, autorzy wiadomości i wiele innych. Chociaż obok treści Portalu możesz zobaczyć treści sponsorowane (które zawsze będą oznaczone jako takie), zespół Portalu nie ponosi w żaden sposób odpowiedzialności za te posty. Treści sponsorowane, reklamy i XDA Depot są zarządzane całkowicie przez odrębny zespół. XDA nigdy nie naruszy swojej rzetelności dziennikarskiej, przyjmując pieniądze za pozytywne pisanie o firmie lub w jakikolwiek sposób zmieniając nasze opinie lub poglądy. Naszych opinii nie można kupić.