Изтеглете уебсайтове за ценни данни с API на Scrapestack

Има много страхотни начини за намиране на информация в интернет. Все пак има информация, която е по-трудна за намиране, особено ако търсите много конкретни неща. Услугите за уеб скрапинг са чудесен инструмент за това. Scrapestack е API, който ви позволява да управлявате своя собствена уеб скрапинг.

Уеб скреперът е инструмент, който ще посети уебсайт и ще направи копие на определен тип данни. Вместо да минавате през всичко ръчно, просто дайте на скрепера да търси данни и той ще свърши цялата работа. Scrapestack е по-мощен от безплатните скрепери за уебсайтове. Той осигурява по-добра сигурност, по-добра надеждност и първокласен сървър.

Приготвяме се да започнем

Първи стъпки с Scrapestack е много лесно. Първо, ще трябва да настроите акаунт. След като имате акаунт, ще ви бъде даден API ключ. Това е, което ще използвате за достъп до API, което не е изненадващо. След това можете да използвате целевия URL адрес, за да изчерпите данни от всеки уебсайт, който искате.

http://api.scrapestack.com/scrape? access_key=YOUR_ACCESS_KEY&url=https://microsoft.com

В примера по-горе вие ​​ще изчерпвате уебсайта на Microsoft. Всичко, което трябва да направите, е да поставите вашия API ключ на подходящото място и да промените домейна накрая. След това ще ви бъде дадено съдържанието на страницата без JavaScrip и CSS стилове.

Има други параметри, които можете да добавите към този целеви URL адрес, за да прецизирате допълнително нещата.

access_key

[Задължително] Посочете своя уникален ключ за достъп до API, за да се удостоверите с API. Вашият ключ за достъп до API може да бъде намерен в таблото за управление на вашия акаунт.

url

[Задължително] Посочете URL адреса на уеб страницата, която искате да скрапирате.

render_js

[по избор] Задаване на 0 (изключено, по подразбиране) или 1 (включено) в зависимост от това дали да изобрази JavaScript на целевата уеб страница. Изобразяването на JavaScript се извършва с помощта на браузър без глава на Google Chrome.

keep_headers

[по избор] Комплект 0 (изключено, по подразбиране) или 1 (включено) в зависимост от това дали да изпратите активни в момента HTTP заглавки към целевия URL адрес с вашата заявка за API и дали API да върне тези заглавки заедно с вашия отговор на API.

proxy_location

[по избор] Посочете 2-буквения код на държавата, която искате да ни предоставите като прокси геолокация за вашата заявка за API за сканиране. Поддържаните държави се различават според типа прокси, моля, вижте Прокси местоположения раздел за подробности.

premium_proxy

[по избор] Комплект 0 (изключено, по подразбиране) или 1 (включено) в зависимост от това дали да активирате премиум жилищни проксита за вашата заявка за извличане. Моля, обърнете внимание, че една заявка за първокласен прокси API се брои като 25 заявки за API.

Ценообразуване

Има няколко ценови нива за Scrapestack. Безплатното ниво предлага 10 000 API заявки, стандартни проксита и ограничена поддръжка. Основното ниво добавя 250 000 API заявки, HTTPS криптиране, едновременни заявки и неограничена поддръжка. Basic струва $19,99 на месец. Издигането до професионално ниво ви дава 1 000 000 заявки, а след това бизнес ниво достига до 3 000 000 заявки. Те струват съответно $79,99 и $149,99 на месец.

Благодарим на scrapestack за спонсорирането на тази публикация и предоставянето на съдържанието. Нашите спонсори ни помагат да платим за много costs, свързани с работата на XDA, включително разходи за сървър, разработчици на пълен работен ден, автори на новини и много други. Въпреки че може да видите спонсорирано съдържание (което винаги ще бъде обозначено като такова) заедно със съдържанието на портала, екипът на портала по никакъв начин не носи отговорност за тези публикации. Спонсорираното съдържание, рекламата и XDA Depot се управляват изцяло от отделен екип. XDA никога няма да компрометира своята журналистическа почтеност, като приема пари, за да пише благосклонно за компания или да променя нашите мнения или възгледи по някакъв начин. Нашето мнение не може да се купи.