Hay muchas formas excelentes de encontrar información en Internet. Aún así, hay información que es más difícil de encontrar, especialmente si buscas cosas muy específicas. Los servicios de web scraping son una gran herramienta para esto. pila de chatarra es una API que te permite administrar tu propio web scraping.
Un web scraper es una herramienta que visitará un sitio web y tomará una copia de un tipo específico de datos. En lugar de revisar todo manualmente, simplemente proporcione los datos del raspador para que los busque y éste hará todo el trabajo. Scrapestack es más poderoso que los raspadores de sitios web gratuitos que existen. Proporciona mayor seguridad, mayor confiabilidad y un servidor de primera línea.
Empezando
Empezar con pila de chatarra es muy fácil. Primero, deberá configurar una cuenta. Una vez que tenga una cuenta, se le proporcionará una clave API. Esto es lo que utilizará para acceder a la API, como era de esperar. Luego puede utilizar la URL de destino para extraer datos de cualquier sitio web que desee.
http://api.scrapestack.com/scrape? access_key=YOUR_ACCESS_KEY&url=https://microsoft.com
En el ejemplo anterior, estarías raspando el sitio web de Microsoft. Todo lo que necesitas hacer es colocar tu clave API en el lugar apropiado y cambiar el dominio al final. Luego se le proporcionará el contenido de la página sin estilos JavaScrip ni CSS.
Hay otros parámetros que puedes agregar a esa URL de destino para refinar aún más las cosas.
|
[Requerido] Especifique su clave de acceso API única para autenticarse con la API. Su clave de acceso API se puede encontrar en el panel de su cuenta. |
|
[Requerido] Especifique la URL de la página web que desea extraer. |
|
[opcional] Establecer en |
|
[opcional] Establecer |
|
[opcional] Especifique el código de 2 letras del país que desea que utilicemos como geolocalización proxy para su solicitud de API de scraping. Los países admitidos difieren según el tipo de proxy; consulte la Ubicaciones de proxy sección para más detalles. |
|
[opcional] Establecer |
Precios
Hay varios niveles de precios para pila de chatarra. El nivel gratuito ofrece 10.000 solicitudes de API, servidores proxy estándar y soporte limitado. El nivel Básico agrega 250.000 solicitudes API, cifrado HTTPS, solicitudes simultáneas y soporte ilimitado. Básico cuesta $19,99 al mes. Pasar al nivel Profesional le otorga 1.000.000 de solicitudes, y luego el nivel Empresarial llega hasta 3.000.000 de solicitudes. Cuestan $79,99 y $149,99 al mes, respectivamente.