¿por qué curl y wget dan como resultado un 403 prohibido?

Question

Más

starfry

Question

¿por qué curl y wget dan como resultado un 403 prohibido?

Intento descargar un archivo con wget y curl y es rechazado con un error 403 (prohibido).

Puedo ver el archivo usando el navegador web en la misma máquina.

Lo intento de nuevo con el agente de usuario de mi navegador, obtenido por http://www.whatsmyuseragent.com. Hago esto:

wget -U 'Mozilla/5.0 (X11; Linux x86_64; rv:30.0) Gecko/20100101 Firefox/30.0' http://...

y

curl -A 'Mozilla/5.0 (X11; Linux x86_64; rv:30.0) Gecko/20100101 Firefox/30.0' http://...

pero sigue estando prohibido. Qué otras razones puede haber para el 403, y qué maneras puedo alterar los comandos wget y curl para superarlas?

(no se trata de poder obtener el archivo - sé que puedo guardarlo desde mi navegador; se trata de entender por qué las herramientas de línea de comandos funcionan de manera diferente)

actualización

Gracias a todas las excelentes respuestas dadas a esta pregunta. El problema específico que había encontrado era que el servidor estaba comprobando el referrer. Añadiendo esto a la línea de comandos pude obtener el archivo usando curl y wget.

El servidor que comprobaba el referrer rebotó a través de un 302 a otra ubicación que no realizaba ninguna comprobación, por lo que un curl o wget de ese sitio funcionó limpiamente.

Si alguien está interesado, esto surgió porque estaba leyendo esta página para aprender sobre CSS incrustado y estaba tratando de mirar el css del sitio's para un ejemplo. La URL real con la que estaba teniendo problemas era esto y el curl con el que terminé es

curl -L -H 'Referer: http://css-tricks.com/forums/topic/font-face-in-base64-is-cross-browser-compatible/' http://cloud.typography.com/610186/691184/css/fonts.css

y el wget es

 wget --referer='http://css-tricks.com/forums/topic/font-face-in-base64-is-cross-browser-compatible/' http://cloud.typography.com/610186/691184/css/fonts.css

Muy interesante.

starfry

Pregunta editada 29º junio 2014 в 8:58

font-face in base64 is cross browser compatible? - CSS-Tricks - CSS-Tricks

I have been using Chris's snippet for font-face, but I heard that rather including different file types like .ttf, .eot,.woff, we can include font using some

css-tricks.com

Unix y Linux

curl

wget

Solution / Answer

Comunidades relacionadas 1

LinuxerOS

3 055 usuarios

Grupo de LinuxerOS de habla hispana más grande de los últimos tiempos. * El respeto ante TODO * Ayuda sobre GNU/Linux * Consultas sobre Android en general * Deepweb * Hacking Blog Oficial: https://linuxforallsite.wordpress.com

Abrir telegram

Añadir pregunta

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 3 semanas

2

Артур «Апер»

Registrado hace 2 meses

3

Viktor Malyutin

Registrado hace 2 meses

4

Viktor Malyutin

Registrado hace 2 meses

5

Syahputra Zhedenk

Registrado hace 2 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

Lekensteyn · Accepted Answer · 2014-06-28T20:20:07+00:00

Una petición HTTP puede contener más cabeceras que no son establecidas por curl o wget. Por ejemplo:

Cookie: esta es la razón más probable por la que una petición sea rechazada, he visto que esto ocurre en sitios de descarga. Dada una cookie key=val, puedes establecerla con la opción -b key=val (o --cookie key=val) para curl.
Referer (sic): al pulsar un enlace en una página web, la mayoría de los navegadores tienden a enviar la página actual como referrer. No se debe confiar en ello, pero incluso eBay no pudo restablecer una contraseña cuando esta cabecera estaba ausente. Así que sí, puede ocurrir. La opción curl para esto es -e URL y --referer URL.
Autorización: esto se está volviendo menos popular ahora debido a la incontrolable interfaz de usuario del diálogo de nombre de usuario/contraseña, pero todavía es posible. Puede establecerse en curl con la opción -u user:password (o --user user:password).
User-Agent: algunas peticiones darán respuestas diferentes dependiendo del Agente de Usuario. Esto puede usarse de forma positiva (proporcionando la descarga real en lugar de una lista de réplicas) o negativa (rechazando agentes de usuario que no empiecen por Mozilla, o que contengan Wget o curl).

Normalmente puedes utilizar las herramientas de desarrollo de tu navegador (Firefox y Chrome lo soportan) para leer las cabeceras enviadas por tu navegador. Si la conexión no está encriptada (es decir, no utiliza HTTPS), también puedes utilizar un rastreador de paquetes como Wireshark para este propósito.

Además de estas cabeceras, los sitios web también pueden desencadenar algunas acciones entre bastidores que cambian el estado. Por ejemplo, al abrir una página, es posible que se realice una petición en segundo plano para preparar el enlace de descarga. O que se produzca una redirección en la página. Estas acciones suelen hacer uso de Javascript, pero también puede haber un marco oculto que facilite estas acciones.

Si está buscando un método para obtener fácilmente archivos de un sitio de descarga, eche un vistazo a plowdown, incluido en plowshare.