+ All Categories
Home > Documents > GNU Wget 1 16

GNU Wget 1 16

Date post: 15-Mar-2023
Category:
Upload: independent
View: 0 times
Download: 0 times
Share this document with a friend
59
7/3/2015 GNU Wget 1.16.2 Manual http://www.gnu.org/software/wget/manual/wget.html#Invoking 1/59 GNU Wget 1.16.2 Manual Tabla de contenido 1 Información general 2 Invocación 2.1 URL Formato 2.2 Opción Sintaxis 2.3 Opciones básicas de inicio 2,4 de registro de entrada y Opciones de archivo 2.5 Opciones de descarga 2.6 Opciones de directorio 2.7 Opciones de HTTP 2.8 HTTPS (SSL / TLS) Opciones 2.9 Opciones de FTP 2.10 recursivas Opciones de recuperación 2.11 recursiva Aceptar / Rechazar Opciones Status 2.12 Salir 3 recursiva Descargar 4 siguientes enlaces 4.1 Hosts Spanning 4.2 Tipos de Archivos 4.3 Límites basado en directorios 4.4 Enlaces relativos 4.5 siguientes enlaces FTP 5 de Sellado de Tiempo Uso 5.1 de Sellado de Tiempo 5.2 HTTP de sellado de tiempo Internos 5.3 FTP de sellado de tiempo Internos 6 Puesta en marcha del archivo 6.1 wgetrc Ubicación 6.2 Sintaxis wgetrc 6.3 Comandos wgetrc 6.4 Muestra wgetrc 7 Ejemplos 7.1 Uso simple 7.2 Uso avanzado 7.3 Uso muy avanzada 8 Varios 8.1 La representación 8.2 Distribución Sitio Web 8.3 8.4 Listas de correo Lista Primaria Lista Avisos de errores Listas obsoletos 8.5 Internet Relay Chat 8.6 Informes de fallos 8.7 Portabilidad 8.8 Señales 9 Apéndices Exclusión 9.1 Robot 9.2 Consideraciones de seguridad 9.3 Colaboradores Apéndice A Copiar este manual A.1 GNU Free Documentation License Índice Concepto Siguiente: Información general , anterior: (dir) , Up: (dir) [ Contenido ][ Índice ] Wget 1.16.2 Este archivo documenta la utilidad GNU Wget para descargar los datos de la red.
Transcript

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 1/59

GNU Wget 1.16.2 ManualTabla de contenido

1 Información general2 Invocación

2.1 URL Formato2.2 Opción Sintaxis2.3 Opciones básicas de inicio2,4 de registro de entrada y Opciones de archivo2.5 Opciones de descarga2.6 Opciones de directorio2.7 Opciones de HTTP2.8 HTTPS (SSL / TLS) Opciones2.9 Opciones de FTP2.10 recursivas Opciones de recuperación2.11 recursiva Aceptar / Rechazar OpcionesStatus 2.12 Salir

3 recursiva Descargar4 siguientes enlaces

4.1 Hosts Spanning4.2 Tipos de Archivos4.3 Límites basado en directorios4.4 Enlaces relativos4.5 siguientes enlaces FTP

5 de Sellado de TiempoUso 5.1 de Sellado de Tiempo5.2 HTTP de sellado de tiempo Internos5.3 FTP de sellado de tiempo Internos

6 Puesta en marcha del archivo6.1 wgetrc Ubicación6.2 Sintaxis wgetrc6.3 Comandos wgetrc6.4 Muestra wgetrc

7 Ejemplos7.1 Uso simple7.2 Uso avanzado7.3 Uso muy avanzada

8 Varios8.1 La representación8.2 DistribuciónSitio Web 8.38.4 Listas de correo

Lista PrimariaLista Avisos de erroresListas obsoletos

8.5 Internet Relay Chat8.6 Informes de fallos8.7 Portabilidad8.8 Señales

9 ApéndicesExclusión 9.1 Robot9.2 Consideraciones de seguridad9.3 Colaboradores

Apéndice A Copiar este manualA.1 GNU Free Documentation License

Índice Concepto

Siguiente: Información general , anterior: (dir) , Up: (dir) [ Contenido ] [ Índice ]

Wget 1.16.2Este archivo documenta la utilidad GNU Wget para descargar los datos de la red.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 2/59

Copyright © 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011 Free SoftwareFoundation, Inc.

Se concede permiso para copiar, distribuir y / o modificar este documento bajo los términos de la licencia de documentaciónlibre GNU, versión 1.3 o cualquier otra versión posterior publicada por la Free Software Foundation; sin secciones invariantes,sin textos de cubierta delantera y sin Contraportada­Textos. Una copia de la licencia está incluida en la sección titulada "GNUFree Documentation License".

• Descripción general : Características de Wget.• Invocación : Wget argumentos de la línea de comandos.• Recursivo Descargar : Descarga de páginas vinculadas.• Enlaces Siguiendo : Los métodos disponibles de enlaces que persiguen.• Sellado de Tiempo : Reflejo de acuerdo con sellos de tiempo.• Puesta en marcha del archivo : Archivo de inicialización de Wget.• Ejemplos : Ejemplos de uso.• Varios : Las cosas que no encaja en ninguna otra parte.• Apéndices : Algunas referencias útiles.• Copia de este manual : Usted puede dar copias de este manual.• Índice Concepto : Los temas tratados en este manual.

Siguiente: Invocación , Previous: Top , Up: Top [ Índice ] [ Índice ]

1 Información general

GNU Wget es una utilidad gratuita para su descarga no interactiva de archivos desde la Web. Soporta HTTP , HTTPS y FTPprotocolos, así como la recuperación a través de HTTP proxy.

Este capítulo es una visión parcial de las características de Wget.

Wget no es interactivo, lo que significa que puede funcionar en segundo plano, mientras que el usuario no ha iniciadosesión. Esto le permite iniciar una recuperación y desconecta del sistema, dejando Wget terminar la obra. Por el contrario,la mayoría de los navegadores web requieren la presencia constante de usuario, que puede ser un gran obstáculo altransferir una gran cantidad de datos.Wget puede seguir enlaces en HTML , XHTML y CSS páginas, para crear versiones locales de los sitios web remotos,recrear totalmente la estructura de directorios del sitio original. Esto se refiere a veces como "descarga recursiva."Mientras que hace que, Wget respeta la Exclusión Robot Standard (/robots.txt). Wget puede ser instruido para convertirlos enlaces en los archivos descargados para apuntar a los archivos locales, para verlas sin conexión.Archivo de coincidencia de nombres comodín y mirroring recursiva de directorios están disponibles cuando se recuperana través de FTP . Wget puede leer la información de sello de tiempo dado por ambos HTTP y FTP servidores, y almacenarlalocalmente. Así Wget puede ver si el archivo remoto ha cambiado desde la última recuperación y recuperarautomáticamente la nueva versión si tiene. Esto hace que Wget adecuado para la creación de reflejo de FTP sitios, asícomo páginas de inicio.Wget ha sido diseñado para la solidez a través de conexiones de red lentas o inestables; si falla una descarga debido a unproblema en la red, que se mantendrá hasta que se ha de volver a intentar recuperar todo el archivo. Si el servidor soportaregetting, se instruirá al servidor para continuar la descarga desde donde lo dejó.Wget soporta servidores proxy, lo que puede aligerar la carga de la red, acelerar la recuperación y facilitar el accesodetrás de cortafuegos. Wget utiliza el pasivo FTP descarga por defecto, activa FTP ser una opción.Wget soporta IP versión 6, la próxima generación de IP. IPv6 es detectado en tiempo de compilación, y se puededesactivar en construir o tiempo de ejecución. Los binarios construidos con trabajo de apoyo IPv6 bien tanto de sólo IPv4y duales entornos familiares.Las características incorporadas ofrecen mecanismos para sintonizar en qué vínculos desea seguir (ver siguientes enlaces).El progreso de las descargas individuales se traza utilizando un medidor de progreso. Descargas interactivos sonrastreados utilizando un "termómetro" de calibre de estilo, mientras que los no interactivos se trazan con puntos, cadapunto representa una cantidad fija de los datos recibidos (1 KB de forma predeterminada). De cualquier calibre se puedepersonalizar con sus preferencias.La mayor parte de las características son totalmente configurables, ya sea a través de las opciones de línea de comandos,o mediante el archivo de inicialización .wgetrc(Ver archivo de inicio ). Wget le permite definir mundiales archivos deinicio (/ Usr / local / etc / wgetrc localespor defecto) para la configuración del sitio. También puede especificar laubicación de un archivo de inicio con la opción ­config.Por último, GNU Wget es software libre. Esto significa que todo el mundo puede utilizarlo, redistribuirlo y / omodificarlo bajo los términos de la Licencia Pública General de GNU, según lo publicado por la Free SoftwareFoundation (consulte el archivoCOPIA que vinieron con GNU Wget, para más detalles).

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 3/59

Siguiente: Descargar recursiva , Anterior: Información general , Up: Top [ Índice ] [ Índice ]

2 Invocación

Por defecto, Wget es muy sencillo de invocar. La sintaxis básica es:

wget [ opción ] ... [ URL ] ...

Wget simplemente descargar toda la URL s especificado en la línea de comandos. URL es un localizador de recursos uniforme ,como se define a continuación.

Sin embargo, es posible que desee cambiar algunos de los parámetros por defecto de Wget. Puede hacerlo de dos maneras: deforma permanente, añadiendo el comando adecuado para.wgetrc(Ver archivo de Inicio ), o especificar en la línea de comandos.

• URL Formato : • Sintaxis Opción : • Opciones de base de inicio : • Tala y archivos de entrada Opciones : • Opciones de descarga : • Opciones de directorio : • HTTP Opciones : • HTTPS (SSL / TLS) Opciones : • Opciones de FTP : • Opciones recursiva de recuperación : • Recursivo Aceptar / Rechazar Opciones : • Estado de salida :

: Siguiente Sintaxis Opción , Previous: Invocación , Up: Invocando [ Contenidos ] [ Índice ]

2.1 URL Formato

URL es un acrónimo de Uniform Resource Locator. Un localizador uniforme de recursos es una representación de cadenacompacta para un recurso disponible a través de Internet. Wget reconoce la URL sintaxis según RFC1738 . Esta es la forma másutilizada (corchetes denotan piezas opcionales):

http: // host [: puerto] / directorio / archivoftp: // host [: puerto] / directorio / archivo

También puede codificar su nombre de usuario y contraseña en un URL :

ftp: // usuario: contraseña @ host / pathhttp: // usuario: contraseña @ host / path

De cualquier usuario o contraseña , o ambos, pueden ser dejados de lado. Si se omite, ya sea el HTTP nombre de usuario ocontraseña, no se enviará ninguna autenticación. Si se omite la FTP nombre de usuario, 'anónimoSe utilizará ". Si se omite la FTPcontraseña, su dirección de correo electrónico se suministra como una contraseña predeterminada. 1

Nota importante : si especifica una contraseña que contiene el URL en la línea de comandos, el nombre de usuario y contraseñaserán claramente visibles para todos los usuarios en el sistema, a modo de ps . En los sistemas multi­usuario, este es un granriesgo para la seguridad. Para trabajar alrededor de ella, utilice wget ‐i ‐ y alimentar la URL s a la entrada estándar de Wget,cada uno en una línea separada, terminado por Cd .

Puede codificar los caracteres no seguros en una URL como '% Xy', xy ser la representación hexadecimal del carácter ASCII valor.Algunos personajes inseguros comunes incluyen '%"(Citado como"25%'),':"(Citado como"% 3A'), Y'@"(Citado como"40%').Consulte RFC1738 para obtener una lista completa de los caracteres no seguros.

Wget también es compatible con el tipo de función para FTP URL s. Por defecto, FTP documentos se recuperan en el modobinario (tipo 'yo'), Lo que significa que se descargan sin cambios. Otro modo útil es la 'un'( ASCII modo), que convierte losdelimitadores de línea entre los diferentes sistemas operativos, y es por tanto útil para archivos de texto. He aquí un ejemplo:

ftp: // host / directorio / archivo; tipo = a

Dos variantes alternativas de URL especificación también son compatibles, por razones históricas (histéricos?) y su usowidespreaded.

FTP sintaxis ­sólo (apoyado por NcFTP ):

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 4/59

host: / dir / archivo

HTTP ­sólo sintaxis (introducido por Netscape ):

host [: puerto] / dir / archivo

Estas dos formas alternativas están en desuso, y pueden dejar de ser apoyado en el futuro.

Si usted no entiende la diferencia entre estas notaciones, o no sabe cuál usar, sólo tiene que utilizar el formato ordinario llanuraque utiliza con su navegador favorito, como Lynx o Netscape .

Siguiente: Opciones básicas de inicio , Previous: URL Formato , Up: Invocando [ Contenidos ] [ Índice ]

2.2 Opción Sintaxis

Desde Wget usa GNU getopt para procesar argumentos de línea de comandos, cada opción tiene una forma larga junto con elcorto. Las opciones largas son más convenientes para recordar, pero toman tiempo para escribir. Usted puede mezclarlibremente diferentes estilos de opción, o especificar opciones después de los argumentos de la línea de comandos. De estamanera usted puede escribir:

wget ‐r ‐‐tries = 10 http://fly.srk.fer.hr/ ‐o registro

El espacio entre la opción de aceptar un argumento y el argumento puede ser omitido. En lugar de 'registro ‐o'Se puedeescribir'‐olog'.

Usted puede poner varias opciones que no requieren argumentos juntos, como:

wget ‐drc URL

Esto es completamente equivalente a:

wget ‐c ‐d ‐r URL

Dado que las opciones se pueden especificar después de los argumentos, puede terminar con '‐'. Así que el siguiente intentarádescargar URL '‐x', La falta de presentación de informes log:

wget ‐o log ‐ ‐x

Las opciones que acepten listas separadas por comas todos respetan la convención de que la especificación de una lista vacíaborra su valor. Esto puede ser útil para limpiar el.wgetrcajustes. Por ejemplo, si su.wgetrc establece exclude_directories a/Cgi‐bin, El siguiente ejemplo primero restablecerla y, a continuación, configurarlo para excluir / ~ Nadie y / ~ Alguien.También puede borrar las listas de.wgetrc (Ver Sintaxis wgetrc ).

wget ‐X '' ‐X / ~ nadie, / ~ alguien

La mayoría de las opciones que no aceptan argumentos son booleanos opciones, llamada así porque su estado puede sercapturada con una o sí­no­variable ("booleano"). Por ejemplo, '‐‐follow‐ftp'Dice Wget seguir enlaces FTP de archivos HTMLy, por otro lado,'‐‐no‐glob'Dice no realizar archivo englobamiento de URL de FTP. Una opción booleana es ya sea afirmativa onegativa (comenzando con '‐‐no'). Todas estas opciones tienen varias propiedades.

A menos que se indique lo contrario, se supone que el comportamiento por defecto es el contrario de lo que logra la opción. Porejemplo, la existencia documentada de '‐‐follow‐ftp'Supone que lo habitual es no seguir enlaces FTP de páginas HTML.

Opciones afirmativas pueden ser negados anteponiendo la '‐‐no‐'Al nombre de la opción; Opciones negativas pueden sernegados por la omisión de la '‐‐no‐'Prefijo. Esto puede parecer superfluo, si el valor predeterminado para la opción afirmativaes la de no hacer algo, entonces ¿por qué proporcionan una manera de convertir explícitamente que fuera? Pero el archivo deinicio puede de hecho cambiar el valor predeterminado. Por ejemplo, utilizando follow_ftp = ON en .wgetrchace Wget seguirenlaces FTP por defecto, y el uso de '‐‐no‐follow‐ftp"Es la única manera de restaurar los valores de fábrica de la línea decomandos.

Siguiente: madereras y de archivos de entrada Opciones , Previous: Opción de sintaxis , Up: Invocando [ Contenidos ] [ Índice]

2.3 Opciones básicas de inicio

'‐V''‐‐version'

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 5/59

Muestra la versión de Wget.

'‐h''‐‐ayuda'

Muestra un mensaje de ayuda que describe todas las opciones de línea de comandos de Wget.

'‐b''‐‐background'

Ir a fondo inmediatamente después del inicio. Si no se especifica un archivo de salida a través de la '‐o', La salida seredirige a wget‐log.

'‐e comando''‐‐execute comando'

Ejecutar comando como si fuera una parte de.wgetrc (Ver archivo de inicio ). Un comando así invocado se ejecutarádespués de los comandos.wgetrc, Dando así prioridad sobre ellos. Si necesita especificar más de un comando wgetrc,utilizar varias instancias de '‐e'.

Siguiente: Opciones de descarga , Previous: Opciones básicas de inicio , Up: Invocando [ Contenidos ] [ Índice ]

2,4 de registro de entrada y Opciones de archivo

'‐o logfile''‐‐output‐file = archivo de registro'

Registrar todos los mensajes de archivo de registro . Los mensajes normalmente se presentan en el error estándar.

'‐un archivo de registro''‐‐append‐output = archivo de registro'

Anexar al archivo de registro . Esto es lo mismo que "‐o', Sólo se añade a logfile lugar de sobrescribir el archivo deregistro de edad. Si el archivo de registro no existe, se crea un nuevo archivo.

'‐d''‐‐debug'

Activar la salida de depuración, lo que significa diversa información importante para los desarrolladores de Wget si nofunciona correctamente. El administrador del sistema puede haber elegido para compilar wget sin el apoyo de depuración,en cuyo caso "‐d"No va a funcionar. Tenga en cuenta que compilar con soporte de depuración es siempre seguro­Wgetcompilado con el apoyo de depuración será no imprimir cualquier información de depuración menos que se solicite con '‐d'. Ver Informar de fallos , para obtener más información sobre cómo utilizar '‐d'Para el envío de informes de errores.

'‐q''‐‐quiet'

Desactivar la salida de Wget.

'‐v''‐‐verbose'

Gire la salida detallada, con todos los datos disponibles. La salida predeterminada es detallado.

'‐nv''‐‐no‐verbose'

Apague detallado sin estar completamente tranquilo (uso '‐q"Para eso), lo que significa que los mensajes de error y lainformación básica todavía se imprimen.

'‐‐Informe velocidad = tipo'

Ancho de banda de salida como tipo . El único valor aceptado es 'pedacitos'.

'‐i archivo''‐‐input‐file = fichero'

Leer URL s de un local o externo de archivos . Si '‐'Se especifica como archivo , URL s se lee de la entrada estándar. (Use

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 6/59

'./‐'Para leer desde un archivo llamado literalmente'‐'.)

Si se utiliza esta función, no URL s tiene que estar presente en la línea de comandos. Si hay URL s tanto en la línea decomandos y en un archivo de entrada, los de las líneas de mando será el primero en ser recuperados. Si '‐‐force‐html'Nose especifica, el archivo debe consistir en una serie de direcciones URL, uno por línea.

Sin embargo, si especifica "‐‐force‐html', El documento será considerado como'html'. En ese caso, es posible que tengaproblemas con vínculos relativos, que se puede resolver, ya sea mediante la adición de <base href = " url "> a losdocumentos o especificando '‐‐base = url'En la línea de comandos.

Si el archivo es uno externo, el documento será tratado automáticamente como 'html'Si el Content­Type coincide'text /html'. Además, el archivo de ubicación s 'se utilizará implícitamente como base href si no se ha especificado.

'‐F''‐‐force‐html'

Cuando la entrada se lee de un archivo, forzarlo a ser tratado como un HTML archivo. Esto le permite recuperar losvínculos relativos desde existente HTML archivos en el disco local, añadiendo <base href = " url "> de HTML , o el usode la '‐‐base'Opción de línea de comandos.

'‐B URL''‐‐base = URL'

Resuelve vínculos relativos utilizando URL como punto de referencia, al leer los enlaces desde un archivo HTMLespecificarse a través de la '‐yo'/'‐‐input‐file'Opción (junto con'‐‐force‐html', O cuando el archivo de entrada se fue abuscar de forma remota desde un servidor y lo describió como HTML ). Esto es equivalente a la presencia de una BASEetiqueta en el HTML archivo de entrada, con URL como el valor para el href atributo.

Por ejemplo, si especifica "http: //foo/bar/a.html'De URL , y Wget lee '../baz/b.html'Del archivo de entrada, que seresolvería a'http: //foo/baz/b.html'.

'‐‐config = ARCHIVO'

Especifique la ubicación de un archivo de inicio que desea utilizar.

Siguiente: Directorio de Opciones , Previous: Logging y de archivos de entrada Opciones , Up: Invocando [ Contenidos ] [Índice ]

2.5 Opciones de descarga

'‐‐bind‐address = DIRECCIÓN'

Al realizar cliente TCP / conexiones IP, se unen a DIRECCIÓN en la máquina local. DIRECCIÓN puede especificarsecomo un nombre de host o la dirección IP. Esta opción puede ser útil si el equipo está obligado a varias direcciones IP.

'‐t número''‐‐tries = número'

Establecer el número de intentos a número . Especifique 0 o 'inf'Para reintentar infinito. El valor predeterminado esvolver a intentar 20 veces, con la excepción de errores fatales como "conexión rechazada" o "no encontrado" (404), queno se vuelve a intentar.

'‐O archivo''‐‐output‐document = archivo'

Los documentos no serán escritos a los archivos correspondientes, pero todo se concatenan y se escriben en presentar . Si'‐'Se utiliza como archivo , los documentos se imprimen en la salida estándar, la desactivación de la conversión enlace.(Use './‐'Para imprimir en un archivo llamado literalmente'‐'.)

El uso de '‐O'Está no pretende significar simplemente "utilizar el nombre de archivo en lugar de la de la URL; "sino quees análoga a bombardear redirección: 'wget ‐O archivo http: // foo'Está destinado a trabajar como'wget ‐O ‐ http: //foo> archivo'; expedientese truncará inmediatamente, y todo el contenido descargado se escribirá allí.

Por esta razón, '‐N'(Para la marca de tiempo de comprobación) no se admite en combinación con'‐O': Desde el archivoestá siempre recién creado, siempre tendrá una nueva marca de tiempo. Se emitirá una advertencia si se utiliza estacombinación.

Del mismo modo, el uso de "‐r'O'‐p'Con'‐O"Puede no funcionar como se espera: Wget no sólo se descargará el primer

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 7/59

archivo a presentar y luego descargar el resto de sus nombres normales: todo el contenido descargado se colocará en elarchivo . Esto fue desactivada en la versión 1.11, pero ha sido reintegrado (con una advertencia) en 1.11.2, ya que hayalgunos casos en los que este comportamiento puede realmente tener alguna utilidad.

Tenga en cuenta que una combinación con '‐k"Sólo se permite cuando se descarga un documento único, ya que en esecaso se acaba de convertir todas las URIs relativas a los externos; '‐k"No tiene sentido para múltiples URI cuando todosestán siendo descargados en un solo archivo; '‐k'Sólo se puede utilizar cuando la salida es un archivo normal.

'‐nc''‐‐no‐clobber'

Si un archivo se descarga más de una vez en el mismo directorio, el comportamiento de Wget depende de algunasopciones, incluyendo "‐nc'. En ciertos casos, el archivo local será una paliza , o se sobrescribe, sobre descarga repetida.En otros casos, será preservada.

Cuando se ejecuta Wget sin '‐N','‐nc','‐r', O'‐p', Descargando el mismo archivo en el mismo directorio se traducirá en lacopia original del archivo se conservan y la segunda copia de ser nombrado 'archivo 0.1'. Si ese archivo se descarga unavez más, la tercera copia se llamará 'archivo 0.2', Etcétera. (Este es también el comportamiento con '‐nd', Aunque'‐r'O'‐p'Son en efecto.) Cuando'‐nc'Se especifica, este comportamiento se suprime, y Wget se negará a descargar nuevas copiasde'expediente'. Por lo tanto, " no‐clobber "es en realidad un nombre inapropiado en esta modalidad no es clobbering esoimpidió (como los sufijos numéricos ya estaban impidiendo clobbering), sino más bien el ahorro versión múltiple, que haimpedido.

Cuando se ejecuta Wget con '‐r'O'‐p', Pero sin'‐N','‐nd', O'‐nc', Volver a descargar un archivo resultará en la nueva copiasimplemente sobrescribir la vieja. Adición '‐nc'Evitará este comportamiento, en lugar causando la versión original paraser preservado y las copias nuevas en el servidor para ser ignorado.

Cuando se ejecuta Wget con '‐N', Con o sin'‐r'O'‐p', La decisión en cuanto a si o no descargar una copia reciente de unarchivo depende de la indicación de la hora local y remota y el tamaño del archivo (consulte de sellado de tiempo ). '‐nc'No se puede especificar al mismo tiempo que'‐N'.

Tenga en cuenta que cuando "‐nc'Se especifica, los archivos con los sufijos'.html'O'.htm'Serán cargados desde el discolocal y analiza como si hubieran sido recuperada de la Web.

'‐‐backups = copias de seguridad'

Antes de (sobre) escritura de un archivo, copia de seguridad de un archivo existente mediante la adición de un '0.1'Sufijo('_1'En VMS) para el nombre del archivo. Tales archivos de copia de seguridad se giran para '0.2','0.3', Y asísucesivamente, hasta las copias de seguridad (y perdido más allá de eso).

'‐c''‐‐continue'

Continuar recibiendo un archivo descargado parcialmente. Esto es útil cuando se quiere terminar una descarga iniciadapor una instancia anterior de Wget, o por otro programa. Por ejemplo:

wget ‐c ftp://sunsite.doc.ic.ac.uk/ls‐lR.Z

Si hay un archivo llamado ls‐lR.Z en el directorio actual, Wget asumirá que es la primera parte del archivo remoto, y lepedirá al servidor para continuar con la recuperación de offset igual a la longitud del archivo local.

Tenga en cuenta que no es necesario especificar esta opción si lo que desea es la invocación actual de Wget para volver aintentar la descarga de un archivo si la conexión se pierde a mitad. Este es el comportamiento predeterminado. '‐c'Sóloafecta a la reanudación de descargas empezó antes a esta invocación de Wget, y cuyos archivos locales todavía estánsentados alrededor.

Sin '‐c', El ejemplo anterior sería sólo tiene que descargar el archivo remoto para ls‐lR.Z.1, Dejando el truncado ls‐lR.Zpresentar solo.

Comenzando con Wget 1.7, si utiliza '‐c'Sobre un archivo que no está vacía, y resulta que el servidor no admite ladescarga continua, Wget se negará a iniciar la descarga desde cero, lo que arruinaría efectivamente contenido existente. Siusted realmente desea la descarga para empezar desde cero, elimine el archivo.

También comenzando con Wget 1.7, si utiliza '‐c'En un fichero del cual es de igual tamaño que el que está en el servidor,Wget se negará a descargar el archivo e imprimir un mensaje explicativo. Lo mismo sucede cuando el archivo es máspequeño en el servidor de forma local (presumiblemente debido a que fue cambiado en el servidor desde el último intentode descarga) ­porque "continua" no es significativo, sin descarga se produce.

En el otro lado de la moneda, mientras que el uso de "‐c', Cualquier archivo que es más grande en el servidor de forma

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 8/59

local será considerado una descarga incompleta y sólo (longitud (distancia) ‐ Longitud () locales) bytes sedescargarán y viraron hacia el final del archivo local. Este comportamiento puede ser deseable en ciertos casos, porejemplo, puede utilizar 'wget ‐c'Para descargar sólo la parte nueva que ha sido añadida a una colección de datos o archivode registro.

Sin embargo, si el archivo es más grande en el servidor porque se ha cambiado , en lugar de sólo anexa a, que va aterminar con un archivo ilegible. Wget no tiene forma de verificar que el archivo local es realmente un prefijo válido delarchivo remoto. ¡Tienes que ser especialmente cuidadoso de esto cuando el uso de '‐c'Junto con'‐r', Ya que cada archivoserá considerado como un candidato "descarga incompleta".

Otro caso en el que obtendrá un archivo ilegible si intenta utilizar '‐c"Es que si tienes un cojo HTTP proxy que inserta una"transferencia interrumpida" cadena en el archivo local. En el futuro se puede añadir una opción de "rollback" para hacerfrente a este caso.

Tenga en cuenta que '‐c'Sólo funciona con FTP servidores y con HTTP servidores que soportan el rango de cabecera.

'‐‐start‐pos = OFFSET'

Inicie la descarga en la posición de base cero OFFSET . Offset puede ser expresada en bytes, kilobytes con el sufijo 'k', omegabytes con el sufijo "m", etc.

'‐‐start polos'Tiene mayor precedencia sobre'‐‐continue'. Cuándo '‐‐start polos'Y'‐‐continue"Son a la vezespecificado, wget emitirá una advertencia a continuación, proceder como si"‐‐continue'Estaba ausente.

Se requiere el soporte de servidor para su descarga continua, de lo contrario '‐‐start polos'No puede ayudar. Ver '‐c'Paramás detalles.

'‐‐progress = tipo'

Seleccione el tipo de indicador de progreso que desea utilizar. Indicadores legales son "punto" y "bar".

El indicador de "bar" se utiliza por defecto. Dibuja un ASCII gráficos de barras de progreso (aka visualización"termómetro") que indican el estado de la recuperación. Si la salida no es un teléfono de texto, la barra de "punto" seutiliza de forma predeterminada.

Use '‐‐progress = dot'Para cambiar a la pantalla de "punto". Traza la recuperación imprimiendo puntos en la pantalla,cada punto representa una cantidad fija de datos descargados.

El progreso tipo también puede tener uno o más parámetros. Los parámetros varían en función del tipo seleccionado.Parámetros de tipo se pasan añadiéndolos al tipo sperated por dos puntos (:) como esto: '‐‐progress = tipo : parámetro1: parámetro2'.

Cuando se utiliza la recuperación de puntos, puede establecer el estilo especificando el tipo 'dot: estilo'. Diferentesestilos asignan significado diferente a un punto. Con el defecto estilo cada punto representa 1K, hay diez puntos en ungrupo y 50 puntos en una línea. El binario estilo tiene un "equipo" más­como puntos de orientación­8K, clusters de 16puntos y 48 puntos por línea (que hace de 384K líneas). El mega‐ estilo es adecuado para la descarga de archivos de grantamaño, cada punto representa 64K recuperada, hay ocho puntos en un grupo, y 48 puntos en cada línea (por lo que cadalínea contiene 3M). Si Mega no es suficiente, entonces se puede utilizar el giga estilo cada punto representa 1Mrecuperada, hay ocho puntos en un grupo, y 32 puntos en cada línea (por lo que cada línea contiene 32M).

Con '‐‐progress = bar', En la actualidad hay dos parámetros posibles, fuerza y noscroll .

Cuando la salida no es un teléfono de texto, la barra de progreso siempre cae de nuevo a "punto", aunque "‐‐progress =bar'Se pasó a Wget durante invocación. Este comportamiento puede ser anulado y la salida de "bar" forzado mediante elparámetro "fuerza" como "‐‐progress = bar: fuerza'.

Por defecto, el 'bar"Barra de progreso estilo desplazarse el nombre del archivo de izquierda a derecha para el archivo dela descarga si el nombre del archivo supera la longitud máxima asignada para su visualización. En algunos casos, comocon '‐‐progress = bar: fuerza', Uno puede no querer que el nombre de archivo de desplazamiento en la barra deprogreso. Al pasar el parámetro "noscroll", Wget puede ser obligado a mostrar tantos el nombre del archivo como seaposible sin necesidad de desplazarse a través de ella.

Tenga en cuenta que puede establecer el estilo por defecto mediante el progreso de comandos en.wgetrc. Ese ajustepuede ser reemplazado desde la línea de comandos. Por ejemplo, para forzar la salida de la barra sin necesidad dedesplazarse, utilice '‐‐progress = bar: Fuerza: noscroll'.

'‐‐show‐progreso'

Fuerza wget para mostrar la barra de progreso en cualquier nivel de detalle.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 9/59

Por defecto, wget sólo muestra la barra de progreso en modo detallado. Uno puede, sin embargo, quiere wget paramostrar la barra de progreso en la pantalla junto con otros modos de verbosidad como '‐‐no‐verbose'O'‐‐quiet'. Esto es amenudo una desea una propiedad al invocar wget para descargar varios archivos pequeños / grandes. En tal caso, wgetpodría simplemente ser invocado con este parámetro para obtener una salida mucho más limpia en la pantalla.

Esta opción también obligará a la barra de progreso que se debe imprimir a stderr cuando se utiliza junto con el '‐‐logfile'Opción.

'‐N''‐‐timestamping'

Encienda el sellado de tiempo. Ver de sellado de tiempo , para más detalles.

'‐‐no‐uso‐server‐marcas de tiempo'

No establezca fecha y hora del archivo local por el que está en el servidor.

Por defecto, cuando se descarga un archivo, sus marcas de tiempo se establecen para que coincida con los del archivoremoto. Esto permite el uso de "‐‐timestamping'En invocaciones posteriores de wget. Sin embargo, a veces es útil basarmarca de tiempo del archivo local en cuando en realidad fue descargado; para ese propósito, el "‐‐no‐uso‐server‐marcasde tiempo'Se ha proporcionado opción.

'‐S''‐‐server‐respuesta'

Imprima las cabeceras enviadas por HTTP servidores y respuestas enviadas por FTP servidores.

'‐‐spider'

Cuando se invoca con esta opción, Wget se comportará como un Web de araña , lo que significa que no va a descargarlas páginas, sólo comprobar que están allí. Por ejemplo, puede utilizar Wget para ver sus marcadores:

wget ‐‐spider ‐‐force‐html ‐i bookmarks.html

Esta característica necesita mucho más trabajo para Wget para acercarse a la funcionalidad de las arañas web reales.

'Segundo ‐T''‐‐timeout = segundos'

Ajuste el tiempo de espera de la red a segundos segundos. Esto es equivalente a especificar '‐‐dns‐timeout','‐‐connect‐timeout', Y'‐‐read‐timeout', Todo al mismo tiempo.

Al interactuar con la red, Wget puede comprobar si hay tiempo de espera y abortar la operación, si se tarda demasiadotiempo. Esto evita anomalías como colgante lee y conecta infinitas. El único tiempo de espera activado por defecto es de900 segundos de tiempo de espera de leer. Establecer un tiempo de espera a 0 desactiva por completo. A menos que sepalo que está haciendo, lo mejor es no cambiar la configuración de tiempo de espera predeterminado.

Todas las opciones relacionadas con el tiempo de espera del aceptan valores decimales, así como los valores por debajodel segundo. Por ejemplo, '0.1'Segundo es un legal (aunque poco inteligente) elección de tiempo de espera. Tiempos deespera por debajo del segundo son útiles para el control de los tiempos de respuesta del servidor o de latencia de la red depruebas.

'‐‐dns‐timeout = segundos'

Ajuste el tiempo de espera de búsqueda DNS para segundos segundos. Búsquedas de DNS que no completen dentro deltiempo especificado fallará. Por defecto, no hay tiempo de espera en las búsquedas de DNS, que no sea aplicado por lasbibliotecas del sistema.

'‐‐connect‐timeout = segundos'

Ajuste el tiempo de espera de conexión a segundos segundos. Conexiones TCP que requieren más tiempo para establecerserán abortados. Por defecto, no hay tiempo de espera de conexión, con excepción de los aplicados por las bibliotecas delsistema.

'‐‐read‐timeout = segundos'

Ajuste la lectura (y escribir) de tiempo de espera a segundos segundos. El "tiempo" de este tiempo de espera se refiere altiempo de reposo : si, en cualquier momento de la descarga, no se reciben datos durante más de un número especificadode segundos, la lectura falla y la descarga se reinicia. Esta opción no afecta directamente la duración de toda la descarga.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 10/59

Por supuesto, el servidor remoto podrá optar por resolver la conexión antes de lo que esta opción requiere. El tiempo deespera de lectura predeterminado es de 900 segundos.

'‐‐limit‐rate = cantidad'

Limitar la velocidad de descarga a ascender bytes por segundo. La cantidad puede ser expresada en bytes, kilobytes conel 'k'sufijo o megabytes con la'm'Sufijo. Por ejemplo, '‐‐limit‐rate = 20k'Limitará la tasa de recuperación de 20 KB / s.Esto es útil cuando, por cualquier razón, usted no quiere Wget para consumir todo el ancho de banda disponible.

Esta opción permite el uso de los números decimales, generalmente en conjunción con sufijos de energía; por ejemplo, '‐‐limit‐rate = 2.5k'Es un valor legal.

Tenga en cuenta que Wget implementa la limitación por dormir la cantidad adecuada de tiempo después de una lectura dered que tomó menos tiempo que el especificado por la tasa. Finalmente, esta estrategia hace que la transferencia de TCPpara frenar a aproximadamente la velocidad especificada. Sin embargo, puede tomar algún tiempo para que esteequilibrio que debe alcanzarse, por lo que no se sorprenda si la limitación de la velocidad no funciona bien con archivosmuy pequeños.

'‐w segundos''‐‐wait = segundos'

Espere el número especificado de segundos entre las recuperaciones. Se recomienda el uso de esta opción, ya que aligerala carga del servidor al hacer las peticiones menos frecuentes. En lugar de en segundos, el tiempo se puede especificar enminutos utilizando el m sufijo, en horas usando h sufijo, o en días utilizando d sufijo.

Especificación de un valor grande para esta opción es útil si la red o el host de destino es hacia abajo, de modo que Wgetpuede esperar el tiempo suficiente para esperar razonablemente el error de red que se fijará antes del reintento. Elintervalo de espera especificado por esta función está influenciada por ‐‐random‐espera , que ver.

'‐‐waitretry = segundos'

Si usted no quiere Wget debe esperar entre cada recuperación, pero sólo entre los reintentos de descargas fallidas, puedeutilizar esta opción. Wget utilizará retroceso lineal , en espera 1 segundo después del primer fracaso en un archivodeterminado, luego de esperar 2 segundos después del segundo fracaso en ese archivo, hasta el número máximo desegundos que especifique.

Por defecto, Wget asumirá un valor de 10 segundos.

'‐‐random‐wait'

Algunos sitios web pueden realizar análisis de registros para identificar programas de recuperación como Wget mediantela búsqueda de similitudes estadísticamente significativas en el tiempo entre peticiones. Esta opción hace que el tiempoentre peticiones de variar entre 0,5 y 1,5 * de espera segundo, donde espera se especifica a través del "‐‐waitOpción ',con el fin de enmascarar la presencia de Wget de dicho análisis.

Un artículo de 2001 en una publicación dedicada al desarrollo de una plataforma de consumo popular proporciona códigopara realizar este análisis sobre la marcha. Su autor sugirió bloqueo a nivel de dirección de clase C para asegurar que losprogramas automatizados de recuperación fueron bloqueados a pesar de cambiar las direcciones DHCP suministrados.

El '‐‐random‐waitOpción 'se inspiró en esta recomendación mal aconsejado para bloquear muchos usuarios norelacionados de un sitio web, debido a las medidas adoptadas por uno.

'‐‐no‐proxy'

No usar proxies, incluso si el apropiado _Proxy * se define la variable de entorno.

Ver proxies , para obtener más información sobre el uso de proxies con Wget.

'‐Q cuotas''‐‐quota = cuota'

Especifique descarga cuota para recuperaciones automáticas. El valor se puede especificar en bytes (por defecto),kilobytes (con 'k'Sufijo) o megabytes (con'm'Sufijo).

Tenga en cuenta que la cuota no afectará a la descarga de un solo archivo. Así que si usted especifica 'wget ‐Q10kftp://wuarchive.wustl.edu/ls‐lR.gz', Todo el ls‐lR.gzse descargará. Lo mismo ocurre incluso cuando varios URL seespecifican s en la línea de comandos. Sin embargo, la cuota se respeta cuando se recuperan ya sea de forma recursiva, ode un archivo de entrada. De esta manera usted puede escribir de forma segura 'sitios wget ‐Q2m ‐i'­Descargar Secancelará cuando se supere la cuota.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 11/59

Configuración de cuotas a 0 ó a 'inf'Unlimits la cuota de descarga.

'‐‐no‐dns‐cache'

Apague el almacenamiento en caché de las búsquedas de DNS. Normalmente, Wget recuerda las direcciones IP quelevantó la vista de DNS por lo que no tiene que ponerse en contacto en varias ocasiones el servidor DNS para el mismo(por lo general pequeño) conjunto de los ejércitos lo recupera de. Existe este caché en memoria de sólo; una nuevaejecución Wget pondrá en contacto con DNS nuevo.

Sin embargo, se ha informado de que en algunas situaciones no es deseable para almacenar en caché los nombres de host,incluso para la duración de una aplicación de corta duración como Wget. Con esta opción Wget emite una nuevabúsqueda de DNS (más precisamente, una nueva llamada a gethostbyname o getaddrinfo ) cada vez que se hace unanueva conexión. Tenga en cuenta que esta opción no afectará el almacenamiento en caché que podría ser realizada por labiblioteca resolver o por una capa de almacenamiento en caché externa, como NSCD.

Si usted no entiende exactamente lo que hace esta opción, es probable que no lo necesitan.

'‐‐restrict‐file‐names = modos'

Cambie la que los personajes se encuentran en URLs remotas deben escaparse durante la generación de nombres deficheros locales. Personajes que están restringidos por esta opción se escaparon, es decir, sustituido por '% HH',Donde'HH'Es el número hexadecimal que corresponde al carácter restringido. Esta opción también puede ser usado paraforzar todos los casos alfabético para ser minúsculas o mayúsculas.

Por defecto, Wget escapa de los personajes que no son válidas o segura como parte de los nombres de archivos de susistema operativo, así como los caracteres de control que son típicamente no imprimible. Esta opción es útil para cambiarestos valores predeterminados, tal vez porque está descargando a una partición no nativo, o porque desea desactivarescapar de los caracteres de control, o si desea restringir aún más los caracteres de sólo los del ASCII rango de valores.

Los modos son un conjunto separada por comas de valores de texto. Los valores aceptables son"unix','ventanas','NoControl','ascii','minúsculas', Y'mayúscula'. Los valores 'unix'Y'ventanas'Son mutuamente excluyentes(uno anular el otro), como son'minúsculas'Y'mayúscula'. Los últimos son casos especiales, ya que no cambian el conjuntode caracteres que se escaparon, sino más bien obligan a rutas de archivos locales a convertirse ya sea a minúsculas omayúsculas.

Cuando se especifica "unix", Wget escapa el carácter '/"Y los caracteres de control en los rangos de 0 a 31 y 128 a 159.Este es el valor por defecto en sistemas operativos tipo Unix.

Cuando "ventanas" se da, Wget escapa de los caracteres '\','|','/',':','?','"','*','<','>', Y los caracteres de control en los rangosde 0 a 31 y 128 a 159. Además de esto, Wget en modo Windows utiliza '+'En lugar de':'Para separar host y el puerto enlos nombres de archivos locales, y utiliza'@'En lugar de'?'Para separar la parte de consulta del nombre de archivo del resto.Por lo tanto, una dirección URL que se guarda como 'www.xemacs.org:4300/search.pl?input=blah'En Unix modo seguarda como'www.xemacs.org+4300/search.pl@input=blah'En el modo de Windows. Este modo es el predeterminado enWindows.

Si se especifica 'NoControl', Entonces el escape de los caracteres de control también está apagado. Esta opción puedetener sentido cuando se está descargando URLs cuyos nombres contengan caracteres UTF­8, en un sistema que se puedeguardar y mostrar nombres de archivo en UTF­8 (algunos de los posibles valores de bytes utilizados en UTF­8 secuenciasde bytes caer en el rango de valores designada por Wget como "controles").

El 'ascii'Modo se utiliza para especificar que cualquier bytes cuyos valores se encuentran fuera del rango de ASCIIcaracteres (es decir, superior a 127) se escapó. Esto puede ser útil cuando se guardan los nombres de fichero cuyacodificación no coincide con la que se utiliza a nivel local.

'‐4''de sólo ‐‐inet4''‐6''de sólo ‐‐inet6'

Fuerza de conexión para las direcciones IPv4 o IPv6. Con 'de sólo ‐‐inet4'O'‐4', Wget sólo se conectará a los hostsIPv4, haciendo caso omiso de registros AAAA en DNS, y se niega a conectarse a direcciones IPv6 especificadas en lasdirecciones URL. Por el contrario, con 'de sólo ‐‐inet6'O'‐6', Wget sólo se conectará a los hosts IPv6 e ignorar losregistros A y direcciones IPv4.

Ni las opciones deben ser necesarios normalmente. Por defecto, un Wget con IPv6 se utilizará la familia de direccionesespecificada por registro DNS del host. Si el DNS responde con IPv4 e IPv6, Wget tratará en secuencia hasta queencuentra uno que puede conectarse. (Véase también ‐‐prefer familiar opción se describe a continuación.)

Estas opciones se pueden utilizar para forzar deliberadamente el uso de IPv4 o IPv6 familias de direcciones en los

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 12/59

sistemas familiares duales, por lo general para ayudar a depurar o tratar con la configuración de red rota. Sólo uno de 'desólo ‐‐inet6'Y'de sólo ‐‐inet4'Pueden especificarse al mismo tiempo. Ninguna opción está disponible en Wgetcompilado sin soporte IPv6.

'‐‐prefer familiar = ninguno / IPv4 / IPv6'

Cuando se les da la opción de varias direcciones, conectar a las direcciones con la familia de direcciones especificadaprimero. La orden de la dirección devuelta por DNS se utiliza sin cambio de forma predeterminada.

Esto evita errores falsos y conectar intentos cuando se accede a los ejércitos que se resuelven en ambas direcciones IPv6 eIPv4 de redes IPv4. Por ejemplo, 'www.kame.net'Resuelve'2001: 200: 0: 8002: 203: 47ff: fea5: 3085'Ypara'203.178.141.194'. Cuando la familia preferido es el IPv4 , la dirección IPv4 se utiliza primero; cuando la familiapreferido es IPv6 , la dirección IPv6 se utilizó por primera vez; si el valor especificado es ninguno , el orden de direccióndevuelta por DNS se utiliza sin cambios.

A diferencia '‐4'Y'‐6', Esta opción no inhibe el acceso a cualquier familia de direcciones, sólo cambia el orden en el quese accede a las direcciones. También tenga en cuenta que el reordenamiento realizado por esta opción es estable ­es noafecta el orden de las direcciones de la misma familia. Es decir, el orden relativo de todas las direcciones IPv4 y de todaslas direcciones IPv6 se mantiene intacta en todos los casos.

'‐‐retry‐connrefused'

Considere la posibilidad de "conexión rechazada" un error transitorio y vuelva a intentarlo. Normalmente Wget da porvencido en una URL cuando no es capaz de conectarse al sitio debido a la falta de conexión se toma como una señal deque el servidor no se está ejecutando en absoluto y que los reintentos no ayudarían. Esta opción es para el reflejo de sitiosno confiables cuyos servidores tienden a desaparecer por períodos cortos de tiempo.

'‐‐user = usuario''‐‐password = contraseña'

Especifique el nombre de usuario de usuario y la contraseña contraseña tanto para FTP y HTTP de recuperación dearchivos. Estos parámetros pueden redefinirse mediante la '‐‐ftp usuario'Y'‐‐ftp contraseña'opciones para FTPconexiones y la '‐‐http usuario'Y'‐‐http‐contraseña'opciones para HTTP conexiones.

'‐‐ask contraseña'

Pedirá una contraseña para cada conexión establecida. No se puede especificar cuando '‐‐password'Está en uso, debido aque son mutuamente excluyentes.

'‐‐no‐iri'

Desactivación de la compatibilidad internacionalizado URI (IRI). Use '‐‐iri'Para encenderlo. Apoyo IRI está activada deforma predeterminada.

Puede establecer el estado por defecto de apoyo IRI utilizando el IRI comando en.wgetrc. Ese ajuste puede serreemplazado desde la línea de comandos.

'‐‐local‐encoding = codificación'

Fuerza Wget para utilizar la codificación como la codificación predeterminada del sistema. Eso afecta cómo Wgetconvierte URL especificados como argumentos de la configuración regional de UTF­8 para el apoyo del IRI.

Wget utilizar la función nl_langinfo () y luego el CHARSET variable de entorno para conseguir la configuración regional.Si falla, ASCII se utiliza.

Usted puede establecer la codificación local predeterminada utilizando el local_encoding comando en.wgetrc. Ese ajustepuede ser reemplazado desde la línea de comandos.

'‐‐remote‐encoding = codificación'

Fuerza Wget para utilizar la codificación como la codificación servidor remoto predeterminado. Eso afecta cómo Wgetconvierte URI que se encuentran en los archivos de codificación remota a UTF­8 durante una recursiva buscarme. Estaopción sólo es útil para el apoyo IRI, para la interpretación de los no ASCII caracteres.

Para HTTP, codificación remoto se puede encontrar en HTTP Content‐Type cabecera y en HTML Content‐Type‐http‐equiv etiqueta meta.

Puede establecer la codificación predeterminada utilizando el remoteencoding comando en.wgetrc. Ese ajuste puede serreemplazado desde la línea de comandos.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 13/59

'‐‐unlink'

Fuerza Wget para desvincular archivo en lugar de clobbering archivo existente. Esta opción es útil para descargar aldirectorio con enlaces duros.

Siguiente: HTTP Opciones , Previous: Opciones de descarga , Up: Invocando [ Contenidos ] [ Índice ]

2.6 Opciones de directorio

'‐nd''‐‐no‐directorios'

No crear una jerarquía de directorios al recuperar de forma recursiva. Con esta opción activada, todos los archivos seguardan en el directorio actual, sin clobbering (si un nombre aparece más de una vez, los nombres de archivos recibiránextensiones '.n').

'‐x''‐‐force‐directorios'

Lo opuesto a '‐nd'­crear Una jerarquía de directorios, incluso si uno no se han creado lo contrario. Por ejemplo 'wget ‐xhttp://fly.srk.fer.hr/robots.txt'Salvará el archivo descargado para fly.srk.fer.hr/robots.txt.

'‐nH''‐‐no‐host‐directorios'

Desactivar generación de directorios de acogida prefijada. Por defecto, la invocación de Wget con '‐rhttp://fly.srk.fer.hr/'Creará una estructura de directorios que comienzan con fly.srk.fer.hr/. Esta opcióndeshabilita este comportamiento.

'‐‐protocol‐directorios'

Utilice el nombre del protocolo como un componente directorio de nombres de archivos locales. Por ejemplo, con estaopción, 'wget ‐r http: // anfitrión'Salvará a'http / anfitrión / ..."En lugar de sólo"anfitrión / ...'.

'‐‐cut‐dirs = número'

Ignorar números componentes de directorio. Esto es útil para obtener un control de grano fino sobre el directorio donde seguardará la recuperación recursiva.

Tomemos, por ejemplo, el directorio a 'ftp://ftp.xemacs.org/pub/xemacs/'. Si recupera con '‐r', Se guardará localmentebajo ftp.xemacs.org/pub/xemacs/. Mientras que el '‐nHOpción 'puede quitar el ftp.xemacs.org/ parte, usted todavía estáatascado con pub / xemacs. Aquí es donde '‐‐cut‐dirs'Viene muy bien; hace Wget no "ver" número componentes dedirectorios remotos. Aquí hay varios ejemplos de cómo "‐‐cut‐dirs'Opción funciona.

No hay opciones ‐> ftp.xemacs.org/pub/xemacs/‐nH ‐> pub / xemacs /‐NH ‐‐cut‐dirs = 1 ‐> xemacs /‐NH ‐‐cut‐dirs = 2 ‐>.

‐‐cut‐dirs = 1 ‐> ftp.xemacs.org/xemacs/...

Si lo que desea es deshacerse de la estructura de directorios, esta opción es similar a una combinación de '‐nd'Y'‐P'. Sinembargo, a diferencia de '‐nd','‐‐cut‐dirs'No pierde con instancia subdirectorios fines, con'‐NH ‐‐cut‐dirs = 1', Un beta/ subdirectorio será puesto a xemacs / beta, Como era de esperar.

'‐P prefijo''‐‐directory‐prefix = prefijo'

Set prefijo directorio para prefijo . El prefijo de directorio es el directorio donde todos los demás archivos ysubdirectorios se guardarán, es decir, la parte superior del árbol de recuperación. El valor predeterminado es '.'(Eldirectorio actual).

Siguiente: HTTPS (SSL / TLS) Opciones , Previous: Directorio de Opciones , Up: Invocando [ Contenidos ] [ Índice ]

2.7 Opciones de HTTP

'‐‐default‐page = nombre'

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 14/59

Usar nombre como nombre de archivo por defecto cuando no se sabe (es decir, para las URL que terminan en una barra),en lugar deindex.html.

'‐E''‐‐adjust‐extensión'

Si un archivo del tipo 'application / xhtml + xml'O'text / html'Se descarga y la URL no termina con la expresiónregular'\. [Hh] [Tt] [Mm] [Ll]?', Esta opción hará que el sufijo'.html'Para ser añadido a su nombre local. Esto es útil,por ejemplo, cuando se está reflejando un sitio remoto que utiliza '.asp'Páginas, pero desea que las páginas de espejo paraser visible en su inventario servidor Apache. Otro buen uso de esto es cuando estás descargando materiales generadas porCGI. Una URL como 'http://site.com/article.cgi?25'Se guardará como article.cgi? 25.html.

Tenga en cuenta que los nombres de archivos modificados de esta manera se volverán a descargar cada vez que vuelva aespejo de un sitio, porque Wget no puede decir que lo local X .html archivo corresponde a URL remota 'X'(Ya que aún nose sabe que la URL produce una salida de tipo'text / html'O'application / xhtml + xml'.

Desde la versión 1.12, Wget también asegurará que los archivos descargados de tipo 'text / css'Terminar con elsufijo'.css', Y la opción fue renombrada de'‐‐html‐extensión', Para reflejar mejor su nuevo comportamiento. El nombrede la opción de edad sigue siendo aceptable, pero ahora debe ser considerado obsoleto.

En algún momento en el futuro, esta opción también puede ser ampliado para incluir sufijos para otros tipos de contenido,incluyendo los tipos de contenidos que no son analizadas por Wget.

'‐‐http‐user = usuario''‐‐http‐password = contraseña'

Especifique el nombre de usuario de usuario y la contraseña de la contraseña en un HTTP servidor. Según el tipo dedesafío, Wget codificarlos utilizando el básico (inseguro), el resumen , o la de Windows NTLM esquema de autenticación.

Otra forma de especificar nombre de usuario y la contraseña se encuentra en la dirección URL en sí (ver URL Formato ).Cualquier método revela su contraseña a nadie a quién le importa correr ps . Para evitar que las contraseñas de ser visto,les guarde en.wgetrc o .netrcY asegúrese de proteger los archivos de otros usuarios con chmod . Si las contraseñas sonmuy importantes, no los deje acostado en esos archivos ya sea a editar los archivos y borrarlos después Wget hacomenzado la descarga.

'‐‐no‐http‐keep‐alive'

Desactive la función "keep­alive" para las descargas HTTP. Normalmente, Wget pide al servidor para mantener laconexión abierta de forma que, cuando se descarga más de un documento desde el mismo servidor, que se transfieren através de la misma conexión TCP. Esto ahorra tiempo y al mismo tiempo reduce la carga en el servidor.

Esta opción es útil cuando, por alguna razón, persistentes (keep­alive) conexiones no funcionan para usted, por ejemplo,debido a un error del servidor o debido a la incapacidad de los scripts de servidor para hacer frente a las conexiones.

'‐‐no‐cache'

Caché del lado del servidor Desactivar. En este caso, Wget enviará al servidor remoto una directiva apropiada ('Pragma:no‐cache') Para obtener el archivo desde el servicio remoto, en lugar de devolver la versión en caché. Esto esespecialmente útil para la recuperación y el lavado de documentos fuera de la fecha en servidores proxy.

El almacenamiento en caché se permite por defecto.

'‐‐no‐galletas'

Desactivar el uso de cookies. Las cookies son un mecanismo para mantener el estado del lado del servidor. El servidorenvía al cliente una cookie con el Set‐Cookie cabecera, y el cliente responde con la misma cookie en futuras solicitudes.Desde las cookies permiten que los propietarios del servidor para realizar un seguimiento de los visitantes y para los sitiosde intercambio de esta información, algunos consideran que la violación de la privacidad. El valor por defecto es el usode cookies; Sin embargo, el almacenamiento de las cookies no está activada por defecto.

'‐‐load‐cookies archivo'

Cargar cookies de archivo antes de la primera recuperación de HTTP. archivo es un archivo de texto en el formatoutilizado originalmente por Netscape cookies.txt presentar.

Típicamente Utilizará esta opción cuando el reflejo sitios que requieren que estar registrado para acceder a algunos o latotalidad de su contenido. El proceso de inicio de sesión normalmente trabaja por el servidor web emitir un HTTP cookiesdespués de recibir y verificar sus credenciales. La cookie es entonces resienten por el navegador al acceder a esa parte delsitio, y así demuestra su identidad.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 15/59

Reflejo de tal sitio requiere Wget para enviar las mismas galletas su navegador envía cuando se comunica con el sitio.Esto se consigue '‐‐load‐cookies"Punto Wget ­simplemente a la ubicación de la cookies.txtarchivo, y enviará lasmismas galletas su navegador enviaría en la misma situación. Los distintos navegadores guardan archivos cookietextuales en diferentes lugares:

Netscape 4.x

Las cookies son en ~ / .netscape / Cookies.txt.

Mozilla y Netscape 6.x

Archivo de cookies de Mozilla también se nombra cookies.txt, Que se encuentra en algún lugar bajo ~ /.mozilla, En el directorio de tu perfil. La ruta completa por lo general termina pareciéndose ~ / .mozilla /Default / algunos‐extraña cadena de /cookies.txt.

Internet Explorer.

Usted puede producir un archivo de cookies Wget puede utilizar mediante el menú Archivo, Importar y Exportar,exportación Cookies. Esto ha sido probado con Internet Explorer 5; no se garantiza que funcione con las versionesanteriores.

Otros navegadores.

Si está utilizando un navegador diferente para crear tus cookies, '‐‐load‐cookies'Sólo funcionará si se puedelocalizar o producir un archivo de cookies en el formato de Netscape que Wget espera.

Si no puede usar '‐‐load‐cookies', Que aún puede ser una alternativa. Si su navegador es compatible con un"administrador de cookies", que se puede utilizar para ver las cookies que se utilizan cuando se accede al sitio que estáreflejando. Anote el nombre y el valor de la cookie, y dar instrucciones manualmente Wget para enviar esas galletas, sinpasar por el soporte para cookies "oficial":

wget ‐‐no‐cookies ‐‐header "Cookie: nombre = valor "

'‐‐save‐cookies archivo'

Guardar cookies para presentar antes de salir. Esto no va a salvar a las cookies que han caducado o que no tienen tiempode caducidad (llamadas "cookies de sesión"), sino también ver '‐‐keep‐sesión‐cookies'.

'‐‐keep‐sesión‐cookies'

Cuando se especifica, hace que '‐‐save‐cookies'Guardar también las cookies de sesión. Las cookies de sesión no seguardan normalmente porque están destinados a ser guardado en la memoria y olvidado al salir del navegador. Salvandolas mismas es útil en los sitios que requieren que usted ingrese o visitar la página de inicio para poder acceder a algunaspáginas. Con esta opción, varias ejecuciones Wget se consideran una sola sesión del navegador por lo que el sitio serefiere.

Dado que el formato de archivo de cookies normalmente no llevan las cookies de sesión, Wget los marca con un sello detiempo de caducidad de 0. Wget de '‐‐load‐cookies'Reconoce a aquellos que las cookies de sesión, pero podría confundira otros navegadores. También tenga en cuenta que las cookies tan cargados serán tratados como otras cookies de sesión,lo que significa que si usted quiere '‐‐save‐cookies'Para preservarlas de nuevo, debe utilizar'‐‐keep‐sesión‐cookies'Otravez.

'‐‐ignore de longitud'

Desafortunadamente, algunos HTTP servidores ( CGI programas, para ser más precisos) envían falsos Content‐Lengthcabeceras, lo que hace Wget ir salvaje, como se piensa, no se recuperó todo el documento. Usted puede detectar estesíndrome si Wget vuelve a intentar conseguir el mismo documento una y otra vez, cada vez alegando que la conexión(por lo demás normal) se ha cerrado en el mismo byte.

Con esta opción, Wget ignorará el Content‐Length cabecera como si nunca hubiera existido.

'‐‐header = header‐line'

Enviar cabecera de línea junto con el resto de las cabeceras en cada HTTP petición. La cabecera suministrado se envía enque está, lo que significa que debe contener el nombre y el valor separados por dos puntos, y no debe contener saltos delínea.

Usted puede definir más de una cabecera adicional especificando '‐‐header"Más de una vez.

wget ‐‐header = 'Accept‐Charset: iso‐8859‐2' \

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 16/59

‐‐header = 'Accept‐Language: hr' \ http://fly.srk.fer.hr/

Especificación de una cadena vacía como el valor de encabezado borrará todos los encabezados definidos por el usuarioanteriores.

A partir de Wget 1.10, esta opción se puede utilizar para anular cabeceras generadas de otra manera automática. Esteejemplo indica Wget para conectarse a localhost, pero para especificar 'foo.bar'En el host de encabezado:

wget ‐‐header = "Host: foo.bar" http: // localhost /

En las versiones de Wget antes de dicho uso de 1,10 '‐‐header"Causado envío de encabezados duplicados.

'‐‐max‐redirect = número'

Especifica el número máximo de redirecciones a seguir para un recurso. El valor por defecto es 20, que es por lo generalmucho más de lo necesario. Sin embargo, en aquellas ocasiones en las que desee permitir más (o menos), esta es laopción de usar.

'‐‐proxy‐user = usuario''‐‐proxy‐password = contraseña'

Especifique el nombre de usuario de usuario y la contraseña de la contraseña para la autenticación en el servidor proxy.Wget codificará utilizando el básico esquema de autenticación.

Las consideraciones de seguridad similares a los que tienen '‐‐http‐contraseña'Pertenecen aquí también.

'‐‐referer = url'

Incluya 'de Referer: url 'encabezado en la solicitud HTTP. Útil para la recuperación de documentos con el procesamientodel lado del servidor que asumen que siempre se recuperan por los navegadores web interactivos y sólo salencorrectamente cuando de Referer se establece en una de las páginas que apuntan a ellos.

'‐‐save‐headers'

Guarde las cabeceras enviadas por el HTTP servidor al archivo, que precede a los contenidos reales, con una línea enblanco como separador.

'‐U agente cuerdas''‐‐user‐agente = agente cuerdas'

Identificar como agente cuerdas al HTTP del servidor.

El HTTP protocolo permite a los clientes que se identifican mediante un User‐Agent campo de encabezado. Esto permitedistinguir la WWW software, por lo general con fines estadísticos o para el seguimiento de violaciónes de protocolo. Wgetnormalmente identifica como 'Wget / versión', la versión es el número de la versión actual de Wget.

Sin embargo, algunos sitios se han sabido imponer la política de adaptar la salida de acuerdo con el User‐Agent ­suppliedinformación. Si bien esto no es una mala idea en teoría, ha sido objeto de abusos por los servidores que nieganinformación a los clientes que no sean (históricamente) Netscape o, más frecuentemente, Microsoft Internet Explorer.Esta opción le permite cambiar el User‐Agent línea emitida por Wget. El uso de esta opción no es recomendable, a menosque realmente sepa lo que está haciendo.

Especificación de agente de usuario vacío con '‐‐user‐agente = ""'Instruye Wget no enviar el User‐Agent encabezado enHTTP peticiones.

'‐‐post‐data = cadena''‐‐post‐file = fichero'

Utilice POST como el método para todas las peticiones HTTP y enviar los datos especificados en el cuerpo de la petición.'‐‐post‐datos'Envía cadena como datos, mientras que '‐‐post‐file'Envía el contenido del archivo . Aparte de eso,trabajan exactamente de la misma manera. En particular, ambos esperan que el contenido de la forma clave1 = valor1 yvalor2 key2 = , con ciento­codificación de caracteres especiales; la única diferencia es que uno espera su contenido comoun parámetro de línea de comandos y el otro acepta su contenido de un archivo. En particular, '‐‐post‐file'Es no para latransmisión de archivos como archivos adjuntos de forma: los debe aparecer como clave = valor de datos (con adecuadaciento codificantes) como todo lo demás. Wget no admite actualmente multipart / form‐data para transmitir datos dePOST; sólo application / x‐www‐form‐urlencoded . Sólo uno de '‐‐post‐datos'Y'‐‐post‐file'Debe ser especificado.

Tenga en cuenta que wget no requiere que el contenido sea de la forma clave1 = valor1 y valor2 key2 = , y ni qué es laprueba misma. Wget simplemente transmitir todos los datos que se proporciona a la misma. La mayoría de los servidores

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 17/59

sin embargo esperan que los datos POST para estar en el formato anterior al procesar formularios HTML.

Tenga en cuenta que Wget necesita saber el tamaño de los datos POST de antemano. Por tanto, el argumento para ‐‐post‐archivo debe ser un archivo regular; la especificación de un FIFO o algo así/ Dev / stdinno funcionará. No estámuy claro cómo evitar esta limitación inherente a HTTP / 1.0. Aunque HTTP / 1.1 introduce chunked transferencia queno requiere conocer la longitud solicitud por adelantado, un cliente no puede utilizar fragmentada a menos que sepa queestá comunicándose con un servidor HTTP / 1.1. Y no puede saber que hasta que reciba una respuesta, la cual a su vezrequiere que la solicitud ha sido completado ­ un problema de la gallina y el huevo.

Nota: Como en la versión 1.15 si Wget es redirigido después de que se ha completado la solicitud POST, sucomportamiento dependerá de la código de respuesta devuelta por el servidor. En caso de un 301 Movidopermanentemente, 302 trasladó temporalmente o 307 Redirección temporal, Wget será, de acuerdo con RFC2616,continuará enviando una solicitud POST. En caso de que un servidor que el cliente quiere cambiar el método de solicitudal producirse el redireccionamiento, debería enviar un 303 Véase Otro código de respuesta.

Este ejemplo muestra cómo conectarse a un servidor utilizando POST y luego proceder a descargar las páginas deseadas,presumiblemente, sólo accesibles a usuarios autorizados:

# Inicie sesión en el servidor. Esto se puede hacer sólo una vez.wget ‐‐save‐cookies cookies.txt \ 'user = foo y password = bar' ‐‐post‐data \ http://server.com/auth.php

# Ahora agarra la página o páginas que nos importa.wget ‐‐load‐cookies cookies.txt \ ‐p http://server.com/interesting/article.php

Si el servidor utiliza cookies de sesión para realizar un seguimiento de la autenticación de usuarios, lo anterior nofunciona porque '‐‐save‐cookies'No los salvará (y ni los navegadores voluntad) y la cookies.txtarchivo estará vacío. Eneste caso de uso '‐‐keep‐sesión‐cookies'Junto con'‐‐save‐cookies'Para forzar el ahorro de las cookies de sesión.

'‐‐method = HTTP‐Method'

A los efectos de scripting REST, Wget permite el envío de otros métodos HTTP sin la necesidad de establecerexplícitamente el uso de '‐‐header = Header‐Line'. Wget usará cualquier cadena se le pasa después '‐‐method'Como elMétodo de HTTP al servidor.

'‐datos ‐‐body = Data‐String''‐‐body‐file = Data‐File'

Se debe establecer cuando los datos adicional tiene que ser enviado al servidor junto con el método especificado usando '‐‐method'. '‐datos ‐‐body'Envía cadena como datos, mientras que '‐‐body‐file'Envía el contenido del archivo . Aparte deeso, trabajan exactamente de la misma manera.

Actualmente, '‐‐body‐file'Es no para la transmisión de archivos como un todo. Wget no admite actualmente multipart /form‐data para la transmisión de datos; sólo application / x‐www‐form‐urlencoded . En el futuro, esto puede cambiarsepara que wget envía el '‐‐body‐file'Como un archivo completo en lugar de enviar su contenido al servidor. Tenga encuenta que Wget necesita saber el contenido de BODY datos de antemano, y por lo tanto el argumento de '‐‐body‐file'Debe ser un archivo normal. Ver '‐‐post‐file'Para una explicación más detallada. Sólo uno de '‐datos ‐‐body'Y'‐‐body‐file'Debe ser especificado.

Si Wget es redirigido después de que se completó la solicitud, Wget suspenderá el método actual y enviar una solicitudGET hasta que se completó la redirección. Esto es cierto para todos los códigos de respuesta de redirección excepto 307Redirección temporal que se utiliza para especificar explícitamente que el método de la petición debería no cambiar. Otraexcepción es cuando el método se establece en la POST , en cuyo caso las reglas de redirección especifican bajo '‐‐post‐datos'Se siguen.

'‐‐content‐disposición'

Si esto está activado, experimental soporte (no totalmente funcional) para Content‐Disposición cabeceras está habilitada.Este momento puede resultar en ida y viajes adicionales al servidor para una CABEZA solicitud, y se sabe que sufren dealgunos errores, por lo que no está actualmente habilitado de forma predeterminada.

Esta opción es útil para algunos programas CGI de archivos a descargar que utilizan Content‐Disposition encabezadospara describir lo que debe ser el nombre de un archivo descargado.

'‐‐content‐on‐error'

Si esto está activado, wget no omitirá el contenido cuando el servidor responde con un código de estado HTTP que indicaerror.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 18/59

'‐‐trust‐server‐nombres'

Si esto está activado, en una redirección se utilizará el último componente de la redirección de URL como nombre dearchivo local. Por defecto se utiliza el último componente en la URL original.

'‐‐auth‐no‐desafío'

Si se da esta opción, Wget enviará información de autenticación HTTP básica (nombre de usuario y contraseña en textoplano) para todas las solicitudes, al igual que Wget 1.10.2 y antes lo hizo de forma predeterminada.

No se recomienda el uso de esta opción, y sólo se dirige a apoyar a algunos pocos servidores oscuros, que nunca envíandesafíos de autenticación HTTP, pero aceptan información de autenticación no solicitado, por ejemplo, además de laautenticación basada en formar.

Siguiente: Opciones de FTP , Previous: HTTP Opciones , Up: Invocando [ Contenidos ] [ Índice ]

2.8 HTTPS (SSL / TLS) Opciones

Para apoyar cifrados HTTP (HTTPS) descargas, Wget se debe compilar con una biblioteca SSL externa, actualmente OpenSSL.Si Wget es compilado sin soporte SSL, ninguna de estas opciones están disponibles.

'‐‐secure protocolo = protocolo'

Elija el protocolo seguro para ser utilizado. Los valores permitidos son'auto','SSLv2','SSLv3','TLSv1','TLSv1_1','TLSv1_2'Y'PFS'. Si 'auto'Se utiliza, la biblioteca SSL se le da la libertad de elegir elprotocolo apropiado de forma automática, que se logra mediante el envío de un saludo TLSv1. Este es el valorpredeterminado.

Especificando 'SSLv2','SSLv3','TLSv1','TLSv1_1'O'TLSv1_2'Obliga al uso del protocolo correspondiente. Esto es útil cuando sehabla de las implementaciones de edad y con errores SSL de servidor que hacen que sea difícil para la biblioteca SSLsubyacente para elegir la versión del protocolo correcto. Afortunadamente, estos servidores son bastante raros.

Especificando 'PFS'Hace cumplir el uso de los llamados conjuntos de cifrado directa perfecta seguridad. En resumen, laSLP añade seguridad al crear una clave única para cada conexión SSL. Tiene un poco más el impacto de la CPU en elcliente y el servidor. Utilizamos conocidos por ser cifrados seguros (por ejemplo, no MD4) y el protocolo TLS.

'de sólo ‐‐https'

Cuando está en modo recursivo, se siguen únicos vínculos HTTPS.

'‐‐no‐check‐certificado'

No comprobar el certificado del servidor contra las entidades emisoras de certificados disponibles. Asimismo, no serequerirá el nombre de URL de host para que coincida con el nombre común presentada por el certificado.

A partir de Wget 1,10, el valor predeterminado es verificar el certificado del servidor contra las autoridades decertificación reconocidas, rompiendo el protocolo de enlace SSL y abortar la descarga si la verificación falla. Aunqueesto proporciona descargas más seguras, lo hace romper la interoperabilidad con algunos sitios que funcionaban conversiones anteriores Wget, especialmente los que utilizan la auto­firmado, expirado, o de otra manera certificados noválidos. Esta opción obliga a un modo de "inseguridad" de la operación que convierte los errores de verificación decertificado en advertencias y le permite continuar.

Si encuentra errores "de verificación del certificado" o los que dicen que "nombre común no coincide con el nombre dehost solicitado", puede utilizar esta opción para omitir la verificación y continuar con la descarga. Sólo use esta opción sies lo contrario convencidos de la la autenticidad del sitio, o si realmente no se preocupan por la validez de sucertificado. Es casi siempre una mala idea de no verificar los certificados cuando se transmiten datos confidenciales oimportantes.

'‐‐certificate = archivo'

Utilice el certificado de cliente almacenada en el archivo . Esto es necesario para los servidores que están configuradospara requerir certificados de los clientes que se conectan a ellos. Normalmente no se requiere un certificado y esteinterruptor es opcional.

'de tipo ‐‐certificate = tipo'

Especifique el tipo de certificado de cliente. Los valores permitidos son 'PEM'(Que se supone por defecto) y'DER', Tambiénconocido como'ASN1'.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 19/59

'‐clave, correspondiente a los = archivo'

Lea la clave privada del archivo . Esto le permite proporcionar la clave privada en un archivo separado del certificado.

'tipo, correspondiente a los de clave = tipo'

Especifique el tipo de la clave privada. Los valores aceptados son "PEM'(Por defecto) y'DER'.

'‐‐ca certificado = archivo'

Utilice el archivo como el archivo con el conjunto de las autoridades de certificación ("CA") para verificar loscompañeros. Los certificados deben estar en formato PEM.

Sin esta opción Wget busca certificados de CA en los lugares especificados por el sistema, elegido durante la instalaciónde OpenSSL.

'‐‐ca‐directorio = directorio'

Especifica directorio que contiene certificados de CA en formato PEM. Cada archivo contiene un certificado de CA, y elnombre del archivo se basa en un valor hash derivada del certificado. Esto se consigue mediante el procesamiento de undirectorio certificado con el c_rehash utilidad suministrado con OpenSSL. El uso de '‐‐ca‐directorio'Es más eficienteque'‐‐ca‐certificado"Cuando se instalan muchos certificados, ya que permite Wget a buscar certificados en la demanda.

Sin esta opción Wget busca certificados de CA en los lugares especificados por el sistema, elegido durante la instalaciónde OpenSSL.

'‐‐crl‐file = fichero'

Especifica un archivo CRL en archivo . Esto es necesario para los certificados que se han revocated por las entidadesemisoras.

'‐‐random‐file = fichero'

[OpenSSL y LibreSSL sólo] Utilice el archivo como fuente de datos aleatorios para sembrar el generador de númerospseudo­aleatorios en sistemas sin/ Dev / urandom.

En tales sistemas, la biblioteca SSL necesita una fuente externa de aleatoriedad para inicializar. El azar puede serproporcionada por EGD (ver '‐‐egd‐file"Más adelante) o leer desde una fuente externa especificada por el usuario. Si nose especifica esta opción, Wget busca datos aleatorios en $ RANDFILE o, en caso de que no está definida, en$ HOME / .rnd.

Si usted está recibiendo el "No se pudo sembrar OpenSSL PRNG; desactivando el SSL. "error, debe proporcionar datosaleatorios usando algunos de los métodos descritos anteriormente.

'‐‐egd‐file = fichero'

[OpenSSL sólo] Utilice el archivo como la toma EGD. EGD significa Entropía , un programa de espacio de usuario querecoge datos de diversas fuentes del sistema impredecibles y pone a disposición de otros programas que pudierannecesitarlo. El software de cifrado, como la biblioteca SSL, necesita fuentes de aleatoriedad no repetitivo inicializar elgenerador de números aleatorios utilizado para producir claves criptográficamente fuertes.

OpenSSL permite al usuario especificar su propia fuente de entropía usando el RAND_FILE variable de entorno. Si estavariable no está definida, o si el archivo especificado no produce suficiente aleatoriedad, OpenSSL leer datos aleatoriosde socket EGD especificados mediante esta opción.

Si no se especifica esta opción (y el comando de inicio equivalente no se utiliza), EGD nunca se pone en contacto. EGDno es necesario en sistemas Unix modernos que soportan/ Dev / urandom.

'‐‐warc‐file = fichero'

Utilice el archivo que el archivo de la ARM destino.

'‐‐warc‐header = cadena'

Utilice cadena en que el registro warcinfo.

'‐‐warc‐max‐size = tamaño'

Establezca el tamaño máximo de los archivos de la ARM a tamaño .

'‐‐warc‐cdx'

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 20/59

Escribe archivos de índice CDX.

'‐‐warc‐dedup = archivo'

No guarde los registros que figuran en este archivo CDX.

'‐‐no‐ARM‐compresión'

No comprimir archivos de la ARM con GZIP.

'‐‐no‐CAMR‐digiere'

No calcular digiere SHA1.

'‐‐no‐ARM‐mantener‐log'

No guarde el archivo de registro en un registro de la ARM.

'‐‐warc‐tempdir = dir'

Especifique la ubicación de los archivos temporales creados por el escritor de la ARM.

Siguiente: recursivas Opciones de recuperación , Previous: HTTPS (SSL / TLS) Opciones , Up: Invocando [ Contenidos ] [Índice ]

2.9 Opciones de FTP

'‐‐ftp‐user = usuario''‐‐ftp‐password = contraseña'

Especifique el nombre de usuario de usuario y la contraseña de la contraseña en un FTP servidor. Sin esto, o la opción deinicio correspondiente, los valores por defecto de contraseña a '‐wget @', Que se utiliza normalmente para FTP anónimo.

Otra forma de especificar nombre de usuario y la contraseña se encuentra en la dirección URL en sí (ver URL Formato ).Cualquier método revela su contraseña a nadie a quién le importa correr ps . Para evitar que las contraseñas de ser visto,les guarde en.wgetrc o .netrcY asegúrese de proteger los archivos de otros usuarios con chmod . Si las contraseñas sonmuy importantes, no los deje acostado en esos archivos ya sea a editar los archivos y borrarlos después Wget hacomenzado la descarga.

'‐‐no‐remove‐lista'

No quite el temporal .listingarchivos generados por FTP recuperaciones. Normalmente, estos archivos contienen loslistados de directorios primas recibidas de FTP servidores. No eliminación de ellos pueden ser útiles para fines dedepuración, o cuando se desea poder comprobar fácilmente en el contenido de los directorios del servidor remoto (porejemplo, para verificar que un espejo que se está ejecutando es completa).

Tenga en cuenta que a pesar de que Wget escribe a un nombre de archivo conocido para este archivo, esto no es unagujero de seguridad en el escenario de una toma de usuario .listing un enlace simbólico / Etc / passwdo algo y pedirroot para ejecutar Wget en su directorio. Dependiendo de las opciones que ha utilizado, ya sea Wget se negará aescribir.listing, Por lo que la operación se estaban utilizando comodines / recursividad / sellado de tiempo fallan o elenlace simbólico se eliminarán y se sustituirán por el real .listing archivo, o la oferta se escribirá en un .listing.número presentar.

A pesar de que esta situación no es un problema, sin embargo, la raíz debe nunca ejecutar Wget en el directorio de unusuario que no sea de confianza. Un usuario podría hacer algo tan simple como la vinculaciónindex.html a / Etc /passwd y pidiendo raíz para ejecutar Wget con '‐N'O'‐r"Así se sobrescribe el archivo.

'‐‐no‐glob'

Apague FTP globbing. Englobamiento se refiere al uso de caracteres especiales de concha ( comodines ), como'*','?','['Y']'Para recuperar más de un archivo desde el mismo directorio a la vez, como:

ftp://gnjilux.srk.fer.hr/*.msg wget

Por defecto, globbing será activado si el URL contiene un carácter globbing. Esta opción se puede utilizar para activar odesactivar el englobamiento de forma permanente.

Puede que tenga que citar la URL para protegerlo de ser expandido en su concha. Englobamiento hace Wget buscar unlistado de directorio, que es específico del sistema. Es por esto que en la actualidad sólo funciona con Unix FTP servidores

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 21/59

(y los que emulan Unix ls salida).

'‐‐no‐pasivo‐ftp'

Deshabilitar el uso de la pasiva modo de transferencia FTP. Mandatos FTP pasivos que el cliente se conectan al servidorpara establecer la conexión de datos en lugar de al revés.

Si el equipo está conectado directamente a Internet, FTP pasiva y activa debería funcionar igual de bien. Detrás de lamayoría de las configuraciones de firewall y NAT FTP pasivo tiene una mejor oportunidad de trabajo. Sin embargo, enalgunas configuraciones de firewall raros, activa FTP realmente funciona cuando FTP pasivo no lo hace. Si ustedsospecha que este es el caso, utilice esta opción, o conjunto passive_ftp = off en su archivo de inicio.

'‐permisos ‐‐preserve'

Preservar los permisos de archivos remotos en lugar de permisos otorgados por umask.

'‐‐retr‐symlinks'

Por defecto, cuando se recuperan FTP directorios de forma recursiva y se encuentra un enlace simbólico, el enlacesimbólico es atravesada y la puntas de los archivos se recuperan. Actualmente, Wget no atraviesa enlaces simbólicos a losdirectorios que descargarlos de forma recursiva, aunque esta característica se puede añadir en el futuro.

Cuándo '‐‐retr‐symlinks = sin'Se especifica, el vinculado a presentar no se descarga. En su lugar, se crea un enlacesimbólico a juego en el sistema de archivos local. El punta­a presentar no serán recuperados a menos que estarecuperación recursiva habría encontrado por separado y descargado de todos modos. Esta opción supone un riesgo deseguridad donde un servidor FTP malicioso puede provocar Wget para escribir en archivos fuera de los directoriosdeseados a través de una especialmente diseñada .LISTING archivo.

Tenga en cuenta que cuando se recupera un archivo (no un directorio), ya que se especificó en la línea de comandos, y noporque se recursed a, esta opción no tiene efecto. Los enlaces simbólicos siempre se atraviesan en este caso.

Siguiente: recursiva de aceptación / rechazo Opciones , Previous: Opciones FTP , Up: Invocando [ Contenidos ] [ Índice ]

2.10 recursivas Opciones de recuperación

'‐r''‐‐recursive'

Encienda recuperación recursiva. Ver recursiva Descargar , para más detalles. La profundidad máxima por defecto es 5.

'‐l profundidad''‐‐level = profundidad'

Especifique recursividad máximo nivel de profundidad de profundidad (ver recursiva Descargar ).

'‐‐delete después'

Esta opción le dice Wget eliminar cada archivo se descarga, después de haberlo hecho. Es útil para pre­ir a buscar páginaspopulares a través de un proxy, por ejemplo:

wget ‐r ‐nd ‐‐delete después http://whatever.com/~popular/page/

El '‐r'Opción es recuperar de forma recursiva, y'‐nd"Para no crear directorios.

Tenga en cuenta que '‐‐delete después'Borra archivos en el equipo local. No emite la 'DELE"Mando a sitios FTP remotos,por ejemplo. También tenga en cuenta que cuando '‐‐delete después'Se especifica,'‐‐convert enlaces'Se ignora, por loque'.orig'Archivos simplemente no se crean en el primer lugar.

'‐k''‐‐convert enlaces'

Después de finalizada la descarga, convertir los vínculos del documento para que sean adecuados para la visualizaciónlocal. Esto afecta no sólo a los hipervínculos visibles, pero cualquier parte del documento que vincula a contenidoexterno, como imágenes incrustadas, enlaces a hojas de estilo, hipervínculos a no HTML contenido, etc.

Cada enlace se cambió en una de las dos maneras:

Los enlaces a los archivos que se han descargado por Wget serán cambiadas para hacer referencia al archivo queseñalan como un vínculo relativo.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 22/59

Ejemplo: si el archivo descargado /foo/doc.html enlaces a /bar/img.gif, También descargaron, a continuación elenlace en doc.html será modificado para que apunte a "../bar/img.gif'. Este tipo de transformación funciona deforma fiable para las combinaciones arbitrarias de directorios.

Los enlaces a archivos que no han sido descargados por Wget serán cambiados para incluir el nombre de host y laruta absoluta de la ubicación que apuntan.

Ejemplo: si el archivo descargado /foo/doc.html enlaces a /bar/img.gif (O en las ../bar/img.gif), Acontinuación el enlace en doc.html será modificado para que apunte a http: // nombre de host /bar/img.gif.

Debido a esto, la navegación local, funciona de forma fiable: si un archivo vinculado se descargó, el vínculo se referirá asu nombre local; si no se ha descargado, el vínculo se referirá a su dirección completa de Internet en lugar de presentar unenlace roto. El hecho de que los antiguos vínculos se convierten en enlaces relativos asegura que se puede mover lajerarquía descargados en otro directorio.

Tenga en cuenta que sólo al final de la descarga puede Wget saber qué vínculos se han descargado. Debido a eso, eltrabajo realizado por '‐k'Se llevará a cabo al final de todas las descargas.

'‐K''‐‐backup convertido‐'

Al convertir un archivo, copia de seguridad de la versión original con un '.orig'Sufijo. Afecta el comportamiento de '‐N'(Ver HTTP de sellado de tiempo Internos ).

'‐m''‐‐mirror'

Activar opciones adecuadas para la creación de reflejo. Esta opción activa la recursividad y la hora­stamping, establecenivel de recursividad infinita y mantiene FTP listados de directorios. En la actualidad es equivalente a '‐r ‐N ‐l inf ‐‐no‐remove‐lista'.

'‐p''‐‐page‐requisitos'

Esta opción hace que Wget para descargar todos los archivos que son necesarios para visualizar correctamente undeterminado HTML página. Esto incluye cosas tales como imágenes, sonidos, inline y hojas de estilo que se hacereferencia.

Normalmente, cuando se descarga un solo HTML página, todos los documentos necesarios que puedan ser necesarios paravisualizar correctamente no se descargan. El uso de '‐r'Junto con'‐l'Pueden ayudar, pero desde Wget no distinguenormalmente entre documentos externos e inline, uno se deja generalmente con "documentos de hoja" que faltan susrequisitos.

Por ejemplo, supongamos documento 1.htmlcontiene un <IMG> referenciación etiqueta1.gify un <A> etiqueta señalandodocumento externo2.html. Decir que2.html es similar, pero que su imagen es 2.gif y que se vincula a 3.html. Decir estocontinúa hasta algún número arbitrariamente alto.

Si uno ejecuta el comando:

wget ‐r ‐l 2 http: // sitio /1.html

entonces 1.html, 1.gif, 2.html, 2.gifY 3.htmlse descargará. Como se puede ver,3.html es sin su requisito 3.gif porqueWget es simplemente contando el número de saltos (hasta 2) de 1.htmla fin de determinar dónde parar la recursión. Sinembargo, con este comando:

wget ‐r ‐l ‐p 2 http: // sitio /1.html

todos los archivos anteriores y 3.html'S requisito 3.gif se descargará. Del mismo modo,

wget ‐r ‐l ‐p 1 http: // sitio /1.html

causará 1.html, 1.gif, 2.htmlY 2.gif para ser descargado. Uno podría pensar que:

wget ‐r ‐l ‐p 0 http: // sitio /1.html

descargaría sólo 1.html y 1.gif, Pero lamentablemente este no es el caso, porque '‐l 0'Equivale a'inf ‐l'­es Decir, larecursividad infinita. Para descargar un solo HTML de la página (o un puñado de ellos, todo lo especificado en la línea decomandos o en un '‐yo' URL del archivo de entrada) y sus (o sus) requisitos, simplemente dejan fuera '‐r'Y'‐l':

wget http ‐p: // sitio /1.html

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 23/59

Tenga en cuenta que Wget se comportará como si "‐r'Habían sido especificado, pero sólo esa única página y susrequisitos serán descargados. No se siguieron Enlaces desde que página a documentos externos. En realidad, paradescargar una sola página y todos sus requisitos (incluso si existen en sitios web separados), y asegúrese de que el lote semuestra correctamente a nivel local, este autor le gusta usar algunas opciones además a '‐p':

wget ‐E ‐H ‐k ‐K ‐p http: // sitio / documento

Para terminar este tema, vale la pena saber que la idea de Wget de un vínculo de documento externo es cualquier URLespecificada en un <A> etiqueta, un <AREA> etiqueta, o un <link> etiqueta distinta <link rel = "stylesheet"> .

'‐‐strict‐comments'

Encienda el estricto análisis de HTML comentarios. El valor por defecto es terminar comentarios en la primera apariciónde '‐>'.

De acuerdo a las especificaciones, HTML comentarios se expresan como SGML declaraciones . Declaración es marcadoespecial que comienza con '<!'Y termina con'>', Tal como'<! DOCTYPE ...>', Que pueden contener comentarios entre unpar de'‐'Delimitadores. HTML comentarios son "declaraciones vacías", SGML declaraciones sin ningún texto nocomentario. Por lo tanto, '<! ‐ Foo ‐>'Es un comentario válido, y también lo es'<! ‐ Uno‐‐ ‐‐dos ‐>', Pero'<! ‐ 1‐‐2 ‐>'No lo es.

Por otro lado, la mayoría de HTML escritores no perciben comentarios como que no sea de texto delimitado con 'cualquiercosa<! ‐'Y'‐>', Que no es exactamente lo mismo. Por ejemplo, algo así como '<! ‐‐‐‐‐‐‐‐‐‐‐‐>'Funciona como uncomentario válido siempre y cuando el número de guiones es un múltiplo de cuatro (!). Si no, el comentario duratécnicamente hasta la próxima '‐', Que puede ser en el otro extremo del documento. Debido a esto, muchos navegadorespopulares ignoran completamente la especificación e implementar lo que los usuarios han llegado a esperar: comentariosdelimitados con '<! ‐'Y'‐>'.

Hasta la versión 1.9, Wget interpretado comentarios estrictamente, lo que dio lugar a enlaces en muchas páginas web quemuestran muy bien en los navegadores que falta, pero tuvo la desgracia de que contiene los comentarios que no cumplan.A partir de la versión 1.9, Wget ha unido a las filas de clientes que implementa comentarios "ingenuos", que terminancada comentario en la primera aparición de '‐>'.

Si, por cualquier razón, desea comentario estricto análisis, utilice esta opción para encenderlo.

: Siguiente Estado de salida , Anterior: recursivas Opciones de recuperación , Up: Invocando [ Contenidos ] [ Índice ]

2.11 recursiva Aceptar / Rechazar Opciones

'‐A acclist ‐‐accept acclist''‐R rejlist ‐‐reject rejlist'

Especifique listas separadas por comas de sufijos o patrones de nombres de archivo para aceptar o rechazar (ver Tipos dearchivos ). Tenga en cuenta que si alguno de los caracteres comodín, '*','?','['O']', Aparece en un elemento de acclist orejlist , será tratado como un patrón, en lugar de un sufijo. En este caso, hay que adjuntar el patrón en comillas para evitarque el shell de expandirlo, como en '‐A "* .mp3"'O'‐A '* .mp3''.

'‐‐accept‐regex urlregex''‐‐reject‐regex urlregex'

Especifique una expresión regular para aceptar o rechazar la URL completa.

'de tipo ‐‐regex regextype'

Especifique el tipo de expresión regular. Los tipos posibles son 'posix'O'pcre'. Tenga en cuenta que para poder utilizar'pcre'Tipo, wget tiene que ser compilado con soporte libpcre.

'‐D dominio de la lista''‐‐domains = dominio de la lista'

Dominios Set a seguir. dominio de la lista es una lista separada por comas de dominios. Tenga en cuenta que lo hace noencender '‐H'.

'‐‐exclude‐dominios dominio de la lista'

Especifique los dominios que reciben no a seguir (ver Hosts Spanning ).

'‐‐follow‐ftp'

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 24/59

Siga FTP enlaces de HTML documentos. Sin esta opción, Wget ignorará todos los FTP enlaces.

'‐‐follow‐tags = lista'

Wget tiene una tabla interna de HTML pares etiqueta / atributos que considera al buscar documentos vinculados duranteuna recuperación recursiva. Si un usuario desea sólo un subconjunto de esas etiquetas a considerar, sin embargo, él o elladebe ser especificar dichas etiquetas en una separada por comas lista con esta opción.

'‐‐ignore‐tags = lista'

Esto es lo contrario de la '‐‐follow‐tags'Opción. Para omitir ciertos HTML etiquetas cuando recursivamente en busca dedocumentos para descargar, especificar en una separada por comas lista .

En el pasado, esta opción era la mejor apuesta para la descarga de una sola página y sus requisitos, mediante una línea decomandos como:

wget ‐‐ignore‐tags = a, zona ‐H ‐k ‐K ‐r http: // sitio / documento

Sin embargo, el autor de esta opción se encontró con una página con etiquetas como <link rel = "casa" HREF = "/"> yllegó a la conclusión de que la especificación de etiquetas para ignorar no era suficiente. Uno no puede simplementedecirle Wget ignorar <link> , porque entonces las hojas de estilo no se descargarán. Ahora, la mejor apuesta para ladescarga de una sola página y de sus requisitos es el dedicado '‐‐page‐requisitos'Opción.

'‐‐ignore caso'

Ignorar mayúsculas cuando se compara archivos y directorios. Esto influye en el comportamiento de ­R, ­a, ­i, y lasopciones ­X, así como globbing implementa cuando se descargan de sitios FTP. Por ejemplo, con esta opción, '‐A "*.txt"'Coincidirá'file1.txt', Pero también'file2.txt','file3.txt', Etcétera. Las comillas en el ejemplo son para evitar queel intérprete de comandos expanda el patrón.

'‐H''‐‐span‐anfitriones'

Habilitar extiende a través de los ejércitos al hacer recuperación recursiva (ver Hosts Spanning ).

'‐L''‐‐relative'

Siga los enlaces relativos solamente. Útil para recuperar una página específica a casa sin ningún tipo de distracciones, nisiquiera los de los mismos anfitriones (ver enlaces relativos ).

'‐I lista''‐‐include‐directorios = lista'

Especifica una lista separada por comas de los directorios que desea seguir al descargar (ver Límites basados endirectorios ). Elementos de lista puede contener comodines.

'‐X lista''‐‐exclude‐directorios = lista'

Especifica una lista separada por comas de los directorios que desea excluir de descarga (ver Límites basados endirectorios ). Elementos de lista puede contener comodines.

'‐np''‐‐no‐padre'

No vuelvas a subir al directorio padre al recuperar de forma recursiva. Se trata de una opción útil, ya que garantiza quesólo los archivos por debajo de una cierta jerarquía se descargarán. Ver Límites basados en directorios , para másdetalles.

Anterior: recursiva de aceptación / rechazo Opciones , Up: Invocando [ Contenidos ] [ Índice ]

Status 2.12 Salir

Wget puede devolver uno de los varios códigos de error si encuentra problemas.

0

No se presentaron problemas.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 25/59

1

Código de error genérico.

2

Analizar instancia de errores para, al analizar las opciones de línea de comandos, el '.wgetrc'O'.netrc'...

3

Error de E / S.

4

Falla en la red.

5

Falla de verificación de SSL.

6

Nombre de usuario / contraseña error de autenticación.

7

Errores de protocolo.

8

Servidor emitió una respuesta de error.

Con las excepciones de 0 y 1, los códigos de salida numerados de menor tienen prioridad sobre números más altos­queridos,cuando se encuentran varios tipos de errores.

En las versiones de Wget anteriores a 1.12, el estado de la salida de Wget tendía a ser inútil e inconsistente. Descargasrecursivas prácticamente siempre volverían 0 (éxito), independientemente de los problemas encontrados, y recuperaciones norecursivas sólo devolvió el estatus que corresponde a la más reciente intento de descarga.

Siguiente: siguientes enlaces , Previous: Invocación , Up: Top [ Índice ] [ Índice ]

3 recursiva Descargar

GNU Wget es capaz de atravesar las partes de la web (o una sola HTTP o FTP servidor), siguiendo los enlaces y estructura dedirectorios. Nos referimos a esto como a la recuperación recursivo , o recursividad .

Con HTTP URL s, Wget recupera y analiza el HTML o CSS del dado URL , la recuperación de los archivos el documento hacereferencia, a través de marcas como href o src , o CSS URI valores especificados usando la 'url ()'Notación funcional. Si elarchivo recién descargado es también de tipo text / html , application / xhtml + xml o text / css , será analizado y siguióadelante.

Recuperación recursiva de HTTP y HTML / CSS contenido es amplitud­primero . Esto significa que Wget primera descarga eldocumento solicitado, entonces los documentos enlaces desde ese documento, los documentos unidos por ellos, y asísucesivamente. En otras palabras, Wget descarga primero los documentos en profundidad 1, entonces los que están en laprofundidad 2, y así sucesivamente hasta que la profundidad máxima especificada.

La máxima profundidad a la que la recuperación puede descender se especifica con la '‐l'Opción. La profundidad máxima pordefecto es de cinco capas.

Al recuperar un FTP URL recursiva, Wget recuperará todos los datos del árbol de directorios dado (incluyendo los subdirectorioshasta la profundidad especificada) en el servidor remoto, la creación de su imagen en el espejo a nivel local. FTP recuperacióntambién está limitada por la profundidad de parámetros. A diferencia de HTTP recursividad, FTP recursividad se realiza primeroen profundidad.

Por defecto, Wget creará un árbol de directorio local, correspondiente a la que se encuentra en el servidor remoto.

Recuperación recursiva puede encontrar un número de aplicaciones, la más importante de las cuales está reflejando. También esútil para WWW presentaciones y cualquier otra oportunidad donde las conexiones de red lentas deben ser anuladas mediante el

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 26/59

almacenamiento de los archivos de forma local.

Usted debe ser advertido de que las descargas recursivas pueden sobrecargar los servidores remotos. Debido a esto, muchosadministradores de fruncir el ceño a ellos y pueden prohibir el acceso de su sitio si detectan descargas muy rápidas de grandescantidades de contenido. Cuando la descarga desde los servidores de Internet, considere el uso de la '‐w'Opción de introducir unretardo entre accesos al servidor. La descarga tardará un tiempo más largo, pero el administrador del servidor no se alarme porsu rudeza.

Por supuesto, descarga recursiva puede causar problemas en su máquina. Si se deja de correr sin control, puede fácilmentellenar el disco. Si la descarga desde la red local, también puede tener el ancho de banda en el sistema, así como consumir lamemoria y la CPU.

Trate de especificar los criterios que coinciden con el tipo de descarga que está tratando de lograr. Si quiere descargar sólo unapágina, use '‐‐page‐requisitos'Sin recursividad adicional. Si quiere descargar gratis las cosas bajo un mismo directorio, utilice'‐np'Para evitar la descarga de las cosas desde otros directorios. Si desea descargar todos los archivos de un directorio, utilice '‐l1'Para asegurarse de que el nivel de recursividad no supera nunca una. Ver siguientes enlaces para obtener más informaciónacerca de esto.

Recuperación recursiva debe utilizarse con cuidado. No digas que no fueron advertidos.

Siguiente: de sellado de tiempo , anterior: Descargar recursiva , Up: Top [ Índice ] [ Índice ]

4 siguientes enlaces

Al recuperar de forma recursiva, uno no desea para recuperar un montón de datos innecesarios. La mayoría del tiempo losusuarios que tener en cuenta exactamente lo que quieren descargar, y quieren Wget seguir enlaces sólo específicos.

Por ejemplo, si desea descargar el archivo de música de 'fly.srk.fer.hr', Usted no tendrá que descargar todas las páginasprincipales que pasan a ser referenciado por una parte oscura del archivo.

Wget posee varios mecanismos que le permite ajustar con precisión, que lo une seguirá.

• Que abarca los Ejércitos : (Un) la recuperación de la limitación en función del nombre de host.• Tipos de archivos : Conseguir sólo ciertos archivos.• Límites basado en directorios : Conseguir sólo ciertos directorios.• Enlaces relativos : Siga los enlaces relativos solamente.• Enlaces de FTP : Después de enlaces FTP.

Siguiente: Tipos de archivos , Previous: Seguimiento de enlaces , Up: siguientes enlaces [ Contenidos ] [ Índice ]

4.1 Hosts Spanning

Recuperación recursiva de Wget normalmente se niega a visitar diferentes hosts que el especificado en la línea de comandos.Este es un defecto razonable; sin él, cada recuperación tendría el potencial para convertir su Wget en una pequeña versión degoogle.

Sin embargo, visitar diferentes hosts o anfitrión que abarca, a veces es una opción útil. Tal vez las imágenes se sirven desde unservidor diferente. Tal vez usted está reflejando un sitio que consta de páginas vinculadas entre tres servidores. Tal vez elservidor tiene dos nombres equivalentes, y los HTML páginas se refieren a ambos indistintamente.

Span a cualquier host­ '‐H'

El '‐H'Opción activa spanning anfitrión, lo que permite ejecución recursiva de Wget para visitar cualquier hostreferenciado por un enlace. A menos que se apliquen profundidad suficientes criterios de recursividad limitativo, estosejércitos extranjeros suelen vincular todavía más hosts, y así sucesivamente hasta Wget termina absorbiendo muchos másdatos que usted ha previsto.

Limite de expansión para ciertos ámbitos mencionados '‐D'

El '‐D'Opción le permite especificar los dominios que se seguirán, lo que limita la recursividad sólo a los hosts quepertenecen a estos dominios. Obviamente, esto tiene sentido sólo en combinación con '‐H'. Un ejemplo típico seríadescargando el contenido del 'www.server.com', Pero que permiten descargas de'images.server.com', Etc .:

wget ‐RH ‐Dserver.com http://www.server.com/

Puede especificar más de una dirección separándolas con una coma, por ejemplo '‐Ddomain1.com, Domain2.com'.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 27/59

Mantenga descarga fuera cierto Dominios­ '‐‐exclude‐dominios'

Si hay dominios que desea excluir específicamente, puede hacerlo con '‐‐exclude‐dominios', Que acepta el mismo tipo deargumentos de'‐D', Pero se excluyen todos los dominios listados. Por ejemplo, si quiere descargar todas las huestes de'foo.edu"Dominio, con la excepción de 'sunsite.foo.edu', Puede hacerlo de esta manera:

wget ‐RH ‐Dfoo.edu ‐‐exclude‐dominios sunsite.foo.edu \ http://www.foo.edu/

Siguiente: Límites basado en directorios , Previous: Que abarca los Ejércitos , Up: siguientes enlaces [ Contenidos ] [ Índice ]

4.2 Tipos de Archivos

Al descargar el material de la web, que a menudo se quiere restringir la recuperación de sólo ciertos tipos de archivos. Porejemplo, si usted está interesado en descargar GIF s, usted no estará muy contento de conseguir un montón de documentosPostScript, y viceversa.

Wget ofrece dos opciones para hacer frente a este problema. La descripción de cada opción enumera un nombre corto, unnombre largo, y la orden equivalente en.wgetrc.

'‐A acclist''‐‐accept acclist''accept = acclist''‐‐accept‐regex urlregex''accept‐regex = urlregex'

El argumento de '‐‐accept'Opción es una lista de sufijos de archivo o patrones que Wget descargará durante larecuperación recursiva. Un sufijo es la parte final de un archivo, y se compone de las letras "normales", como porejemplo 'gif'O'.jpg'. Una coincidencia de patrones contiene comodines­shell como, por ejemplo 'libros *'O'zelazny *196 [0‐9] *'.

Así, especificando 'gif ‐A wget, jpg'Hará Wget descargar sólo los archivos que terminan con'gif'O'jpg', Es decir, GIF s yJPEG s. Por otra parte, '‐A wget "zelazny * 196 [0‐9] *"'Descargará sólo los archivos que comienzan con'zelazny'Y quecontienen los números 1960­1969 en cualquier lugar dentro. Busque el manual de su cáscara para obtener una descripciónde cómo funciona la coincidencia de patrones.

Por supuesto, cualquier número de sufijos y los patrones se pueden combinar en una lista separada por comas, y dadocomo un argumento para '‐A'.

El argumento de '‐‐accept‐regex'Opción es una expresión regular que se compara con la URL completa.

'‐R rejlist''‐‐reject rejlist''rechazar = rejlist''‐‐reject‐regex urlregex''rechazar‐regex = urlregex'

El '‐‐reject'Opción funciona del mismo modo que'‐‐accept', Sólo su lógica es la inversa; Wget descargará todos losarchivos excepto los que coinciden con los sufijos (o patrones) en la lista.

Así que, si quiere descargar una página entera a excepción de los engorrosos MPEG s y .AU archivos, puede utilizar 'wget‐R mpg, mpeg, au'. Análogamente, para descargar todos los archivos excepto los que empiezan con 'bjork', Utilice'wget ‐R "bjork *"'. Las citas son para prevenir la expansión de la cáscara.

El argumento de '‐‐accept‐regex'Opción es una expresión regular que se compara con la URL completa.

El '‐A'Y'‐R'Opciones se pueden combinar para lograr aún mejor puesta a punto de los archivos que desea recuperar. Por ejemplo'wget ‐A "* Zelazny *" ‐R .ps'Descargará todos los archivos que tiene'zelazny"Como parte de su nombre, pero no los archivosPostScript.

Tenga en cuenta que estas dos opciones no afectan a la descarga de HTML archivos (como se determina por un'.htm'O'.html'Prefijo de nombre de archivo). Este comportamiento puede no ser conveniente para todos los usuarios, y puede sercambiado para futuras versiones de Wget.

Tenga en cuenta, también, que las cadenas de consulta (cuerdas al final de una dirección URL que empieza con un signo deinterrogación ('?') No están incluidos como parte del nombre de archivo para aceptar / rechazar normas, a pesar de que éstosrealmente contribuir al nombre elegido para el archivo local. Se espera que una versión futura de Wget proporcionará unaopción para permitir a juego contra cadenas de consulta.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 28/59

Por último, vale la pena señalar que la aceptación / rechazo listas coinciden dos veces contra los archivos descargados: una vezcontra la parte de nombre de archivo de la URL, para determinar si el archivo debe ser descargado en el primer lugar; luego,después de que ha sido aceptada y descarga con éxito, el nombre del archivo local también se comprueba con el / rechazaraccept listas para ver si debe ser eliminado. La razón era que, puesto que '.htm'Y'.html'Archivos siempre se descarganindependientemente de aceptar / rechazar normas, deben ser retirados después de la descarga y escaneado para los enlaces, si lohicieran juego con el / rechazo accept listas. Sin embargo, esto puede conducir a resultados inesperados, ya que los nombres dearchivos locales pueden diferir de los nombres de archivo originales URL de la siguiente manera, todo lo cual puede cambiar siuna aceptación / rechazo regla partidos:

Si el archivo local ya existe y '‐‐no‐directorios'Se ha especificado, un sufijo numérico se anexará al nombre original.Si '‐‐adjust‐extensión'Se ha especificado, el nombre del archivo local podría tener ".html'Anexado a él. Si Wget esinvocado con "‐E ‐A.php', Un nombre de archivo como'index.php'Coincidirá ser aceptado, pero en descarga seránombrado'index.php.html', Que ya no coincide, por lo que se elimina el archivo.Las cadenas de consulta no contribuyen a la coincidencia de URL, pero se incluyen en los nombres de archivos locales,por lo que no contribuyen a nombre coincidente.

Este comportamiento también se considera menos de lo deseable, y puede cambiar en una futura versión de Wget.

Siguiente: enlaces relativos , Previous: Tipos de archivos , Arriba: siguientes enlaces [ Contenidos ] [ Índice ]

4.3 Límites basado en directorios

Independientemente de otras instalaciones de enlace­siguiente, a menudo es útil para colocar la restricción de qué archivos pararecuperar basado en los directorios de los archivos se colocan en. No puede haber muchas razones para esto, las páginas puedenser organizados en una estructura de directorios razonable ; o algunos directorios pueden contener información inútil, porejemplo,/ Cgi‐bin o / Dev directorios.

Wget ofrece tres opciones diferentes para hacer frente a este requisito. La descripción de cada opción enumera un nombre corto,un nombre largo, y la orden equivalente en.wgetrc.

'‐I lista''‐‐include lista''include_directories = lista'

'‐YO'Opción acepta una lista separada por comas de los directorios incluidos en la recuperación. Simplemente se ignorantodos los otros directorios. Los directorios son rutas absolutas.

Por lo tanto, si usted desea descargar de 'http: // host / personas / bozo /'Tras sólo enlaza a los colegas de bozo en el/ personas directorio y los guiones falsos en / Cgi‐bin, Puede especificar:

wget ‐I / gente, / http cgi‐bin: // host / personas / bozo /

'‐X lista''‐‐exclude lista''exclude_directories = lista'

'‐X'Opción es exactamente lo contrario de'‐YO'­esta Es una lista de directorios excluidos de la descarga. Por ejemplo, siusted no quiere Wget para descargar cosas desde/ Cgi‐bin directorio, especifique '‐X / Cgi‐bin'En la línea de comandos.

Lo mismo que con '‐A'/'‐R', Estas dos opciones se pueden combinar para obtener una mejor puesta a punto de la descargade los subdirectorios. Por ejemplo, si desea cargar todos los archivos de/ Pub jerarquía excepción de / Pub / sin valor,Especifique '‐I / Pub ‐X / pub / sin valor'.

'‐np''‐‐no‐padre''no_parent = en'

La forma más sencilla, ya menudo muy útil de directorios limitante es no permitir la recuperación de los vínculos quehacen referencia a la jerarquía por encima de la del directorio de inicio, es decir, no permitir el ascenso a los padres dedirectorio / directorios.

El '‐‐no‐padre'Opción (corto'‐np') Es útil en este caso. Su uso garantiza que nunca saldrá de la jerarquía existente.Suponiendo que se emite Wget con:

wget ‐r http ‐‐no‐padre: // somehost / ~ luzer / mi‐archivo /

Usted puede estar seguro de que ninguna de las referencias a / ~ Sus‐girls‐homepage / o / ~ Luzer / todos‐mis‐mpegs/será seguido. Sólo el archivo usted está interesado en se descargará. En esencia, '‐‐no‐padre'Es similar a'‐I / ~ Luzer /

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 29/59

mi‐archivo', Sólo que maneja redirecciones de una manera más inteligente.

Tenga en cuenta que, para HTTP (y HTTPS), la barra final es muy importante '‐‐no‐padre'. HTTP no tiene concepto deun "directorio" ­Wget depende de usted para indicar lo que es un directorio y lo que no lo es. En 'http: // foo / bar /',Wget considerará'bar'Para ser un directorio, mientras que en'http: // foo / bar'(Sin barra inclinada),'bar'Seráconsiderado un nombre de archivo (por lo que'‐‐no‐padre'No tendría sentido, ya que su padre es'/').

Siguiente: FTP Links , Anterior: Límites basado en directorios , Up: siguientes enlaces [ Contenidos ] [ Índice ]

4.4 Enlaces relativos

Cuándo '‐L'Está activada, sólo los vínculos relativos son siempre seguidos. Los enlaces relativos se definen aquí los que no serefieren a la raíz del servidor web. Por ejemplo, estos enlaces son en relación:

<a href="foo.gif"><a href="foo/bar.gif"><a href="../foo/bar.gif">

Estos enlaces no son relativas:

<a href="/foo.gif"><a href="/foo/bar.gif"><a href="http://www.server.com/foo/bar.gif">

El uso de esta opción garantiza que la recuperación recursivo no abarcará los ejércitos, no sin '‐H'. En casos sencillos quetambién permite descargas a "sólo trabajan" sin tener que convertir enlaces.

Probablemente Esta opción no es muy útil y podría eliminarse en un futuro release.

Anterior: enlaces relativos , Up: siguientes enlaces [ Contenidos ] [ Índice ]

4.5 siguientes enlaces FTP

Las reglas para FTP son algo específico, ya que es necesario para que ellos sean. FTP enlaces en HTML documentos se incluyencon frecuencia para fines de referencia, y es a menudo incómodo para descargarlos de manera predeterminada.

Tener FTP enlaces seguido desde HTML documentos, es necesario especificar el '‐‐follow‐ftp'Opción. Una vez hecho esto, FTPenlaces abarcarán anfitriones independientemente de '‐H'Ajuste. Esto es lógico, ya que FTP enlaces rara vez apuntan a la mismamáquina donde el HTTP reside servidor. Por razones similares, la '‐L'Opciones no tiene ningún efecto sobre estas descargas. Porotro lado, la aceptación de dominio ('‐D') Y las reglas de sufijo ('‐A'Y'‐R') Se aplica normalmente.

También tenga en cuenta que siguió enlaces a FTP directorios no se pueden recuperar de forma recursiva más.

Siguiente: archivo de Inicio , Anterior: Después de Enlaces , Up: Top [ Índice ] [ Índice ]

5 de Sellado de Tiempo

Uno de los aspectos más importantes de la duplicación de la información de Internet es la actualización de sus archivos.

Descarga de todo el archivo una y otra vez, sólo para reemplazar unos archivos cambiados es caro, tanto en términos de anchode banda y dinero perdido, y el tiempo para hacer la actualización. Es por ello que todas las herramientas que reflejan ofrecen laopción de actualización gradual.

Tal mecanismo de actualización significa que el servidor remoto se escanea en busca de nuevos archivos. Sólo los nuevosarchivos se descargarán en el lugar de los antiguos.

Un archivo se considera nuevo si se cumple alguna de estas dos condiciones:

1. Un archivo con ese nombre no existe ya a nivel local.2. Un archivo con ese nombre sí existe, pero el archivo remoto se modificó más recientemente que el archivo local.

Para implementar esto, el programa tiene que ser consciente de la hora de la última modificación de dos archivos locales yremotos. Llamamos a esta información, el sello de tiempo de un archivo.

Se enciende el sellado de tiempo en GNU Wget en el uso de '‐‐timestamping'('‐NOpción '), o por medio de sellado de tiempo =en directiva .wgetrc. Con esta opción, para cada archivo que tiene la intención de descargar, Wget comprobará si existe un

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 30/59

archivo local con el mismo nombre. Si lo hace, y el archivo remoto no es nueva, Wget no descargarlo.

Si no existe el archivo local, o los tamaños de los archivos no coinciden, Wget descargará el archivo remoto no importa lo quedigan los sellos de tiempo.

• Uso de Sellado de Tiempo : • HTTP de sellado de tiempo Internos : • FTP de sellado de tiempo Internos :

Siguiente: HTTP de sellado de tiempo Internos , Previous: de sellado de tiempo , Up: de Sellado de Tiempo [ Contenidos ] [Índice ]

Uso 5.1 de Sellado de Tiempo

El uso del tiempo­estampado es simple. Digamos que usted desea descargar un archivo de forma que mantiene su fecha demodificación.

wget ‐S http://www.gnu.ai.mit.edu/

Un simple ls ‐l muestra que la marca de tiempo en el archivo local es igual al estado del Last‐Modified cabecera, como eldevuelto por el servidor. Como puede ver, la información de sellado de tiempo se conserva localmente, incluso sin '‐N'(Almenos para HTTP ).

Varios días más tarde, que le gustaría Wget para comprobar si el archivo remoto ha cambiado, y descargarlo si tiene.

wget ‐N http://www.gnu.ai.mit.edu/

Wget le pedirá al servidor para la fecha de última modificación. Si el archivo local tiene la misma marca de tiempo que elservidor, o uno más nuevo, el archivo remoto no se volverá a descabellada. Sin embargo, si el archivo remoto es más reciente,Wget procederá a buscarla.

Lo mismo ocurre con FTP . Por ejemplo:

wget "ftp://ftp.ifi.uio.no/pub/emacs/gnus/*"

(Las comillas que son URL para evitar que la cáscara de tratar de interpretar la '*'.)

Después de la descarga, un listado de directorio local muestran que las marcas de tiempo coincide con el del servidor remoto.Volver a emitir el comando con '‐N'Hará Wget re­fetch sólo los archivos que han sido modificados desde la última descarga.

Si usted deseaba reflejar el archivo GNU cada semana, se utilizaría un comando como el siguiente, semanal:

wget ‐r ‐‐timestamping ftp://ftp.gnu.org/pub/gnu/

Tenga en cuenta que el tiempo de estampado sólo funcionará para los archivos para los que el servidor da un sello de tiempo.Para HTTP , esto depende de la obtención de un Last‐Modified cabecera. Para FTP , esto depende de la obtención de un listadode directorio con fechas en un formato que Wget puede analizar (véase FTP de sellado de tiempo Internos ).

Siguiente: FTP de sellado de tiempo Internos , Previous: Uso de sellado de tiempo , Up: de Sellado de Tiempo [ Contenidos ] [Índice ]

5.2 HTTP de sellado de tiempo Internos

Fechado en HTTP se implementa mediante la comprobación del Last‐Modified cabecera. Si desea recuperar el archivofoo.htmla través de HTTP , Wget comprobará si foo.htmlexiste a nivel local. Si no lo hace,foo.html se recuperaráincondicionalmente.

Si el archivo existe localmente, Wget comprobará primero su sello de tiempo local (similar a la forma en que ls ‐l locomprueba), y después enviar un CABEZA solicitud al servidor remoto, exigiendo la información sobre el archivo remoto.

El Last‐Modified encabezado se examina para encontrar qué archivo se ha modificado más recientemente (que hace que sea"nuevo"). Si el archivo remoto es más reciente, se descargará; si es más antigua, Wget se dio por vencido. 2

Cuándo '‐‐backup convertido‐'('‐K') Se especifica en conjunción con'‐N', De archivos del servidor'X'Se compara con el archivolocal "X .orig', Si existe, en lugar de ser comparado con el archivo local "X', Que siempre será diferente si ha sido convertidapor'‐‐convert enlaces'('‐k').

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 31/59

Podría decirse que, HTTP tiempo estampación debe implementarse utilizando el If‐Modified‐Since petición.

Anterior: HTTP de sellado de tiempo Internos , Up: de Sellado de Tiempo [ Contenidos ] [ Índice ]

5.3 FTP de sellado de tiempo Internos

En teoría, FTP obras de sellado de tiempo muy parecido al HTTP , sólo FTP no tiene headers­sellos de tiempo se deben descubríande los listados de directorios.

Si un FTP descarga es recursivo o utiliza esta expansión, Wget utilizará el FTP LISTA comando para obtener una lista de archivospara el directorio que contiene el archivo (s) deseado. Se tratará de analizar el perfil, tratándolo como Unix ls ‐l salida, laextracción de los sellos de tiempo. El resto es exactamente el mismo que para HTTP . Tenga en cuenta que al recuperar archivosindividuales desde un FTP servidor sin usar comodines o recursividad, el listado de archivos no será descargado (y por lo tantolos archivos no estarán con marca de tiempo) a menos '‐N'Se especifica.

Asunción que cada anuncio en el directorio es un listado de estilo Unix puede sonar extremadamente restrictivo, pero en lapráctica no lo es, ya que muchos no­Unix FTP servidores utilizan el formato de lista Unixoid porque la mayoría (todos?) de losclientes entenderlo. Tenga en cuenta que RFC959 define ninguna forma estándar para obtener una lista de archivos, por no hablarde las marcas de tiempo. Sólo podemos esperar que una futura norma definirá esto.

Otra solución no estándar incluye el uso de MDTM comando que es apoyada por algunos FTP servidores (incluyendo el popularwu‐ftpd ), que devuelve el tiempo exacto del archivo especificado. Wget puede apoyar a este comando en el futuro.

Siguiente: Ejemplos , Previous: sellado de tiempo , Up: Top [ Índice ] [ Índice ]

6 Puesta en marcha del archivo

Una vez que sepa cómo cambiar la configuración por defecto de Wget través de argumentos de la línea de comandos, es posibleque desee hacer algunos de esos ajustes sean permanentes. Usted puede hacer eso de una forma sencilla mediante la creación dela puesta en marcha Archivo­ Wget.wgetrc.

Además .wgetrces el archivo de inicialización "principal", es conveniente contar con una instalación especial para almacenarcontraseñas. Así Wget lee e interpreta el contenido de$ HOME / .netrc, Si lo encuentra. Usted puede encontrar.netrc formatoen los manuales del sistema.

Wget lee .wgetrc en el arranque, el reconocimiento de un conjunto limitado de comandos.

• wgetrc Ubicación : Ubicación de varios archivos wgetrc.• Sintaxis wgetrc : Sintaxis de wgetrc.• Comandos wgetrc : Lista de los comandos disponibles.• wgetrc Muestra : Un ejemplo wgetrc.

Siguiente: Sintaxis wgetrc , Previous: archivo de Inicio , Up: archivo de Inicio [ Contenidos ] [ Índice ]

6.1 wgetrc Ubicación

Al inicializar, Wget buscará un mundial archivo de inicio, / Usr / local / etc / wgetrc locales por defecto (o algún prefijoque no sea / Usr / local, Si Wget no se instaló allí) y comandos de lectura a partir de ahí, si existe.

Luego buscará archivos del usuario. Si la variable ambiental wgetrc se establece, Wget intentará cargar ese archivo. En sudefecto, no se realizarán más intentos.

Si wgetrc no está establecido, Wget intentará cargar$ HOME / .wgetrc.

El hecho de que la configuración del usuario se cargan después los de todo el sistema significa que en caso de colisión wgetrcdel usuario anula la wgetrc de todo el sistema (en/ Usr / local / etc / wgetrc localespor defecto). Administradoresfascistas, lejos!

Siguiente: wgetrc Comandos , Previous: wgetrc Ubicación , Up: archivo de Inicio [ Contenidos ] [ Índice ]

6.2 Sintaxis wgetrc

La sintaxis de un comando wgetrc es simple:

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 32/59

variable = valor

La variable de también se llamará de comandos . Válidos los valores son diferentes para los diferentes comandos.

Los comandos son caso, underscore­ y­menos insensible. Así 'DIr__PrefiX','DIR‐prefix'Y'dirprefix'Son iguales. Las líneasvacías, las líneas que comienzan con '#'Y las líneas que contienen espacios en blanco sólo se descartan.

Los comandos que esperan una lista separada por comas borrará la lista en un comando vacío. Por lo tanto, si desea restablecerla lista de rechazo especificado en mundialwgetrc, Puede hacerlo con:

rechazar =

Siguiente: Muestra wgetrc , Previous: Sintaxis wgetrc , Up: archivo de Inicio [ Contenidos ] [ Índice ]

6.3 Comandos wgetrc

El conjunto completo de comandos se encuentra a continuación. Los valores admitidos se enumeran después de la '='. Losvalores booleanos simples se pueden armar o desarmar usando 'en'Y'apagado'O'1'Y'0'.

Algunos comandos toman valores pseudo arbitraria. dirección valores pueden ser nombres de host o direcciones IP de cuatro. npuede ser cualquier número entero positivo, o "inf'Para el infinito, en su caso. de cuerda valores pueden ser cualquier cadenaque no esté vacía.

La mayoría de estos comandos tienen equivalentes de línea de comandos directos. Además, cualquier comando wgetrc se puedeespecificar en la línea de comandos utilizando el '‐‐execute'Switch (ver Opciones básicas de inicio .)

aceptar / rechazar = cadena

Igual a '‐A'/'‐R'(Ver Tipos de archivos ).

add_hostdir = on / off

Activar / desactivar los nombres de archivo de acogida prefijada. '‐nH'Desactiva.

ask_password = on / off

Pedirá una contraseña para cada conexión establecida. No se puede especificar cuando '‐‐password'Está en uso, debido aque son mutuamente excluyentes. Equivalente a '‐‐ask contraseña'.

auth_no_challenge = on / off

Si se da esta opción, Wget enviará información de autenticación HTTP básica (nombre de usuario y contraseña en textoplano) para todas las solicitudes. Ver '‐‐auth‐no‐desafío'.

fondo = on / off

Activar / desactivar yendo a­fondo lo mismo que '‐b'(Lo que le permite).

backup_converted = on / off

Activar / desactivar guardar archivos convertidos previamente con el sufijo '.orig'­el Mismo que'‐K'(Lo que le permite).

Las copias de seguridad = número

Utilice un máximo de numerar las copias de seguridad de un archivo. Las copias de seguridad se hacen girar mediante laadición de un contador incremental que empieza a '1'. El valor predeterminado es '0'.

base = cadena

Considere relativa URL s en los archivos de entrada (especificado a través del 'entrada'Comando o la'‐‐input‐file'/'‐yo'Opción, junto con'force_html'O'‐‐force‐html') Como en relación con la cadena ­el mismo que '‐‐base = cadena'.

bind_address = dirección

Enlazar a dirección , como el '‐‐bind‐address = dirección'.

ca_certificate = archivo

Establezca el archivo de autoridades paquete certificado a presentar . El mismo que '‐‐ca certificado = archivo'.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 33/59

ca_directory = directorio

Establezca el directorio utilizado para las autoridades de certificación. El mismo que '‐‐ca‐directorio = directorio'.

cache = on / off

Cuando se establece en off, no permitir que el servidor de almacenamiento en caché. Ver el '‐‐no‐cache'Opción.

certificado = archivo

Establezca el nombre del archivo de certificado de cliente a presentar . El mismo que '‐‐certificate = archivo'.

certificate_type = cadena

Especifique el tipo de certificado de cliente, los valores jurídicos siendo "PEM'(Por defecto) y'DER'(Aka ASN1). El mismoque 'de tipo ‐‐certificate = cadena'.

check_certificate = on / off

Si esto está desactivado, el certificado del servidor no se comprueba con las autoridades cliente especificados. El valorpredeterminado es "on". El mismo que '‐‐check‐certificado'.

connect_timeout = n

Ajuste el tiempo de espera de conexión del mismo que '‐‐connect‐timeout'.

content_disposition = on / off

Encienda el reconocimiento de la (no estándar) 'Content‐Disposition'HTTP header­si está en'en', Lo mismo que'‐‐content‐disposición'.

trust_server_names = on / off

Si se establece en, utilice el último componente de un redireccionamiento de URL para el nombre del archivo local.

continuar = on / off

Si se establece en on, forzar la continuación de los archivos recuperados parcialmente preexistentes. Ver '‐c'Antes deajustarlo.

convert_links = on / off

Convertir enlaces que no son parientes localmente. El mismo que '‐k'.

galletas = on / off

Cuando se establece en off, no permitir las cookies. Ver el '‐‐galletas'Opción.

cut_dirs = n

No haga caso de n componentes de directorios remotos. Equivalente a '‐‐cut‐dirs = n'.

debug = on / off

El modo de depuración, mismo que '‐d'.

default_page = cadena

Página Default­lo mismo que '‐‐default‐page = cadena'.

delete_after = on / off

Eliminar después de descargar­lo mismo que '‐‐delete después'.

dir_prefix = cadena

Top de árbol de directorios­lo mismo que '‐P cadena'.

dirstruct = on / off

Volviendo dirstruct en o fuera de la misma como '‐x'O'‐nd', Respectivamente.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 34/59

dns_cache = on / off

Gire el almacenamiento en caché de DNS de encendido / apagado. Desde el almacenamiento en caché de DNS estáactivada de forma predeterminada, esta opción se utiliza normalmente para apagarlo y es equivalente a '‐‐no‐dns‐cache'.

dns_timeout = n

Ajuste el tiempo de espera del DNS mismo que '‐‐dns‐timeout'.

dominios = cadena

Igual a '‐D'(Ver Hosts Spanning ).

dot_bytes = n

Especifique el número de bytes "contenida" en un punto, como se ha visto a lo largo de la recuperación (1024 pordefecto). Puede postfix el valor con 'k'O'm', Que representa kilobytes y megabytes, respectivamente. Con los ajustes depuntos que pueda adaptar la recuperación de puntos para adaptarse a sus necesidades, o puede utilizar las predefinidasestilos (ver Opciones de descarga ).

dot_spacing = n

Especifique el número de puntos en un solo grupo (10 por defecto).

dots_in_line = n

Especifique el número de puntos que se van a imprimir en cada línea en toda la recuperación (50 por defecto).

egd_file = archivo

Utilice cadena como el nombre del archivo socket EGD. El mismo que '‐‐egd‐file = fichero'.

exclude_directories = cadena

Especifica una lista separada por comas de los directorios que desea excluir de descarga­lo mismo que '‐X cadena'(VerLímites basados en directorios ).

exclude_domains = cadena

Igual a '‐‐exclude‐domains = cadena'(Ver Hosts Spanning ).

follow_ftp = on / off

Siga FTP enlaces de HTML documentos­lo mismo que '‐‐follow‐ftp'.

follow_tags = cadena

Sólo seguir ciertas HTML etiquetas cuando se hace una recuperación recursiva, al igual que '‐‐follow‐tags = cadena'.

force_html = on / off

Si se establece en on, forzar el nombre del archivo de entrada debe ser considerado como un HTML ­documento lo mismoque '‐F'.

ftp_password = cadena

Establezca su FTP contraseña para cadena . Sin este ajuste, los valores por defecto de contraseña a '‐wget @', Que es undefecto útil para anónimo FTP de acceso.

Este comando se utiliza para ser nombrado passwd antes de Wget 1.10.

ftp_proxy = cadena

Utilice cadena como FTP proxy, en lugar de la especificada en el ambiente.

ftp_user = cadena

Establecer FTP usuario cadena .

Este comando se utiliza para ser nombrado entrada antes de wget 1.10.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 35/59

glob = on / off

Gire globbing on / off­lo mismo que '‐‐glob'Y'‐‐no‐glob'.

encabezado = cadena

Definir una cabecera para descargas HTTP, como el uso de '‐‐header = cadena'.

adjust_extension = on / off

Añadir un '.html'Extensión'text / html'O'application / xhtml + xml'Archivos que carecen de uno, oun'.css'Extensión'text / css'archivos que carecen de uno, como'‐E'. Anteriormente llamado 'html_extension'(Siendoaceptable, aunque no se use).

http_keep_alive = on / off

Encienda la función de mantener activa o desactiva (por defecto) en. Apagarlo es equivalente a '‐‐no‐http‐keep‐alive'.

http_password = cadena

Set HTTP contraseña, equivalente a '‐‐http‐password = cadena'.

http_proxy = cadena

Utilice cadena como HTTP proxy, en lugar de la especificada en el ambiente.

http_user = cadena

Set HTTP usuario cadena , equivalente a '‐‐http‐user = cadena'.

https_only = on / off

Cuando está en modo recursivo, sólo los vínculos HTTPS se siguen (el valor predeterminado off).

https_proxy = cadena

Utilice cadena como HTTPS proxy, en lugar de la especificada en el ambiente.

ignore_case = on / off

Cuando se establece en adelante, los archivos de los partidos y directorios caso insensible; lo mismo que '‐‐ignore caso'.

ignore_length = on / off

Cuando se establece en adelante, ignorar Content‐Length cabecera; lo mismo que '‐‐ignore de longitud'.

ignore_tags = cadena

No haga caso de ciertos HTML etiquetas cuando se hace una recuperación recursiva, como '‐‐ignore‐tags = cadena'.

include_directories = cadena

Especifica una lista separada por comas de los directorios que desea seguir al descargar­lo mismo que '‐I cadena'.

iri = on / off

Cuando se establece en adelante, habilitar el soporte internacionalizado URI (IRI); lo mismo que '‐‐iri'.

inet4_only = on / off

Fuerza de conexión para las direcciones IPv4, desactivado por defecto. Usted puede poner esto en el archivo init globalpara deshabilitar los intentos de Wget para resolver y conectarse a los hosts IPv6. Disponible sólo si Wget fue compiladocon soporte para IPv6. El mismo que 'de sólo ‐‐inet4'O'‐4'.

inet6_only = on / off

Fuerza de conexión para direcciones IPv6, desactivado por defecto. Disponible sólo si Wget fue compilado con soportepara IPv6. El mismo que 'de sólo ‐‐inet6'O'‐6'.

entrada = archivo

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 36/59

Lea la URL s de cadena , como '‐i archivo'.

keep_session_cookies = on / off

Cuando se especifica, hace que 'save_cookies = en'Guardar también las cookies de sesión. Ver '‐‐keep‐sesión‐cookies'.

limit_rate = tasa

Limitar la velocidad de descarga a no más de tasa de bytes por segundo. El mismo que '‐‐limit‐rate = velocidad'.

load_cookies = archivo

Galletas de carga de archivo . Ver '‐‐load‐cookies archivo'.

local_encoding = codificación

Fuerza Wget para utilizar la codificación como la codificación predeterminada del sistema. Ver '‐‐local‐codificación'.

logfile = archivo

Archivo de registro se establece en el archivo , lo mismo que '‐o archivo'.

max_redirect = número

Especifica el número máximo de redirecciones a seguir para un recurso. Ver '‐‐max‐redirect = número'.

espejo = on / off

Gire reflejo de encendido / apagado. El mismo que '‐m'.

netrc = on / off

Gire la lectura netrc encendido o apagado.

no_clobber = on / off

Igual a '‐nc'.

no_parent = on / off

No permitir la recuperación fuera de la jerarquía de directorios, como '‐‐no‐padre'(Ver Límites basados en directorios ).

no_proxy = cadena

Utilice cadena como la lista separada por comas de dominios para evitar en proxy de carga, en lugar de la especificada enel medio ambiente.

output_document = archivo

Ajuste la salida de nombre de archivo lo mismo que '‐O archivo'.

page_requisites = on / off

Descargar todos los documentos complementarios necesarios para un solo HTML página para mostrar correctamente, lomismo que '‐p'.

passive_ftp = on / off

Cambie el ajuste del pasivo FTP , equivalente a la '‐‐passive‐ftp'Opción.

password = cadena

Especifique la contraseña de cadena tanto para FTP y HTTP de recuperación de archivos. Este comando se puede anularcon la 'ftp_password'Y'http_password'Comando para FTP y HTTP , respectivamente.

post_data = cadena

Utilice POST como el método para todas las peticiones HTTP y enviar cadena en el cuerpo de la petición. El mismo que'‐‐post‐data = cadena'.

post_file = archivo

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 37/59

Utilice POST como el método para todas las peticiones HTTP y envía el contenido del archivo en el cuerpo de lapetición. El mismo que '‐‐post‐file = fichero'.

prefer_family = ninguno / IPv4 / IPv6

Cuando se les da la opción de varias direcciones, conectar a las direcciones con la familia de direcciones especificadaprimero. La orden de la dirección devuelta por DNS se utiliza sin cambio de forma predeterminada. El mismo que '‐‐prefer familiar', Que ver para una discusión detallada de por qué esto es útil.

private_key = archivo

Establezca el archivo de clave privada para presentar . El mismo que '‐clave, correspondiente a los = archivo'.

private_key_type = cadena

Especifique el tipo de la clave privada, valores jurídicos siendo "PEM'(Por defecto) y'DER'(Aka ASN1). El mismo que'tipo, correspondiente a los = cadena'.

progreso = cadena

Establecer el tipo de indicador de progreso. Tipos legales son 'punto'Y'bar'. Equivalente a '‐‐progress = cadena'.

protocol_directories = on / off

Cuando se establece, utilice el nombre del protocolo como un componente directorio de nombres de archivos locales. Elmismo que '‐‐protocol‐directorios'.

proxy_password = cadena

Contraseña de autenticación Configurar proxy para cadena , como '‐‐proxy‐password = cadena'.

PROXY_USER = cadena

Nombre de usuario de autenticación Set proxy para cadena , como '‐‐proxy‐user = cadena'.

tranquila = on / off

Modo de la Quiet mismo que '‐q'.

quota = cuota

Indique la cuota de descarga, que es útil para poner en el mundial wgetrc. Cuando se especifica descarga cuota, Wgetdetener la recuperación después de la suma descarga se ha vuelto mayor que la cuota. La cuota se puede especificar enbytes (por defecto), kbytes 'k'Anexa) o megabytes ('m'Anexa). Así 'quota = 5m'Fijará la cuota de 5 megabytes. Tenga encuenta que el archivo de inicio del usuario anula la configuración del sistema.

random_file = archivo

Utilice archivo como una fuente de aleatoriedad en los sistemas que carecen de / Dev / random.

random_wait = on / off

Gire aleatorios entre­solicitud tiempos de espera o desactivar. El mismo que '‐‐random‐wait'.

read_timeout = n

Ajuste la lectura (y escribir), tiempo de espera lo mismo que '‐‐read‐timeout = n'.

reclevel = n

Nivel de recursividad (profundidad), el mismo que '‐l n'.

= recursivas de encendido / apagado

Recursiva on / off­lo mismo que '‐r'.

árbitro = cadena

Set HTTP 'Árbitro:'Encabezado al igual que'‐‐referer = cadena'. (Tenga en cuenta que se trataba de las personas queescribieron el HTTP especificación que consiguió la ortografía de "referente" mal).

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 38/59

relative_only = on / off

Seguir enlaces ­el único relativos mismo que '‐L'(Ver enlaces relativos ).

remote_encoding = codificación

Fuerza Wget para utilizar la codificación como la codificación servidor remoto predeterminado. Ver '‐‐remote‐codificación'.

remove_listing = on / off

Si se establece en on, eliminar FTP listados descargados por Wget. Si se establece en off es lo mismo que '‐‐no‐remove‐lista'.

restrict_file_names = unix / ventanas

Restringir los nombres de los archivos generados por Wget de URLs. Ver '‐‐restrict‐file‐nombres'Para una descripciónmás detallada.

retr_symlinks = on / off

Cuando se establece en adelante, recuperar enlaces simbólicos como si fueran ficheros planos; lo mismo que '‐‐retr‐symlinks'.

retry_connrefused = on / off

Cuando se establece en adelante, considerar "conexión rechazada" un error en el transitorio mismo que '‐‐retry‐connrefused'.

robots = on / off

Especifique si la convención norobots es respetado por Wget, "on" por defecto. Este interruptor controla tantola/robots.txt y la 'nofollow'Aspecto de la especificación. Ver Exclusión de Robots , para más detalles sobre esto.Asegúrese de saber lo que está haciendo antes de dar vuelta esto.

save_cookies = archivo

Guardar cookies para presentar . El mismo que '‐‐save‐cookies archivo'.

save_headers = on / off

Igual a '‐‐save‐headers'.

secure_protocol = cadena

Elija el protocolo seguro para ser utilizado. Los valores permitidos son 'auto'(Por defecto),'SSLv2','SSLv3', Y'TLSv1'. Elmismo que '‐‐secure protocolo = cadena'.

server_response = on / off

Elija si desea imprimir o no los HTTP y FTP servidor respuestas­lo mismo que '‐S'.

show_all_dns_entries = on / off

Cuando un nombre DNS se resuelve, le mostrará todas las direcciones IP, no sólo los tres primeros.

span_hosts = on / off

Igual a '‐H'.

araña = on / off

Igual a '‐‐spider'.

strict_comments = on / off

Igual a '‐‐strict‐comments'.

timeout = n

Establezca todos los valores de tiempo de espera aplicables a n , lo mismo que '‐T n'.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 39/59

timestamping = on / off

Gire sellado de tiempo de encendido / apagado. El mismo que '‐N'(Véase de sellado de tiempo ).

use_server_timestamps = on / off

Si se pone a 'apagado', Wget no fijará fecha y hora del archivo local por el que está en el servidor (el mismo que'‐‐no‐uso‐server‐marcas de tiempo').

intenta = n

Establecer el número de reintentos por URL ­el mismo que '‐t n'.

USE_PROXY = on / off

Cuando se establece en off, no use Proxy incluso cuando se establecen las variables de entorno relacionadas con el proxy.En ese caso, es lo mismo que usar '‐‐no‐proxy'.

user = cadena

Especificar nombre de usuario cadena tanto para FTP y HTTP de recuperación de archivos. Este comando se puede anularcon la 'ftp_user'Y'http_user'Comando para FTP y HTTP , respectivamente.

user_agent = cadena

Identificación del agente de usuario envía al servidor HTTP­lo mismo que '‐‐user‐agente = cadena'.

verbose = on / off

Gire verbose on / off­lo mismo que '‐v'/'‐nv'.

espere = n

Espere n segundos entre recuperaciones­lo mismo que '‐w n'.

wait_retry = n

Espere hasta n segundos entre reintentos de recuperaciones fallidas solo­lo mismo que '‐‐waitretry = n'. Tenga encuenta que esto está activada de forma predeterminada en el mundialwgetrc.

Anterior: wgetrc Comandos , Up: archivo de Inicio [ Contenidos ] [ Índice ]

6.4 Muestra wgetrc

Este es el archivo de inicialización de la muestra, como se da en la distribución. Se divide en dos secciones, una para uso global(apto para archivo de inicio global), y otro para uso local (apto para $ HOME / .wgetrc). Tenga cuidado con las cosas quecambiar.

Tenga en cuenta que casi todas las líneas están deshabilitadas. Para un comando tenga efecto, debe quitar la '#"Carácter alcomienzo de su línea.

###### Ejemplo de archivo de inicialización Wget .wgetrc###

## Puede utilizar este archivo para cambiar el comportamiento predeterminado de wget o## Evitar tener que escribir muchas, muchas opciones de línea de comandos. Este archivo haceNo ## contiene una lista completa de comandos ‐ mirar el manual## Para averiguar lo que puede poner en este archivo. Usted puede encontrar esta aquí:## $ Info wget.info 'Archivo de inicio'## O en línea aquí:## Https://www.gnu.org/software/wget/manual/wget.html#Startup‐File#### Archivo de inicialización Wget puede residir en / / / etc / usr wgetrc locales## (Global, para todos los usuarios) o $ HOME / .wgetrc (para un solo usuario).#### Para utilizar la configuración de este archivo, usted tendrá que quitar los comentarios de ellos,##, Así como modificarlos, en la mayoría de los casos, el valor indicado en el## líneas comentadas de salida son los valores por defecto (por ejemplo, "off").#### Comando son caso‐, underscore‐ y‐menos insensible.## Por ejemplo ftp_proxy, ftp‐proxy y ftpproxy son los mismos.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 40/59

#### La configuración global (útil para la creación de en / / / etc / usr wgetrc locales).## Piense bien antes de cambiarla, ya que pueden reducir de wget## Funciones, y hacer que se comporte en contra de la documentación:##

# Se puede establecer recuperar cuota para principiantes especificando un valor# Opcionalmente seguido de 'K' (kilobytes) o "M" (megabytes). LaCuota # defecto es ilimitado.#quota = inf

# Se puede reducir (o aumentar) el número predeterminado de reintentos cuando# Descarga de un archivo (por defecto es 20).#tries = 20

# La reducción de la profundidad máxima de la recuperación recursiva es útil para# Impiden novatos de ir demasiado "profundo" cuando, sin saberlo, comienzan# La recuperación recursiva. El valor predeterminado es 5.#reclevel = 5

# Por defecto Wget utiliza la transferencia de "pasivo FTP" donde el cliente# Inicia la conexión de datos al servidor en lugar de la otra# Revés. Lo que se requiere en los sistemas detrás de NAT donde el cliente# Computadora no se puede llegar fácilmente desde Internet. Sin embargo, algunos# Cortafuegos software apoya explícitamente FTP activo y de hecho tiene# Problemas de compatibilidad con la transferencia pasiva. Si usted se encuentra en tal# Entorno, utilice "passive_ftp = off" para volver a FTP activo.#passive_ftp = off

# El comando de "esperar" a continuación hace Wget esperar entre cada conexión.# Si, en cambio, desea Wget esperar sólo entre reintentos de fracasadoDescargas #, establecer waitretry al número máximo de segundos de espera (Wget# Utilizará "retroceso lineal", en espera 1 segundo después del primer fracaso# En un archivo, 2 segundos después del segundo fracaso, etc. hasta este máximo).#waitretry = 10

#### Configuración local (para un usuario para establecer en su $ HOME / .wgetrc). Es## * * Altamente indeseable para poner estos valores en el archivo global, ya que## Son potencialmente peligrosos para los usuarios "normales".#### Aun cuando la creación de su propio ~ / .wgetrc, usted debe saber lo que## Están haciendo antes de hacerlo.##

# Ponga esto en el sellado de tiempo de usar de forma predeterminada:#timestamping = off

# Es una buena idea hacer Wget enviar su dirección de correo electrónico en un `From: '# Encabezado con su solicitud (de modo que los administradores del servidor pueden contactar# Que en caso de errores). Wget * no * enviar `From: 'por defecto.#header = De: Su nombre <[email protected]>

# Se puede configurar otras cabeceras, como Accept‐Language. Accept‐Language# * No * es enviado de forma predeterminada.#header = Accept‐Language: en

# Se puede configurar los proxies predeterminados para Wget utilizar para http, https y ftp.# Se anulará el valor en el medio ambiente.#https_proxy = http://proxy.yoyodyne.com:18023/#http_proxy = http://proxy.yoyodyne.com:18023/#ftp_proxy = http://proxy.yoyodyne.com:18023/

# Si no desea utilizar Proxy en absoluto, ponga esto en OFF.#use_proxy = en

# Se puede personalizar el pronóstico de recuperación. Las opciones válidas son por defecto,# Binarios, mega y micro.#dot_style = por defecto

# Establecer esta en off hace Wget no descargar /robots.txt. Asegúrese de# * Saber exactamente * lo /robots.txt es y cómo se usa antes de cambiar# El predeterminado!#robots = en

# Puede ser útil hacer Wget esperar entre conexiones. Ponga esto en# El número de segundos que desea Wget esperar.#WAIT = 0

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 41/59

# Se puede forzar la creación de la estructura de directorios, incluso si es un solo ser# Recuperada, estableciendo esta activado.#dirstruct = off

# Se puede encender recuperación recursivo por defecto (no hagas esto si# No está seguro de que usted sabe lo que significa) estableciendo esta activado.#RECURSIVO = off

# Para hacer una copia de seguridad del archivo siempre X como X.orig antes de convertir sus vínculos (debido# Para ‐k / ‐‐convert‐links / convert_links = por haber sido especificado),# Define esta variable a en:#backup_converted = off

# Para que Wget sigue los enlaces de FTP de archivos HTML por defecto, establecer este# Para en:#follow_ftp = off

# Para tratar de direcciones IPv6 en primer lugar:# Prefieren familiar = IPv6

# Set default apoyo estatal IRI#iri = off

# Forzar la codificación predeterminada del sistema#localencoding = UTF‐8

# Forzar la codificación servidor remoto por defecto#remoteencoding = UTF‐8

# Encienda para prevenir siguiendo enlaces no HTTPS cuando en modo recursivo#httpsonly = off

Seguridad # Tune HTTPS (auto, SSLv2, SSLv3, TLSv1, PFS)#secureprotocol = auto

Siguiente: Varios , Previous: archivo de Inicio , Up: Top [ Índice ] [ Índice ]

7 Ejemplos

Los ejemplos se dividen en tres secciones basado libremente en su complejidad.

• Uso simple : Uso simple, básico del programa.• Uso avanzado : Sugerencias avanzadas.• Uso muy avanzada : Las cosas peludas.

Siguiente: Uso avanzado , Anterior: Ejemplos , Up: ejemplos [ Contenidos ] [ Índice ]

7.1 Uso simple

Digamos que quiere descargar un URL . Sólo tienes que escribir:

wget http://fly.srk.fer.hr/

Pero, ¿qué ocurrirá si la conexión es lenta, y el archivo es largo? La conexión probablemente fallará antes de recuperartodo el archivo, más de una vez. En este caso, Wget intentará conseguir el archivo hasta que o bien obtiene la totalidad deella, o excede el número predeterminado de reintentos (siendo 20). Es fácil cambiar el número de intentos para 45, paraasegurar que todo el archivo llegará con seguridad:

wget ‐‐tries = 45 http://fly.srk.fer.hr/jpg/flyweb.jpg

Ahora vamos a dejar Wget para trabajar en segundo plano, y escribir su progreso para el archivo de registro log. Esagotador para escribir '‐‐tries', Así que vamos a utilizar'‐t'.

wget ‐t 45 ‐o ingrese http://fly.srk.fer.hr/jpg/flyweb.jpg y

El símbolo de unión en el extremo de la línea se asegura de que Wget trabaja en segundo plano. Para unlimit el númerode reintentos, utilice 'inf ‐t'.

El uso de FTP es tan simple. Wget se encargará de usuario y contraseña.

ftp://gnjilux.srk.fer.hr/welcome.msg wget

Si especifica un directorio, Wget recuperará la lista de directorios, analizarlo y convertirlo a HTML . Pruebe:

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 42/59

ftp://ftp.gnu.org/pub/gnu/ wgetEnlaces index.html

Siguiente: Uso muy avanzada , Previous: Uso simple , Up: ejemplos [ Contenidos ] [ Índice ]

7.2 Uso avanzado

Usted tiene un archivo que contiene las direcciones URL que desea descargar? Utilice la '‐yo'Cambiar:

‐i wget archivo

Si se especifica '‐"Como nombre de archivo, la URL s se leerá de la entrada estándar.

Crear una imagen de espejo profundo cinco niveles de la página web de GNU, con la misma estructura de directoriosoriginal tiene, con sólo un intento por documento, guardar el registro de las actividades de gnulog:

wget ‐r http://www.gnu.org/ ‐o gnulog

Lo mismo que el anterior, pero convertir los enlaces en los archivos descargados para señalar a los archivos locales, paraque puedas ver los documentos fuera de línea:

wget ‐‐convert‐enlaces ‐r http://www.gnu.org/ ‐o gnulog

Recuperar una sola HTML página, pero asegúrese de que todos los elementos necesarios para que la página se mostrarán,como las imágenes en línea y hojas de estilo externas, también se descargan. También asegúrese de que la páginadescargado hace referencia a los enlaces descargados.

wget ‐p ‐‐convert‐enlaces http://www.server.com/dir/page.html

El HTML página se guardará enwww.server.com/dir/page.htmly las imágenes, hojas de estilo, etc., en algún lugar bajowww.server.com/, Dependiendo de dónde se encontraban en el servidor remoto.

Lo mismo que el anterior, pero sin la www.server.com/directorio. De hecho, yo no quiero tener todos los directorios delservidor al azar de todos modos, sólo tienes que guardar todos los archivos con unDescarga / subdirectorio del directorioactual.

wget ‐p ‐‐convert‐enlaces ‐nH ‐nd ‐Pdownload \ http://www.server.com/dir/page.html

Recuperar el index.html de 'www.lycos.com', Que muestra los encabezados de servidor originales:

wget ‐S http://www.lycos.com/

Guarde los encabezados de servidor con el archivo, tal vez para el post­procesamiento.

wget ‐‐save‐headers http://www.lycos.com/más index.html

Recuperar los dos primeros niveles del 'wuarchive.wustl.edu', Salvándolos a / Tmp.

wget ‐r ‐l2 ‐P / tmp ftp://wuarchive.wustl.edu/

Usted quiere descargar todo el GIF s de un directorio en un HTTP servidor. Ha intentado 'wgethttp://www.server.com/dir/*.gif', Pero eso no funcionó porque HTTP recuperación no admite comodines. En ese caso,utilice:

wget ‐r ‐l1 ‐‐no‐padre ‐A.gif http://www.server.com/dir/

Más detallado, pero el efecto es el mismo. '‐r ‐l1'Significa recuperar de forma recursiva (ver recursiva Descargar ), conuna profundidad máxima de 1. '‐‐no‐padre'Significa que se ignoran las referencias al directorio padre (ver Límitesbasados en directorios ), y '‐A.gif'Significa descargar sólo los GIF archivos. '‐A "* .gif""Habría trabajado demasiado.

Supongamos que en el medio de la descarga, cuando Wget fue interrumpido. Ahora usted no quiere darle una paliza a losarchivos ya presentes. Sería:

wget ‐r ‐nc http://www.gnu.org/

Si desea codificar su propio nombre de usuario y contraseña para HTTP o FTP , utilice el adecuado URL sintaxis (ver URLFormato ).

ftp wget: // hniksic: [email protected]/.emacs

Tenga en cuenta, sin embargo, que este uso no es aconsejable en sistemas multiusuario porque revela su contraseña acualquiera que mira a la salida de ps .

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 43/59

Desea que los documentos de salida para ir a la salida estándar en lugar de a los archivos?

wget ‐O ‐ http://jagor.srce.hr/ http://www.srce.hr/

También se pueden combinar las dos opciones y tomar las tuberías para recuperar los documentos de hotlists remotas:

wget ‐O ‐ http://cool.list.com/ | wget ‐‐force‐html ‐i ‐

Anterior: Uso avanzado , Up: ejemplos [ Contenidos ] [ Índice ]

7.3 Uso muy avanzada

Si desea Wget para mantener un espejo de una página (o FTP subdirectorios), utilice '‐‐mirror'('‐m'), Que es la abreviaturade "‐r ‐l inf ‐N'. Usted puede poner Wget en el archivo crontab para pedirle que vuelva a revisar un sitio cadaDomingo:

crontab0 0 * * 0 wget ‐‐mirror http://www.gnu.org/ ‐o / home / me / weeklog

Además de lo anterior, usted desea que los enlaces sean convertidos para la visualización local. Pero, después de haberleído este manual, usted sabe que la conversión enlace no juega bien con sellado de tiempo, por lo que también quiereWget hacer copia de seguridad de los originales HTML archivos antes de la conversión. Invocación Wget se vería así:

wget ‐‐mirror ‐‐convert enlaces convertidos‐‐‐backup \ http://www.gnu.org/ ‐o / home / me / weeklog

Pero también se ha notado que la visión local no funciona del todo bien cuando HTML archivos se guardan conextensiones distintas de '.html', Tal vez porque les sirvieron como index.cgi. Así que desea Wget para cambiar elnombre de todos los archivos servidos con contenido de tipo 'text / html'O'application / xhtml + xml'A nombrar.html.

wget ‐‐mirror ‐‐convert enlaces convertidos‐‐‐backup \ ‐‐html‐extensión ‐o / home / me / weeklog \ http://www.gnu.org/

O bien, con menos escribiendo:

wget ‐m ‐k ‐K ‐E http://www.gnu.org/ ‐o / home / me / weeklog

Siguiente: Apéndices , Previous: Ejemplos , Up: Top [ Índice ] [ Índice ]

8 Varios

Este capítulo contiene todas las cosas que no podría caber en cualquier otro lugar.

• La representación : Soporte para servidores proxy.• Distribución : Obtener la última versión.• Sitio Web : La presencia de GNU Wget en la World Wide Web.• Listas de correo : Lista de correo Wget para anuncios y discusión.• Internet Relay Chat : La presencia de Wget en el IRC.• Informes de fallos : ¿Cómo y dónde informar de los errores.• Portabilidad : Los sistemas de Wget trabaja.• Señales : Señal de manipulación realizada por Wget.

Siguiente: Distribución , Anterior: Varios , Up: Varios [ Contenidos ] [ Índice ]

8.1 La representación

Los proxies son de propósito especial HTTP servidores diseñados para transferir datos desde servidores remotos a los clienteslocales. Un uso típico de proxies es aligerar la carga de red para los usuarios detrás de una conexión lenta. Esto se logramediante la canalización de todos los HTTP y FTP solicitudes a través del proxy que almacena en caché los datos transferidos.Cuando se solicita un recurso en caché de nuevo, delegación devolverá los datos de la memoria caché. Otro uso de proxies espara las empresas que separan (por razones de seguridad) de sus redes internas del resto de Internet. Con el fin de obtenerinformación de la Web, sus usuarios se conectan y recuperar datos remotos usando un proxy autorizado.

Wget soporta servidores proxy, tanto para HTTP y FTP recuperaciones. La manera estándar para especificar la ubicación deproxy, que Wget reconoce, está utilizando las siguientes variables de entorno:

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 44/59

http_proxyhttps_proxy

Si se establece, la HTTP_PROXY y https_proxy las variables deben contener la URL s de los proxies para HTTP y HTTPSconexiones respectivamente.

ftp_proxy

Esta variable debe contener la URL del proxy para FTP conexiones. Es bastante común que http_proxy y ftp_proxy seestablecen en la misma URL .

no_proxy

Esta variable debe contener una lista separada por comas de extensiones de dominio de proxy debe no ser utilizado para.Por ejemplo, si el valor de no_proxy es '.mit.edu', Proxy no será utilizado para recuperar documentos de MIT.

Además de las variables de entorno, ubicación proxy y configuraciones pueden especificarse desde dentro de sí misma Wget.

'‐‐no‐proxy''Proxy = on / off'

Esta opción y el comando correspondiente se pueden utilizar para suprimir el uso de proxy, incluso si se establecen lasvariables de entorno apropiadas.

'http_proxy = URL''https_proxy = URL''ftp_proxy = URL''no_proxy = cadena'

Estas variables de archivos de arranque le permiten anular la configuración del proxy especificados por el medioambiente.

Algunos servidores proxy requieren autorización para que pueda utilizarlos. La autorización se compone de nombre de usuarioy contraseña , que debe ser enviado por Wget. Al igual que con HTTP autorización, existen varios esquemas de autenticación.Para la autorización de proxy sólo el básico se implementa actualmente esquema de autenticación.

Usted puede especificar su nombre de usuario y contraseña, ya sea a través del proxy URL oa través de las opciones de línea decomandos. Suponiendo que el proxy de la empresa se encuentra en 'proxy.company.com'En el puerto 8001, un proxy URLubicación que contiene los datos de autorización podría tener este aspecto:

http: // hniksic: [email protected]: 8001 /

Alternativamente, usted puede usar el 'proxy‐usuario'Y'proxy‐password'Opciones, y el equivalente .wgetrc ajustes PROXY_USER yproxy_password para establecer el nombre de usuario y contraseña del proxy.

Siguiente: Sitio Web , Previous: La representación , Up: Varios [ Contenidos ] [ Índice ]

8.2 Distribución

Como todas las utilidades GNU, la última versión de Wget se puede encontrar en el maestro GNU archive site ftp.gnu.org, y susespejos. Por ejemplo, Wget 1.16.2 se puede encontrar en ftp://ftp.gnu.org/pub/gnu/wget/wget­1.16.2.tar.gz

: A continuación las listas de correo , Previous: Distribución , Up: Varios [ Contenidos ] [ Índice ]

Sitio Web 8.3

El sitio web oficial de GNU Wget es en http://www.gnu.org/software/wget/ . Sin embargo, más información útil reside en "laWget Wgiki", http://wget.addictivecode.org/ .

Siguiente: Internet Relay Chat , Previous: Sitio Web , Up: Varios [ Contenidos ] [ Índice ]

8.4 Listas de correo

Lista Primaria

La lista de correo principal para el debate, informes de error, o si tiene preguntas sobre GNU Wget es en bug­[email protected] .

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 45/59

Para suscribirse, envíe un correo electrónico a bug­wget­[email protected] , o visite http://lists.gnu.org/mailman/listinfo/bug­wget .

No es necesario suscribirse a enviar un mensaje a la lista; Sin embargo, tenga en cuenta que los mensajes no suscritas sonmoderados, y puede tomar un tiempo antes de que lleguen a la lista­ lo general alrededor de un día . Si usted quiere que sumensaje aparezca de inmediato, por favor suscríbase a la lista antes de publicar. Archivos de la lista se pueden encontrar enhttp://lists.gnu.org/pipermail/bug­wget/ .

Una pasarela NNTP / Usenettish también está disponible a través de Gmane . Usted puede ver los archivos gmane enhttp://news.gmane.org/gmane.comp.web.wget.general . Tenga en cuenta que los archivos gmane incluyen convenientementemensajes, tanto de la lista actual, y el anterior. Los mensajes también aparecen en los archivos gmane antes de lo que lo hacenen lists.gnu.org .

Lista Avisos de errores

Además, existe la wget­[email protected] lista de correo. Esta es una lista no discusión que recibe notificaciones deinforme de errores de la de seguimiento de fallos. Para suscribirse a esta lista, enviar un correo electrónico a wget­notify­[email protected] , o visite http://addictivecode.org/mailman/listinfo/wget­notify .

Listas obsoletos

Anteriormente, la lista de correo [email protected] fue utilizado como la lista de discusión principal, y otra lista, wget­[email protected] se utilizó para la presentación y discusión de los parches de GNU Wget.

Mensajes de [email protected] están archivadas en

http://www.mail­archive.com/wget%40sunsite.dk/ y al http://news.gmane.org/gmane.comp.web.wget.general (que también sigue archivar la lista actual, bug­[email protected] ).

Mensajes de wget­[email protected] están archivadas en

http://news.gmane.org/gmane.comp.web.wget.patches .

Siguiente: Reporte de Errores , Anterior: Listas de correo , Up: Varios [ Contenidos ] [ Índice ]

8.5 Internet Relay Chat

Además de las listas de correo, también tenemos un canal de apoyo establecido a través de IRC en irc.freenode.org , #wget .Ven échale un vistazo!

Siguiente: Portabilidad , Previous: Internet Relay Chat , Up: Varios [ Contenidos ] [ Índice ]

8.6 Informes de fallos

Le invitamos a enviar informes de errores a través del gestor de fallos de GNU Wget (verhttp://wget.addictivecode.org/BugTracker ).

De hecho, antes de enviar un informe de error, por favor tratar de seguir algunas pautas simples.

1. Por favor, trate de asegurarse de que el comportamiento que se ve realmente es un error. Si Wget se estrella, es un error.Si Wget no se comporta como se documenta, es un error. Si las cosas funcionan extraño, pero no están seguros acerca dela forma en que se supone que deben trabajar, bien podría ser un error, pero es posible que desee volver a verificar ladocumentación y las listas de correo (ver listas de correo ).

2. Trate de repetir el error en circunstancias tan simple como sea posible. Por ejemplo, si Wget se estrella al descargar 'wget‐rl0 ‐kKE ‐T5 ‐‐no‐proxy http://yoyodyne.com ‐o / tmp / Entrar', Usted debe tratar de ver si el accidente esrepetible, y si va a ocurrir con un conjunto más simple de opciones. Puede ser que incluso intente iniciar la descarga en lapágina donde se produjo el accidente para ver si esa página de alguna manera provocó el accidente.

Asimismo, si bien probablemente voy a estar interesados en saber el contenido de su .wgetrcarchivo, sólo el dumping enel mensaje de depuración es probablemente una mala idea. En su lugar, primero debe tratar de ver si el error se repitecon.wgetrcmovido fuera del camino. Sólo si resulta que .wgetrc ajustes afectan al bicho, me envía las partes pertinentesdel expediente.

3. Por favor iniciar Wget con '‐d'Opción y enviarnos la salida resultante (o en partes pertinentes del mismo). Si Wget fuecompilado sin soporte de depuración, recompilar­es mucho más fácil de rastrear errores con el apoyo de depuración.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 46/59

Nota: asegúrese de eliminar cualquier información sensible desde el registro de depuración antes de enviarlo a ladirección bug. El ‐d no saldrá de su manera de recoger información sensible, pero el registro será contener unatranscripción bastante completo de la comunicación de Wget con el servidor, que puede incluir contraseñas y piezas delos datos descargados. Desde la dirección de error está archivada públicamente, se puede suponer que todos los informesde errores son visibles para el público.

4. Si Wget ha estrellado, tratar de ejecutarlo en un depurador, por ejemplo gdb `que wget` núcleo y tipo donde para obtenerla traza. Esto puede no funcionar si el administrador del sistema ha deshabilitado archivos del núcleo, pero es seguro queintentarlo.

Siguiente: Señales , Previous: Informar de errores , Up: Varios [ Contenidos ] [ Índice ]

8.7 Portabilidad

Al igual que todo el software GNU, Wget trabaja en el sistema GNU. Sin embargo, ya que utiliza GNU Autoconf para laconstrucción y configuración, y sobre todo evita el uso de características "especiales" de cualquier Unix particular, debecompilar (y trabajo) en todos los sabores de Unix comunes.

Varias versiones Wget han compilado y probado en muchos tipos de sistemas Unix, incluyendo GNU / Linux, Solaris, SunOS4.x, Mac OS X, OSF (también conocido como Digital Unix o Tru64), Ultrix, * BSD, IRIX, AIX y otros. Algunos de esossistemas ya no son de uso generalizado y puede no ser capaz de soportar las versiones recientes de Wget. Si Wget falla alcompilar en su sistema, nos gustaría saberlo.

Gracias a los contribuyentes en especie, esta versión de Wget compila y funciona en 32 bits plataformas Microsoft Windows.Se ha compilado con éxito utilizando MS Visual C ++ 6.0, compiladores Watcom, Borland C, y del CCG. Naturalmente, separalizó de algunas de las características disponibles en Unix, pero debería funcionar como un sustituto de personas atrapadascon Windows. Tenga en cuenta que las porciones específicas de Windows de Wget no están garantizados para recibir apoyo enel futuro, aunque este ha sido el caso en la práctica desde hace muchos años. Todas las preguntas y problemas en la utilizaciónde Windows deben ser reportados a wget lista de correo en [email protected] donde los voluntarios que mantienen lascaracterísticas relacionadas con el Windows puede mirarlas.

El apoyo a la construcción de MS­DOS a través de DJGPP ha sido aportado por Gisle Vanem; un puerto para VMS se mantienepor Steven Schweda, y está disponible en http://antinode.org/ .

Anterior: Portabilidad , Up: Varios [ Contenidos ] [ Índice ]

8.8 Señales

Dado que el propósito de Wget es trabajo de fondo, que atrapa la señal de colgar ( SIGHUP ) y lo ignora. Si la salida fue en lasalida estándar, será redirigido a un archivo llamadowget‐log. De lo contrario, SIGHUP se ignora. Esto es conveniente cuando sedesea redirigir la salida de Wget después de haber comenzado.

$ Wget http://www.gnus.org/dist/gnus.tar.gz y...$ Kill ‐HUP %%SIGHUP recibió, redirigir la salida de `wget‐log '.

Aparte de eso, Wget no tratará de interferir con las señales de ninguna manera. Cc , matar ‐TERM y matar ‐KILL debería matarloigual.

Siguiente: Copia de este manual , Anterior: Varios , Up: Top [ Índice ] [ Índice ]

9 Apéndices

Este capítulo contiene algunas referencias que considero útil.

• Exclusión de Robots : El apoyo de Wget para RES.• Consideraciones de seguridad : Seguridad con Wget.

• Colaboradores : Las personas que ayudaron.

: Siguiente Consideraciones de Seguridad , Previous: Apéndices , Up: Apéndices [ Contenidos ] [ Índice ]

Exclusión 9.1 Robot

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 47/59

Es muy fácil de hacer Wget vagar sin rumbo por un sitio web, chupar todos los datos disponibles en el progreso. 'wget ‐rsitio', Y ya está. Gran? No por el administrador del servidor.

Mientras Wget sólo está recuperando páginas estáticas, y hacerlo a un precio razonable (véase el '‐‐wait'Opción), no hay muchode un problema. El problema es que Wget no puede decir la diferencia entre la página estática pequeño y el CGI más exigente.Un sitio que conozco tiene una sección a cargo de un CGI script en Perl que convierte archivos info para HTML sobre la marcha.El guión es lento, pero funciona bastante bien para los usuarios humanos que ve un archivo de información ocasional. Sinembargo, cuando recursiva descarga Wget de alguien tropieza con la página de índice que vincula a todos los ficheros Info através de la escritura, el sistema se pone de rodillas sin aportar nada útil para el usuario (Esta tarea de convertir ficheros Infopodría hacerse a nivel local y el acceso a la documentación Info para todo el software GNU instalado en un sistema estádisponible en la información de comandos).

Para evitar este tipo de accidentes, así como para preservar la privacidad de los documentos que deben ser protegidos de losrobots de buen comportamiento, el concepto de exclusión robot fue inventado. La idea es que los administradores de losservidores y los autores del documento pueden especificar qué partes del sitio que desean proteger de los robots y los que van apermitir el acceso.

El mecanismo más popular, y el de facto estándar compatible con todos los principales robots, es la "Robots ExclusiónStandard" (RES) escrito por Martijn Koster et al. en 1994. En él se especifica el formato de un archivo de texto que contiene lasdirectivas que instruyen a los robots que rutas URL que deben evitarse. Para ser encontrado por los robots, las especificacionesdeben ser colocados en /robots.txt en la raíz del servidor, que se espera que los robots para descargar y analizar.

Aunque Wget no es un robot de la red en el sentido estricto de la palabra, se puede descargar grandes partes del sitio sin laintervención del usuario para descargar una página individual. Debido a eso, honores Wget RES al descargar de formarecursiva. Por ejemplo, cuando se emite:

wget ‐r http://www.server.com/

En primer lugar el índice de "www.server.com'Se descargará. Si Wget encuentra que quiere descargar más documentos de eseservidor, solicitará 'http://www.server.com/robots.txt"Y, si lo encuentra, lo utilizan para obtener más descargas. robots.txtse carga sólo una vez por cada servidor.

Hasta la versión 1.8, Wget apoyó la primera versión de la norma, escrita por Martijn Koster en 1994 y disponible enhttp://www.robotstxt.org/wc/norobots.html . Desde la versión 1.8, Wget ha apoyado las directivas adicionales especificadas enel proyecto de internet '<proyecto‐koster‐robots‐00.txt>'Titulado "Un Método para Web Robots de control". El proyecto, quetiene por lo que nunca se sabe hice a un RFC , está disponible en http://www.robotstxt.org/wc/norobots­rfc.txt .

Este manual ya no incluye el texto de la Exclusión de Robots estándar.

El segundo mecanismo, menos conocida, permite que el autor de un documento individual para especificar si quieren que losenlaces desde el archivo a ser seguidos por un robot. Esto se logra mediante el META tag, así:

<Meta name = "robots" content = "nofollow">

Esto se explica con cierto detalle en http://www.robotstxt.org/wc/meta­user.html . Wget soporta este método de exclusión robotademás de la habitual/robots.txt exclusión.

Si usted sabe lo que está haciendo y realmente desea apagar la exclusión de robots, establezca el robots variable 'apagado'En su.wgetrc. Usted puede conseguir el mismo efecto desde la línea de comandos con el ‐e interruptor, por ejemplo 'wget robots ‐e= OFF url ...'.

Siguiente: Colaboradores , Previous: Robot Exclusión , Up: Apéndices [ Contenidos ] [ Índice ]

9.2 Consideraciones de seguridad

Al usar Wget, debe ser consciente de que envía contraseñas sin cifrar a través de la red que pueden representar un problema deseguridad. Éstos son los temas principales, y algunas soluciones.

1. Las contraseñas en la línea de comandos son visibles usando ps . La mejor manera de evitarlo es usar wget ‐i ‐ yalimentar la URL s a la entrada estándar de Wget, cada uno en una línea separada, terminado por Cd . Otra solución esutilizar.netrcpara almacenar contraseñas; Sin embargo, el almacenamiento de contraseñas sin cifrar también se consideraun riesgo para la seguridad.

2. Utilizando la inseguridad básica esquema de autenticación, las contraseñas sin cifrar se transmiten a través de los routersde red y gateways.

3. Los FTP contraseñas también son de ninguna manera encriptada. No hay una buena solución para esto en este momento.4. Aunque la salida "normal" de Wget trata de ocultar las contraseñas, registros de depuración ellos muestran, en todas las

formas. Este problema se evita con cuidado al enviar registros de depuración (sí, incluso cuando se les envíe a mí).

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 48/59

Anterior: Consideraciones de Seguridad , Up: Apéndices [ Contenidos ] [ Índice ]

9.3 Colaboradores

GNU Wget fue escrito por Hrvoje Niksic [email protected] .

Sin embargo, el desarrollo de Wget nunca podría haber ido tan lejos como lo ha hecho, si no fuera por la ayuda de muchaspersonas, ya sea con los informes de fallos, propuestas de características, parches o cartas diciendo "¡Gracias!".

Un agradecimiento especial a las siguientes personas (sin orden en particular):

Dan Harkless contribuyó­un montón de código y documentación de muy alta calidad, así como el ‐‐page‐requisitos yopciones relacionadas. Él fue el principal mantenedor durante algún tiempo y liberado Wget 1.6.Ian Abbott contribuyó­correcciones de errores, correcciones relacionadas con Windows y proporciona un prototipo deaplicación de la descarga recursiva en amplitud. Co­mantenido Wget durante el ciclo de 1,8 liberación.La tripulación dotsrc.org, en particular, Karsten Thygesen donó­recursos del sistema, como la lista de correo, espacioweb, FTP espacio, y repositorios de control de versiones, junto con un montón de tiempo para hacer verdaderamentefuncionan. Cristiano Reiniger fue de inestimable ayuda con la configuración de Subversion.Heiko Herold­proporciona alta calidad de Windows construye y contribuyó bug y construir informes para muchos años.Shawn informes McHorse­errores y parches.Kaveh R. Ghazi­on­the­fly ansi2knr ­ization. Muchas correcciones de portabilidad.Gordon Matzigkeit­.netrc apoyo.Zlatko Čalušić, Tomislav Vujec y sugerencias Kacar en características Drazen y discusiones "filosóficas".Darko puerto Budor­inicial a Windows.Antonio Rosella­ayuda y sugerencias, además de la traducción inicial italiana.Tomislav Petrovic, Mario Mikocevic­muchos informes de errores y sugerencias.Francois Pinard­muchos informes de errores a fondo y discusiones.Karl­Eichwalder mucha ayuda a la internacionalización, diseño Makefile y muchas otras cosas.Apoyo a Opie y Junio Hamano­donado HTTP Recopilación de autenticación.Mauro Tortonesi­mejorado la compatibilidad con IPv6, añadiendo soporte para los sistemas familiares duales.Rediseñado y mejorado código FTP IPv6. Mantenido GNU Wget 2.004 a 2.007.Christopher G. Lewis­mantenimiento de la versión de Windows de GNU Wget.Gisle Vanem­muchos parches y mejoras útiles, especialmente para el soporte de Windows y MS­DOS.Ralf Wildenhues contribuyó­parches para convertir Wget utilizar Automake como parte de su proceso de construcción, yvarias correcciones de errores.Steven Schubiger­Muchos parches útiles, correcciones de errores y mejoras. En particular, la conversión de Wget utilizarlas comillas Gnulib y módulos quoteargs, y la adición de password en la consola, a través de la Gnulib getpasswd­gnumódulo.Soporte para CSS Ted Mielczarek­donado.San Xavier­Apoyo a los IRI (RFC 3987).Las personas que dieron donaciones para el desarrollo, incluyendo a Brian Gough.

Las siguientes personas han aportado parches, bug / crear informes, sugerencias útiles, servicios de pruebas beta, cartas deadmirador y todas las otras cosas que hacen mantenimiento muy divertido:

Tim Adam, Adrian Aichner, Martin Baehr, Dieter Baron, Roger Beeman, Dan Berger, T. Bharat, Christian Biere, Paul Bludov,Daniel Bodea, Mark Boyns, John Burden, Julien Buty, Wanderlei Cavassin, Gilles Cedoc, Tim Charron, Noel Cragg, KristijanConkas, John diario, Andreas Damm, Ahmon Dancy, Andrew Davison, Bertrand Demiddelaer, Alexander Dergachev, AndrewDeryabin, Ulrich Drepper, Marc Duponcheel, Damir Dzeko, Alan Eldridge, Hans­Andreas Engel, Aleksandar Erkalovic, AndyEskilsson, Joao Ferreira, Christian Fraenkel, David Fritz, Mike Frysinger, Charles C. Fu, Fujishima Satsuki, Masashi Fujita,Howard Gayle, Marcel Gerrits, Lemble Gregory, Hans Grobler, Alain Guibert, Mathieu Guillaume, Aaron Hawley, JochenHein, Karl Heuer, Madhusudan Hosaagrahara, HIROSE Masaaki, Ulf Harnhammar, Gregor Hoffleit, Erik Magnus HULTHÉN,Richard Huveneers, Jonas Jensen, Larry Jones, Simon Josefsson, Mario Juric, Hack Kampbjorn, Const Kaplinsky, GoranKezunovic, Igor Khristophorov, Robert Kleine, KOJIMA Haime, Fila Kolodny , Alexander Kourakos, Martin Kraemer, SamiKrank, Jay Krell, Simos KSenitellis, Christian Lackas, Hrvoje Lacko, Daniel S. Lewart, Nicolas Lichtmeier, Dave Amor,Alexander V. Lukyanov, Thomas Lussnig, Andre Majorel, Aurelien Marchand, Matthew J. Mellon, Jordan Mendelson, TedMielczarek, Robert Millan, Lin Zhe mínima, Jan Minar, Tim Mooney, Keith Moore, Adam D. Moss, Simon Munton, CharlieNégyesi, RK Owen, Jim París, Kenny Parnell, Leonid Petrov, Simone Piunno, Andrew Pollock, Steve Pothier, Jan Prikryl,Marin Purgar, Csaba Raduly, Keith Refson, Bill Richardson, Tyler Riddle, Tobias Ringstrom, Jochen Roderburg, Juan JoséRodríguez, Maciej W. Rozycki, Edward J. Sabol, Heinz Salzmann, Robert Schmidt, Nicolas Schodet, Benno Schulenberg,Andreas Schwab, Steven M. Schweda, Chris Seawood, Pranab Shenoy, Dennis Smit, Toomas Soome, Tage Stabell­Kulo, PhilipStadermann, Daniel Stenberg, Sven Sternberger, Markus Strasser, John Summerfield, Szakacsits Szabolcs, Mike Thomas,Philipp Thomas, Mauro Tortonesi, Dave Turner, Gisle Vanem, Rabin Vicente, Russell Vicente, Zeljko Vrba, Charles GWaldman, Douglas E. Wegscheid, Ralf Wildenhues, Joshua David Williams, Benjamin Wolsey, San Javier, YAMAZAKIMakoto, Jasmin Zainul , Bojan Zdrnja, Kristijan Zimmer, Xin Zou.

Mis disculpas a todos los que sin querer me he dejado, y muchas gracias a todos los suscriptores de la lista de correo Wget.

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 49/59

Siguiente: Índice Concepto , Anterior: Apéndices , Up: Top [ Índice ] [ Índice ]

Apéndice A Copiar este manual

• Licencia de Documentación Libre : Licencia para la copia de este manual.

Anterior: Copia de este manual , Up: Copia de este manual [ Contenidos ] [ Índice ]

A.1 GNU Free Documentation License

Versión 1.3, 03 de noviembre 2008

Copyright © 2000, 2001, 2002, 2007, 2008 Free Software Foundation, Inc. http://fsf.org/

Se permite la copia y distribución de copias literalesde este documento de licencia, pero cambiándolo no está permitido.

1. PREÁMBULO

El propósito de esta Licencia es permitir que un manual, libro de texto, u otro documento funcional y útil libre en elsentido de libertad: asegurar a todo el mundo la libertad efectiva de copiarlo y redistribuirlo, con o sin modificaciones, demanera comercial o no. Segundo término, esta Licencia proporciona al autor y al editor una manera de obtenerreconocimiento por su trabajo, sin que se le considere responsable de las modificaciones realizadas por otros.

Esta licencia es una especie de "copyleft", lo que significa que los trabajos derivados del documento deben a su vez serlibres en el mismo sentido. Complementa la Licencia Pública General de GNU, que es una licencia copyleft diseñada parael software libre.

Hemos diseñado esta Licencia para usarla en manuales de software libre, ya que el software libre necesita documentaciónlibre: un programa libre debe venir con manuales que ofrezcan la mismas libertades que hace el software. Pero estalicencia no se limita a manuales de software; que puede ser utilizado para cualquier texto, sin tener en cuenta su temáticao si se publica como libro impreso. Recomendamos esta licencia principalmente para trabajos cuyo fin sea instructivo ode referencia.

2. Aplicabilidad y definiciones

Esta Licencia se aplica a cualquier manual u otro trabajo, en cualquier soporte, que contenga una nota colocada por eltenedor del copyright diciendo que puede ser distribuido bajo los términos de esta Licencia. Tal nota garantiza unalicencia libre de regalías en todo el mundo, sin límite de tiempo, el uso de dicho trabajo según las condiciones aquíestipuladas. El "Documento", a continuación, se refiere a cualquiera de dichos manuales o trabajos. Cualquier miembrodel público es un licenciatario y será referido como "usted". Usted acepta la licencia si copia, modifica o distribuye eltrabajo de cualquier modo que requiera permiso según la ley de derechos de autor.

Una "Versión Modificada" del Documento significa cualquier trabajo que contenga el Documento o una porción delmismo, ya sea una copia literal o con modificaciones y / o traducido a otro idioma.

Una "Sección Secundaria" es un apéndice con título o una sección preliminar al prólogo del Documento que trataexclusivamente de la relación de los editores o autores del Documento con el tema general del Documento (o asuntosrelacionados) y no contiene nada que pueda caer directamente en este tema general. (Por lo tanto, si el Documento es enparte un texto de matemáticas, una Sección Secundaria puede no explicar matemáticas.) La relación puede ser un asuntode conexión histórica con el tema o temas relacionados, o de legal, comercial, filosófica, ética o posición política conrespecto a ellos.

Las "Secciones Invariantes" son ciertas Secciones Secundarias cuyos títulos son designados como Secciones Invariantesen la nota que indica que el documento es liberado bajo esta Licencia. Si una sección no entra en la definición deSecundaria, no se puede designarse como Invariante. El documento puede no tener Secciones Invariantes. Si elDocumento no identifica las Secciones Invariantes, es que no hay ninguno.

Los "Textos de Cubierta" son ciertos pasajes cortos de texto que se listan como Textos de Cubierta Delantera ni Textos deCubierta Trasera en la nota que indica que el documento es liberado bajo esta Licencia. Una de Cubierta Delantera textopuede tener como mucho 5 palabras, y un Texto de Cubierta Trasera puede tener hasta 25 palabras.

Una copia "Transparente" del Documento significa una copia para lectura en máquina, representada en un formato cuyaespecificación está disponible al público en general, que es apto para que los contenidos editados directamente coneditores de texto genéricos o (para imágenes compuestas por puntos) genéricos de programas o (para dibujos) con algúneditor de dibujos ampliamente disponible, y que sea adecuado para exportar a formateadores de texto o para traducción

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 50/59

automática a una variedad de formatos adecuados para ingresar a formateadores de texto. Una copia hecha en un formatodefinido como Transparente, pero cuyo margen de beneficio, o la ausencia de marcas, ha sido diseñado para impedir odificultar modificaciones posteriores por los lectores no es Transparente. Un formato de imagen no es Transparente si seusa para una cantidad de texto sustancial. Una copia que no es "Transparente" es llamada "Opaca".

Como ejemplos de formatos adecuados para copias Transparentes están ASCII puro sin marcaje, formato de entrada deTexinfo, formato de LaTeX, SGML o XML usando una DTD disponible públicamente, y HTML simple que sigan losestándares, PostScript o PDF diseñado para modificaciones humanas. Ejemplos de formatos de imagen transparentes sonPNG, XCF y JPG. Los formatos Opacos incluyen formatos propietarios que pueden ser leídos y editados únicamente enprocesadores de palabras propietarios, SGML o XML para los cuáles las DTD y / o herramientas de procesamiento noestén ampliamente disponibles, y la máquina generados HTML, PostScript o PDF generados por algunos procesadores depalabras sólo como salida.

La "Portada" significa, en un libro impreso, la página de título, más las páginas siguientes que sean necesarias paramantener legiblemente el material que esta Licencia requiere que aparezca en la portada. Para trabajos en formatos que notienen página de portada como tal, "Portada" significa el texto cercano a la aparición más prominente del título deltrabajo, precediendo el comienzo del cuerpo del texto.

El "editor" significa cualquier persona o entidad que distribuye copias del Documento para el público.

Una sección "Titulada XYZ" significa una subunidad llamada del Documento cuyo título es precisamente XYZ ocontiene XYZ entre paréntesis a continuación de texto que traduce XYZ a otro idioma. (Aquí XYZ se refiere a nombre dela sección específica que se menciona a continuación, como "Aprobaciones", "Dedicatorias" "Agradecimientos", o"Historia".) Para "Conservar el Título" de tal sección cuando se modifica el Documento significa que sigue siendo unasección "Titulada XYZ" según esta definición.

El Documento puede incluir Limitaciones de Garantía cercanas a la nota que indica que esta Licencia se aplica alDocumento. Estas limitaciones de garantía se consideran incluidas, por referencia, en la Licencia, pero sólo en lo querespecta negando garantías: cualquier otra implicación que estas Limitaciones de Garantía puedan tener es nula y no tieneefecto sobre el significado de esta Licencia.

3. Copia literal

Usted puede copiar y distribuir el Documento en cualquier soporte, sea en forma comercial o no, siempre y cuando estaLicencia, las notas de copyright, y el aviso indica que esta Licencia se aplica al Documento se reproduzcan en todas lascopias y que usted no añada ninguna otra condición a los de esta Licencia. Usted no puede usar medidas técnicas paraobstruir o controlar la lectura o copia posterior de las copias que usted haga o distribuya. Sin embargo, usted puedeaceptar compensación a cambio de las copias. Si distribuye un número suficientemente grande de copias también deberáseguir las condiciones de la sección 3.

Usted también puede prestar copias, bajo las mismas condiciones establecidas anteriormente, y puede exhibir copiaspúblicamente.

4. COPIADO EN CANTIDAD

Si publica copias impresas (o copias en soportes que tengan normalmente cubiertas impresas) del Documento, que sumanmás de 100, y la nota de Licencia del Documento exige Textos de Cubierta, debe incluir las copias con cubiertas quelleven en forma clara y legible, todos estos Textos de Cubierta: Textos de Cubierta Delantera en la cubierta delantera, ytextos de cubierta trasera de la cubierta posterior. Ambas cubiertas deben clara y legible identificarle como editor de talescopias. La cubierta debe mostrar el título completo con todas las palabras del título igualmente prominentes y visibles.Usted puede añadir otro material en las cubiertas. Las copias con cambios limitados a las cubiertas, siempre queconserven el título del Documento y satisfagan estas condiciones, puede ser tratada como una copia literal en otrosaspectos.

Si los textos requeridos para la cubierta son muy voluminosos para que ajusten legiblemente, debe colocar los primerosmencionados (tantos como sea razonable colocar) en la verdadera cubierta y situar el resto en páginas adyacentes.

Si publica o distribuye copias Opacas del Documento cuya cantidad exceda las 100, debe incluir una copia legible pormáquina transparente junto con cada copia Opaca, o bien mostrar, en cada copia Opaca una ubicación de la redinformática de la que el en red en general utilizando público tiene acceso por medio de protocolos de red pública estándaruna copia Transparente del Documento completa, sin material adicional. Si utiliza la última opción, deberá tomar lasmedidas necesarias, cuando comience la distribución de las copias Opacas en cantidad, para asegurar que esta copiaTransparente permanecerá accesible en el sitio establecido por lo menos un año después de la última vez que distribuyauna copia Opaca (directamente oa través de sus agentes o distribuidores) de esa edición al público.

Se solicita, pero no se requiere, que se contacte con los autores del Documento antes de redistribuir gran número decopias, para darles la oportunidad de que le proporcionen una versión actualizada del Documento.

5. MODIFICACIONES

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 51/59

Usted puede copiar y distribuir una Versión Modificada del Documento bajo las condiciones de las secciones 2 y 3anteriores, siempre que usted libere la Versión Modificada bajo esta misma Licencia, con la Versión Modificada haciendoel rol del Documento, por lo tanto licenciando la distribución y modificación de la Versión Modificada a quienquieraposea una copia de la misma. Además, debe hacer lo siguiente en la Versión Modificada:

1. Uso en la Portada (y en las cubiertas, si hay alguna) un título distinto al del Documento y de sus versionesanteriores (que deberían, si hay alguna, estar listado en la sección de Historia del Documento). Usted puede usar elmismo título que una versión anterior si el editor original de dicha versión da permiso.

2. Listar en la Portada, como autores, una o más personas o entidades responsables de la autoría de las modificacionesde la Versión Modificada, junto con por lo menos cinco de los autores principales del Documento (todos susautores principales, si hay menos de cinco), a menos que le eximan de tal requisito.

3. Mostrar en la Portada como editor el nombre del editor de la Versión Modificada, como el editor.4. Conservar todas las notas de copyright del Documento.5. Añadir una nota de copyright apropiada a sus modificaciones, adyacente a las otras notas de copyright.6. Incluir, inmediatamente después de las notas de copyright, una nota de licencia dando el permiso para usar la

Versión Modificada bajo los términos de esta Licencia, de la forma mostrada en la Adenda a continuación.7. Preservar en dicha licencia notar el listado completo de las Secciones Invariantes y de los Textos de Cubierta

necesaria en la nota de Licencia del Documento.8. Incluir una copia sin modificación de esta Licencia.9. Preservar la sección llamada "Historia", conservar su Título y añadirle un elemento que declare al menos el título,

el año, los nuevos autores y el editor de la Versión Modificada como reza en la Portada. Si no hay una seccióntitulada "Historia" en el Documento, crear una estableciendo el título, el año, los autores y el editor del Documento,tal como figura en su Portada, añadiendo además un elemento describiendo la Versión Modificada, como seestableció en la oración anterior.

10. Conservar la dirección en red, si la hay, dada en el Documento para el acceso público a una copia Transparente delmismo, así como las otras direcciones de red dadas en el Documento para versiones anteriores se basa. Puedenubicarse en la sección "Historia". Se puede omitir la ubicación en red de un trabajo que fue publicado por lo menoscuatro años antes que el Documento mismo, o si el editor original de dicha versión da permiso.

11. En cualquier sección Titulada "Agradecimientos" o "Dedicatorias", preservar el título de la sección, y preservar enla sección toda la sustancia y el tono de cada uno de los agradecimientos y / o dedicatorias contribuyente.

12. Conservar todas las Secciones Invariantes del Documento, sin alterar su texto ni sus títulos. Números de sección oel equivalente no son considerados parte de los títulos de la sección.

13. Borrar cualquier sección titulada "Aprobaciones". Una sección de este tipo no puede ser incluido en la VersiónModificada.

14. No cambiar el título de ninguna sección existente a ser titulada "Aprobaciones" o para que entre en conflicto con elde alguna Sección Invariante.

15. Conservar todas las Limitaciones de Garantía.

Si la Versión Modificada incluye secciones o apéndices que califiquen como Secciones Secundarias y contienen materialno copiado del Documento, puede opcionalmente designar algunas o todas esas secciones como invariantes. Para ello,añada sus títulos a la lista de Secciones Invariantes en la nota de licencia de la Versión Modificada. Tales títulos debenser distintos de cualquier otro título de sección.

Puede añadir una sección titulada "Aprobaciones", siempre que contenga únicamente aprobaciones de su VersiónModificada por otras fuentes, por ejemplo, observaciones de peritos o que el texto ha sido aprobado por una organizacióncomo la definición oficial de un estándar.

Puede añadir un pasaje de hasta cinco palabras como Texto de Cubierta Delantera y un pasaje de hasta 25 palabras comoTexto de Cubierta Posterior, al final de la lista de Textos de Cubierta en la Versión Modificada. Solamente un pasaje deTexto de Cubierta Delantera y uno al de Cubierta Trasera texto puede ser adicionado por (oa manera de arreglos hechospor) una entidad. Si el Documento ya incluye un texto de cubierta para la misma cubierta, previamente adicionado porusted o por arreglo hecho por la misma entidad que está actuando en nombre de, usted no puede añadir otro; pero puedereemplazar el anterior, con permiso explícito del editor anterior que añadió el antiguo.

El autor (s) y editor (s) del documento no lo hacen por esta Licencia permiso para usar sus nombres para publicidad nipara asegurar o implicar aprobación de cualquier Versión Modificada.

6. COMBINACIÓN DE DOCUMENTOS

Usted puede combinar el Documento con otros documentos liberados bajo esta Licencia, en los términos definidos en lasección 4 anterior para versiones modificadas, siempre que incluya en la combinación todas las Secciones Invariantes detodos los documentos originales, sin modificar, y enumerarlos todos como Secciones Invariantes del trabajo combinadoen su nota de licencia, y que debe incluir la Limitación de Garantía.

El trabajo combinado necesita contener solamente una copia de esta Licencia, y múltiples Secciones Invariantes idénticaspueden ser reemplazadas por una sola copia. Si hay varias Secciones Invariantes con el mismo nombre pero concontenidos diferentes, haga el título de cada una de estas secciones único añadiéndole al final del mismo, entre paréntesis,el nombre del autor o editor original de esa sección, si es conocido, o bien un número único. Haga el mismo ajuste a los

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 52/59

títulos de sección en la lista de Secciones Invariantes en la nota de licencia del trabajo combinado.

En la combinación, debe combinar cualquier sección titulada "Historia" de los varios documentos originales, formandouna sección titulada "Historia"; la misma forma combine cualquier sección titulada "Agradecimientos", y cualquiersección titulada "Dedicatorias". Debe borrar todas las secciones tituladas "Aprobaciones."

7. COLECCIONES DE DOCUMENTOS

Puede hacer una colección que conste del Documento y otros documentos liberados bajo esta Licencia, y reemplazar lascopias individuales de esta Licencia en todos los documentos por una sola copia que esté incluida en la colección,siempre que siga las reglas de esta Licencia para la copia literal de cada uno de los documentos en todos los demásaspectos.

Puede extraer un solo documento de una de tales colecciones y distribuirlo individualmente bajo esta Licencia, siempreque inserte una copia de esta Licencia en el documento extraído, y siga esta Licencia en todos los demás aspectosrelativos a la copia literal de dicho documento.

8. AGREGACIÓN CON TRABAJOS INDEPENDIENTES

Una recopilación del Documento o sus derivados con otros documentos o trabajos separados e independientes, en o sobreun volumen de un medio de almacenamiento o distribución, que se llama un "agregado" si no se utiliza el copyrightresultante de la compilación de limitar los derechos legales de usuarios de la compilación más allá de lo que permita eltrabajo individual. Cuando el Documento se incluye en un agregado, esta Licencia no se aplica a los otros trabajos delagregado que no sean en sí mismos derivados del Documento.

Si el requisito de Texto de Cubierta de la sección 3 es aplicable a estas copias del Documento y el Documento es menorque la mitad del agregado entero, Textos de Cubierta del Documento pueden colocarse en cubiertas que enmarquensolamente el Documento dentro del agregado, o la equivalente electrónico de las cubiertas si el documento está en formaelectrónica. En caso contrario deben aparecer en cubiertas impresas enmarcando todo el agregado.

9. TRADUCCIÓN

Traducción es considerada como un tipo de modificación, por lo que puede distribuir traducciones del Documento bajolos términos de la sección 4. El reemplazo las Secciones Invariantes con traducciones requiere permiso especial de lostitulares de derechos de autor, pero usted puede añadir traducciones de algunas o todas las Secciones Invariantesadicionalmente a las versiones originales de las Secciones Invariantes. Puede incluir una traducción de esta Licencia, detodas las notas de licencia del documento, y las Limitaciones de Garantía, siempre y cuando se incluya también la versiónen Inglés de esta Licencia y las versiones originales de las notas y renuncias. En caso de un desacuerdo entre latraducción y la versión original de esta licencia o una notificación o una abstención, la versión original en Inglésprevalecerá.

Si una sección del Documento está Titulada, "Dedicatorias" "Agradecimientos", o "Historia", el requisito (sección 4) deConservar su Título (Sección 1) requerirá, típicamente, cambiar su título.

10. TERMINACIÓN

Usted no puede copiar, modificar, sublicenciar o distribuir el Documento excepto como prevé expresamente estaLicencia. Cualquier intento de copiar, modificar, sublicenciar o distribuir es nulo, y terminará automáticamente susderechos bajo esta Licencia.

Sin embargo, si deja de violación de esta Licencia, entonces su licencia desde el poseedor del copyright correspondienteserá restituida (a) provisionalmente, a menos que y hasta que el titular del derecho de autor termina explícitamente y,finalmente, su licencia, y (b) de forma permanente, si el titular del derecho de autor dejase para notificarle de la violaciónpor algún cauce antes de 60 días después de la cesación.

Por otra parte, su licencia desde el poseedor del copyright correspondiente será restituida permanentemente si el poseedordel copyright le notifica de la violación por algún cauce, esta es la primera vez que ha recibido la notificación deviolación de esta Licencia (para cualquier trabajo) de ese poseedor de los derechos de autor, y curar la violación antes de30 días desde la recepción de la notificación.

La cancelación de sus derechos en virtud de esta sección no canceladas las licencias de terceros que hayan recibido copiaso derechos de usted bajo esta Licencia. Si se han terminado sus derechos y no restituidos de forma permanente, larecepción de una copia de parte o la totalidad del mismo material no le otorga ningún derecho para usarla.

11. REVISIONES FUTURAS DE ESTA LICENCIA

La Free Software Foundation puede publicar versiones nuevas y revisadas de la Licencia de documentación libre GNU devez en cuando. Tales versiones nuevas serán similares en espíritu a la presente versión, pero pueden diferir en detallespara considerar nuevos problemas o situaciones. Ver http://www.gnu.org/copyleft/ .

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 53/59

Cada versión de la Licencia tiene un número de versión que la distingue. Si el Documento especifica que una versiónnumerada en particular de esta licencia o "cualquier versión posterior" se aplica a él, usted tiene la opción de seguir lostérminos y condiciones, bien de esa versión especificada o de cualquier versión posterior que haya sido publicada (nocomo un borrador) por la Free Software Foundation. Si el Documento no especifica un número de versión de estaLicencia, puede escoger cualquier versión que haya sido publicada (no como borrador) por la Free Software Foundation.Si el Documento especifica que un apoderado puede decidir que se pueden utilizar las versiones futuras de esta licencia,la declaración pública de ese proxy de la aceptación de una versión permanentemente le autoriza a elegir esa versión parael documento.

12. Renovación de licencias

"Massive Multiautor Colaboración Sitio" (o "MMC Sitio") se refiere a cualquier servidor World Wide Web que publicatrabajos sujetos a copyright y también dispone de instalaciones prominentes para que cualquiera pueda editar esostrabajos. Un wiki pública que cualquiera puede editar es un ejemplo de uno de estos servidores. A "Colaboración MasivaMultiautor" (o "MMC") contenida en el sitio: cualquier conjunto de obras copyrightable así publicados en el sitio MMC.

"CC­BY­SA" significa la Reconocimiento­Compartir bajo la misma licencia Creative Commons 3.0 publicada porCreative Commons Corporation, una corporación sin fines de lucro que tiene su lugar principal de negocios en SanFrancisco, California, así como las futuras versiones de copyleft que licencia publicada por esa misma organización.

"Incorporar" significa publicar o volver a publicar un documento, en su totalidad o en parte, como parte de otrodocumento.

Una MMC es "elegible para la renovación de licencias" si está licenciado bajo esta licencia, y si todas las obras que sepublicaron por primera vez bajo esta Licencia en otro lugar que este MMC, y posteriormente incorporado en su totalidado en parte en el MMC, (1) no tenían Textos de Cubierta o secciones invariantes, y (2) se incorporan por lo tanto antes del1 de noviembre, 2008.

El operador de un sitio MMC puede volver a publicar una MMC contenida en el sitio debajo CC­BY­SA en el mismositio en cualquier momento antes del 1 de agosto del 2009, siempre que la MMC es elegible para la renovación delicencias.

ADENDA: Cómo usar esta Licencia en sus documentos

Para usar esta licencia en un documento que usted haya escrito, incluya una copia de la Licencia en el documento y ponga lossiguientes avisos de copyright y de licencia justo después de la portada:

Copyright (C) año su nombre . Se concede permiso para copiar, distribuir y / o modificar este documento bajo los términos de la licencia de documentación libre GNU, versión 1.3 o cualquier otra versión posterior publicada por la Free Software Foundation; sin Secciones Invariantes ni Textos de Cubierta Delantera y no Volver‐Cover Textos. Una copia de la licencia está incluida en la sección titulada `` GNU Licencia de Documentación Libre ''.

Si tiene Secciones Invariantes, Textos de Cubierta Delantera y Textos de Contra­tapa, reemplace la línea "sin ...." Con esto:

siendo las Secciones Invariantes lista de sus títulos , con los Textos de Cubierta Delantera lista , y con los Textos de Cubierta Trasera estar lista .

Si tiene Secciones Invariantes sin Textos de Cubierta o cualquier otra combinación de los tres, mezcle ambas alternativas paraadaptarse a la situación.

Si su documento contiene ejemplos no triviales de código de programa, recomendamos liberar estos ejemplos en paralelo bajosu elección de licencia de software libre, como la Licencia Pública General GNU, para permitir su uso en software libre.

Anterior: Copia de este manual , Up: Top [ Índice ] [ Índice ]

Índice Concepto

Saltar a # . A B C D E F G H I K L M N O P Q R S T U V W

Entrada de índice Sección

##wget : Internet Relay Chat

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 54/59

.extensión .css : Opciones de HTTPextensión .html : Opciones de HTTP.listing archivos, la eliminación de : Opciones FTP.netrc : Archivo de inicio.wgetrc : Archivo de inicio

Laaceptar directorios : Límites basado en directoriosaceptar sufijos : Tipos de Archivosaceptar comodines : Tipos de ArchivosAnexar al registro : De registro de entrada y Opciones de archivoargumentos : Invocandoautenticación : Opciones de descargaautenticación : Opciones de HTTPautenticación : Opciones de HTTP

Bcopias de seguridad de archivos convertidos : Recursivas Opciones de recuperacióncopias de seguridad de archivos : Opciones de descargaancho de banda, límite : Opciones de descargabase para los vínculos relativos en archivo de entrada : De registro de entrada y Opciones de archivoDirección bind : Opciones de descargainformes de errores : Informar de erroreserrores : Informar de errores

Ccaché : Opciones de HTTPel almacenamiento en caché de las búsquedas de DNS : Opciones de descargacaso pliegue : Recursiva Aceptar / Rechazar Opcionescliente dirección IP : Opciones de descargaclobbering, archivo : Opciones de descargalínea de comandos : Invocandocomentarios, HTML : Recursivas Opciones de recuperaciónconecte tiempo de espera : Opciones de descargaContenido On Error : Opciones de HTTPContent­Disposition : Opciones de HTTPContent­Length, ignorar : Opciones de HTTPcontinuar la recuperación : Opciones de descargacontinuar la recuperación : Opciones de descargacolaboradores : Colaboradoresconversión de los enlaces : Recursivas Opciones de recuperaciónGalletas : Opciones de HTTPcookies, carga : Opciones de HTTPgalletas, el ahorro : Opciones de HTTPgalletas, sesión : Opciones de HTTPdirectorios de corte : Opciones de directorio

Ddebug : De registro de entrada y Opciones de archivopredeterminado nombre página : Opciones de HTTPeliminar después de la recuperación : Recursivas Opciones de recuperacióndirectorios : Límites basado en directorios

directorios, excluyen : Límites basado en directoriosdirectorios, incluyen : Límites basado en directorios

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 55/59

límites de directorio : Límites basado en directoriosdirectorio prefijo : Opciones de directorioCaché de DNS : Opciones de descargaTiempo de espera de DNS : Opciones de descargaestilo del punto : Opciones de descargadescargar varias veces : Opciones de descarga

EEGD : HTTPS Opciones (SSL / TLS)entropía, especificando fuente de : HTTPS Opciones (SSL / TLS)ejemplos : Ejemplosexcluir directorios : Límites basado en directoriosejecutar comandos wgetrc : Opciones básicas de inicio

FFDL, GNU Free Documentation License : GNU Free Documentation Licensecaracterísticas : Visión de conjuntolos nombres de archivo, restringir : Opciones de descargapermisos de archivos : Opciones FTPllenando proxy caché : Recursivas Opciones de recuperaciónseguir enlaces de FTP : Recursiva Aceptar / Rechazar Opcionessiguientes enlaces ftp : Enlaces FTPsiguientes enlaces : Siguientes enlacesfuerza html : De registro de entrada y Opciones de archivoautenticación ftp : Opciones FTPcontraseña ftp : Opciones FTPsellado de tiempo ftp : FTP de sellado de tiempo Internosusuario ftp : Opciones FTP

Gglobbing, de palanca : Opciones FTP

Hcolgar : Señalescabecera, añadir : Opciones de HTTPanfitriones, que abarca : Abarcando los EjércitosHTML comentarios : Recursivas Opciones de recuperacióncontraseña http : Opciones de HTTPhttp árbitro : Opciones de HTTPsellado de tiempo http : HTTP de sellado de tiempo Internosusuario http : Opciones de HTTP

YOapoyo idn : Opciones de descargaignorar caso : Recursiva Aceptar / Rechazar Opcionesignorar longitud : Opciones de HTTPincluir directorios : Límites basado en directoriosdescargas incompletas : Opciones de descargadescargas incompletas : Opciones de descargaactualización gradual : De Sellado de Tiempoindex.html : Opciones de HTTParchivo de entrada : De registro de entrada y Opciones de archivoInternet Relay Chat : Internet Relay Chatinvocación : InvocandoDirección IP del cliente : Opciones de descarga

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 56/59

IPv6 : Opciones de descargaIRC : Internet Relay Chatapoyo iri : Opciones de descarga

KKeep­Alive, apagar : Opciones de HTTP

Lúltima versión : Distribuciónancho de banda límite : Opciones de descargaconversión enlace : Recursivas Opciones de recuperaciónenlaces : Siguientes enlaceslista : Listas de correoGalletas de carga : Opciones de HTTPcodificación local : Opciones de descargaubicación de wgetrc : Wgetrc Ubicaciónel archivo de registro : De registro de entrada y Opciones de archivo

Mlista de correo : Listas de correomirroring : Uso muy avanzada

Nningún padre : Límites basado en directoriossin clobber : Opciones de descarganohup : Invocandonúmero de intentos : Opciones de descarga

Odesplazamiento : Opciones de descargasistemas operativos : Portabilidadopción sintaxis : Sintaxis OpciónOtros métodos HTTP : Opciones de HTTParchivo de salida : De registro de entrada y Opciones de archivovisión general : Visión de conjunto

PPágina requisitos : Recursivas Opciones de recuperaciónftp pasivo : Opciones FTPcontraseña : Opciones de descargapausa : Opciones de descargaConexiones persistentes, incapacitante : Opciones de HTTPportabilidad : PortabilidadPOSTE : Opciones de HTTPindicador de progreso : Opciones de descargaproxies : ProxiesProxy : Opciones de descargaProxy : Opciones de HTTP

autenticación de proxy : Opciones de HTTPllenado de proxy : Recursivas Opciones de recuperacióncontraseña del proxy : Opciones de HTTPusuario de proxy : Opciones de HTTP

Q

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 57/59

tranquila : De registro de entrada y Opciones de archivocuota : Opciones de descarga

Rde espera aleatorio : Opciones de descargaaleatoriedad, especificando fuente de : HTTPS Opciones (SSL / TLS)tasa, límite : Opciones de descargaleer tiempo de espera : Opciones de descargarecursividad : Recursiva Descargardescarga recursiva : Recursiva Descargarredirigir : Opciones de HTTPredirigir la salida : Uso avanzadoárbitro, http : Opciones de HTTPrechazar directorios : Límites basado en directoriosrechazar sufijos : Tipos de Archivosrechazar comodines : Tipos de Archivosenlaces relativos : Enlaces relativoscodificación remota : Opciones de descargaCómo informar de fallos : Informar de erroresimágenes necesarias, la descarga : Recursivas Opciones de recuperaciónDescarga reanudar : Opciones de descargaDescarga reanudar : Opciones de descargareintentos : Opciones de descargareintentos, espera entre : Opciones de descargarecuperación : Recursiva Descargarexclusión robot : Exclusión de Robotsrobots.txt : Exclusión de Robots

Sdegustar wgetrc : Muestra wgetrcahorro de las cookies : Opciones de HTTPseguridad : Consideraciones de seguridadel mantenimiento del servidor : Exclusión de Robotsrespuesta del servidor, de impresión : Opciones de descargarespuesta del servidor, salvo : Opciones de HTTPcookies de sesión : Opciones de HTTPmanejo de señales : Señaleshosts que abarca : Abarcando los Ejércitosespecifique config : De registro de entrada y Opciones de archivoaraña : Opciones de descargaSSL : HTTPS Opciones (SSL / TLS)Certificado SSL : HTTPS Opciones (SSL / TLS)Autoridad de certificados SSL : HTTPS Opciones (SSL / TLS)SSL tipo de certificado, especifique : HTTPS Opciones (SSL / TLS)Certificado SSL, compruebe : HTTPS Opciones (SSL / TLS)SSL CRL, la lista de revocación de certificados : HTTPS Opciones (SSL / TLS)Protocolo SSL, seleccione : HTTPS Opciones (SSL / TLS)

posición inicial : Opciones de descargainicio : Archivo de inicioarchivo de inicio : Archivo de iniciosufijos aceptan : Tipos de Archivossufijos, rechazan : Tipos de Archivosenlaces simbólicos, la recuperación : Opciones FTPsintaxis de opciones : Sintaxis Opción

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 58/59

sintaxis de wgetrc : Sintaxis wgetrc

Ttag­basa poda recursiva : Recursiva Aceptar / Rechazar Opcionessellado de tiempo : De Sellado de Tiemposellado de tiempo de uso : Sellado de tiempo de usoTiempo de espera : Opciones de descargatiempo de espera, conecte : Opciones de descargatiempo de espera, DNS : Opciones de descargatiempo de espera, lea : Opciones de descargasellado de tiempo : De Sellado de Tiempointenta : Opciones de descargaConfía en los nombres de servidor : Opciones de HTTPtipos de archivos : Tipos de Archivos

Udesvincular : Opciones de descargala actualización de los archivos : De Sellado de TiempoURL : Formato URLSintaxis de URL : Formato URLuso, sellado de tiempo : Sellado de tiempo de usousuario : Opciones de descargauser­agent : Opciones de HTTP

Vdiversos : Varioverbose : De registro de entrada y Opciones de archivo

Wesperar : Opciones de descargaesperar, al azar : Opciones de descargaespera entre reintentos : Opciones de descargaARM : HTTPS Opciones (SSL / TLS)sitio web : Sitio WebWget como araña : Opciones de descargawgetrc : Archivo de iniciowgetrc comandos : Comandos wgetrcwgetrc ubicación : Wgetrc Ubicaciónwgetrc sintaxis : Sintaxis wgetrccomodines, aceptan : Tipos de Archivoscomodines, rechazan : Tipos de ArchivosNombres de archivos de Windows : Opciones de descarga

Saltar a # . A B C D E F G H I K L M N O P Q R S T U V W

Tabla de contenido

1 Información general2 Invocación

2.1 URL Formato2.2 Opción Sintaxis2.3 Opciones básicas de inicio2,4 de registro de entrada y Opciones de archivo2.5 Opciones de descarga2.6 Opciones de directorio2.7 Opciones de HTTP

7/3/2015 GNU Wget 1.16.2 Manual

http://www.gnu.org/software/wget/manual/wget.html#Invoking 59/59

2.8 HTTPS (SSL / TLS) Opciones2.9 Opciones de FTP2.10 recursivas Opciones de recuperación2.11 recursiva Aceptar / Rechazar OpcionesStatus 2.12 Salir

3 recursiva Descargar4 siguientes enlaces

4.1 Hosts Spanning4.2 Tipos de Archivos4.3 Límites basado en directorios4.4 Enlaces relativos4.5 siguientes enlaces FTP

5 de Sellado de TiempoUso 5.1 de Sellado de Tiempo5.2 HTTP de sellado de tiempo Internos5.3 FTP de sellado de tiempo Internos

6 Puesta en marcha del archivo6.1 wgetrc Ubicación6.2 Sintaxis wgetrc6.3 Comandos wgetrc6.4 Muestra wgetrc

7 Ejemplos7.1 Uso simple7.2 Uso avanzado7.3 Uso muy avanzada

8 Varios8.1 La representación8.2 DistribuciónSitio Web 8.38.4 Listas de correo

Lista PrimariaLista Avisos de erroresListas obsoletos

8.5 Internet Relay Chat8.6 Informes de fallos8.7 Portabilidad8.8 Señales

9 ApéndicesExclusión 9.1 Robot9.2 Consideraciones de seguridad9.3 Colaboradores

Apéndice A Copiar este manualA.1 GNU Free Documentation License

Índice Concepto

Notas al pie

(1)

Si usted tiene un .netrc archivo en su directorio personal, la contraseña también se buscará allí.

(2)

Como una comprobación adicional, Wget mirará el Content‐Length cabecera, y comparar los tamaños; si no son los mismos, elarchivo remoto se descargará no importa lo que dice la marca de tiempo.


Recommended