meta data de esta página
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previaPróxima revisiónAmbos lados, revisión siguiente | ||
programacion:python:scrapy [2015/12/14 22:48] – lc | programacion:python:scrapy [2015/12/20 21:34] – [Instalación y configuración] lc | ||
---|---|---|---|
Línea 6: | Línea 6: | ||
==== Instalación y configuración ==== | ==== Instalación y configuración ==== | ||
+ | Primero instalamos python | ||
+ | < | ||
+ | sudo apt-get install python-pip python-dev libxml2-dev libxslt1-dev</ | ||
- | Primero | + | Seguidamente |
< | < | ||
virtualenv venv</ | virtualenv venv</ | ||
Línea 17: | Línea 20: | ||
< | < | ||
- | < | + | < |
+ | |||
+ | Una vez instalado vamos a crear nuestra primera araña. | ||
+ | |||
+ | < | ||
+ | |||
+ | Para generar una araña usando esta plantilla debemos escribir en la consola scrapy genspider -t crawl. En nuestro caso a la araña la llamaremos segundamano y el dominio será el de la segundamano.es | ||
+ | <code>scrapy genspider -t crawl segundamano segundamano.es </ | ||
+ | |||
+ | Al ejecutar el comando se genera dentro un fichero segundamano.py dentro del **directorio del proyecto/ | ||
+ | < | ||
+ | ├── tutorial | ||
+ | │ | ||
+ | │ | ||
+ | │ | ||
+ | │ | ||
+ | │ | ||
+ | │ | ||
+ | │ | ||
+ | └── scrapy.cfg | ||
+ | </ | ||
+ | ==== Referencias ==== | ||
+ | * http:// |