博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Scrapy框架---第一个小实例及TabError: inconsistent use of tabs and spaces in indentation解决方法
阅读量:3959 次
发布时间:2019-05-24

本文共 774 字,大约阅读时间需要 2 分钟。

总结 北理工-嵩老师

均在cmd里面的命令行中运行
准备条件,准备一个文件夹用于存储此框架代码,先切盘切路径到该位置
1.0 创建框架 Scrapy startproject python123demo
2.0 切换到下一步路径(该框架文件的路径下) cd python123demo
3.0 创建爬虫 scrapy genspider demo python123.io
在这里插入图片描述
4.0配置文件;刚创建的demo.py文件
在这里插入图片描述
代码替换,替换掉原有代码

import scrapyclass DemoSpider(scrapy.Spider):	name = "demo"     	#allowed_domains = ["python123.io"]    	start_urls = ['https://python123.io/ws/demo.html']     	def parse(self, response):   		fname = response.url.split('/')[-1]		with open(fname, 'wb') as f:				f.write(response.body)		self.log('Saved file %s.' % name)

保存后,继续在cmd里面运行Scrapy scrapy crawl demo

运行后爬取到的文件保存在与项目名同一级目录下,如下图所示:
在这里插入图片描述
爬取过程中出现的错误:TabError: inconsistent use of tabs and spaces in indentation
用pycharm打开刚编写的代码,系统给出一条提示Unexpected indent翻译过来就是意外缩进的意思,
你可以查看自己刚编写的代码是否存在缩进问题。尽量避免使用txt文本文档

转载地址:http://qamzi.baihongyu.com/

你可能感兴趣的文章
内核抢占
查看>>
编译linux内核源码 ubuntu
查看>>
epoll使用详解
查看>>
epoll
查看>>
The AnimationClip 'Walk' used by the Animation component 'Pig' must be marked as Legacy.
查看>>
《Linux内核设计与实现》- Linux的进程
查看>>
《Linux内核设计与实现》- 进程的调度
查看>>
inet_ntoa()
查看>>
POSIX消息队列mq_open问题
查看>>
两个数组a[N],b[N],其中A[N]的各个元素值已知,现给b[i]赋值,b[i] = a[0]*a[1]*a[2]…*a[N-1]/a[i];
查看>>
用户态切换到内核态的3种方式
查看>>
笔试常见的智力题(附答案)
查看>>
内核库函数
查看>>
Linux 系统内核空间与用户空间通信的实现与分析
查看>>
linux内核空间和用户空间的区别及交互
查看>>
如何写好应用型学术论文
查看>>
如何查看进程的各种限制
查看>>
64位int类型用printf输出问题
查看>>
网络后台开发面试题目
查看>>
Linux 共享内存限制的查看与设置
查看>>