无聊些python 抓糗百看看。。。。。。-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

无聊些python 抓糗百看看。。。。。。

阅读量：6852 次

发布时间：2019-06-26

本文共 563 字，大约阅读时间需要 1 分钟。

#coding=utf-8import requestsfrom lxml import etreeimport sysreload(sys)sys.setdefaultencoding('utf-8')for num in range(1,36):    url = 'http://www.qiushibaike.com/8hr/page/'+str(num)    html = requests.get(url).text    selector = etree.HTML(html)    content = selector.xpath('//div[@id="content-left"]/div[@class="article block untagged mb15"]/div[@class="content"]/text()')    print  '正在抓取第'+str(num)+'页：url：'+url    for each in content:        f = open('./qiubai1.txt','a')        f.write(each+'\n')    f.close()

转载于:https://my.oschina.net/u/2411815/blog/619964

你可能感兴趣的文章

去你的lua和go，哥发现node.js原来才是最爱~

OC中initialize方法和init方法的区别

一些不可思议的小问题

界面间传值

3.vsphere client的安装

Linux实现最常用的磁盘阵列-- RAID5

简单的菜单 menu

Intellij Idea 2017创建非Maven web项目使用tomcat部署实战

工程DHCP配置

GIL(全局解释器锁)与互斥锁

我的友情链接

Git常用操作及分支

关于一种求最大公约数的算法的分析与证明

微信授权莫名创建用户数据失败的原因

网络高手修身

JavaWeb综合案例-键盘模拟

Android Day03-SQLite数据库操作及ListView详解

Looking for APAC Operations IT XML Database Developer in Shenzhen and Hongkong

Myeclipse常用快捷键

我的友情链接

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-01 08:50:20 当前IP: 18.223.159.189 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我