金色的骷髅 发表于 2015-1-14 20:34:56

来一发Python进门进修:收集刷博器爬虫

如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的小伙伴们!比来两天入手下手进修Python,因为已往次要利用C,对Python的简便易用感应很别致,年夜年夜增添了进修的乐趣。
从明天入手下手纪录Python的进修过程和条记。一方面便利本人将来查阅,另外一方面与人人同享进修。
复杂扫瞄了一下Python的复杂语法后,我上彀找了一些材料。在查找的过程当中,看到了一个由智普教导制造的Python进修视频,视频有一段名字叫做”收集刷博器爬虫“吸引了我的注重。
收集刷博器爬虫的基础道理:一些博客网站翻开某博客,该博客会见量就加一,假如屡次轮回翻开统一博客,该博客的会见量就会大批上升。
步伐必要用到第三方函数库模块:httplib2
函数库的下载地点:https://code.谷歌.com/p/httplib2/
利用前必要设置体系情况变量,在体系情况变量Path后增加python装置目次。进进httplib2模块的解压目次,运转settup.py装置便可
翻开一个网页的代码为:
viewplaincopy



[*]webbrowser.open_new_tab(网址)

有于翻开必定数目的网页后,内存会增添,我们必要准时关失落扫瞄器,关失落扫瞄器的代码以下(关失落Chrome为例):viewplaincopy



[*]os.system(taskkill/F/IMchrome.exe)


同时要利用到while轮回来轮回操纵,到达刷博客的目标。详细的代码模仿了智普教导进修视频,感激智普教导,完全的代码以下:viewplaincopy



[*]importwebbrowserasweb
[*]importtime
[*]importos
[*]importrandom
[*]count=random.randint(5,7)
[*]j=0
[*]whilej<=count:
[*]i=0
[*]whilei<=8:
[*]web.open_new_tab(网址)#网址本人填进
[*]i=i+1
[*]time.sleep(0.8)
[*]else:
[*]os.system(taskkill/F/IMchrome.exe)
[*]printj,timewebbrowerclosed
[*]j=j+1
[*]


欢迎大家来到仓酷云论坛!

简单生活 发表于 2015-1-16 15:38:37

来一发Python进门进修:收集刷博器爬虫

永中office2004增强版安装只需要默认安装即可使用并操作大多与win系统雷同,打印机的配置和管理,记录光盘等。

金色的骷髅 发表于 2015-1-18 18:50:49

如果你想深入学习Linux,看不懂因为文档实在是太难了。写的最好的、最全面的文档都是英语写的,最先发布的技术信息也都是用英语写的。

再现理想 发表于 2015-1-27 17:47:57

我是学习嵌入式方向的,这学期就选修了这门专业任选课。

飘飘悠悠 发表于 2015-2-5 14:54:19

掌握硬件配置,如显卡,声卡,网卡等,硬件只要不是太老或太新一般都能被支持,作为一名Linux系统管理员建议多阅读有关硬件配置文章,对各种不支持或支持不太好的硬件有深刻的了解。

精灵巫婆 发表于 2015-2-12 11:27:11

我是学习嵌入式方向的,这学期就选修了这门专业任选课。

飘灵儿 发表于 2015-3-3 03:49:21

随着IT从业人员越来越多,理论上会有更多的人使用Linux,可以肯定,Linux在以后这多时间不会消失。

仓酷云 发表于 2015-3-11 09:58:13

你需要提供精确有效的信息。Linux这并不是要求你简单的把成吨的出错代码或者数据完全转储摘录到你的提问中。

谁可相欹 发表于 2015-3-18 12:15:22

Windows有MS-DOS?方式,在该方式下通过输入DOS命令来操作电脑;Linux与Windows类似,也有命令方式,Linux?启动后如果不执行?X-WINDOWS,就会处于命令方式下,必须发命令才能操作电脑。?

第二个灵魂 发表于 2015-3-26 03:31:16

掌握硬件配置,如显卡,声卡,网卡等,硬件只要不是太老或太新一般都能被支持,作为一名Linux系统管理员建议多阅读有关硬件配置文章,对各种不支持或支持不太好的硬件有深刻的了解。
页: [1]
查看完整版本: 来一发Python进门进修:收集刷博器爬虫