摘要:本人建立个群作为去转盘网的官方群,人数现在也不多,如果有兴趣的话来逛逛吧,多个粉丝去转盘多一份热闹,群号 之前我在写百度网盘爬虫,百度图片爬虫的时候答应网友说,抽时间要把ok搜搜的的源码公开,如今是时候兑现诺言了,下面就是爬虫的所有代码,完全,彻底的公开,你会不会写程序都可以使用,不过请先装个linux系统,具备公网条件,然后运行: python startCrawler.py 有必要...
摘要:正则表达式是定义搜索模式的字符序列。通常这种模式被字符串搜索算法用于字符串上的查找或查找和替换操作,或者用于输入验证。 正则表达式是定义搜索模式的字符序列。通常这种模式被字符串搜索算法用于字符串上的查找或查找和替换操作,或者用于输入验证。 1. 正则表达式的语法 . 表示任何单个字符 [] 字符集,对单个字符给出取值范围 [^] 非字符集,对单个字符给出排除范围 *前一个字符0次或者...
摘要:将数据集中不含缺失值的变量称为完全变量,数据集中含有缺失值的变量称为不完全变量。这种程序的实施恰当地反映了由于缺失值引起的不确定性,使得统计推断有效。 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 showImg(https://segmentfault.com/img/remote/1460000015801387?w=1045&h=603);...
摘要:博客的架构先搞明白博客从搭建到自动发布的架构,才能更好的理解我们每一步进行的操作。整个搭建流程第一部分服务器环境搭建,包括安装配置创建用户。在裸库的文件夹中,新建文件。 1. 博客的架构 先搞明白Hexo博客从搭建到自动发布的架构,才能更好的理解我们每一步进行的操作。不然只跟着步骤过了一遍,却不知道为什么这么做。 首先看这张架构图:showImg(https://segmentfaul...
将子域名http://wap.baidu.com/qq55/id56.html 指向到http://www.baidu.com/?domain=wap&page=qq&size=55&id=id56 nginx配置如下: set $sub_domain ; if ( $host ~* (.*).baidu.com ){ set $sub_domain $1; } if ( $sub_doma...