文章库ARTICLE COLUMN

  • 大数据时代,如何构建精准用户画像,直击精细化运营

    大数据时代,如何构建精准用户画像,直击精细化运营

    摘要:比如个推旗下的用户画像产品,能够对用户线上和线下行为进行大数据分析,帮助开发者和运营者构建全面精准多维的用户画像体系。 移动互联网时代,精细化运营逐渐成为企业发展的重要竞争力,用户画像的概念也应运而生。用户画像是指,在大数据时代,...

    dreamGongdreamGong 评论0 收藏0
  • Python爬虫教学(写给入门的新手)  一

    Python爬虫教学(写给入门的新手) 一

    摘要:在不懂和等协议的情况下,我直接打个比方来解释一下什么是请求,以浏览器为例,人在浏览器输入,然后敲击键,直到页面出现,整个过程,我们可以抽象为我们向百度服务器发起的一次请求。更专业,更详细的解释,自己去百度学习吧。 前言   刚学完pytho...

    zonezone 评论0 收藏0
  • 注入eval, Function等系统函数,截获动态代码

    注入eval, Function等系统函数,截获动态代码

    摘要:动态执行代码无非两种方法,即和。注意,有些网站会检测和这两个方法是否原生,因此需要一些小花招来忽悠过去。注入方式另外,还有个问题需要关注,就是挂钩代码的注入方法。 showImg("https://segmentfault.com/img/remote/1460000018765904");showIm...

    xuexiangjysxuexiangjys 评论0 收藏0
  • (转)Python3爬取豆瓣电影保存到MySQL数据库

    (转)Python3爬取豆瓣电影保存到MySQL数据库

    摘要:行代码实现爬取豆瓣电影排行榜代码基于,用到的类库有标题文字通过伪造请求头或设置代理等方式获取页面内容,参考文档对页面进行解析,提取数据,参考文档版本中用于操作数据库,中则使用,安装用到的几个类库分析豆瓣电影页面页面分析爬取数据之前,我...

    nevermindnevermind 评论0 收藏0
  • 文件服务器的两种实现方式

    文件服务器的两种实现方式

    摘要:简介在日常的工作项目中,我们常常会需要用到文件服务器,即在网页端就能访问到本地的电脑中某个文件夹下的所有文件,示例界面如下本文将介绍笔者接触到的两种实现文件服务器的方法,它们所使用的工具如下本文以系统系统为例,具体介绍如何实现文件服务...

    gplanegplane 评论0 收藏0
  • 是程序员,就用python导出pdf

    是程序员,就用python导出pdf

    摘要:谁让我们是程序员呢,所以就爱上了写课件,讲道理也是个非常不错的写书格式啊。没错,就是这么一个可以用网站来写的地方。后来了解到有一个包叫,专门用来转换文件。 showImg("https://img-blog.csdnimg.cn/20190329141407344.png?x-oss-process=image...

    wenduxwendux 评论0 收藏0
  • 别开心太早,Python 官方文档的翻译差远了

    别开心太早,Python 官方文档的翻译差远了

    摘要:诚然,宣称官方中文文档,确实不妥,这只是个人社区的行为,改正就好了至于合入官方的途径,只需有翻译成果,也不难做到最后,一个站点接些贴片广告,哪有什么不妥我所了解到的社区翻译情况,大致如上。 近几天,很多公众号发布了 Python 官方文档的消...

    JasonJason 评论0 收藏0
  • 面向对象编程简单讲解

    面向对象编程简单讲解

    摘要:面向对象编程定义把函数进行分类和封装后放入对象中,使得开发更快更强。面向对象编程的两大特性封装继承封装顾名思义就是把内容封装好,在调用封装好的内容。面向对象编程的继承和现实的继承类似,子类继承父类的某些特质。 showImg("https://segment...

    lifesimplelifesimple 评论0 收藏0
  • 国家企业信用公示系统的爬取

    国家企业信用公示系统的爬取

    摘要:国家企业信用公示系统的爬取网站分析获取首页通过直接请求网站首页,返回错误提示码,返回结果是代码。验证码识别开发者文档代码结果查询企业在首页的源代码中,有一句注释伪造极验变量百度成功获取到结果链接国家企业信用公示系统爬取 国家企业信用公...

    cloudcloud 评论0 收藏0
  • Python分析微信好友性别比例和省份城市分布比例,基于itchat模块

    Python分析微信好友性别比例和省份城市分布比例,基于itchat模块

    摘要:安装使用新建,拷贝以下代码导入模块微信机器人登录有种模式,极简模式终端模式缓存模式可保持登录状态初始化机器人,选择缓存模式扫码登录获取好友群公众号信息获取好友的统计信息运行到所在目录运行,然后扫码登录结果学习交流微信 安装itchat pip i...

    cjiecjie 评论0 收藏0
  • 机器学习 | 树回归

    机器学习 | 树回归

    摘要:由于近期学业繁重,所以我就不说废话了,直接上代码运行结果代码使用二元切分法每次将数据集切成两份如果数据的某特征值等于切分所要求的值,那么这些数据就进入树的左子树,反之则进入右子树将每行映射成浮点数将文件中的所有数据都保存在同一个矩阵中...

    CODINGCODING 评论0 收藏0
  • Web安全防范

    Web安全防范

    摘要:防范措施转义验证用户输入攻击指跨域请求伪造,这是一种近年来才逐渐被大众了解的攻击方式。防范措施正确使用方法令牌效验其中令牌是比较常用的方法,具体做法是在表单提交中添加一些伪随机数,即令牌,这里我们就不详细展开。 简单总结一下日常web开...

    hightopohightopo 评论0 收藏0
  • 机器学习项目:boston_housing

    机器学习项目:boston_housing

    摘要:机器学习工程师纳米学位模型评价与验证项目预测波士顿房价欢迎来到预测波士顿房价项目在此文件中,我们已经提供了一些示例代码,但你还需要完善更多功能才能让项目成功运行。 机器学习工程师纳米学位 模型评价与验证 项目 1: 预测波士顿房价 欢迎来到...

    BatkidBatkid 评论0 收藏0
  • 机器学习项目:构建垃圾邮件分类

    机器学习项目:构建垃圾邮件分类

    摘要:几乎所有大型电子邮箱服务提供商都内置了垃圾邮件检测系统,能够自动将此类邮件分类为垃圾邮件。大多数机器学习算法都要求传入的输入是数字数据,而电子邮件信息通常都是文本。 我们的任务 垃圾邮件检测是机器学习在现今互联网领域的主要应用之一。几...

    xcc3641xcc3641 评论0 收藏0
  • 为什么你需要少看垃圾博客以及如何在Python里精确地四舍五入

    为什么你需要少看垃圾博客以及如何在Python里精确地四舍五入

    摘要:网上有人说,因为在计算机里面,小数是不精确的,例如在计算机中实际上是,所以当你对这个小数精确到小数点后两位的时候,实际上小数点后第三位是,所以四舍五入,因此结果为。 今天又有一个Python初学者被中文技术博客中的垃圾文章给误导了。 这位初...

    ObjectObject 评论0 收藏0
  • 安利一个实用小工具 oscillo:帮助你观察命令运行时在时间轴上的cpu和内存占用率

    安利一个实用小工具 oscillo:帮助你观察命令运行时在时间轴上的cpu和内存占用率

    摘要:如果使用过,如果有一颗的心的话,一定会觉得不但酷炫而且十分实用。不过如果想观察一个程序从运行开始到结束的占用率怎么办好办,利用的异步观察就行。 showImg("https://segmentfault.com/img/remote/1460000018718651?w=1456&h=426"); 如果使用过gl...

    Paul_KingPaul_King 评论0 收藏0
  • 【算法】算法图解笔记_快速排序

    【算法】算法图解笔记_快速排序

    摘要:再谈大表示法快速排序的独特之处在于其速度取决于选择的基准值。在平均情况下快速排序的运行时间为在最糟情况下退化为。快速排序和合并排序的算法速度分别表示为和,是算法所需的固定时间量被称为常量。 分而治之 分而治之(divide and conquer,D&C)是...

    YanceyOfficialYanceyOfficial 评论0 收藏0
  • 一篇文章看懂大数据分析就业前景及职能定位

    一篇文章看懂大数据分析就业前景及职能定位

    摘要:今天就先给大家讲大数据分析工程师。所以你要和我说你在外面培训了个月的大数据分析后,就想做了,那请你再考虑考虑。而他们鼓吹的大数据分析师,其实就是。 showImg("https://segmentfault.com/img/remote/1460000018722710?w=1000&h=750"); Overview...

    itvincentitvincent 评论0 收藏0
  • 别再说Python没有枚举类型了,好好看看

    别再说Python没有枚举类型了,好好看看

    摘要:枚举类型可以看作是一种标签或是一系列常量的集合,通常用于表示某些特定的有限集合,例如星期月份状态等。 showImg("https://segmentfault.com/img/remote/1460000018679998?w=740&h=728"); 枚举类型可以看作是一种标签或是一系列常量的集合,通常用...

    zsy888zsy888 评论0 收藏0
  • 多线程+代理池爬取天天基金网、股票数据(无需使用爬虫框架)

    多线程+代理池爬取天天基金网、股票数据(无需使用爬虫框架)

    摘要:本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。技术路线代理池多线程爬虫与反爬编写思路首先,开始分析天天基金网的一些数据。一旦使用多线程,则需要考虑到数据的读写顺序问题。 @[TOC] 简介 提到爬虫,大部...

    jaysunjaysun 评论0 收藏0
  • 基于Python的模拟登陆获取脉脉好友信息

    基于Python的模拟登陆获取脉脉好友信息

    摘要:代码已经上传到上简介这是一个基于而写的爬虫,爬取的网站的脉脉网,在搜索框中搜索,并切换到人脉选项卡,点击姓名,进入详情页,爬取其详细信息获取的具体信息有基本信息工作经历教育经历职业标签及其认可数点评信息几度关系一度二度三度等写给用户的...

    canopus4ucanopus4u 评论0 收藏0
  • Pandas之旅(六): 字符串实用方法汇总

    Pandas之旅(六): 字符串实用方法汇总

    摘要:有关字符串基本方法大家好,我又回来了之前的几期我们已经简单了解了的基础操作,但是只要涉及到数据,最常见的就是字符串类型,所以很多时候我们其实都在和字符串打交道,所以今天,我会把我自己总结的,有关字符串的常用方法分享给大家,希望能够帮到...

    高胜山高胜山 评论0 收藏0
  • 机器学习 | 预测数值型数据:回归

    机器学习 | 预测数值型数据:回归

    摘要:由于近期学业繁重,所以我就不说废话了,直接上代码线性回归局部加权线性回归代码标准回归函数和数据导入函数默认文本的最后一行为目标值第一列为偏移量,假定为常数第二列为,也就是图中的横坐标计算最佳拟合曲线标识矩阵的转置矩阵转置,变程行向量判...

    eternalshalloweternalshallow 评论0 收藏0
  • 解决python3下读取redis返回byte类型的问题

    解决python3下读取redis返回byte类型的问题

    摘要:我们首先查看连接的构造方法这个参数决定返回结果是否所以只需要设置连接将其改为即可 我们首先查看redis连接的构造方法 def __init__(self, host="localhost", port=6379, db=0, password=None, socket_timeout=None, ...

    vslamvslam 评论0 收藏0
  • LeetCode 334. Increasing Triplet Subsequence

    LeetCode 334. Increasing Triplet Subsequence

    摘要:描述给定一个未排序的数组,判断这个数组中是否存在长度为的递增子序列。说明要求算法的时间复杂度为,空间复杂度为。示例输入输出示例输入输出思路声明三个变量,,用于表示首先遍历数组,找到第一对满足的数。此时依然有但是,不影响判断的逻辑。 De...

    saucxssaucxs 评论0 收藏0

热门文章

<