资讯专栏INFORMATION COLUMN

真实 Python 爬虫面试题

ZoomQuiet / 1165人阅读

摘要:就在昨天我面试了,来到上海之后面试的第一家公司,面试过程挺顺利,不出意外今天下午就会收到。七月初,独身一人,提着一包行李,买了张飞机票,就直接来到上海。在此记录下自己来到上海,第一家面试的公司,面试到的题。

阅读文本大概需要 5 分钟。

就在昨天我面试了,来到上海之后面试的第一家公司,面试过程挺顺利,不出意外今天下午就会收到 offer。面试完之后,我走在路上,整个人都是在傻笑的状态,路人一脸关爱智障的眼神,但我还是非常的开心。

自己一路自学过来,不知道遇到多少 bug,不知道有多少个深夜,还在敲代码,不知道有多少迷茫的时候。我只知道我必须要更加努力。幸运的是,这一路下来,我没有放弃。天道酬勤,宁静致远。

6 月底我从重庆一所普通二本学校毕业,大学获奖屈指可数,挂科却不计其数。最开始我也连 C 语言的「hello world」,都要打错 4,5 遍。不是头函数没有加,就是少了一个字母。就单论大学的学习,我就是一个学渣。

我知道学习上比别人差,但至少在努力这个层面,我可以做到最好。我清楚地记得最开始学技术的时候,是看着别人的博客学。但我看一遍,两遍,甚至三遍根本就记不住。离开文章,脑海里一片空白,根本就不知道要写什么代码。

但那时候我根本不知道如何高效地学习,于是我就用最低效率的方法,看的记不住,那我就抄一遍,把博客里的内容,一个字一个字地敲打一遍。敲一遍记不住,那我就再敲一遍。这就是我最早学习技术的方式。一个暑假的时间风雨无阻,每天一篇博客敲打文,到了最后,有道云笔记里全是自己的敲打文。

现在回想起来那时候自己有多么的笨,但却又感谢曾经努力的我。就是靠着比别人多努力一点点,我慢慢能记得博客的内容;就是比别人多努力一点点,我能慢慢的写一个小程序;就是比别人多努力一点点,我能写出几千字的文章;就是比别人多努力一点点,公众号发展至今已有 1.3W 的读者数;就是比别人多努力一点点,如今来到我梦寐以求的上海。

七月初,独身一人,提着一包行李,买了张飞机票,就直接来到上海。上海我没有朋友,没有亲戚,甚至不知道下飞机之后,我该去往哪里。但这些都阻挡不了,我想要去上海的心。

在此记录下自己来到上海,第一家面试的公司,面试到的题。希望对你以后的 python 爬虫道路有所帮助。等之后工作稳定,我再详细写一篇,如何自学 python 找到爬虫工作。

笔试题

python 常用数据结构有哪些?请简要介绍一下。

简要描述 Python 中单引号、双引号、三引号的区别。

如何在一个 function 里面设置一个全局的变量?

Python 里面如何拷贝一个对象?(赋值、浅拷贝、深拷贝的区别)

如果 custname 字符串的内容为 utf-8 的字符,如何将 custname 的内容转为 gb18030 的字符串?

请写出一段 Python 代码实现删除一个 list 里面的重复元素。

这两个参数是什么意思:args,*kwargs?

统计如下 list 单词及其出现次数。

a=["apple", "banana", "apple", "tomato", "orange", "apple", "banana", "watermeton"]

给列表中的字典排序:假设有如下 list 对象

alist=[{"name":"a", "age":20}, {"name":"b", "age":30}, {"name":"c", "age":25}]

将 alist 中的元素按照 age 从大到小排序。

写出下列代码的运行结果

a = 1
def fun(a):
  a = 2
fun(a)
print(a)
a = []
def fun(a):
  a.append(1)
fun(a)
print(a)
class Person:
    name = "Lily"

p1 = Person()
p2 = Person()
p1.name = "Bob"
print(p1.name)
print(p2.name)
print(Person.name)

假设有如下两个 list:a = ["a", "b", "c", "d", "e"],b = [1, 2, 3, 4, 5],将 a 中的元素作为 key,b 中元素作为 value,将 a,b 合并为字典。

使用 python 已有的数据结构,简单的实现一个栈结构。

面试官提的问题

项目上遇到了哪些难点?如何解决?

数据如何去重,清洗,存入数据库?

有一个升序后又降序的数组,比如 1356742,如何查找到 2 的位置。

如何查找到二叉树两个节点的最低公共祖节点?

mysql 的序列都有哪些?

遇到哪些反爬机制?如何解决?

以上问题,你是否能全部答出来?

本文首发与公众号「痴海」,后台回复「1024」,领取 2018 最新 python 教程。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42008.html

相关文章

  • Python 爬虫面试 170 道:2019 版

    摘要:下面代码会存在什么问题,如何改进一行代码输出之间的所有偶数。简述进程之间如何通信多路复用的作用模型的区别什么是并发和并行解释什么是异步非阻塞的作用面试题说说你知道的命令如何查看某次提交修改的内容答案扫码下面的二维码订阅即可获取。 引言 最近在刷面试题,所以需要看大量的 Python 相关的面试题,从大量的题目中总结了很多的知识,同时也对一些题目进行拓展了,但是在看了网上的大部分面试题不...

    trigkit4 评论0 收藏0
  • 从零转行数据分析的亲身经历

    摘要:我的转行经历博主从开公众号起前个月开始接触语言,然后接触到了数据方面的技术,包括爬虫,数据分析,数据挖掘,机器学习等,一直到现在仍然在坚持自学,我相信只要坚持结果总不会太差。对于数据分析而言,机器学习和爬虫等并不是必须,但是加分项。 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 showImg(https://segmentfault.com/i...

    Rocture 评论0 收藏0
  • 一道神奇的Python面试,你会吗?

    关注公众号:「Python专栏」,后台回复「爬虫书籍」,即可获得2本Python爬虫相关的电子书showImg(https://segmentfault.com/img/remote/1460000018448215?w=860&h=860); 无意间,看到这么一道Python面试题:以下代码将输出什么? def testFun(): temp = [lambda x : i*x for ...

    princekin 评论0 收藏0
  • Python面试经验总结,面试一时爽,一直面试一直爽!

    摘要:面试的心得体会简历制作我做了两份简历,用两个手机账号,两个简历名字,分别在各个招聘网站投了双份简历,一个是数据分析的简历一个是全栈开发的简历,我真正接触快年,不管是学习还是工作学到的东西,这两年大概掌握了前端爬虫数据分析机器学习技术, showImg(https://upload-images.jianshu.io/upload_images/13090773-b96aac7e974c...

    gxyz 评论0 收藏0
  • 【FAILED】记一次Python后端开发面试的经历

    摘要:正确的思路是等概率随机只取出共个数,每个数出现的概率也是相等的随机输出把一段代码改成,并增加单元测试。代码本身很简单,即使没学过也能看懂,改后的代码如下但是对于单元测试则仅限于听过的地步,需要用到,好像也有别的模块。 在拉勾上投了十几个公司,大部分都被标记为不合适,有两个给了面试机会,其中一个自己觉得肯定不会去的,也就没有去面试,另一个经历了一轮电话面加一轮现场笔试和面试,在此记录一下...

    kohoh_ 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<