资讯专栏INFORMATION COLUMN

爬虫入门到精通-网页的解析(正则)

RiverLi / 1372人阅读

摘要:本文章属于爬虫入门到精通系统教程第五讲在爬虫入门到精通第四讲中,我们了解了如何下载网页,这一节就是如何从下载的网页中获取我们想要的内容万能匹配文章的标题文字我们要获取的如上所示,假如我们要获取文章的标题这几个文字,那么我们应该怎么做呢我

本文章属于爬虫入门到精通系统教程第五讲

在爬虫入门到精通第四讲中,我们了解了如何下载网页,这一节就是如何从下载的网页中获取我们想要的内容

万能匹配
html = u"""



    
    文章的标题


    

h1文字