资讯专栏INFORMATION COLUMN

Go 的 fake-useragent 了解一下

hzc / 2009人阅读

摘要:先前我也遇到了这个问题,因此有了这个项目,用来解决你我的痛点项目地址支持安装用法推荐使用定制你可以调整抓取数据源的最大页数时间间隔以及最大超时时间。如果不填写,则为默认值。希望你能够喜欢这个项目,根本目的还是为了解决痛点,欢迎

Go 的 fake-useragent 了解一下

有的网站会根据 User-Agent 的不同,跳转到不同(PC、M)的站点,也有根据版本的不同给出不一样的提示等等,而 User-Agent 的变化更是爬虫里的基础姿势

使用 Go 编写网络爬虫或需要模拟浏览器头(User-Agent)的时候,你是否会觉得很麻烦,获取请求头(Request Headers)的 User-Agent 还得找来找去,挺繁琐。先前我也遇到了这个问题,因此有了这个项目 fake-useragent,用来解决你我的痛点

项目地址:https://github.com/EDDYCJY/fa...

支持

All User-Agent Random

Chrome

InternetExplorer (IE)

Firefox

Safari

Android

MacOSX

IOS

Linux

IPhone

IPad

Computer

Mobile

安装
$ go get github.com/EDDYCJY/fake-useragent
用法
package main

import (
    "log"

    "github.com/EDDYCJY/fake-useragent"
)

func main() {
    // 推荐使用
    random := browser.Random()
    log.Printf("Random: %s", random)

    chrome := browser.Chrome()
    log.Printf("Chrome: %s", chrome)

    internetExplorer := browser.InternetExplorer()
    log.Printf("IE: %s", internetExplorer)

    firefox := browser.Firefox()
    log.Printf("Firefox: %s", firefox)

    safari := browser.Safari()
    log.Printf("Safari: %s", safari)

    android := browser.Android()
    log.Printf("Android: %s", android)

    macOSX := browser.MacOSX()
    log.Printf("MacOSX: %s", macOSX)

    ios := browser.IOS()
    log.Printf("IOS: %s", ios)

    linux := browser.Linux()
    log.Printf("Linux: %s", linux)

    iphone := browser.IPhone()
    log.Printf("IPhone: %s", iphone)

    ipad := browser.IPad()
    log.Printf("IPad: %s", ipad)

    computer := browser.Computer()
    log.Printf("Computer: %s", computer)

    mobile := browser.Mobile()
    log.Printf("Mobile: %s", mobile)
}
定制

你可以调整抓取数据源的最大页数、时间间隔以及最大超时时间。 如果不填写,则为默认值。

client := browser.Client{
    MaxPage: 3,
    Delay: 200 * time.Millisecond,
    Timeout: 10 * time.Second,
}
cache := browser.Cache{}
b := browser.NewBrowser(client, cache)

random := b.Random()

更新浏览器头的临时文件缓存

client := browser.Client{}
cache := browser.Cache{
    UpdateFile: true,
}
b := browser.NewBrowser(client, cache)

最后,建议常规用法就好,默认参数能够满足日常需求

输出
Random: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36

Chrome: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36

IE: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)

Firefox: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:41.0) Gecko/20100101 Firefox/41.0

Safari: Mozilla/5.0 (iPhone; CPU iPhone OS 11_2_5 like Mac OS X) AppleWebKit/604.5.6 (KHTML, like Gecko) Version/11.0 Mobile/15D60 Safari/604.1

Android: Mozilla/5.0 (Linux; Android 6.0; MYA-L22 Build/HUAWEIMYA-L22) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.84 Mobile Safari/537.36

MacOSX: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit/602.2.14 (KHTML, like Gecko) Version/10.0.1 Safari/602.2.14

IOS: Mozilla/5.0 (iPhone; CPU iPhone OS 10_1 like Mac OS X) AppleWebKit/602.2.14 (KHTML, like Gecko) Version/10.0 Mobile/14B72 Safari/602.1

Linux: Mozilla/5.0 (X11; Linux x86_64; rv:42.0) Gecko/20100101 Firefox/42.0

IPhone: Mozilla/5.0 (iPhone; CPU iPhone OS 10_2 like Mac OS X) AppleWebKit/602.3.12 (KHTML, like Gecko) Version/10.0 Mobile/14C92 Safari/602.1

IPad: Mozilla/5.0 (iPad; CPU OS 5_0_1 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A405 Safari/7534.48.3

Computer: Mozilla/5.0 (Windows NT 10.0; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0

Mobile: Mozilla/5.0 (Linux; Android 7.0; Redmi Note 4 Build/NRD90M) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.111 Mobile Safari/537.36
注意

如果第一次使用,fake-useragent 将收集数据并在临时目录中创建一个文件作为文件缓存,请耐心等待几秒钟

最后

如果在项目中发现了什么问题,欢迎提交 PR 或者 issue。希望你能够喜欢这个项目,根本目的还是为了解决痛点,欢迎 Star!

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41751.html

相关文章

  • Go fake-useragent 了解一下

    摘要:先前我也遇到了这个问题,因此有了这个项目,用来解决你我的痛点项目地址支持安装用法推荐使用定制你可以调整抓取数据源的最大页数时间间隔以及最大超时时间。如果不填写,则为默认值。希望你能够喜欢这个项目,根本目的还是为了解决痛点,欢迎 Go 的 fake-useragent 了解一下 有的网站会根据 User-Agent 的不同,跳转到不同(PC、M)的站点,也有根据版本的不同给出不一样的提示...

    woshicixide 评论0 收藏0
  • Go fake-useragent 了解一下

    摘要:先前我也遇到了这个问题,因此有了这个项目,用来解决你我的痛点项目地址支持安装用法推荐使用定制你可以调整抓取数据源的最大页数时间间隔以及最大超时时间。如果不填写,则为默认值。希望你能够喜欢这个项目,根本目的还是为了解决痛点,欢迎 Go 的 fake-useragent 了解一下 有的网站会根据 User-Agent 的不同,跳转到不同(PC、M)的站点,也有根据版本的不同给出不一样的提示...

    geekzhou 评论0 收藏0
  • 爬虫带你了解一下Golang市场行情

    摘要:原文地址了解一下的市场行情项目地址如果对你有所帮助,欢迎,给文章来波赞,这样可以让更多的人看见目标在工作中已是一份子,想让大家了解一下的市场行情,也想让更多的人熟悉它。 原文地址:了解一下Golang的市场行情项目地址:https://github.com/go-crawler... 如果对你有所帮助,欢迎 Star,给文章来波赞,这样可以让更多的人看见 :) 目标 在工作中 Gol...

    chinafgj 评论0 收藏0
  • 爬虫带你了解一下Golang市场行情

    摘要:原文地址了解一下的市场行情项目地址如果对你有所帮助,欢迎,给文章来波赞,这样可以让更多的人看见目标在工作中已是一份子,想让大家了解一下的市场行情,也想让更多的人熟悉它。 原文地址:了解一下Golang的市场行情项目地址:https://github.com/go-crawler... 如果对你有所帮助,欢迎 Star,给文章来波赞,这样可以让更多的人看见 :) 目标 在工作中 Gol...

    loostudy 评论0 收藏0
  • 爬虫带你了解一下Golang市场行情

    摘要:了解一下的市场行情项目地址如果对你有所帮助,欢迎,给文章来波赞,这样可以让更多的人看见目标在工作中已是一份子,想让大家了解一下的市场行情,也想让更多的人熟悉它。 了解一下Golang的市场行情 项目地址:https://github.com/go-crawler... 如果对你有所帮助,欢迎 Star,给文章来波赞,这样可以让更多的人看见 :) 目标 在工作中 Golang 已是一份...

    Amio 评论0 收藏0

发表评论

0条评论

hzc

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<