资讯专栏INFORMATION COLUMN

[原] Python 开发者面向文档编程的正确姿势

Y3G / 644人阅读

摘要:用注释写单元测试单元测试是代码开发环节必不可少的一环,对于定位和代码质量而言是非常重要的。现在最广为人知的单元测试框架就是,它借鉴了中成熟的单元测试框架的。

概述

秦人不暇自哀,而后人哀之;后人哀之而不鉴之,亦使后人而复哀后人也! --论面向文档编程的重要性

如果想看见识一个人写代码的功力,注释其实是区分老司机和小鲜肉的一个显著的分界线(有没有观察到你们公司的领导基本都在开会或者写文档),通常情况下老司机的文档量与代码量是1:1的比例,而新人往往认为写完功能模块就已经可以完成任务了。生产环境中需要面对现实中大量复杂的业务逻辑和数据校验并与各方对接,文档质量和代码质量就被提升到了相同的高度。很多人没有写注释的习惯,大多数不是因为懒惰,一方面是没有意识到写文档的好处,另一方面是不了解这方面的工具。毕竟从管理上依赖于人的主动性是远不如依赖于工具有效的。本文介绍如何利用Python注释提升文档书写的质量以及效率的小技巧。

Python

在实际生产中,机器学习工作现在看起来,白天像是个算法工程师的活,晚上就变成运维+测试了。Python 一直以来也都受到测试工程师和运维工程师的偏爱,下面是几个经典的注释活用case。

用注释写单元测试:doctest

单元测试是代码开发环节必不可少的一环,对于Bug定位和代码质量而言是非常重要的。现在最广为人知的单元测试框架就是Unittest,它借鉴了Java中成熟的单元测试框架的JUnit。即使像Django还对这个框架有特殊的支持,然而在实现Unittest的时候会感觉确实比较啰嗦,setup,teardown...在维护单元测试的时候很多时候感觉力不从心。

一个巧妙的方式可以是通过doctest,用docstring注释的方式来完成单元测试,由于每个方法def下面都先跟着一段测试用例,然后紧跟着就是代码正文,这样一来很方便我们测试现有代码的质量,另一方面又便于修改。

举个例子:

def factorial(n):
    """Return the factorial of n, an exact integer >= 0.

    >>> [factorial(n) for n in range(6)]
    [1, 1, 2, 6, 24, 120]
    >>> factorial(30)
    265252859812191058636308480000000
    >>> factorial(-1)
    Traceback (most recent call last):
        ...
    ValueError: n must be >= 0

    Factorials of floats are OK, but the float must be an exact integer:
    >>> factorial(30.1)
    Traceback (most recent call last):
        ...
    ValueError: n must be exact integer
    >>> factorial(30.0)
    265252859812191058636308480000000

    It must also not be ridiculously large:
    >>> factorial(1e100)
    Traceback (most recent call last):
        ...
    OverflowError: n too large
    """

    import math
    if not n >= 0:
        raise ValueError("n must be >= 0")
    if math.floor(n) != n:
        raise ValueError("n must be exact integer")
    if n+1 == n:  # catch a value like 1e300
        raise OverflowError("n too large")
    result = 1
    factor = 2
    while factor <= n:
        result *= factor
        factor += 1
    return result


if __name__ == "__main__":
    import doctest
    doctest.testmod()

上面是官网提供的一个求N的阶乘函数示例,在docstring 中通过 >>>符号来开始一个单元测试,之后换行输入预期结果即可。实际上就是复制粘贴一下调试过程和结果,真的再简单不过了,想实现TDD也因此变得非常轻松。

用注释写API文档:apidoc

在我们完成机器学习模型后,想要提供一个对外服务的接口以贡献我们的算力时就需要完备的API文档,也是通过API的调用才能为我们的模型提供源源不断的校验数据,对于提升模型效果有非常实际的意义。对大多数人而言调用API来完成开发都是一件比较开心的事情,因为我们可以少做很多工作就可以实现强大功能。然而,当我们需要对外提供API时就要面临不一样的考验了,接口鉴权、接口设计、版本控制、并发问题、日志埋点...这些都是需要面对的新问题,而利用 apidoc 可以很好地解决这些API文档中常见的诸多问题,相当于通过模板提升了我们的接口设计的能力。

apidoc为Python提供了一种类似于 docstring 的方式来写API文档,从语法上看比较类似于 R中的roxygen,都需要用户以 @xxx 符号作为一个开头,随后书写相关的定义和功能。

举个例子:

下面是一个API接口的定义方法,最核心的部分就是

路由

GET/POST方法

名称/分组

参数与调用例子

(这年头没有用例的代码都是耍流氓)

"""
@api {get} /user/:id Request User information
@apiName GetUser
@apiGroup User

@apiParam {Number} id Users unique ID.

@apiSuccess {String} firstname Firstname of the User.
@apiSuccess {String} lastname  Lastname of the User.
"""

我们可以直接撸一个官方示例来学习如何使用apidoc。

首先,下载示例源码

git clone https://github.com/apidoc/apidoc
cd apidoc

然后,安装 apidoc 组件

sudo npm install apidoc -g

接着,利用官方代码来制作一个例子,并且访问即可。

apidoc -i example/ -o output/ -t template/
open output/index.html

几个参数的含义如下:
-i:input,表示输入的文件夹
-o:output,表示输出文件夹
-t:template,表示模板文件,通过替换模板我们可以修改文档皮肤

在 example 文件夹下,我们需要在apidoc.json 中填写配置文件,定义文档的header和footer部分内容,其余的文件会被自动识别出其中的docstring作为API文档的一部分。

由于apidoc的官方文档非常简单清晰,所以这里不过多强调语法。

apidoc 还为我们提供了接口调试的功能,在实际使用的时候要注意:

我们需要一个web server 才可以使用这个接口调试的功能

要注意跨域的问题。

通过版本对比,我们还可以快速排查API接口的变化情况。需要注意的是这个功能要求我们要将历史的文档记录也要保存在该目录下的文件中,通常我们可以把历史的注释输出到一个特定文件中保存。

总的来说,虽然,API文档的书写并不是一件难度非常高的事情,却能体现系统模块设计和用户体验设计的功力,我们应该对那些无代码示例,无版本控制的API文档say no!

用注释写命令行接口docopt

利用docopt,我们可以在注释中直接声明文件的命令行传入参数,而不需要通过 argvs变量来捕获输入值再做判断,这在调用运维脚本或者若干任务调度脚本的时候尤其管用,极大地提升了CLI的效率。

举个例子:(此处代码仅供参考)

"""Usage:
  fiannceR.py tcp   [--timeout=]
  fiannceR.py serial  [--baud=9600] [--timeout=]
  fiannceR.py -h | --help | --version

"""
from docopt import docopt

if __name__ == "__main__":
    arguments = docopt(__doc__, version="0.1.1rc")
    print(arguments)

随后,我们可以在命令行中成功调用

fiannceR.py tcp 0.0.0.0 3838

这里的 arguments 将传出一个字典对象,以Key-Value的形式将命令行中的输入值捕获。

{"--baud": None,
 "--help": False,
 "--timeout": None,
 "--version": False,
 "-h": False,
 "": "0.0.0.0",
 "": "3838",
 "serial": False,
 "tcp": True}
总结

如果真的要从数据撸到模型、接口,那么一排注释的画面真是美得不敢想象。

"""unitest
>>> FinanceR("20161001")
21.01
"""
def FinanceR(date):
    price = get_price(date)
    return(price)

class(BaseHandler):
    def get(self):   
        """apidoc
           @api {get} /price/:date 获取当前价格
           @apiName GetPrice
           @apiGroup Quota

           @apiParam {Number} date 交易日期

           @apiSuccess {String} price
        """
        date = self.get_argument("date",None)
        try:
            price = FinanceR(date)
            self.write({"data":{"price":price},"response":{"message":"success","code":200}})
        except Exception as e:
            self.write({"data":None,"response":{"message":str(e),"code":404}})
            
"""Usage:
  fiannceR.py tcp   [--timeout=]
  fiannceR.py serial  [--baud=9600] [--timeout=]
  fiannceR.py -h | --help | --version

"""
from docopt import docopt

if __name__ == "__main__":
    arguments = docopt(__doc__, version="0.1.1rc")
    print(arguments)

欢迎大家留言讨论,给出更多应用案例,交流分享。

参考文献

APIDoc

Python 指南:测试你的代码

doctest

nose is nicer testing for python

tox: standardize testing in Python

Biopython测试框架

Docopt

Sphinx

docopt.R

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/38195.html

相关文章

  • python入门正确姿势,从一无所知到无所不知

    摘要:不同的人的路线图版本会有所不同。寻找答案从一无所知到无所不知如果你在这个过程中多次遇到困难,在知难而退之前努力尝试解决问题。并不是成为一个全面的开发人员所需要的唯一技能。首先进行一两个月的学习阶段,然后进入一个月的构建阶段。 初级开发者学Python容易陷入茫然,面对市面上种类众多的编程语言和框架,重要的是坚持自己的选择,宜精不宜杂。本文是一篇指路文,概述了从编程基础、引导、文档阅读、...

    legendmohe 评论0 收藏0
  • python入门正确姿势,要永远做个学习者,但不仅仅只做学习者!

    摘要:总之,要永远做个学习者,但不仅仅只做学习者了解并践行学习实践阶段循环任何创造性学科的学习都可以分两个阶段,学习阶段和构建阶段,彼此不断重复。 初级开发者学Python容易陷入茫然,面对市面上种类众多的编程语言和框架,重要的是坚持自己的选择,宜精不宜杂。本文是一篇指路文,概述了从编程基础、引导、文档阅读、书籍和视频、源代码等学习和积累环节,值得初学者参考。 作为一个开发者,为何要选择Py...

    MarvinZhang 评论0 收藏0
  • 如何成为一名优秀程序员

    摘要:前言罗子雄如何成为一名优秀设计师董明伟工程师的入门和进阶董明伟基于自己实践讲的知乎为新人提供了很多实用建议,他推荐的罗子雄如何成为一名优秀设计师的演讲讲的非常好,总结了设计师从入门到提高的优秀实践。 前言 罗子雄:如何成为一名优秀设计师 董明伟:Python 工程师的入门和进阶 董明伟基于自己实践讲的知乎live为Python新人提供了很多实用建议,他推荐的罗子雄:如何成为一名优秀...

    keelii 评论0 收藏0
  • 干货 | 学习Python正确姿势

    摘要:勤学学习效率与效果取决于执行力。这一步学习的正确姿势是在实践操作中发掘问题,然后带着问题找答案。拆分任务将目标分解成具体可执行的学习任务。勤学强大的执行力是学习的根本保障。分享复述检验学习成果,提高学习效果的最好方法。 showImg(https://segmentfault.com/img/bVbcPGZ?w=256&h=256); 前段时间和大家一起分享了一篇关于学习方法内容《大牛...

    Thanatos 评论0 收藏0
  • [] Python 发者如何正确使用 RStudio 编辑器

    摘要:工程师也用过快速开发面向消费者的网站以响应一日三变的用户需求。硬件工程师在树莓派上用来调试一个人脸检测的功能,以较低的成本完成核心功能的调试。另一方面,通过在任何一个浏览器中就可以直接前往服务器现场,不论是一台甚至是树莓派。 概述 资深Python工程师可以选择的编辑器有很多,比如 Rodeo,Spider,Eclipse,Vim,Visual Studio,Atom,Sublime ...

    el09xccxy 评论0 收藏0

发表评论

0条评论

Y3G

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<