资讯专栏INFORMATION COLUMN

❤️算法离我们并不远❤️为什么你排位总是输,原因在这

keithxiaoy / 2272人阅读

前言

文章摘抄至《算法之美》,附带了Python模拟。

不久前,我去观看草地网球锦标赛,一位十分沮丧的运动员引起了我对球赛目前采用的名次确定方法的注意。这位运动员在比赛中早早落败,因此彻底失去了获得奖牌的机会。令他感到屈辱的是,获得第二名的是他知道的一名远不如自己的运动员。


普通观众可能会把这种“哀叹”归咎于失败的痛苦,但道奇森并不是一个同情心泛滥的人,他是牛津大学数学系讲师,因此,在听到运动员的抱怨之后,他决定对体育赛事展开深入调查。道奇森不仅仅是一个数学家(其实他几乎不记得自己是从事数学研究的)。现在,反而是他的笔名——刘易斯·卡罗尔更加广为人知。他以这个笔名写出了《爱丽丝漫游奇境记》以及大量其他深受欢迎的文学作品。他还将他的数学知识与文学天赋相结合,完成了一篇知名度略低的文章——《草地网球锦标赛:正确的名次确定方法以及现行方法辨误》。

道奇森针对的是单一淘汰赛。在这种赛制下,运动员两两对决,只要输掉一场比赛,就会被淘汰出局。道奇森的理由非常有说服力,他认为,货真价实的第二名有可能是被第一名淘汰的任何人,而不一定是最后才被淘汰的那名运动员。


直白地说,银牌是一种假象。“作为一个数学事实,”他继续写道,“实力排第二位的运动员获得应得名次的机会只有16/31。而最优秀的4名运动员获得与实力相称名次的机会非常小,发生的概率为1/12!”

这里可以借助Python演示一下(语言不重要,可以改成自己熟悉的。)

import copyimport randomclass Participants():    def __init__(self,*_participants):        self.name = _participants[0]  # 1号球员        self.performance =_participants[1]   # 自身成绩        self.racePlaces = _participants[2]  # 比赛名次# 实例100个选手,并且假设从5号以后的选手,实例都不如前4个arrPart=[]arrPart.append(Participants("No.1",100,0,0))arrPart.append(Participants("No.2",99,0,0))arrPart.append(Participants("No.3",98,0,0))arrPart.append(Participants("No.4",97,0,0))for i in range(5,101):    arrPart.append(Participants(f"No.{i}", random.randint(0,96), 0, 0))# 单场比赛(传入2个人员,和名次)返回,胜利者、失败者def race(one,two,topNum):    unitRace=[]    if(one.performance > two.performance):        print(f"{one.name}{two.name}比赛,{one.name}胜利")        one.racePlaces=topNum        two.racePlaces=topNum-1        unitRace.append(one)        unitRace.append(two)        return one,two    else:        print(f"{one.name}{two.name}比赛,{two.name}胜利")        two.racePlaces=topNum-1        unitRace.append(two)        one.racePlaces=topNum        unitRace.append(one)        return two,one# 排位开始def knockout(all):    arrVictory=[]   #保存胜利者    # 选出前4名后结束    if(len(all)<=3):        print("++++++++++++++++++=================")        print(all[1].name)        return all    # 依次进行两两比赛,同批次淘汰赛只参加一次    while( len(all) > 1 ):        topNum=len(all)        r=random.randint(0,len(all)-1)        one=all[r]        # 参赛后,从当前候选名单删除        all.remove(one)        r=random.randint(0,len(all)-1)        two=all[r]        all.remove(two)        victory,fail=race(one,two,topNum)        print(victory.name)        arrVictory.append(victory) # 添加胜利者    # 没有进行匹配的直接晋级    if( len(all) == 1):        arrVictory.append(all[0])    print("***********************--------------------------")    # 下一轮淘汰赛    return knockout(arrVictory)# 统计1000次模拟种有几次实力3号选手能进前三isNO2count=0for i in range(1000):    arrPart1=copy.copy(arrPart)    victorys=knockout(arrPart1)    for v in victorys:        if v.name=="No.3":            print("名次:%d"%(v.racePlaces))            isNO2count += 1            breakprint(isNO2count)

== 看输出结果,我们很容易发现,结果在22-28%之间徘徊。 ==
而只有把if v.name==‘No.3’:的No.3改成No.1才会是100%。


尽管道奇森的文章犀利有力,却没有对草地网球产生任何影响。他提出应该采取三败淘汰制(根据这种赛制,击败过你的运动员如果落败,也有可能导致你随之出局),但是这个提议根本没有人理会。不过,虽然道奇森的解决方案实施起来有很大的难度,但是他在这个问题上的看法仍然是有道理的。(可惜的是,至今为止,在单淘汰赛中,仍然会颁发银牌。)不过,道奇森的逻辑还给我们带来了一个更加深刻的认识。我们人类不仅会对数据、财产进行排序,还会把我们自己变成排序对象。

世界杯、奥运会、美国全国大学体育协会(NCAA)、美国全国橄榄球联盟(NFL)、美国全国曲棍球联合会(NHL)、美国职业篮球联赛(NBA)和美国职业棒球大联盟(MLB),所有这些赛事都毫无疑问地使用了排序程序,利用赛季、排位赛和季后赛等算法排出先后关系。体育运动中的循环赛制就利用了算法。如果一共有n支运动队,那么每支运动队最终都要和其余n-1支队伍比赛。这种赛制虽然可以说是最全面的,但也最费时费力。

让每一支运动队都与其他所有队伍比赛,就像在晚宴上让客人两两拥抱一样,最终会需要可怕的O(n2)次角逐。排位赛(在羽毛球、英式壁球和美式壁球等体育项目中比较常见)对运动员进行线性排序,每个球员都可以直接向排在前面一位的球员发起挑战,如果获胜,则交换排位。排位赛就相当于运动场上的冒泡排序,因此也是平方排序,需要O(n2)场比赛才能得到稳定的排名。

到这里就要提到算法的两个基础概念:

1.时间复杂度

「 大O符号表示法 」,即 T(n) = O(f(n))
在 大O符号表示法中,时间复杂度的公式是: T(n) = O( f(n) ),其中f(n) 表示每行代码执行次数之和,而 O 表示正比例关系,这个公式的全称是:算法的渐进时间复杂度。

** 在刚刚的演示代码中,race函数的执行次数就是一个时间复杂度的统计,所以,该程序的时间复杂度为O(n log n) **

3.空间复杂度

空间复杂度是对一个算法在运行过程中临时占用存储空间大小的一个量度,同样反映的是一个趋势,我们用 S(n) 来定义。

** 在刚刚的演示代码中,一个人/同一时间,只有一个场地比赛,所以,它的空间复杂度为S(1) **

原文补充:

不过,最流行的赛制可能还是分组淘汰——著名的“疯狂三月”NCAA篮球赛就是其中一例。“疯狂三月”锦标赛的赛程包含“64强赛”“32强赛”到“甜蜜16强”“8强赛”“最后4强”和总决赛。每一轮都会导致比赛人数减半。与我们熟悉的对数排序很像吧?这种赛制其实就是合并排序,先让球队无序配对,然后进行一轮又一轮的比较。
我们知道合并排序需要线性对数时间[即O(n log n)],因此,如果一共有64支队伍,可以预计比赛只需要进行6轮(一共192场),而采用排位赛或者循环赛,则需要多达63轮(2016场)比赛。这是一个巨大的改进,说明对数设计发挥了效用。

“疯狂三月”有6轮比赛,似乎没有问题,但是怎么是192场比赛呢?
美国大学体育协会锦标赛不是只有63场比赛吗?


“疯狂三月”其实不完全是一种合并排序法,因为它并没有产生所有64支队伍的完整排序。要对所有球队进行排名,我们需要增加一组比赛才能确定第二名,确定第三名时又需要增加一组比赛,以此类推,比赛的总场次就会是一个线性对数函数。但是“疯狂三月”没有采取这种赛制。相反,就像道奇森抱怨的草地网球锦标赛一样,它采用的是一种单一淘汰制,被淘汰的球队是不排序的。这种赛制的优势在于它的线性时间。由于每场比赛正好淘汰一支队伍,因此,要让一支队伍留到最后,一共需要n-1场比赛。这是一个线性数字。不足之处是,这种赛制只能决出第一名,无法给出名次表。

最后

很多优秀的算法,很容易在生活中找到案例,同时也可以把算法技巧用在生活和工作上。
书名为《算法之美–指导工作与生活的算法》

同时推荐一本《数据结构与算法__Python语言描述_裘宗燕编著_北京:机械工业出版社》

我很少大范围的推荐资料,知道什么是有用的,可以帮助自己少走很多弯路,需要的小伙伴,网盘自取:
链接: https://pan.baidu.com/s/1W8p4xXO7XaZiUxXgS9VjIQ 提取码: qrej 复制这段内容后打开百度网盘手机App,操作更方便哦

最后,感谢大家三连关注,支持一波。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/121682.html

相关文章

  • 程序员这条路,选择深耕技术,还是全面学习比较好?

    摘要:前言在开发技术和应用市场完全成熟的今天,有人希望深耕技术打造出自己的一片天地,也有人想广泛学习在程序员市场中游刃有余。而这本书上千的引用论文,给我指明了一条系统学习理论的明路。 ...

    kun_jian 评论0 收藏0
  • 以❤简单易懂❤的语言带搞懂有监督学习算法【附Python代码详解】机器学习系列之KNN篇

    必须要看的前言 本文风格:以❤️简单易懂❤️的语言带你彻底搞懂KNN,了解什么是有监督学习算法。 认真看完这篇文章,彻底了解KNN、了解监督学习算法绝对是一样很简单的事情。 注:本篇文章非常详细,同时我也附加了Python代码,欢迎收藏后慢慢阅读。 目录 必须要看的前言监督学习算法KNN/K近邻算法1 算法原理1.1 实现过程1.2 距离的确定 2 算法的优缺点3 算法的变种3.1 变...

    MoAir 评论0 收藏0
  • 女朋友嫌我拍的照片有雾,连夜用OpenCV写出❤去雾算法逃过一劫(收藏保命)

    ❤️欢迎订阅《从实战学python》专栏,用python实现爬虫、办公自动化、数据可视化、人工智能等各个方向的实战案例,有趣又有用!❤️ 更多精品专栏简介点这里 治愈生活的良方 就是保持对生活的热爱 前言 哈喽,大家好,我是一条。 每次和女朋友出去玩,拍照是必须的,天气好还行,天气要是不好,加上我这破手机,那拍的简直惨不忍睹,自己都不过去。 但是没什么能难倒程序员的,为了不挨骂,连夜写出去雾...

    DTeam 评论0 收藏0
  • 身为在软件测试摸爬滚打多年工程师的感悟,写给正在迷茫的

    互联网高速发展,随着科技的进步有一些岗位薪资出现了垫底的情况比如:生产制造、客服、行政等岗位。也有一些岗位薪资有了大幅度的增长:营销/运营、研发/开发,以及IT相关的岗位。 那么对于一个应届毕业生,并非计算机专业的该如何进入IT这个领域呢? 推荐你来学习软件测试,首先软件测试只有20%的代码,对文科生来说是非常又好的。学习软件测试的入行难度相对比开发压力小很多。就算是你想要选择在二线城市就业,不想...

    Cciradih 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<