摘要:数据科学包括机器学习,数据分析和数据可视化首先,机器学习是什么解释机器学习的最佳方法是给你一个简单的例子。机器学习算法的工作方式大致相同。这是一个人们竞争为特定问题构建最佳机器学习算法的网站。
来源 | 愿码(ChainDesk.CN)内容编辑
愿码Slogan | 连接每个程序员的故事
网站 | http://chaindesk.cn
愿码愿景 | 打造全学科IT系统免费课程,助力小白用户、初级工程师0成本免费系统学习、低成本进阶,帮助BAT一线资深工程师成长并利用自身优势创造睡后收入。
官方公众号 | 愿码 | 愿码服务号 | 区块链部落
免费加入愿码全思维工程师社群 | 任一公众号回复“愿码”两个字获取入群二维码
本文阅读时间:11min
如果您正在考虑学习Python,或者已经开始学习它,那么您可能会问:“我使用Python到底能做什么?”
这是一个很难回答的问题,因为Python有很多应用程序。
但随着时间的推移,我发现Python有三个主要的流行应用程序:
Web开发
数据科学 - 包括机器学习,数据分析和数据可视化
脚本
Web开发最近基于Python的Web框架(如Django和Flask)在Web开发中变得非常流行。
这是因为Web框架使构建通用后端逻辑变得更容易。这包括将不同的URL映射到Python代码块,处理数据库以及生成用户在其浏览器上看到的HTML文件。
Django和Flask是两个最流行的Python Web框架。如果是刚入门,建议你使用其中一个。
主要对比:
· Flask提供简单,灵活和细粒度控制。它是非特定的(它可以让你决定如何实现它)。
· Django提供了一个包罗万象的体验:您可以获得管理面板,数据库接口,ORM [对象关系映射]以及开箱即用的应用程序和项目的目录结构。
你应该选择:
· Flask,如果您专注于体验和学习机会,或者您想要更多地控制使用哪些组件(例如您想要使用哪些数据库以及如何与它们进行交互)。
· Django,如果你专注于最终产品,特别是如果你正在开发一个直接的应用程序,如新闻网站,电子商店或博客,你希望总是有一个单一的,显而易见的方式来做事情。
换句话说,如果你是初学者,Flask可能是一个更好的选择,因为它需要处理的组件更少。此外,如果您想要更多自定义,Flask是更好的选择。
另一方面,如果你想要直接构建一些东西,Django更符合你的需求。
数据科学 - 包括机器学习,数据分析和数据可视化首先,机器学习是什么?
解释机器学习的最佳方法是给你一个简单的例子。假设您想要开发一个程序来自动检测图片中的内容。
因此,如下图(图1),您希望程序识别出它是一只狗。
鉴于下面的另一个(图2),您希望程序识别它是一个桌子。
你可能会说,好吧,我可以写一些代码来做到这一点。例如,如果图片中有很多浅棕色像素,那么我们可以说它是一只狗。或者,您可以弄清楚如何检测图片中的边缘。然后,你可能会说,如果有很多直边,那么它就是一张桌子。
但是,这种方法很快变得棘手。如果照片中有一只没有棕色头发的白狗怎么办?如果图片只显示表格的圆形部分怎么办?
这就是机器学习的切入点。
机器学习通常实现一种自动检测给定输入中的模式的算法。
你可以给机器学习算法给1000张狗的照片和1000张桌子的照片。然后,它将学习狗和桌子之间的区别。当你给它一张狗或桌子的新图片时,它将能够识别它是哪一个。
我认为这有点类似于婴儿学习新事物的方式。宝宝怎么知道一件事看起来像狗,另一件看起来像一张桌子?可能来自一堆例子。
你可能没有明确地告诉婴儿,“如果有毛茸茸的东西,有浅棕色的头发,那么它可能是一只狗。”你可能会说,“那是一只狗。这也是一只狗。这是一张桌子。那个也是一张桌子。“
机器学习算法的工作方式大致相同。
您可以将相同的想法应用于:
· 推荐系统(想想YouTube,亚马逊和Netflix)
· 人脸识别
· 语音识别
等应用程序。
您可能听说过的流行机器学习算法包括:
· 神经网络
· 深度学习
· 支持向量机
· 随机森林
您可以使用上述任何算法来解决我之前解释过的图片标注问题。
用于机器学习的Python有流行的机器学习库和Python框架。
其中两个最受欢迎的是scikit-learn和TensorFlow。
· scikit-learn附带了一些内置的更流行的机器学习算法。我在上面提到了其中一些。
· TensorFlow更像是一个底层库,允许您构建自定义机器学习算法。
如果您刚开始使用机器学习项目,我建议您先从scikit-learn开始。如果你开始遇到效率问题,那么我会开始研究TensorFlow。
我该如何掌握机器学习?要掌握机器学习基础知识,我会推荐斯坦福大学或加州理工学院的机器学习课程。
请注意,您需要微积分和线性代数的基本知识才能理解这些课程中的一些知识点。
然后,用Kaggle练习所学到的东西。这是一个人们竞争为特定问题构建最佳机器学习算法的网站。他们也为初学者提供了很好的教程。
列举一个简单的例子:假设您正在为一家在线销售某些产品的公司工作。作为数据分析师,您可以绘制这样的条形图。
从这张图中,我们可以看出,男性购买了超过400个单位的产品,女性在这个特定的星期天购买了约350个单位的产品。
作为数据分析师,您可能会对这种差异提出一些可能的解释。
一个明显可能的解释是,这种产品比起女性更受男性欢迎。另一种可能的解释可能是样本量太小而且这种差异只是偶然造成的。而另一种可能的解释可能是,男性倾向于仅在周日因某种原因购买该产品。
为了理解这些解释中的哪一个是正确的,您可以绘制另一个像这样的图。
我们不是仅显示星期日的数据,而是查看整整一周的数据。如您所见,从这张图中,我们可以看到这种差异在不同的日子里非常一致。
从这个小小的分析中,你可以得出结论,对这种差异最有说服力的解释是,这种产品更容易受到男性的欢迎,而不是女性。
如果你看到像这样的图表怎么办?
那么,是什么解释了周日的差异?
你可能会说,也许男人往往只是因为某种原因在周日购买更多的这种产品。或者,也许只是巧合,周日男人买了更多。
所以,这是一个说明数据分析在现实世界中可能是什么样子的简化的例子。
Matplotlib是最受欢迎的数据可视化库之一。
· 很容易上手
· 其他一些图书馆,如Seaborn,都是以它为基础的。因此,学习matplotlib将有助于您以后学习这些其他库。
首先应该了解数据分析和可视化的基础知识,然后从Coursera和Khan Academy等网站学习统计数据的基础知识也会有所帮助。
脚本脚本通常是指编写旨在自动执行简单任务的小程序。
举个例子:我曾经在日本的一家小型创业公司工作,我们有一个电子邮件支持系统。这是一个系统,让我们回答客户通过电子邮件发送给他们的问题。
当我在那里工作时,我的任务是计算包含某些关键字的电子邮件的数量,以便我们分析收到的电子邮件。
我们可以手动完成它,但是,我编写了一个简单的程序/简单脚本来自动执行此任务。
实际上,我们当时使用Ruby,但Python也是这类任务的好语言。Python适合这种类型的任务,主要是因为它具有相对简单的语法并且易于编写。用它写一些小东西并测试它也很快。
嵌入式应用程序Python可以与Rasberry Pi一起使用。是硬件爱好者中的一种流行应用。
游戏您可以使用名为PyGame的库来开发游戏,但它并不是最流行的游戏引擎。你可以用它来建立一个爱好项目,但如果你对游戏开发很认真的话,我个人不会选择它。
相反,建议开始使用Unity与C#,这是最受欢迎的游戏引擎之一。它允许您为许多平台构建游戏,包括Mac,Windows,iOS和Android。
桌面应用程序您可以使用Tkinter制作一个Python,但它似乎也不是最受欢迎的选择。
相反,似乎Java,C#和C ++等语言更受欢迎。最近,一些公司也开始使用JavaScript来创建桌面应用程序。
例如,Slack的桌面应用程序是用Electron构建的。它允许您使用JavaScript构建桌面应用程序。
就个人而言,如果我正在构建一个桌面应用程序,我会使用JavaScript选项。它允许您重用Web版本中的一些代码(如果有的话)。
Python 3还是Python 2?推荐Python 3,因为它更现代,而且在这一点上它是一个更受欢迎的选项。
备注:关于后端代码与前端代码的说明(以防您不熟悉这些术语):
假设您想制作像Instagram这样的东西。
然后,您需要为要支持的每种类型的设备创建前端代码。
您可以使用,例如:
· 适用于iOS的Swift
· 适用于Android的Java
· 用于Web浏览器的JavaScript
每组代码都将在每种类型的设备/浏览器上运行。这将是一组代码,用于确定应用程序的布局如何,单击按钮时的外观等等。
但是,您仍然需要能够存储用户的信息和照片。您需要将它们存储在服务器上,而不仅仅存储在用户的设备上,以便每个用户的关注者都可以查看他/她的照片。
这是后端代码/服务器端代码的用武之地。您需要编写一些后端代码来执行以下操作:
· 跟踪谁在追随谁
· 压缩照片,以免占用太多存储空间
· 在发现功能中向每个用户推荐照片和新帐户
因此,这是后端代码和前端代码之间的区别。
顺便说一下,Python并不是编写后端/服务器端代码的唯一好选择。还有许多其他流行的选择,包括基于JavaScript 的Node.js。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/43578.html
摘要:语料库是由文本构成的数据集通过提供现成的文本数据来辅助文本处理。那么可以用来做什么呢我自己是一名从事是不错的入门选项。大数据和人工智能是机器学习和的主要开发语言。 Python培训有哪些内容?很多零基础学员不知道Python软件是干什么用的?Python软件是Python工程师编写代码时所需...
摘要:如果你有一台云主机,你会用来做什么呢拥有一台云服务器,你可以做很多很多有趣的事情呀,不会代码不懂开发,不要紧,因为现在网站上有很多零基础使用教程,良心教学,快速上手比起物理服务器,云服务器不用租场地,也省去了运维电力等基础消耗,再加上价格便如果你有一台云主机,你会用来做什么呢?拥有一台云服务器,你可以做很多很多有趣的事情呀,不会代码不懂开发,不要紧,因为现在网站上有很多零基础使用教程,良心教...
摘要:前言这里声明漫谈我们都知道下有的包的,我们也知道下有封装更好的包。当然这种也是优点,但是如果用了下的的的话,你会会发现对于都封装的很好。故此,我对下的包进行了增强对进行封装。这里我的实现也很简单,其实希望有人能有更好的实现。 前言 这里声明: elasticsearch -> es 漫谈 我们都知道Python 下 有es的sdk包的,我们也知道java 下有封装更好的es包。为什么说...
阅读 1228·2021-11-25 09:43
阅读 1982·2021-11-11 10:58
阅读 1198·2021-11-08 13:18
阅读 2701·2019-08-29 16:25
阅读 3522·2019-08-29 12:51
阅读 3320·2019-08-29 12:30
阅读 757·2019-08-26 13:24
阅读 3695·2019-08-26 10:38