资讯专栏INFORMATION COLUMN

分类模型——决策树

qiangdada / 2500人阅读

Split train and test
from sklearn.cross_validation import train_test_split
x_train, x_test, y_train, y_test = train_test_split(customer.ix[:,0:customer.columns.size-1], customer.ix[:,customer.columns.size-1], test_size = 0.2)
x_train, x_test, y_train, y_test = train_test_split(order.ix[:,0:order.columns.size-1], order.ix[:,order.columns.size-1], test_size = 0.2)
Decision tree

使用信息熵作为划分标准,对决策树进行训练

from sklearn import tree  
clf = tree.DecisionTreeClassifier(criterion="entropy")
print(clf)  
clf.fit(x_train, y_train)
Predict
answer = pd.Series(clf.predict(x_test))
result = pd.DataFrame(np.c_[y_test, answer])
result["correct"] = np.where(result[0] == result[1], 1, 0) 
sum(result["correct"])/pd.count(result["correct"])
result.sum()/result.count()

preds = clf.predict(x_test)
result = pd.crosstab(y_test, preds, rownames=["actual"], colnames=["preds"])
res = result.div(result.sum(1).astype(float), axis=0)
res
res2 = res.drop(max(res) < 0.5, axis=1)
res.to_csv("result.csv", index = True, header = True)



文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/44570.html

相关文章

  • Hinton提出泛化更优的「软决策」:可解释DNN具体决策

    摘要:近日,针对泛化能力强大的深度神经网络无法解释其具体决策的问题,深度学习殿堂级人物等人发表论文提出软决策树。即使没有使用无标签数据,仍然有可能通过使用一种称为蒸馏法,的技术和一种执行软决策的决策树,将神经网络的泛化能力迁移到决策树上。 近日,针对泛化能力强大的深度神经网络(DNN)无法解释其具体决策的问题,深度学习殿堂级人物 Geoffrey Hinton 等人发表 arXiv 论文提出「软决...

    SillyMonkey 评论0 收藏0
  • tensorflow决策

    当涉及到机器学习和数据科学时,决策树是一种广泛使用的算法。TensorFlow是一种流行的机器学习框架,它可以用于训练和部署决策树模型。在本文中,我们将探讨如何使用TensorFlow实现决策树算法。 首先,让我们了解一下决策树算法的工作原理。决策树是一种基于树形结构的分类算法,它将数据集分成不同的类别或标签。决策树的每个节点表示一个特征,每个分支表示该特征的一个可能取值,而每个叶节点表示一个类...

    sumory 评论0 收藏1571

发表评论

0条评论

qiangdada

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<