博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark中mlib的决策树模型参数详解
阅读量:6706 次
发布时间:2019-06-25

本文共 373 字,大约阅读时间需要 1 分钟。

hot3.png

机器学习之决策树

Spark中的决策树模型参数:

model = DecisionTree.trainClassifier(trainData2, 7, Map(10 -> 4, 11 -> 40),impurity, depth, bins)

trainData2:训练集(标签向量数据)

7:分类个数

Map(10 -> 4, 11 -> 40):特征值的类型数量(比如第10个特征有4个类型值,第11个特征有40个类型值)

如果特征值为纯粹的单个数值类型可以不用映射,直接写成 Map[Int,Int]()

impurity:指定不纯度,分类中主要是gini系数和entropy标准熵。

depth:指定树的深度。

bins:指定最大节点数。

转载于:https://my.oschina.net/shea1992/blog/1601650

你可能感兴趣的文章
流程管理在企业管理中的影响力
查看>>
LAMP 马哥教程
查看>>
[机器学习10.1-2] K-均值聚类算法对未标注数据分组
查看>>
nginx相同域名下不同路径的转发
查看>>
Scala深入浅出实战经典《第89讲:Scala中使用For表达式实现内幕思考》笔记
查看>>
Splunk-面向机器数据的处理分析平台
查看>>
游戏制作中的安全需求分析项
查看>>
linux查看端口对应的进程
查看>>
《从0到1学习Flink》—— Flink 写入数据到 Kafka
查看>>
Redis的安装和使用之二------phpredis与phpRedisAdmin
查看>>
内部邮件服务器转发
查看>>
指定mysql数据目录位置(便于查看和管理)
查看>>
Distcc(分布式编译)(方法1)
查看>>
IBM服务器安装ubuntu系统
查看>>
Icinga2监控web、mysql状态
查看>>
Mysql备份之mysqldump
查看>>
站在源码的角度全解Scroller工作机制(三)
查看>>
NTP时间服务器安装部署文档
查看>>
第8章 网关、隧道及中继
查看>>
CSS3的边框(四)
查看>>