关注天善智能,走数据之路感谢

请关注天善智能。 我们是一个专注于商业智能BI、大数据、数据分析领域的垂直社区,一站式学习、答疑、求职。

内容摘要:

1、iris数据集介绍

2、引入r模型的可能方案

3、引入H2o.ai框架和pojo/mojo模型

正式内容:

iris数据集介绍

Iris数据集是常用的分类实验数据集,由Fisher、1936收集整理。 Iris又称鸢尾花卉数据集,是一类多重变量分析的数据集。 数据集包括150个数据集,分为三类,每类包含50个数据,每类包含4个属性。 根据萼长、萼宽、花瓣长、花瓣宽4个属性可以预测鸢尾花卉属于(Setosa、Versicolour、Virginica ) 3种中的哪一种。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

数据集链接: http://存档. ics.UCI.edu/ml /数据集/IRIS

图像源:

359 EN .维基百科. org /维基/iris _ flower _数据集

r模型部署的可能方案

r语言模型导入相关的内容网络和书籍中介绍的很少,博主在摸索了一段时间后,将自己可能知道的方案总结如下,请参考。

部署方法所涉及的软件包和工具概要Mojo/PojoH2OH2O可以将训练过的model转换为plainoldjavaobject(Pojo ) or a Model ObJect,optimized ) mojo ),成为Java环境从提供的h2o-genmodel.jar中生成合适的war包即可。 web APIpumber软件包Turnyourcodeintoawebapi https://www.r plumber.io是一种服务主机PMMLr2pmml软件包RPackageforconvertion

H2o.ai是一个开源的AI平台(OPEN Source AI平台),作为前端的机器学习建模平台,提供了r、python、h2oflow等。 支持的算法有:监督学习(GLM、GBM、深度学习、分布式随机森林、朴素贝叶斯、堆叠式学习)、GLRM、k -。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

H2o.ai模型的引入方法

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

训练分类模型(GBM )=model输出为pojo形式) pojo转换为war包=jetty容器,执行war包=api服务

利用h2o R训练GBM分类器

# #负载包库(H2O ) ) H2O环境初始化h2o.init ) fr-as.H2O ) iris ) my_model-H2O.gbm ) x=1:4,y=5,培训\

同时生成

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

可以在r的工作路径中找到。

H2O预测服务器的构筑

a .准备工作:

Java 1.6、rJava、jetty-runner环境的安装、Linux/Mac OSX系统

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

b.build the H2 opredictionservicebuilder :

克隆系统文件git克隆e https://github.com/h2oai/steam

打开终端窗口,位于steam/prediction-service-builder目录下

使用Run ./gradlew build构建服务

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

显示构建成功消息后,Run./gradlew jettyRunWar运行构建器服务

打开浏览器,输入localhost:55000后,将出现模型builder界面,并显示GBM _ model _ r _ XXX.Java/H2O-gen model.jar软件包(上一个

运行构建器服务

打开新的终端窗口,进入~/steam/prediction-service-builder目录,然后浏览到Java-jar jetty-runner-9.3.9.m1.jar -。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

在浏览器中输入http://localhost:55001以进入预测界面。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

输入相关参数后,单击predict,即可在页面的右侧显示预测结果。 按类别分类的概率。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

同时,也可以单击

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

按箭头按钮,弹出api的网址,传递参数,可以得到json格式的预测结果。

scor模型的五个流程(git分支管理最佳实践)-冯金伟博客园

参考文档:

359 github.com/h2oai/steam /树/主/前服务-构建器

PS :

这次只叙述了mojo/pojo的方式,后期会讨论其他两种方式,敬请期待。

作者:天善社区数据取经团

原文链接: https://www.hellobi.com/u/61330