前言
机器学习建模以后,对模型的选择和泛化是一项繁琐的过程,选择合适的模型需要高计算成本、时间和精力,工具上的优化出现了AutoML。
AutoML介绍
AutoML 是一个广泛的概念,指的是使用算法和统计模型来自动化机器学习流程中的多个步骤,包括数据预处理、特征选择、模型选择与超参数调优、模型评估等,目标是减少人工干预,使非专家用户也能高效地构建和应用机器学习模型。
AutoML框架执行任务可总结成以下:
- 预处理和清理数据
- 选择并构建合适的特征
- 选择合适的模型
- 优化模型超参数
- 设计神经网络的拓扑结构(如果使用NN学习)
- 机器学习模型的后处理
- 结果的可视化和展示
流行的automl视线框架有:
PyCaret
PyCaret 是 Python 中的一个开源、低代码机器学习库,可自动执行机器学习工作流。它也是一个端到端的机器学习和模型管理工具,可以成倍地加快实验周期,提升工作开发效率。
PyCaret 本质上是围绕多个机器学习库和框架封装而成,包括大家熟悉的scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt 和 Ray等。可仅用几行代码完成原本需要数百行代码完成的工作,尤其是对于密集的实验迭代过程可以大大提速。
- 📘 文档:https://pycaret.gitbook.io/
- 📘 GitHub:https://www.github.com/pycaret/pycaret
- 📘 教程:https://pycaret.gitbook.io/docs/get-started/tutorials
from pycaret.datasets import get_data from pycaret.classification import setup, compare_models # 加载数据集 data = get_data('iris') # 初始化环境 exp = setup(data, target='species') # 比较不同模型的表现 best_model = compare_models() # 调优最佳模型 from pycaret.classification import tune_model tuned_model = tune_model(best_model) # 评估模型 from pycaret.classification import evaluate_model evaluate_model(tuned_model) # 模型集成, 包括投票分类器和堆叠模型。 from pycaret.classification import blend_models, stack_models blended_model = blend_models([best_model, tuned_model]) stacked_model = stack_models([best_model, tuned_model]) # 预测新数据 new_data = data.sample(5) predictions = predict_model(tuned_model, data=new_data) print(predictions)
TransmogriAI
TransmogrifAI 是一个基于 Scala 语言和 SparkML 框架构建的库,它恰好可以实现这一目标。只需短短的几行代码,数据科学家就可
到此这篇机器学习自动化建模AutoML_自动化建模工具的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/rgzn-amjqxx/5182.html