Scikit-learn是Python编程语言的免费软件机器学习库,基本功能主要被分为六大部分:分类、回归、聚类、数据降维、模型选择和数据与处理。

  分类:指识别给指定对象的所属类别,属于监督学习的范畴,最常见的应用场景包含垃圾邮件检测和图像识别等。目前Scikit-learn已经实现的算法包括:支持向量机、逻辑回归、随机森林、决策树以及多层感知器神经网络等。

  回归:指预测与给定对象相关联的连续值属性,最常见的应用场景包含预测药物反应和预测股票价格等。

  聚类:指自动识别具有相似属性的给定对象,并将其分组为集合,属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。目前Scikit-learn已经实现的算法包括:K-均值聚类、谱聚类、均值偏移、分层聚类、DBSCAN聚类等。

  数据降维:指使用主成分分析、非负矩阵分解或特征选择等降维技术来减少要考虑的随机变量的个数,其主要应用场景包括可视化处理和效率提升。

  模型选择:指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调度来提升精度。目前Scikit-learn实现的模块包括:格点搜索、交叉验证和各种针对预测误差评估的度量函数。

  数据预处理:指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。这里归一化是指将输入数据转换为具有零均值和单位权方差的新变量。但因为大多数时候都做不到精确等于零,因此会设置一个可接受的范围,一般都要求落在0-1之间。


©著作权归作者所有:来自51CTO博客作者mb5fd1925b5d585的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 2021-04-07:给定一个非负数组arr,长度为N,那么有N-1种方案可以把arr
  2. 2021-04-04:给定一个非负数组arr,和一个正数m。 返回arr的所有子序
  3. 2021-04-03:给定两个字符串str1和str2,想把str2整体插入到str1中的
  4. 2021-04-02:给定一个正方形或者长方形矩阵matrix,实现zigzag打印。
  5. 2021-04-01:给定一个正方形矩阵matrix,原地调整成顺时针90度转动的
  6. 2021-03-31:给定一个数组arr,给定一个值v。求子数组平均值小于等于
  7. 儿时环境对其人生长远影响的综述, 包括前所未有的计量识别策略总
  8. 2021-03-30:给定一个整数组成的无序数组arr,值可能正、可能负、可
  9. 2021-03-26:给定一个正整数N,表示有N份青草统一堆放在仓库里。有一

随机推荐

  1. Android:控件AutoCompleteTextView 自动提
  2. android webview web里面的数据透传到jav
  3. android 读取SQLite android could not o
  4. android 版本更新
  5. android 打开各种文件(setDataAndType)
  6. 自定义TabActivity,TabActivity的美化
  7. Android 保活后台启动Service 8.0踩坑记
  8. 解析Android消息处理机制:Handler/Thread/
  9. Android Camera 的学习记录
  10. Android中clipChildren属性的用法