需要帮助开始应用机器学习?
这些是您一直在寻找的分步指南!
你需要什么帮助?
我被问到的最常见问题是:“我如何开始?”
我对机器学习入门的最佳建议分为 5 个步骤:
- 第一步:调整心态。相信您可以练习和应用机器学习。
- 第 2 步:选择流程。使用系统流程来解决问题。
- 第 3 步:选择一个工具。为您的关卡选择一个工具并将其映射到您的流程中。
- 初学者: 维卡工作台。
- 中级: Python 生态系统。
- 高级:R 平台。
- 机器学习的最佳编程语言
- 第 4 步:在数据集上练习。选择要处理的数据集并练习该过程。
- 第 5 步:建立投资组合。收集结果并展示您的技能。
有关此自上而下方法的更多信息,请参阅:
我的许多学生都使用这种方法继续在 Kaggle 比赛中取得好成绩,并获得了机器学习工程师和数据科学家的工作。
机器学习的好处是预测和做出预测的模型。
拥有应用机器学习的技能意味着知道如何始终如一地可靠地对一个又一个问题提供高质量的预测。你需要遵循一个系统的过程。
以下是一个 5 步流程,您可以按照该流程在预测建模问题上始终如一地取得高于平均水平的结果:
- 第 1 步:定义您的问题。
- 第 2 步:准备数据。
- 第 3 步:抽查算法。
- 第 4 步:改进结果。
- 第 5 步:展示结果。
有关此过程的完整摘要,请参阅以下帖子:
概率是量化和利用不确定性的数学。它是许多数学领域(如统计学)的基石,对于应用机器学习至关重要。
以下是您可以用来快速了解机器学习概率的 3 步过程。
- 第 1 步:了解什么是概率。
- 第 2 步:了解为什么概率对于机器学习如此重要。
- 第 3 步:深入探讨概率主题。
- 概率论机器学习迷你课程
- 机器学习的概率(我的书)
您可以在此处查看有关概率的所有教程。以下是一些最受欢迎的教程的精选。
概率基础
贝叶斯定理
统计方法是深入了解机器学习算法行为所需的重要数学基础领域。
以下是您可以用来快速掌握机器学习统计方法的 3 步过程。
- 第 1 步:了解什么是统计方法。
- 第 2 步:了解为什么统计方法对机器学习很重要。
- 第 3 步:深入研究统计方法的主题。
- 机器学习统计(7 天迷你课程)
- 机器学习的统计方法 (我的书)
您可以在此处查看所有统计方法帖子。以下是一些最受欢迎的教程的精选。
汇总统计
统计假设检验
线性代数是深入理解机器学习算法所需的重要数学基础领域。
下面是 3 个步骤的过程,您可以使用它来快速掌握用于机器学习的线性代数。
- 第 1 步:了解什么是线性代数。
- 第 2 步:了解为什么线性代数对机器学习很重要。
- 第 3 步:深入研究线性代数主题。
- 机器学习的线性代数迷你课程
- 机器学习的线性代数(我的书)
您可以在此处查看所有线性代数帖子。以下是一些最受欢迎的教程的精选。
优化是所有机器学习算法的核心。当我们训练机器学习模型时,它正在对给定的数据集进行优化。
您可以通过 3 个步骤快速熟悉机器学习的优化。
- 第 1 步:了解什么是优化。
- 第 2 步:发现优化算法。
- 第 3 步:深入优化主题。
- 如何手动优化机器学习模型超参数
- 机器学习优化(我的书)
您可以在此处查看所有优化帖子。以下是一些最受欢迎的教程的精选。
局部优化
全局优化
微积分是许多机器学习算法成功的隐藏驱动力。当我们谈论机器学习算法的梯度下降优化部分时,梯度是使用微积分找到的。
您可以通过 3 个步骤熟悉机器学习的微积分。
- 第 1 步:发现什么是微积分。
- 第 2 步:发现差异化规则。
- 第 3 步:深入研究微积分主题。
- 微积分实战:神经网络
- 微分在神经网络中的应用
- 机器学习微积分(我的书)
您可以在此处查看所有微积分帖子。以下是一些最受欢迎的教程的精选。
基础微积分
多元微积分
Python 是机器学习项目的通用语言。不仅很多机器学习库都是用Python编写的,而且能有效的帮助我们快速、利落的完成我们的机器学习项目。拥有良好的 Python 编程技能可以让您在更短的时间内完成更多的工作!
您可以通过 3 个步骤熟悉用于机器学习的 Python。
- 第 1 步:学习语言。
- 第 2 步:学习如何使用该语言。
- 第 3 步:了解您可以在 Python 生态系统中做什么。
您可以在此处查看所有Python 帖子。但是不要错过Python for Machine Learning(我的书)。以下是一些最受欢迎的教程的精选。
基本语言
故障排除
语言技巧
图书馆
机器学习是关于机器学习算法的。
您需要了解针对给定问题可用的算法、它们的工作原理以及如何充分利用它们。
以下是如何开始使用机器学习算法:
- 第 1 步:发现不同类型的机器学习算法。
- 第 2 步:发现机器学习算法的基础。
- 第 3 步:了解顶级机器学习算法的工作原理。
- 机器学习算法迷你课程
- 精通机器学习算法(我的书)
您可以在此处查看所有机器学习算法帖子。以下是一些最受欢迎的教程的精选。
集成算法
如何研究/学习 ML 算法
Weka 是一个平台,您可以使用它开始应用机器学习。
它有一个图形用户界面,这意味着不需要编程,它提供了一套最先进的算法。
以下是开始使用 Weka 的方法:
- 第 1 步:了解 Weka 平台的功能。
- 第 2 步:了解如何绕过 Weka 平台。
- 第 3 步:了解如何使用 Weka 交付结果。
您可以在此处查看所有Weka 机器学习帖子。以下是一些最受欢迎的教程的精选。
在 Weka 中准备数据
Weka算法教程
Python 是应用机器学习发展最快的平台之一。
您可以在模型的开发和运营部署中使用相同的工具,如 pandas 和 scikit-learn。
以下是您可以用来开始使用 Python 机器学习的步骤:
- 第 1 步:发现用于机器学习的 Python
- 第 2 步:探索 Python 机器学习的生态系统。
- 第 3 步:了解如何使用 Python 中的机器学习解决问题。
您可以在此处查看所有Python 机器学习帖子。以下是一些最受欢迎的教程的精选。
在 Python 中准备数据
Python 中的机器学习
R 是一个统计计算平台,是专业数据科学家中最受欢迎的平台。
它之所以流行,是因为有大量可用的技术,并且因为这些方法具有出色的接口,例如功能强大的 caret 包。
以下是 R 机器学习入门的方法:
- 第 1 步:发现 R 平台及其如此受欢迎的原因。
- 第 2 步:在 R 中发现机器学习算法。
- 第 3 步:了解如何使用 R 中的机器学习解决问题。
您可以在此处查看所有R 机器学习帖子。以下是一些最受欢迎的教程的精选。
R 中的数据准备
通过从头开始编写代码,您可以学到很多关于机器学习算法的知识。
通过编码学习是许多开发人员和工程师的首选学习方式。
以下是如何通过从头开始编写所有内容来开始机器学习。
- 第 1 步:从头开始发现编码算法的好处。
- 第 2 步:发现从头开始编码算法只是一种学习工具。
- 第 3 步:了解如何使用 Python 从头开始编写机器学习算法代码。
- 从零开始的机器学习算法(我的书)
您可以在此处查看 Scratch 帖子中的所有代码算法。以下是一些最受欢迎的教程的精选。
时间序列预测是业务应用程序中的一个重要主题。
许多数据集包含时间成分,但从机器学习的角度来看,时间序列的主题很少被深入探讨。
以下是时间序列预测的入门方法:
- 第 1 步:发现时间序列预测。
- 第 2 步:发现时间序列作为监督学习。
- 第 3 步:了解如何通过时间序列预测善于交付结果。
您可以在此处查看所有时间序列预测帖子。以下是一些最受欢迎的教程的精选。
数据准备教程
预测教程
您的预测模型的性能取决于您用来训练它的数据。
因此,数据准备可能是您应用的机器学习项目中最重要的部分。
以下是机器学习数据准备入门的方法:
- 第 1 步:发现数据准备的重要性。
- 第 2 步:发现数据准备技术。
- 第 3 步:发现如何通过数据准备擅长交付结果。
您可以在此处查看所有数据准备教程。以下是一些最受欢迎的教程的精选。
XGBoost 是梯度提升决策树的高度优化实现。
它很受欢迎,因为它被世界上一些最好的数据科学家用来赢得机器学习竞赛。
以下是开始使用 XGBoost 的方法:
- 第 1 步:发现梯度提升算法。
- 第 2 步:发现 XGBoost。
- 第 3 步:了解如何使用 XGBoost 擅长交付结果。
您可以在此处查看所有XGBoost 帖子。以下是一些最受欢迎的教程的精选。
XGBoost 基础知识
XGBoost 调整
不平衡分类是指分类任务,其中一个类的示例比另一个类多得多。
这些类型的问题通常需要使用专门的性能指标和学习算法,因为标准指标和方法不可靠或完全失败。
下面介绍如何开始使用不平衡分类:
- 第 1 步:发现不平衡分类的挑战
- 第 2 步:发现偏斜类分布的直觉。
- 第 3 步:探索如何解决不平衡分类问题。
您可以在此处查看所有不平衡分类帖子。以下是一些最受欢迎的教程的精选。
深度学习是一个迷人而强大的领域。
最先进的成果来自深度学习领域,它是机器学习中不可忽视的一个子领域。
以下是深度学习入门的方法:
- 第 1 步:了解什么是深度学习。
- 第 2 步:发现最好的工具和库。
- 第 3 步:发现如何解决问题并取得成果。
您可以在此处查看所有深度学习帖子。以下是一些最受欢迎的教程的精选。
背景
多层感知器
卷积神经网络
循环神经网络
除了 Keras,PyTorch 是另一个市场份额巨大的深度学习库。了解 PyTorch 并熟悉其语法非常重要。
以下是在 PyTorch 中开始深度学习的方法:
- 第 1 步:了解什么是深度学习。
- 第 2 步:发现 PyTorch
- 第 3 步:发现如何解决问题并取得成果。
您可以在此处查看所有PyTorch 深度学习帖子。以下是一些最受欢迎的教程的精选。
背景
多层感知器
建模技术
高级网络
尽管定义和拟合深度学习神经网络模型很容易,但要在特定的预测建模问题上获得良好的性能可能具有挑战性。
您可以使用一些标准技术来改进学习、减少过度拟合并使用深度学习模型做出更好的预测。
以下是如何开始获得更好的深度学习性能:
- 第 1 步:发现深度学习的挑战。
- 第 2 步:发现用于诊断和改进模型性能的框架。
- 第 3 步:发现可用于提高性能的技术。
您可以在此处查看所有更好的深度学习帖子。以下是一些最受欢迎的教程的精选。
更好的学习(修复培训)
更好的泛化(修复过度拟合)
更好的预测(合奏)
提示、技巧和资源
预测性能是许多分类和回归问题中最重要的关注点。集成学习算法结合了来自多个模型的预测,旨在比任何贡献的集成成员表现得更好。
以下是如何开始获得更好的集成学习性能:
- 第 1 步:发现集成学习。
- 第 2 步:发现集成学习算法。
- 第 3 步:发现可用于提高性能的技术。
您可以在此处查看所有集成学习帖子。以下是一些最受欢迎的教程的精选。
长短期记忆 (LSTM) 递归神经网络专为序列预测问题而设计,是用于挑战性预测问题的最先进的深度学习技术。
以下是在 Python 中开始使用 LSTM 的方法:
- 第 1 步:发现 LSTM 的前景。
- 第 2 步:发现 LSTM 的用处。
- 第 3 步:了解如何在您的项目中使用 LSTM。
您可以在此处查看所有LSTM 帖子。下面精选了一些在 Python 中使用 LSTM 和 Keras 深度学习库的最流行的教程。
LSTM 的数据准备
- 如何重塑长短期记忆网络的输入数据
- 如何对序列数据进行一次热编码
- 如何使用差异变换去除趋势和季节性
- 如何为长短期记忆网络扩展数据
- 如何为 Truncated BPTT 准备序列预测
- 如何处理序列预测问题中的缺失时间步
LSTM 行为
使用 LSTM 建模
时间序列的 LSTM
由于自然语言的混乱性质,处理文本数据很困难。
文本不是“已解决”,而是要在具有挑战性的 NLP 问题上获得最先进的结果,您需要采用深度学习方法
以下是自然语言处理深度学习入门的方法:
- 第 1 步:了解 NLP 深度学习的全部内容。
- 第 2 步:发现 NLP 的标准数据集。
- 第 3 步:发现如何解决问题并取得成果。
- 自然语言处理深度学习速成班
- 自然语言处理的深度学习(我的书)
您可以在此处查看有关 NLP 深度学习的所有帖子。以下是一些最受欢迎的教程的精选。
词袋模型
语言建模
文本摘要
文本分类
词嵌入
照片说明
文本翻译
由于原始像素和图像中的含义之间存在鸿沟,因此处理图像数据很困难。
计算机视觉并没有解决,但要在具有挑战性的计算机视觉任务(如对象检测和人脸识别)上获得最先进的结果,您需要深度学习方法。
以下是计算机视觉深度学习入门的方法:
- 第 1 步:了解计算机视觉深度学习的全部内容。
- 第 2 步:发现计算机视觉的标准任务和数据集。
- 第 3 步:发现如何解决问题并取得成果。
您可以在此处查看有关计算机视觉的所有深度学习帖子。以下是一些最受欢迎的教程的精选。
图像数据处理
图像数据增强
图片分类
图像数据准备
卷积神经网络基础
物体识别
深度学习神经网络能够自动学习从输入到输出的任意复杂映射,并支持多个输入和输出。
MLP、CNN 和 LSTM 等方法为时间序列预测提供了很多希望。
以下是开始深度学习进行时间序列预测的方法:
- 第 1 步:发现时间序列深度学习的前景(和局限性)。
- 第 2 步:了解如何开发稳健的基线和可靠的预测模型。
- 第 3 步:了解如何为时间序列预测构建深度学习模型。
您可以在此处查看有关时间序列预测帖子的所有深度学习。以下是一些最受欢迎的教程的精选。
预测趋势和季节性(单变量)
人类活动识别(多元分类)
预测用电量(多变量、多步骤)
模型类型
时间序列案例研究
预测空气污染(多变量,多步骤)
生成对抗网络,简称 GAN,是一种使用深度学习方法(例如卷积神经网络)进行生成建模的方法。
GAN 是一个令人兴奋且瞬息万变的领域,它兑现了生成模型的承诺,能够在一系列问题领域中生成真实的示例,尤其是在图像到图像的转换任务中。
以下是如何开始深度学习生成对抗网络:
- 第 1 步:发现 GAN 在生成建模方面的前景。
- 第 2 步:发现 GAN 架构和不同的 GAN 模型。
- 第 3 步:了解如何使用 Keras 在 Python 中开发 GAN 模型。
您可以在此处查看所有生成对抗网络教程。以下是一些最受欢迎的教程的精选。
GAN 基础知识
GAN 损失函数
开发简单的 GAN 模型
用于图像翻译的 GAN
注意机制是为了缓解递归神经网络无法很好地处理长输入序列的问题而发明的技术。我们了解到注意力机制本身可以用作神经网络的构建块,因此我们现在有了 Transformer 架构。
注意力机制和转换器模型被证明可以提供惊人的结果,尤其是在自然语言处理方面。有一些以某种方式使用 Transformer 模型的示例,这些模型可以使计算机理解人类语言并以类似人类的质量执行翻译或总结段落等任务。
以下是如何开始理解注意力机制和转换器:
- 第 1 步:了解注意力是什么以及它能做什么。
- 第 2 步:了解如何在神经网络模型中使用注意力。
- 第 3 步:了解如何从注意力机制构建 Transformer 模型。
- 变压器模型
- 用注意力构建变压器模型(我的书)
您可以在此处查看所有Attention 和 Transformer 教程。以下是一些最受欢迎的教程的精选。