您好、欢迎来到现金彩票网!
当前位置:全民彩票app下载 > 感知机 >

机器学习入门

发布时间:2019-06-10 18:42 来源:未知 编辑:admin

  随着人工智能的火热,数据科学领域逐渐被人们所熟知,相信你肯定也听说过诸如一些机器学习,深度学习之类让人听不懂的术语,而随着概念的火热,想进入人工智能这个领域的人越来越多,原因无他,随着这个领域的火爆未来的发展机会,发展潮流乃至薪资都是非常可人的,但是许多人虽然想进入这个领域,却发现无从下手,或者说已经了解了人工智能这个概念想开始学习机器学习,却不知道如何入门的人,今天我们就借助这篇文章,讲述一下,机器学习应该怎么样入门。

  要了解机器学习,首先就不得不谈到数据挖掘,所谓数据挖掘,是指在数据中挖掘有价值的信息,最早定义的数据挖掘是KDD的一个步骤,后随着挖掘的应用场景不断丰富,其技术有了长足的发展,如今的数据挖掘,其概念无论从内涵还是外延角度而言都已独立成为一门学科。

  数据挖掘的特征是对客观世界的抽象,算法则是对事物运行规律内嵌逻辑的还原,算法作用于特征从而无限逼近客观事物运行规律的过程则是机器学习或者数据挖掘的过程。

  但凡从数据中进行有价值信息的挖掘,均可称为数据挖掘,时至今日,数据挖掘核心算法主要可分为数理统计分析算法和机器学习算法两大类

  基于数理统计原理进行的分析,现在称作数理统计分析,也是数据挖掘的一个分支,如线性回归、时间序列等算法,至今仍然是使用最广泛的算法

  数理统计分析一般遵循假设检验-建模参数选择-构建模型-建设检验评估模型-参数调优这五个步骤。

  机器学习的定义:一个计算机程序可以从经验E中学习某些类型的任务T和性能度量P,而且它在任务T中的性能(用P度量)可以随着经验E的提高而提高

  随着计算机运算能力不断提升,数理统计分析大行其道。但人们并不止步于此,50年代就被提出的感知机理论在80年代再次进入公众视野,人们开始尝试使用计算机训练多层感知机,也就是现在所谓的神经网络。

  神经网络算法的计算机实践是成功的,这即是神经网络算法本身诸多优秀特性所导致,也是计算机运算让神经网络迭代运算如虎添翼

  从算法理论层面来说,数理统计是基于统计学原理设计的一系列算法,大多是基于少量样本的统计推断,其算法虽然大多诞生实践较早,但在当今数据环境中仍然能够发挥巨大价值。机器学习是需要更多的计算资源及数据量支撑,计算前无需预设过多条件,运算过程会不断迭代,直至收敛。

  第一重境界,将算法本身当做黑箱,在不知道算法具体原理的情况下能够掌握算法的基本应用情景(有监督、无监督),以及算法的基本使用情景,能够调包实现算法。

  第二重境界则是能够深入了解、掌握算法原理,并在此基础上明白算法实践过程中的关键技术、核心参数,最好能够利用编程语言手动实现算法,能够解读算法执行结果,并在理解原理的基础上对通过调参对算法进行优化

  最后一重境界,实际上也是算法(研发)工程师的主要工作任务,即能够结合业务场景、自身数学基础来进行有针对性的算法研发,此部分工作不仅需要扎实的算法基本原理知识,也需要扎实的编程能力。

  理论基础讲完,接下来就是要介绍一下我们应该如何的去安排我们如何去学习机器学习了,当前主流的数据挖掘算法——机器学习大类算法并非完全由一个个独立的算法所组成,机器学习算法内部有诸多相通之处,核心思想高度一致,彼此之间处理手段也有相互借鉴的地方,因此教学过程不仅对将各个算法的核心原理、编程语言实现方法进行讲解,还需要对更为一般的机器学习方法论进行系统的讲解。我们的学习任务也分为三个阶段:

  第二阶段是算法大爆炸,在有了第一阶段基本算法思维培养和基本方法论掌握的基础上,第二阶段将对当前主流机器学习算法进行讲解学习,也是分为核心算法和机器学习方法论。

  核心算法:树模型:包括ID3、C4.5、CART等;回归分析:包括线性回归、岭回归、Lasso、广义线性回归(逻辑回归)等;贝叶斯分类器;关联规则:包括Apriori、FP-Growth、PrefixSpan等

  机器学习方法论:机器学习算法一般流程、常用凸函数优化方法(梯度下降、最小二乘法、坐标轴下降、拟牛顿法等)、概率分类问题模型评估指标(ROC、AUC)、感知机模型基本原理

  第三阶段也就是最后一个阶段是学习讲解当前机器学习算法的高阶算法部分,主要包括由感知机模型衍生而来的两个模型:神经网络和SVM,以及一些常用的集成方法。此部分所谓高级算法,即指其基本原理要更加艰深,也指其使用过程难度更大。

  以上就是我么学习机器学习的三个阶段,接下来我们简单的讨论而言,在各种领域中,算法是何物。

  在计算机领域中,算法用来调整语法结构、数据结构,从而优化程序执行效率;

  在数学领域中,算法指的是在根据一定条件构建的模型是否有解、是否存在最优解,及获取解的过程

  而在数据分析、数据挖掘或机器学习领域,算法用于捕捉数据背后隐藏的客观规律,去解决和实际业务高度相关的某些问题。某些时候算法是为了调整数据结构、降低程序的时间复杂度,提高计算机执行效率(如FP-Growth),多数时候算法是为了解决最优化问题(如最小二乘法、梯度下降等),更多时候算法就是一个数学模型,作用于特定的数据,产出特定的结论,解决特定的问题。

  首先,算法理论是此三者中最核心的知识内容,掌握算法基本理论、拥有算法素养和算法思维才能根据需求及数据情况合理选择选法、根据模型结果进行算法调优,并合理解读模型结果;

  其次,算法需要利用计算机来执行,因此我们需要将算法中的人类逻辑转化为计算机逻辑交付计算机执行,此过程需要用到编程语言,但其只是算法实践的工具

  最终,算法库将进一步封装算法底层执行过程,提供整洁而统一的接口给用户使用,从而降低算法使用门槛。

  以上就是有关机器学习入门的步骤希望大家在看完之后可以明白什么是机器学习,并且坚定的在这条道路上走下去,紧跟时代的潮流,早日找到自己满意的一份领域内的工作,谢谢。

  每个月,我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。

http://diystuff.net/ganzhiji/484.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有