10分钟带你了解神经网络基础:反向传播算法详解
itomcoil 2024-12-28 13:35 15 浏览
作者:Great Learning Team
deephub.ai 翻译组
1.神经网络
2.什么是反向传播?
3.反向传播是如何工作的?
4.损失函数
5.为什么我们需要反向传播?
6.前馈网络
7.反向传播的类型
8.案例研究
在典型的编程中,我们输入数据,执行处理逻辑并接收输出。 如果输出数据可以某种方式影响处理逻辑怎么办? 那就是反向传播算法。 它对以前的模块产生积极影响,以提高准确性和效率。
让我们来深入研究一下。
神经网络(Neural network)
神经网络是连接单元的集合。每个连接都有一个与其相关联的权重。该系统有助于建立基于海量数据集的预测模型。它像人类的神经系统一样工作,有助于理解图像,像人类一样学习,合成语音等等。
什么是反向传播(What is backpropagation?)
我们可以将反向传播算法定义为在已知分类的情况下,为给定的输入模式训练某些给定的前馈神经网络的算法。当示例集的每一段都显示给网络时,网络将查看其对示例输入模式的输出反应。之后,测量输出响应与期望输出与误差值的比较。之后,我们根据测量的误差值调整连接权重。
在深入研究反向传播之前,我们应该知道是谁引入了这个概念以及何时引入。它最早出现在20世纪60年代,30年后由大卫·鲁梅尔哈特、杰弗里·辛顿和罗纳德·威廉姆斯在1986年的著名论文中推广。在这篇论文中,他们谈到了各种神经网络。今天,反向传播做得很好。神经网络训练是通过反向传播实现的。通过这种方法,我们根据前一次运行获得的错误率对神经网络的权值进行微调。正确地采用这种方法可以降低错误率,提高模型的可靠性。利用反向传播训练链式法则的神经网络。简单地说,每次前馈通过网络后,该算法根据权值和偏差进行后向传递,调整模型的参数。典型的监督学习算法试图找到一个将输入数据映射到正确输出的函数。反向传播与多层神经网络一起工作,学习输入到输出映射的内部表示。
反向传播是如何工作的?(How does backpropagation work?)
让我们看看反向传播是如何工作的。它有四层:输入层、隐藏层、隐藏层II和最终输出层。
所以,主要的三层是:
1.输入层
2.隐藏层
3.输出层
每一层都有自己的工作方式和响应的方式,这样我们就可以获得所需的结果并将这些情况与我们的状况相关联。 让我们讨论有助于总结此算法所需的其他细节。
这张图总结了反向传播方法的机能。
1.输入层接收x
2.使用权重w对输入进行建模
3.每个隐藏层计算输出,数据在输出层准备就绪
4.实际输出和期望输出之间的差异称为误差
5.返回隐藏层并调整权重,以便在以后的运行中减少此错误
这个过程一直重复,直到我们得到所需的输出。训练阶段在监督下完成。一旦模型稳定下来,就可以用于生产。
损失函数(Loss function)
一个或多个变量被映射到实数,这些实数表示与这些变量值相关的某个数值。为了进行反向传播,损失函数计算网络输出与其可能输出之间的差值。
为什么我们需要反向传播?(Why do we need backpropagation?)
反向传播有许多优点,下面列出一些重要的优点:
?反向传播快速、简单且易于实现
?没有要调整的参数
?不需要网络的先验知识,因此成为一种灵活的方法
?这种方法在大多数情况下都很有效
?模型不需要学习函数的特性
前馈网络(Feed forward network)
前馈网络也称为MLN,即多层网络。 之所以称为前馈,是因为数据仅在NN(神经网络)中通过输入节点,隐藏层并最终到达输出节点。 它是最简单的人工神经网络。
反向传播的类型(Types of backpropagation)
有两种类型的反向传播网络。
?静态反向传播(Static backpropagation)
?循环反向传播(Recurrent backpropagation)
1. 静态反向传播(Static backpropagation)
在这个网络中,静态输入的映射生成静态输出。像光学字符识别这样的静态分类问题将是一个适合于静态反向传播的领域。
2. 循环反向传播(Recurrent backpropagation)
反复进行反向传播,直到达到某个阈值为止。 在到达阈值之后,将计算误差并向后传播。
这两种方法的区别在于,静态反向传播与静态映射一样快。
案例研究(Case Study)
让我们使用反向传播进行案例研究。 为此,我们将使用Iris数据(鸢尾花卉数据集),该数据包含诸如萼片和花瓣的长度和宽度之类的特征。 在这些帮助下,我们需要确定植物的种类。
为此,我们将构建一个多层神经网络,并使用sigmoid函数,因为它是一个分类问题。
让我们看一下所需的库和数据。
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
为了忽略警告,我们将导入另一个名为warnings的库。
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
接着让我们读取数据。
iris = pd.read_csv("iris.csv")
iris.head()
现在我们将把类标记为0、1和2。
iris. replace (, , inplace=True)
我们现在将定义函数,它将执行以下操作。
1.对输出执行独热编码(one hot encoding)。
2.执行sigmoid函数
3.标准化特征
对于独热编码,我们定义以下函数。
def to_one_hot(Y):
n_col = np.amax(Y) + 1
binarized = np.zeros((len(Y), n_col))
for i in range(len(Y)):
binarized ] = 1.
return binarized
#现在我们来定义一个sigmoid函数
def sigmoid_func(x):
return 1/(1+np.exp(-x))
def sigmoid_derivative(x):
return sigmoid_func(x)*(1 – sigmoid_func(x))
现在我们将定义一个用于标准化的函数。
def normalize (X, axis=-1, order=2):
l2 = np. atleast_1d (np.linalg.norm(X, order, axis))
l2 = 1
return X / np.expand_dims(l2, axis)
现在我们将对特征进行规范化,并对输出应用独热编码。
x = pd.DataFrame(iris, columns=columns)
x = normalize(x.as_matrix())
y = pd.DataFrame(iris, columns=columns)
y = y.as_matrix()
y = y.flatten()
y = to_one_hot(y)
现在是时候应用反向传播了。为此,我们需要定义权重和学习率。让我们这么做吧。但在那之前,我们需要把数据分开进行训练和测试。
#Split data to training and validation data(将数据拆分为训练和验证数据)
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.33)
#Weights
w0 = 2*np.random.random((4, 5)) - 1 #for input - 4 inputs, 3 outputs
w1 = 2*np.random.random((5, 3)) - 1 #for layer 1 - 5 inputs, 3 outputs
#learning rate
n = 0.1
我们将为错误设置一个列表,并通过可视化查看训练中的更改如何减少错误。
errors = []
让我们执行前馈和反向传播网络。对于反向传播,我们将使用梯度下降算法。
for i in range (100000):
#Feed forward network
layer0 = X_train
layer1 = sigmoid_func(np.dot(layer0, w0))
layer2 = sigmoid_func(np.dot(layer1, w1))
Back propagation using gradient descent
layer2_error = y_train - layer2
layer2_delta = layer2_error * sigmoid_derivative(layer2)
layer1_error = layer2_delta.dot (w1.T)
layer1_delta = layer1_error * sigmoid_derivative(layer1)
w1 += layer1.T.dot(layer2_delta) * n
w0 += layer0.T.dot(layer1_delta) * n
error = np.mean(np.abs(layer2_error))
errors.append(error)
准确率将通过从训练数据中减去误差来收集和显示
accuracy_training = (1 - error) * 100
现在让我们直观地看一下如何通过减少误差来提高准确度。(可视化)
plt.plot(errors)
plt.xlabel('Training')
plt.ylabel('Error')
plt.show()
现在让我们查看一下准确率。
print ("Training Accuracy of the model " + str (round(accuracy_training,2)) + "%")
Output: Training Accuracy of the model 99.04%
我们的训练模型表现很好。现在让我们看看验证的准确性。
#Validate
layer0 = X_test
layer1 = sigmoid_func(np.dot(layer0, w0))
layer2 = sigmoid_func(np.dot(layer1, w1))
layer2_error = y_test - layer2
error = np.mean(np.abs(layer2_error))
accuracy_validation = (1 - error) * 100
print ("Validation Accuracy of the model "+ str(round(accuracy_validation,2)) + "%")
Output: Validation Accuracy 92.86%
这个性能符合预期。
应遵循的最佳实践准则(Best practices to follow)
下面讨论一些获得好模型的方法:
?如果约束非常少,则系统可能不起作用
?过度训练,过多的约束会导致过程缓慢
?只关注少数方面会导致偏见
反向传播的缺点(Disadvantages of backpropagation)
?输入数据是整体性能的关键
?有噪声的数据会导致不准确的结果
?基于矩阵的方法优于小批量方法(mini-batch)
综上所述,神经网络是具有输入和输出机制的连接单元的集合,每个连接都有相关联的权值。反向传播是"误差的反向传播",对训练神经网络很有用。它快速、易于实现且简单。反向传播对于处理语音或图像识别等易出错项目的深度神经网络非常有益。
相关推荐
- CentOS7服务器,这样搭建Tensorflow很快!我可以提前去吃饭了
-
CentOS7搭建Tensorflow框架凡是我相信的,我都做了;凡是我做了的事,都是全身心地投入去做的。WhateverIbelieved,Idid;andwhateverIdid,...
- python2.0和python3.0的区别(python2.7和3.7哪个好)
-
Python3.0是Python语言的一次重大升级,与Python2.x系列存在许多不兼容的改动。以下是两者核心区别的全面总结,按重要性和使用频率排序:一、最关键的破坏性变更特性Pyth...
- 体验无GIL的自由线程Python:Python 3.13 新特征之一
-
全局解释器锁(GIL,GlobalInterpreterLock)是Python中备受争议的特性之一。它的主要作用是确保Python是一种线程安全的编程语言,防止多个线程同时访问和修改同一...
- Python 3.8异步并发编程指南(python异步调用)
-
有效的提高程序执行效率的两种方法是异步和并发,Golang,node.js之所以可以有很高执行效率主要是他们的协程和异步并发机制。实际上异步和并发是每一种现代语言都在追求的特性,当然Python也不例...
- Python测试框架pytest入门基础(pytest框架搭建)
-
Pytest简介Pytestisamaturefull-featuredPythontestingtoolthathelpsyouwritebetterprograms.T...
- Python学不会来打我(8)字符串string类型深度解析
-
2025年全球开发者调查显示,90%的Python项目涉及字符串处理,而高效使用字符串可提升代码效率40%。本文系统拆解字符串核心操作,涵盖文本处理、数据清洗、模板生成等八大场景,助你掌握字符串编程精...
- windows使用pyenv安装多python版本环境
-
官方的介绍。pyenvletsyoueasilyswitchbetweenmultipleversionsofPython.It’ssimple,unobtrusive,an...
- Python 中 base64 编码与解码(Python 中 base64 编码与解码生成)
-
base64是经常使用的一种加密方式,在Python中有专门的库支持。本文主要介绍在Python2和Python3中的使用区别:在Python2环境:Python2.7.16(d...
- Python项目整洁的秘诀:深入理解__init__.py文件
-
当你发现项目中import语句越来越混乱时,问题可能出在缺少这个关键文件上作为一名Python开发者,我曾深陷项目结构混乱的困境。直到真正理解了__init__.py文件的价值,我的代码世界才变得井然...
- 如何把一个Python应用程序装进Docker
-
准备容器无处不在,但是如何在Docker容器中运行Python应用程序呢?这篇文章将告诉你怎么做!如果您想知道,这些示例需要Python3.x。在深入讨论容器之前,让我们进一步讨论一下我们想要封装的...
- python中数值比较大小的8种经典比较方法,不允许你还不知道
-
在Python中比较数值大小是基础但重要的操作。以下是8种经典比较方法及其应用场景,从基础到进阶的完整指南:1.基础比较运算符Python提供6种基础比较运算符:a,b=5,3...
- Python程序员必看3分钟掌握if语句10个神技,第5个99%的人不知道
-
同事因为写错一个if被开除?全网疯传的Python避坑指南,看完我连夜改了代码!一、新手必踩的3大天坑(附救命代码)技巧1:缩进踩坑事件ifTrue:print("这样写必报错!...
- 为什么Python里遍历字符串比列表慢?3个底层原因揭秘
-
用字符串处理文本时,你可能正悄悄浪费性能。在日常Python开发中,我们经常需要遍历字符串和列表。但你是否注意过,当处理海量数据时,遍历字符串的速度明显比列表慢?这背后隐藏着Python设计的深层逻辑...
- 记录Python3.7.4更新到Python.3.7.8
-
Python官网Python安装包下载下载文件名称运行后选择升级选项等待安装安装完毕打开IDLE使用Python...
- Python3中最常用的5种线程锁你会用吗
-
前言本章节将继续围绕threading模块讲解,基本上是纯理论偏多。对于日常开发者来讲很少会使用到本章节的内容,但是对框架作者等是必备知识,同时也是高频的面试常见问题。私信小编01即可获取大量Pyth...
- 一周热门
- 最近发表
-
- CentOS7服务器,这样搭建Tensorflow很快!我可以提前去吃饭了
- python2.0和python3.0的区别(python2.7和3.7哪个好)
- 体验无GIL的自由线程Python:Python 3.13 新特征之一
- Python 3.8异步并发编程指南(python异步调用)
- Python测试框架pytest入门基础(pytest框架搭建)
- Python学不会来打我(8)字符串string类型深度解析
- windows使用pyenv安装多python版本环境
- Python 中 base64 编码与解码(Python 中 base64 编码与解码生成)
- Python项目整洁的秘诀:深入理解__init__.py文件
- 如何把一个Python应用程序装进Docker
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)