二四六天天好彩免费资料大全大全正版 小说

Renaissance
Era
详细内容
Detail



1. 技术架构:底层基于Python,集成RestData(时代复兴数据服务)。

2. 数据库:MongoDB热数据存储、MySQL存储一般数据、文本型数据库存储14T大数据。

3. 开发环境:支持Python和R开发。

4. 负载均衡:通过分布式技术架构实现多机协同,按需提供计算资源,弹性计算性能调度。

5. 参数优化:高性能参数回测优化系统,支持多机并行


一、深度学习架构

深度学习是机器学习研究中的一个新的领域,深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释和分析数据,例如,人的视觉系统的信息处理是分级的。从低级的V1区提取边缘特征,再到V2区的形状或者目标的部分等,再到更高层,整个目标、目标的行为等。

 


 

在神经网络中,每一层神经元学习到的是前一层神经元值的更抽象的表示。神经网络由包括输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接;这种分层结构,是比较接近人类大脑的结构的。第一个隐藏层学习到的是“边缘”的特征,第二个隐藏层学习到的是由“边缘”组成的“形状”的特征,第三个隐藏层学习到的是由“形状”组成的“图案”的特征,最后的隐藏层学习到的是由“图案”组成的“目标”的特征。总之,深度学习的实质就是通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的二分布式特征表示。

 

二、深度学习模型

我们利用自动编码器模型(AutoEncoder)对多因子进行特征提取。自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现,自动编码器就必须捕捉可以代表输入数据的最重要的因素,就像主成分分析那样,找到可以代表原信息的主要成分。

步骤1、给定无标签数据,用非监督学习学习特征:

我们将input输入一个encoder编码器,就会得到一个code,这个code也就是输入的一个表示。我们加一个decoder解码器,这时候decoder就会输出一个重构信息,那么如果输出的这个信息和一开始的输入信号input是很像的,我们就相信这个code是原始信息的良好表达。因为是无标签数据,所以误差的来源就是直接重构后与原输入相比得到,通过调整encoder和decoder的参数,使得重构误差最小 。整个流程如下图所示。


 


 

步骤2、逐层训练——构建多层自动编码器,通过编码器产生特征,然后训练下一层:

   我们将上面第一层抽象得到的code,当成第二层的输入信号,同样最小化重构误差,就会得到第二层的参数,并且得到第二层的code,也就是原输入信息的第二个表达。其他层如法炮制,训练这一层时,前面层的参数都是固定的,并且他们的decoder已经没用了,可以略去。下面是一个三层自动编码器的例子:

按照上面的方法,我们可以得到很多层自动编码器。至于需要多少层,本身就没有一个科学的评价方法,需要自己试验。

 

步骤3、最后一层加入有监督分类器:

    到这里,这个AutoEncoder还不能用来分类数据。它只是学习获得了一个可以良好代表输入的特征,这个特征可以最大程度上代表原输入信号。那么,为了实现分类,我们就可以在AutoEncoder的最顶的编码层添加一个分类器(例如Softmax、SVM等),然后通过标准的多层神经网络的监督训练方法(梯度下降法)去训练。

  如下图所示,我们需要将最后层的特征code输入到最后的分类器,通过有标签样本,通过监督学习进行微调,调整分类器(黑色部分)。一旦监督训练完成,这个网络就可以用来分类了。神经网络的最顶层可以作为一个线性分类器,然后我们可以用一个更好性能的分类器去取代它。


上一篇:没有了

下一篇:没有了

所属类别: 深度学习系统

该资讯的关键词为: