深度学习模型之旅

内容

神经风格
神经讲故事的人
数据
查恩·泰恩
结论

资料来源：Kran77 / Dreamstime.com

带走：

深度学习模型正在教会计算机进行独立思考，并获得一些非常有趣的结果。

深度学习正被应用于越来越多的领域和行业。从无人驾驶汽车，播放Go语言到生成图像音乐，每天都有新的深度学习模型问世。在这里，我们介绍了几种流行的深度学习模型。科学家和开发人员正在采用这些模型，并以新颖和创新的方式对其进行修改。我们希望这个展示柜能激发您看到可能的一切。（要了解人工智能的进步，请参阅计算机能够模仿人脑吗？）

神经风格

当没有人关心软件质量时，您就无法提高编程技能。

神经讲故事的人

神经讲故事者（Neural Storyteller）是一个模型，当给出图像时，它可以生成有关该图像的浪漫故事。它是一个有趣的玩具，但是您可以想象未来，并看到所有这些人工智能模型的发展方向。

上面的功能是“样式转换”操作，该操作允许模型将标准图像标题转换为小说的故事样式。样式转换的灵感来自“一种艺术风格的神经算法”。

数据

此模型使用两个主要数据源。 MSCOCO是Microsoft的数据集，包含约300,000张图像，每个图像包含五个标题。 MSCOCO是唯一使用的监督数据，这意味着它是人类必须进入并为每个图像明确写上标题的唯一数据。

前馈神经网络的主要限制之一是它没有记忆。每个预测都独立于先前的计算，就好像它是网络有史以来的第一个也是唯一的预测。但是对于许多任务（例如翻译句子或段落），输入应包含顺序和与主题相关的数据。例如，如果没有周围单词所提供的条件，很难理解句子中的单个单词。

RNN不同，因为它们在神经元之间添加了另一组连接。这些链接允许来自隐藏层中神经元的激活在序列的下一个步骤中反馈回自身。换句话说，在每个步骤中，隐藏层都从其下面的层以及序列中的上一步接收激活。这种结构本质上给了递归神经网络记忆。因此，对于对象检测的任务，RNN可以利用其先前对狗的分类来帮助确定当前图像是否为狗。

查恩·泰恩

隐藏层中的这种灵活结构使RNN对于字符级语言模型非常有用。 Char RNN由Andrej Karpathy最初创建，是一个以一个文件作为输入并训练RNN学习预测序列中下一个字符的模型。 RNN可以逐个字符生成看起来像原始训练数据的字符。演示已使用各种TED演讲的笔录进行了培训。向模型输入一个或几个关键字，它将以TED演讲的声音/样式生成关于关键字的段落。