小书亭 > 男频 > 穿越:2014 > 第310章 图奖大佬肯定的想法

第310章 图奖大佬肯定的想法

就以“内容表示”来说吧,在构建生成式文本摘要模型的时候。

很多时候内容表示的完成水平的高下将直接影响到后续的步骤。

而尹芙·卡莉所搞得《文本判断甄别比较的一种新方法》这项专利在内容表示方面确实有一定的价值。

借助于该专利所提供的价值,林灰以后在进行文本摘要的后续升级换代的过程中可以少一些逻辑层面的漏洞。

但如果仅仅是因为这点价值,还不足以让林灰大费周章进行一项跨国专利的收购。

林灰之所以煞费苦心将尹芙·卡莉搞出的《文本判断甄别比较的一种新方法》这项专利最最根本的原因还是因为林灰比较在意尹芙·卡莉在这一专利中所应用的模型。

在《文本判断甄别比较的一种新方法》这项专利中就文本甄别尹芙·卡莉极其有创意地鼓捣出一个用于文本判断甄别的模型。

如果仅仅就自然语言处理机器学习方面来看,这不过只是一个平平无奇的用于文本判别的模型。

但当思维跳脱出自然语言处理这个小领域之后,这个模型可不能够等闲视之。

当初在翻阅这个时空的学术方面的一些资料时,林灰敏锐地注意该专利所蕴含的价值。

尽管专利所提供的技术路线很多时候都是概要性的。

一些后来者在按照这些技术路线去体悟技术的时候往往只能盲人摸象般的探索。

在拥有前世信息的情况下,林灰相当于站在巨人的肩膀上,

虽然偶尔会有些高处不胜寒的感觉,但具体到技术方面的时候林灰往往系统概念更强。

很多时候,林灰只消看到一些公开的技术路线就能了解到其背后所蕴含的价值。

并且这种判断基本是八九不离十。

当初接触到尹芙·卡莉搞得这个专利时。

林灰发现根据该专利已经公开的一些资料尤其是该专利公开提及的技术路线。

林灰很快捕捉到这个专利的价值。

林灰料定利用这个模型几乎稍加变形就能在此基础上形成一种颇为高效的判别式模型。

事实是后来进行的收购进一步了解了专利信息后更是印证了此前林灰对之的猜测。

仅仅是判别式模型即便是效率高或许没啥意义。

但是稍微做点小改动那事情就不一样了。

当高效的判别式模型邂后高效的生成式模型。

此二者进行有机结合,并在此基础上再继续进行一定的专门架构之后。

完全可以藉此搞出全新的效率颇高的深度学习模型。

这个深度学习模型在前世有个大名鼎鼎地称呼:

——生成对抗网络(GAN)

生成对抗网络由一个生成网络与一个判别网络组成。

生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模彷训练集中的真实样本。

判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。

而生成网络则要尽可能地欺骗判别网络。

两个网络相互对抗、不断调整参数。

最终目的是使判别网络无法判断生成网络的输出结果是否真实。

在前世图灵奖获得者、卷积神经网路之父Yann Le 在某次学术论坛上甚至将生成对抗网络模型称之为机器学习方面二十年来最酷的想法。

能得到图灵奖级别大老这样高度肯定,生成对抗网络模型的价值可想而知。

前世生成对抗网络作为非监督式学习的一种方法。

是由尹恩·古德费洛等人于2014年提出的。

不过这个时空由于机器学习方面的研究整体滞后。

这个前世颇为有名的深度学习模型在这个时空想要如约而至似乎是有些难度了。

这倒是给了林灰一些上下其手的机会。

前世生成式对抗网络自出现以来,针对不同的应用领域出现了许多变体。

这些变体相对于最原始的生成式对抗网络都进行了一定的改进。

这些改进有的是单纯改进了结构。

有的则是因为理论上的发展而对生成式对抗模型涉及到的一些函数或者说参数进行了一定的改进。

再或者就是单纯就应用方面进行了一定的创新调整。

一项技术被频繁改动不是说明这项技术失败。

刚好相反,这恰恰说明这项技术很成功。

因为这某种程度上从侧面反映了该技术有很多的成长空间。

事实也正是如此,前世生成式对抗网络是相当成功且应用广泛的。

在很多机器学习领域都能看到生成式对抗网络的身影。

之所以如此大概是因为原始的生成式对抗网络在构建的时候,先验假设比较少。

正是因为对数据几乎没有任何假设使得生成式对抗网络具有几乎不设限的建模能力。

借助于生成式对抗网路可以拟合多种分布。

此外,由于生成式对抗网路模型不甚复杂。

很多时候在应用生成式对抗网络的时候就不需要预先设计较为复杂的函数模型。

在不少生成式对抗网络的应用场景中,工程师甚至只需要应用反向传播算法简单训练一下对应的网络。

就可以让生成式对抗网络中的生成器和判别器正常工作。

之所以将生成式对抗网络搞得这么比较易上手。

跟生成式网络的设计初衷是为了进行无监督学习也有很大的关系。

不过事物都是有两面性的,正是因为原始生成式对抗网路过于自由。

训练过程很容易出现训练发散的情况。

不止于此,生成式对抗网络还存在诸如梯度消失等问题。

由于这些问题的存在,生成式对抗网络是很难学习一些生成离散的分布的。

就比如原始的生成式对抗网路就不是很擅长纯粹文本方面的处理。

除了涉及到部分场景下会将生成式对抗网络用于文本分割之外。

多数时候很少将生成式对抗网络应用于文本(特指纯粹文字形式的文本)方面。

不过尺有所长寸有所短,虽然并不是很擅长对纯粹文本信息的处理。

但在其余很多领域生成式对抗网路都可以大显身手。

穿越:2014》情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的男频小说,小书亭转载收集穿越:2014最新章节。