阿司匹林的作品集 - 都市小说 - 穿越:2014在线阅读 - 第222章 破碎美好的真实

第222章 破碎美好的真实

    虽然伊芙·卡莉已经将林灰同其最近探讨的成果以论文的形式整理了出来并且整理得还不错。

    但林灰还是决定在伊芙·卡莉撰写的论文基础上再完善一下。

    毕竟这是来到这个时空里林灰在纯粹学术方面的首秀。

    对于这次首秀,林灰希望能够做到尽善尽美。

    尽管世界上几乎不存在十全十美的东西。

    但林灰的理念向来是要么不做,要做就要做到极致。

    在这种信念的驱使下,这注定是个无眠的夜晚了。

    原本林灰也不需要这么着急的。

    但伊芙·卡莉发来的邮件中也顺带着提到了美國國内对生成式摘要算法跟进的情况。

    形势虽然不算是悲观,但也谈不上是很乐观。

    在林灰鼓捣出生成式摘要算法之后。

    很多美國商业性质的科研机构都在迅速跟进林灰的研究。

    除此之外,还有很多计算机方面实力超强的美國大学(包括但不限于诸如麻省理工学院、斯坦福大学、卡内基梅隆大学等)也在跟进这一方向。

    这些海外的科研机构会迅速跟进林灰的研究也不足为奇。

    涉及到文本摘要这个自然语言处理的细分领域这方面的研究虽然看起来不怎么起眼。

    普通人里面多数人中甚至没啥人知道有人在从事着这方面的工作。

    但这丝毫不妨碍文本摘要对于人类文明进步的重要意义。

    对此之前林灰已经进行过很多这方面的论证了。

    事实上这个时空这些海外的科研团队应该一开始就很重视文本摘要这方面的研究。

    只是现在的重视程度又提高了一个层次。

    之所以重视程度提高一个层级跟林灰搞出的动静有着不可分割的联系。

    在林灰的研究成果出现之后。

    目前国内外常用的自动文本摘要技术根据摘要产生的不同方法可以分为两种:

    抽取式文本摘要和生成式文本摘要。

    抽取式文本摘要的方法实现简单,只是从文档中抽取已有的句子形成摘要。

    生成式文本摘要则是要利用自然语言理解技术来执行文本的语法和语义分析和融合信息并在此基础上生成新的摘要句子。

    由于林灰刚搞出生成式摘要算法没多久。

    所以现在生成式摘要算法除了在南风APP上应用了之外其应用范围还不算太广泛。

    反倒是抽取式方法由于一些历史方面的沿革而在应用方面较为广泛。

    但这并不能据此否定生成式文本摘要的价值。

    学术层次从来都不是多数压倒少数的,真理往往掌握在少数人手中。

    抽取式文本摘要归根结底只能看作一个组合优化问题。

    这在生成式文本摘要面前终究是落了下乘。

    尽管处理同一个问题(文本摘要)的两种方法强行分为上下乘似乎有些不妥。

    可人类在文本摘要的目的是什么呢?

    甚至于人类在自然语言处理这方面的研究的目的是什么呢?

    终归不过是为了更好的理解自然语言进而能够更加高效地处理自然语言。

    以这个角度来衡量的话,生成式摘要算法在理解自然语言方面的能力无疑要比抽取式摘要算法高到不知道哪去了。

    因此称生成式摘要算法为上乘而抽取式算法为下乘也不偏颇。

    想来这些海外的研究团队应该也是看到了林灰搞出来的生成式摘要算法在让机器对自然语言的理解能力更上一层楼之后。

    才会对生成摘要这方面研究的重视程度进一步提升。

    不得不说,方向对了。

    事实上前世由于人工智能领域崛起基于人工智能的生成式文本摘要得到质的飞跃之后生成式文本摘要更是一举成为生成摘要的主要研究方向。

    不过仅仅是一些科研机构在文本摘要算法方面加大投入还不足以让林灰这么重视。

    林灰已经在生成式摘要算法这方面构筑了相当完备的技术壁垒。

    想要弯道超车是不可能的,这些科研团队所能采取的方式无非是继续按照林灰先前公布的技术路线造轮子。

    林灰比较警惕地是:

    因为这些科研机构将关注的重心放在文本摘要这个细分领域之后。

    海外很多原本一直处在冷宫的自然语言处理方面的部分细分领域的研究最近也被重拾起来。

    甚至于连带着机器学习其余领域的一些原本冷门的研究方向也有回暖的迹象。

    这对林灰可不是一个好消息。

    这很可能打断林灰此前的一些部署。

    纵然林灰在除却文本摘要之外的其余领域也有着技术方面的优势。

    七年甚至七年以上的信息优势想要一朝逾越是不可能的。

    但现在这种情况也意味着林灰想要藉此一劳永逸也是不现实的。

    对手虽然进步的很慢,但也是一直在进步的。

    林灰如果固步自封的话,迟早会被超越的。

    龟兔赛跑的故事家喻户晓,这里面的道理自然不需多言。

    弱小和无知从来不是生存的障碍,傲慢才是。

    盲目的自负和藐视对手是要付出惨痛的代价的。

    更何况对手还是科研实力地表第一梯队的美國。

    林灰是不能丝毫大意。

    不仅不能大意,而且今后林灰必须加大在自然语言处理和机器学习这方面落子的速度了。

    只有比对手进步的更快,才能不断碾压对手。

    心念及此,林灰很快就进入了熬夜奋战的状态。

    尽管是熬夜奋战,林灰也不觉得有什么疲惫。

    非但不疲惫,而且神清气明,思维始终处于很活跃的状态。

    现在林灰似乎愈发可以肯定其重生之后穿过时空隧道之时身体获得一定程度的强化了。

    不过事情也不绝对,林灰依旧不能完全排除这事是否是因为金钱刺激的影响。

    虽然像这种论文跟之前的代码有些不同,这种论文并没有什么直接经济效益。

    但并不能说这些论文没有经济效益。

    这类论文的间接经济效益还是有的,不但有,而且经济效益还十分显著。

    在这种情况下,林灰也不能判断是身体被强化了还是说依旧是金钱刺激。

    或许什么时候可以更严格控制一下相关变量进行一下测试。

    但林灰觉得很难,这个世界完全不掺杂任何金钱利益或者其余形式利益的事情少之又少。

    反正纵然是此时思维比较活跃,林灰也没想到比较好的验证方法。

    多思无益,林灰也不再纠结。

    趁着思维活跃,林灰全身心投入到工作中。

    在这种全身心地投入下,林灰工作效率很高。

    原本林灰是做好奋战通宵的准备的。

    结果才凌晨三点林灰就将论文改得差不多了。

    确切地说涉及到论文的核心表述方面已经没有任何问题了。

    能这么快改得差不多除了林灰高度活跃的思维之外。

    也得益于先前伊芙·卡莉做的前期工作很棒。

    之所以还没彻底完成还是因为语言方面的一些原因。

    为了追求学术前沿就特么得写英文论文?

    以后林灰牛比了拥有某一研究领域的绝对话语权之后绝对要求所有歪果仁都写成中文论文往外发。

    理想很丰满,不过现实很骨感。

    任重道远啊,哎。

    这之后,林灰又将他微调了一点点的论文给伊芙·卡莉回了过去。

    要伊芙·卡莉有空帮忙润色一下。

    这之后林灰也没怎么有睡意。

    林灰想到前不久他想要鼓捣的关于手机病毒方面的专利。

    虽然短时间内林灰没申请该专利的打算。

    但先将相应的材料整理出来总是好的,免得到时候还要额外花费时间。退出转码页面,请下载小说阅读最新章节。

    重生以后,时间是林灰最宝贵的财富。

    也是林灰潜在的最大威胁。

    时间是一条不会逆行的河流。

    林灰的经历中逆行过一次的河流已然属于神迹了。

    这样的经历林灰觉得是没有机会再遇到了。

    重生之后,林灰的时间跟这个时空的任何人一样。

    每一秒过去了也不会再回来了。

    这种情况下,林灰格外珍惜每分每秒。

    尽管这种状态或许很忙碌,但林灰相信随着他的忙碌会有很多人随之而忙碌。

    毕竟再有七年甚至是七年以上信息优势的情况下。

    林灰的很多努力都是踩在巨人的肩膀上的。

    站在巨人的肩膀上,林灰可以够得比别人更高,看得比别人更远。

    就拿自动文本摘要来说吧。

    这个时空的科研人员在处理自动文本摘要问题的时候可能会仅仅局限在文本摘要这一块。

    但林灰想得却要更多。

    文本摘要的不断迭代人们会对摘要的准确度提出更高的要求。

    而对神经摘要准确度的更高要求连带着会对神经网络学习产生更高水平的要求。

    而神经网络方面即将到来的突破将催生人工智能的兴盛。

    更进一步,一共智能的兴盛又会对新的硬件提出要求。

    毕竟神经网络的逻辑还是和传统的计算机逻辑有区别的。

    举个栗子,神经元之间传递脉冲信号的速度远低于冯·诺依曼计算机的工作速度,前者为毫秒量级。

    后者的时钟频率通常可达10的八次方Hz或更高的速率。

    但是,由于人脑是一个大规模并行与串行组合处理系统,因而在许多问题上可以做出快速判断、决策和处理,其速度可以远高于串行结构的冯·诺依曼计算机。

    人工神经网络的基本结构模仿人脑,具有并行处理的特征,可以大大提高工作速度。

    此外,人工神经网络的兴起对分布式方面的研究也有要求。

    人脑存储信息的特点是利用突触效能的变化来调整存储内容,也即信息储存在神经元之间连接强度的分布上,存储区与运算区合为一体。虽然人脑每日有大量神经细胞死亡,但不影响大脑的功能,局部损伤可能引起功能衰退,但不会突然丧失功能。

    冯·诺依曼计算机具有相互独立的存储器和运算器,知识存储与数据运算互不相关,只有通过人的编程给出指令使之沟通,这种沟通不能超越程序编写者的预想。元件的局部损伤或程序中的微小错误都可能引起严重的失常。

    人工神经网络的原理与应用人类大脑有很强的自适应与自组织特性。

    后天的学习与训练可以开发许多各具特色的活动功能。

    如盲人的听觉和触觉非常灵敏,聋哑人善于运用手势,训练有素的运动员可以表现出非凡的运动技巧等等。

    冯·诺依曼计算机强调程序编写,系统的功能取决于程序给出的知识和能力。

    显然,对于上述智能活动要加以总结并编制程序将十分困难。

    人工神经网络也具有初步的自适应与自组织能力。

    在学习和训练过程中改变突触权重值,以适应周围环境的要求。同一网络因学习方式及内容不同可具有不同功能。

    人工神经网络是一个有学习能力的系统,可以发展知识,以致超过设计者原有的知识水平。

    神经网络硬件的研究与发展要真正实现神经网络计算机,则神经网络芯片设计与生产技术必须有实质性的进展。

    目前,在单片上集成数百个神经元的制作技术已经没有困难,但这种水平与神经网络实际应用的要求尚有较大距离。

    神经网络硬件设计和理论研究相比,要落后很多。

    因此,这也是神经网络研究发展的重要方向之一。

    在这方面,光学技术是实现神经网络及神经计算机的一个比较理想的选择。

    因为光学技术具有非常好的固有特性,主要体现在:高驱动性﹑较高的通信带宽以光速并行传递信息等。

    虽然光学神经计算机实现技术目前还不成熟,其商品化大规模实现还有待时日。

    但这就是未来。

    谁洞察了未来的先机,谁就终将胜利。

    之前林灰搞得生成式摘要算法,无形之中调动世界上众多科研机构的忙碌不正说明这一情况么?

    这种现象用后世的话叫什么呢?

    对,没错,就是“卷”。

    重生者不当卷王,难道带头躺平么?

    迟早卷死这个时空所有的敌对势力。

    不过也无所谓了,前世林灰已经不知道为了多少屁事熬过通宵了。

    现在即便是熬夜,林灰也是属于为了自己奋斗。猪熊的穿越:2014