在挑战写语文作文之后,艾现在盯上了高考英语。
结果,好家伙,今年高考英语卷我考了134分。
这不是偶然的。
2018—2021年的10套真题测试中,AI的分数都在125以上,最高纪录138.5,听力和阅读理解也是满分。
这是由学者秦提出的,用于高考英语测试的人工智能系统。
它的参数只有GPT—3的十六分之一,但它的平均分比GPT—3高15分。
具体来说,就是对维基百科,YouTube等平台的信息进行重新提取和重构,然后喂给AI进行训练,从而使AI具有更强的泛化能力。
两位学者用100多页的论文深入解释了这一新范式。
那么,这个范式到底在说什么呢。
来深挖一下吧~
什么是重构前培训。
论文题目很简单,叫《重构的预训》。
核心观点一言以蔽之,简明扼要。注意数据!
笔者认为,世界上有价值的信息无处不在,目前的AI系统并没有充分利用数据中的信息。
比如维基百科和Github就包含了模型学习的各种信号:实体,关系,文本摘要,文本主题等由于技术瓶颈,以前没有考虑过这些信号
因此,本文提出了一种利用神经网络来存储和访问各种数据的方法。
它们以结构化的方式用信号来表示数据,这和数据科学中非常相似,我们经常把数据构造成表格或者JSON格式,然后通过一种特殊的语言来检索所需的信息。
具体来说,这里的信号其实是指数据中的有用信息。
比如莫扎特出生在萨尔茨堡这句话里,莫扎特和萨尔茨堡就是信号。
接下来利用提示法,可以把这些来自不同地方的信号统一成一种形式。
最后,这些重组的数据被集成并存储在语言模型中。
这样,研究可以统一来自10个数据源的26种不同类型的信号,使模型具有很强的泛化能力。
结果表明,在许多数据集上,RST—T和RST—A零样本学习的性能优于GPT—3。
为了进一步检验新方法的性能,笔者还想到了让AI做高考题的方法。
他们表示,现在很多工作方法都遵循中国GPT—3的思路,在评测应用场景上也遵循OpenAI和DeepMind。
比如胶水评测基准,蛋白质折叠评分等。
基于对目前AI模式发展的观察,笔者认为可以开辟一条新的赛道来尝试,于是想到了利用高考来培养AI手。
他们找来前几年共10套试卷做标记,请高中老师打分。
最后,开发了英语的人工智能模型,也可以称为秦。
从测试结果可以看出,秦绝对是一个学习高手,10套卷子的成绩都高于T0pp和3。
他们觉得现在的很多评测基准的任务都很单一,大部分都没有实用价值,很难和人的状况相比。
高考题目不仅涵盖了各种知识点,还直接有人类的分数进行对比,可谓一举两得。
NLP的第五范式。
P1。非神经网络时代的完全监督学习
P2。基于神经网络的全监督学习
P3。预培训,微调范例
P4。预训练,提示和预测范例
但基于目前对NLP发展的观察,他们认为也许未来可以用以数据为中心的方式来看待问题。
即预训/微调,少射/零射等概念的分化。会比较模糊,核心只会集中在一点上——
有多少有价值的信息,有多少可以利用。
此外,他们还提出了NLP进化的假说。
核心思想是技术发展的方向永远遵循这个——做得更少,实现更好更通用的系统。
复旦大学校友楼
本论文的第一部分是袁。
她毕业于武汉大学,获学士学位,后赴卡内基梅隆大学学习数据科学。
研究方向侧重于自然语言处理任务的文本生成和评测。
去年,她分别收到了AAAI 2022和NeurIPS 2021的论文,还获得了ACL 2021最佳演示论文奖。
2019年获复旦大学计算机系博士学位,师从邱希鹏教授和黄教授。
他的兴趣包括NLP模型的可解释性,迁移学习,基于任务的学习等。
博士期间拿了计算机领域的各种奖学金,包括IBM博士奖学金,微软奖学金,腾讯人工智能奖学金,百度奖学金。
还有一点
值得一提的是,当刘鹏飞向我们介绍这部作品时,他直言不讳地说,起初,我们并不打算提交它。
这是因为他们不希望会议论文的格式限制了构思论文的想象力。
我们决定把这篇论文作为一个故事来讲,给读者一种观影的体验。
这就是为什么我们在第三页设置了观看模式的全景。
就是带大家了解NLP发展的历史,以及我们对未来的期待,让每一个研究者都有一定的代入感,感受通过矿山寻宝引领前期训练语言模型走向美好明天的过程。
文末藏了一些惊喜彩蛋。
比如PLMs主题表情:
最后的插图是:
所以,一篇100多页的论文你不会看腻~
论文地址:
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
三大航货运业务逆势增长,燃油附加费翻番 三大航去年亏损仍在加剧,航空业出路何在。3月30日晚间,国内三大航司相继发布2021年年报,三大航营收均录得增...
3999元起,小米11Ultra手机限时特惠150 日前,小米春季发布会上正式推出了小米11Ultra,该机拥有黑白两色,精密陶瓷工艺机身,黑色沉稳大气,白色优雅...
新北洋:累计回购605万股占比0.9088% 每经AI快讯,新北洋3月31日晚间发布公告称,截至2022年3月31日,公司累计通过回购专用证券账户以集中竞价...
中青旅:2021年营收同比增长两成持续布局“旅游+ 中青旅3月31日披露2021年报,公司全年实现营业收入86.35亿元,较上年增加20.76%,实现归属于上市公...
高值设计·重构未来——SK瓷砖x金堂奖战略合作云发 SKCERAMICS2022随着消费新升级,新生代消费群体对居住空间的诉求,越来越艺术化、多元化、个性化。SK...
605389长龄液压3月24日收盘小幅上涨0.57 2022年3月24日长龄液压(605389)收盘点评:长龄液压今日小幅上涨.57%,早盘低开-0.50%,报4...
600358国旅联合3月24日全天上涨2.48%, 2022年3月24日国旅联合(600358)收盘点评:国旅联合今日上涨2.48%,早盘低开-0.41%,报7....
600386北巴传媒3月24日收盘数据:较昨日下跌 2022年3月24日北巴传媒(600386)收盘点评:北巴传媒今日微跌-.25%,早盘高开0.25%,报4.0...
海能实业:2021年度独立董事述职报告王义华 安福县海能实业股份有限公司2021年度独立董事述职报告王义华各位股东及股东代表:本人作为安福县海能实业股份有限...
601598中国外运3月24日股价收盘3.88元与 2022年3月24日中国外运(601598)收盘点评:中国外运今日股价与昨日持平早盘高开0.77%,报3.91... 
601138工业富联3月24 2022年3月24日工业富联(60113...
陈小春开启京东汽车超级直播夜 11月9日晚18点,京东汽车11.11超...
挑战善行者丨2021速8酒店 热爱不止,善行不息善行者是一种勇气善行者...
布局宠物蓝海市场安心养宠物计 京东健康宠物医院作为安心养宠物最重要的升...
苏炳添用9秒83的佳绩带领亚 每0.01秒的提升都是汗水与泪水...
4×100米接力决赛 中国男 4×100米接力·决赛中国女队4...
JBL/UA PROJECT 在这七月热汗运动季,由高保真至潮...
中国队“00后”纷纷登上东京 杨倩、管晨辰、李雯雯、全红婵……...
体育赛事招商的三大注意事项 今年4月姚明和篮协对CBA商务开发权的争...
传统体育文化的两大现代价值 中国传统体育文化丰富多彩,内容博大精深,...
当今世界体育对人的价值体现在 不知你想过没有,在当今这个高度互联网化、...
体育分析中机器学习的标准:预 运动分析有相当一部分属于机器学习,即从数...
进行冬奥会体育营销的五个关键 明年冬奥会将在北京和张家口举行,关于奥运...
父母如何从家庭教育当中反思自 某天晚上睡不着,忽然想到能够写这么一个角...
思维教育对幼儿的四大好处 思想教育对幼儿的益处,幼儿思想处于直观行...
父母教育孩子前必须要知道的前 网上的很多文章提到过,一些懵懂型鸡娃的家...
华为是第一大客户EDA第一股 在半导体芯片设计领域,EDA软件也是卡脖...
新的设计和技术风向奥迪gra 2021年9月3日消息,奥迪将在2021...