2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > 北大AI公开课第十一课--语言智能的进展by微软亚洲研究院周明

北大AI公开课第十一课--语言智能的进展by微软亚洲研究院周明

时间:2023-01-20 23:09:07

相关推荐

北大AI公开课第十一课--语言智能的进展by微软亚洲研究院周明

想做的事情很多,但是时间却很有限。所以我们更应当在开始任何事情之前,做好足够的计划和准备,这样才能在有限的时间里做出最恰当的选择,为自己真正值得做的事争取出更多时间。之所以有这个感悟是因为最近太多事情要做,但是却一团糟,所以突然发现,或许应当做一个更为严密的计划!

第十一讲,是来自微软亚洲研究院首席研究员周明老师的分享,它主要是针对自然语言的一些技术、自然语言当前获得的标志性进展以及发展大趋势等方面提出自己的一些看法,对于我们理解当前人工智能大潮下智能语言的理解具有很好的帮助,所以可以耐心地体会一下,也可以结合之前李航老师的分享进行一下理解,虽然二者都是关于自然语言处理、技术及趋势的观点,但是在看待的角度上还是很不一样的。

一、课堂回顾

小冰爸爸——周明老师

周明,博士,现为微软亚洲研究院主任研究员。主要从事机器翻译和自然语言处理等方面的研究。在加入微软研究院之前为清华大学计算机科学与技术系的副教授。曾经主持过多项自然科学基金、航天基金、博士后基金,并曾与日本、香港、韩国进行过多次合作。在国内和日本领导过三项商品化软件的研发。周明老师于1999年加入微软亚洲研究院,并主要负责自然语言研究组的工作,微软输入法、英库词典(必应词典)、中英翻译、微软中国文化系列(微软对联、微软字谜、微软绝句)等重要产品和项目的研发,并对微软Office、必应搜索、Windows等产品中的自然语言技术做出了重要贡献,并且周明老师也参与了小冰的研发,所以也可以说是小冰的爸爸了。

分享内容

1、自然语言技术概览

从自然语言技术的发展取得了一些进步:

自然语言技术通过自然语言处理的过程,可以达到自动文摘、多文档摘要、单文档摘要,主要可以用于神经机器翻译、聊天机器人、阅读理解、创作、简历信息的抽取等,还有一些可能的应用方向是写对联、写诗、生成音乐等。从中可以看到,随着智能程度不断提升,慢慢地会有越来越多更好玩的东西产生。

2、自然语言的一些常见应用场景

自然语言走向应用的过程中,遵循从简单到复杂的规律,比如从翻译-》聊天-》阅读理解-》创作,目前比较常见的就是在翻译中应用会比较多,而且效果也相当不错;

神经机器翻译:

(1)深度学习方法:主要就是编码和解码的过程,通过RNN+LSTM及注意力模型,输入句子的编码可以得到当前句子的语义表达,又因为每个句子的成分权重不一样,所以对编码的解码引入注意力模型型进行解码就知道句子的意思了。也就是说,在翻译的时候,因为针对同一个编码,有可能在不同的语境下表达的意思是不一样的,这个时候就需要借助注意力模型,找出句子的核心成分,使得解码的句义更有针对性。其实经常使用谷歌翻译的用户就知道,现在翻译的准确率比以前要好了挺多的,这也许也得益于深度学习这些神经网络方法的创新。

(2)transformer_based 翻译:这也是一种基于编码-解码的方法,只不过它会直接在编码和解码之间建立注意力机制,获得相关权重,减少句子、词之间的传播路径,并且借助矩阵乘法使得模型的计算并行化,优化了模型的计算效率。

(3)对偶学习:它和常见的神经网络翻译的双语训练有所不同,一开始的时候只采用一种语言进行训练,比如只用中文,然后中译英,再英译中,最后通过比对句子间的差距来调整神经网络的参数即可

(3)推敲网络:传统的机器翻译一般编码之后只进行一次解码,而在大多数语言使用的过程中,其实语言成型之后还需要经过多次润色和修改,也就是有一个推敲的过程,所以推敲网络会对句子进行两次解码 ,第一次是解码生成原始的句子序列,然后再经过对原始语句的推敲之后,获得新的打磨好的语句。

(4)双向一致性翻译:对句子的翻译过程,采用从右至左,从左至右,对比一致性,然后获得新的损失函数,通过调整网络参数使得损失函数极值化即可。

(5)手语翻译:手语的翻译是一个交叉性的课题,因为不仅仅局限于文字对文字,还涉及对手势语言的识别和翻译,所以难度上是加大了的。之前看到一篇报道中说,有两个研究生的同学研发出了一款手语的智能臂环,它通过在手环上安装多个传感器,识别手语发出者的手部的力度、速度等信号,与之前的训练形成比对,从而识别出当前手语输入的内容。这个手臂环的应用,可以实时把手语翻译成语音,而语音又可以合成文字显示在手臂环的屏幕上,这样就达到了手语翻译的效果。从这一点上,一个有心做产品的人,也应当是一个充满慈悲心的人,因为善良,我们会想着那些折了翅膀的天使,想着那些仍然生活在黑暗中的人,如此我们的设计的产品可能会多出一份温暖和爱意。

聊天机器人:

聊天机器人主要有两种模式,第一种是基于检索的方式,这种方式下会有一个庞大的库存语对,经过分类,用于对话发生时的检索。

第二种方式是端到端的,直接进行编码和解码,它需要的先验知识是对话的主题以及背景的知识库。

类似地还有新闻生成、智能音箱、客服等,如敦煌公众号客服系统。从这一个维度上,细心观察的话,我们就会发现类似于淘宝、一些公众号都采用了只能的客服,就是根据过往客服常见问题,整理好了相应的语对,并在检测到这个问题的提问关键词时,给出这个问题的答案,可以节省大量的人工。

阅读理解:

阅读理解主要是给出文章和问题,然后基本的算法过程是先做 word-embeding ,然后进行编码,解码,最后锁定问题答案所谓的边界,最后给出答案。在这个过程中,其实和人的思考方式是基本相同的。还记得当年英语老师也是告诉我们,你们首先要读懂题目问的问题是什么,然后带着问题回去读文章,读文章的过程中锁定答案的区域,最后根据题意给出答案。

诗歌创作:

当机器语言的智能到达一定程度之后,就可以按照人类输入的规律和主题等,进行诗歌、对联、音乐的创作,虽然目前看来,创作的水平还比较拙劣,甚至会让人觉得有点可笑,但是这就像一个牙牙学语的孩子,假以时日,一定会慢慢地进步,不敢保证高超的审美艺术水平,但是对仗工整、符合押韵等创作规律是一定可以达到的。

3、nlp技术的5-10的趋势

(1)口语机器翻译完全普及:这个应用会植入我们的手机中,进行口语的实时接收和翻译。到那时候,我们做很多事的语言障碍就会被克服,直观的想象就是,你可以自由地环游世界,假如你有钱,你还有时间,你还不怕累,尽管去;

(2)自然语言对话(聊天、问答、对话)达到实用。各种智能助理,办公、家庭服务、教育、导购等;

(3)智能客服+人工客服:大大提高咨询及售后的客服效率;

(4)自动写诗、新闻、小说、流行歌曲等会开始流行起来;

(5)推动语音助手、物联网、智能硬件、智能家居的普及;

(6)与其它一些智能语音技术如视觉、视频等结合,在金融、经济、法律、服务等行业发挥更大作用

简言之,如果人工智能是这个时代的王者,那么自然语言就是这顶王冠上的一颗明珠,因为一切都以自然语言的理解和表达为大前提。

7、对话

(1)Google IO,自然语言处理真的实用了吗?

目前一些单轮对话的使用已经初见成效,而一些多轮对话的研究也在加紧中,无论是何种技术,都还存在比较大的提升空间。周老师也分享了一个观点,之前很多老师也分享过,就是说,在研发产品的过程中,尤其是人工智能类的产品,过于追求完美才上线是不合理的,因为人工智能是一个尚未成熟的概念,一方面产品的研发没有标准的规范和考量,另一方面,人工智能产品的研发需要更多样化、合理化、可落地的需求,这些需求无法停留在学术或是产品研发的空想,它们最直接也最靠谱的来源是用户。所以,不用等到完美,达到可用,能帮助用户解决一些问题即可先推出,获取更多用户反馈和评论之后结合新技术再进行迭代即可;

(2)视频理解(视频+nlp)

image captioing:图片理解,输入一张图片,自动输出算法对图片的描述,涉及到图像处理及自然语言处理,越来越受到关注;

vedio captioning:对视频进行理解和描述,可实现拍照片、写游记、自动配音乐等一体化的服务;

视频自动生成:视频检索、广告、过滤(一些黄色信息、违、侵权等)

在这一种应用上,其实最主要的问题还是说,图片描述、视频描述的训练数据太少,有的都是一些国外的小规模的数据集,可获得的训练数据太少,所以算法的准确率距离落地还有较大差距,而一旦,数据集的问题解决了之后,其实可落地的应用就会在短时间内被实现。

(3)方言语音库太少

可以尝试自己建库,每种方言建一个语料库,但其实小团队或者是个人做这样的事基本没有什么意义,效率会很低很低,真的很低。

(4)智能机器和智能机器之间的对话交流?

所有的机器智能都是人工赋予的,所以如果有交流,也是在人类定义的空间内可控,如果有一天,机器实现了自动编程,而不再完全依靠于人类的程序输入,可能就会生成机器智能。这个问题很有意思,其实和机器是否会毁灭人类有异曲同工之妙。

后话:

对于每一款新产品或者是新功能的研发而言,用户-场景-需求都是很重要的,而人工智能作为时代的弄潮儿,在这三者上都有无限的可能。它可以为任何人、在许多场景下、满足用户的多种需求,所以灵活性比传统的互联网还要高许多,也是因为这样,人工智能产品的研发才需要更多大胆的创想,所以我们在思考产品的时候,思维应当更发散,更天马星空,有的时候你觉得暂时不能实现好像也没关系,因为在不断地思考中,你会越来越清楚,将来我们会遇到一个什么样的世界,我们的用户会需要什么?又有哪些更新奇的场景,这些都是在不断地思考和实践中慢慢获得的认识。

最后送自己一句话:无论是决定还是知识,都是自己的,除了自己,没有人能给你!!!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。