2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性

Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性

时间:2019-05-29 18:09:24

相关推荐

Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性

本期为TechBeat人工智能社区471线上Talk!

北京时间2月1(周三)20:00东京大学情报理工系博士生——刘海洋的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:“多模态驱动谈话动作生成:质量与多样性”,届时将介绍多模态驱动谈话动作生成领域的进展。

Talk·信息

主题:多模态驱动谈话动作生成:质量与多样性

嘉宾:东京大学情报理工系博士生 刘海洋

时间:北京时间2月1日(周三) 20:00

地点:TechBeat人工智能社区

/

点击下方链接,即可观看视频

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。/talk-info?id=748

Talk·介绍

随着AIGC技术的发展,生成模型在动画建模上已经取得了出色的成果,业界和学界的研究重心逐渐从建模转向驱动,即探索基于AI的由低成本信号驱动的动作生成算法。目前的算法由于缺乏显式的模型设计,以及丰富的训练数据,在生成结果的质量和多样性上仍与真实数据存在较大差异。提升生成动作的多样性和质量是学界的热点及难点。

Talk大纲如下:

本报告将介绍多模态驱动谈话动作生成领域的进展,首先进行背景介绍(引出多样性和质量问题),之后介绍针对多样性提出的:基于动作特征解耦的动作生成算法,最后介绍针对该任务构建的新数据集,基线模型和评估标准,着重于生成情感和语意相关的动作。

Talk·预习资料

DisCo: disentangled implicit content and rhythm learning for diverse co-speech gesture synthesis, ACMMM ,https://pantomatrix.github.io/DisCo/

BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis, ECCV ,https://pantomatrix.github.io/BEAT/

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

刘海洋

东京大学情报理工系博士生

刘海洋,现为东京大学情报理工系博士生。获早稻田大学工学硕士学位,获东南大学工学学士学位。主要研究方向包括:多模态,生成模型,音频识别,人体姿态估计等,主要工作集中于基于单/多模态生成更真实,有表现力的肢体/面部动作,从而构建基于AI的动画制作管线。其研究成果发表于ECCV, KDD, ACMMM等国际会议。

个人主页:

https://h-liu1997.github.io/

-The End-

关于TechBeat人工智能社区

TechBeat()隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。