• 首页
  • 学院概况
    • 学院简介
    • 院长寄语
    • 现任领导
    • 机构设置
    • 学院荣誉
    • 联系方式
    • 院长、书记信箱
  • 新闻中心
    • 学院新闻
      • 学科新闻
      • 教学新闻
      • 学生新闻
      • 党建新闻
      • 新闻人物
    • 学院公告
      • 科研公告
      • 教学公告
      • 行政公告
      • 党务公告
    • 规章制度
    • 资料下载
    • 安全宣传
  • 师资队伍
    • 计算机科学与技术系
    • 空间信息与数字技术系
    • 软件工程系
    • 计算机公共基础教学部
    • 数学与计算科学系
    • 物理基础教学部
    • 专业实验室
    • 大学物理实验中心
    • 教辅人员
  • 科学研究
    • 学院学科简介
    • 科研成果展示
      • 高水平论文
      • 重大项目
      • 科技奖项
      • 教学成果奖
    • 研究生教育
      • 导师一览
      • 培养方案
      • 奖励细则
    • 服务社会
    • 科研团队
  • 学生工作
    • 组织架构
    • 新闻动态
    • 学科竞赛
    • 就业信息
    • 课程导师
    • 学工周报
    • 规章制度
    • 学生组织
      • 学生品牌活动展示
      • 学生社团
    • 出国考研
    • 毕业合影
      • 本科生
      • 研究生
    • 表格下载
  • 招生信息
    • 招生信息
      • 本科生
      • 全日制研究生
      • 在职研究生
      • 博士生
  • 学院党建
    • 组织架构
    • 重点工作
    • 学习园地
    • 党风廉政
    • 规章制度
    • 入党指南
    • 党务公开
  • 对外合作
    • 访学
      • 高校访学
      • 国外访学
    • 产学研基地
      • 就业实习基地展示
    • 国际交流
  • 工程认证
    • 工作动态
    • 组织结构
    • 专业介绍
    • 人才培养
      • 空间信息与数字技术专...
      • 计算机科学与技术专业
      • 软件工程专业
      • 信息与计算科学专业
    • 认证培训
    • 调查问卷
    • 表格下载

自然语言处理中的预训练模型

来源:张程冬发稿时间:2020-11-05浏览次数:60

报告简介:目前预训练模型在自然语言处理领域取得了广泛的成功。本报告的内容主要涵盖以下4部分内容:1)预训练模型的原理介绍,包括模型结构、学习准则、发展历程等;2)预训练模型的迁移方法:包括如何通过任务转换、多步迁移、改进精调等方法来进一步提高预训练模型在下游任务上的性能;3)预训练模型的改进模型:包括知识嵌入模型、多模态模型、多语言模型、语言特定模型、领域特定模型和模型压缩等;4)对预训练模型及其未来发展趋势进行展望。

 

 

报告人介绍:邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师。于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,发表CCF A/B类论文70余篇,获得ACL 2017杰出论文奖(CCF A类)、CCL 2019最佳论文奖。出版开源专著《神经网络与深度学习》,Github关注人数1.3万,豆瓣评分9.6分。曾获得国家优秀青年科学基金、首届中国科协青年人才托举工程项目、钱伟长中文信息处理科学技术奖青年创新一等奖、Aminer2020年度AI 2000人工智能全球最具影响力提名学者等。培养学生曾获中国中文信息学会优博、中国人工智能学会优博、微软学者、微软学者提名、百度奖学金、上海市优博提名等。