数据驱动的软件智能化开发 | ChinaOSC

ChinaOSC 2022 以“开源创新,引领未来”为主题,将汇聚国内外顶级开源专家和开源组织,为参会者呈上一场精彩宏大的专业盛宴。别缺席,等你来,欢迎参会报名!
数据驱动的软件智能化开发 | ChinaOSC
文章图片

数据驱动的软件智能化开发技术论坛 开源软件社区积累了大量代码、文档、开发历史等软件开发数据,同时在线软件开发论坛也积累了大量的软件开发问答信息,这些都为数据驱动的软件智能化开发提供了基础。近些年来,基于开源软件开发大数据的代码推荐与生成、软件开发问答、软件缺陷分析与修复、开发人员推荐等方面的软件智能化开发技术研究已经成为学术界的一个研究热点,同时也得到了企业的广泛关注。围绕这一主题,本论坛邀请了多位来自学术界和工业界的专家进行技术报告,同时围绕相关问题开展互动讨论,希望为数据驱动的软件智能化开发方面的研究者和实践者提供一个交流研究与实践成果、了解技术发展趋势的平台。
论坛主席:
彭鑫 复旦大学
彭鑫,复旦大学计算机科学技术学院副院长、软件学院副院长、教授、博士生导师。CCF 杰出会员、软件工程专委会副主任、开源发展委员会常务委员,《Journal of Software: Evolution and Process》联合主编,《ACM Transactions on Software Engineering and Methodology》编委,《软件学报》编委,《Empirical Software Engineering》编委,IEEE软件维护与演化国际会议(ICSME)执委(2017-2020)。2016年获得NASAC青年软件创新奖。主要研究方向包括软件开发大数据分析、软件智能化开发、云原生与智能化运维、人机物融合泛在计算系统、机器人软件工程等。研究工作获得ICSM 2011最佳论文奖、ACM SIGSOFT 杰出论文奖(ASE 2018/2021)、IEEE TCSE杰出论文奖(ICSME 2018/2019/2020)、IEEE Transactions on Software Engineering 年度最佳论文奖(2018)。带领复旦大学 CodeWisdom 研究团队开展软件开发大数据分析以及软件智能化开发与运维方面的研究与实践,研究成果在多家大型企业进行了实践应用。
论坛日程安排 数据驱动的软件智能化开发 | ChinaOSC
文章图片

数据驱动的软件智能化开发 | ChinaOSC
文章图片

主题报告 1: 主讲嘉宾:
李戈,北京大学计算机学院长聘教授,CCF 软件工程专委会秘书长
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
李戈,北京大学长聘教授,博士生导师,教育部长江学者,CCF 软件工程专委会秘书长。长期聚焦于“基于深度学习的程序理解与程序生成”的研究,是国际上最早从事该研究并取得代表性成果的研究者,在 NIPS, AAAI, IJCAI, ACL, ICSE, ASE, ICPC, TOSEM, TSE, EMSE 等多个会议与期刊发表论文50余篇,多篇论文被国际学者认为是“首创成果”并被广泛引用。在软件与人工智能领域的多个国际会议担任程序委员会共同主席与PC。曾获教育部科技进步一等奖,CCF 科技发明一等奖,北京市科技发明二等奖,中创软件人才奖,并多次获ACM杰出论文奖。科研转化成果aiXcoder为航天领域的重大工程、金融与IT领域的多家大型企业及数十万国际开发者提供服务。
报告题目:
基于深度学习的程序理解与生成
报告摘要:
程序理解与程序生成是一对相互依存的经典研究任务。近年来,基于深度学习等人工智能技术的方法,与传统的程序分析与程序综合方法相结合,针对上述两项任务发展出了一系列新的解决方案。这也使程序理解与生成问题成为跨越“软件工程”和“人工智能”两个领域的研究热点。讲者所在研究团队是基于深度学习的程序理解与生成领域的早期开拓和持续贡献团队。讲者以自身研究经历为背景,对基于深度学习的程序理解与生成方法的发展历程和发展状态进行简要阐述,并着重对当前研究和产业化中存在的问题进行探讨。
主题报告 2: 主讲嘉宾:
周宇,南京航空航天大学教授,CCF 系统软件专委会、软件工程专委会执行委员
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
周宇,南京航空航天大学教授,博导。研究方向为软件工程、分布式计算技术,主要包括智能化软件开发、软件演化分析和验证、云计算和大数据技术等。CCF系统软件专委会、软件工程专委会执行委员,江苏省信息技术应用学会常务理事、江苏省计算机学会软件专委会副主任,江苏省软件工程标准化技术委员会委员。近年来主持国家及省部级项目多项,在国内外重要学术杂志和学术会议,如 TSE,TOSEM,ICSE,FSE,中国科学,软件学报等发表论文 100 余篇,授权发明专利 10 余项。
报告题目:
基于开源软件的代码注释生成初探
报告摘要:
代码注释生成旨在为代码段自动生成简洁的自然语言描述,从而促进程序理解和软件维护,深度神经网络技术(DNN)是当前代码注释生成的重要途径。报告主要介绍我们近期在基于开源软件,应用DNN技术生成代码注释的一些初步工作进展,主要包括上下文结构信息和代码语义信息的建模、注释质量评价指标的选择、基于对抗样本的注释生成模型的鲁棒性提升等方面。
主题报告 3: 主讲嘉宾:
李青山,西安电子科技大学计算机科学与技术学院(国家示范性软件学院)教授、党委书记, CCF 杰出会员、软件工程专委会常务委员、系统软件专委会执行委员、开源发展委员会执行委员、大数据专委会执行委员。
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
李青山,教授,博导,CCF 杰出会员。西安电子科技大学计算机科学与技术学院(国家示范性软件学院)党委书记、智能软件与系统新技术研究所所长、陕西省智能软件工程科技创新团队负责人、西安市智能软件工程重点实验室主任、西电软件工程一级学科负责人、教育部省级重点学科“软件工程”学术带头人。曾任学校发展规划处副处长/一流建设工作办公室副主任(主持工作)、研究生院副院长、软件学院副院长。CCF 软件工程专委会常务委员,系统软件专委会执行委员,开源发展委员会执行委员,大数据专委会执行委员,陕西省计算机学会软件工程专委会副主任。主要从事国产开源软件、软件体系结构、自适应软件演化、智能软件工程、大数据智能化分析技术等方向研究工作,主持国家科技部重大研发计划课题、国家 863 重大项目课题、国家自然科学基金重点项目课题、面上项目等国家和省部级项目五十余项,在 ICSE、ESEC/FSE、《中国科学》、《软件学报》、《计算机学报》等 CCF A 类会议和软件工程顶级会议期刊发表论文 100 余篇,授权/公开国家发明专利30余项,获省部级及以上科研/教学奖励3项。
报告题目:
开源环境下的航空航天软件供应链可靠性分析
报告摘要:
近年来,以航空航天为代表的核心工业领域高度重视开源软件的持续发展,积极推动国产开源软件的自主建设。开源环境下航空航天软件系统,通过多重依赖关系交织,已形成了错综复杂的软件供应链。然而,航空航天领域的开源建设发展刚刚起步,仍面临诸多挑战,例如航空航天领域对于软件系统可靠性要求极高,在引入开源生态之后,如何进一步保障领域软件的可靠性。因此,本报告旨在介绍一种基于软件组成成分的开源航空航天软件供应链分析方法,通过探讨航空航天开源软件的依赖构成和组件之间的供应关系,探寻高效准确的可靠性评估手段,以确保航空航天关键领域开源软件的可靠应用。
主题报告4: 主讲嘉宾:
彭鑫,复旦大学计算机科学技术学院教授、副院长,CCF 杰出会员、软件工程专委会副主任、开源发展委员会常务委员,获 2016 年 CCF NASAC 青年软件创新奖
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
彭鑫,复旦大学计算机科学技术学院副院长、软件学院副院长、教授、博士生导师。CCF 杰出会员、软件工程专委会副主任、开源发展委员会常务委员,《Journal of Software: Evolution and Process》联合主编,《ACM Transactions on Software Engineering and Methodology》编委,《软件学报》编委,《Empirical Software Engineering》编委,IEEE 软件维护与演化国际会议(ICSME)执委(2017-2020)。2016年获得CCF NASAC青年软件创新奖。主要研究方向包括软件开发大数据分析、软件智能化开发、云原生与智能化运维、人机物融合泛在计算系统、机器人软件工程等。研究工作获得 ICSM 2011 最佳论文奖、ACM SIGSOFT杰出论文奖(ASE 2018/2021)、IEEE TCSE 杰出论文奖(ICSME 2018/2019/2020)、IEEE Transactions on Software Engineering 年度最佳论文奖(2018)。带领复旦大学 CodeWisdom 研究团队开展软件开发大数据分析以及软件智能化开发与运维方面的研究与实践,研究成果在多家大型企业进行了实践应用。
报告题目:
基于知识图谱的可解释代码推荐
报告摘要:
软件开发人员经常需要通过各种代码搜索与推荐工具获得可复用的代码单元。现有的研究工作主要关注于如何提高搜索与推荐的准确性。然而,为了实现有效的代码复用,开发人员经常需要理解代码背后所蕴含的背景知识和技术决策以及代码自身所隐藏的问题,从而更好地选择适合的代码片段并对其进行适应性修改。针对这一问题,我们尝试对基于知识图谱的可解释代码推荐方法进行了研究,希望通过代码中的概念识别和链接为可复用代码片段提供必要的解释,协助开发人员理解代码并更高效地进行代码适应性修改。本次报告将在分析问题背景的基础上介绍我们当前正在开展的一些研究工作,并对未来的发展方向进行展望。
主题报告 5: 【数据驱动的软件智能化开发 | ChinaOSC】主讲嘉宾:
董威,国防科技大学计算机学院教授,CCF 形式化方法专委会秘书长,曾获 CCF 首届 NASAC 青年软件创新奖
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
董威,国防科技大学计算机学院教授、博士生导师,主要研究方向为高可信软件、智能化软件开发方法,CCF 形式化方法专委会秘书长。入选教育部新世纪优秀人才支持计划,曾获 CCF 首届 NASAC 青年软件创新奖、霍英东基金会高校青年教师奖等。先后主持国家自然科学基金重大项目课题、国家 863 和 973 课题、国防领域课题十余项,发表学术论文 70 余篇,出版国家级规划教材两部,相关成果应用于航空航天、装备控制、自主基础软件等关键领域。
报告题目:
基于多样化开源资源提升软件开发智能化
报告摘要:
互联网上已存在包括开源社区在内的各种各样软件相关资源和数据。开源一方面为汇聚群体智慧、协同构建各类软件系统提供便利,另一方面所含大量资源可为进一步提高软件开发智能化程度提供有力支持。互联网和开源社区可以提供代码、文档等累积资源,也能够提供不同技术原理的开源工具、不同领域背景开发人员等知识来源;能够为软件开发提供历史遗留数据,也能提供有效的即时反馈数据。此外,由于软件开发是经验知识和逻辑推理紧密融合的过程,智能化开发还应将数据驱动方法和演绎推导方法有机结合。本报告结合我们近年来的研究工作,对如何将多样化资源进行汇聚与融合,以提升软件开发过程中代码生成、分析验证等活动的智能化程度进行一些探讨。
主题报告 6: 主讲嘉宾:
楼建光,微软研究院首席研究员
数据驱动的软件智能化开发 | ChinaOSC
文章图片

报告人简介:
楼建光,博士,微软研究院首席研究员。多年来主要从事机器学习和人工智能技术在交互式数据分析机器人、程序自动生成、大规模在系统智能诊断与运维等方面。多项成果在微软公司的产品中得到广泛应用。部分工作发表在人工智能、自然语言处理、计算机软件、系统及数据挖掘相关的知名国际会议(NeurIPS,ACL,AAAI,IJCAI,EMNLP,ICSE,FSE,ATC,ASE,KDD,ICDM 等)。
报告题目:
可信赖的程序生成
报告摘要:
随着深度学习技术的飞速发展,借助 CodeX 和 InCoder 等大型模型的强大功能,自动程序生成技术近年来得到了极大的改进,实现了越来越高的准确性。自动程序生成技术取得了长足进步。但是,对于一个能够在实际编程实践中应用的自动程序生成框架来说,仅仅准确性是不够的。在实际应用中,用户真正需要的是值得信赖的AI合作伙伴。对于一个自动程序生成系统,要获得用户的信任,它需要具体有健壮性,安全性,公平性,和一定程度的可解释性,等等。显然,黑盒神经模型不能轻易实现这一点。在这个报告中,我将系统的介绍一下在基于神经网络大模型的程序生成中的可信赖问题,研究现状,以及可能的研究方向。
2022 CCF 中国开源大会(CCF ChinaOSC)拟于 2022 年 8 月 20 日至 21 日在陕西省西安高新国际会议中心召开。大会由中国计算机学会(CCF)和开放原子开源基金会主办,CCF 开源发展委员会、西安电子科技大学承办,本届大会的主题为“开源创新,引领未来”。
作为第一届 CCF 中国开源大会,本届大会将组织特邀报告、开源高峰论坛、开源发展委员会路演、社区论坛、技术论坛、教育论坛、开源创新大赛培训等 20 余个不同类型的活动。大会将邀请 10 余位开源及相关领域中国科学院院士、中国工程院院士与知名专家,为大会带来特邀报告并参加开源高峰论坛等活动。目前已邀请参会的两院院士与知名嘉宾包括中国科学院院士梅宏,中国工程院院士廖湘科,中国科学院院士王怀民,中国工程院院士孙凝晖,中国科学院院士钱德沛,工信部科技司司长谢少锋,国家杰出自然科学基金获得者、清华大学教授胡事民等。本届大会预计将吸引参会单位超过 100 家,作为中国开源领域的年度盛会,诚挚地邀请开源领域学术界、企业界、教育界的学者、从业者、师生等前来参会

    推荐阅读