随着互联网的高速发展带来了信息过载问题,给人们获取和理解所需要的信息带来了障碍。因此产生许多精华概要式服务模式,例如罗振宇的60秒语音、快速讲书、快速讲电影等等,都是通过提炼核心信息服务受众。近年来AI技术取得了巨大的进步,尤其是在自然语言处理的文本生成领域,具有十分广泛的产业化应用前景,不仅可以基于文本,还可以基于图片等多模态信息,凝练生成优美的文案。2020年OpenAI发布的1750亿参数的GPT-3,其写作水平能够与人类媲美。
【321,京东言犀×NLPCC 2022挑战赛开赛!】
京东发现好货-西门子文案
京东发现好货-海蓝之谜文案
京东已在自身业务中大规模应用了文本生成技术,可以在短时间内为用户撰写精美的商品摘要文案,并根据用户喜好推荐给用户“种草”,京东言犀基于领域预训练K-PLUG的商品文案生成模型已经覆盖了京东的3000+个三级品类,人工审核通过率90%以上,累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等,商品摘要文案反映了商品最独特的差异化价值,最大限度地促进用户的购买,累计带来超过3亿元GMV。此外,言犀还可以拥有写诗、写春联、书法创作等多种AI能力。
文章图片
京东发现好货-卧式冰箱文案
商品摘要文案的挑战主要来源于三个方面,首先,信息的来源丰富,包含标题、商品规格、产品海报等信息;其次,需要处理多模态和结构化的信息,包含文字和图像各类信息,以及商品规格参数等结构化信息;再次,AI系统必须要足够智能,能够充分挖掘商品的卖点信息,并在合适的时间,千人千面的推荐给恰当的用户。
基于此,京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办多模态商品摘要挑战赛。该任务旨在为一个指定商品生成一段凝练的文本摘要,给定的输入包括商品详细文本描述、商品知识图谱和商品图片。以下将介绍该任务的定义、数据集和评测方法。
文章图片
推荐阅读
- 人工智能|卷积神经网络的特征是如何学习的()
- 神经网络|一个神经网络有多少个神经元()
- 神经网络|复数神经网络_如果神经网络状态为复数会发生什么()
- 人工智能|人脸识别最全知识图谱,中国学者数量全球第三—清华大学出品
- 人工智能|十年AI谁“最能打”(AI 2000榜单(何恺明最佳论文“刷”状元,谷歌机构排名第一...))
- 人工智能|解析|人脸识别最全知识图谱—清华大学出品
- 程序人生|十年AI学者影响力盘点(何恺明排名第一,成为全球最具影响力学者)
- 人工智能|十年AI谁“最能打”(何恺明最佳论文“刷”状元,谷歌机构排名第一)
- 人工智能|何恺明霸榜!近10年里的具有影响力的一作(年轻)AI学者大盘点!谷歌机构排名第一!...