经营谈话学和当然谈话经管限制的顶级学术会议ACL 2024年会本周在泰国举行开云集团「中国」Kaiyun·官方网站,阿里云共有38篇高水平论文被大会委派,包括通义千问团队多篇大模子关连论文,主题波及大模子SFT时间、LLM脚色饰演能力、多模态模子测评基准等。设在曼谷大会现场的通义展台被寰宇各地的NLP研究东谈主员和诱惑者围不雅,通义成了现场最受关心的中国大模子。 ACL 2024年会本周在泰国召开 ACL 年会(Annual Meeting of the Association for Computational Linguistics)由国际经营谈话学协会组织,是经营谈话学和当然谈话经管限制排行第1的顶级学术会议。ACL 2024是该协会的第62届会议,本年大会特地关心“以绽开科学、绽开数据、绽开模子促进可复现的当然谈话经管研究”这一话题。 阿里云一直以来都是ACL论文入选数目最高的科技公司之一,本年累计有38篇著作被收录,包括16篇主会论文。手脚中国大模子“开源绽开”力量的代表,通义大模子团队在本次大会浮现了多项大模子前沿时间,并与寰宇各地的NLP研发东谈主员和诱惑者濒临面相易。 《Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment》初次提议用于大模子脚色饰演的自我对皆政策DITTO,显耀晋升了LLM的脚色饰演能力,通义团队已将DITTO开源;《AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension》先容了通义团队推出的音频谈话意会模子测评基准AIR-Bench,用于评估模子的生成式教导侍从能力,填补了业界空缺;《How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition》通过一系列施行展示了SFT数据何如影响LLM的数学、代码、东谈主类对皆能力,可为研究者和诱惑者的SFT责任提供模仿。 国际诱惑者基于Qwen查考了泰语大模子和东南亚语大模子 自2023年8月以来,通义千问依然开源数十款LLM、多模态和专项能力模子,Qwen系列开源模子下载量向上了2000万。 在东南亚地区,通义千问开源模子也有好多诚实用户,开源社区频繁可见基于Qwen查考的泰语、越南语、东南亚语等大模子。比如,新加坡工程师刘乾基于Qwen1.5查考了广受迎接的东南亚语大模子Sailor,遮掩0.5B、1.8B、4B、7B、14B等全套尺寸;越南语工程师Nguyen Quan诱惑了越南语大模子,他说:“凭据咱们里面的基准测评,Qwen2基础模子杰出了当今商场上悉数的闭源大谈话模子”。 附:阿里云被ACL 2024收录的论文清单 阿里云被ACL 2024收录的论文清单 开云集团「中国」Kaiyun·官方网站
|