dataman
-
ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
DataMan:提升大语言模型预训练效率的数据管理器 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍由浙江大学和阿里巴巴千问团队合作完成的一项研究,该研究针对大语言模型(llms)预训练数据选择问题,提出了一种名为dataman的数据…
DataMan:提升大语言模型预训练效率的数据管理器 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍由浙江大学和阿里巴巴千问团队合作完成的一项研究,该研究针对大语言模型(llms)预训练数据选择问题,提出了一种名为dataman的数据…