欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
智东西
车东西
芯东西
智猩猩
公开课
公开课官网
公开课小程序
GTIC
快讯
头条
人工智能
芯东西
AIoT
云与智慧城市
机器人
VR/AR
手机通信
活动
智源发布中英文语义向量模型训练数据集MTP
2023-09-15
智源研究院
7
智东西9月15日消息,据智源研究院微信公众号发文,9月14日,在北京人工智能产业峰会暨中关村科学城科创大赛颁奖典礼现场,智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP(Massive Text Pairs)。据介绍,这是目前最大的中、英文文本对训练数据集,数据规模达3亿对,其中中文1亿、英文2亿,这也是智源此前发布的开源中英文语义向量大模型BGE训练所用的数据集。
MTP数据集地址:
https://data.baai.ac.cn/details/BAAI-MTP
分享至:
北京智源研究院
+订阅北京智源研究院最新动态