阿里巴巴研发中文语言数据集 Youku-mPLUG，语料数据来自优酷 - 热讯科技网

【资料图】

品玩 6 月 8 日讯，据 arxiv 上的一篇论文显示，达摩院近日为了推动视觉语言预训练以及多模态大语言模型在中文社区的发展，发布了一款视频语言数据集 Youku-mPLUG。

这个数据集的所有内容均来自优酷，对其中的安全性、多样性和内容质量有着非常严格的标准。据达摩院介绍，Youku-mPLUG 中包含了 45 种不同类型的 1000 万个视频文本，这些视频文本从 4 亿个原始视频中筛选而出，主要用于大规模预训练。

达摩院表示，Youku-mPLUG 可以帮助研发人员在未来进行更深入的多模态研究，开发出更好的应用。

推荐内容

阿里巴巴研发中文语言数据集 Youku-mPLUG，语料数据来自优酷

2023-06-08
违规变道怎么判定?违规停放车辆怎么处罚？

2023-06-08
变道不打灯扣几分?怎么正确的变道？

2023-06-08
世界热资讯！“中国古代科学文化探源系列论坛”主论坛活动在京举行

2023-06-08
国产大飞机开启常态化商业运行—— C919，带动产业链一起飞

2023-06-08
焦点精选！科学家首次发现第一代超大质量恒星化学遗迹

2023-06-08
天天信息:协商与校准：与人工智能共存的未来

2023-06-08
在苏州，科创有了“心”动力

2023-06-08
宝来r和宝来1.8t的区别有哪些?宝来r好还是翼神好？

2023-06-08
广东绿色制造名单总数居全国首位累计创建国家级绿色工厂304家，“广东造”含绿量不断提升世界热资讯

2023-06-08
世界观热点：关于食品添加剂的4个问题，60%以上的消费者都误会了！

2023-06-08
如果让AI做你的高考语文题，它能得多少分？-全球热资讯

2023-06-08
大乐透23064期一等奖开出8注，单注奖金631万，江苏彩民独揽4注

2023-06-08
一颗特殊恒星的“寻亲”之旅

2023-06-08
科学家首次发现第一代超大质量恒星化学遗迹-天天快播报

2023-06-08
中国科研人员研发出新型多孔光催化剂

2023-06-08
雷达卫星：全天候观测“大显身手” 世界聚看点

2023-06-08
每日短讯：“汇聚·食品安全指南”系列丨缓解疼痛你做对了吗？居家缓解疼痛有妙招

2023-06-08
环球今日讯！高考试卷是在监狱印刷的？它都经历了什么？揭秘！

2023-06-08
花园里有真相丨植物受伤也会尖叫？绣球花竟然是不育的？

2023-06-08
儿子吃同学生日蛋糕，宝妈微信群怒称“被投毒”，植物奶油真的一口不能吃吗？|全球报道

2023-06-08
6月8日零时，成都将启动臭氧重污染天气黄色预警

2023-06-08
中国芯片稳步推进，美国芯片行业已现颓势，韩荷认清了现实

2023-06-08
每日聚焦：梅西官宣加盟迈阿密国际老板是贝克汉姆：5000万欧年薪+苹果分成等

2023-06-08
动物界“天山童姥”：我不想，不想长大……|全球最资讯

2023-06-08
山西省发布十大非遗旅游线路-焦点精选

2023-06-08
南昌市已安排近3.32亿元衔接资金赋能乡村振兴_天天聚看点

2023-06-08
东方电气国内单机容量最大冲击式水电机组完成国产化改造

2023-06-08
上能电气（300827）：6月7日北向资金增持23.38万股-焦点消息

2023-06-08
焦点要闻：什么是Project xCloud 您需要知道的一切

2023-06-08
妖精的尾巴激斗朱毕安值得培养吗技能效果介绍

2023-06-08
光大证券：钾肥大合同价格的确定有望为国内钾肥价格提供底部支撑

2023-06-08
景德镇一餐饮店发生爆炸，官方回应：事故正在处理中

2023-06-08
今日快看!洛川县147辆巡游出租车免费送考

2023-06-08
环球微资讯！送子由使契丹阅读答案_送子由使契丹翻译及赏析

2023-06-08
视焦点讯！关于天的诗句_关于天的诗句精选

2023-06-08
受贿1992615.31元！陈克祥一审获刑三年半！

2023-06-08
世界即时看！汽车报道：处理自动驾驶数据宝马集团成立新部门

2023-06-08
全球热头条丨后备后备空姐_后备空姐2重返月球

2023-06-08
智能表面产品和新型底盘产品目前有没有获得订单？宁波华翔回应

2023-06-08
浙江婺城“输血+造血”，助力四川道孚铺就致富路

2023-06-08
什么是教育的首要任务问题_什么是教育的首要问题全球短讯

2023-06-08
美股收盘：三大指数收盘涨跌不一热门科技股多数下跌全球要闻

2023-06-08
快报：土耳其里拉持续贬值再创历史新低

2023-06-08
征和工业：湖州土地出让金已足额按时交纳

2023-06-08
全球速递！你过桥他爬桥、买个馒头排大队……网红打卡怎样才能不招人烦？

2023-06-08
2023世界人工智能大会主题和主视觉发布，将于7月6—8日在上海举办

2023-06-08
【世界热闻】应用在无线K歌宝中的国产蓝牙芯片

2023-06-08
A股收评：宁德时代跌超5%,创业板指跌1.61%续创新低

2023-06-08
来自宁波的昊鑫国际更新美股招股书披露最新财报数据热文

2023-06-08