-
大模型革新进展:从海量教学视频中萃取顶级多模态教科书资源
淳于菁以2025-01-20 19:47:48 科技 -
导读 浙江大学与阿里巴巴达摩院合作发布了一项研究,旨在利用教学视频创建高质量多模态教科书,为大规模语言模型训练提供新思路。研究团队从互联
浙江大学与阿里巴巴达摩院合作发布了一项研究,旨在利用教学视频创建高质量多模态教科书,为大规模语言模型训练提供新思路。研究团队从互联网收集并筛选出75,000个高质量教学视频,涵盖多个学科,总时长超过22,000小时。通过复杂处理管道,这些视频被转化为内容丰富、结构严谨的多模态教科书,显著提升了知识密度和图像关联性。
该研究成果引起了学术界的广泛关注,相关数据集在Hugging Face平台上迅速走红,两周内下载量超7000次。研究者希望这一创新不仅能推动语言模型发展,还能为教育资源的整合与应用开启新篇章。
标 签:
免责声明:本文由用户上传,如有侵权请联系删除!