在AI大模型训练过程中,高质量语料库是模型“好用、易用”的前提。当前,许多机构数据资源分散、利用率低。
在华为全联接大会2025数据存储峰会上,华为公司副总裁、数据存储产品线总裁周跃峰博士指出,应加快从烟囱式存储向AI数据湖演进,实现多模态语料统一汇聚与按需流动。
崖州湾国家实验室通过整合基础库、大豆/玉米/生猪专题数据集,并依托数据湖存储与统一视图,构建了精准育种技术体系,大幅缩短育种研发周期。
华为建议各行业加强数据资源的整合与长期保存,以AI数据湖为底座推进语料高质量建设,为AI提供可持续学习的“教材”。
#华为全联接大会 #周跃峰 #AI行业化落地 #HC2025 #AI数据湖
0 条评论
请「登录」后评论