多知网5月22日消息,近日,在第七届世界智能大会上,国家超级计算天津中心正式发布打造天河 E 级智能计算开放创新平台和天河天元大模型。
据介绍,国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,训练打造了自己的中文语言大模型——天河天元大模型。
同时大模型还在持续训练和完善中,并在此基础上启动深度训练面向医疗、工业、法律等领域的专业模型。
据悉,天河 E 级智能计算开放创新平台将带来突破百亿亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。