北数所推出AI大模型训练数据集!助力医疗医药大模型训练

为助力企业大模型训练,近日,北京国际大数据交易所联合相关数据集提供方,推出《数据产品手册-人工智能数据集产品》。

作者: 北京国际大数据交易所 来源: 北京国际大数据交易所 2024-08-14 13:43:03

为助力企业大模型训练,近日,北京国际大数据交易所联合相关数据集提供方,推出《数据产品手册-人工智能数据集产品》。

微信图片_20240814134124.png

此次发布的的人工智能大模型训练数据集,覆盖了科技创新、金融服务、医疗医药、自动驾驶、气象服务、遥感影像、影视创作等众多应用场景,共计170余个数据集。内容涵盖了专业知识问答、中外论文期刊、古今文化书籍、互联网舆情资讯、知识产权与专利、多语种音视频、教学资源题库、科研数据、自动驾驶环境场景数据、高清图片等众多领域。

医疗医药领域主要包括如下数据集产品:

用于大规模虚拟筛选的小分子药物数据库、多肽药物库

生物医药研发质量控制与精准溯源

药物ADMET数据

单细胞转录组数据

单细胞代谢组数据核酸适配数据库

二型糖尿病人群队列基因位点数据

用于反向虚拟筛选的蛋白质数据库

就近就诊智能推荐模型

就近购药智能推荐模型

药店评价智能推荐模型

就诊医院信息智能推荐模型

就诊医生信息智能推荐模型

骗保行为AI自动识别算法模型

基于医保数据构建药物平价替代智能推荐算法模型

因病返货风险预警模型模型

民族医药消费趋势分析预测

医学大模型监督微调数据集

用于大规模虚拟筛选的小分子结构和多肽结构和相关的参数文件

数据类型包括头皮脑电、颅内脑电、结构和功能影像、临床诊断信息,其中约95%为头皮脑电和颅内脑电记录的脑功能数据

临床知识数据集

中医知识数据集

匿名化健康医疗大数据

北京国际大数据交易所 AI大模型训练数据集

关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯