北数所推出AI大模型训练数据集!助力医疗医药大模型训练
为助力企业大模型训练,近日,北京国际大数据交易所联合相关数据集提供方,推出《数据产品手册-人工智能数据集产品》。
为助力企业大模型训练,近日,北京国际大数据交易所联合相关数据集提供方,推出《数据产品手册-人工智能数据集产品》。
此次发布的的人工智能大模型训练数据集,覆盖了科技创新、金融服务、医疗医药、自动驾驶、气象服务、遥感影像、影视创作等众多应用场景,共计170余个数据集。内容涵盖了专业知识问答、中外论文期刊、古今文化书籍、互联网舆情资讯、知识产权与专利、多语种音视频、教学资源题库、科研数据、自动驾驶环境场景数据、高清图片等众多领域。
医疗医药领域主要包括如下数据集产品:
用于大规模虚拟筛选的小分子药物数据库、多肽药物库
生物医药研发质量控制与精准溯源
药物ADMET数据
单细胞转录组数据
单细胞代谢组数据核酸适配数据库
二型糖尿病人群队列基因位点数据
用于反向虚拟筛选的蛋白质数据库
就近就诊智能推荐模型
就近购药智能推荐模型
药店评价智能推荐模型
就诊医院信息智能推荐模型
就诊医生信息智能推荐模型
骗保行为AI自动识别算法模型
基于医保数据构建药物平价替代智能推荐算法模型
因病返货风险预警模型模型
民族医药消费趋势分析预测
医学大模型监督微调数据集
用于大规模虚拟筛选的小分子结构和多肽结构和相关的参数文件
数据类型包括头皮脑电、颅内脑电、结构和功能影像、临床诊断信息,其中约95%为头皮脑电和颅内脑电记录的脑功能数据
临床知识数据集
中医知识数据集
匿名化健康医疗大数据
关注大健康Pai 官方微信:djkpai我们将定期推送医健科技产业最新资讯