TCMBank非商业中医药数据库
中医药方向的朋友有福了。TCMBank 非商业中医药数据库是目前体量最大的中医药开源数据资源,嗯,是真的大,而且还完全免费。它其实是TCM Database @Taiwan的延续版,2023 年上线之后就比较火,蛮多搞科研的都在用。
你能下载到 4 个核心表格:ingredient_all.xlsx
(成分信息)、disease_all.xlsx
(疾病对照)、gene_all.xlsx
(基因靶点)、herb_all.xlsx
(中药材详情)。格式规整,字段也清晰,用Pandas或者Excel Power Query起来顺手。
像你如果做的是中药成分挖掘,或者搞AI 药理、中西医疾病对照,这些数据都挺有用的。是gene_all.xlsx
这个,直接就能拿来对接你自己做的生物通路模型或是靶点预测算法。
还有一个细节挺贴心——每份数据都不是随便拼拼的,而是和临床文献、药理数据库做过交叉比对,数据质量还不错。要做系统挖掘,可以顺手配合下面这些参考链接用,比如有个讲Mashup 整合的就蛮实用。
建议你先整体浏览一遍结构,再根据研究方向来挑重点字段。嗯,别直接全部 import 进数据库,先过滤下字段更稳。如果你是做中医药相关 AI 模型训练的,这波资源别错过了。
下载地址
用户评论