数模论坛

 找回密码
 注-册-帐-号
搜索
热搜: 活动 交友 discuz
查看: 2658|回复: 1

题目仅提供2D分子描述符的数值,对模型精度有影响

[复制链接]
发表于 2021-10-15 17:34:35 | 显示全部楼层 |阅读模式
本帖最后由 qscft 于 2021-10-15 17:34 编辑

文件"分子描述符含义解释.xlsx"中介绍了3D分子描述符,但题目仅给出了2D分子描述符的样本数值,缺少3D分子描述符的样本数值会对预测模型的精度产生影响吧。
比如我注意到,"Molecular_Descriptor.xlsx"中第1969行和第1975行两个样本的2D分子描述符数值完全一致,但对应的ERα_activity.xlsx中IC50和pIC50数值却存在较大差异,而且存在上述情况的样本数量不少。仅根据已提供的2D分子描述符变量,无法得到较精确的预测模型该怎么办?是否能剔除这些存在“矛盾”的样本?
发表于 2021-10-15 17:50:12 | 显示全部楼层
训练集中有的分子考虑了手性,有的分子没有考虑手性,这样就出现了你说的情况。建议你根据题目要求进行相应处理。
您需要登录后才可以回帖 登录 | 注-册-帐-号

本版积分规则

小黑屋|手机版|Archiver|数学建模网 ( 湘ICP备11011602号 )

GMT+8, 2024-11-28 01:47 , Processed in 0.051461 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表