数模论坛

 找回密码
 注-册-帐-号
搜索
热搜: 活动 交友 discuz
查看: 2898|回复: 4

D题第一问表述问题

[复制链接]
发表于 2021-10-14 21:35:02 | 显示全部楼层 |阅读模式
第一问中 那20个占比重较大的分子描述符,如果两个变量是强相关的,同时对于目标有同样的重要性, 那排序应该取一个还是取两个? 因为题目中要求给出前20个对生物活性最具有显著影响的分子描述符(即变量)
发表于 2021-10-14 21:38:15 | 显示全部楼层
要不交流一下
发表于 2021-10-14 23:54:08 | 显示全部楼层
确实是个问题, 解答问题一究竟是应该选择 特征重要性最高的变量(包括关联度较高的)还是应该选择 对接下来模型预测效果提升最有帮助的20个变量(即要剔除关联较强的变量)
发表于 2021-10-15 09:18:26 | 显示全部楼层
建议仔细阅读题目,然后根据题目要求去做。因为需要提供详细的分子描述符筛选过程及合理性,只要你的选择有理有据,我想评委也会认可的。
发表于 2021-10-15 09:24:15 | 显示全部楼层
我觉得应该是选择20个影响比较大的
您需要登录后才可以回帖 登录 | 注-册-帐-号

本版积分规则

小黑屋|手机版|Archiver|数学建模网 ( 湘ICP备11011602号 )

GMT+8, 2024-11-28 03:31 , Processed in 0.063605 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表