数模论坛

 找回密码
 注-册-帐-号
搜索
热搜: 活动 交友 discuz
查看: 4535|回复: 0

2010年华中地区大学生数学建模竞赛真题A

  [复制链接]
发表于 2010-4-30 21:26:30 | 显示全部楼层 |阅读模式
第三届BiZ-WiZ杯华中地区大学生数学建模邀请赛题目
(请先阅读“选手须知”以及 “论文格式规范”)


A题:互联网论坛用户识别
(由BiZ-WiZ公司执行总监王郁泠女士供题)

本题目为商业决策咨询公司急需掌握的市场信息,采取数据挖掘技术进行解决,做好本题就意味着能马上就业并取得高薪水的工作。
中国互联网发展经历了10年的快速增长期,已经形成较为成熟的应用。现在的互联网正从信息单向推送模式向互动模式转型,互联网论坛已经成为互联网企业与用户、用户与用户之间重要的互动平台。
在这样的互动氛围中衍生出了很多商业机会和运营难题。比如,企业如何通过论坛发掘出有商业价值的用户?互联网公司如何通过激励用户来维持论坛热度?回答这些问题和解决运营难题的首要条件是,企业能够对论坛内的用户进行有效识别。
这些识别需要达到如下四个结果:
1、言论领袖:发现论坛言论领袖,即最具影响力的论坛人物。
2、话题用户:精确定位关注某一特定话题的用户
3、活跃用户:识别论坛活跃用户。
4、关系圈:发掘论坛人际关系圈。
研究建议:
1.        言论领袖的发现可以从其所发帖子的跟帖数量、精华贴数、置顶时间、发帖总数等变量切入,并进行综合评价。
2.        话题用户的定位可从其主要跟帖主题、谈论内容判断。不需要完全准确,大概识别出范围即可。例如,diybbs.it168.com论坛中对游戏话题非常关注的用户。
3.        活跃用户可从登录频率、参与话题数量等方面综合评价。
4.        关系圈可从帖子关联关系等方面综合评价。
5.        建模所用数据以你能在这些论坛上注册后能看到的所有内容为准,不限于文字、数字、符号。例如,发帖时间、主帖跟帖数量(主帖楼高)、用户登录频率、用户最后登录时间、发帖积分、帖子关键字。因为,你能看到的内容就是爬虫机器人可获取的内容,在技术上以可完全实现,并进入到结构化数据库进行数据挖掘。
研究对象包括但不限于如下论坛:
1、http://bbs.55bbs.com
2、http://diybbs.it168.com
3、http://club.autohome.com.cn/bbs
4、http://bbs.pchome.net/bbs
最后成果请提炼形成通用模型,并针对言论领导、话题用户、活跃用户、关系圈四个要求提出实例说明。例如,在http://diybbs.it168.com论坛上关注游戏话题的话题用户的识别,在http://bbs.55bbs.com论坛上的活跃用户等。考虑到各个论坛结构和内容上的差异,通用模型使用的变量应尽量考虑各论坛间的通用性,定量和定性结合为佳,通用模型配合文字或使用方法论说明为佳。
本题要说明识别所用数据获取途径或方法,包括数据挖掘技术以及程序代码。
您需要登录后才可以回帖 登录 | 注-册-帐-号

本版积分规则

小黑屋|手机版|Archiver|数学建模网 ( 湘ICP备11011602号 )

GMT+8, 2024-12-2 11:31 , Processed in 0.087578 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表