2月22日下午,由我院“大数据+网络舆情创新团队”主办的“数舆沙龙”第一期在教学主楼411书吧成功举办。此次沙龙邀请了武汉烽火普天信息技术有限公司KA事业部总经理司徒洁亮、研发总监杜鲁、数据新闻策划与舆情分析师王劲松和大家分享了大数据在城市形象研究中的应用。创新团队成员韦路、徐敏、何春晖、吴赟、章燕、苏振华、陆建平、吴红雨,浙江在线的相关专家,以及传媒学院的多位研究生参与了讨论。
首先,王劲松分析师以“重庆城市形象”为案例,介绍了如何建构多层级的城市指标结构,其中涉及到人工的维度构建过程以及机器学习、自然语言处理、词库建设等多种大数据技术,他说明了大数据在城市形象分析方面的优势以及面临的挑战,同时也分享了自身通过大数据方法进行舆情分析和数据新闻的项目经验。
接着,杜鲁工程师具体介绍了大数据项目的技术流程及其中包含的各种专业角色。他指出在烽火普天主要存在六大数据技术分工——设计、数据采集、大数据架构、算法、用户交互及可视化,并具体解释了每个工种的定位及其在团队中的作用。在谈及大数据技术运用在城市形象指数建构中时,他介绍了大数据在处理非结构化数据方面的优势及具体技术,强调理论建构和机器学习之间需要不断互动以提升指标体系的可靠性。
之后,司徒洁亮经理剖析了理解大数据的三个关键词——数据、场景、价值。他认为,尽管我们有多元的方法获取数据,但针对用户来说数据仍然是不够的;而不同场景需要不同的模型去分析;大数据的价值体现在特征的提取和主题的聚类两个方面。
三位的分享给在场师生提供了不同的视角去看待大数据及其应用,也帮助大家较为全面地了解了大数据技术在城市形象指数研究中的应用。在互动环节,大家就城市形象指数的构建思路、机器处理自然语言的可靠性、数据挖掘后的垃圾信息清洗、大数据项目组的专业人员协调等多个方面进行了深入的交流与研讨。
(文/谢点;图/方振武)