7月4日下午,应我室杨恺教授的邀请,美国阿肯色中央大学盛胜利教授来我院作学术报告,并与师生在嘉定校区智信馆305会议室进行了学术交流及研讨。
报告会上,盛胜利教授作了题为“Cost-Sensitive Feature Value Acquisition in Testing”的学术报告。盛教授首先介绍了其科研团队的研究方向——多标签学习、主动学习、众包机理学习,并针对“代价”这一报告主题,通过病人在医院身体检查的代价真实案例,引出此次报告的主要内容。在医学诊断中,医生必须经常确定应该为患者安排什么样的医学检查(如X光检查、血液检查),以尽量减少医学检查和误诊的总成本。盛教授研究团队设计了基于成本代价敏感的机器学习算法来模拟和学习这样的诊断过程。不同的医学诊断手段就像机器学习中不同的数据属性,其值可以以成本(属性成本)获得,而误诊就是可以看作错误分类,导致病人后续成本花费巨大。为了解决此问题,盛教授团队提出了一种延迟决策树学习算法,该算法最大限度地减少了属性成本和错误分类成本的总和。并设计了几种新的“测试策略”,可以要求以一定的成本获得未知属性的值(类似于医生以一定的成本订购医疗测试),以最小化测试示例(新患者)的总成本。这些测试策略对应于现实诊断中的不同情况。对这些测试策略进行了实证评估,结果表明它们是有效的,并且优于以前的方法,测试结果可以很容易地应用于实际的诊断任务。最后,盛教授对决策树的价值挖掘与有效利用提出新的研究思路对其他实际应用进行了前景展望。
盛胜利教授的报告内容深入浅出,对我院师生从事机器学习研究有着重要的启发作用。报告结束后,展开了热烈的交流互动,盛教授对在场师生提出的问题均做了详细解答,现场气氛热烈,师生受益匪浅。双方表示在今后的科学研究中加强联系,进行更深入的合作。
盛胜利(VICTOR S. SHENG)教授是美国阿肯色中央大学计算机科学系教授(终身教职)和数据分析实验室主任。研究领域为数据挖掘与机器学习、人工智能、数据安全和决策支持。主持或共同主持美国自然科学基金、加拿大自然科学与工程研究基金等12项。在数据挖掘和机器学习的顶级期刊如TPAMI、TKDE、JMLR、TMM、TNNLS和DMKD等,以及顶级会议如IJCAI、KDD、ICML、AAAI、ECML、ICDM、DASFAA、ACM MM、ICMR、ICME、CIKM等上面共发表研究成果论文130余篇,其中CCF推荐的A类期刊和会议论文30余篇,谷歌学术统计单篇论文被引用最高达820余次,累计被引用3890余次。2018年荣获ICCCS大会最佳论文奖和杰出贡献奖; 2015年荣获WISE最佳学生论文奖Finalist;2011年荣获ICDM大会最佳论文奖;2008年荣获KDD大会最佳论文奖亚军;2008年机器学习研讨会Google学生奖;2006年荣获IEEE Kitchener-Waterloo知识和数据挖掘联合研讨会最佳海报奖。