上海大学引入特征选择方法使机器学习精度提升近6个百分点
怎样让机器越来越聪明?8月30日从上海大学传出信息:该校计算机研究人员创新性引入特征选择方法,使机器学习精度提高近6个百分点,为人工智能集成学习研究辟出新路。据悉,相关论文在刚结束的第九届亚太地区人工智能会议上获选“最佳论文”。
仅凭图像,住宅监控系统就能自动辨别谁是大楼居民,谁是不速之客;输入中文童话故事,转眼间电脑就“拍”出了以此为蓝本的动画片……随着人工智能研究的不断深入,如何进一步提升机器的学习精度,成为全球研究者共同关注的问题。
研究小组负责人、上海大学计算机学院副教授李国正介绍,如今在人工智能研究领域比较流行集成学习,这就好比在机器系统内开个“专家讨论会”。面对需要作出判断的对象,系统内多个学习程序同时启动,得出各自结论,然后“投票表决”,获得多数票的成为系统最终判断结果。如邮政信件自动分捡系统中,会有若干程序同时对“邮政编码”一栏里的手写数字进行辨认:到底是“1”还是“7”,“6”还是“5”?听“大多数”的。
如何让每一位“专家”作出更精准的判断,成为提升机器学习精度的关键之一。上世纪70年代已应用于人工智能领域的特征选择方法,进入研究小组视野。这种方法可在最短时间内筛选出对识别最具价值的特征信息,何不将其引入集成学习技术?研究人员据此构造出两种全新算法―――“PRIFEB”和“MIFEB”,按每个学习程序的“专家特长”,有针对性地分发学习对象的特征资料,帮助程序排除无用的干扰信息。数据集验证实验显示,全新技术获得的精度为79.84%,比对照组的73.89%提升近6个百分点。
专家指出,如将这一通用技术应用于网络搜索引擎,可使用户获得更多更匹配的搜索结果;应用于机器翻译系统,翻译更加接近“信达雅”;应用于指纹识别系统,准确率也会提高。
专家评点
第九届亚太地区人工智能会议匿名评阅专家:这一研究首次将人工智能集成学习技术与特征选择方法有机结合,提出了有趣的方法,其实验结果是可信的。