目前的人工智能发展迅速,人工智能的应用带给人类很多方便,提高了生产率,加速了生活和学习的节奏。各种人工智能的研究日趋完善,诸如模式识别、神经网络、进化计算、人工免疫学,这四个研究方向代表着人工智能的四大研究方法,利用这四种方法将人工智能学科推进到很广阔的发展前景。随着大数据时代的到来,神经网络的研究又将进入新的高潮期;而进化计算的领域应用仿生学思想,应用遗传算法,可以使得问题求解更加精确或者得到优化;人工免疫学是个新型的自然科学,具有广阔的研究前景,势必带给人类和社会广泛的应用。上述的四大方法既有联系又有区别,有自己独特的解决问题的方法和观念,也可以相互结合达到更好解决问题的目的。
数据分类预测问题是一个很重要的议题,在大数据时代显得更加重要。很多生活中的问题都离不开数据分类预测问题,数据分类预测很有意义。例如,淘宝网进行商品类目整合和分析离不开数据分类,意大利葡萄酒的研究离不开数据分类,做股票的近期涨跌预测也是一种数据分类预测问题。
目前各行各业要处理大量的数据,数据量庞大,数据信息包含内容众多,数据类型具有多样化和高度复杂的特点,大数据的定义应运而生。大数据研究兴起时就被认定为是各大行业的决定因素,因为经过对数据的收集、处理、特征提取、算法研究、数据共享等操作,人们可以更深入地感知世界,更好地体验社会的进步和科技创新。目前,大数据云计算的研究成为很重要的领域,其数据分类预测研究成为极具竞争力的研究方向。本文研究了游戏评价数据的分类预测问题,用不同方法进行数据分析和数据挖掘,打下大数据研究的坚实基础。
本文从数据表示与处理开始研究,涉及三种数据形式。第一种是数值形式数据;第二种是非结构化数据;另外一种是图像数据,是图片的形式。
对于文本数据,主要进行了模式识别的理论研究,并对游戏数据进行分类预测;进行了神经网络方法研究,并用于游戏评价文本数据的分类;设计了遗传免疫优化算法,降低游戏评价文本数据的预测误差;研究了支持向量机,并用支持向量机对游戏数值数据和非结构化数据进行分类预测研究。对于游戏评价的图像数据,对归类算法进行改进,用于图像数据的特征提取和分类预测。
提出了基于SVM的数据决定因素权值找寻法,通过几组实验结果的比较验证了此方法的正确性。提出了基于大数据样本的有用信息提取方法,从分类正确率角度通过实验验证了此方法的可行性。提出了基于中位选民定律和SVM的预测方法等,具有很高的分类正确率。实验结果表明,这些新方法具备一定的明显优势,节约运行时间,提高了分类预测的正确率。