期刊发表网电话

全国热线
022-83699069

数据挖掘在股票方面的应用

作者: 发布时间:2020-01-19 13:34:55 阅读: 37 次

 

摘要:通过对数据挖掘方法的研究,实现其在股票方面的信息处理和数据预测,进而对从事股票相关工作和研究的人员提供新思路和工具。

关键词:数据挖掘;股票;预测。

                                   

 

数据挖掘的发展历史虽然较短,但从20世纪90年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还没有一个严格的定义,人们提出了许多数据挖掘的定义,一般来说数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这里所说的知识并不是指崭新的科学定理和数学公式,更不需要什么定理来证明。数据挖掘要解决的问题就是在庞大的数据中寻找有价值的隐藏信息,加以分析,并将这些有意义的信息归纳成结构模式,提供给有关部门在进行决策时参考。实际上,数据挖掘所有发现的知识都是相对的,是有特定的前提和约束条件,并面向特定的领域。数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用己有的数据对未来的活动进行预测。

1 问题的提出:

把数据挖掘应用的股票上有几个主要原因:

,股票本身的属性很适合数据挖掘的应用。股票本身的数据是离散的,数字的,有规律的,而且数量很大,原有的分析方法已经很成熟,急需一种新的分析方法,而数据挖掘正好是在大量数据中寻找有价值的信息,很适合作为一种新的分析方法。

第二,数据库系统经过数十年的发展,已经保存了大量的日常业务数据。随着数据库和各类信息系统应用的不断深入,数据量的日益积累,每年都要生成大量的数据,并成增量发展趋势。而大量的数据就是财富,数据挖掘正是有效利用这种财富的工具。

第三,近十年间,计算机技术的研究工作取得了很大的进展:首先是计算机的运算能力大幅的提高;然后是各种计算方法和新的技术指标逐渐出现;最后是各种数据挖掘技术的应用的成果很好的促进了其在股票方面的应用。

2.数据挖掘在股票方面应用的两个基本方向

数据挖掘在股票方面应用出现了两个基本的方向:1,是在股票信息方面的应用;2,是在股票数据方面的应用。

2.1股票信息方面的应用

这类的数据挖掘主要针对的是金融信息进行数据挖掘,主要分为数据采集,文本处理,数据挖掘算法处理,人工处理几个方面。

数据采集主要是在网上的各大金融网站和其下属的相关股票论坛,进行文字、字符、数据进行采集,采集上来的数据一般以文本模式保存。通过数据采集上来的数据要具有及时性,准确性,不重复性和固定的格式,这样才能更好的进行下面的处理。

文本处理方面,由于我们采集上来的信息主要以文本为主,那么就要通过对文本信息进行一定的处理,对于语言尤其是中文的处理主要通过以下几个步骤来进行:1,基础资源(包括中文词典,金融词典);2,词法分析;3,句法分析;4,语义分析。几个步骤。通过文本处理可以把大量无用的信息过滤掉,留下我们感兴趣的数据进行数据挖掘。

通过采集和文本处理的数据就可以进行数据挖掘了,主要方法就是神经网络方法和支持向量机技术。通过数据挖掘的信息在经过有经验的操作人员的处理就可以通过,关键词的褒贬意等方面的处理,给予现场股票操作人员一种新的参考资料。

2.2股票数据方面的应用

这类的数据挖掘主要针对的是股票数据本身进行数据挖掘,我们都知道股票最重要的数据就是股票的价格,那么每日的更高价、更低价、开盘价、收盘价、3日均价,5日均价,15日均价,K,D,J等等数据都是基本的数据,对这些数据进行挖掘也是很合适。

由于对于股票数据本身来说,就是数据的、离散的、有规律的,所以对它进行挖掘的方法也有很多,现在主要在使用的有决策树算法、神经网络算法、基因算法、基本统计分析方法、贝叶斯网络方法和关联规则算法。

但是需要承认的是,股市是一个非常复杂的系统,股价并不是完全依靠股市本身的信息来决定。像行为金融学中的“羊群行为”就不是由股票信息直接造成的。即使如此,我们仍然可以说,在日常股市交易中,假若投资者是理性的,那么通过对股价信息的数据挖掘的准确率是可以相信的。

3.结论

数据挖掘和股票在很多方面有着很好的适应性,但是由于影响股票价格不单单是数据本身,还有股市参与者的心理因素、政策、世界局势、突发事件等等无法利用数据来处理的因素,所以很难做到准确的预测股价等具体工作。但是作为一种辅助股票从业人员的工具来说,它可以大幅减少人工操作、筛选有用信息,还是很有实际意义的。