设置主页 加入收藏 保存到桌面
当前位置首页论文经济论文优秀经济统计学校毕业论文范文

优秀经济统计学校毕业论文范文

鉴宝神话围观:℉更新时间:2021-12-19 13:26:20

优秀经济统计学校毕业论文范文

这是一篇经济统计论文,经济统计工作是搜集、整理和分析国民经济数量资料的工作过程;经济统计资料是经过搜集、整理和计算分析以后所得的反映国民经济现象数量方面的各种统计数据。(以上内容来自百度百科)今天为大家强烈推荐一篇经济统计论文,供大家参考。优秀经济统计学校毕业论文范文第一篇第一章绪论1.1研究背景与意义随着互联网的高速发展,web信息正呈现着爆炸性的增长。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。尤其是近年来社交网络的兴起,大量的UGC(即用户生成内容)文本信息、音频、视频、图片等非结构化数据正在爆增。在互联网上,天的时间里,新浪微博用户所发的微博量超过1亿条,Faceboo能产生32亿条评论、3亿张照片,信息量达10TB;对Twitter而言,一天代表新增2亿条微博,约有50亿个单词,比纽约时报60年的词语总量还多一倍,信息量达7TB;而百度大约要处理数十亿次搜索请求,淘宝网站的交易达数千万笔。这所有也标志着大数据时代的到来。蕴藏着如此多信息的互联网环境犹如一个海量且资源丰富的社会信息资源库。无论搜索引擎还是电商,从传统行业数据库到商业系统数据仓库,每天都会产生大量的数据,这些数据里面涵盖了一些十分有价值的信息,挖掘出这些价值可以直接或间接为企业和机构带来利润,同时为人类的生活带来更多便利。一直以来,互联网用户都试图利用传统的通用搜索引擎来获取有价值的信息。面对这一海量、异构、半结构化的信息库,传统的通用搜索引擎通过抽取网页中关键字信息,只能给予页面级的排序和检索,往往还需要用户经过多次査询和蹄选才能获取到最终需要的信息。尤其是很多情况下,用户感兴趣的是一些特定的对象而非网页。为此,基于对象的垂直搜索引擎应运而生。1.2本文的研究工作本文主要研究如何利用统计主题模型对学术网络包括其中的会议、作者和论文信息进行建模,并挖掘学术网络中的语义关联信息,通过这种挖掘到的潜在语义主题为桥梁,将学术网络模型应用于学术检索,包括专家检索、会议检索、论文检索,可实现根据查询词得到语义相关的专家、会议和论文。具体的研究要点如下:(1)提出一种新的统计主题模型Author-Conference Topic-Connection(ACTC)。基于学术网络中会议、作者和论文各个对象中隐含的语义信息,将这些异构对象分别映射到相应的语义主题层,从而实现对学术网络对象的统一语义建模,并且挖掘出网络对象中隐含的语义信息以及相互之间的语义关联。(2)将ACTC模型应用于学术检索,包括专家检索、会议检索、论文检索。ACTC模型能够更有效地挖掘学术网络对象之间的语义关联信息,通过挖掘到的潜在语义主题为桥梁,可实现根据查询词得到语义相关的专家、会议和论文。此外,还与几种常用的统计主题模型和统计语言模型进行了学术检索实验的对比分析,包括统计语言模型 LM、Latent Dirichlet Allocation(LDA)、Author-Topic(AT) Model 以及 Author-Conference-Topic(ACT) Model。(3)利用ACTC模型构建计算语言学领域的学术网络检索系统ACLMiner。该系统利用ACTC模型为国际上计算语言学研究领域中的学术对象进行统一建模,并挖掘所有论文、专家和会议的语义信息,从而为用户提供权威论文、专家以及会议的语义检索服务。第二章相关研究工作2. 1学术网络与对象建模的研究学术网络作为典型的异构社会网络,其中的学术信息数据正呈现飞速增长。例$口,图2.1描述了一个异构学术网络的例子。它主要包括了作者、会议和论文这些类型不同的对象信息。对于作者,可以通过其主页信息以及其发表的论文、参加的会议信息来进行描述;对于论文,则可以用论文的标题、作者、摘要以及所投的会议等进行描述;对于会议,则可以用该会议所收录的论文来表示。相应地,各种学术网络的应用系统也相继被开发。例如著名的DBLPCDigital Bibliography Library Project)系统目前收录的文献已经超过了 2 100 000篇,同时DBLP只提供计算机领域的英文文献搜索服务。与之互补的是,由中国人民大学网络与移动数据管理实验室(WAMDM)开发的C-DBLP系统,该系统集成了国内现有权威计算机期刊、会议的中文文献数据,为用户提供以文献作者为中心的检索服务,如今收录的计算机类文献和作者都已超过50000条。此外,还有CiteSecr和Google Scholar等。但这些系统大多数都只是基于一元语言模型来对文档进行建模,检索时并未考虑到学术信息中的语义主题。2. 2统计主题模型的研究进展统计主题模型起源于潜在语义索引,是近年来文本挖掘中研究的热点之一。自LSA、PLSA和LDA等模型诞生以来,越来越多的研究工作开始围绕统计主题模型来展开,并用于解决很多文本挖掘、自然语言处理和信息检索等问题。与传统的空间向量模型和语言模型不同,统计主题模型巧妙地引入了语义主题的概念,从而实现了文本在隐含主题层上的表示,每一个语义主题又可以表示成一个在词语维度上的概率分布。通过对文本中隐含的语义主题进行建模,统计主题模型具有以下两大好处:成功地解决了海量文本挖掘中的降维问题。在海量数据挖掘中最容易遇到的一大挑战是高维度挖掘。当文档釆用传统的词语级空间上的向量表示时,文本信息量越大,词语级的向量空间维度则越大,则容易导致可用数据(即真正表述文本语义的数据信息变得稀疏,很不利于文本分析。这也被称为维数的灾难;。统计主题模型通过引入语义主题维度,将文档表示成主题维度上的概率分布,而非词语级的空间向量,由于文本集合中隐含的语义主题数量远小于词语数量,从而实现了文档的降维表示。第三章学术网络对象的语义建模........... 143.1引言 ..........143.2学术网络的对象建模.......... 163.2.1 ACTC模型的提出.......... 173.2.2 ACTC 模型.......... 183.2.3 ACTC模型的参数估计.......... 203.2.4将ACTC模型应用于学术检索 ..........223.3实验 ..........233.3.1数据集以及预处理..........233.3.2 ACTC模型的训练.......... 243.3.3学术检索实验.......... 283.3小结 ..........31第四章学术网络检索系统ACLMiner.......... 324.1引言 ..........324.2学术网络检索系统ACLMiner.......... 334.2.1系统框架图 ..........334.2.2学术检索的系统展示.......... 354.3小结.......... 39第五章总结和展望.......... 405.1总结.......... 405.2下一步研究工作.......... 40第四章学术网络检索系统ACLMiner4.1引言上一章主要介绍了本文提出的ACTC模型以及学术网络对象的建模与应用,接下来,我们将利用ACTC模型构建一个计算语言学领域的学术网络检索系统,并提供针对学术网络对象的基于语义的检索服务,包括专家检索、会议检索和论文检索。随着近年来学术网络信息资源的快速增长,尤其是计算语言学领域,它作为新兴的交叉学科研究领域,也取得了长足的发展。国际计算语言学学会(The Association for Computational Linguistics, ACL) [42]也专门建立了国际上计算语言学领域的相关研究论文与会议的语料库ACL Anthology[43]。此外,ACL还根据ACL Anthology中的语料构建了一个学术网络ACL Anthology Networ (AAN) _,用于研究学术网络中的作者引用、论文引用等引用关系以及合作者之间的关系,并能为用户提供简易的基于单词匹配的学术查询。结论统计主题模型与对象检索尤其是专家检索,均是目前计算语言学领域的重要研究问题。面对海量、异构的学术网络,如何有效地挖掘其中的语义信息并应用于网络对象的检索也正变得尤为重要,其中对学术网络对象进行建模是十分重要的一步。本文则是研究学术网络中的对象建模问题,利用统计主题模型能够挖掘隐含语义主题信息的特点,提出了一种新的统计主题模型,用于更准确地挖掘学术网络中对象的语义信息,将作者、会议与论文对象均映射到各自的语义主题层上,并得到相互之间的语义关联信息,从而应用于学术网络中的对象检索。参考文献(略)优秀经济统计学校毕业论文范文第二篇第一章 绪论1.1 论文研究的背景近年来,随着 IT 行业、互联网的快速发展,中国银行业逐步完成了银行业务的电子化、信息化建设。目前,中国银行业的主要业务依托着各自开发的各类业务系统和应用支撑,发挥着重要的作用。在全球化发展的大背景下,中国银行业的金融业务由起初较为单一的资产、负债业务发展成为门类齐全、业务种类的丰富的金融业务。特别是近些年来,随着国际金融危机的蔓延,金融机构的不断增设,银行业间的竞争日趋激烈。如何正确决策银行业的发展方向,如何保证银行业业务发展的安全性,如何保证银行业的健康发展已成为急需解决的问题。统计分析工作在银行内部管理和宏观决策中发挥着重要作用。全面和有效的指导银行正常运转,是统计分析一项重要工作职能。数据库技术是银行各项业务系统使用的一项基础技术。随着数据库技术的发展,银行业对数据库对数据处理以及需求分析越来越高,不仅要求处理出令人满意的结果,还要应用到商业决策。由于,银行早期缺乏系统建设的规划,银行内部系统和应用众多,而又缺少联系,随着管理层对数据需求的不断变化,业务统计人员,很大程度上依靠手工完成数据的收集,汇总。如何从大量的数据中准确,及时的统计数据,为企业提供决策依据呢? OLAP,是有效的解决方案。.............1.2 开展数据统计分析工作的基础及存在的问题一、 银行数据统计的分析现状银行经营指标数据的统计是一项十分重要的工作,它需要将银行业的各项业务经营指标数据进行收集,整理,并加工成各种反映银行经营运营状况的指标,提供给管理决策层,用于分析机构的运营状况和业务的发展趋势。近年来,随着计算机技术的发展,商业银行开发了大量的统计经营分析系统和应用。从国内情况来看,早些年,中国工商银行的数据统计采用自下而上;层层汇总的形式。通常是基层银行分支机构(支行一级)收集数据,上报其上级二级分行,再上报至一级分行,最后在总行层级汇总。2002 年以后,中国工商银行开发了 CS2002 应用系统,系统会按日定期对银行内部业务系统的产生数据收集,隔日(T+1)生成全行各级机构的各类业务报告,包括业务状况表、资产负债表、利润表等。可以说中国工商银行的 CS2002 为该行后续的数据集市、数据仓库的建设奠定了良好的基础,但是由于中国工商银行原始数据积累有限,技术及相关人才的匮乏,在数据挖掘、数据分析运用等方面存在很多不足。目前国内商业智能应用尚不成熟稳重,实施商业智能的企业数量极少,即使采用商业智能的企业也仅限于小规模的应用,全面的企业级应用几乎为空白。第二章 银行小型经营统计分析系统的相关技术概述2.1 OLAP 技术的概述1985 年,E.F.Codd 发明了术语联机事务处理(;On-line Transcation Processing,OLTP),并提出了 12 条定义 OLTP 数据库的标准。他的学术和标准被广泛地接受,并且成为用来管理公司日常操作(事务)数据库的标准。1993 年,Codd 提出了术语联机分析处理;(On-line Analytical Processing,OLAP),并且提出了 12条定义 OLAP 数据库的标准。这一次,他的标准并没有得到广泛地认可,但术语OLAP 得到了认可,可见它十分适宜描述多数制定决策(分析)的数据库。OLAP(On-line Analytical Processing)即联机分析处理,是以海量数据为基础的发杂分析技术。OLAP 能够帮助各级管理人员,从不同的角度、不同的维度,从数据仓库中调用需要分析的数据进行分析和处理,给决策人员提供简易易懂的数据分析结果。从而为管理层和决策层掌握企业和业务发展情况提供有力的参考依据。OLAP 也被称为称为多维数据分析,它的技术的核心是维;,与传统的OLTP(On-line Transcation Processing)处理应用相同。OLTP 应用主要是作用是用户的事务处理,对响应的时间要求较高。而 OLAP 的应用主要是对用户数据进行分析,对响应时间要求较低。2.2 数据仓库的概念和特征2.2.1 传统数据库与数据仓库的差别随着计算机技术的飞速发展和广泛地应用于各行各业,事务处理型系统已有相当成熟稳重的应用,并有效地解决了企业部门的日常事务。在实际运行中,企业的事务处理型系统积累了大量的业务数据。这些数据中隐含着大量的珍贵信息可应用于管理层制定企业的战略方针和决策依据。因此,企业产生了对事务处理型数据进行分析和挖掘的需求。到这里,我们可以看出存在两种不同的数据处理方式,一种为事务处理型操作也叫操作型处理即 OLTP(联机事务处理),另外一种为分析型处理即 OLAP(联机分析处理)。操作型处理主要完成对数据库的增删改查等操作,系统要求对用户的需求进行快速响应,对数据的安全性以及事务吞吐量要求很高。传统的数据库能够很好满足和适应操作型处理的特点。分析型处理是对历史形成的数据进行查询和统计分析,对系统的数据访问十分大,操作较为复杂,而对响应时间要求较为宽松。由于操作型处理和分析型处理存在较大的差异,传统的数据库无法满足分析型处理的需求。为了解决该问题,数据仓库就应运而生。传统数据库和数据仓库的差异直接体现在其所应用的处理方面操作型处理和分析性处理的区别。第三章 银行小型经营统计分析系统的需求分析...... 223.1 农行西藏分行经营统计工作中需要解决的问题.... 223.2 农行西藏分行经营统计分析系统的核心需求分析...... 233.2.1 资产业务 ...... 233.2.2 .负债业务 ...... 233.2.3 中间业务 ...... 243.2.4 资金头寸管理 .... 253.2.5 .绩效考核管理 .... 263.3 本章小结........ 26第四章 系统总体设计........ 274.1 数据仓库的设计........ 274.1.1 业务数据理解和需求分析 ........ 274.1.2 分析主题和元数据 ........ 284.1.3 粒度的设计 ........ 304.1.4 维度设计 ...... 314.2 系统的功能模块设计...... 314.2.1 数据采集功能模块 ........ 324.5.2 数据计算功能 .... 354.5.3 数据转换功能 .... 374.5.4 数据展示功能 .... 374.3 本章小结........ 38第五章 银行小型经营统计分析系统的实现........ 395.1 银行小型经营统计分析系统架构.... 395.2 银行小型经营统计分析系统的核心子系统实现.... 435.3 银行小型经营统计分析系统 OLAP 设计 ......... 525.4 本章小结........ 54第六章 系统测试在银行经营统计分析系统中,OLAP 是通过数据统计分析人员端的浏览器展示给用户的。如前所述,数据统计分析人员,通过前端的网页,选择所需访问的报表和数据后,系统会将用户的操作信息以 HTTP 报文形式传送到服务器上。服务器根据系统内已设置的角色以及用户的权限,将请求提交到 OLAP 上。之后 OLAP 将在数据仓库中保存的多维立方体数据,根据统计分析人员的 要求进行数据的转换和计算。再将数据的计算结果反馈给服务器,并最终返回到统计分析人员的浏览器上,完成一次完整的 OLAP 分析过程。结论银行经营统计分析系统开发后,为全行的统计分析工作带来了极大的便利,通过 B/S 架构方式,统计分析人员能够很方便地通过浏览器维护和访问、分析所需的业务经营数据。而且通过系统支持的 OLAP 能够自由地获取所需的各项业务经营指标。使用数据仓库技术后发挥了历史数据的价值,为全行的经营决策提供了较为准确的依据。该套系统上线测试后,主要解决了问题:1.建立统一的数据披露平台,从而使全行的各项业务数据使用规范化和统一化;2.建立各二级分行的数据平台,按照机构设置情况,向下钻取并细化业务分区,全面分析全行业务的数据来源;3.将全行经营 PI 从各业务系统抽取出来,集成到统一的数据披露平台;4.有效利用形成的历史数据,为测算模型和趋势分析提供基础;5.通过联机分析处理和数据挖掘等手段,能够自由地业务经营情况进行相关分析。通过解决以上问题后,我行经营分析从横向的广度到纵向的渗透性以及分析的效率等各方面均能质的飞跃实现,为全行的业务发展能够提供较为准确、快捷、客观的决策参考依据。参考文献(略)优秀经济统计学校毕业论文范文

标签:历史