邢台数据分析培训,为什么选择R语言做统计分析
大数据技术是互联网公司发展起来的,互联网金融将??大数据应用推向了一个新的发展阶段。但银行数据与互联网数据相比,复杂度更高。银行历经多年的发展,在数据分析领域已形成了很多成熟的技术,并没有那么容易被新技术完全替代,所以大数据应用还是会有一个过程
R语言是S语言的一种开源实现,一种用于数据分析和图形化的编程环境。资深分析师Catherine最近撰文结合自己的实践经验详细介绍了R语言的优点和缺点。
Catherine指出,R主要用于做统计工作。你可以把它看成是像SAS Analytics分析系统的竞争者之一,R如此强大,诸如StatSoft STATISTICA 或者 Minitab与R相比,就不值一提了。
许多专业的政府部门、商业和制药行业的统计人员和方法论者把他们的事业都倾注在了IBM 的SPSS或者是SAS上,但是他们并不用写一条R代码就能用。所以,从某种程度上来说,决定去学习R是一个事关企业文化和你如何去工作的问题。我在我的统计咨询实践中使用好几种工具,但是我所用的大部分都是R。
关于R语言的优点,Catherine列举了若干条:
R是一个强大的脚本语言。我最近被邀请去分析一次概略研究的结果。这些研究者翻阅了1600篇研究论文,并把这些内容用几种标准来编码——事实上是大量的标准,并且这些标准还包括多个选项和分支。他们的数据曾经放到微软的Excel表格中,这表格中居然包括8000列,然后这些列大多是是空的。这些研究者们想要在不同的类别和标题下对总数进行压缩,R是一种强大的脚本语言,它能够像Perl的正则表达式一样来处理文本。凌乱的数据需要编程语言这样的资源,尽管SAS和SPSS有处理那些超越下拉菜单任务的脚本语言,但是R是被用作一门编程语言来写的,因此,对于这一目的,R是一种更好工具。
R领导新的方式。许多新的统计学方面的产品在成为商业平台之前,最初是作为R的包而出现的。我最近得到关于病人回访的医学研究的数据。对于每一个病人,我们有医生曾经建议的治疗条目的数量,同时也有病人实际记住的条目数量。自然模型是β-二项分布。自20世纪50年代以来,这一点已经被广泛熟知,但是把估计程序与感兴趣的协变量关联起来却是最近的事情。通常,像这样的数据都要用一般估计方程来处理,但GEE方法是渐进的,并且假设前提是样本足够大。我曾经希望R能够拥有处理广义线性模型与β-二项式的能力。恰好最近的一个包估计了这个模型: Ben Bolker所写的β-二项式。SPSS都没有完成这个功能。
与文档整合在一起发布。R能够很好的与LaTex文档发布系统整合在一起,这意味着来自于R的统计输出和图形可以嵌入到可出版级的文档中。这并不是适合每一个人,除非你想写一本关于数据分析的书,或者你是不喜欢把你的结果拷贝到一个字符处理文档中,最短和最优雅的途径是通过R和LaTex来实现。
没有花费。作为一个小企业的老板,我很喜欢R是免费的这一特点。甚至对于一个大企业,要知道你可以带一个有临时基础的人来,然后快速的让他们坐到工作站旁来使用领先的分析软件是一件很美妙的事情。没必要担心预算问题。
邢台数据分析培训,R语言培训,QQ:1563591818
官网:http://www.hbcpda.com
联系人:李文雅(业务)
手机:13393211060
邮箱:419510645@qq.com
*您的姓名:
*联系手机:
固话电话:
E-mail:
所在单位:
需求数量:
*咨询内容: