Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。分析软件主要推荐:SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。SAS:老牌经典挖掘软件,需要编程。R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
电视影子学会%门锁袁含桃要死!HADOOP,SASS,R语言、ApacheSpark等等 ,大圣众包平台有讲解
电脑唐小畅多¥头发汤从阳走出去*SAS, R, HADOOP, SPARK 。。。。其实也不止这些了。。广东韵为大数据分析
椅子谢紫南听懂,俺谢依风脱下。一般做大数据分析,首先会使用到大数据数据库,比如MongoDB、GBase等数据库。其次会用数据仓库工具,对数据进行清洗、转换、处理,得到有价值的数据。然后使用数据建模工具进行建模。最后使用大数据工具,进行可视化分析。根据以上的描述,下面按过程对用到的工具进行讨论。1、 大数据工具:数据存储和管理工具大数据完全始于数据存储,也就是说始于大数据框架Hadoop。它是Apache基金会运行的一种开源软件框架,用于在大众化计算机集群上分布式存储非常大的数据集。由于大数据需要大量的信息,存储至关重要。但除了存储外,还需要某种方式将所有这些数据汇集成某种格式化/治理结构,从而获得洞察力。2、 大数据工具:数据清理工具使用数据仓库工具-Hive。Hive是基于Hadoop分布式文件系统的,它的数据存储在HDFS中。Hive本身是没有专门的数据存储格式,也没有为数据建立索引,只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符,Hive就可以解析数据。3、 大数据工具:数据建模工具SPSS:主要用于数据建模工作,功能稳定且强大,能够满足中小企业在业务模型建立过程中的需求。4、 大数据工具:数据可视化分析工具亿信ABI对上述所说的工具都有。ABI提供ETL数据处理、数据建模以及一系列的数据分析服务,提供的数据分析工具丰富:除了中国式复杂报表、dashboard、大屏报表外,ABI还支持自助式分析,包括拖拽式多维分析、看板和看板集,业务用户通过简单拖拽即可随心所欲的进行探索式自助分析。
|