博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据领域的顶级开源工具大集合
阅读量:6588 次
发布时间:2019-06-24

本文共 784 字,大约阅读时间需要 2 分钟。

hot3.png

 随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。

    如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。

26142931_xBDX.jpg

  

    以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

    数据存储:

    Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt

    NoSql 数据库 – MongoDB, Cassandra, Hbase

    SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB

    开发平台:

    Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)

    Apache Lucene和 Solr平台

    OpenStack(构建私有云和公有云)

    Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)

    REEF(微软的Hadoop开发者平台)

    Storm(集成了各种排队系统和数据库系统)

    开发工具和集成:

    Apache Mahout(机器学习的编程语言)

    Python 和 R(预测分析编程语言)

    分析和报告工具:

    Jaspersoft(报告和分析服务器)

    Pentaho(数据集成和业务分析)

    Splunk(IT分析平台)

    Talend(大数据集成,数据管理和应用集成)

    以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

  原文:

转载于:https://my.oschina.net/duansheli/blog/306740

你可能感兴趣的文章
JEESZ-SSO解决方案
查看>>
RS-232、RS422和RS-485的区别和各自的实现方式
查看>>
Java程序员面试失败的5大原因
查看>>
深入理解Java的分级引用模型
查看>>
PyCharm入门教程——在编辑器中选择文本
查看>>
2.2 流程控制-for序列 2.3 流程控制-for字典 2.4 循环退出 2.5 流程控制-while
查看>>
多币种钱包开发:什么是工作量证明(POW)?
查看>>
kotlin使用mapstruct(二)
查看>>
树形结构的数据库表Schema设计
查看>>
“如何学习”系列文章2007年全部文章索引
查看>>
AlloyTeam|腾讯全端 AlloyTeam 团队 - HTML5开源图像处理框架AlloyImage
查看>>
判断两个List<Integer>是否包含同样的值,不考虑位置关系
查看>>
oracle数据库的重复数据处理
查看>>
Android推送通知指南
查看>>
Javascript 加载详解
查看>>
Android Arcface人脸识别sdk使用工具类
查看>>
hdoj_1711_Number Sequence
查看>>
android studio单个工程文件的代理设置
查看>>
Centos 查看 登录 登出 重启 日志
查看>>
Agent admitted failure to sign using the key
查看>>