Alluxio,原名Tachyon,在早些时候获得了硅谷风投Andreessen Horowitz 750万美元的A轮投资。现在,该公司正在推出第一个基于其开源的以存储为中心的分布式存储系统的商业产品。
Alluxio旨在解决的问题是,大多数企业每天都在创建大量的数据,他们经常将它们存储在一些存储系统和云上。为了从这些数据中获得价值,他们必须将所有的这些信息结合在一起来进行分析,但是如果你的数据存储在不同的系统中,很难做。
Alluxio 是一个高容错的分布式文件系统,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。它使用分层存储架构,将最常用的数据缓存在内存中,在SSD和传统硬盘驱动器上使用较少使用的数据。可以认为Alluxio是一个非常复杂的大数据工作负载缓存,并有类Java的文件API、兼容Hadoop MapReduce和Spark、底层文件系统可插拔等特性。Hadoop文件系统已成为在许多(通常是数千)机器上存储大量数据的标准。
Alluxio正在推出企业版和社区版的测试软件。像大多数开源项目一样,Alluxio通过销售支持和高级功能来获利。在Alluxio的企业产品下,这些附加功能包括更好地支持高可用性设置,企业安全和数据复制等等。
社区版是免费提供的,但是和通常的模式有点不同,这个版本也经过认证和测试,并配备了所有必要的驱动程序,以访问广泛的文件系统(像Amazon S3,Google云存储,OpenStack Swift,Red Hat Ceph,华为FusionStorage等)和计算框架(包括Apache Spark,Apache Hadoop和Apache MapReduce)。和企业版一样,社区版还具有Alluxio的Web界面,用于管理服务。无法免费获得的唯一主要功能(除了支持)是复制支持和Kerberos身份验证。