共享直播间系统
据外媒报道,大数据公司 Cloudera 正在开发一个大型的开源储存引擎 Kudu,用于储存和服务大量不同类型的非结构化数据。预计本月底发布。
Kudu 将被当作目前广泛使用的 Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。
据说,Kudu 的扫描速度几乎和原生 HDFS 一样快,同时随机访问速度和 HBase 几乎一样快。不过,Kudu 并不打算替换掉 HDFS 或 HBase。Cloudera 未来也会继续支持 HDFS 和 HBase 。
Kudu 可用于时间序列数据,实时报告,模型构建。但它不是一个 SQL 查询引擎用来 pull 特定数据。Kudu 将集成 cloudera-impala” target=”_blank” rel=”nofollow”>Impala,未来也将支持 Spark。此外,Kudu 的 API 可以使用 Java 和 C++。