基于Docker的hbase-phoenix-all-in-one试用问题总结

一、docker hub上搜索phoenix镜像

安装命令:

进入容器bash:

执行sqlline:

二、存储笔记

经过验证,Phoenix的table,默认仅建立一个命名为0的Family Column,但是在创建表的时候可以将列分散到多个Family Column中。

三、性能测试

官网FAQ中讲述,在中等集群中,可以做到100M(一亿)条记录全表扫描仅需要用20S。

插入测试:但是博主在Windows10上使用Docker镜像测试,对于以下测试表,采用SSD硬盘单线程插入速度大概在每秒200个点左右,10线程的话,总计每秒接近700条记录左右。采用普通机械硬盘,10线程插入数量为500条记录。

count(*)测试:200万条记录时,count(*)需要用50-60秒;

select 单条:速度在0.3秒左右;

select avg()等1万条:速度在1秒左右;

测试表结构:

insert测试代码:

 

三、已知缺点

  1. sdk 语言仅支持Java和Python两种;
  2. Python版本目前不支持任何Array类型,但可以使用ARRAY_TO_STRING函数暂时代替,例如select id,ARRAY_TO_STRING(val,’,’)as val from ph_test_tb12;

参考链接:

  • https://python-phoenixdb.readthedocs.io/en/latest/
  • https://github.com/Boostport/hbase-phoenix-all-in-one/issues
分享到:更多 ()

留言板 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址