StarRocks UDF 需求搜集与反馈

社区里有没有已经用上 UDF 的同学可以提供我们一些反馈?我们想了解一下大家使用 UDF 的场景和性能的表现情况,是否满足你们的需求。

2赞

使用了UDF,做业务处理用的漏斗、留存这样的业务, 性能比较差–即使和presto相比,而且稍微复杂的查询会导致be节点CPU负载过高且不释放

1赞

UDF 还是 UDAF 性能差

udaf的性能比较差,UDF的话 暂时没有太多使用

CPU 消耗比较多主要是因为 full gc导致的,我们在2.3优化了一下高基数group by
你有测试环境吗,测一下我们2.3分支UDAF性能

https://github.com/StarRocks/starrocks/pull/6082

另外你能提供一个Demo吗,我也实测一下

分组键的去重数才4800+

我问下leader 代码是否可以分享

leader 暂时不太同意分享代码 有没有其它方式呢

你有测试环境吗,测一下branch-2.3的

哈哈 从3月份开始做产品 就在等java UDF UDAF的功能 这如果还要等branch-2.3 还不确定要多久呢

branch-2.3分支已经拉出来了,你可以测一下试试

https://github.com/StarRocks/starrocks/tree/branch-2.3

1、能不能udf里面支持sr自带的函数
2、sr自带的函数,现在是有固定的默认值,比如字符串函数,执行失败是null,能不能自己传入函数执行失败的默认值更灵活?

1赞

建议参考presto 实现通用的上下文State 我自己定义的 每次都是自制粘贴 因为定义一次就够用了

继承一个通用的State是不是也能达到同样的效果?