Flink SQL 实战:广告点击流和曝光流的场景应用 有更新!

本文主要介绍在流式场景中 join 的实战。大家都知道在使用 SQL 进行数据分析的过程中,join 是经常要使用的操作。在离线场景中,join 的数据集是有边界的,可以缓存数据有边界的数据集进行查询,有Nested Loop/Hash Join/Sort Merge Join 等多表 join;而在实时场景中,join 两侧的数据都是无边界的数据流,所以缓存数据集对长时间 job 来说,存储和查询压力很大,另外双流的到达时间可能不一致,造成 join 计算结果准确度不够;因此,Flink SQL 提供了多种 join 方法,来帮助用户应对各种 join 场景。

阅读全文 »

短语匹配(LCS)在SEO中的运用 有更新!

对于公司的层面而言,SEO往往是一个很悲催的角色,因为SEO这一块很少会得到重视。这往往不是取决于SEO流量在网站的占比、SEO人员的能力等等,而是几乎所有人都觉得,SEO就是没法做出什么事情的。因此很多公司认为SEO是网站应该有的一个职位,仅此而已。

阅读全文 »