某网广告平台展示的数据指标包含两类:曝光类(包括曝光数、点击数、点击单价、花费),转化类(包括转化下单数、转化下单金额、转化付款数、转化付款金额)。前一类的数据主要由流量方以接口的方式提供(比如对接的腾讯广点通平台),后一类则是某网特有的数据,通过买家的浏览、下单、付款日志算出来。
【问题1】
该平台采用了典型的Lambda架构形式,架构图如图所示。图中,(1)(2)(3)分别是哪三层。
【问题2】
典型的大数据架构,除了Lambda架构之外,还有Kappa架构,这两个架构的区别如下表所示,请补
充表中空(1)-(4)
【问题3】
该平台目前的架构存在两个问题,
第一,其数据处理层比较简单,性能的瓶颈在Java服务层。服务层需要关联两张MySQL表,查询过程
很复杂。
第二,实时数据只对接了内部的Kafka消息,没有实时的获取第三方的曝光、点击、浏览数据。请问应该如何改进这两个问题?