智能广告系统架构

  • 智能广告系统架构

  • 图:智能广告系统架构

    从业务上看,整个智能广告系统,主要分为:
    1)业务端:广告主的广告后台
    2)展现端:用户实际访问的页面

    业务端,广告主主要有两类行为
    1)广告设置行为:例如设置投放计划,设置地域,类别,关键字,竞价等
    2)效果查看行为:例如广告展示次数是多少,广告点击次数是多少等

    展现端,用户主要也有两类行为
    1)站点访问行为:用户浏览实际的信息,此时广告系统决定出广告主的什么广告
    2)广告点击行为:此时广告系统会对广告主进行扣费

    从系统分层架构上看,智能广告系统,主要分为三层:
    1)站点层:用户和广告主直接面向的网站站点
    2)服务层:为了实现智能广告的业务逻辑,提供的通用服务,此处又主要分为四大类服务:
    2.1)策略服务:实施广告策略
    2.2)检索服务:可以理解为一个纯检索系统
    2.3)计费服务:用户点击广告时进行扣费
    2.4)反作弊服务:不是每次点击都扣费哟,反作弊服务对广告系统至关重要,但由于反作弊服务功能相对比较独立,和广告业务看似关系又不大,故未在架构图中画出
    3)数据层:用户数据,广告数据,竞价数据,日志数据等等等等

  • 智能广告的业务流程
  • 光讲架构不直观,下面通过一系列的例子,帮助大家更好的理解智能广告,以及智能广告系统。
    步骤一:广告主在业务端投递广告
    广告主登录业务端后台,设置了,今日投放地域是“北京-上地”,投放类别是“租房”,定向人群为“女”,需要推广的广告是他发布的一条“房屋出租”的帖子,竞价设置的是0.2元,单日预算是20元。
    这些数据,当然通过业务端存储到了数据层,即数据库和缓存里。

    步骤二:用户来到了网站,进入了“北京-上地-租房”类别,广告初筛实施
    咦,用户产生了点击行为,网站除了展示应该展示的内容,还要展示广告哟。
    首先被展现的广告不能太离谱,太离谱用户也不会点击。
    于是先必须符合“语义相关性”,即基础检索属性必须是符合的(广告能否满足用户的需求,满足了点击率才高嘛),这个工作是通过BS-basic search检索服务完成的。BS检索服务到数据层拉取了“北京-上地-租房”的所有广告帖子。

    步骤三:用户属性与广告主属性匹配,广告精筛实施
    步骤二中,基础属性初筛了以后,要进行更深层次的策略筛选(用户能否满足广告的需求),例如有些广告主的精准需求为“女”(可能房主比较爱干净吧),有些广告主的精准需求为“用户年龄为30岁以下”,有些广告主的精准需求为“用户访问IP必须是北京”,等等等等。系统将初筛出来的M条广告和用户属性进行匹配筛选,又过滤掉了一部分,最后剩余N条待定广告。这些工作是在AS-advanced search策略服务完成的。

    步骤四:综合排序,并返回TopX的广告
    经过步骤2和步骤3的初筛和精筛之后,待选的N条广告既能满足用户当前的需求,用户亦能满足广告主的筛选需求,但实际情况是,广告位只有3个,怎么办呢?就需要我们对N条广告进行综合打分排序(满足平台的需求,广告平台要多赚钱嘛)。
    打分排序的依据是什么呢?
    有人说按照竞价排序bid,出价高的打分高;
    有人说按照CTR点击率排序,CTR高的点的人多;
    都只对了一半,出价高,但没人点击,广告平台没有收益;点击率高,但出价低,广告平台还是没有收益;综合一下,最终应该按照广告的出价与CTR的乘积作为综合打分排序的依据,bid*CTR。
    既然bid*CTR是所有广告综合打分的依据,且出价bid又是广告主实现设定好的,那么实际上,问题的核心又转向了广告CTR的预测,CTR预测是推荐系统、广告系统、搜索系统里非常重要的一部分,是一个工程,算法,业务三方结合的问题,本文就不展开讨论了。
    无论如何,N条广告,根据bid*预估CTR进行综合打分排序后,返回了打分最高的3个广告(广告位只有3个)。

    步骤五:展现端展示了广告,用户点击了广告
    展示了广告后,展现端js会上报广告展示日志,有部分用户点击了广告,服务端会记录点击日志,这些日志可以作为广告算法实施的数据源,同时,他们经过统计分析之后,会被展示给广告主,让他们能够看到自己广告的展示信息,点击信息。

    步骤六:对广告主进行扣费
    用户既然点击了广告,平台就要对投放广告的广告主进行扣费了,扣费前当然要经过反作弊系统的过滤,扣费后信息会实时反映到数据层,费用扣光后,广告就要从数据层里下线,后续用户的点击就不会出现0费用的广告了。

    个人资料
    飘雪无垠
    等级:6
    文章:24篇
    访问:2.1w
    排名: 16
    推荐圈子
    上一篇: ReactiveCocoa中潜在的内存泄漏及解决方案
    下一篇:风控中的大数据和机器学习
    猜你感兴趣的圈子:
    系统架构圈
    标签: 广告、广告主、点击、扣费、ctr、面试题
    隐藏