多武装强盗如何确定您在网上看到的广告和故事

$config[ads_kvadrat] not found

20150102 吃八方 2014行者影像节作品展映:花朵1

20150102 吃八方 2014行者影像节作品展映:花朵1
Anonim

想象一下,你是一个赌徒,你站在几台老虎机前面。您的目标是最大化您的奖金,但您实际上并不知道每台机器提供的潜在奖励。但是,你知道你拉动的杠杆以及你这样做的频率会影响赌博狂欢的结果。

拉斯维加斯和大西洋城的游客(无论人们到大西洋城的程度如何)每天面对的这种情况也是一个经典的逻辑难题,称为“多武装强盗” - 老虎机被称为“单臂武器”匪徒“通过老化里诺式,因为他们有一个杠杆,并拿走人民的钱。虽然没有一种正确的方法可以解决多武装强盗情况 - 最接近的候选人是Gittins指数 - 但是有一些战略方法可以解决这些问题,而这些问题在你上网的时候每天都没有注册。管理内容的方式通过Google和网站呈现的许多算法都是围绕MAB策略构建的。几乎所有情况下的目标都是将学习和结果联系起来,并最大限度地发挥两者的潜力。

使用多臂强盗方法 华盛顿邮报 找出你最有可能点击的照片和标题,并通过无线网络找出哪种最佳的节能路线是最好的。从MBA方法中发展出来的算法对于这些公司和其他许多公司来说非常重要,因为它们基本上决定了何时以及哪些广告在网上出现。

弄清楚向人们展示什么广告是一个具有挑战性的问题,因为有很多单臂匪徒在网上点击东西。用于广告的MAB算法通常使用快速变化的“致命的多臂强盗问题”,其在有限的时间段内应用。交通数据用于开发越来越有效的方法。

将MAB固定到一个确切的目的是很困难的,因为可以创建这么多的公式变体。例如,K型武装匪徒拥有竞争获得最高预期奖励的“武器”。语境化强盗也做同样的事情,但是“专家建议” - 先前在用户上收集的数据 - 以及名为“ILOVETOCONBANDITS”的网络就绪仅适用于预先指定的轮次。相反,经典的MAB方法没有可能的辅助信息,结果仅取决于所选动作的可能性。

虽然迄今为止最有用的MAB应用程序似乎与互联网相关,但研究人员正在努力寻找将其应用于“现实生活”(又名meatspace)场景的方法。在2015年的一篇论文中,不列颠哥伦比亚大学的研究人员考虑将MAB应用于医学试验。如果MAB在这里证明是可能的,那么目标是MAB算法可以测量特定药物的效果。显而易见的问题是,除非可以创建计算机调制版本,否则采用这种方法只会耗费太多时间。 MAB设计无法在临床试验中使用。

这个想法很好,但截至目前还不可行。在未来到来之前,当你拼命想要点击弹出式广告时,你会感受到多臂匪徒的迫近存在。

$config[ads_kvadrat] not found