Learning to Collaborate——基于多智能体强化学习的多场景联合优化

  • 时间:
  • 浏览:0

NASA计划后,阿里又透露了在强化学习领域的布局

拆开阿里小蜜的内核,看智能人机交互的实现逻辑

在淘宝平台上有非常多的子场景,例如搜索、推荐、广告。每个子场景又有非常多细分,例如搜索包括默认排序、店铺内搜索、店铺搜索等;推荐内有猜你喜欢、今日推荐、每日好店等。基于数据驱动的机器学习和优化技术目前极少量的应用于哪此场景中,并将会取得了不错的效果——在单场景内的A/B测试上,点击率、转化率、成交额、单价都能看到显著提升。

然而,目前各个场景之间是全版独立优化的,可是会带来几点比较严重的大大问题:

DeepMind 在多智能体强化学习方面又有了新进展,最新成果登上 Science 杂志!

人工智能在搜索中的应用

电商搜索算法技术的演进

蚂蚁金服有哪此金融特色的机器学习技术?

【ICML2018】63篇强化学习论文全解读

【NIPS2017】大会议程最全盘点,7位重磅嘉宾报告,DeepMind、Facebook论文汇总

让机器帮你做决策!强化学习在智能交互搜索的应用分享

【干货】3万字剖析强化学习在电商环境下应用

【双11头上的技术】基于淬硬层 强化学习与自适应在线学习的搜索和推荐算法研究

让天下这么 难用的搜索:阿里搜索怎么能能成长为贴心“暖男”?

  a. 用户在淘宝上购物会总是在多个场景之间切换,例如:从主搜索到猜你喜欢,从猜你喜欢到店铺内。不同场景的商品排序仅考虑自身,会原因分析用户的购物体验是不连贯将会雷同的。例如:从冰箱的详情页进入店铺,却展示手机;各个场景都展现

专访阿里巴巴徐盈辉:淬硬层 学习和强化学习技术首次在双11中的大规模应用

『干货』淬硬层 强化学习与自适应在线学习的阿里实践

专访 | 阿里搜索事业部研究员徐盈辉:剖析阿里头上的强化学习技术

UCL 教授汪军:多智能体强化学习的两大挑战 | CCF-GAIR 2017

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

专访三桐:阿里人工智能搜索应用的交互式未来

基于TensorFlow打造强化学习API:TensorForce是怎么能能炼成的?

下拉加载更多

本文为云栖社区原创内容,未经允许不得转载,如需转载请发送邮件至yqeditor@list.alibaba-inc.com;将会您发现本社区涵盖涉嫌抄袭的内容,欢迎发送邮件至:yqgroup@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

环境才能强化学习,智能体要找不着北了,UCL汪军团队提出环境设计的新依据