餐饮加盟网-免费发布餐饮招商信息!本站不提供任何加盟资料,如需加盟请去其官网了解详情

美团点评王栋:AI 赋能餐饮行业,如何全局协同优化,打造“外卖大脑”?

来源:餐饮加盟
作者:小吃加盟·发布时间 2025-10-14
核心提示:锋网(公众号:雷锋网)按:9 月 7 日,首届人工智能计算大会(AI Computing Conference 简称 AICC)在京举行。本次大会由中国工

锋网(公众号:雷锋网)按:9 月 7 日,首届人工智能计算大会(AI Computing Conference 简称 AICC)在京举行。本次大会由中国工程院信息与电子工程学部主办、浪潮集团承办。除了邀请海内外数十位知名专家围绕 AI 计算创新作主题报告外,还设置了 AI+计算创新、AI+互联网、AI+产业创新、AI+HPC 融合分论坛,有来自百度、微软、阿里、腾讯、英特尔等业界人士分享了各自对 AI 的看法,以及各自企业在 AI 上的应用进展。

在 AI+互联网论坛上,美团点评高级技术总监王栋作为嘉宾以《人工智能在餐饮行业的应用场景》作了演讲,就 AI 在餐饮行业中的潜在应用,以及美团的一些具体技术方案做了详细讲解。此外,王栋在接受媒体采访时,就美团点评数据、业务方面的情况进行了解答。

王栋对 AI 在人工智能在餐饮行业应用场景的主要观点及对未来的展望如下:

嗅觉、味觉口味识别是非常有潜力的方向;

人工智能在流量转化优化、配送调度机制、用户营销过程领域的应用成效显著;

要全局协同优化,打造外卖大脑:交易流量分配+配送履约+智能营销;

自动化配送可能早于自动驾驶实现:场景可控,闭环反馈;

人工智能是使能技术:给餐饮行业带来更好规模效应;用户端+商户端+平台化。

以下为王栋演讲内容实录,雷锋网做了不改变愿意的编辑:

我在美团点评负责外卖的算法和数据,今天讲的题目不是很大,但大家会觉得这个事情有点突兀,咱们可以慢慢介绍一下。

我们先看一下对 AI 这件事情的理解,AI 其实现在主要是以深度学习为主,但早先包括规则、SVM 这些浅层网络都出现过,这是因为我们用不同表达方式解决同一个问题,这个问题其实按照康德的说法应该分为对一个问题的解答分为三部分,第一是什么样的问题,第二你怎么样表达这个问题,第三才是问题真正的解决方案。

比如说我们用非常简单的例子,我们原来可能知道,大家都用的是阿拉伯数字,但是实际上在历史上,也经常更长时间用的是罗马数字,历史上更长的时间是用的罗马数字表示,如果运算非常大的乘法的时候用罗马数字来做是不可想象的事情,不同的表示对应不同解决方案的难易程度。今天我们看 AI 做到很多应用的场景,包括阿法狗,或者是 Caffee 这样一些比较前沿的方法,其实都是在深度学习框架下。但是这里仍然只是一种 AI 可能的解决方案。

然后我们看一下对于 AI 的问题,解决方案大概有这么几个步骤,第一,要有一个明确的场景,这个场景本身是可以去明确定义的,没有歧义;第二,要有足够的数据,在通常的场景下,AI 深度学习必须有大量的数据;第三,要有足够好的人员能把数据用起来;最后我们在应用场景里不断对我们的目标和实的结果做持续反馈。只有通过这个才能更好了解到底这个解决方案和实际应用场景不匹配的点在哪里,以及怎么样去改进,这是对 AI 这个方向简单理解。

AI 应用场景

对于餐饮行业来说,大家可能都认为,汽车是非常 Fashion 的一个行业,有颠覆性的机会,可以看到汽车行业 4 千亿,餐饮行业是 3500 亿,数据差不多,美国的消费是 5 千亿美元的餐饮消费规模。

现在中国向消费升级这个方向发展,这块也是有比较大的潜力。滴滴共享出行、包括像共享单车一样现象级的产业,这个流程相对来说比之前的两个更复杂一点。

餐饮行业首先涉及到用户在平台上进行下订单,选择哪家喜欢吃的菜,然后下单,下了单通知这个商家做接单,商家要去做,出餐,通过骑手要把这个餐送给用户。所以这块是一个非常长的时间要求,我们都不愿意自己的餐可能一个小时才能送到,都希望半个小时甚至更短时间能够到自己的手里。但配送员能量是有限的,用户点的餐往往都是在自己附近一公里,这样意思是说,如果我们有三公里以外的配送骑手对解决这个问题是没有帮助的。要求这么高,资源又这么少,又是一个刚性的资源,所以这个优化是非常难做的。

服务的链条比较长,尤其遇上恶劣天气,会是一个很要命的事情,这个导致服务行业要求及时配送,无论是天猫次日达,京东可以做到当天或者 6 个小时,甚至包括一些闪送小的创业企业其实都没有解决这么大规模及时配送的优化问题。

对配送来说,我们确实对这个也是有一个改善的,我们可以做一个区域划分,每个配送员会有一块相对熟悉的区域,这个区域内他会做相关的配送。美团有 30 万骑手每天完成一千万单交付。

我们看全球外卖公司其实还是蛮多的,中国现在刚刚经历了一个 3 进 2 的角逐,饿了么和百度外卖进行合并,真正的在这个行业做的只有两家,这个规模是远远大于其他竞争者的。比其他国家任何一个市场都要大,这个原因其实商业上可以理解,我们大部分是在城市,城市密度很高,同时中餐复杂程度不像西餐,不像吃披萨或者吃意面,只有三种选择,我们菜的选择是非常多的,通过电话订餐是比较复杂的事情,同时商家现在租金成本在涨,而外卖是堂食之外对商家一个很好的补充,这种模式下外卖无论对用户还是商家都是多赢的解决方案。

AI 技术方案

简单的场景介绍之后看一下在餐饮行业,我们 AI 应该怎么去应用,这块大概按纵横两个维度来看,纵的维度其实是遵循传统关于计算规模、计算资源划分、最基础的底层基础设施、数据和计算能力,再上层一点的是算法,各种各样算法框架,包括技术方向,以及应用场景。

横向来看会有大家通用的感知分析,类似于像视觉、听觉,包括理解与思考,怎么样去做一个决策,怎么样去做一些存储,去把这些数据经过提炼得到答案,把这个答案用起来。最后是交互,怎么能够做市场连读,对餐饮行业来说,这是现在比较少有人去做的事情,其实这也在于前面计算机怎么去做位置建模,怎么样建视觉和嗅觉的相关建模。也有一些小的创业公司在看这方面的机会,在中间智能匹配和规划决策这一块,更偏向于思考,美团点评其实有在做这方面的事情。

再具体一点来看,比如感知这一块,这个现在目前还是一个可以研究的方向,无论是原材料产生还是做原材料加工过程,咱们把这个菜做成主食,或者设备商的工艺改进,这个都是可以利用 AI 方式去做颠覆的。

食物生产工厂,有一些相对来讲经济价值比较高的,类似于生菜这样的设备,是可以在工厂里生成,去量产的。比我们现在大棚里的效率是更高的,当然现在成本还是要高一点。也有人合成牛肉,中间这块其实是很有趣的事情。大概两三年以前,IBM 说自己做了一个创意型菜谱,能够通过 Internet 自己输入很多菜谱,去生成做菜方式。

我们比较本土的创新的擀面条机器人(300024,诊股)或者做拉面机器人,这个现在都是蛮成熟的,包括麻辣香锅机器人,可以很快降低成本,提高企业效率。右边是我们做的比较差的,像标准化的口味,对某个人来说这个辣可能是 50% 的辣,对另外一个人可能是 70% 的辣,应该有一个标准在这里。包括每一种菜品,四川风味应该怎么做,到了北京经过改良之后又是什么样的情况,这个事情也是没有人做的,如果这个事情做的很标准,意味着对每一个人来说,他可以知道每一家餐厅是否符合他的口味,而不是像现在经过平台筛选告诉他,这一家你是不是喜欢,这个是任重道远的事情,我们今天也没有做到。

对于更接地气的做法是我们做的理解,理解是对用户和商户的理解,包括对交易或者用户在线时候的一些历史兴趣,包括当前实施的一些通过点击等行为表现出来的一些理解。对商户本身出餐速度、口味有一些质量等方面的理解。

如果我们做的话一次性对用户单个选择,也可能有多次用户的重复购买,这个里面信息是不一样的,包括多次用到平台的一些红包,或者是促进用户购买的手段,这个其实也是通过人工智能可以去做一些改进的。

对于决策这块,对平台来说,更多是刚才谈到的配送,怎么能够分配我们配送的资源,怎么样更好的做调度。

把这个事情展开一点的话,左边是用户,右边是商家,中间是平台要做的两件事情,核心的点,包括流量匹配、智能营销,还有一个很重要的商家生态健康度。上面更重要的是配送路径规划,以及订单究竟给哪个配送员。综合起来要达到配送的准确度、及时度、满意度和成本的平衡。

交易平台的智能化

下面对于交易效率来说,可能希望能做更好的匹配、单次的匹配,更长远的看也需要考虑商家生态。

交易平台,从美团的历史上来说大概经历了 4 个阶段,目前是处在往人工智能时代过渡演进的过程当中,早先的时候就是一些比较简单的人工运营规则,再往后我们做离线机器人方法,今天利用深度学习和在线学习,能够做上下文的探索,能够去感知到用户偏好的变化,同时能够在线的去探索,比如对用户有帮助的新上的商家,将来希望更多的将增强学习和理解信息更好的用进去。比如说用户喜欢吃辣,对川菜感兴趣,也可能湖南菜他觉得挺适合的,这就不光通过知识驱动,更有效的达到目的,通过及时配送去做一些协同调整。

在现在我们 APP的页面,有搜索、平台排序、场景推荐、个性化推荐,以及基本兜底的所有东西都可以在这儿找得到一个列表。这儿的目标叫单次的用户转化,各个模块之间的功能肯定是有一些互补,更重要的是我们在单个的模块里面去做更好的优化,比如信息优化,以及对用户转化率估计的优化。

这块我们用了一些深度学习技术,对于关键信息的展示这块,展示样式的优化,我们用了一些增强学习的方法,对于在图像呈现里面我们用了图象处理的方法,用 CNN 包括相关性,我们之前用 DSSM、CTR 预估,对新商家冷启动,我们同样用了增强学习框架。

简单说一下 CTR、CVR,这个事情对交易平台是非常重要的事情,分为这么四层,首先最基本的数据,上层怎么获得我们的标注,获得我们的特征?标注类似于在我们今天的场景下怎么样更好的解决问题,采用什么样具体的模型解决问题,我们怎么样在在线的情况下做实时数据更新,这个是非常传统的一些做法。

特征交叉有连续特征、离散特征和细节处理,在深度学习之后,原始特征的处理还是需要的,我们也用一些图像特征,之前我们倾向于用一些连续离散的特征,通过商家首页的头图,我们其实可以了解更多关于商家的信息。这个标注信息第一作为底层原始特征,第二作为中层表示,作为一些标签会加进来。

除了做菜谱,因为有时候商家标菜的信息并不是非常精准,需要帮他纠正过来,或者他有可能会做不正当营销,我们都可以通过一些方式解决。

上面是我们怎么样辅助商家,帮助他做出更好的菜品显示。有些选择图并不好看,我们怎么样告诉他这个图效果不好,这块其实做了两点,第一是美观度,美观度做完以后其实发现这个事儿并没有解决,有的图虽然不那么难看,也很美观,但是用户觉得不敢进去。所以第二,我们又做了一波,怎么样看他对用户是不是有足够的吸引力,这个做完之后效果好很多。

标注和奖励

对标注来说,因为我们是监督学习场景,但是正在向半监督或者强化学习过程当中,关于怎么样标注是有讲究的。无论我们通过闭环学习方式还是说我们现在正在做反馈引入,比如我们点击购买、评价、甚至浏览商家的长度,是不是有可能去做一个购物车的加购,包括加购之后有没有取出来,有些用户反馈,对商家有一个评价,对配送人员有一个反馈等等,如果我们对它不加细分的话,有些人对配送质量不满意,对商家质量是满意的,但这个地方没有区分开,标注会有一个错误,它会影响我们系统的表现。

还有一个问题是代理标注,也有我们手中拿到的点击下单都不是用户对这个菜是否满意的最根本反映,我们尝试用各种各样不同信号去模拟用户真正对这个菜喜欢的程度。

模型设计上,我们优化目标综合考虑了很多种,点击率、下单率、下单金额,把点击率和下单率尝试了很多不同算法,其实也有一个演化的过程。

最近我们在做 DNN 的 CTR 预估,右边我们会有一些原来经常用到的点击率特征,配送距离特征等等连续的特征,大概一百多位放在一起,再去做连接,一层一层做优化,最后直到产生一个点击或者购买决策,这个是最近做的工作,效果还不错。

同时我们其实也有帮助商家去做一些优化,包括帮助我们自己的 BD 在线下做商家谈判的时候有效果的提升,这里面用一些图像 OCR 技术会去做身份证识别,这个现在都是处于业务当中,用的时候去做,而不是说针对这个方面我们需要做一个特别大的工作,所以这个是属于一个内部的小项目。具体的做法其实也是非常标准的做法,做一些 FCL。

配送调度算法的核心问题

下面我们可以看一下我们现在做的订单的指派问题或者配送的问题。这个问题更简单的看,左边我们有不同的用户在不同的时间,他会去点不同的商家,这时候就需要多个配送员有选择的把这些订单满足用户需求时间的情况下交到用户的手里面,但是很多的配送员在路上已经有订单了,已经在去或者送的过程中,这个时候我们应该把新增的订单分配给这些配送员,应该怎么分配?分配给哪些人,先送哪个,后送哪个?这是里面所要解决的核心问题,这个问题分四步。

第一,先估计单个配送员给定目标的时候,他配送时间大概什么样子的,这是非常粗略的估计,因为我们并没有执行他实际路径优化。第二,我们知道大致时间之后,再去做细致路径的规划,这个时候,我们其实相当于有一个订单,比如有 10 个,或者 20 个订单,我们给配送员发,到底给哪个配送员。

第三,我们怎么样做全局优化的前提是要有一个合适的目标和一个约束,这个其实也是在刚才所说的之后,有一个比较好的决策目标。

最后真正的执行优化,有一些细节优化的点,这个也是经历了大概四步的阶段,最早的时候也是人工,骑手抢单,一方面开着电动车,一方面盯着视频,比较着急。后来优化了,我们首先是分配,分区域、分范围,每一个范围之内有一个站长,站长并不需要自己去送餐,他的任务是在高峰期的时候给骑手打电话,分配定单,后来经过系统长期运作,我们能够比较好的把这个事情自动完成,今天能够做智能派单,做骑手的路径规划,骑手 90% 的情况下遵循我们的建议。

这个情况下我们兼顾配送的效率,用户的体验、人力成本、骑手安全,我们希望做到针对不同的场景,包括运力规划。甚至更长远一点,一个月内看到三个月对运输什么样的要求,同时需要做一些交易协同。

配送时间这个事情也已经比较复杂了,这个流程是这样的,首先骑手接单,他要去到行使到商家,他要去取餐,之后再行驶到用户这边,在商家这边其实有一些问题,有可能不一定有足够时间做菜,骑手到了店以后要等做餐,有可能这一骑手对这个店不熟悉,他要找,或者等半天,都有一个时间损耗。行驶的时间是比较好估计的,到了那边可能写字楼不让骑手进,或者写字楼很高,他可能要等,都是不确定的因素。

同时我们还有用户画像,用户对交付时间要求是不是非常着急,有的用户可能没那么着急。有一些区域,在路上行驶的时候,在 12 点的时候是不是交通拥堵,这些信息加在一起是非常大的量。

我们尝试了两种方法建模,一种是机器建模,每个小部分单独的做模型,然后再估计,另外一种是数据系统建模,数据系统建模比较好,数据量比较大,所以采用数据建模方式。有了时间估计之后,我们要做配送路径优化,这个目标针对一个订单,给一个订单的时候我们分派给哪个骑手,这个问题其实也是一个非常难。

我们首先是用快速搜索,到底朝哪个方向可以走,配送给哪个骑手是可行的,然后我们再做一个稍微清晰的回归模型,最后我们再去做迭代优化的执行,看一步两步三步,在优化里面是不是有快速搜索,这里面有这个领域的知识,我们可以做高效分析。

其实这块效果目前能做到 99.9% 近似最优,也不是完全做 100% 的最优,这个也是在时间和效果的平衡。这块比较显著改进的一个点,去年的时候我们只能做到 99%,意味着每天 1%,大概有 10 几万单是有问题的。现在我们已经把它缩小到一万单。

决策目标及约束

对于决策目标来说,我们可能有这么几个,首先要去看决策什么东西,其实我们就是把订单在什么时间点优化,配送给每个配送员,约束的条件有骑手配送箱容量,用户期望送达时间、出餐时间、骑手交付时间、骑手行驶速度,优化目标肯定是多个目标的综合,同时又是一个大规模的实时优化的问题,有数千配送区域,数十万骑手,本身又是秒级计算完成的速度,目标冲突,这个对公司成本是没法承受的。

另外一个是有强随机性的问题,可能用户突然在某个地方下了订单,导致我们之前最优解变得不解,这时候我们要改优化结果,这是非常大的一个挑战。

订单优化算法的关键,第一我们结合了问题特征,包括搜索机制,我们有一些订单是可以合并的,有些地理位置信息可以做简单约束,在搜索机制上,我们有很多问题特征搜索和机制搜索。同时右边可以看到,可以考虑一个订单,每次都去循环做一下,这样效率其实不是特别高,会浪费一部分资源。我们一批订单大概 10 个、20 个我们再做优化,或者我们做局部更新,某一个小局部用户相关的商家更新。

还有我们将来考虑一段时间内可能出现订单的预测,比如说某栋写字楼人比较多,经常有人点各种各样的订单,我们提前预判,其实对系统优化强随机性的改进,其实是会比较有效。所以,大概这么几个关键的点。

我们其实也是批量更新之后,做了一个更细致的优化。我们怎么样去做粗过滤,明显不符合目标的骑手可以快速排除,我们用随机优化方法,包括最后怎么样把订单合并之后再用经典的算法去做到改造以后的最佳匹配在线解法,这样复杂度降低。

同时我们会做优化,这个方法用在线方法做不太现实,我们做了很多模拟平台建设。

总结和展望

总结一下,我们确实有很多业务应用问题,同时解决业务的应用问题需要做底层基础建设,美团本身有自己的云服务,美团云为了提供很多底层的基础建设,包括资源调度、计算资源、数据访问各种协议,底层我们都不需要担心。像我们自己内部自研的关于 NLP 的算法,包括传统的 LDA,PSA 这样一些模型,我们事先都有底层实现。我们需要做的就是在这个库上面去做更多应用探索,无论是计算机视觉应用,还是我们今天没有提到的安全,无论对用户安全还是对我们自己平台安全来说都有很多应用,这也是在我们平台的云上其实都是可以做到。

美团云本身其实也提供一个产品云矩阵,这个跟在座讲的大部分解决方案是有类似程度的,但是我们比较好的一个点是我们本身有非常大规模的业务,能够在需求当中快速迭代,能够快速迭代,意味着我们能够快速的把需求传导到底层优化模型和数据上。包括全栈 GPU 主机、纵和物理机、深度学习的平台,现在也是处于对外开放的状态。我们刚才所说到各种验证,各种识别,各种应用,其实也都是一个全面开放的态度,可以跟外界合作,包括中小型做 AI 的公司,可以把他们的应用放在美团云上给第三方提供服务。

这个是关于我们美团做的餐饮行业的应用和基础建设的介绍。总结起来关于嗅觉、味觉口味识别这个方向我个人认为是非常有潜力的方向,同时我们在流量转化优化、智能营销、公司用户访问,以及营销过程配送机制调度方面我们确实取得了一定成绩,这个和我们业务的应用分不开的。如果做一个简单展望,我们认为首先在外卖这块,配送和外卖本身两个部门协调,怎么样去做智能营销,这三个其实可以更多的协调和打通。

第一点,自动化配送、自动驾驶是很牛的事情,其实通过自动配送,甚至局部的车解决配送的问题有可能比车更早实现,还是刚才最早提到的观点是一致的,这个问题表示和应用场景,这里面配送小车的速度比汽车要低很多,意味着对硬件的成本要求也会低很多。

第二点,这里面我们所采用的路径相对来说是固定的,不像车可能什么地方都要去跑,从这两点上来说我们的可行性更大一些,而且本身每天跑的量很大,我们有很多数据积累,我们预测这件事情是会比自动驾驶更早实现。

第三点,无论刚才所说到的很多人工智能应用,还是对我们餐饮行业现在已经做的和将来有可能展开的应用来说,都是非常好的一个带有规模效应利器,相信这块将来会有更多应用领域。

演讲结束后,王栋接受了包括雷锋网在内的媒体采访,以下为采访内容实录:

提问:刚刚听了您的演讲,讲了算法、基础建设中的很多问题,在您看来美团目前亟待解决和优化的问题有哪些?有没有一个优先级。

王栋:首先产品是有一个比较明确的落地场景,之前大家谈技术还是蛮多的,实际上AI的技术到今天还没有非常的成熟,无论是语音还是图像,都没有一个很好的实际解决方案,只能是在受限的场景下用技术和长期协同去解决一个问题。所以,如何找到适用的场景是非常关键的。我们也有在做一些外卖的自动点餐,比怎么样让机器人帮助你在电商那儿买衣服是更容易的做的事情,包括配送小车也比自动驾驶更容易做的事情,关键在于你能不能用技术去打磨产品,更能满足人们的需求。

提问:从技术架构来说,美团最需要优化的有哪些?技术架构要完善的话,挑战在哪儿?

王栋:我们主要是在做应用这一层,底层有美团云的同事,如何做到更高并行的优化,无论是训练还是在线上跑预测的阶段,这是一个比较大的挑战,甚至包括我们底层既有GPU,也有FPGA,在什么样的场景下去用合适的解决方案把它们结合起来,在整体的成本、实际实现的效果上有一个比较好的折中,这是需要花能力去做的事情。

第二,针对不同的应用场景以及资源的调度,其实也还是在资源管理的这一层,从架构上来说,怎么样做的更好。

第三,前两步都做好了,是不是有可能在用户端做一些端计算,把计算的算力在两边进行平衡,服务器端和客户端做一个平衡,端计算和云计算结合起来。这是在架构方面。

说到技术的挑战,对语言的理解、推理其实是很关键的问题,人比较擅长,但是机器并不擅长。也有人提到怎么样在记忆方面突破现有的结构,把记忆和存储能够更好的融合起来,在计算的时候能够更好的去调用,这是从技术上比较大的挑战。模型上我们现在更多用的是监督模型,怎么做到半监督、全监督,大规模的获取数据。

提问:美团跟大众点评合并以后,数据这一块是怎么合作的?美团点评的数据优势是怎么体现的?

王栋:可以类比 BAT,他们各自都有不同的优势,百度信息的数据量是比较大的,腾讯在社交和游戏方面的数据量是比较大的,阿里有很好的交易数据,对美团来说我们的用户优势是在于本地的电商服务这个领域。

最近我们也有在基础的用户数据上面去做一些获取,包括用户的基本属性,比如说做一些金融方面的应用,基础数据是绕不过去的,这个是数据方面在做的事情,我们本身也有骑手,骑手每天在街上跑,有很多对场景、对地图的覆盖,帮助在内部做很好的运营,提升我们的运营效率,这个也是很好的数据。

我们也有很多线下的 BD,我们会有非常实时的及时的店家信息的更新。这个不仅是我们自己在用,高德也会公开用到我们的数据。这是美团技术数据的核心。

提问:美团的特点是有很多种的业务线,哪一块业务线在您看来是目前跟友商相比是特别超前的?比如打车有滴滴、易道,新零售美团和阿里的河马先生也很像。

王栋:我们更多的是从用户的使用场景来看。比如打车这件事情,之前很多人也很奇怪,为什么美团会做打车,但是如果你想到 Uber 也去做外卖,我们反向跨界也不是不可以想象的事情。

有两个点,一个是和场景结合,用户到一个地方可以很快的利用美团本地的运输能力快速的达到目的地。第二,即使是在本地的用户,他想去吃东西,几个人一起去吃饭,就需要打车,这并不是很难的操作,我们选好了店,就可以去打车。这个将来是有可能统一的,而且会带来商家和打车业务模式的结合,有可能会有更优质的解决方案,帮助商家去做营销。所以,从这个角度来讲,打车并不是一件不可想象的事情。

至于您刚才说到的新零售,阿里的逻辑很好理解,因为线上做的差不多,没有空间了,成长潜力不大,要在线下做用户的获取,对我们来说逻辑也是类似的。所以这是基于业务理解和用户场景的判断。

提问:能不能介绍一下美团云用到的一些 AI 技术,包括场景方面的应用情况?

王栋:美团云本身是美团的总集成,不光是内部的系统运维,还有采购,比较新的 AI 这一块,都有持续的在投入。之前也做一些网络相关的应用,所以他们在文本的处理,包括对用户的信息骚扰这方面也有做很多的过滤,这是在用户的层面上做的,包括 OCR,也有外部内部各种应用的匹配。

人脸识别我们有用到 Face++,也有可能用到我们内部自研的技术,在整体上本身内部在用,另外一方面也会作为一个公开的平台提供给外部去调用,也可以给外部的用户足够多的选择。

说到人脸,我们其实会用到实名认证,在酒店行业我们可以去做房态预估,包括商家给的图片去判断是什么样的房型,今天晚上会不会住满人,最近这一段有可能这个地方都比较清淡,所以没有必要做非常多的线上营销活动。入住率高将来可能会非常贵,我们可以通过提前预订的方式把预订资源拿到。

这也是需要很多预测能力的,美团云也有提供,像我们今天所说的底层的 IaaS、PaaS、SaaS 都有涉及,确实美团本身应用的场景是非常多的,酒店、旅游、餐饮等其他新兴的业务,对AI技术的需求本身是巨大的。我们在做好自己事情的同时,要么结合自己的力量,要么结合外部的力量,打造更好的技术。

提问:人脸识别的技术用的是谁的?

王栋:我们自己内部也有资源。调用的时候看业务方的场景,比如金融这块精度要求非常高,旷视的可能更多一些。

雷锋网原创文章,未经授权禁止转载。详情见转载须知。

<>

“ I’m sorry. I can’t do that, Dave.” 这是经典科幻电影《2001: A Space Odyssey》里HAL 9000机器人说的一句话,浓缩了人类对终极人工智能的憧憬。让机器学会说这样简单一句话,需要机器具备情感认知、自我认识以及对世界的认识,来辅助机器处理接收到的各种信息,了解信息背后的意思,从而生成自己的决策。而这些认知模块的基础,都需要机器具备知识学习组织推理的能力,知识图谱就是为实现这些目标而生。

< class="pgc-img">

今年5月,美团NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑,它将充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论数据,理解用户在菜品、价格、服务、环境等方面的喜好,挖掘人、店、商品、标签之间的知识关联,从而构建出一个“知识大脑”。美团大脑已经在公司多个业务中初步落地,例如智能搜索推荐、智能金融、智能商户运营等。

此前,《美团大脑:知识图谱的建模方法及其应用》一文,介绍了知识图谱的分类及其具体应用,尤其是常识性知识图谱及百科全书式知识图谱分别是如何使用的。之后我们收到非常多的反馈,希望能进一步了解“美团大脑”的细节。为了让大家更系统地了解美团大脑,NLP中心会在接下来一段时间,陆续分享一系列技术文章,包括知识图谱相关的技术,美团大脑背后的算法能力,千亿级别图引擎建设以及不同应用场景的业务效果等等,本文是美团大脑系列的第一篇文章。

迈向认知智能

海量数据和大规模分布式计算力,催生了以深度学习为代表的第三次(1993-目前)人工智能高潮。Web 2.0产生的海量数据给机器学习和深度学习技术提供了大量标注数据,而GPU和云计算的发展为深度学习的复杂数值计算提供了必要算力条件。深度学习技术在语音、图像领域均取得了突破性的进展,这表示学习技术成果使得机器首次在感知能力上达到甚至超越了人类的水平,人工智能已经进入感知智能阶段。

然而,随着深度学习被广泛应用,其局限性也愈发明显。

  • 缺乏可解释性:神经网络端到端学习的“黑箱”特性使得很多模型不具有可解释性,导致很多需要人去参与决策,在这些应用场景中机器结果无法完全置信而需要谨慎的使用,比如医学的疾病诊断、金融的智能投顾等等。这些场景属于低容错高风险场景,必须需要显示的证据去支持模型结果,从而辅助人去做决策。
  • 常识(Common Sense)缺失:人的日常活动需要大量的常识背景知识支持,数据驱动的机器学习和深度学习,它们学习到的是样本空间的特征、表征,而大量的背景常识是隐式且模糊的,很难在样本数据中进行体现。比如下雨要打伞,但打伞不一定都是下雨天。这些特征数据背后的关联逻辑隐藏在我们的文化背景中。
  • 缺乏语义理解。模型并不理解数据中的语义知识,缺乏推理和抽象能力,对于未见数据模型泛化能力差。
  • 依赖大量样本数据:机器学习和深度学习需要大量标注样本数据去训练模型,而数据标注的成本很高,很多场景缺乏标注数据来进行冷启动。
< class="pgc-img">

数据知识驱动AI能力对比

从人工智能整体发展来说,综上的局限性也是机器从感知智能向认知智能的迁跃的过程中必须解决的问题。认知智能需要机器具备推理和抽象能力,需要模型能够利用先验知识,总结出人可理解、模型可复用的知识。机器计算能力整体上需要从数据计算转向知识计算,知识图谱就显得必不可少。知识图谱可以组织现实世界中的知识,描述客观概念、实体、关系。这种基于符号语义的计算模型,一方面可以促成人和机器的有效沟通,另一方面可以为深度学习模型提供先验知识,将机器学习结果转化为可复用的符号知识累积起来。

知识究竟是什么呢?知识就是有结构的信息。人从数据中提取有效信息,从信息中提炼有用知识,信息组织成了结构就有了知识。知识工程,作为代表人工智能发展的主要研究领域之一,就是机器仿照人处理信息积累知识运用知识的过程。而知识图谱就是知识工程这一领域数十年来的代表性研究方向。在数据还是稀有资源的早期,知识图谱的研究重点偏向语义模型和逻辑推理,知识建模多是自顶向下的设计模式,语义模型非常复杂。其中典型工作,是在1956年人工智能学科奠基之会——达特茅斯会议上公布的“逻辑理论家”(Logic Theorist)定理证明程序,该程序可以证明《数学原理》中的部分定理。伴随着Web带来前所未有的数据之后,知识图谱技术的重心从严谨语义模型转向海量事实实例构建,图谱中知识被组织成<主,谓,宾>三元组的形式,来表征客观世界中的实体和实体之间的关系。比如像名人的维基百科词条页面中,Infobox卡片都会描述该名人的国籍信息,其结构就是<人,国籍,国家>这样的三元组。


< class="pgc-img">


互联网公司知识图谱布局

目前,知识图谱已被广泛应用在问答、搜索、推荐等系统,已涉及金融、医疗、电商等商业领域,图谱技术成为“兵家必争”之地。微软于2010年开始构建Satori知识图谱来增强Bing搜索;Google在2012年提出 Knowledge Graph概念,用图谱来增强自己的搜索引擎;2013年Facebook发布Open Graph应用于社交网络智能搜索;2015年阿里巴巴开始构建自己的电商领域知识图谱;2016年Amazon也开始构建知识图谱。


< class="pgc-img">


美团大脑

2018年5月,美团点评NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑。美团点评作为中国最大的在线本地生活服务平台,覆盖了餐饮娱乐领域的众多生活场景,连接了数亿用户和数千万商户,积累了宝贵的业务数据,蕴含着丰富的日常生活相关知识。在建的美团大脑知识图谱目前有数十类概念,数十亿实体和数百亿三元组,美团大脑的知识关联数量预计在未来一年内将上涨到数千亿的规模。

美团大脑将充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论和行为数据,理解用户在菜品、价格、服务、环境等方面的喜好,构建人、店、商品、场景之间的知识关联,从而形成一个“知识大脑”。相比于深度学习的“黑盒子”,知识图谱具有很强的可解释性,在美团跨场景的多个业务中应用性非常强,目前已经在搜索、金融等场景中初步验证了知识图谱的有效性。近年来,深度学习和知识图谱技术都有很大的发展,并且存在一种互相融合的趋势,在美团大脑知识构建过程中,我们也会使用深度学习技术,把数据背后的知识挖掘出来,从而赋能业务,实现智能化的本地生活服务,帮助每个人“Eat Better, Live Better”。

知识图谱技术链


< class="pgc-img">


知识图谱技术链

知识图谱的源数据来自多个维度。通常来说,结构化数据处理简单、准确率高,其自有的数据结构设计,对数据模型的构建也有一定指导意义,是初期构建图谱的首要选择。世界知名的高质量的大规模开放知识库如Wikidata、DBPedia、Yago是构建通用领域多语言知识图谱的首选,国内有OpenKG提供了诸多中文知识库的Dump文件或API。工业界往往基于自有的海量结构化数据,进行图谱的设计与构建,并同时利用实体识别、关系抽取等方式处理非结构化数据,增加更多丰富的信息。

知识图谱通常以实体为节点形成一个大的网络,图谱的Schema相当于数据模型,描述了领域下包含的类型(Type),与类型下描述实体的属性(Property),Property中实体与实体之间的关系为边(Relation),实体自带信息为属性(Attribute)。除此之外Schema也会描述它们的约束关系。

美团大脑围绕用户打造吃喝玩乐全方面的知识图谱,从实际业务需求出发,在现有数据表之上抽象出数据模型,以商户、商品、用户等为主要实体,其基本信息作为属性,商户与商品、与用户的关联为边,将多领域的信息关联起来,同时利用评论数据、互联网数据等,结合知识获取方法,填充图谱信息,从而提供更加多元化的知识。

知识获取

知识获取是指从不同来源、不同结构数据中,抽取相关实体、属性、关系、事件等知识。从数据结构划分可以分为结构化数据、半结构化数据和纯文本数据。结构化数据指的关系型数据库表示和存储的二维形式数据,这类数据可以直接通过Schema融合,实体对齐等技术将数据提取到知识图谱中。半结构化数据主要指有相关标记用来分隔语义元素,但又不存在数据库形式的强定义数据,如网页中的表格数据、维基百科中的Infobox等等。这类数据通过爬虫、网页解析等技术可以将其转换为结构化数据。现实中结构化、半结构化数据都比较有限,大量的知识往往存在于文本中,这也和人获取知识的方式一致。对应纯文本数据获取知识,主要包括实体识别、实体分类、关系抽取、实体链接等技术。

实体作为知识图谱的核心单位,从文本中抽取实体是知识获取的一个关键技术。文本中识别实体,一般可以作为一个序列标注问题来进行解决。传统的实体识别方法以统计模型如HMM、CRF等为主导,随着深度学习的兴起,BiLSTM+CRF[1]模型备受青睐,该模型避免了传统CRF的特征模版构建工作,同时双向LSTM能更好地利用前后的语义信息,能够明显提高识别效果。在美团点评-美食图谱子领域的建设中,每个店家下的推荐菜(简称店菜)是图谱中的重要实体之一,评论中用户对店菜的评价,能很好地反映用户偏好与店菜的实际特征,利用知识获取方法,从评论中提取出店菜实体、用户对店菜的评价内容与评价情感,对补充实体信息、分析用户偏好、指导店家进行改善有着非常重要的意义。


< class="pgc-img">


BiLSTM+CRF模型

实体分类则是对抽取出的实体进行归类。当从文本中发现一个新的实体,给实体相应的Type是实体概念化的基本目标。比如用该实体的上下文特征与其他Type下的实体特征进行对比,将新实体归入最相似的Type中。此外,在Schema不完善的情况下,对大量实体进行聚类,进而抽象出每个簇对应的Type,是自底向上构建图谱的一个常用方法,在补充Type层的同时,也顺便完成了实体归类。

关系抽取,是从文本中自动抽取实体与实体之间的特定的语义关系,以补充图谱中缺失的关系,例如,从“干酪鱼原来是奶酪做的”中抽取出<干酪鱼,食材,奶酪>。关系抽取可以通过定义规则模版来获取,如匹配某种表达句式、利用文法语义特征等,但规则类方法消耗大量人力,杂质较多。基于Bootstrap Learning的方法利用少量种子实例或模版抽取新的关系,再利用新的结果生成更多模版,如此迭代,KnowItAll[2]、TextRunner[3]基于这类思想;远程监督(Distant Supervision)方法[4]把现有的三元组信息作为种子,在文本中匹配同时含有主语和宾语的信息,作为关系的标注数据。这两种方法解决了人力耗费问题,但准确率还有待提高。近期的深度学习方法则基于联合模型思想,利用神经网络的端对端模型,同时实现实体识别和关系抽取[5][6],从而避免前期实体识别的结果对关系抽取造成的误差累积影响。

知识校验

知识校验贯穿整个知识图谱的构建过程。在初期的Schema设计过程中,需要严格定义Type下的Property,Property关联的是属性信息还是实体,以及实体所属的Type等等。Schema若不够规范,会导致错误传达到数据层且不易纠错。在数据层,通过源数据获取或者通过算法抽取的知识或多或少都包含着杂质,可以在Schema层面上,添加人工校验方法与验证约束规则,保证导入数据的规范性,比如对于<店A,包含,店菜B>关系,严格要求主语A的Type是POI,宾语B的Type是Dish。

而对于实体间关系的准确性,如上下位关系是否正确、实例的类型是否正确,实例之间的关系是否准确等,可以利用实体的信息与图谱中的结构化信息计算一个关系的置信度,或看作关系对错与否的二分类问题,比如<店A, 适合, 情侣约会>,对于“情侣约会”标签,利用店A的信息去计算一个权重会使得数据更有说服力。此外,如果涉及到其他来源的数据,在数据融合的同时进行交叉验证,保留验证通过的知识。当图谱数据初步成型,在知识应用过程中,通过模型结果倒推出的错误,也有助于净化图谱中的杂质,比如知识推理时出现的矛盾,必然存在知识有误的情况。

知识融合

知识融合主要解决多源异构数据整合问题,即从不同来源、不同结构但表达统一实体或概念的数据融合为一个实体或概念。融入来自多源数据的知识,必然会涉及知识融合工作,实体融合主要涉及Schema融合、实体对齐、实体链接等技术。

Schema是知识图谱的模型,其融合等价于Type层的合并和Property的合并。在特定领域的图谱中,Type与Property数量有限,可以通过人工进行合并。对于实例的对齐,可以看作一个寻找Top匹配的实例的排序问题,或者是否匹配的二分类问题,其特征可以基于实体属性信息、Schema结构化信息、语义信息等来获取。

实体对齐是多源数据融合中的重要过程。当数据来自于不同的知识库体系,需要分辨其描述的是同一个实体,将相关信息融合,最终生成该知识库中唯一的实体。这通常是一个求最相似问题或判断两个实体是否是同一个的二分类问题,实体名称、实体携带属性以及其结构化信息,都可以作为有用特征。同时,通过Type或规则限制,缩小匹配的实体范围。

一旦图谱构建完成,如何从文本中准确匹配上图谱中相应的实体,进而延伸出相关的背景知识,则是一个实体链接问题。实体链接[7] 主要依赖于实体Entity与所有Mention(文本文档中实体的目标文本)的一个多对多的映射关系表, 如 “小龙虾”这个Mention在图谱中实际对应的实体Entity可能是“麻辣小龙虾”的菜,也可能是“十三香小龙虾”的菜。对于从文本中识别出的Mention,利用上下文等信息,对其候选Entity进行排序,找出最可能的Entity。实体链接可以正确地定位用户所提实体,理解用户真实的表达意图,从而进一步挖掘用户行为,了解用户偏好。


< class="pgc-img">


实体链接(Entity linking)

美团大脑也参考并融入了多源的数据信息,知识融合是构建图谱的一个重要步骤。以美食领域子图谱为例,该图谱是由结构化数据和文本挖掘出来的知识融合而成,首要任务是将图谱中已构建的菜品通过菜名、口味、食材等方面的相似度将菜品与文本挖掘出来的菜品知识进行关联,其次还要对无法关联的菜品知识聚类抽象成一个菜品实体。知识的融合很大程度上增加了菜品的数量,丰富了菜品信息,同时为实体链接的映射关系表提供了候选对,有助于我们在搜索过程中,支持更多维度(如口味、食材)的查询。

知识表示

知识表示是对知识数据的一种描述和约定,目的是让计算机可以像人一样去理解知识,从而可以让计算机进一步的推理、计算。大多数知识图谱是以符号化的方法表示,其中RDF是最常用的符号语义表示模型,其一条边对于一个三元组<主语Subject,谓语Predicate,宾语Object>,表达一个客观事实,该方法直观易懂,具备可解释性,支持推理。

而随着深度学习的发展,基于向量表示的Embedding算法逐渐兴起,其为每个实体与关系训练一个可表征的向量,该方法易于进行算法学习,可表征隐形知识并进一步发掘隐形知识。常用的Embedding模型有Word2Vec与Trans系列[8][9],将会在之后的系列文章里进一步讲解。美团大脑参考Freebase的建模思想,以< Subject,Predicate,Object>的三元组形式将海量知识存储在分布式数据仓库中,并以CVT(Compound Value Type)设计承载多元数据,即抽象一个CVT的实例来携带多元信息,图为一个知识表示的例子。与此同时,美团大脑基于上亿节点计算Graph Embedding的表征,并将结果应用到搜索领域中。


< class="pgc-img">


美团大脑知识表示

知识推理

基于知识图谱的推理工作,旨在依据现有的知识信息推导出新知识,包括实体关系、属性等,或者识别出错误关系。可以分为基于符号的推理与基于统计的推理,前者一般根据经典逻辑创建新的实体关系的规则,或者判断现有关系的矛盾之处,后者则是通过统计规律从图谱中学到新的实体关系。

利用实体之间的关系可以推导出一些场景,辅助进行决策判断。美团大脑金融子图谱利用用户行为、用户关系、地理位置去挖掘金融领域诈骗团伙。团伙通常会存在较多关联及相似特性,图谱中的关系可以帮助人工识别出多层、多维度关联的欺诈团伙,再利用规则等方式,识别出批量具有相似行为的客户,辅助人工优化调查,同时可以优化策略。


< class="pgc-img">


知识推理在金融场景应用

知识赋能

知识图谱含有丰富的语义信息,对文本有基于语义的更为深入的理解,在推荐、搜索、问答等领域能提供更加直接与精确的查询结果,使得服务更加智能化。

个性化推荐通过实体与实体之间的关系,利用用户感兴趣的实体,进一步扩展用户偏好的相似的实体,提供可解释性的推荐内容。一方面,图谱提供了实体在多个维度的特征信息,另一方面,表示学习向量带有一定的语义信息,使得寻找推荐实体更接近目标实体或更偏向用户喜好。

语义搜索,是指搜索引擎对Query的处理不再拘泥于字面本身,而是抽象出其中的实体、查询意图,通过知识图谱直接提供用户需要的答案,而不只是提供网页排序结果,更精准的满足用户的需求。当前Google、百度、神马搜索都已经将基于知识图谱的语义搜索融入到搜索引擎中,对于一些知识性内容的查找,能智能地直接显示结果信息。

美团大脑的业务应用

依托深度学习模型,美团大脑充分挖掘、关联美团点评各个业务场景公开数据(如用户评价、菜品、标签等),正在构建大规模的餐饮娱乐“知识大脑”,并且已经开始在美团不同业务中进行落地,利用人工智能技术全面提升用户的生活体验。

智能搜索:帮助用户做决策

知识图谱可以从多维度精准地刻画商家,已经在美食搜索和旅游搜索中应用,为用户搜索出更适合Ta的店。基于知识图谱的搜索结果,不仅具有精准性,还具有多样性,例如:当用户在美食类目下搜索关键词“鱼”,通过图谱可以认知到用户的搜索词是“鱼”这种“食材”。因此搜索的结果不仅有“糖醋鱼”、“清蒸鱼”这样的精准结果,还有“赛螃蟹”这样以鱼肉作为主食材的菜品,大大增加了搜索结果的多样性,提升用户的搜索体验。并且对于每一个推荐的商家,能够基于知识图谱找到用户最关心的因素,从而生成“千人千面”的推荐理由,例如在浏览到大董烤鸭店的时候,偏好“无肉不欢”的用户A看到的推荐理由是“大董的烤鸭名不虚传”,而偏好“环境优雅”的用户B,看到的推荐理由就是“环境小资,有舞台表演”,不仅让搜索结果更具有解释性,同时也能吸引不同偏好的用户进入商家。


< class="pgc-img">


知识图谱在点评搜索中应用

对于场景化搜索,知识图谱也具有很强的优势,以七夕节为例,通过知识图谱中的七夕特色化标签,如约会圣地、环境私密、菜品新颖、音乐餐厅、别墅餐厅等等,结合商家评论中的细粒度情感分析,为美团搜索提供了更多适合情侣过七夕节的商户数据,用于七夕场景化搜索的结果召回与展示,极大的提升了用户体验和用户点击转化。

在NLP中心以及大众点评搜索智能中心两个团队的紧密合作下,依赖知识图谱技术和深度学习技术对搜索架构进行了整体的升级。经过5个月时间,点评搜索核心指标在高位基础上仍然有非常明显的提升。

ToB商户赋能:商业大脑指导店老板决策

美团大脑正在应用于SaaS收银系统专业版,通过机器智能阅读每个商家的每一条评论,可以充分理解每个用户对于商家的感受,针对每个商家将大量的用户评价进行归纳总结,从而可以发现商家在市场上的竞争优势/劣势、用户对于商家的总体印象趋势、商家的菜品的受欢迎程度变化。进一步,通过细粒度用户评论全方位分析,可以细致刻画商家服务现状,以及对商家提供前瞻性经营方向。这些智能经营建议将通过美团SaaS收银系统专业版定期触达到各个商家,智能化指导商家精准优化经营模式。

传统给店老板提供商业分析服务中主要聚焦于单店的现金流、客源分析。美团大脑充分挖掘了商户及顾客之间的关联关系,可以提供围绕商户到顾客,商户到所在商圈的更多维度商业分析,在商户营业前、营业中以及将来经营方向,均可以提供细粒度运营指导。

在商家服务能力分析上,通过图谱中关于商家评论所挖掘的主观、客观标签,例如“服务热情”、“上菜快”、“停车免费”等等,同时结合用户在这些标签所在维度上的Aspect细粒度情感分析,告诉商家在哪些方面做的不错,是目前的竞争优势;在哪些方面做的还不够,需要尽快改进。因而可以更准确地指导商家进行经营活动。更加智能的是,美团大脑还可以推理出顾客对商家的认可程度,是高于还是低于其所在商圈的平均情感值,让店老板一目了然地了解自己的实际竞争力。

在消费用户群体分析上,美团大脑不仅能够告诉店老板来消费的顾客的年龄层、性别分布,还可以推理出顾客的消费水平,对于就餐环境的偏好,适合他们的推荐菜,让店老板有针对性的调整价格、更新菜品、优化就餐环境。

金融风险管理和反欺诈:从用户行为建立征信体系

知识图谱的推理能力和可解释性,在金融场景中具有天然的优势,NLP中心和美团金融共建的金融好用户扩散以及用户反欺诈,就是利用知识图谱中的社区发现、标签传播等方法来对用户进行风险管理,能够更准确的识别逾期客户以及用户的不良行为,从而大大提升信用风险管理能力。

在反欺诈场景中,知识图谱已经帮助金融团队在案件调查中发现并确认多个欺诈案件。由于团伙通常会存在较多关联及相似特性,关系图可以帮助识别出多层、多维度关联的欺诈团伙,能通过用户和用户、用户和设备、设备和设备之间四度、五度甚至更深度的关联关系,发现共用设备、共用Wi-Fi来识别欺诈团伙,还可在已有的反欺诈规则上进行推理预测可疑设备、可疑用户来进行预警,从而成为案件调查的有力助手。

未来的挑战

知识图谱建设过程是美团第一次摸索基于图的构建/挖掘/存储/应用过程,也遇到了很多挑战,主要的挑战和应对思路如下:

(1)数据生成与导入

  • 难点:Schema构建和更新;数据源多,数据不一致问题;数据质检。
  • 应对思路:通过针对不同的数据进行特定清洗,元数据约束校验、业务逻辑正确性校验等,设置了严格的数据接入和更新规范。

(2)知识挖掘

  • 难点:知识的融合、表征、推理和验证。
  • 应对思路:通过借鉴文本中的词向量表征,为知识建立统一的语义空间表征,使得语义可计算,基于深度学习和知识表示的算法进行推理。

(3)百亿图存储及查询引擎

  • 难点:数据的存储、查询和同步,数据量极大,没有成熟开源引擎直接使用。
  • 应对思路:构建分层增量系统,实时增量、离线增量、全量图三层Merge查询,减少图更新影响范围。同时建设完整的容灾容错、灰度、子图回滚机制。基于LBS等业务特点合理切分子图View,构建分布式图查询索引层。

(4)知识图谱应用挑战

  • 难点:算法设计,系统实现难和实时应用。
  • 应对思路:知识图谱的应用算法则需要有效融合数据驱动和知识引导,才能提升算法效果和提供更好的解释性,属于研究前沿领域。百亿甚至千亿关系规模下,需要设计和实现分布式的图应用算法,这对算法和系统都有重大的挑战。

总而言之,为打造越来越强大的美团大脑,NLP中心一方面利用业界前沿的算法模型来挖掘关联以及应用知识,另一方面,也在逐步建立国内领先的商业化分布式图引擎系统,支撑千亿级别知识图谱的实时图查询、图推理和图计算。在未来的系列文章中,NLP中心将一一揭秘这背后的创新性技术,敬请期待。

致谢

在美团大脑的建设过程中,NLP中心与多团队紧密配合,合作共赢建设知识基础能力,在此非常感谢数据仓库团队、搜索团队、点评内容研发/挖掘团队,以及美团旅游团队等兄弟团队共建知识体系。

非常感谢搜索智能中心、金融平台、SaaS收银等各业务团队的紧密合作共建,让美团大脑逐步在应用场景中落地,更好的服务于C端用户和B端商家。

参考文献

[1] Huang, Zhiheng, Wei Xu, and Kai Yu. "Bidirectional LSTM-CRF models for sequence tagging." arXiv preprint arXiv:1508.01991 (2015).

[2] Etzioni, Oren, et al. "Unsupervised named-entity extraction from the web: An experimental study." Artificial intelligence165.1 (2005): 91-134.

[3] Banko, Michele, et al. "Open information extraction from the web." IJCAI. Vol. 7. 2007.

[4] Mintz, Mike, et al. "Distant supervision for relation extraction without labeled data." Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP: Volume 2-Volume 2. Association for Computational Linguistics, 2009.

[5] Zheng, Suncong, et al. "Joint entity and relation extraction based on a hybrid neural network." Neurocomputing 257 (2017): 59-66.

[6] Zheng, Suncong, et al. "Joint extraction of entities and relations based on a novel tagging scheme." arXiv preprint arXiv:1706.05075 (2017).

[7] Shen, Wei, Jianyong Wang, and Jiawei Han. "Entity linking with a knowledge base: Issues, techniques, and solutions." IEEE Transactions on Knowledge and Data Engineering 27.2 (2015): 443-460.

[8] Bordes, Antoine, et al. "Translating embeddings for modeling multi-relational data." Advances in neural information processing systems. 2013.

[9] Wang, Zhen, et al. "Knowledge Graph Embedding by Translating on Hyperplanes." AAAI. Vol. 14. 2014.

作者简介

仲远,博士,美团AI平台部NLP中心负责人,点评搜索智能中心负责人。在国际顶级学术会议发表论文30余篇,获得ICDE 2015最佳论文奖,并是ACL 2016 Tutorial “Understanding Short Texts”主讲人,出版学术专著3部,获得美国专利5项。此前,他曾担任微软亚洲研究院主管研究员,以及美国Facebook公司Research Scientist。曾负责微软研究院知识图谱、对话机器人项目和Facebook产品级NLP Service。

富峥,博士,美团AI平台NLP中心研究员,目前主要负责美团大脑项目。在此之前,他在微软亚洲研究院社会计算组担任研究员,并在相关领域的顶级会议和期刊上发表30余篇论文,曾获ICDM2013最佳论文大奖,出版学术专著1部。 曾担任ASONAM的工业界主席,IJCAI、WSDM、SIGIR等国际会议和TKDE、TOIS、TIST等国际期刊的评审委员。

王珺,博士,美团AI平台NLP中心产品和数据负责人。在此之前,王珺在阿里云负责智能顾问多产品线,推动建立了阿里云智能服务体系。

明洋,硕士,美团AI平台NLP中心知识图谱算法工程师。2016年毕业于清华大学计算机系知识工程实验室。

思睿,硕士,美团AI平台NLP中心知识图谱算法专家。此前在百度AIG知识图谱部负责知识图谱、NLP相关算法研究,参与了百度知识图谱整个构建及落地过程。

一飞,负责AI平台NLP中心知识图谱产品。目前主要负责美团大脑以及知识图谱落地项目。

梦迪,美团AI平台NLP中心知识图谱算法工程师,此前在金融科技公司文因互联任高级工程师及开放数据负责人,前清华大学知识工程实验室研究助理,中文开放知识图谱联盟OpenKG联合发起人。

欢迎加入美团机器学习技术交流群,跟作者零距离交流。进群方式:请加美美同学微信(微信号:MTDPtech02),回复:机器学习,美美会自动拉你进群。

感恩福利

亲爱的读者朋友们,感恩节快乐!也许我们不曾将感恩说出口,但内心一直心存感恩之心,感谢你对美团技术团队的每一分关注,每一句评论,每一次转发。未来,我也会更加关注你,希望跟你一起共同成长。


< class="pgc-img">


请按照以下步骤,参与抽取感恩礼物吧!

1. 微信关注美团技术团队(meituantech)公众号。

2. 在后台,回复关键字【感恩节】,参与我们的抽奖。

活动推荐


< class="pgc-img">


《美团技术沙龙第46期·北京:全球最大外卖配送平台用了哪些AI技术?》11月25日周日下午,在外卖5周年之际,挑选四个代表性的议题,全面分享美团外卖商业化AI团队及配送AI团队的技术,并邀请一线技术专家与业界技术人员一起分享交流。更多活动详情请戳>>活动报名链接 http://www.huodongxing.com/event/3466333221711?qd=weixin。


招聘信息

美团点评 NLP 团队招聘各类算法人才,base 北京上海均可。NLP 中心使命是打造世界一流的自然语言处理核心技术和服务能力,依托 NLP(自然语言处理)、Deep Learning(深度学习)、Knowledge Graph(知识图谱)等技术,处理美团点评海量文本数据,打通餐饮、旅行、休闲娱乐等各个场景数据,构建美团点评知识图谱,搭建通用 NLP Service,为美团点评各项业务提供智能的文本语义理解服务。我们的团队既注重AI技术的落地,也开展中长期的NLP及知识图谱基础研究。目前项目及业务包括美团点评知识图谱、智能客服、语音语义搜索、文章评论语义理解、美团点评智能助理等。真正助力于“帮大家吃得更好,生活更好”企业使命的实现,优化用户的生活体验,改善和提升消费者的生活品质。欢迎各位朋友推荐或自荐至 hr.ai@meituan.com。

算法岗:NLP算法工程师/专家/研究员 、知识图谱算法工程师/专家/研究员

工程岗:C++/Java研发专家/工程师 、AI平台研发工程师/专家

产品岗:AI产品经理/专家(NLP、数据方向)

<>

些年来,中式快餐的商业模式变革一直在加快速度。

今年9月份,国内知名的中式连锁快餐品牌吉祥馄饨和美团点评合作推出了旗下智慧门店合作项目,一个月来表现不俗。

提供方便快捷标准化的产品,长久以来是中式快餐进行“工业革命”的核心,在互联网时代,中式快餐还需解决哪些核心问题?

餐饮老板内参 王菁 /文

01 中式快餐需要怎样的“智慧”?吉祥馄饨试水一个月谈成效

创立超过20年,全国门店数量突破2500家,吉祥馄饨在中式连锁快餐领域算得上是当之无愧的头部品牌。

除了换装修、推新品,中式快餐的数字化升级到底该怎么做?如何考虑投资和收益问题?加盟商愿意跟进吗?吉祥馄饨用大胆的试水给出了答案。

今年9月份,吉祥馄饨和美团点评联名的智慧餐厅(以下简称智慧餐厅)在南京西路悄然投入使用,这个项目由吉祥馄饨和美团点评全面合作,从门店数字化硬件工具升级到平台流量的实验性开发,都取得了良好的效果。

< class="pgc-img">

日前,内参君走进这家经过全新改造的智慧门店体验,这家吉祥馄饨面积在100平方米左右,有50多个餐位,由于处在闹市区,用餐高分时段非常繁忙。

内参君发现,和传统街边小店前台点单、验券不同,智慧门店的点单方式改造为桌边扫码和门口触摸屏点单。

目前,前台仍为不会使用移动支付工具的中老年人提供辅助人工点单,但据店员称,前台点单率降低了80%。

点单后,传统的人工叫号也改为了系统和屏幕叫号,桌面上还提供无线充电,在许多细节上的确呈现出了中式快餐店少有的“智慧感”。

该店负责人称,在改造后,门店日营业额提升了50%,更为可喜的是,在效率提高服务人次增加的基础上,消费客单价出现了20%的提升。

02 中式快餐的“中式智慧”,小投入撬动长期营收增长

餐厅的“数字化”“智慧化”,早就不是新鲜事,甚至吉祥馄饨此次升级采用的设备投入和店型改造,在资金投入上也是有限的。

< class="pgc-img">

事实上,吉祥馄饨正是中国快餐店的缩影,数字化升级虽然早已来到餐饮行业,但是对于这些运营能力有限、投资有限的夫妻老婆店来说,谈“智慧”还是一件非常奢侈的事情。

吉祥馄饨的创始人张彪表示,这个时代是一个数字的时代,一个扁平的时代,也正是因为这样一个时代,才让卖馄饨的也有机会参与到数字化营销中。

一个“智慧”的门店,将把中式快餐带往何方,张彪基于智慧门店一个月来的运营成绩,也作出了自己的分析。

慢慢点,点更多

刚才说了,使用二维码、app或者是屏幕点单,在餐饮行业并不稀奇。那么这些“智慧设备”,真正带给商家的是什么呢?

张彪解释道,其实是跟顾客更多的互动机会。

在快餐店吃便饭,排队几分钟,点单几十秒,吃完走人可能不超过十五分钟。在这极其有限的时间里,餐厅的服务人员和顾客的交互时间往往也只有十几秒钟。

而多种形式的点单和产品呈现方式,给了顾客更充分的了解产品甚至整体品牌风格的时间。

智慧门店负责人介绍,由于点单系统设置了多种具有吸引力的套餐搭配、新品推荐机制,顾客愿意花更多时间了解他过去无暇细问的新产品、新套餐,这是目前门店客单价显著提升的最重要原因。

品牌和加盟商的新纽带

过去的快餐很简单,就是做产品,直到现在,产品都是快餐进行品牌表达的主要方式,中式快餐更是如此。而张彪则认为,快餐要有服务,有体验,不然就相当于一直停留在工业时代。

所谓的“智慧门店”不是简简单单用个电脑和显示屏,事实上,它通过彻底影响消费者用餐行为的方式,间接改变了品牌和加盟商之间的聚合方式。

快餐品牌通过产品和顾客发生链接,那么必然,加盟商和总部也仅能通过产品发生链接。在未来,数字化将使品牌和加盟商的之间的关系也发生深刻的变化。

“除了产品,未来品牌和加盟商更有可能通过信息进行链接,因为今后的信息是可以广泛收集并分析的,它对一个品牌所有的经营者都有宝贵的价值,数据将是品牌非常好的工具和团结加盟商的路径。”

张彪称,看到和美团点评联名的智慧门店的阶段性成绩,已经有加盟商开始主动联系购买设备,“加盟商渴望在有限成本之下提升体验,提升市场竞争力,吉祥馄饨的智慧门店提供了一个很好的解决方案。”

03 中式快餐的“平台登陆战”,焦点在于品牌表达

消费者从美团点评上获取餐厅的各类信息,早以成为了用餐消费前的一种习惯,但是中式快餐品牌从中获得的流量和关注度,远低于各类特色餐饮品牌,“这是快餐的一个机会点。”张彪说。

吉祥馄饨的门店有2500多家,每天有将近20万次的流量,但和过去完全不同,如今门店大概有40%的流量来自线上外卖和到店业务,“这也是做餐饮除了要抢商场的位置还要在平台抢位置的原因,因为平台已经创造了新的消费空间。”

张彪在日前参与金投赏美团点评专场时,馄饨不是一个快速变化的产品,所以怎样去丰富产品和服务,挑战异常艰巨,“基于对未来年轻化目标群体的精准锁定,吉祥馄饨布局很早,也一直积极尝试不同的数字化途径,和美团的两次合作都十分深刻。”

张彪认为,平台能给我们什么东西,我们能给平台什么东西,我们和平台之间的关系应该是怎样的,这都值得思考。

吉祥馄饨选择与美团点评合作,正是看中了它超级平台的地位。从吃开始,美团点评历经信息平台到交易平台再到履约平台,逐步形成了具有海量用户、商户以及高效履约能力的超级平台。

据美团点评2019年第二季度财报显示,美团交易用户、活跃商家持续稳定增长:交易用户数达4.2亿;每位交易用户平均每年交易笔数25.5笔;活跃商家数590万。

并且,美团通过70万日活跃外卖骑手、平均配送时长30分钟形成了高效履约能力。

< class="pgc-img">

2016年年底,吉祥馄饨请机构为自己进行服务体验调查,所给出的建议主要集中在产品上的和服务上的两个维度,而此次和美团点评合作智慧餐厅,同样沿袭了这种升级理念。

“快餐首要讲究便捷性,智慧门店首先满足了这个需求。顾客用餐时间短,我们必须找到各种方式,寻找最好的时间节点,完成更多的互动,促进产品以外的品牌表达,在这方面,美团点评起了很大作用。”

除了智慧门店,吉祥馄饨和美团点评近期的另一个重磅合作是电影IP《深夜食堂》的联合营销。《深夜食堂》暖心的电影风格非常符合吉祥馄饨的品牌定位,同时,在电影推广期间推出IP联名推荐套餐。

最终,活动取得7000多万次的曝光量,3万多份的套餐销售,对于吉祥馄饨来说可谓名利双收。

< class="pgc-img">

这样的尝试,在中式快餐品牌里并不多见,原因正是由于中式快餐过去缺乏更加丰富的品牌传播方式。

让品牌如何融入平台,共同追求流量价值的最大化,是摆在中式快餐面前的一条新路。

而张彪认为,从产品变成一种服务形态或供给形态,所有品牌要改变自己思考的过程,才能实现更好的平台融入。

如果您对此项目感兴趣,请在此留言,坐等企业找您(成功的创业者90%都是通过留言,留言只需5秒钟)
  • 知名招商项目汇聚平台

    汇聚海量知名、高诚信度品牌招商项目,随时为您提供招商信息

  • 事实和口碑胜于一切

    千万创业者通过这里找项目、迈出成功创业第一步;

  • 诚信的商机发布平台

    请你在加盟留言时,选择有实力、 加盟店多、成功案例多、合法资质、 证照齐全、诚信经营的品牌.

郑重承诺:本公司郑重承诺尊重你的隐私,并承诺为你保密!
随时 上班时间 下班时间
您可以根据下列意向选择快捷留言
  1. 加盟费多少
  2. 我们这里有加盟店吗?
  3. 我想了解一些加盟资料
  4. 我对这个项目感兴趣,尽快联系我


创业专题



热门创业项目

精品推荐

餐饮项目分类

联系我们

微信扫一扫
第一时间推送投资小回报快利润高的项目

合作伙伴

我们也在这里

关注微信关注微信

您身边的财富顾问...

扫一下
客户端客户端

iPhone/Android/iPad

去下载
关注微博关注微博

官方微博随时分享...

加关注
手机看hbdrt.cn手机看hbdrt.cn

随时随地找商机...

去看看

温馨提示

  • 1在找餐饮项目的过程中多对比同类项目。
  • 2了解项目时多打电话,进行实地考察。
  • 3投资有风险,请谨慎加盟。
  • 4本网站对投资者的风险概不承担。