年前,一场疫情,让我下定决心结束了20年的北漂生活,陪孩子在山西太原老家上学。跟很多人一样,虽然在北京上学工作多年,我们两口子的职位都不低,但没有北京户口,多方考虑之后,最后还是选择陪孩子回老家上学。
回到老家后,为了陪伴孩子,上班的地点不能离家太远,也不能总是加班,再加上老家互联网氛围不够,想找到一份心仪的工作真的是太难了,我开始做起了自由职业者。
一个偶然的机会,北京的朋友给介绍了一个客户,是一个山西本土的奶茶品牌。由于我之前在连锁加盟平台做了多年的推广工作,所以对加盟行业的内情还是很了解的。其实刚回来老家的时候,就一直在琢磨自己干点什么,开个店。有句话说,打工人最终的归宿还是自己干,开公司或者开店。互联网行业干久了,一身的职业病,到了40岁的年龄,管理经验很足,但家里的事太多,再加上职业病,确实有时候感觉力不从心。
合作了一年多的时间,跟品牌的创始人,还有公司的人打交道越来越多,发现这个品牌在太原这样一个城市,这么多年,发展的一直都很佛系。创始人是个性情中人,她说昧良心的钱她不能挣,所以店里做的产品,价位都不高,但是原材料用的都是好的。“自己都不能放心喝的产品,我们是不能上线的”黑洪堂人的实在让我心动了。后来,我也确实喜欢上喝黑洪堂的奶茶。我北京的朋友回去之后说,特别想喝牛乳大满贯,可惜北京没有啊!
然后我就萌生了开个店的想法,我的梦想是:开一家可以有很多书,可以读书的饮品店。刚开始我还不能开一家那么大的饮品店,但是先开个奶茶店还是可以的。
< class="pgc-img">我的门店
>< class="pgc-img">让我的店在抖音火的盲盒奶茶
>我一直认为,开店应该选择自己熟悉的行业,但是我从来没有开过店,选择一个自己熟悉的品牌也是不错的。太大的品牌,实在没有那个经济实力。其他形形色色的各种行业的,各种品牌,作为连锁加盟行业的从业人员,其中的猫腻太知道了。很多品牌都是割韭菜的,别说能不能赚钱了,有一些可能交了钱,想把店开起来都成问题。我知道创业的路肯定是不平坦的,但我感觉之前那种在公司做高管的路,现在的我想要时间自由也是走不通的,创业的路迟早要走,选一个还算靠谱的领头人跟着干,风险还是要相对低一些的。
就这样我加盟了黑洪堂奶茶店。创业不是那么容易的,尤其是创业小白,这一年多来,经历了反反复复的疫情,恶劣的天气情况,整个经济环境越来越差。2022年的年初,尤其艰难,在店铺即将迎来一周年的时候,疫情让整个城市停摆。在这期间,总部带着我们在线上学习抖音宣传,抖音直播,门店如何在疫情期间突围。自己也开始能把线上推广的经验和店铺运营结合起来,获得了小小的成绩。
这一年来,感觉我在好几倍速的成长,不停的学习往前赶,踩了一些坑,也有一些成功的经验,接下来的文章中,我会继续分享我的一些经验和教训。愿大家的创业之路走的更顺畅!愿每一个创业者都能得偿所愿!
国饮品快报
2021年,水果奶茶正在成为行业热点,多家茶饮品牌表示销售名列前茅,有品牌已将该品类计划列入新一季菜单中。
从奈雪到喜茶,从7分甜到黑洪堂,从广东到武汉,从杨枝甘露到葡萄撞奶。
一切现象表明,水果奶茶火了。
这个从杨枝甘露、草莓奶茶中延展而来的品类,是否会成为下一个风口?
近日,我们采访多个茶饮品牌,从产品到研发,从市场表现到品牌内部看法,对水果奶茶做了一次全面分析。
01PART ——
水果奶茶目前的市场现状
在水果奶茶系列里,众多品牌也随之持续更新。黑洪堂在去年就上新了莓醉系列新品,其中“莓醉椰椰雪山”在当月突破预期销售量,这款产品定价18元,据创始人石萍美表示,近期水果奶茶类产品销售量基本都在前三。
定位于湖北地区的茶尖尖目前门店爆款是“18岁太芒”,这款以芒果为主的产品定价22元,自推出以来,销售量一直排名前三。茶尖尖的负责人魏明君表示,这款产品稳定性比较好,颜值高,外卖评价和复购率都比较高,网友点评也基本推荐这款产品。
< class="pgc-img">>四川品牌圆真真推出的“真真奇兰阿荔”,中杯定价为15元,区域负责人表示,产品推出后,销量一直很好,顾客评价也相当高。
< class="pgc-img">>成都绣之茶几款水果奶茶产品销量排名前十,都以草莓、桃子、芒果为主,单品月销售金额都在五万以上。
< class="pgc-img">>还有西南地区品牌的销售数据,水果奶茶销量比基本都占前。
再就是一些品牌如峯茶、新作的茶创始人表示,今年三月会朝着水果奶茶方向上新。峯茶创始人潘丁宏表示,具体会从蜜桃入手,这款水果风味好,颜值高,产品相对于其他水果较有优势。
从上面数据可以看出,大部分消费者偏向于草莓、葡萄、蜜桃水果,当然也与应季有关。在价位这方面,一些厂家研发师表示,全国整体价格在16-23元的区间比较稳定。
原料成本一般在6元左右浮动,因为现在市场上的平均毛利大约是在65%左右,所以抓均值,18元左右零售价倒推出6元左右的成本,当然具体还是看各品牌。
02PART ——
应用制作上要创新
行业内大部分的人认为水果奶茶在今年成为话题,是从杨枝甘露这个细分品类延伸出的现象,杨枝甘露在应用上比较成功,制作上如果用茉莉奶绿来打底,加入预制水果和果汁,有效的解决了茉莉奶绿风味断层的问题,再加入小料,就极大的彰显了水果奶茶的特性,所以后续出现了蜜桃甘露、草莓甘露、芒果甘露等等。
< class="pgc-img">>延伸到水果奶茶后,应用上更是提升了一级,如奈雪新出的“撞撞茶”系列,让一杯饮品里兼具水果和奶茶两种优势:
1. 冷热均可制作,克服了水果茶难做热饮的问题,也提供了丰富的口感;
2. 带小料的水果在茶汤中充分融入,发挥了颜值、香气价值,口感价值,又控制了新鲜水果的成本和不稳定性,使落地、出品都更为可控。
从这两个细分品类上来看,产品如何去应用是关键。
01 | 茶基底乌龙茶或将成为趋势
行业资深研发师兼培训师大鹏表示,大多数研发师会选用绿茶作为茶基底,而他建议,水果奶茶选用乌龙最合适,因为绿茶不含有茶红素或者茶褐素,跟奶制品天然不相融合,可以说乌龙茶是绿茶制作水果奶茶的一个升级。
但如果以绿茶为茶基底,特别是带花香和果香的绿茶,制作沙冰系列的水果奶茶比较合适,接受度很高。红茶茶感重,做水果奶茶凸显不出水果奶茶的鲜感。
麦客森公司后端研发负责人Chirs也认为乌龙比较合适,他说茶百道今年出了一款草莓大红袍,是款沙冰类产品,其中是以大红袍为主打茶基底,加草莓,牛乳进行了产品结合,产品结构特别好。
< class="pgc-img">>Chirs表示,现在水果奶茶都偏向于清香型,清香型的茶就比较适合做水果奶茶,比如桂花乌龙,玫瑰乌龙等。
对此他们也开发了一款“无醇草莓大红袍奶茶”,针对风味做了创新和调整,增加了无醇啤酒糖浆和小料的特色性在里面,让这款产品的整体饱和度,风味性和趣味性更强一些。
02 | 单一品类细分
观察到去年一些大品牌推新的水果奶茶,基本是以一种水果风味进行应用,奈雪的“葡萄撞撞宝藏茶”、喜茶的“思乡龙眼”,都体现出细分品类风味的单独应用。
< class="pgc-img">>大鹏老师解释,这种应用讲究的是三重确认法,例如一款产品是葡萄为主,1、茶是葡萄乌龙,2、液体里面有葡萄果汁,3、冻冻是葡萄风味,最后装饰的奶油顶上还有葡萄干,这是非常好的消费体验,感觉被葡萄一直包围,确认了要表达的葡萄味觉体现。
03 | 体现小料价值感
再就是小料的应用。潘丁宏表示,因为杨枝甘露的关系,大家对果奶这个概念接受度比以前高,但更多原因在于小料的升级。
< class="pgc-img">>●多元化应用小料
现在的果奶不再像以前只是单纯用果粉这类的物料调制,优质的新鲜水果也可以作为小料应用,很好的跟含奶类的产品结合,而不再局限于传统小料类,同时也能体现出水果奶茶的具体风味。
●提升小料视觉感
在视觉上,小料大多数都是沉于杯底,呈现度不高,前几年雪顶奶茶流行后,研发师将雪顶上应用各种小料,如粉类、坚果、水果等,这种趋势一直在持续,而今年大多数品牌推出的水果奶茶都将整颗水果应用在雪顶上,在视觉上满足了水果奶茶的真实感与新鲜感。
03PART ——
水果奶茶能否成为今年的爆款
从市场调查结果上来看,研发师谈论认为水果奶茶会有一定流量,但目前水果奶茶这个品类对于口味与价值感还存在问题,不一定能够直接成为所谓的“爆品”。
< class="pgc-img">>行业资深研发师林育丞表示,水果奶茶之前有酸性水果遇乳起絮问题,虽然工厂端有在开发原料得到解决,但是从推广到被广泛应用还需要一定时间。
其次原料上水果+奶的搭配可能更多直接被联想到预包装好的水果、牛奶等产品,价值感看起来没有水果茶强。
再从口感上来看,水果+奶可能要适配浓缩果酱果茸,因为使用水果原汁味道会被乳品覆盖的比较严重,或会导致整体味道偏水,也是间接影响产品的价值感,如果使用果酱果茸,酱气对于现在一二线城市的消费者也有逐渐抗拒的趋势。
解决这些,水果奶茶才真正能在门店实现易操作、好喝、盈利的产品,自然会在市场上形成流量。
04PART ——
未来水果奶茶将朝这几点发展
谈到水果奶茶未来的发展方向,林育丞个人认为在乳制品上要有更多的选择,并非只有鲜奶与植脂末,甘露类的椰奶或现在一些品牌使用的羊乳制品、燕麦奶等奶基底,给更多不同适配产品研发。
< class="pgc-img">>二是发展两个最大的茶饮产品的结合,即奶茶与水果茶的结合。奶茶跟水果茶本是茶饮门店最大的两种主题产品,这两大类产品的结合,也就是水果奶茶这个议题,是可能成为一个大的主题系列,就像奶茶跟水果茶一样,而不是一般品牌的各自上新一些酸奶、酒酿等小系列性质。
三是如何结合好“热果茶”的问题。热水果茶一直不好做,通常水果遇热显酸发苦,果酱遇热显酱气,原汁部分有许多水果是不能加热,这些问题一直困扰研发师,但市场有需求,产品更新必须突破这个瓶颈。
///
从目前看来,水果奶茶的挑战还有很多,要做标准、做稳定,也要持续优化、创新。在当下审美、品质的要求下,任何一款产品都要体现它的价值与亮点,而在消费者的心里,这种价值与亮点才是打造爆品的最大路径。
享嘉宾:江会星博士 前美团研究员
编辑整理:吴萌 电子科技大学
出品平台:DataFunTalk
导读:事件图谱(Event Graph)是以事件为基本单位,研究事件属性、事件间关联关系的知识网络。用户在电子商务平台上查找、购买、咨询、投诉、评价等用户行径,均是发生在真实时空下的真实事件。其中涉及到沟通的咨询、投诉、评价等会话事件,如何从中准确地识别事件及事件属性,如何实时地对事件进行在线聚合处理,以及事件推理如何在智能客服机器人中应用等,本文将围绕其在美团智能客服中的应用实践进行介绍。
--
01
事件图谱是什么
1. 事件图谱的概念
知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念、实体及其相互关系。知识图谱常由节点和边构成,其中节点代表客观世界中的概念和实体,边代表它们之间的关系和属性。通常知识图谱描述的是静态信息。
然而,世界上存在着大量事件信息,传递着动态的、程序性的知识。事件是发生在特定时空下由一个或者多个角色参与的一个或者多个动作组成的事情或者状态的改变。以事件为中心的知识表示非常重要,它把实体与事件组织在一起。当前事件图谱方面的研究也提出了很多概念,如下图右下角表格所示,包括Event Graph, Event-centric KG, Event Evolutionary Graph, Event-centric Temporal KG, 以及Event Logic Graph等。其中,有些是在事件体系(Schema)层面的,另一些是在事件图谱实例(Instance)层面的。其中节点(Nodes)有事件、实体,有的甚至还包括关系,不过大多数还是认为节点是事件和实体的集合,边是事件与事件的关系。
< class="pgc-img">>本文遵从多数人的定义,事件图谱是包含事件、事件属性、事件间关联关系的以事件为基本单位的知识网络。当前业界研究事件图谱多以新闻和金融领域应用为主,主要是从篇章文本中提炼事件图谱。常见的应用场景有:
- 事件脉络梳理:依据时间顺序,将关联事件及子事件聚合并串联起来;
- 网络热点发现:从网络中实时检测事件,并捕捉热点;
- 后续事件的预测与推理:通过对历史事件进行关联分析,预测/推理下一步事件。
下面将分别举例说明。
2.事件图谱的常见应用案例
① 事件脉络
< class="pgc-img">>近期大家共同关心的一件事是俄乌冲突,上图左边是从百度App上截取的一个截图,其中的事件脉络以新闻事件的先后顺序(时间轴)进行组合呈现,并且支持以发布方来筛选。上图右边是一个外卖客服场景的例子,用户在11:12分下了一个订单,是商家小野螺螺蛳粉加的一份炸蛋,然后在11:19分又下了一单,是商家黑洪堂家的黑洪大满贯牛乳奶茶。然后就是在12:23分请求了美团客服,会话事件是申请退款。这里把下单事件和退款事件以时间轴的方式进行组合呈现,便形成了一个事件脉络。
② 热点发现
< class="pgc-img">>如上图左边截图所示,常见的热点发现有新闻热点榜单,在新闻类应用中非常常见。上图右边是以客服场景中的外卖客服为例,将不同品类下的事件进行汇总,可以得到事件在各品类下的分布。若将事件在各区域下进行汇总,则可以得到事件在各区域下的分布。
③ 后续事件预测/推理
< class="pgc-img">>以金融领域为例,将历史数据的相关金融标的进行挖掘和提取,构建基于事理的图谱,能够进行在线实时的事理推理,这是多步推理的认知呈现。如上图左边所示,还可以融合企业与供应链图谱进行上下游的事件推理。比如,以上游原料产能不足为例,该事件爆发后会导致上游原材料价格上涨,同时也会导致下游产品价格上涨,最终影响下游产品所在的公司股价等等。上图右侧是以外卖客服场景为例,通过对对话历史进行挖掘分析,申请赔付事件的现象事件通常是配送慢或者骑手接单不取餐等等,接下来大概率会得到请求更换骑手的事件。经过对事件的预测推理,我们可以优化客服的对话逻辑,帮助用户在申请赔付时,根据系统信息来判断下单后是否已经过了取餐时间、骑手是否已经取餐等,进而直接与用户沟通,帮助用户进行申请更换骑手的解决方案。
--
02
客服场景事件图谱
上文主要介绍了事件图谱的定义及其常见应用,接下来重点介绍在客服领域事件图谱的构建。分别从事件体系归纳(Event Schema Induction),客服场景事件图谱实时处理关键技术,以及事件图谱的时序处理框架三个方面介绍。
1. Event Schema Induction
以用户在电子商务App上的一个完整消费旅程为例,其用户旅程包含:查找商品/服务、售前咨询、下单购买、售中咨询、消费商品/服务、消费后有疑问申请售后客服服务,有时最后还会对商品或服务进行评价。如下图左边所示。
< class="pgc-img">>这些均是发生在真实时空里的一个个事件,特别是过程中涉及到售前咨询、售中咨询、售后客服以及商品或服务评价等多个沟通过程,这些沟通过程即发生在消费者与商户、骑手、客服人员等不同的角色之间的会话事件。智能客服就是在这些沟通过程中,帮助用户快速自助解决问题,提升沟通效率。通过对每个会话中的事件进行实时抽取,如右边图所示,如无法下单、申请赔付、餐品缺货等,并依据事件之间的时序、共指等关系关联,最后构成了实时动态更新的客服场景的事件图谱。
< class="pgc-img">>参考已有公开的事件图谱定义,再结合智能客服的应用场景,本文使用的事件图谱的表达式定义如下:
< class="pgc-img">>其中 s 为事件或者实体,实体如功能、产品、人或物等专名;p 为事件的触发(trigger)词,通常为谓词,如“投诉、打赏、退订”等;o 为事件所关联的业务,如电子商务平台所涉及的配送服务、保险服务、商家服务、商品价格、营销活动、APP使用等。
节点ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/28896727651c45bda261e2c3f8cba63a","uri":"","width":77,"height":23,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/2085930eb1f949cbb89cf6266165cd9f","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="N\ni\left\{s,p \right\}">包括事件ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/41f03bb8824146bba046732ab9bf920e","uri":"","width":37,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/6cde506e003e4aefaceff201a8b4cd9a","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="N_{evt}">和实体ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/c0a45000ec10439fad4b03ba6559999a","uri":"","width":38,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/f5daad474adc42ebbf7b78c0b5951e48","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="N_{ent}">,除了会话中的事件、也将订单看成“下订单”事件,实体主要是事件涉及到的用户、商户、骑手、商品等;ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/e686dfc26c524d6eb8de2db9a8632564","uri":"","width":58,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/3f8d25c83d2e44039264527ead23c133","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="E\ni P">包括事件与事件ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/e232324d444f47868641309a625f3b3d","uri":"","width":97,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/9158b0f1987c48a88a660c053f35bf8f","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="(evt - evt)">之间的关系, 事件与实体ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/1e2ba7e4d4eb406fa39f96aeda2fa5f1","uri":"","width":98,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/4b03db49853a462bbd6d13db2f0bee1a","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="(evt - ent)">之间的关系,以及实体与实体ntent='{"url":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/c0bb700df81846f6a056bbb566175e2a","uri":"","width":100,"height":28,"darkImgUrl":"https://p3.toutiaoimg.com/origin/tos-cn-i-qvj2lq49k0/d35b185b671b4ba48698b1e1f35c363b","darkImgUri":"","formulaImgStatus":"succeed"}' data-formula="(ent - ent)">之间的关系,下文介绍中节点 N 主要是事件,边 E 主要是事件与事件的关系。
< class="pgc-img">>通过对客服场景中的会话事件进行整理归纳,我们将其分为四大类:
- 办理
通常指需要客服人员或者平台去执行某个动作,比如调用退款接口完成退款,又可分为退款、赔付、退单、开具发票、追加备注等小类,退款小类又包括申请全单退款,申请部分退款,赔付又包括放心吃赔付、准时宝赔付等。
- 现象
通常是办理的具体原因,可以按照事件关联业务或功能细分,比如骑手反馈的配送问题,包括“配送路线距离不准”、“配送路线交通管制”等;又比如用户反馈的账号问题,包括“账号无法登录”、“保证金无法体现”等。
- 咨询
通常是咨询流程或者信息查询相关的问题,比如商户咨询“线下培训计划”、咨询“如何联系保险公司”等。
- 投诉
通常是投诉商家/骑手/BD,可以按照投诉对象划分小类,比如投诉他们的某个行为,“商家投诉BD修改商家配送范围”等。
Event Schema具体怎么得到,通常是需要经过模型识别事件,人工审核并进行归类归纳,再优化事件识别模型的一个循环迭代过程。
< class="pgc-img">>首先我们看下事件的构成,通常由(subject,predicate)、(predicate, object)或者(subject,predicate,object)构成。其中subject通常为独立的功能、产品、人、物等专有名词,predicate指有明确事件属性的谓词,如投诉、打赏、退订等。因此我们将事件识别任务定位成由会话中的核心词或者主题词构成的关键词短语的识别。
上图左边流程是Runtime的会话事件识别流程,包括三个步骤:
第一步,从会话session中生成关键词短语候选,由分词后的ngram构成。
第二步,生成关键词短语候选的特征,具体特征如上图右边所示,包括位置、角色、左右熵、标签模板等特征。
第三步,模型预测每个关键词短语候选的得分,选择得分高的关键词短语作为会话的事件。
这里有意思的是我们在候选中增加一个EOS候选,通过EOS的位置来决定最终哪些关键词短语被抽取出来。EOS的特征表示为所有候选特征对应位置的值做pooling得到。
< class="pgc-img">>实际业务中各业务Event Schema归纳的SOP流程为先从会话中进行事件抽取(keyphrase抽取),然后与Event Schema中已有的事件进行匹配,判断是否是已有事件,如果是可以将说法添加到已有事件的具体说法中;如果不是则可能是新事件,最后将所有识别的新事件候选进行聚类,并将聚好的类交由业务运营人员或者数据标注同学进行整理和归类归纳,进而扩充现有的事件体系。
2. 客服场景事件图谱Instance
以上介绍的是事件图谱中事件体系的构建。对于事件图谱而言,有了事件体系后,就是为新发生的会话实时识别其中所包含的事件。
< class="pgc-img">>容易想到的做法是对会话中的每个句子进行识别,判断它是不是事件体系中的某个事件。考虑到事件体系是在不断更新的,通常会采用相似度计算的方式来进行。在客服场景中,有些会话轮数非常多,根据句子识别出来的事件也会比较多,不容易区分哪些是该会话中的核心事件。好在客服场景,客服人员在跟用户沟通结束后会记录工单,包括记录用户的诉求,也就是要办理什么事,或者咨询什么事,亦或是投诉什么人,以及对应的背景现象是什么,这些数据都是非常好的人工整理数据源。基于客服人员填写的工单数据,可以训练一个模型,挑选会话中的核心语句,如上图左边所示。然后基于挑选出来的重要句子,再对其进行事件的识别。在这里,现象类事件的识别采用的是这种两阶段的方法,具体模型如上图所示。
< class="pgc-img">>针对诉求类事件,即办理、投诉和咨询类事件,客服人员记录工单时,是在各业务中用户诉求类别的有限集中选择出来的。同样,基于客服人员填写的诉求结果,可以训练一个模型来识别出会话中用户的核心诉求,如上图左边所示。然后根据诉求可以挑选出候选的句子,这里是简单的通过诉求对应的触发词,匹配得到候选句。然后再对这些候选句分别进行相应的事件识别。
3. 事件图谱时序处理框架
2.2节介绍的是实时事件识别是怎么做的,下面再来看下完整的事件图谱时序处理框架。
< class="pgc-img">>如上图所示,最下层是数据接入,包括实时的会话数据、评论数据和舆情数据,也包括订单数据、配送数据、工单数据等。这些数据有些是从Binlog Kafka、日志中心的实时流中获取,有些是静态数据,如用户维表和商户维表,则是从Hive中读取。
中间层是流批处理计算引擎,我们采用的是Flink+Spark,会调用事件识别模型对会话数据打上事件标签,其中Spark主要是离线批量刷数据。我们同时也会基于打上事件标签的实时数据进行事件级别的实时预警。
处理之后的数据我们在Doris里会存储一份宽表,方便实时多维度的查询分析,为了加上对文本类内容的查询,文本类字段也会在ES(Elastic Search引擎)里建立索引。
最后我们有统一的API层实现事件图谱的对外输出接口。
--
03
事件图谱在智能客服问答中的应用
上文介绍了事件图谱是什么以及事件图谱的构建,本节介绍事件图谱在智能客服问答中的应用,包括事件脚本预测(Event script Prediction)、多轮话题引导和辅助业务经营决策。
1. Event script Prediction
Event scripts在一些论文中也称作Narrative Event Chains,下图左边描述的是一个去餐厅消费的事件链。顾客走进餐厅,然后坐下、点餐、服务员送餐、顾客吃餐,然后支付、离开餐厅。学术上通常把预测下一步要做什么叫做Event script Prediction。
< class="pgc-img">>回到智能客服场景,将事件图谱Instance中的每个会话事件进行时序关系建模,可以形成一个个事件链。通过对这些事件链进行合并,可以形成如上图右侧所示的一颗树。在这里,为了和对话中的概念对齐,我们把从用户话语中抽取的事件称为User Action,把从客服人员话语中抽取的事件称为Staff Action。最后这棵树就用于指导特定任务的任务型对话,也就是我们通常称之为的TaskBot。
< class="pgc-img">>在不同人的会话过程中哪些事先说哪些事后说,具有很大的随机性。如果直接对每个会话中抽取出来的事件链进行拼接,势必会非常乱。这里需要先对这些事件链进行序列的先后建模。本节介绍一种对对话的动作序列进行N-gram建模的方法,如上图最左方框所示。给定动作序列,N-gram模型可以输出后续动作及其概率,这里在统计的时候将每个会话中的事件链加入起始标记SOS和结束标记EOS。
得到了N-gram模型性后,如何生成Taskflow树,总共可以分为5个步骤,如上图中间方框所示。
到此生成的Taskflow在实际使用中还有问题,因为多数Taskflow需要调用外部接口来获取数据或者状态。因此还需要后处理,人工添加API的调用信息,然后根据API的返回值进行节点间的条件转移。
下图是一颗生成好的Taskflow样例,右边是基于该Taskflow实现的机器人与用户的真实对话。其中对于机器人来说Staff Action就对应为System Action,在用户确认订单后,System Action为询问骑行时间,当用户告知了1分钟后,系统调用 set_fee API,然后将最终的处理结果告知用户。
< class="pgc-img">>2. 多轮话题引导
事件图谱在智能客服中除了用来生成Taskflow外,还可以用于多轮对话中话题引导。
< class="pgc-img">>这个在之前的报告《美团智能客服技术实践》中也提到过。比如当用户询问会员能否退订这件事时,我们除了给出答案外,也会引导用户回答具体的原因现象是什么,是“外卖红包无法使用”,还是因为换了手机号需要了解“如何换绑手机号”等。
3. 辅助经营决策
事件图谱除了在智能客服问答中直接使用外,还有一个很大的作用就是辅助业务做经营决策。
< class="pgc-img">>通过会话事件可以把用户、商户、地址、商品及服务等关联起来,从而我们可以得到商户维度、商品维度、地理位置维度等的事件分布,比如这个例子,我们可以筛选出各商家一定时段内的发生的食品安全类事件,从而挑选出存在食品安全隐患的商家,告知商家,并相应地要求商家进行食品安全方面的学习,对存在的食品安全问题进行整改;同时我们还可以用事件图谱对这些商家的食品安全问题进行长时间的日常跟踪监控。
--
04
小结与展望
最后对全文进行一个回顾总结。
第一部分主要介绍了事件图谱是什么,知识图谱和事件图谱的区别以及当前在事件图谱方面的主要研究,并且举了几个应用的例子,包括事件脉络、热点发现和事件预测推理。
< class="pgc-img">>第二部分主要讲解智能客服和事件图谱,并分别介绍了事件Schema的构建、实时事件标签的识别以及在智能客服场景的事件图谱时序处理框架。
第三部分主要介绍了事件图谱在智能客服问答中的应用,包括如何从事件图谱中生成Taskflow用于多轮问答,事件图谱在多轮问答中用于话题引导,以及事件图谱如何辅助商家经营决策。
最后,针对下阶段的工作,当前在事件图谱上的工作还比较初步,还只是在单个业务上的探索,一是我们会进一步完善事件图谱以及挖掘在公司内部更多有价值的落地,二是基于事件图谱的问答以及辅助经营会在更多业务上进行验证。
今天的分享就到这里,谢谢大家。
阅读更多技术干货文章,请关注微信公众号“DataFunTalk”。
分享嘉宾:
< class="pgc-img">>关于我们:
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章700+,百万+阅读,14万+精准粉丝。
欢迎转载分享评论,转载请私信。